Support more model outputs for BERT/ERNIE/RoBERTa #2583

guoshengCS · 2022-06-20T08:54:21Z

PR types

New features

PR changes

APIs

Description

Support more model outputs for BERT. The default behavior is the same as before for compatibility.

Import more output structures refer to HF.

    BaseModelOutputWithPastAndCrossAttentions,
    BaseModelOutputWithPoolingAndCrossAttentions,
    SequenceClassifierOutput,
    TokenClassifierOutput,
    QuestionAnsweringModelOutput,
    MultipleChoiceModelOutput,
    MaskedLMOutput,
    ModelOutput,

Usage:

import paddle
import paddlenlp
from paddlenlp.transformers import AutoModel, AutoTokenizer, AutoModelForTokenClassification, AutoModelForPretraining

paddle.seed(123)
model_name = "bert-base-uncased"
model_name = "ernie-1.0-base-zh"
model_name = "hfl/roberta-wwm-ext"
#model = AutoModel.from_pretrained(model_name)
model = AutoModelForTokenClassification.from_pretrained(model_name)
#model = AutoModelForPretraining.from_pretrained(model_name)
model.eval()
tokenizer = AutoTokenizer.from_pretrained(model_name)

inputs = tokenizer("欢迎使用百度飞桨!")
inputs = {k:paddle.to_tensor([v]) for (k, v) in inputs.items()}
print(inputs)
outputs = model(**inputs, return_dict=True, output_hidden_states=True, output_attentions=False)
print(outputs)

yingyibiao · 2022-06-22T09:03:42Z

paddlenlp/transformers/model_outputs.py

+
+import inspect
+import dataclasses
+from collections import OrderedDict, UserDict
+from collections.abc import MutableMapping
+from contextlib import ExitStack
+from dataclasses import fields, dataclass
+from enum import Enum
+from typing import Any, ContextManager, List, Tuple, Optional


这里的 import 是否应该挪到文件开头位置

yingyibiao · 2022-06-22T09:33:29Z

paddlenlp/transformers/model_outputs.py

+    all_hidden_states = [] if output_hidden_states else None
+    for i, mod in enumerate(self.layers):
+        layer_outputs = mod(output,
+                            src_mask=src_mask,
+                            cache=None if cache is None else cache[i],
+                            output_attentions=output_attentions)
+        if isinstance(layer_outputs, tuple):
+            output = layer_outputs[0]
+            outputs = layer_outputs[1:]
+        else:
+            output = layer_outputs
+            outputs = None
+
+        if output_hidden_states:
+            all_hidden_states.append(output)


HF 中的 all_hidden_states 包含了 embedding_output，这里的实现相比会少这个 Tensor。

Done. Thanks

…nto bert-output-attn

yingyibiao

LGTM

This reverts commit dab5e26.

…2647) This reverts commit dab5e26.

Support more model outputs for BERT.

e621c73

guoshengCS added 4 commits June 20, 2022 20:57

Make more task classed support more outputs.

b0989f4

Convert list to tuple automatically in ModelOutput.

0e32be6

Support more model outputs for ERNIE.

e698eb3

Support more model outputs for Roberta.

500c7d1

guoshengCS marked this pull request as ready for review June 22, 2022 06:48

guoshengCS changed the title ~~Support more model outputs for BERT~~ Support more model outputs for BERT/ERNIE/RoBERTa Jun 22, 2022

guoshengCS requested review from wawltor, tianxin1860 and yingyibiao June 22, 2022 06:53

guoshengCS mentioned this pull request Jun 22, 2022

Experience enhancement of paddlenlp.transformers module #2356

Closed

11 tasks

yingyibiao reviewed Jun 22, 2022

View reviewed changes

guoshengCS added 3 commits June 24, 2022 18:03

Add embedding output to all hidden states.

7e4e150

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleNLP i…

51f0b7c

…nto bert-output-attn

Clean import in model_output.py

8489fe2

yingyibiao approved these changes Jun 24, 2022

View reviewed changes

Merge branch 'develop' into bert-output-attn

9dbf36d

guoshengCS merged commit dab5e26 into PaddlePaddle:develop Jun 26, 2022

guoshengCS added a commit that referenced this pull request Jun 27, 2022

Revert "Support more model outputs for BERT/ERNIE/RoBERTa (#2583)"

76941c2

This reverts commit dab5e26.

guoshengCS mentioned this pull request Jun 27, 2022

Revert "Support more model outputs for BERT/ERNIE/RoBERTa" #2647

Merged

guoshengCS added a commit that referenced this pull request Jun 27, 2022

Revert "Support more model outputs for BERT/ERNIE/RoBERTa (#2583)" (#…

3862947

…2647) This reverts commit dab5e26.

guoshengCS mentioned this pull request Jun 28, 2022

Support more model outputs for BERT/ERNIE/RoBERTa #2665

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Support more model outputs for BERT/ERNIE/RoBERTa #2583

Support more model outputs for BERT/ERNIE/RoBERTa #2583

guoshengCS commented Jun 20, 2022 •

edited

Loading

yingyibiao Jun 22, 2022

guoshengCS Jun 24, 2022

yingyibiao Jun 22, 2022

guoshengCS Jun 24, 2022

yingyibiao left a comment

Support more model outputs for BERT/ERNIE/RoBERTa #2583

Support more model outputs for BERT/ERNIE/RoBERTa #2583

Conversation

guoshengCS commented Jun 20, 2022 • edited Loading

PR types

PR changes

Description

yingyibiao Jun 22, 2022

Choose a reason for hiding this comment

guoshengCS Jun 24, 2022

Choose a reason for hiding this comment

yingyibiao Jun 22, 2022

Choose a reason for hiding this comment

guoshengCS Jun 24, 2022

Choose a reason for hiding this comment

yingyibiao left a comment

Choose a reason for hiding this comment

guoshengCS commented Jun 20, 2022 •

edited

Loading