論文の概要: Embeddings of Label Components for Sequence Labeling: A Case Study of
Fine-grained Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2006.01372v2
- Date: Thu, 4 Jun 2020 14:01:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 00:20:04.699922
- Title: Embeddings of Label Components for Sequence Labeling: A Case Study of
Fine-grained Named Entity Recognition
- Title(参考訳): 配列ラベリングのためのラベル成分の埋め込み:きめ細かな名前付きエンティティ認識を事例として
- Authors: Takuma Kato, Kaori Abe, Hiroki Ouchi, Shumpei Miyawaki, Jun Suzuki,
Kentaro Inui
- Abstract要約: モデルへの埋め込みとしてラベル成分情報を統合することを提案する。
提案手法は,特に低周波ラベルを持つ事例において,性能の向上を実証する。
- 参考スコア(独自算出の注目度): 41.60109880213463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In general, the labels used in sequence labeling consist of different types
of elements. For example, IOB-format entity labels, such as B-Person and
I-Person, can be decomposed into span (B and I) and type information (Person).
However, while most sequence labeling models do not consider such label
components, the shared components across labels, such as Person, can be
beneficial for label prediction. In this work, we propose to integrate label
component information as embeddings into models. Through experiments on English
and Japanese fine-grained named entity recognition, we demonstrate that the
proposed method improves performance, especially for instances with
low-frequency labels.
- Abstract(参考訳): 一般に、シーケンスラベリングで使われるラベルは異なる種類の要素から構成される。
例えば、B-Person や I-Person のような IOB-format のエンティティラベルは、スパン (B と I) とタイプ情報 (Person) に分解することができる。
しかし、ほとんどのシーケンスラベリングモデルはそのようなラベルコンポーネントを考慮していないが、personのようなラベル間の共有コンポーネントはラベル予測に有用である。
本稿では,ラベル成分情報をモデルへの埋め込みとして統合することを提案する。
提案手法は,英語および日本語の微粒な実体認識実験を通じて,特に低周波ラベルの事例において,性能の向上を実証する。
関連論文リスト
- Exploiting Conjugate Label Information for Multi-Instance Partial-Label Learning [61.00359941983515]
MIPL(Multi-instance partial-label Learning)は、各トレーニングサンプルが1つの真のラベルといくつかの偽陽性を含む候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現されるシナリオに対処する。
ELIMIPLは共役ラベル情報を利用して曖昧性を改善する。
論文 参考訳(メタデータ) (2024-08-26T15:49:31Z) - Substituting Data Annotation with Balanced Updates and Collective Loss
in Multi-label Text Classification [19.592985329023733]
MLTC(Multi-label text classification)は、あるテキストに複数のラベルを割り当てるタスクである。
本報告では,MLTCの問題点を,ラベル数に比例して,利用可能な監視信号の大きさが線形であるアノテーションフリーおよび希少アノテーション設定で検討する。
提案手法は,(1)事前学習した言語モデルを用いて,入力テキストを事前ラベル候補の集合にマッピングし,(2)ラベル記述による署名付きラベル依存グラフの計算,(3)ラベル依存グラフに沿ったメッセージパスによる事前ラベル候補の更新を行う。
論文 参考訳(メタデータ) (2023-09-24T04:12:52Z) - Bridging the Gap between Model Explanations in Partially Annotated
Multi-label Classification [85.76130799062379]
偽陰性ラベルがモデルの説明にどのように影響するかを考察する。
本稿では,部分ラベルで学習したモデルの属性スコアを向上し,その説明をフルラベルで学習したモデルと類似させる。
論文 参考訳(メタデータ) (2023-04-04T14:00:59Z) - Towards Few-shot Entity Recognition in Document Images: A Label-aware
Sequence-to-Sequence Framework [28.898240725099782]
アノテーション付き文書画像のほんの数ショットしか必要としないエンティティ認識モデルを構築します。
ラベルを意識したSeq2seqフレームワーク LASER を開発した。
2つのベンチマークデータセットの実験は、数ショット設定下でのLASERの優位性を示している。
論文 参考訳(メタデータ) (2022-03-30T18:30:42Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - Evaluating Multi-label Classifiers with Noisy Labels [0.7868449549351487]
実世界では、クリーンなデータセットよりもノイズの多いデータセットを扱う方が一般的です。
雑音ラベルを効果的に処理するコンテキストベースマルチラベル分類器(CbMLC)を提案する。
CbMLCは、ほとんどの場合、以前の方法よりも大幅に改善されています。
論文 参考訳(メタデータ) (2021-02-16T19:50:52Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - iobes: A Library for Span-Level Processing [11.112281331309939]
トークンレベルの決定として表現されたスパンを解析、変換、処理するために、iobeが使用されている。
本稿では,オープン治療法であるiobeについて紹介する。
論文 参考訳(メタデータ) (2020-10-09T05:03:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。