論文の概要: iobes: A Library for Span-Level Processing
- arxiv url: http://arxiv.org/abs/2010.04373v1
- Date: Fri, 9 Oct 2020 05:03:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 05:24:05.135085
- Title: iobes: A Library for Span-Level Processing
- Title(参考訳): iobes: Span-Level処理のためのライブラリ
- Authors: Brian Lester
- Abstract要約: トークンレベルの決定として表現されたスパンを解析、変換、処理するために、iobeが使用されている。
本稿では,オープン治療法であるiobeについて紹介する。
- 参考スコア(独自算出の注目度): 11.112281331309939
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many tasks in natural language processing, such as named entity recognition
and slot-filling, involve identifying and labeling specific spans of text. In
order to leverage common models, these tasks are often recast as sequence
labeling tasks. Each token is given a label and these labels are prefixed with
special tokens such as B- or I-. After a model assigns labels to each token,
these prefixes are used to group the tokens into spans.
Properly parsing these annotations is critical for producing fair and
comparable metrics; however, despite its importance, there is not an
easy-to-use, standardized, programmatically integratable library to help work
with span labeling. To remedy this, we introduce our open-source library,
iobes. iobes is used for parsing, converting, and processing spans represented
as token level decisions.
- Abstract(参考訳): 名前付きエンティティ認識やスロットフィリングなど、自然言語処理における多くのタスクは、特定のテキストのスパンの識別とラベル付けを含む。
一般的なモデルを活用するために、これらのタスクはしばしばシーケンスラベリングタスクとして再キャストされる。
各トークンにはラベルが与えられ、これらのラベルには b- や i- などの特別なトークンがプレフィックスされている。
モデルが各トークンにラベルを割り当てた後、これらのプレフィックスを使用してトークンをスパンに分類する。
これらのアノテーションを適切に解析することは、公平で同等のメトリクスを生成するために重要であるが、その重要性にもかかわらず、スパンラベリングを扱うのに役立つ、使いやすく、標準化され、プログラム的に統合可能なライブラリは存在しない。
これに対処するため、我々はオープンソースのライブラリであるiobesを紹介します。
iobesはトークンレベルの決定を表すスパンの解析、変換、処理に使用される。
関連論文リスト
- Exploiting Conjugate Label Information for Multi-Instance Partial-Label Learning [61.00359941983515]
MIPL(Multi-instance partial-label Learning)は、各トレーニングサンプルが1つの真のラベルといくつかの偽陽性を含む候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現されるシナリオに対処する。
ELIMIPLは共役ラベル情報を利用して曖昧性を改善する。
論文 参考訳(メタデータ) (2024-08-26T15:49:31Z) - Don't Waste a Single Annotation: Improving Single-Label Classifiers
Through Soft Labels [7.396461226948109]
目的とする単一ラベル分類タスクに対する共通データアノテーションとトレーニング手法の限界に対処する。
以上の結果から,信頼性,二次ラベル,不一致などの付加的なアノテータ情報を用いて,ソフトラベルを効果的に生成できることが示唆された。
論文 参考訳(メタデータ) (2023-11-09T10:47:39Z) - Substituting Data Annotation with Balanced Updates and Collective Loss
in Multi-label Text Classification [19.592985329023733]
MLTC(Multi-label text classification)は、あるテキストに複数のラベルを割り当てるタスクである。
本報告では,MLTCの問題点を,ラベル数に比例して,利用可能な監視信号の大きさが線形であるアノテーションフリーおよび希少アノテーション設定で検討する。
提案手法は,(1)事前学習した言語モデルを用いて,入力テキストを事前ラベル候補の集合にマッピングし,(2)ラベル記述による署名付きラベル依存グラフの計算,(3)ラベル依存グラフに沿ったメッセージパスによる事前ラベル候補の更新を行う。
論文 参考訳(メタデータ) (2023-09-24T04:12:52Z) - Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.67511167969934]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - Label2Label: A Language Modeling Framework for Multi-Attribute Learning [93.68058298766739]
Label2Labelは、言語モデリングの観点からのマルチ属性予測の最初の試みである。
NLPにおける事前学習言語モデルの成功に触発されたLabel2Labelは、イメージ条件付きマスキング言語モデルを導入した。
我々の直感は、ニューラルネットワークがコンテキストと残りの属性ヒントに基づいて欠落した属性を推測できる場合、インスタンスの属性関係がよく把握されるということである。
論文 参考訳(メタデータ) (2022-07-18T15:12:33Z) - Towards Few-shot Entity Recognition in Document Images: A Label-aware
Sequence-to-Sequence Framework [28.898240725099782]
アノテーション付き文書画像のほんの数ショットしか必要としないエンティティ認識モデルを構築します。
ラベルを意識したSeq2seqフレームワーク LASER を開発した。
2つのベンチマークデータセットの実験は、数ショット設定下でのLASERの優位性を示している。
論文 参考訳(メタデータ) (2022-03-30T18:30:42Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - Label-Wise Document Pre-Training for Multi-Label Text Classification [14.439051753832032]
本稿では,ラベル認識情報を用いた文書表現を実現するLW-PT法を提案する。
基本的な考え方は、複数ラベルの文書は、複数のラベルの表現の組み合わせとして表すことができ、相関ラベルは、常に同じまたは類似の文書で共起するということである。
論文 参考訳(メタデータ) (2020-08-15T10:34:27Z) - Few-shot Slot Tagging with Collapsed Dependency Transfer and
Label-enhanced Task-adaptive Projection Network [61.94394163309688]
本稿では,現在最先端の少数ショット分類モデルであるTapNetに基づくラベル強化タスク適応プロジェクションネットワーク(L-TapNet)を提案する。
実験結果から,本モデルは1ショット設定で14.64点のF1スコアで最強の少ショット学習ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-06-10T07:50:44Z) - Embeddings of Label Components for Sequence Labeling: A Case Study of
Fine-grained Named Entity Recognition [41.60109880213463]
モデルへの埋め込みとしてラベル成分情報を統合することを提案する。
提案手法は,特に低周波ラベルを持つ事例において,性能の向上を実証する。
論文 参考訳(メタデータ) (2020-06-02T03:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。