論文の概要: Span-Oriented Information Extraction -- A Unifying Perspective on Information Extraction
- arxiv url: http://arxiv.org/abs/2403.15453v1
- Date: Mon, 18 Mar 2024 20:10:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 02:44:33.705879
- Title: Span-Oriented Information Extraction -- A Unifying Perspective on Information Extraction
- Title(参考訳): Span-Oriented Information extract -- 情報抽出の統一的視点
- Authors: Yifan Ding, Michael Yankoski, Tim Weninger,
- Abstract要約: インフォメーション抽出(Information extract)とは、テキストとそのラベル内のサブシーケンスを識別するタスクの集合である。
私たちは、これらの一見不連続なタスクを、テキストにまたがっていると定義することを中心に、統一された視点に再調整します。
そこで我々は,情報抽出タスクの多種多様さを,Span-Oriented Information extractタスクの変種として再表現する。
- 参考スコア(独自算出の注目度): 9.510495910563565
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Information Extraction refers to a collection of tasks within Natural Language Processing (NLP) that identifies sub-sequences within text and their labels. These tasks have been used for many years to link extract relevant information and to link free text to structured data. However, the heterogeneity among information extraction tasks impedes progress in this area. We therefore offer a unifying perspective centered on what we define to be spans in text. We then re-orient these seemingly incongruous tasks into this unified perspective and then re-present the wide assortment of information extraction tasks as variants of the same basic Span-Oriented Information Extraction task.
- Abstract(参考訳): インフォメーション抽出(Information extract)とは、自然言語処理(NLP)におけるタスクの集合で、テキストとそのラベル内のサブシーケンスを識別する。
これらのタスクは、関連する情報を抽出し、自由テキストを構造化データにリンクするために長年使われてきた。
しかし,情報抽出タスクの不均一性は,この分野の進歩を妨げている。
したがって、テキストでスパンと定義するものを中心に、統一された視点を提供する。
次に、これらの不連続なタスクをこの統一的な視点に再配置し、続いて、情報抽出タスクを、同じ基本的なSpan-Oriented Information extractタスクの変種として、広範囲に並べて表現する。
関連論文リスト
- The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - X-PARADE: Cross-Lingual Textual Entailment and Information Divergence across Paragraphs [55.80189506270598]
X-PARADEは、段落レベルの情報の分岐の最初の言語間データセットである。
アノテーションは、対象言語における段落をスパンレベルでラベル付けし、ソース言語における対応する段落に対して評価する。
アライメントされた段落は、異なる言語のウィキペディアページから引用される。
論文 参考訳(メタデータ) (2023-09-16T04:34:55Z) - Into the Single Cell Multiverse: an End-to-End Dataset for Procedural
Knowledge Extraction in Biomedical Texts [2.2578044590557553]
FlaMB'eは、バイオメディカルテキストの手続き的知識をキャプチャする専門家によるデータセットのコレクションである。
このデータセットは、非構造化テキストとして記述される手続き的知識のユビキタスソースが、その方法論を記述する学術論文の中にあるという観察にインスパイアされている。
論文 参考訳(メタデータ) (2023-09-04T21:02:36Z) - TAGPRIME: A Unified Framework for Relational Structure Extraction [71.88926365652034]
TAGPRIMEは、与えられた条件に関する情報を入力テキストに追加するシーケンスタグ付けモデルである。
事前学習された言語モデルにおける自己認識機構により、プライミングワードは、出力された文脈化された表現に、与えられた条件に関するより多くの情報を含む。
5つの異なる言語にまたがる10のデータセットをカバーする3つのタスクに関する大規模な実験と分析は、TAGPRIMEの汎用性と有効性を示している。
論文 参考訳(メタデータ) (2022-05-25T08:57:46Z) - PET: A new Dataset for Process Extraction from Natural Language Text [15.16406344719132]
我々は、アクティビティ、ゲートウェイ、アクター、フロー情報に注釈を付けた、ビジネスプロセス記述の最初のコーパスを開発する。
我々は、アノテーションスキーマとガイドラインの詳細な概要や、テキストからビジネスプロセスを抽出することの難しさと難しさをベンチマークするための様々なベースラインを含む、新しいリソースを提示する。
論文 参考訳(メタデータ) (2022-03-09T16:33:59Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - Knowledge Graph Anchored Information-Extraction for Domain-Specific
Insights [1.6308268213252761]
新しいドメイン内で特定の情報ニーズを満たすためにタスクベースのアプローチを使用します。
美術NLP技術の状態を構成したパイプラインを使用して、インスタンスレベルのセマンティック構造を自動的に抽出する。
論文 参考訳(メタデータ) (2021-04-18T19:28:10Z) - TRIE: End-to-End Text Reading and Information Extraction for Document
Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。
テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。
提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-27T01:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。