論文の概要: OpenPI2.0: An Improved Dataset for Entity Tracking in Texts
- arxiv url: http://arxiv.org/abs/2305.14603v1
- Date: Wed, 24 May 2023 00:57:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 20:59:35.949927
- Title: OpenPI2.0: An Improved Dataset for Entity Tracking in Texts
- Title(参考訳): OpenPI2.0: テキストにおけるエンティティ追跡のための改善されたデータセット
- Authors: Li Zhang, Hainiu Xu, Abhinav Kommula, Niket Tandon, Chris
Callison-Burch
- Abstract要約: 手続きテキスト中のエンティティ状態を追跡するための改良されたデータセットであるOpenPI2.0を提案する。
OpenPI2.0は、評価を促進する標準的なエンティティだけでなく、手動ラベルと自動予測を含むサリエンスアノテーションも備えている。
- 参考スコア(独自算出の注目度): 24.98780926375663
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Representing texts as information about entities has long been deemed
effective in event reasoning. We propose OpenPI2.0, an improved dataset for
tracking entity states in procedural texts. OpenPI2.0 features not only
canonicalized entities that facilitate evaluation, but also salience
annotations including both manual labels and automatic predictions. Regarding
entity salience, we provide a survey on annotation subjectivity, modeling
feasibility, and downstream applications in tasks such as question answering
and classical planning.
- Abstract(参考訳): エンティティに関する情報としてテキストを表現することは、イベント推論において長い間有効と考えられてきた。
手続きテキスト中のエンティティ状態を追跡するための改良されたデータセットであるOpenPI2.0を提案する。
OpenPI2.0は、評価を促進する標準的なエンティティだけでなく、手動ラベルと自動予測を含むサリエンスアノテーションも備えている。
エンティティ・サリアンスについては、質問応答や古典的な計画といったタスクにおけるアノテーションの主観性、モデリング実現可能性、下流アプリケーションに関する調査を行う。
関連論文リスト
- Dynamic Retrieval-Augmented Generation [4.741884506444161]
動的検索・拡張生成(DRAG)のための新しい手法を提案する。
DRAGは、取得したエンティティの圧縮埋め込みを生成モデルに注入する。
提案手法は,(1)コンテキストウィンドウの長さ制限を解除し,迅速なサイズを節約すること,(2)コンテキストに利用可能な検索エンティティの数を膨大に拡張すること,(3)ミススペルや関連エンティティ名検索の失敗を緩和すること,の3つの目標を達成する。
論文 参考訳(メタデータ) (2023-12-14T14:26:57Z) - OpenPI-C: A Better Benchmark and Stronger Baseline for Open-Vocabulary
State Tracking [55.62705574507595]
OpenPIは、オープン語彙状態トラッキング用に注釈付けされた唯一のデータセットである。
手順レベル,ステップレベル,状態変化レベルの3つの問題を分類する。
評価指標として,クラスタベースの計量法を提案する。
論文 参考訳(メタデータ) (2023-06-01T16:48:20Z) - Understand the Dynamic World: An End-to-End Knowledge Informed Framework
for Open Domain Entity State Tracking [15.421012879083463]
Open Domain entity state trackingは、アクション記述が与えられたエンティティの妥当な状態変化(すなわち、[entity]の[属性]は、[before_state]と[after_state])を予測することを目的としています。
モデルがアクションによって引き起こされる任意の数のエンティティ状態変化を予測する必要がある一方で、ほとんどのエンティティはアクションとその属性に暗黙的に関連しており、状態はオープンな語彙から来ているため、それは難しいです。
我々は、オープンドメインのエンティティ状態追跡のための新しいエンドツーエンドの知識インフォームドフレームワーク、KIESTを提案し、関連するエンティティと属性を明示的に取り出す。
論文 参考訳(メタデータ) (2023-04-26T22:45:30Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Coalescing Global and Local Information for Procedural Text
Understanding [70.10291759879887]
完全な手続き的理解ソリューションは、入力のローカル・グローバル・ビューとアウトプットのグローバル・ビューの3つの中核的な側面を組み合わせるべきである。
本稿では,エンティティと時間表現を構築する新しいモデルであるCoalescing Global and Local InformationCGを提案する。
一般的な手続き的テキスト理解データセットの実験は、我々のモデルが最先端の結果を得ることを示す。
論文 参考訳(メタデータ) (2022-08-26T19:16:32Z) - Entity Cloze By Date: What LMs Know About Unseen Entities [79.34707800653597]
言語モデル(LM)は通常、大規模なコーパスで一度訓練され、更新されずに数年間使用される。
本研究では,LMの事前学習時に存在しなかった新しいエンティティについて,LMがどのような推論ができるのかを解析する枠組みを提案する。
本論文は,その発祥日によって索引付けされたエンティティのデータセットを,英語のウィキペディア記事と組み合わせて作成し,各エンティティに関する文章を検索する。
論文 参考訳(メタデータ) (2022-05-05T17:59:31Z) - Towards Entity Alignment in the Open World: An Unsupervised Approach [29.337157862514204]
これは知識のカバレッジと品質を高めるために知識グラフ(kgs)を統合する上で重要なステップである。
最先端のソリューションは、モデルトレーニングにラベル付きデータに頼る傾向があります。
オープンな世界でエンティティアライメントを行う監視されていないフレームワークを提供します。
論文 参考訳(メタデータ) (2021-01-26T03:10:24Z) - LUKE: Deep Contextualized Entity Representations with Entity-aware
Self-attention [37.111204321059084]
両方向変換器に基づく単語と実体の事前学習した文脈表現を提案する。
我々のモデルは、BERTのマスキング言語モデルに基づく新しい事前訓練タスクを用いて訓練される。
また,変換器の自己認識機構の拡張である自己認識機構を提案する。
論文 参考訳(メタデータ) (2020-10-02T15:38:03Z) - Interpretable Entity Representations through Large-Scale Typing [61.4277527871572]
本稿では,人間の読みやすいエンティティ表現を作成し,箱から高パフォーマンスを実現する手法を提案する。
我々の表現は、微粒な実体型に対する後続確率に対応するベクトルである。
特定のドメインに対して,学習に基づく方法で,型セットのサイズを縮小できることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。