論文の概要: SPLICE: A Singleton-Enhanced PipeLIne for Coreference REsolution
- arxiv url: http://arxiv.org/abs/2403.17245v1
- Date: Mon, 25 Mar 2024 22:46:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 17:15:36.149467
- Title: SPLICE: A Singleton-Enhanced PipeLIne for Coreference REsolution
- Title(参考訳): SPLICE: コアリゾリューションのためのシングルトン強化ピペリン
- Authors: Yilun Zhu, Siyao Peng, Sameer Pradhan, Amir Zeldes,
- Abstract要約: シングルトンは、つまりテキストの中で一度だけ言及される不明瞭さは、理論的な観点から人間が言論を理解する方法において重要であると言及している。
OntoNotesベンチマークでシングルトン参照スパンが欠如しているため、英語のエンドツーエンドのニューラルコア参照解決にそれらの検出を組み込もうとする以前の試みは妨げられていた。
本稿では,既存のネストネストNERシステムとOntoNotes構文木から派生した特徴を組み合わせることで,この制限に対処する。
- 参考スコア(独自算出の注目度): 11.062090350704617
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Singleton mentions, i.e.~entities mentioned only once in a text, are important to how humans understand discourse from a theoretical perspective. However previous attempts to incorporate their detection in end-to-end neural coreference resolution for English have been hampered by the lack of singleton mention spans in the OntoNotes benchmark. This paper addresses this limitation by combining predicted mentions from existing nested NER systems and features derived from OntoNotes syntax trees. With this approach, we create a near approximation of the OntoNotes dataset with all singleton mentions, achieving ~94% recall on a sample of gold singletons. We then propose a two-step neural mention and coreference resolution system, named SPLICE, and compare its performance to the end-to-end approach in two scenarios: the OntoNotes test set and the out-of-domain (OOD) OntoGUM corpus. Results indicate that reconstructed singleton training yields results comparable to end-to-end systems for OntoNotes, while improving OOD stability (+1.1 avg. F1). We conduct error analysis for mention detection and delve into its impact on coreference clustering, revealing that precision improvements deliver more substantial benefits than increases in recall for resolving coreference chains.
- Abstract(参考訳): シングルトンは、つまり、テキストの中で一度だけ言及される内容は、理論的な観点から人間が言論を理解する方法において重要であると言及している。
しかし、OntoNotesベンチマークにおけるシングルトン参照スパンの欠如により、英語のエンドツーエンドのニューラルコア参照解決にそれらの検出を組み込もうとする以前の試みは妨げられている。
本稿では,既存のネストネストNERシステムとOntoNotes構文木から派生した特徴を組み合わせることで,この制限に対処する。
このアプローチでは、OntoNotesデータセットのほぼ近似を、すべてのシングルトンの言及で生成し、金のシングルトンのサンプルに対して約94%のリコールを達成する。
次に、SPLICEと呼ばれる2段階のニューラル参照とコア参照解決システムを提案し、その性能をOntoNotesテストセットとOTOGUMコーパスの2つのシナリオでエンドツーエンドアプローチと比較する。
その結果、再構成シングルトントレーニングにより、OntoNotesのエンドツーエンドシステムに匹敵する結果が得られ、OOD安定性(+1.1 avg.F1)が向上した。
我々は、参照検出のためのエラー解析を行い、コア参照クラスタリングへの影響を掘り下げ、コア参照チェーンの解決のためのリコールの増加よりも精度の向上が大きなメリットをもたらすことを明らかにした。
関連論文リスト
- Incorporating Singletons and Mention-based Features in Coreference
Resolution via Multi-task Learning for Better Generalization [12.084539012992412]
本稿では,シングルトンを学習するコア推論モデルと,エンティティタイプや情報ステータスなどの特徴について述べる。
このアプローチはOntoGUMベンチマークで新しい最先端スコアを実現する。
論文 参考訳(メタデータ) (2023-09-20T18:44:24Z) - TOLD: A Novel Two-Stage Overlap-Aware Framework for Speaker Diarization [54.41494515178297]
話者ダイアリゼーションを単一ラベル分類問題として再検討する。
話者の重なりと依存性を明示的にモデル化できる重なり認識型EEND(EEND-OLA)モデルを提案する。
オリジナルのEENDと比較すると、提案されたEEND-OLAはダイアリゼーションエラー率において14.39%の相対的な改善を実現している。
論文 参考訳(メタデータ) (2023-03-08T05:05:26Z) - Neural Coreference Resolution based on Reinforcement Learning [53.73316523766183]
コアレゾリューションシステムは2つのサブタスクを解決する必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクターをベースとした強化学習型ニューラルコア参照分解システムを提案する。
論文 参考訳(メタデータ) (2022-12-18T07:36:35Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。
また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。
実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文 参考訳(メタデータ) (2021-07-08T13:10:42Z) - Explaining and Improving Model Behavior with k Nearest Neighbor
Representations [107.24850861390196]
モデルの予測に責任のあるトレーニング例を特定するために, k 近傍表現を提案する。
我々は,kNN表現が学習した素因関係を明らかにするのに有効であることを示す。
以上の結果から,kNN手法により,直交モデルが逆入力に対してより堅牢であることが示唆された。
論文 参考訳(メタデータ) (2020-10-18T16:55:25Z) - Reinforcement Learning-based N-ary Cross-Sentence Relation Extraction [3.342376225738321]
遠方監督に基づくn-aryクロス文関係抽出モデルでは、n 個の実体に言及する連続した文がこれらの n 個の実体の関係を記述していると仮定する。
一方、一部の非連続文は1つの関係を記述しており、これらの文はこの仮定ではラベル付けできない。
最初の問題に対処する新しい文分布推定器モデルを提案する。
論文 参考訳(メタデータ) (2020-09-26T20:39:55Z) - Coreference Resolution System for Indonesian Text with Mention Pair
Method and Singleton Exclusion using Convolutional Neural Network [0.0]
インドネシア語テキストの参照ペア法による新しいコア参照解決システムを提案する。
語彙的・統語的特徴に加えて,言及する単語や文脈の表現を学習するために,単語埋め込みを用いてCNNに供給する。
提案システムは最先端システムより優れている。
論文 参考訳(メタデータ) (2020-09-11T22:21:19Z) - SueNes: A Weakly Supervised Approach to Evaluating Single-Document
Summarization via Negative Sampling [25.299937353444854]
本研究は,参照要約の存在を伴わない,弱教師付き要約評価手法に対する概念実証研究である。
既存の要約データセットの大量データは、文書と破損した参照要約とのペアリングによってトレーニングのために変換される。
論文 参考訳(メタデータ) (2020-05-13T15:40:13Z) - Paraphrasing vs Coreferring: Two Sides of the Same Coin [28.80553558538015]
2つの異なるNLPタスク間のシナジーについて検討する。
イベントコアスデータセットからのアノテーションを、リスコアで抽出された述語パラフレーズの遠隔監視に使用しています。
私たちはまた、最先端のイベントコア参照解決モデルに付加的な入力として、同じ再ランク機能を使用します。
論文 参考訳(メタデータ) (2020-04-30T17:29:17Z) - Active Learning for Coreference Resolution using Discrete Annotation [76.36423696634584]
我々は、コア参照解決におけるアクティブラーニングのためのペアワイズアノテーションを改善した。
提案された参照ペアがコアフェレントでないと判断された場合、アノテータに参照アンテセントを識別するよう依頼する。
既存のベンチマークコアベンチマークデータセットを用いた実験では、この追加質問からの信号が人間のアノテーション時間当たりの大幅なパフォーマンス向上につながることが示された。
論文 参考訳(メタデータ) (2020-04-28T17:17:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。