論文の概要: XCoref: Cross-document Coreference Resolution in the Wild
- arxiv url: http://arxiv.org/abs/2109.05252v1
- Date: Sat, 11 Sep 2021 10:41:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 10:24:45.684355
- Title: XCoref: Cross-document Coreference Resolution in the Wild
- Title(参考訳): XCoref: ワイルドでのクロスドキュメント参照解決
- Authors: Anastasia Zhukova, Felix Hamborg, Karsten Donnay, and Bela Gipp
- Abstract要約: ブリッジングと緩やかなコア推論の関係は、ニュース読者を単語の選択やラベル付けによって偏見に晒す恐れのある関連を引き起こす。
単語の選択とラベル付けによってバイアスの認識をもたらすためのステップは、高い語彙的多様性を持つコア推論の信頼性の高い解決である。
ドナルド・トランプ(Donald Trump)のような人物を包括的に解決するCDCR手法であるXCorefという教師なしの手法を提案する。
我々は,提案したXCorefと最先端CDCR法と,そのような複雑なコア参照関係を解く先行手法TCAを比較した。
- 参考スコア(独自算出の注目度): 8.586057042714698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Datasets and methods for cross-document coreference resolution (CDCR) focus
on events or entities with strict coreference relations. They lack, however,
annotating and resolving coreference mentions with more abstract or loose
relations that may occur when news articles report about controversial and
polarized events. Bridging and loose coreference relations trigger associations
that may lead to exposing news readers to bias by word choice and labeling. For
example, coreferential mentions of "direct talks between U.S. President Donald
Trump and Kim" such as "an extraordinary meeting following months of heated
rhetoric" or "great chance to solve a world problem" form a more positive
perception of this event. A step towards bringing awareness of bias by word
choice and labeling is the reliable resolution of coreferences with high
lexical diversity. We propose an unsupervised method named XCoref, which is a
CDCR method that capably resolves not only previously prevalent entities, such
as persons, e.g., "Donald Trump," but also abstractly defined concepts, such as
groups of persons, "caravan of immigrants," events and actions, e.g., "marching
to the U.S. border." In an extensive evaluation, we compare the proposed XCoref
to a state-of-the-art CDCR method and a previous method TCA that resolves such
complex coreference relations and find that XCoref outperforms these methods.
Outperforming an established CDCR model shows that the new CDCR models need to
be evaluated on semantically complex mentions with more loose coreference
relations to indicate their applicability of models to resolve mentions in the
"wild" of political news articles.
- Abstract(参考訳): Datasets and Methods for cross-document coreference resolution (CDCR)は、厳密なコア参照関係を持つイベントやエンティティに焦点を当てる。
しかし、ニュース記事が物議を醸し、偏った出来事について報告するときに起こるような、より抽象的あるいは緩やかな関係で、中核論の注釈と解決を欠いている。
ブリッジングとゆるいコリファレンスの関係は、ニュース読者が単語の選択とラベル付けによってバイアスにさらされることにつながる可能性がある。
例えば、ドナルド・トランプとキムの直接会談、例えば「数ヶ月にわたる熱いレトリックの後の異常な会議」や「世界の問題を解決する大きなチャンス」は、この出来事に対するより肯定的な認識を形作っている。
単語の選択とラベリングによってバイアスの認識をもたらすためのステップは、語彙多様性の高いコリファレンスの信頼性の高い解決である。
我々は、例えば、ドナルド・トランプ(Donald Trump)のような、以前流行していた人物だけでなく、人々の集団、移民のキャラバン(caravan ofmigrant)、出来事や行動、例えば「米国国境へのマーチング(marching to the U.S. border)」など、抽象的に定義された概念を、CDCRで解決する手法であるXCorefを提案する。
本稿では,提案手法を最先端CDCR法と比較し,複雑なコア参照関係を解消し,XCorefがこれらの手法より優れていることを示す。
確立されたCDCRモデルのパフォーマンスは、政治ニュース記事の「ワイルド」における言及を解決するためのモデルの適用性を示すために、より緩やかなコア参照関係を持つ意味論的に複雑な言及に基づいて、新しいCDCRモデルを評価する必要があることを示している。
関連論文リスト
- Noisy-Correspondence Learning for Text-to-Image Person Re-identification [50.07634676709067]
本稿では,雑音対応においても頑健な視覚関係を学習するための新しいロバスト二重埋め込み法(RDE)を提案する。
提案手法は,3つのデータセット上での合成ノイズ対応と非合成ノイズ対応を両立させる。
論文 参考訳(メタデータ) (2023-08-19T05:34:13Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Focus on what matters: Applying Discourse Coherence Theory to Cross
Document Coreference [22.497877069528087]
ドキュメント間でのイベントとエンティティのコア参照の解決は、候補参照の数を大幅に増加させ、完全な$n2$ペアワイズ比較を行うことを難しくする。
既存のアプローチでは、ドキュメントクラスタ内でのコア参照のみを考慮することで単純化されているが、クラスタ間のコア参照を処理できない。
我々は、談話コヒーレンス理論の洞察に基づいて、潜在的コア推論は、読者の談話焦点によって制約される。
本手法は,ECB+,ガン・バイオレンス,フットボール・コアス,クロスドメイン・クロスドキュメント・コアス・コーパスにおけるイベントとエンティティの両面での最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-10-11T15:41:47Z) - Cross-document Coreference Resolution over Predicted Mentions [19.95214898312209]
原文からのCDコア参照解決のための最初のエンドツーエンドモデルを提案する。
我々のモデルは、金の言及に対するイベントとエンティティのコア参照の解決のための競合的な結果を達成する。
論文 参考訳(メタデータ) (2021-06-02T14:56:28Z) - SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts [28.96683772139377]
我々は、科学論文における概念のための階層的CDCRの新しいタスクを提示する。
目標は、コアファレンスクラスタとそれらの間の階層を共同で推論することです。
このタスクのエキスパートアノテーションデータセットであるSciCoを作成します。これは、著名なECB+リソースよりも3倍大きいです。
論文 参考訳(メタデータ) (2021-04-18T10:42:20Z) - CD2CR: Co-reference Resolution Across Documents and Domains [20.30046972135548]
クロスドキュメント・コリファレンス・レゾリューション (CDCR) は、多くのテキスト文書にまたがるエンティティや概念への言及を識別し、リンクするタスクである。
クロスドキュメント・クロスドメイン・コリファレンス・レゾリューション(CD$2$CR)のための新しいタスクと英語データセットを提案する。
このクロスドメインなクロスドキュメント設定では、既存のCDCRモデルはうまく動作せず、CD$2$CR上の現在の最先端CDCRモデルより優れたベースラインモデルを提供する。
論文 参考訳(メタデータ) (2021-01-29T15:18:30Z) - Coreference Reasoning in Machine Reading Comprehension [100.75624364257429]
機械読解におけるコレファレンス推論は,従来考えられていたよりも大きな課題である。
本稿では,コア参照推論の課題を反映した理解データセットの読解手法を提案する。
これにより、さまざまなMRCデータセットにまたがる最先端のモデルの推論能力が向上します。
論文 参考訳(メタデータ) (2020-12-31T12:18:41Z) - Generalizing Cross-Document Event Coreference Resolution Across Multiple
Corpora [63.429307282665704]
クロスドキュメントイベントコア参照解決(CDCR)は、文書の集合全体にわたってイベントの特定とクラスタ化を行う必要があるNLPタスクである。
CDCRは、下流のマルチドキュメントアプリケーションに利益をもたらすことを目標としているが、CDCRの適用による改善はまだ示されていない。
これまでのCDCRシステムは,1つのコーパスでのみ開発,トレーニング,テストが行われた。
論文 参考訳(メタデータ) (2020-11-24T17:45:03Z) - A Brief Survey and Comparative Study of Recent Development of Pronoun
Coreference Resolution [55.39835612617972]
PCR(Pronoun Coreference Resolution)は、プロノミナルな表現を、それらが参照するすべての言及に対して解決するタスクである。
1つの重要な自然言語理解(NLU)コンポーネントとして、代名詞分解は多くの下流タスクにおいて不可欠であり、既存のモデルでは依然として困難である。
我々は、現在のモデルが標準評価セットで優れたパフォーマンスを達成しているにもかかわらず、実際のアプリケーションで使用する準備ができていないことを示すために、広範な実験を行っている。
論文 参考訳(メタデータ) (2020-09-27T01:40:01Z) - Streamlining Cross-Document Coreference Resolution: Evaluation and
Modeling [25.94435242086499]
クロスドキュメント(CD)コア参照解決のための最近の評価プロトコルは、しばしば矛盾または寛大である。
我々の主な貢献は、原文のみにアクセスすることを前提とした実用的評価手法を提案することである。
我々のモデルは、CDコア参照設定に対処するためにドキュメント内コア参照解決のために、最近のニューラルモデルを適用し、拡張する。
論文 参考訳(メタデータ) (2020-09-23T10:02:10Z) - Query Resolution for Conversational Search with Limited Supervision [63.131221660019776]
本稿では,双方向トランスフォーマに基づくニューラルクエリ解決モデルQuReTeCを提案する。
我々はQuReTeCが最先端モデルより優れており、また、QuReTeCのトレーニングに必要な人為的なデータ量を大幅に削減するために、我々の遠隔監視手法が有効であることを示す。
論文 参考訳(メタデータ) (2020-05-24T11:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。