論文の概要: Okay, Let's Do This! Modeling Event Coreference with Generated Rationales and Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2404.03196v1
- Date: Thu, 4 Apr 2024 04:49:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-05 15:43:35.702204
- Title: Okay, Let's Do This! Modeling Event Coreference with Generated Rationales and Knowledge Distillation
- Title(参考訳): よーし、こうしよう! 生成した合理化と知識蒸留によるイベント参照のモデリング
- Authors: Abhijnan Nath, Shadi Manafi, Avyakta Chelle, Nikhil Krishnaswamy,
- Abstract要約: イベント参照解決(ECR)は、同じ実際のイベントを参照するイベントクラスタを接続するタスクである。
本研究では,現代の自己回帰 LLM によって生成される帰納的自由文論理(FTR)を用いて検討する。
イベント・コアス・スコアリングのための新しい合理的なイベント・クラスタリングと知識蒸留手法を実装した。
- 参考スコア(独自算出の注目度): 6.102274021710727
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In NLP, Event Coreference Resolution (ECR) is the task of connecting event clusters that refer to the same underlying real-life event, usually via neural systems. In this work, we investigate using abductive free-text rationales (FTRs) generated by modern autoregressive LLMs as distant supervision of smaller student models for cross-document coreference (CDCR) of events. We implement novel rationale-oriented event clustering and knowledge distillation methods for event coreference scoring that leverage enriched information from the FTRs for improved CDCR without additional annotation or expensive document clustering. Our model using coreference specific knowledge distillation achieves SOTA B3 F1 on the ECB+ and GVC corpora and we establish a new baseline on the AIDA Phase 1 corpus. Our code can be found at https://github.com/csu-signal/llama_cdcr
- Abstract(参考訳): NLPでは、イベント・コア・レゾリューション(ECR)は、通常、ニューラルネットワークを介して、同じ現実のイベントを参照するイベント・クラスタを接続するタスクである。
本研究では,現代の自己回帰的LLMが生成する帰納的自由文有理性(FTR)を,クロスドキュメント・コアス(CDCR)のためのより小さな学生モデルの遠隔監視として用いた。
我々は,FTRからの豊富な情報を活用してCDCRを改良し,付加的なアノテーションや高価な文書クラスタリングを伴わずに,新たな合理的なイベントクラスタリングと知識蒸留手法を実装した。
コア基準別知識蒸留を用いたモデルにより,ECB+とGVCコーパスのSOTA B3 F1が達成され,AIDAフェーズ1コーパスの新たなベースラインが確立される。
私たちのコードはhttps://github.com/csu-signal/llama_cdcrで参照できます。
関連論文リスト
- Linear Cross-document Event Coreference Resolution with X-AMR [6.225801514919498]
Event Coreference Resolution (ECR) は、自動システムや手動アノテーションに費用がかかる。
本稿では,イベントのグラフィカルな表現であるX-AMRを提案する。
次に、イベントグラフ上の新しいマルチホップコア参照アルゴリズムを用いて、ECRを線形化する。
論文 参考訳(メタデータ) (2024-03-25T02:49:06Z) - Consistency Guided Knowledge Retrieval and Denoising in LLMs for
Zero-shot Document-level Relation Triplet Extraction [43.50683283748675]
文書レベルの関係トリプルト抽出(DocRTE)は、文書から意味的関係を持つエンティティを同時に抽出することを目的とした情報システムの基本課題である。
既存の手法は、かなりの量の完全なラベル付きデータに依存している。
ChatGPTやLLaMAのような最近の先進言語モデル(LLM)は、素晴らしい長文生成能力を示している。
論文 参考訳(メタデータ) (2024-01-24T17:04:28Z) - CorefPrompt: Prompt-based Event Coreference Resolution by Measuring
Event Type and Argument Compatibilities [16.888201607072318]
イベントコア参照解決(ECR)は、同じ現実世界のイベントを参照するイベント参照を、クラスタにグループ化することを目的としている。
本稿では,ECRをクローゼスタイル(マスケプド言語モデル)タスクに変換するためのプロンプトベースのアプローチであるCorefPromptを提案する。
これにより、完全に共有されたコンテキストで、単一のテンプレート内で同時イベントモデリングとコア参照の識別が可能になる。
論文 参考訳(メタデータ) (2023-10-23T02:47:27Z) - Filling in the Gaps: Efficient Event Coreference Resolution using Graph
Autoencoder Networks [0.0]
本稿では,低リソースの言語ドメインに適用されたイベント・コンカレンス・レゾリューション(ECR)の新規かつ効率的な手法を提案する。
ECRをグラフ再構成タスクとすることで、深いセマンティック埋め込みと構造的コア参照チェーンの知識を組み合わせることができる。
提案手法は,オランダの大規模イベントコアスコーパスにおいて,古典的参照ペア法よりも優れていた。
論文 参考訳(メタデータ) (2023-10-18T13:44:58Z) - An AMR-based Link Prediction Approach for Document-level Event Argument
Extraction [51.77733454436013]
文書レベルのイベント調停抽出(文書レベルEAE)のための抽象的意味表現(AMR)を導入した最近の研究動向
本研究では,AEをAMRグラフ上のリンク予測問題として再検討する。
本稿では,より少ない情報量のサブグラフやエッジタイプを圧縮し,スパン情報を統合し,同じ文書内の事象をハイライトする新たなグラフ構造であるTalored AMR Graph(TAG)を提案する。
論文 参考訳(メタデータ) (2023-05-30T16:07:48Z) - Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - The CLEAR Benchmark: Continual LEArning on Real-World Imagery [77.98377088698984]
連続学習(CL)は、生涯AIにとって重要な課題であると考えられている。
本稿では,視覚概念の自然な時間進化を伴う最初の連続画像分類ベンチマークであるCLEARを紹介する。
単純な教師なし事前学習のステップで、最先端のCLアルゴリズムがすでに強化されていることが分かりました。
論文 参考訳(メタデータ) (2022-01-17T09:09:09Z) - Unsupervised Representation Learning via Neural Activation Coding [66.65837512531729]
我々は、下流アプリケーションのためのラベルなしデータから深部表現を学習するための新しいアプローチとして、ニューラルアクティベーションコーディング(NAC)を提案する。
我々はNACが連続したデータ表現と離散的なデータ表現の両方を学習し、それぞれ下流の2つのタスクで評価することを示した。
論文 参考訳(メタデータ) (2021-12-07T21:59:45Z) - Focus on what matters: Applying Discourse Coherence Theory to Cross
Document Coreference [22.497877069528087]
ドキュメント間でのイベントとエンティティのコア参照の解決は、候補参照の数を大幅に増加させ、完全な$n2$ペアワイズ比較を行うことを難しくする。
既存のアプローチでは、ドキュメントクラスタ内でのコア参照のみを考慮することで単純化されているが、クラスタ間のコア参照を処理できない。
我々は、談話コヒーレンス理論の洞察に基づいて、潜在的コア推論は、読者の談話焦点によって制約される。
本手法は,ECB+,ガン・バイオレンス,フットボール・コアス,クロスドメイン・クロスドキュメント・コアス・コーパスにおけるイベントとエンティティの両面での最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-10-11T15:41:47Z) - Generalizing Cross-Document Event Coreference Resolution Across Multiple
Corpora [63.429307282665704]
クロスドキュメントイベントコア参照解決(CDCR)は、文書の集合全体にわたってイベントの特定とクラスタ化を行う必要があるNLPタスクである。
CDCRは、下流のマルチドキュメントアプリケーションに利益をもたらすことを目標としているが、CDCRの適用による改善はまだ示されていない。
これまでのCDCRシステムは,1つのコーパスでのみ開発,トレーニング,テストが行われた。
論文 参考訳(メタデータ) (2020-11-24T17:45:03Z) - Searching Central Difference Convolutional Networks for Face
Anti-Spoofing [68.77468465774267]
顔認識システムにおいて、顔の反偽造(FAS)が重要な役割を担っている。
最先端のFASメソッドの多くは、スタック化された畳み込みと専門家が設計したネットワークに依存している。
ここでは、中央差分畳み込み(CDC)に基づくフレームレベルの新しいFAS手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T12:48:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。