Fugu-MT 論文翻訳(概要): GoLLIE: Annotation Guidelines improve Zero-Shot Information-Extraction

論文の概要: GoLLIE: Annotation Guidelines improve Zero-Shot Information-Extraction

arxiv url: http://arxiv.org/abs/2310.03668v5
Date: Wed, 6 Mar 2024 16:38:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-07 17:53:28.990532
Title: GoLLIE: Annotation Guidelines improve Zero-Shot Information-Extraction
Title（参考訳）: GoLLIE: アノテーションガイドラインの改善によるゼロショット情報抽出
Authors: Oscar Sainz, Iker Garc\'ia-Ferrero, Rodrigo Agerri, Oier Lopez de Lacalle, German Rigau, Eneko Agirre
Abstract要約: GLLIE(Guideline-following Large Language Model for IE)を提案する。 GoLLIEは、目に見えないガイドラインを一般化し、フォローすることができ、ゼロショット情報抽出の以前の試みよりも優れている。
参考スコア（独自算出の注目度）: 25.028613319081696
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Large Language Models (LLMs) combined with instruction tuning have made significant progress when generalizing to unseen tasks. However, they have been less successful in Information Extraction (IE), lagging behind task-specific models. Typically, IE tasks are characterized by complex annotation guidelines that describe the task and give examples to humans. Previous attempts to leverage such information have failed, even with the largest models, as they are not able to follow the guidelines out of the box. In this paper, we propose GoLLIE (Guideline-following Large Language Model for IE), a model able to improve zero-shot results on unseen IE tasks by virtue of being fine-tuned to comply with annotation guidelines. Comprehensive evaluation empirically demonstrates that GoLLIE is able to generalize to and follow unseen guidelines, outperforming previous attempts at zero-shot information extraction. The ablation study shows that detailed guidelines are key for good results.
Abstract（参考訳）: 大規模な言語モデル(llm)と命令チューニングが組み合わさって、未認識のタスクに一般化する際に大きな進歩を遂げた。しかし、情報抽出(ie)では成功せず、タスク固有のモデルに遅れを取っている。通常、IEタスクは、タスクを記述し、人間に例を示す複雑なガイドラインによって特徴づけられる。このような情報を活用するためのこれまでの試みは,たとえ大規模なモデルであっても,最初からガイドラインに従うことができないため,失敗に終わっている。本稿では,ガイドラインに準拠した微調整により,目に見えないIEタスクのゼロショット結果を改善することができるGoLLIE(Guideline-following Large Language Model for IE)を提案する。包括的評価は、GoLLIEが目に見えないガイドラインを一般化し、フォローできることを実証的に示し、ゼロショット情報抽出における以前の試みよりも優れている。アブレーション研究は、詳細なガイドラインが良い結果の鍵であることを示している。

関連論文リスト

ASIDE: Architectural Separation of Instructions and Data in Language Models [87.16417239344285]
本稿では,埋め込みレベルにおける命令とデータを明確に分離する手法ASIDEを提案する。 ASIDEはデータトークンの埋め込みに固定回転を適用し、追加のパラメータを導入することなく、命令とデータトークンの異なる表現を生成する。提案手法の有効性を,(1)モデル能力の低下を伴わない命令データ分離スコアの高度化と,(2)専用の安全訓練を伴わずともインジェクションベンチマークにおける競合結果を示す。
論文参考訳（メタデータ） (2025-03-13T17:17:17Z)
RUIE: Retrieval-based Unified Information Extraction using Large Language Model [6.788855739199981]
統一された情報抽出は、単一のモデルまたはフレームワークを使用して全ての情報抽出タスクを完了することを目的としている。本稿では,テキスト内学習を活用して迅速な一般化を実現するフレームワークRUIE(Retrieval-based Unified Information extract)を提案する。 8つのホールドアウトデータセットの実験結果から、未確認タスクを一般化するRUIEの有効性が示された。
論文参考訳（メタデータ） (2024-09-18T03:20:04Z)
ADELIE: Aligning Large Language Models on Information Extraction [55.60192044049083]
大規模言語モデル(LLM)は通常、情報抽出タスクで不足する。本稿では,様々なIEタスクを効果的に解決する協調LLMであるADELIEを紹介する。本稿では,オープンソースモデル間でのSoTA(State-of-the-art)性能について述べる。
論文参考訳（メタデータ） (2024-05-08T12:24:52Z)
Instruct and Extract: Instruction Tuning for On-Demand Information Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。 InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。 InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文参考訳（メタデータ） (2023-10-24T17:54:25Z)
Benchmarking Large Language Models with Augmented Instructions for Fine-grained Information Extraction [46.09887436555637]
本稿では,Large Language Models (LLMs) に適した微細なIEベンチマークデータセットを提案する。本研究では,エンコーダ・デコーダモデル,特にT5およびFLAN-T5の広範な評価により,未知の情報型への一般化が期待できる。
論文参考訳（メタデータ） (2023-10-08T09:41:18Z)
InstructIE: A Bilingual Instruction-based Information Extraction Dataset [44.65162892808696]
大きな言語モデルは、一般的な自然言語処理でうまく機能するが、その効果は情報抽出(IE)の亜最適である。最近の研究によると、主な理由はIE命令に関する広範なデータが不足していることにある。 InstructIEは、12のドメインをカバーするバイリンガル命令ベースのIEデータセットである。
論文参考訳（メタデータ） (2023-05-19T08:51:11Z)
Do Models Really Learn to Follow Instructions? An Empirical Study of Instruction Tuning [37.01833561948585]
命令チューニング(IT)に関する最近の研究は、目に見えないタスクに対してゼロショットの一般化性で大きな成果を上げている。我々は、モデルトレーニングと変更した命令と元の命令とを比較して、モデルがどのようにITのインストラクションを利用するかを分析する。
論文参考訳（メタデータ） (2023-05-19T02:00:47Z)
CodeIE: Large Code Generation Models are Better Few-Shot Information Extractors [92.17328076003628]
大規模コーパスで事前訓練された大規模言語モデル(LLM)は、多くのNLPタスクにおいて、驚くべき数ショットの学習能力を示している。本稿では、自然言語の代わりに構造化された出力をコード形式で再キャストすることを提案する。
論文参考訳（メタデータ） (2023-05-09T18:40:31Z)
Discover, Explanation, Improvement: An Automatic Slice Detection Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文参考訳（メタデータ） (2022-11-08T19:00:00Z)
Don't Blame the Annotator: Bias Already Starts in the Annotation Instructions [71.5668415104079]
我々は14のNLUベンチマークにおいて、命令バイアスと呼ばれるバイアスの形式を研究する。提案手法は, クラウドワーカーが収集したデータに伝達する具体的なパターンを示すことが多いことを示す。
論文参考訳（メタデータ） (2022-05-01T07:51:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。