論文の概要: A Monte Carlo Language Model Pipeline for Zero-Shot Sociopolitical Event
Extraction
- arxiv url: http://arxiv.org/abs/2305.15051v1
- Date: Wed, 24 May 2023 11:41:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 16:26:39.628211
- Title: A Monte Carlo Language Model Pipeline for Zero-Shot Sociopolitical Event
Extraction
- Title(参考訳): ゼロショット社会政治イベント抽出のためのモンテカルロ言語モデルパイプライン
- Authors: Erica Cai, Brendan O'Connor
- Abstract要約: 我々は、アクターのペア間のアクションを特定するために、ダイアドゼロショットイベント抽出(EE)を検討する。
現在のEEメソッドは、単語感覚のあいまいさ、モダリティのミスマッチ、効率性などの問題を含む、タスクに対して不十分に機能する。
モンテカルロ法を用いて, 生成出力のランダム性を活用し, 克服する。
- 参考スコア(独自算出の注目度): 4.4527447219371545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider dyadic zero-shot event extraction (EE) to identify actions
between pairs of actors. The \emph{zero-shot} setting allows social scientists
or other non-computational researchers to extract any customized,
user-specified set of events without training, resulting in a \emph{dyadic}
event database, allowing insight into sociopolitical relational dynamics among
actors and the higher level organizations or countries they represent.
Unfortunately, we find that current zero-shot EE methods perform poorly for the
task, with issues including word sense ambiguity, modality mismatch, and
efficiency. Straightforward application of large language model prompting
typically performs even worse. We address these challenges with a new
fine-grained, multi-stage generative question-answer method, using a Monte
Carlo approach to exploit and overcome the randomness of generative outputs. It
performs 90\% fewer queries than a previous approach, with strong performance
on the widely-used Automatic Content Extraction dataset. Finally, we extend our
method to extract affiliations of actor arguments and demonstrate our method
and findings on a dyadic international relations case study.
- Abstract(参考訳): 我々はdyadic zero-shot event extraction (ee) をアクタのペア間のアクションを識別する。
\emph{zero-shot}設定により、社会科学者や他の非計算研究者は、トレーニングなしでカスタマイズされたユーザー特定イベントのセットを抽出でき、その結果、 \emph{dyadic}イベントデータベースが作成され、アクターと彼らが代表するより高いレベルの組織や国の間の社会政治関係のダイナミクスを洞察することができる。
残念なことに、現在のゼロショットEEメソッドは、単語感覚の曖昧さ、モダリティのミスマッチ、効率性といった問題を含む、そのタスクに対して不十分であることがわかった。
大規模言語モデルのストレートフォワード適用は、一般的にさらに悪化する。
本研究では,モンテカルロ法を用いて,生成出力のランダム性を活用し,克服する手法を提案する。
従来のアプローチよりも90%少ないクエリを実行し、広く使用されているAutomatic Content extractデータセットで強いパフォーマンスを発揮する。
最後に,本手法を拡張してアクター論争の関連性を抽出し,その方法と知見を国際関係ケーススタディで実証する。
関連論文リスト
- Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - MeaeQ: Mount Model Extraction Attacks with Efficient Queries [6.1106195466129485]
自然言語処理(NLP)におけるモデル抽出攻撃の研究
これらの問題に対処する単純で効果的な方法であるMeaeQを提案する。
MeaeQは、クエリを少なくしながら、ベースラインよりも犠牲者モデルに高い機能的類似性を実現する。
論文 参考訳(メタデータ) (2023-10-21T16:07:16Z) - Revisiting Large Language Models as Zero-shot Relation Extractors [8.953462875381888]
リレーショナル抽出(RE)は、ゼロショット設定下であっても、一定のラベル付きまたはラベルなしのデータを一貫して含む。
近年の研究では、大きな言語モデル(LLM)が、単に自然言語のプロンプトを与えられただけで、新しいタスクにうまく移行していることが示されている。
本研究はゼロショット関係抽出器としてLLMを探索することに焦点を当てる。
論文 参考訳(メタデータ) (2023-10-08T06:17:39Z) - RetICL: Sequential Retrieval of In-Context Examples with Reinforcement
Learning [77.34726150561087]
In-Context Learning (RetICL) のための検索式を提案する。
我々は、マルコフ決定プロセスとして逐次サンプル選択の問題を定義し、LSTMを用いてサンプルレトリバーモデルを設計し、近似ポリシー最適化を用いてそれを訓練する。
論文 参考訳(メタデータ) (2023-05-23T20:15:56Z) - Retrieval-Augmented Generative Question Answering for Event Argument
Extraction [66.24622127143044]
イベント引数抽出のための検索拡張生成QAモデル(R-GQA)を提案する。
最も類似したQAペアを検索し、現在の例のコンテキストへのプロンプトとして拡張し、引数を回答としてデコードする。
提案手法は, 様々な設定において, かなり先行した手法より優れている。
論文 参考訳(メタデータ) (2022-11-14T02:00:32Z) - Zero-Shot On-the-Fly Event Schema Induction [61.91468909200566]
本稿では,大規模な言語モデルを用いて,高レベルなイベント定義,特定のイベント,引数,それらの関係を予測・付与するソースドキュメントを生成する手法を提案する。
我々のモデルを用いて、任意のトピックに関する完全なスキーマを、手動のデータ収集、すなわちゼロショットの方法で、オンザフライで生成することができる。
論文 参考訳(メタデータ) (2022-10-12T14:37:00Z) - Improving Zero-Shot Event Extraction via Sentence Simplification [28.516348706626307]
イベント抽出は、進行中の地政学的危機への窓口を提供し、実行可能なインテリジェンスをもたらす。
近年,イベント抽出のための新しいパラダイムとして,機械読み取り(MRC)が登場している。
MRCモデル自体によって誘導される教師なし文の単純化を行うことにより、MRCに基づくイベント抽出の性能を向上させるための一般的な手法を提案する。
論文 参考訳(メタデータ) (2022-04-06T01:14:50Z) - Query and Extract: Refining Event Extraction as Type-oriented Binary
Decoding [51.57864297948228]
本稿では,自然言語クエリとしてイベントタイプと引数ロールを取り入れた新しいイベント抽出フレームワークを提案する。
我々のフレームワークは、イベントタイプや引数ロールと入力テキストとのセマンティックな相関をよりよく捉えるための注意機構の恩恵を受ける。
論文 参考訳(メタデータ) (2021-10-14T15:49:40Z) - A Markov Decision Process Approach to Active Meta Learning [24.50189361694407]
教師付き学習では、データが特定のタスクに関連付けられていると仮定して、与えられたデータセットに1つの統計モデルを適用する。
メタラーニングでは、データは多数のタスクと関連付けられており、同時に全てのタスクでうまく機能するモデルを模索する。
論文 参考訳(メタデータ) (2020-09-10T15:45:34Z) - Document-Level Event Role Filler Extraction using Multi-Granularity
Contextualized Encoding [40.13163091122463]
イベントロールフィラーに対応するテキストの幅を決定するために、より大きなコンテキストのビューを必要とするため、イベント抽出は難しいタスクである。
まず、文書レベルのロールフィラー抽出において、エンドツーエンドのニューラルシーケンスモデルがどのように機能するかを検討する。
私たちの最高のシステムは、以前の作業よりもかなり優れたパフォーマンスを示します。
論文 参考訳(メタデータ) (2020-05-13T20:42:17Z) - Inferring Temporal Compositions of Actions Using Probabilistic Automata [61.09176771931052]
本稿では,動作の時間的構成を意味正規表現として表現し,確率的オートマトンを用いた推論フレームワークを提案する。
我々のアプローチは、長い範囲の複雑なアクティビティを、順序のないアトミックアクションのセットとして予測するか、自然言語文を使ってビデオを取得するという既存の研究とは異なる。
論文 参考訳(メタデータ) (2020-04-28T00:15:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。