論文の概要: FIG: Forward-Inverse Generation for Low-Resource Domain-specific Event Detection
- arxiv url: http://arxiv.org/abs/2502.17394v1
- Date: Mon, 24 Feb 2025 18:20:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:58:12.738505
- Title: FIG: Forward-Inverse Generation for Low-Resource Domain-specific Event Detection
- Title(参考訳): FIG:低リソース領域固有イベント検出のためのフォワード逆生成
- Authors: Tanmay Parekh, Yuxuan Dong, Lucas Bandarkar, Artin Kim, I-Hung Hsu, Kai-Wei Chang, Nanyun Peng,
- Abstract要約: Event Detection (ED)は、自然言語テキストから興味のある型付きイベントを識別するタスクである。
高品質な合成データに逆生成を利用するハイブリッドアプローチであるFIGを導入する。
多様なドメインからの3つのEDデータセットの実験により、FIGが最高のベースラインを上回ることが判明した。
- 参考スコア(独自算出の注目度): 84.82139313614255
- License:
- Abstract: Event Detection (ED) is the task of identifying typed event mentions of interest from natural language text, which benefits domain-specific reasoning in biomedical, legal, and epidemiological domains. However, procuring supervised data for thousands of events for various domains is a laborious and expensive task. To this end, existing works have explored synthetic data generation via forward (generating labels for unlabeled sentences) and inverse (generating sentences from generated labels) generations. However, forward generation often produces noisy labels, while inverse generation struggles with domain drift and incomplete event annotations. To address these challenges, we introduce FIG, a hybrid approach that leverages inverse generation for high-quality data synthesis while anchoring it to domain-specific cues extracted via forward generation on unlabeled target data. FIG further enhances its synthetic data by adding missing annotations through forward generation-based refinement. Experimentation on three ED datasets from diverse domains reveals that FIG outperforms the best baseline achieving average gains of 3.3% F1 and 5.4% F1 in the zero-shot and few-shot settings respectively. Analyzing the generated trigger hit rate and human evaluation substantiates FIG's superior domain alignment and data quality compared to existing baselines.
- Abstract(参考訳): イベント検出(英: Event Detection, ED)とは、生物医学、法学、疫学の分野におけるドメイン固有の推論の恩恵を受ける自然言語テキストから、タイプ付きイベントの言及を識別するタスクである。
しかし、各藩の何千ものイベントの監視データを取得することは、手間と費用のかかる作業である。
この目的のために、既存の研究は、前方(ラベルなし文の生成ラベル)と逆(生成されたラベルから生成された文を生成する)世代による合成データ生成を探索してきた。
しかし、フォワードジェネレーションはしばしばノイズの多いラベルを生成し、逆生成はドメインドリフトと不完全なイベントアノテーションと苦労する。
これらの課題に対処するために、FIGは高品質なデータ合成のために逆生成を利用するハイブリッドアプローチを導入し、ラベルのないターゲットデータに対してフォワード生成によって抽出されたドメイン固有のキューに固定する。
FIGは、フォワードジェネレーションベースの改善を通じて、欠落したアノテーションを追加することで、合成データをさらに強化する。
多様なドメインからの3つのEDデータセットの実験により、FIGはゼロショットと少数ショットの設定でそれぞれ平均3.3%のF1と5.4%のF1を達成し、最高のベースラインを上回っていることが明らかになった。
生成されたトリガーヒット率と人間の評価は、既存のベースラインと比較して、FIGの優れたドメインアライメントとデータ品質を裏付ける。
関連論文リスト
- Gradual Source Domain Expansion for Unsupervised Domain Adaptation [45.207132297204424]
教師なしドメイン適応(UDA)は、ソースデータセットからターゲットデータセットに知識を転送することで、大きなラベル付きデータセットの必要性を克服しようとする。
本稿では,この問題を解決するために,段階的ソース領域拡張(GSDE)アルゴリズムを提案する。
GSDEはUDAタスクをスクラッチから数回トレーニングし、毎回ネットワークウェイトを再起動するが、毎回ターゲットデータでソースデータセットを拡張する。
論文 参考訳(メタデータ) (2023-11-16T06:18:35Z) - Cyclically Disentangled Feature Translation for Face Anti-spoofing [61.70377630461084]
循環不整合特徴変換ネットワーク(CDFTN)と呼ばれる新しい領域適応手法を提案する。
CDFTNは、(1)ソースドメイン不変の生長特徴と2)ドメイン固有のコンテンツ特徴とを持つ擬似ラベル付きサンプルを生成する。
ソースドメインラベルの監督の下で、合成擬似ラベル付き画像に基づいてロバスト分類器を訓練する。
論文 参考訳(メタデータ) (2022-12-07T14:12:34Z) - Deep Unsupervised Domain Adaptation: A Review of Recent Advances and
Perspectives [16.68091981866261]
対象領域のデータの性能低下に対応するために、教師なし領域適応(UDA)を提案する。
UDAは、自然言語処理、ビデオ解析、自然言語処理、時系列データ分析、医用画像解析など、有望な成果を上げている。
論文 参考訳(メタデータ) (2022-08-15T20:05:07Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Disentanglement-based Cross-Domain Feature Augmentation for Effective
Unsupervised Domain Adaptive Person Re-identification [87.72851934197936]
Unsupervised Domain Adaptive (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインからラベル付きターゲットドメインへ知識を転送することを目的としている。
ひとつの課題は、トレーニング用に信頼できるラベルでターゲットドメインサンプルを生成する方法だ。
ディスタングルメントに基づくクロスドメイン機能拡張戦略を提案する。
論文 参考訳(メタデータ) (2021-03-25T15:28:41Z) - Generation for adaption: a Gan-based approach for 3D Domain Adaption
inPoint Cloud [10.614067060304919]
Unsupervised Domain Adapt (UDA)は、ターゲットドメインラベルなしでそのような問題を解決することを目指しています。
本稿では,生成逆ネットワークを用いてソースドメインから合成データを生成する手法を提案する。
実験により,本手法は3つの一般的な3次元オブジェクト/シーンデータセットにおいて,最先端のUDA手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-02-15T07:24:10Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z) - Unsupervised Domain Adaptation for Person Re-Identification through
Source-Guided Pseudo-Labeling [2.449909275410288]
人物再識別(re-ID)は、異なるカメラで撮影された同一人物の画像を取得することを目的としている。
Unsupervised Domain Adaptation (UDA)は、ターゲットデータの高価なアノテーションを避けるため、この課題に対する興味深い研究方向である。
ソースドメインとターゲットドメインにおける分類と三重項損失に基づく計量学習を最適化する2分岐アーキテクチャを利用するフレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-20T14:54:42Z) - Inductive Unsupervised Domain Adaptation for Few-Shot Classification via
Clustering [16.39667909141402]
ショットの分類は、多様なドメインに適応する必要がある場合、苦労する傾向があります。
本稿では、ClusteringによるFew-shot分類のためのドメイン適応性能を改善するためのフレームワークDaFeCを紹介する。
提案手法は, 絶対利得(分類精度)が4.95%, 9.55%, 3.99%, 11.62%であった。
論文 参考訳(メタデータ) (2020-06-23T08:17:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。