論文の概要: Behind the Scenes: An Exploration of Trigger Biases Problem in Few-Shot
Event Classification
- arxiv url: http://arxiv.org/abs/2108.12844v1
- Date: Sun, 29 Aug 2021 13:46:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:48:38.395410
- Title: Behind the Scenes: An Exploration of Trigger Biases Problem in Few-Shot
Event Classification
- Title(参考訳): 舞台裏--Few-Shotイベント分類におけるトリガーバイアス問題の探索
- Authors: Peiyi Wang, Runxin Xu, Tianyu Liu, Damai Dai, Baobao Chang, and
Zhifang Sui
- Abstract要約: FSEC(Few-Shot Event Classification)は、アノテーション付きデータに制限のある新しいイベントタイプに一般化可能な、イベント予測モデルの開発を目標としている。
既存のFSECモデルは、トリガーワードとターゲットイベントタイプの間の統計的均一性を示すトリガーバイアスに悩まされている。
FSECモデルにおけるコンテキストバイパス問題に対処するために、敵の訓練とトリガー再構成技術を導入する。
- 参考スコア(独自算出の注目度): 24.598938900747186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-Shot Event Classification (FSEC) aims at developing a model for event
prediction, which can generalize to new event types with a limited number of
annotated data. Existing FSEC studies have achieved high accuracy on different
benchmarks. However, we find they suffer from trigger biases that signify the
statistical homogeneity between some trigger words and target event types,
which we summarize as trigger overlapping and trigger separability. The biases
can result in context-bypassing problem, i.e., correct classifications can be
gained by looking at only the trigger words while ignoring the entire context.
Therefore, existing models can be weak in generalizing to unseen data in real
scenarios. To further uncover the trigger biases and assess the generalization
ability of the models, we propose two new sampling methods, Trigger-Uniform
Sampling (TUS) and COnfusion Sampling (COS), for the meta tasks construction
during evaluation. Besides, to cope with the context-bypassing problem in FSEC
models, we introduce adversarial training and trigger reconstruction
techniques. Experiments show these techniques help not only improve the
performance, but also enhance the generalization ability of models.
- Abstract(参考訳): FSEC(Few-Shot Event Classification)は、アノテーション付きデータに制限のある新しいイベントタイプに一般化可能な、イベント予測モデルの開発を目指している。
既存のFSECの研究は、異なるベンチマークで高い精度を達成した。
しかし、いくつかのトリガーワードとターゲットイベントタイプの間の統計的均質性を示すトリガーバイアスに苦しむことがわかり、トリガーオーバーラップとトリガー分離性としてまとめる。
バイアスは、コンテキストバイパスの問題、すなわち、すべてのコンテキストを無視しながらトリガーワードのみを見ることによって正しい分類を得ることができる。
したがって、既存のモデルは、実際のシナリオで見えないデータを一般化するのに弱い可能性がある。
さらにトリガバイアスを明らかにし,モデルの一般化能力を評価するために,評価中のメタタスク構築のための2つの新しいサンプリング手法,Trigger-Uniform Smpling (TUS) とConfusion Smpling (COS) を提案する。
さらに,fsecモデルにおける文脈横断問題に対処するために,逆訓練とトリガ再構成手法を導入する。
実験によると、これらの手法は性能を向上させるだけでなく、モデルの一般化能力を高めるのに役立つ。
関連論文リスト
- Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - MsPrompt: Multi-step Prompt Learning for Debiasing Few-shot Event
Detection [16.98619925632727]
イベント検出(ED)は、構造化されていないテキストでキートリガーワードを特定し、それに従ってイベントタイプを予測することを目的としている。
従来のEDモデルは、ラベル付きデータが不足している実際のアプリケーションに対応するには、データ不足が多すぎる。
本稿では,複数ステップのプロンプト学習モデル(MsPrompt)を提案する。
論文 参考訳(メタデータ) (2023-05-16T10:19:12Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - HCL-TAT: A Hybrid Contrastive Learning Method for Few-shot Event
Detection with Task-Adaptive Threshold [18.165302114575212]
タスク適応型閾値(HCLTAT)を用いた新しいハイブリッドコントラスト学習法を提案する。
本稿では,タスク適応型閾値(HCLTAT)を用いたハイブリッドコントラスト学習手法を提案する。
ベンチマークデータセットFewEventの実験は、最先端技術と比較して、より良い結果を得るために、我々の手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-10-17T07:37:38Z) - CC-Cert: A Probabilistic Approach to Certify General Robustness of
Neural Networks [58.29502185344086]
安全クリティカルな機械学習アプリケーションでは、モデルを敵の攻撃から守ることが不可欠である。
意味的に意味のある入力変換に対して、ディープラーニングモデルの証明可能な保証を提供することが重要である。
我々はChernoff-Cramer境界に基づく新しい普遍確率的証明手法を提案する。
論文 参考訳(メタデータ) (2021-09-22T12:46:04Z) - Counterfactual Adversarial Learning with Representation Interpolation [11.843735677432166]
本稿では,逆境因果関係の観点から問題に取り組むために,対人関係訓練の枠組みを導入する。
実験により、CATは異なる下流タスク間でSOTAよりも大幅にパフォーマンスが向上することが示された。
論文 参考訳(メタデータ) (2021-09-10T09:23:08Z) - Few-Shot Event Detection with Prototypical Amortized Conditional Random
Field [8.782210889586837]
イベント検出は、いくつかのサンプルで新しいイベントタイプを認識する必要がある場合、苦労する傾向がある。
本稿では,タスクを2部タグ付け方式で複数ショットタグ付け問題に変換する統一結合モデルを提案する。
ベンチマークデータセットFewEventで実験を行い、実験結果から、タグ付けに基づく手法は既存のパイプラインやジョイントラーニング手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-12-04T01:11:13Z) - Asymptotic Behavior of Adversarial Training in Binary Classification [41.7567932118769]
敵の訓練は、敵の攻撃に対する防衛の最先端の方法と考えられている。
実際に成功したにもかかわらず、敵の訓練のパフォーマンスを理解する上でのいくつかの問題は未解決のままである。
2進分類における対角訓練の最小化のための正確な理論的予測を導出する。
論文 参考訳(メタデータ) (2020-10-26T01:44:20Z) - Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。
本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。
我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文 参考訳(メタデータ) (2020-10-05T22:13:21Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。