論文の概要: CoBA: Counterbias Text Augmentation for Mitigating Various Spurious Correlations via Semantic Triples
- arxiv url: http://arxiv.org/abs/2508.21083v1
- Date: Tue, 26 Aug 2025 07:49:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:10.808137
- Title: CoBA: Counterbias Text Augmentation for Mitigating Various Spurious Correlations via Semantic Triples
- Title(参考訳): CoBA: セマンティック・トリプルによる各種スプーラス相関の緩和のための反バイアステキスト強化
- Authors: Kyohoon Jin, Juhwan Choi, Jungmin Yun, Junho Lee, Soojin Jang, Youngbin Kim,
- Abstract要約: 本稿では, 対物データ増大という, 対物データ増大のより一般的な形式を紹介する。
CoBA: CounterBias Augmentationはセマンティック・トリプルレベルで機能する統合フレームワークである。
我々は,CoBAがダウンストリームタスクのパフォーマンスを向上するだけでなく,バイアスを効果的に低減し,アウト・オブ・ディストリビューションのレジリエンスを強化することを示す。
- 参考スコア(独自算出の注目度): 37.584469264091744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models often learn and exploit spurious correlations in training data, using these non-target features to inform their predictions. Such reliance leads to performance degradation and poor generalization on unseen data. To address these limitations, we introduce a more general form of counterfactual data augmentation, termed counterbias data augmentation, which simultaneously tackles multiple biases (e.g., gender bias, simplicity bias) and enhances out-of-distribution robustness. We present CoBA: CounterBias Augmentation, a unified framework that operates at the semantic triple level: first decomposing text into subject-predicate-object triples, then selectively modifying these triples to disrupt spurious correlations. By reconstructing the text from these adjusted triples, CoBA generates counterbias data that mitigates spurious patterns. Through extensive experiments, we demonstrate that CoBA not only improves downstream task performance, but also effectively reduces biases and strengthens out-of-distribution resilience, offering a versatile and robust solution to the challenges posed by spurious correlations.
- Abstract(参考訳): ディープラーニングモデルは、トレーニングデータの急激な相関を学習し、活用することが多い。
このような依存は、パフォーマンスの劣化と、目に見えないデータに対する一般化の欠如につながります。
これらの制限に対処するために、より一般的な反現実的データ拡張形式である反バイアスデータ増強を導入し、同時に複数のバイアス(例えば、性別バイアス、単純さバイアス)に対処し、配布外ロバスト性を高める。
CoBA: CounterBias Augmentationはセマンティック・トリプルレベルで機能する統一されたフレームワークで、まずテキストを主観的述語・対象のトリプルに分解し、次にこれらのトリプルを選択的に修正し、スプリケートな相関を乱す。
これらの調整されたトリプルからテキストを再構築することで、CoBAはスプリアスパターンを緩和するカウンターバイアスデータを生成する。
広範な実験を通じて、CoBAは下流タスクのパフォーマンスを向上するだけでなく、バイアスを効果的に低減し、分布外のレジリエンスを強化し、スプリアス相関によって生じる課題に対する汎用的で堅牢な解決策を提供することを示した。
関連論文リスト
- Enhanced Data Transfer Cooperating with Artificial Triplets for Scene Graph Generation [15.109087477826106]
本研究は、シーングラフ生成(SGG)のための情報リレーショナル三重項のトレーニングデータセット強化に焦点を当てる。
本稿では,FSTA(Feature Space Triplet Augmentation)とSoft Transferの2つの新しいトレーニングデータセット拡張モジュールを提案する。
実験結果から、FSTAとSoft Transferの統合は、Visual Genomeデータセットにおけるリコールと平均リコールの両方の高レベルを実現することが示された。
論文 参考訳(メタデータ) (2024-06-27T16:52:01Z) - Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文 参考訳(メタデータ) (2023-04-26T10:36:40Z) - CORE: A Retrieve-then-Edit Framework for Counterfactual Data Generation [91.16551253297588]
Counterfactual Generation via Retrieval and Editing (CORE) は、トレーニングのための多様な反事実摂動を生成するための検索強化された生成フレームワークである。
COREはまず、学習されたバイエンコーダを用いて、タスク関連未ラベルテキストコーパス上で密集した検索を行う。
COREはこれらを、反ファクト編集のために、数ショットの学習機能を備えた大規模な言語モデルへのプロンプトに組み込む。
論文 参考訳(メタデータ) (2022-10-10T17:45:38Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Improving Robustness by Augmenting Training Sentences with
Predicate-Argument Structures [62.562760228942054]
データセットバイアスに対するロバスト性を改善する既存のアプローチは、主にトレーニング目標の変更に焦点を当てている。
本稿では,学習データ中の入力文に対応する述語句構造を付加することを提案する。
特定のバイアスを対象とせずに、文の増大は、複数のバイアスに対してトランスフォーマーモデルの堅牢性を向上することを示す。
論文 参考訳(メタデータ) (2020-10-23T16:22:05Z) - PCPL: Predicate-Correlation Perception Learning for Unbiased Scene Graph
Generation [58.98802062945709]
本稿では,適切な損失重みを適応的に求めるための新しい述語相関知覚学習手法を提案する。
我々のPCPLフレームワークは、文脈特徴をよりよく抽出するグラフエンコーダモジュールも備えています。
論文 参考訳(メタデータ) (2020-09-02T08:30:09Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。