論文の概要: Bias In, Bias Out? Finding Unbiased Subnetworks in Vanilla Models
- arxiv url: http://arxiv.org/abs/2603.05582v1
- Date: Thu, 05 Mar 2026 18:54:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:44.294115
- Title: Bias In, Bias Out? Finding Unbiased Subnetworks in Vanilla Models
- Title(参考訳): バイアズ・イン・バイアズ・アウト? バニラモデルに不偏のサブネットが発見される
- Authors: Ivan Luiz De Moura Matos, Abdel Djalil Sad Saoud, Ekaterina Iakovleva, Vito Paolo Pastore, Enzo Tartaglione,
- Abstract要約: 従来の訓練されたモデルにすでに存在する「バイアスフリー」ワークを識別し、分離する学習戦略であるBias-Invariant Subnetwork extract (BISE)を紹介する。
提案手法は, プルーニングによって抽出可能であり, 改良することなく操作可能であり, バイアスの少ない機能に効果的に依存し, 堅牢な性能を維持していることを示す。
- 参考スコア(独自算出の注目度): 12.623277149669205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The issue of algorithmic biases in deep learning has led to the development of various debiasing techniques, many of which perform complex training procedures or dataset manipulation. However, an intriguing question arises: is it possible to extract fair and bias-agnostic subnetworks from standard vanilla-trained models without relying on additional data, such as unbiased training set? In this work, we introduce Bias-Invariant Subnetwork Extraction (BISE), a learning strategy that identifies and isolates "bias-free" subnetworks that already exist within conventionally trained models, without retraining or finetuning the original parameters. Our approach demonstrates that such subnetworks can be extracted via pruning and can operate without modification, effectively relying less on biased features and maintaining robust performance. Our findings contribute towards efficient bias mitigation through structural adaptation of pre-trained neural networks via parameter removal, as opposed to costly strategies that are either data-centric or involve (re)training all model parameters. Extensive experiments on common benchmarks show the advantages of our approach in terms of the performance and computational efficiency of the resulting debiased model.
- Abstract(参考訳): ディープラーニングにおけるアルゴリズムバイアスの問題により、様々なデバイアス技術が開発され、その多くが複雑なトレーニング手順やデータセット操作を実行している。
しかし、興味深い疑問が生じる: 偏見のないトレーニングセットのような追加データに頼ることなく、標準的なバニラ訓練モデルから公平でバイアスに依存しないサブネットを抽出することは可能か?
本研究では,従来のモデル内にすでに存在する「バイアスフリー」サブネットワークを,元のパラメータを再学習したり微調整したりすることなく識別・分離する学習戦略であるBias-Invariant Subnetwork extract (BISE)を紹介する。
提案手法は,このようなサブネットワークをプルーニングによって抽出し,修正することなく動作し,バイアスの少ない機能に効果的に依存し,堅牢な性能を維持することの証明である。
本研究は,データ中心あるいはモデルパラメータを(再)学習するコストの高い戦略とは対照的に,パラメータ除去による事前学習ニューラルネットワークの構造適応による効率的なバイアス緩和に寄与する。
一般的なベンチマーク実験では, 偏りのあるモデルの性能と計算効率の観点から, 提案手法の利点が示された。
関連論文リスト
- Rethinking Relation Extraction: Beyond Shortcuts to Generalization with a Debiased Benchmark [53.876493664396506]
ベンチマークは、機械学習アルゴリズムのパフォーマンスの評価、比較の促進、優れたソリューションの特定に不可欠である。
本稿では,関係抽出タスクにおけるエンティティバイアスの問題に対処する。
本稿では,エンティティの代替によって,エンティティ参照と関係型との擬似相関を破る不偏関係抽出ベンチマークDREBを提案する。
DREBの新たなベースラインを確立するために,データレベルとモデルトレーニングレベルを組み合わせたデバイアス手法であるMixDebiasを導入する。
論文 参考訳(メタデータ) (2025-01-02T17:01:06Z) - Improving Bias Mitigation through Bias Experts in Natural Language
Understanding [10.363406065066538]
補助モデルと主モデルの間に二項分類器を導入するデバイアス化フレームワークを提案する。
提案手法は補助モデルのバイアス識別能力を向上させる。
論文 参考訳(メタデータ) (2023-12-06T16:15:00Z) - Feature-Level Debiased Natural Language Understanding [86.8751772146264]
既存の自然言語理解(NLU)モデルは、特定のデータセットで高いパフォーマンスを達成するために、データセットバイアスに依存することが多い。
本稿では, バイアスの潜在特性を緩和し, バイアスの動的性質を無視するために, DCT(Debiasing contrastive learning)を提案する。
DCTは、ディストリビューション内のパフォーマンスを維持しながら、アウトオブディストリビューションデータセットの最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2022-12-11T06:16:14Z) - Modular and On-demand Bias Mitigation with Attribute-Removal Subnetworks [10.748627178113418]
本稿では, 単独で高度に疎細なデビアシングワークからなる, 新たなモジュラーバイアス緩和手法を提案する。
我々は、性別、人種、年齢の3つの分類タスクを保護属性として実験する。
論文 参考訳(メタデータ) (2022-05-30T15:21:25Z) - Toward More Generalized Malicious URL Detection Models [4.151658495779136]
本稿では、悪意のあるURL検出のための機械学習モデルを実行中に、パフォーマンスに深刻な影響を及ぼす可能性のあるデータバイアス問題を明らかにする。
このようなバイアスが解釈可能な機械学習技術を用いてどのように識別できるかを説明し、そのようなバイアスが分類モデルを訓練するための現実世界のセキュリティデータに自然に存在することを論じる。
偏りのある特徴から負の効果を緩和するために、多くのディープラーニングベースモデルに適用可能な偏りのあるトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2022-02-21T07:46:03Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - General Greedy De-bias Learning [163.65789778416172]
本稿では,関数空間における勾配降下のような偏りのあるモデルとベースモデルを優雅に訓練する一般グリーディ・デバイアス学習フレームワーク(GGD)を提案する。
GGDは、事前知識を持つタスク固有バイアスモデルと、事前知識を持たない自己アンサンブルバイアスモデルの両方の設定の下で、より堅牢なベースモデルを学ぶことができる。
論文 参考訳(メタデータ) (2021-12-20T14:47:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。