論文の概要: Causal Bias Detection in Generative Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2605.11365v2
- Date: Mon, 18 May 2026 15:50:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:45.602134
- Title: Causal Bias Detection in Generative Artificial Intelligence
- Title(参考訳): 生成人工知能における因果バイアス検出
- Authors: Drago Plecko,
- Abstract要約: 我々は、生成AIにおける因果フェアネスの問題を形式化し、共通の理論的枠組みの下で標準ML設定と統一する。
我々は, (a) 異なる因果経路と (b) 生成モデルのメカニズムによる実世界のメカニズムの置き換えの両方に沿って, 公正な影響の粒度の定量化を可能にする新たな因果分解結果を導出した。
- 参考スコア(独自算出の注目度): 15.736899098702972
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated systems built on artificial intelligence (AI) are increasingly deployed across high-stakes domains, raising critical concerns about fairness and the perpetuation of demographic disparities that exist in the world. In this context, causal inference provides a principled framework for reasoning about fairness, as it links observed disparities to underlying mechanisms and aligns naturally with human intuition and legal notions of discrimination. Prior work on causal fairness primarily focuses on the standard machine learning setting, where a decision-maker constructs a single predictive mechanism $f_{\widehat Y}$ for an outcome variable $Y$, while inheriting the causal mechanisms of all other covariates from the real world. The generative AI setting, however, is markedly more complex: generative models can sample from arbitrary conditionals over any set of variables, implicitly constructing their own beliefs about all causal mechanisms rather than learning a single predictive function. This fundamental difference requires new developments in causal fairness methodology. We formalize the problem of causal fairness in generative AI and unify it with the standard ML setting under a common theoretical framework. We then derive new causal decomposition results that enable granular quantification of fairness impacts along both (a) different causal pathways and (b) the replacement of real-world mechanisms by the generative model's mechanisms. We establish identification conditions and introduce efficient estimators for causal quantities of interest, and demonstrate the value of our methodology by analyzing race and gender bias in large language models across different datasets.
- Abstract(参考訳): 人工知能(AI)上に構築された自動化システムは、ますます高度な領域に展開され、公正性や世界の人口格差の永続性に対する批判的な懸念が高まっている。
この文脈では、因果推論は、観察された相違を根底にあるメカニズムと結びつけ、人間の直観や差別の法的概念と自然に一致させるので、公平性について推論するための原則化された枠組みを提供する。
因果フェアネスに関する以前の研究は、主に標準的な機械学習の設定に焦点を当てており、意思決定者は結果変数$Y$に対して単一の予測メカニズム$f_{\widehat Y}$を構築し、実際の世界から他のすべての共変数の因果メカニズムを継承する。
生成モデルは任意の条件から任意の変数の集合をサンプリングし、単一の予測関数を学ぶのではなく、すべての因果的メカニズムに関する独自の信念を暗黙的に構築することができる。
この根本的な違いは、因果フェアネス方法論における新しい発展を必要とする。
我々は、生成AIにおける因果フェアネスの問題を形式化し、共通の理論的枠組みの下で標準ML設定と統一する。
次に、両面に沿って公正な影響の粒度の定量化を可能にする新しい因果分解結果を導出する。
a)異なる因果経路と
b) 生成モデルのメカニズムによる実世界のメカニズムの置き換え。
同定条件を確立し,関心の因果的量に対する効率的な推定器を導入し,異なるデータセットにわたる大言語モデルにおける人種や性別の偏りを分析し,方法論の価値を実証する。
関連論文リスト
- A Theory of Information, Variation, and Artificial Intelligence [0.0]
実証研究の活発化は、生成AIの普及が情報、創造性、文化生産に顕著な均質化効果をもたらすことを示唆している。
本稿では、特殊領域内の知識を平らにする非常に均質化が、その知識をそれら全体で再結合可能な一貫したモジュールに同時にレンダリングする、と論じる。
この論文は、この緊張を解決するのに必要な認知的および制度的な足場を概説し、生成的AIがイノベーションの道具になるか、均質化されるかを決定する決定的な変数であると主張した。
論文 参考訳(メタデータ) (2025-08-20T16:21:13Z) - Learning Causality for Modern Machine Learning [2.093689302081589]
過去数十年間、経験的リスク最小化による機械学習は、学習において大きな能力を示してきた。
ERMは、変更の理解と処理方法の因果関係のモデリングを避けます。
本稿では,現代の機械学習において,より広範なタスクの因果性を取り入れ,実現する方法を検討する。
論文 参考訳(メタデータ) (2025-06-13T21:03:49Z) - Causal Responsibility Attribution for Human-AI Collaboration [62.474732677086855]
本稿では,人間のAIシステムにおける責任を体系的に評価するために,構造因果モデル(SCM)を用いた因果的枠組みを提案する。
2つのケーススタディは、多様な人間とAIのコラボレーションシナリオにおけるフレームワークの適応性を示している。
論文 参考訳(メタデータ) (2024-11-05T17:17:45Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - Learning for Counterfactual Fairness from Observational Data [62.43249746968616]
公正な機械学習は、人種、性別、年齢などの特定の保護された(感受性のある)属性によって記述されるある種のサブグループに対して、学習モデルのバイアスを取り除くことを目的としている。
カウンターファクトフェアネスを達成するための既存の手法の前提条件は、データに対する因果モデルの事前の人間の知識である。
本研究では,新しいフレームワークCLAIREを提案することにより,因果関係を付与せずに観測データから対実的に公正な予測を行う問題に対処する。
論文 参考訳(メタデータ) (2023-07-17T04:08:29Z) - Ecosystem-level Analysis of Deployed Machine Learning Reveals Homogeneous Outcomes [72.13373216644021]
本研究では,機械学習の社会的影響を,特定の文脈に展開されるモデルの集合を考慮し検討する。
デプロイされた機械学習はシステム障害を起こしやすいため、利用可能なすべてのモデルに排他的に誤分類されているユーザもいます。
これらの例は、エコシステムレベルの分析が、機械学習の社会的影響を特徴づける独自の強みを持っていることを示している。
論文 参考訳(メタデータ) (2023-07-12T01:11:52Z) - ComplAI: Theory of A Unified Framework for Multi-factor Assessment of
Black-Box Supervised Machine Learning Models [6.279863832853343]
ComplAIは、説明可能性、堅牢性、パフォーマンス、公正性、モデル行動を有効にし、観察し、分析し、定量化するユニークなフレームワークである。
教師付き機械学習モデルの評価は、正しい予測を行う能力だけでなく、全体的な責任の観点から行う。
論文 参考訳(メタデータ) (2022-12-30T08:48:19Z) - Causal Fairness Analysis [68.12191782657437]
意思決定設定における公平性の問題を理解し、モデル化し、潜在的に解決するためのフレームワークを導入します。
我々のアプローチの主な洞察は、観測データに存在する格差の定量化と、基礎となる、しばしば観測されていない、因果的なメカニズムの収集を結びつけることである。
本研究は,文献中の異なる基準間の関係を整理し,説明するための最初の体系的試みであるフェアネスマップにおいて,本研究の成果を左右するものである。
論文 参考訳(メタデータ) (2022-07-23T01:06:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。