Trustworthy AI Suffers from Invariance Conflicts and Causality is The Solution
Abstractの概要
本ポジションペーパーは、信頼できるAIの中核的目標である公平性、頑健性、プライバシー、説明可能性を同時に最適化することが困難である理由として、それぞれがモデルの振る舞いに対して異なる不変性要件を課すことを論じている。著者らは介入と不変性の言語を用いて、公平性と精度、プライバシーと有用性、頑健性と精度、説明可能性と性能といった一般的なトレードオフを、データ生成過程への異なる変更に対する安定性要求間の衝突として再解釈する。複数の目標や精度制約のバランスを取る必要がある場合、観測的手法だけでは安定したメカニズムと擬似的な依存関係を区別できないため、因果推論が必要であると主張している。さらに、この議論を古典的な機械学習から基盤モデルへと拡張し、因果的仮定を現代のシステムに統合するための明示的・暗黙的・ハイブリッドな方法を議論している。最後に、識別可能性、スケーリング、評価、データの制限を含む、概念的および実装上の未解決課題を提示している。
新規性
本論文の独自の貢献は、信頼できるAIのトレードオフを、個別の経験的副作用として扱うのではなく、介入下での異なる不変性要件間の非両立性として捉えた点にある。さらに、適切な不変性を選択的に適用し、評価を観測的精度から古典的モデルおよび基盤モデルの両方にわたる介入的妥当性へと移行させるための統一的枠組みとして因果性を提案している。
成果
ポジションペーパーとして、主な成果は新たなベンチマーク結果ではなく、統合された概念的枠組みである。著者らは、因果性が選択的不変性を通じていくつかの主要な信頼できるAIのトレードオフをどのように緩和または解決しうるかを示し、実践的な統合戦略を明示的・暗黙的・ハイブリッドなアプローチに整理している。これには、事前学習、事後学習、監査の段階をカバーする基盤モデルのライフサイクルの観点も含まれる。
論文の注目点
- 本論文は、公平性、プライバシー、頑健性、説明可能性の目標を、データ生成過程への異なる介入下での不変性要件として再定式化し、トレードオフを構造的に解釈可能にしている。
- 因果モデルは、許容される安定したメカニズムと擬似的または規範的に許容されない経路を区別することで選択的不変性を可能にし、これは純粋に観測的な手法では達成できないと論じている。
- 基盤モデルに対して、モデルのライフサイクル全体にわたる明示的・暗黙的・ハイブリッドな因果統合戦略を提案し、識別可能性、スケーラビリティ、ベンチマーク、因果データの利用可能性における未解決課題を強調している。