論文の概要: Misaligned by Design: Incentive Failures in Machine Learning
- arxiv url: http://arxiv.org/abs/2511.07699v1
- Date: Wed, 12 Nov 2025 01:12:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.435939
- Title: Misaligned by Design: Incentive Failures in Machine Learning
- Title(参考訳): 設計ミスアライメント: 機械学習におけるインセンティブ障害
- Authors: David Autor, Andrew Caplin, Daniel Martin, Philip Marx,
- Abstract要約: 非対称な損失関数は、予測可能な方法で人や機械の目的を誤る可能性があることを示す。
インセンティブデザインの経済モデルと内在的情報獲得を用いて,この結果を合理化する。
この問題の正式な扱いは、直感的なアピールのために取り入れられた手法が、実際に予測可能な方法で人や機械の目的を誤認することを明らかにします。
- 参考スコア(独自算出の注目度): 1.7180474886924841
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The cost of error in many high-stakes settings is asymmetric: misdiagnosing pneumonia when absent is an inconvenience, but failing to detect it when present can be life-threatening. Because of this, artificial intelligence (AI) models used to assist such decisions are frequently trained with asymmetric loss functions that incorporate human decision-makers' trade-offs between false positives and false negatives. In two focal applications, we show that this standard alignment practice can backfire. In both cases, it would be better to train the machine learning model with a loss function that ignores the human's objective and then adjust predictions ex post according to that objective. We rationalize this result using an economic model of incentive design with endogenous information acquisition. The key insight from our theoretical framework is that machine classifiers perform not one but two incentivized tasks: choosing how to classify and learning how to classify. We show that while the adjustments engineers use correctly incentivize choosing, they can simultaneously reduce the incentives to learn. Our formal treatment of the problem reveals that methods embraced for their intuitive appeal can in fact misalign human and machine objectives in predictable ways.
- Abstract(参考訳): 欠席時に肺炎を誤診することは不便であるが、現在ある時に検出できないことは命の危険である。
このため、人工知能(AI)モデルは、人間の意思決定者による偽陽性と偽陰性の間のトレードオフを含む非対称な損失関数でしばしば訓練される。
2つの焦点応用において、この標準アライメントの実践がバックファイアを生じさせることを示す。
どちらの場合も、人間の目的を無視する損失関数で機械学習モデルをトレーニングし、その目的に従ってポスト前の予測を調整するほうがよい。
インセンティブデザインの経済モデルと内在的情報獲得を用いて,この結果を合理化する。
私たちの理論フレームワークから得られる重要な洞察は、機械分類器が1つではなく2つのインセンティブ付きタスクを実行することである。
調整エンジニアが正しく選択をインセンティブ化する一方で、学習のインセンティブを同時に減らすことができることを示す。
この問題の正式な扱いは、直感的なアピールのために取り入れられた手法が、実際に予測可能な方法で人や機械の目的を誤認することを明らかにします。
関連論文リスト
- Learning to Make MISTAKEs: Modeling Incorrect Student Thinking And Key Errors [58.65143578052761]
本稿では,推論誤りの高品質な合成例を構成する新しい手法であるMISTAKEを提案する。
3つの教育課題において,MISTAKEを評価した結果,(1)誤答のシミュレーションにおいて高い精度が得られた。
論文 参考訳(メタデータ) (2025-10-13T15:10:38Z) - An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes [55.93922317950527]
DRQ-learnerと呼ばれる新しいメタラーナーを開発した。
DRQ-learnerは離散状態空間と連続状態空間の両方の設定に適用できます。
論文 参考訳(メタデータ) (2025-09-30T15:49:29Z) - Can Large Reasoning Models Self-Train? [51.0277533541394]
多数決投票を簡単な自己フィードバック機構として利用し、強化学習において自己学習が持続できるかどうかを検討する。
この基本的なアプローチは、モデルの推論性能だけでなく、次のRLイテレーションでより良い品質フィードバックを生成する能力も改善します。
しかし、我々の分析では、このような自己学習パラダイムの限界も明らかにしています - 自己回帰の長いRLは、報酬のハッキングにつながるため、突然、そして完全なパフォーマンスが崩壊します。
論文 参考訳(メタデータ) (2025-05-27T17:16:00Z) - Rethinking Early Stopping: Refine, Then Calibrate [49.966899634962374]
キャリブレーション・リファインメント分解の新規な変分定式化について述べる。
我々は,校正誤差と精錬誤差が訓練中に同時に最小化されないという理論的,実証的な証拠を提供する。
論文 参考訳(メタデータ) (2025-01-31T15:03:54Z) - Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - Fairness Implications of Heterogeneous Treatment Effect Estimation with
Machine Learning Methods in Policy-making [0.0]
予測機械学習の標準的なAIフェアネスアプローチは、すべての因果機械学習アプリケーションに適していないと我々は主張する。
政策決定は、通常、因果的機械学習モデルが間接的な力しか持たないような共同決定である、と我々は主張する。
論文 参考訳(メタデータ) (2023-09-02T03:06:14Z) - Machine Learning with a Reject Option: A survey [18.43771007525432]
この調査は、拒絶を伴う機械学習の概要を提供することを目的としている。
本稿では,2種類の拒絶,曖昧さ,新規性拒絶につながる条件を紹介する。
我々は,モデルの予測的,拒絶的品質を評価するための戦略をレビューし,分類する。
論文 参考訳(メタデータ) (2021-07-23T14:43:56Z) - Towards Real-time Mispronunciation Detection in Kids' Speech [19.17617301462919]
現代の誤発音検出・診断システムでは,ディープラーニングの導入により精度が著しく向上している。
特に、最先端技術は双方向のリカレントネットワークを使用し、一方向ネットワークの方が適している可能性がある。
モデルのアライメントを改善するために2つの損失項を試すことにより、この制限に対処する。
論文 参考訳(メタデータ) (2020-03-03T19:58:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。