論文の概要: Energy Shields for Fairness
- arxiv url: http://arxiv.org/abs/2605.24926v1
- Date: Sun, 24 May 2026 08:10:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.514911
- Title: Energy Shields for Fairness
- Title(参考訳): フェアネスのためのエネルギーシールド
- Authors: Filip Cano, Thomas A. Henzinger, Konstantin Kueffner,
- Abstract要約: 伝統的なフェアネスシールドは、実行時フェアネスを突然強制し、決定の順序が実行時フェアネス尺度の目標に反するたびに、エフェデミニズム的に介入する。
このことは我々の主要な概念的貢献である textbfenergy shields を動機付けます。
エネルギーシールドは、新しい、軽量で適応的なコントローラで、一連の決定を監視し、実行時の公平さを円滑に確保するためにエンプロバビリズム的に介入する。
これにより、エフェクトbfファーストフェアネスシールドは、エフェショート長期安全と長期的安全の両方を提供する。
- 参考スコア(独自算出の注目度): 7.5385675686924865
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Runtime fairness is not a one-time constraint but a dynamic property evaluated over a sequence of decisions. To ensure fairness at runtime, it is necessary to account for past decisions, information neglected by conventional, static classifiers. Traditional fairness shields enforce runtime fairness abruptly, by intervening \emph{deterministically} whenever a sequence of decisions violates the target for a running fairness measure. This motivates our \emph{main conceptual contribution: \textbf{energy shields}.} An energy shield is a novel, lightweight, adaptive controller that monitors a sequence of decisions and intervenes \emph{probabilistically} to ensure runtime fairness smoothly, by utilizing physics-inspired energy functions to nudge the sequence toward fairness: the more unfair the decisions, the stronger the nudging force becomes. This makes energy shields the \emph{\textbf{first}} fairness shields to provide both \emph{short-term safety and long-term liveness guarantees}. Safety ensures that the running fairness measure stays within a running target interval with high probability, and liveness ensures that the limit of the fairness measure lies within the limit target interval. Intuitively, the short-term specifies the tolerated fairness values and the long-term specifies the desired fairness values. We also provide a synthesis procedure for constructing the least intrusive energy shield for a given target specification, and demonstrate its efficiency experimentally. We evaluate our energy shields against existing fairness shields through the lens of short- and long-term fairness.
- Abstract(参考訳): 実行時の公正さは1回限りの制約ではなく、一連の決定に対して評価される動的なプロパティである。
実行時の公平性を確保するためには、従来の静的分類器によって無視された情報である過去の決定を考慮に入れる必要がある。
従来のフェアネスシールドは、実行時フェアネスを突然強制し、決定の順序が実行時フェアネス尺度のターゲットに反するたびに \emph{determinically} を介入する。
これは、我々の \emph{main 概念的コントリビューション: \textbf{energy shields} を動機付けます。
エネルギーシールド(英: energy shield)とは、物理学に着想を得たエネルギー関数を用いて、決定の順序を監視し、実行時の公正性を円滑に確保する、新規で軽量で適応的な制御装置である。
これにより、エネルギーシールドは \emph{\textbf{first}} フェアネスシールドとなり、 \emph{short-term safety と long-term liveness guarantees} の両方を提供する。
ランニングフェアネス尺度は、高い確率でランニングターゲットインターバル内に留まることを保証し、ライブネスは、フェアネス尺度の限界がリミットターゲットインターバル内にあることを保証します。
直感的には、短期は許容公正値、長期は所望の公正値を指定する。
また、所定の目標仕様に対して最小侵入エネルギーシールドを構築するための合成手順を提案し、その効率を実験的に実証する。
我々は,短時間・長期のフェアネスレンズを用いて,既存のフェアネスシールドに対するエネルギーシールドの評価を行った。
関連論文リスト
- Long-term Fairness with Selective Labels [7.685857844572122]
選択ラベル設定における長期的公正性について検討し、単純解が公平性を保証するものではないことを解析的に示す。
本稿では,選択ラベルを用いた長期的公正意思決定のための新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-05-21T10:42:56Z) - Masked Unfairness: Hiding Causality within Zero ATE [0.48429188360918735]
私たちは決定レベルでではなく、モデルレベルで公正さを規制しなければならないと論じています。
ATEに基づく規制の下での最適化は、大きな不平等な治療を引き起こす可能性がある。
本研究は,真偽と因果正当性の相違が共起によって引き起こされることを示す。
論文 参考訳(メタデータ) (2026-03-07T02:03:14Z) - Energy-Driven Steering: Reducing False Refusals in Large Language Models [80.09252175869858]
エネルギー駆動ステアリング(EDS、Energy-Driven Steering)は、動的で推論時間の介入によってこの問題を解決するために設計された、新しい、微調整自由なフレームワークである。
我々は、望ましくない(偽の拒絶または脱獄)状態に高エネルギーを割り当て、望ましい(好ましくない反応または安全な拒絶)状態に低エネルギーを割り当てるために、軽量な外部エネルギーベースモデル(EBM)を訓練した。
エネルギー関数の勾配を利用してLLMの隠れた状態を低エネルギー領域に動的に操る。
論文 参考訳(メタデータ) (2025-10-09T06:01:41Z) - Fairness Shields: Safeguarding against Biased Decision Makers [6.4181048948049595]
我々は、シンボル的意思決定者が別のデプロイされたブラックボックス意思決定者の決定順序を監視するフェアネス・シールドを導入する。
フェアネスシールドを計算するための4つの異なるアルゴリズムを提案し、そのうちの1つは固定された水平線に対するフェアネスを保証する。
我々のアルゴリズムは計算コストと最適性保証のレベルが異なる有界-水平最適制御問題の異なるインスタンスを解く。
論文 参考訳(メタデータ) (2024-12-16T17:21:12Z) - Equal Opportunity of Coverage in Fair Regression [50.76908018786335]
我々は、予測の不確実性の下で公正な機械学習(ML)を研究し、信頼性と信頼性のある意思決定を可能にする。
本研究は,(1)類似した結果の異なる集団に対するカバー率が近いこと,(2)人口全体のカバー率が一定水準にあること,の2つの特性を達成することを目的としたカバーの平等機会(EOC)を提案する。
論文 参考訳(メタデータ) (2023-11-03T21:19:59Z) - Consistent End-to-End Estimation for Counterfactual Fairness [56.9060492313073]
本稿では, 対実フェアネスの予測を行うための新しい対実フェアネス予測器を提案する。
我々は,本手法が対実公正性の概念を確実にするのに有効であることを理論的に保証する。
論文 参考訳(メタデータ) (2023-10-26T17:58:39Z) - Adapting Static Fairness to Sequential Decision-Making: Bias Mitigation Strategies towards Equal Long-term Benefit Rate [41.51680686036846]
逐次意思決定におけるバイアスに対処するため,Equal Long-term Benefit Rate (ELBERT) という長期公正性の概念を導入する。
ELBERTは、以前の長期公正の概念に見られる時間的差別問題に効果的に対処する。
ELBERT-POは高い有効性を維持しながらバイアスを著しく減少させることを示した。
論文 参考訳(メタデータ) (2023-09-07T01:10:01Z) - Proportional Fairness in Obnoxious Facility Location [70.64736616610202]
この問題に対して,距離に基づく比例フェアネスの概念の階層構造を提案する。
決定論的かつランダムなメカニズムを考察し、比例フェアネスの価格に関する厳密な境界を計算する。
モデルの拡張が2つあることを示す。
論文 参考訳(メタデータ) (2023-01-11T07:30:35Z) - Algorithmic Decision Making with Conditional Fairness [48.76267073341723]
条件付きフェアネスを、条件付きフェアネス変数の条件付けにより、より健全なフェアネス計量として定義する。
本稿では,アルゴリズム決定の精度と公平性のトレードオフを追跡するために,導出条件公正規則化器(DCFR)を提案する。
論文 参考訳(メタデータ) (2020-06-18T12:56:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。