論文の概要: Self-fulfilling Bandits: Endogeneity Spillover and Dynamic Selection in
Algorithmic Decision-making
- arxiv url: http://arxiv.org/abs/2108.12547v1
- Date: Sat, 28 Aug 2021 01:41:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:50:50.827316
- Title: Self-fulfilling Bandits: Endogeneity Spillover and Dynamic Selection in
Algorithmic Decision-making
- Title(参考訳): 自己充足バンド:アルゴリズム決定における内在性スパイルオーバーと動的選択
- Authors: Jin Li, Ye Luo, Xiaowei Zhang
- Abstract要約: 本研究では,データと行動が相互依存するアルゴリズム決定における内在性問題について検討する。
本稿では,先進的なオンライン学習アルゴリズムに機器変数を組み込むことで,バイアスを補正するアルゴリズムのクラスを提案する。
- 参考スコア(独自算出の注目度): 8.881788084913147
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we study endogeneity problems in algorithmic decision-making
where data and actions are interdependent. When there are endogenous covariates
in a contextual multi-armed bandit model, a novel bias (self-fulfilling bias)
arises because the endogeneity of the covariates spills over to the actions. We
propose a class of algorithms to correct for the bias by incorporating
instrumental variables into leading online learning algorithms. These
algorithms also attain regret levels that match the best known lower bound for
the cases without endogeneity. To establish the theoretical properties, we
develop a general technique that untangles the interdependence between data and
actions.
- Abstract(参考訳): 本稿では,データと行動が相互依存するアルゴリズム決定における内在性問題について検討する。
文脈的多腕バンディットモデルに内在的共変量が存在するとき、その共変量の内在性が作用にこぼれるため、新しいバイアス(自己満足バイアス)が発生する。
本稿では,オンライン学習アルゴリズムにインストゥルメンタル変数を組み込むことでバイアスを補正するアルゴリズムのクラスを提案する。
これらのアルゴリズムは、内在性のない場合に最もよく知られた下限に合致する後悔レベルも達成する。
理論的性質を確立するため,データと行動間の相互依存を解き放つ一般的な手法を開発した。
関連論文リスト
- Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Counterfactual Fairness through Transforming Data Orthogonal to Bias [7.109458605736819]
我々は新しいデータ前処理アルゴリズムOrthogonal to Bias (OB)を提案する。
OBは、連続的な敏感な変数群の影響を排除し、機械学習アプリケーションにおける反ファクトフェアネスを促進するように設計されている。
OBはモデルに依存しないため、幅広い機械学習モデルやタスクに適用できる。
論文 参考訳(メタデータ) (2024-03-26T16:40:08Z) - Debiasing Machine Learning Models by Using Weakly Supervised Learning [3.3298048942057523]
アルゴリズムの出力と感度変数の両方が連続的な設定において、アルゴリズム決定のバイアス軽減の問題に取り組む。
典型的な例は、年齢や財政状況に関して行われる不公平な決定である。
我々のバイアス緩和戦略は弱い教師付き学習手法であり、データのごく一部を公平に測定する必要がある。
論文 参考訳(メタデータ) (2024-02-23T18:11:32Z) - Globally-Optimal Greedy Experiment Selection for Active Sequential
Estimation [1.1530723302736279]
逐次的に収集したデータの実験を適応的に選択するアクティブシーケンシャル推定の問題について検討する。
目標は、より正確なモデル推定のための実験選択ルールを設計することである。
そこで本稿では,グリーディ実験の選択手法のクラスを提案し,最大可能性の統計的解析を行う。
論文 参考訳(メタデータ) (2024-02-13T17:09:29Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Bounding Counterfactuals under Selection Bias [60.55840896782637]
本稿では,識別不能なクエリと識別不能なクエリの両方に対処するアルゴリズムを提案する。
選択バイアスによって引き起こされる欠如にもかかわらず、利用可能なデータの可能性は無限であることを示す。
論文 参考訳(メタデータ) (2022-07-26T10:33:10Z) - Deep Active Learning with Noise Stability [24.54974925491753]
ラベルのないデータの不確実性推定は、アクティブな学習に不可欠である。
本稿では,雑音の安定性を利用して不確実性を推定する新しいアルゴリズムを提案する。
本手法はコンピュータビジョン,自然言語処理,構造データ解析など,様々なタスクに適用可能である。
論文 参考訳(メタデータ) (2022-05-26T13:21:01Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Causal Reinforcement Learning: An Instrumental Variable Approach [8.881788084913147]
データ生成とデータ解析の動的な相互作用は、標準データ分析における内在性の問題を悪化させる新しいタイプのバイアス -- 強化バイアス -- に繋がることを示している。
この論文の重要な貢献は、ノイズが時間依存を特徴とする一般的な設定におけるアルゴリズムの分析を可能にする新しい手法の開発である。
論文 参考訳(メタデータ) (2021-03-06T03:57:46Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。