論文の概要: Robust Decision Aggregation with Adversarial Experts
- arxiv url: http://arxiv.org/abs/2403.08222v1
- Date: Wed, 13 Mar 2024 03:47:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 15:50:03.358308
- Title: Robust Decision Aggregation with Adversarial Experts
- Title(参考訳): 対人的専門家によるロバストな意思決定
- Authors: Yongkang Guo, Yuqing Kong
- Abstract要約: 我々は、真理と敵の双方の専門家が存在する場合、二項決定集約問題を考える。
最悪の情報構造下では,後悔を最小限に抑える最適なアグリゲータが見つかる。
- 参考スコア(独自算出の注目度): 4.751372843411884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a binary decision aggregation problem in the presence of both
truthful and adversarial experts. The truthful experts will report their
private signals truthfully with proper incentive, while the adversarial experts
can report arbitrarily. The decision maker needs to design a robust aggregator
to forecast the true state of the world based on the reports of experts. The
decision maker does not know the specific information structure, which is a
joint distribution of signals, states, and strategies of adversarial experts.
We want to find the optimal aggregator minimizing regret under the worst
information structure. The regret is defined by the difference in expected loss
between the aggregator and a benchmark who makes the optimal decision given the
joint distribution and reports of truthful experts.
We prove that when the truthful experts are symmetric and adversarial experts
are not too numerous, the truncated mean is optimal, which means that we remove
some lowest reports and highest reports and take averaging among the left
reports. Moreover, for many settings, the optimal aggregators are in the family
of piecewise linear functions. The regret is independent of the total number of
experts but only depends on the ratio of adversaries. We evaluate our
aggregators by numerical experiment in an ensemble learning task. We also
obtain some negative results for the aggregation problem with adversarial
experts under some more general information structures and experts' report
space.
- Abstract(参考訳): 我々は、真理と敵の双方の専門家が存在する場合、二項決定集約問題を考える。
真面目な専門家は個人的な信号を真実に適切なインセンティブで報告し、敵の専門家は任意に報告することができる。
意思決定者は、専門家の報告に基づいて世界の本当の状態を予測するための堅牢なアグリゲータを設計する必要がある。
意思決定者は、信号、状態、および敵の専門家の戦略の共同分布である特定の情報構造を知らない。
最悪の情報構造の下で、後悔を最小限に抑える最適なアグリゲータを見つけたいと思っています。
この後悔は、アグリゲータとベンチマークの間の期待される損失の差によって定義される。
真理の専門家が対称的であり、敵対的な専門家があまり多くないことが証明された場合、取り残された平均値が最適であることは、最も低い報告と最も高い報告を取り除き、左のレポートの中で平均値を取ることを意味する。
さらに、多くの設定において、最適アグリゲータは断片線型関数の族に属する。
後悔は専門家の総数とは無関係であるが、敵の比率にのみ依存する。
アンサンブル学習課題における数値実験によりアグリゲータを評価する。
また、より一般的な情報構造と専門家の報告空間の下で、敵の専門家による集約問題に対する否定的な結果を得た。
関連論文リスト
- Mitigating the Participation Bias by Balancing Extreme Ratings [3.5785450878667597]
我々は、参加バイアスの下で、ロバストな評価集計タスクについて検討する。
私たちの目標は、集計された評価と、基礎となるすべての評価の平均との間の2乗損失を最小化することです。
論文 参考訳(メタデータ) (2025-02-06T02:58:46Z) - Heavy-tailed Contamination is Easier than Adversarial Contamination [8.607294463464523]
ハマー (Huber, 1960) にさかのぼる統計学と計算機科学のコミュニティにおける研究の成果は、統計学的および計算学的に効率的なアウトリア・ローバスト推定器に繋がった。
2つの特定の外れ値モデル、すなわち対向モデルと重尾モデルが注目されている。
論文 参考訳(メタデータ) (2024-11-22T19:00:33Z) - The Surprising Benefits of Base Rate Neglect in Robust Aggregation [14.286448842405678]
私たちの仕事は、基準レートを無視する傾向のある専門家を考慮に入れています。
ある程度のベースレートの無視は、堅牢な予測アグリゲーションに役立ちます。
論文 参考訳(メタデータ) (2024-06-19T12:20:29Z) - Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす
本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。
本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文 参考訳(メタデータ) (2024-04-16T17:59:55Z) - Robust Decision Aggregation with Second-order Information [4.021926055330022]
2人の専門家による意思決定集約問題について検討し、それぞれがプライベートシグナルを観察した後に2項の推薦を行う。
信号と状態の合同情報構造を知らないエージェントは、専門家の勧告を見て、アクションを実際の状態と一致させることを目指している。
本シナリオでは,2次情報の追加によるアグリゲーション向上の可能性を検討した。
論文 参考訳(メタデータ) (2023-11-23T16:39:55Z) - Merge, Then Compress: Demystify Efficient SMoE with Hints from Its Routing Policy [84.11508381847929]
わずかに活性化されたMixture-of-Experts(SMoE)は、ニューラルネットワークの学習能力のスケールアップを約束している。
ルーティング統計を利用したM-SMoEを提案する。
我々のMC-SMoEは最大80%のメモリと20%のFLOPを削減でき、性能は実質的に損なわれない。
論文 参考訳(メタデータ) (2023-10-02T16:51:32Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Are You Smarter Than a Random Expert? The Robust Aggregation of
Substitutable Signals [14.03122229316614]
本稿では,幅広い情報構造から専門家の知識を逆選択する文脈において,予測集約の研究を開始する。
投射的代替条件の下では、専門家の予測の平均値を取得することは、ランダムな専門家を信頼する戦略によって大幅に改善される。
本研究では, 専門家の予測を平均化し, 一定の要因によって前者から遠ざかることで平均を極端に推し進めることにより, 集積器の性能保証は, 事前の知識がなくても実現可能であることを示す。
論文 参考訳(メタデータ) (2021-11-04T20:50:30Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Towards an Understanding of Benign Overfitting in Neural Networks [104.2956323934544]
現代の機械学習モデルは、しばしば膨大な数のパラメータを使用し、通常、トレーニング損失がゼロになるように最適化されている。
ニューラルネットワークの2層構成において、これらの良質な過適合現象がどのように起こるかを検討する。
本稿では,2層型ReLUネットワーク補間器を極小最適学習率で実現可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T19:08:53Z) - Malicious Experts versus the multiplicative weights algorithm in online
prediction [85.62472761361107]
2人の専門家と1人の予測者による予測問題を考える。
専門家の一人が正直で、各ラウンドで確率$mu$で正しい予測をしていると仮定する。
もう一つは悪意のあるもので、各ラウンドで真の結果を知り、予測者の損失を最大化するために予測を行う。
論文 参考訳(メタデータ) (2020-03-18T20:12:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。