論文の概要: Explaining Human Choice Probabilities with Simple Vector Representations
- arxiv url: http://arxiv.org/abs/2511.03643v1
- Date: Wed, 05 Nov 2025 17:03:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.499352
- Title: Explaining Human Choice Probabilities with Simple Vector Representations
- Title(参考訳): 簡単なベクトル表現による人間の選択確率の説明
- Authors: Peter DiBerardino, Britt Anderson,
- Abstract要約: 我々は,選択周波数ヒストグラムをベクトルとして扱うことによって構成した参加者選択モデルを開発した。
マッチング/アンチマッチと最大化/最小化という2つの基本方針だけで、参加者の選択を考慮に入れることができました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When people pursue rewards in stochastic environments, they often match their choice frequencies to the observed target frequencies, even when this policy is demonstrably sub-optimal. We used a ``hide and seek'' task to evaluate this behavior under conditions where pursuit (seeking) could be toggled to avoidance (hiding), while leaving the probability distribution fixed, or varying complexity by changing the number of possible choices. We developed a model for participant choice built from choice frequency histograms treated as vectors. We posited the existence of a probability antimatching strategy for avoidance (hiding) rounds, and formalized this as a vector reflection of probability matching. We found that only two basis policies: matching/antimatching and maximizing/minimizing were sufficient to account for participant choices across a range of room numbers and opponent probability distributions. This schema requires only that people have the ability to remember the relative frequency of the different outcomes. With this knowledge simple operations can construct the maximizing and minimizing policies as well as matching and antimatching strategies. A mixture of these two policies captures human choice patterns in a stochastic environment.
- Abstract(参考訳): 確率的環境において報酬を追求する場合、このポリシーが明らかに準最適である場合でも、選択頻度と観測対象周波数とを一致させることが多い。
我々は,探索(探索)を回避(隠蔽)に切り替える条件下で,確率分布を固定したままにしたり,可能な選択数を変えて複雑さを変化させたりする条件下で,この振る舞いを評価するために,'hide and seek'タスクを使用した。
選択周波数ヒストグラムをベクトルとして処理した参加者選択モデルを開発した。
我々は、回避(隠蔽)ラウンドに対する確率マッチング戦略の存在を仮定し、これを確率マッチングのベクトル反射として定式化した。
その結果、部屋数と反対確率分布の2つの選択を考慮すれば、マッチング/アンチマッチと最大化/最小化の2つの基本方針が十分であることがわかった。
このスキーマは、人々が異なる結果の相対的な頻度を記憶する能力のみを必要とする。
この知識により、単純な操作は、マッチングとアンチマッチング戦略と同様に、ポリシーの最大化と最小化を構築することができる。
これら2つのポリシーの混合は、確率的環境における人間の選択パターンをキャプチャする。
関連論文リスト
- Consistency of Selection Strategies for Fraud Detection [0.0]
我々は、保険業者が詐欺を捜査する主張をどう選ぶかを研究する。
これは一貫性のない学習につながる可能性があり、ランダムな代替案を提案する。
論文 参考訳(メタデータ) (2025-09-23T07:33:33Z) - A Minimaximalist Approach to Reinforcement Learning from Human Feedback [49.45285664482369]
人間のフィードバックから強化学習を行うアルゴリズムとして,SPO(Self-Play Preference Optimization)を提案する。
我々のアプローチは、報酬モデルや不安定な敵の訓練を必要としないという点で最小主義である。
我々は,一連の継続的制御タスクにおいて,報酬モデルに基づくアプローチよりもはるかに効率的に学習できることを実証した。
論文 参考訳(メタデータ) (2024-01-08T17:55:02Z) - Confidence-Based Model Selection: When to Take Shortcuts for
Subpopulation Shifts [119.22672589020394]
モデル信頼度がモデル選択を効果的に導くことができるConfidence-based Model Selection (CosMoS)を提案する。
我々はCosMoSを,データ分散シフトのレベルが異なる複数のテストセットを持つ4つのデータセットで評価した。
論文 参考訳(メタデータ) (2023-06-19T18:48:15Z) - Learning from a Biased Sample [2.7728441305894447]
本稿では,テスト分布のファミリーで発生する最悪のリスクを最小限に抑える決定ルールの学習方法を提案する。
本研究では,健康調査データからメンタルヘルススコアの予測を行うケーススタディにおいて,提案手法を実証的に検証した。
論文 参考訳(メタデータ) (2022-09-05T04:19:16Z) - Algorithms for Adaptive Experiments that Trade-off Statistical Analysis
with Reward: Combining Uniform Random Assignment and Reward Maximization [50.725191156128645]
トンプソンサンプリングのようなマルチアームバンディットアルゴリズムは適応的な実験を行うのに利用できる。
統計的解析のための一様ランダム化の利点を組み合わせた2つのアルゴリズムを探索する2つのアーム実験のシミュレーションを提案する。
論文 参考訳(メタデータ) (2021-12-15T22:11:58Z) - Sequential Community Mode Estimation [7.693649834261879]
本研究では,集団内最大の集団を個体の連続的無作為なサンプリングによって同定する問題について検討する。
この問題に対する新しいアルゴリズムを提案し,解析し,任意のアルゴリズムの下でエラーの確率に関する情報理論の下限を確立する。
論文 参考訳(メタデータ) (2021-11-16T15:05:40Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Continuous Mean-Covariance Bandits [39.820490484375156]
本稿では,選択肢相関を考慮した連続平均共分散帯域モデルを提案する。
CMCBでは、与えられた選択肢の重みベクトルを逐次選択し、決定に従ってランダムなフィードバックを観察する学習者がいる。
最適な後悔(対数的因子を含む)を伴う新しいアルゴリズムを提案し、それらの最適性を検証するために一致した下界を提供する。
論文 参考訳(メタデータ) (2021-02-24T06:37:05Z) - Consensus-Guided Correspondence Denoising [67.35345850146393]
本稿では,地域間コンセンサス学習フレームワークと対応関係を異色化し,対応関係をロバストに識別する。
ローカル地域からグローバル地域への動的グラフから推定されるコンセンサススコアに基づいて,信頼度の高い候補を初期マッチングから蒸留する新しい「プルーニング」ブロックを導入した。
本手法は、堅牢なラインフィッティング、ワイドベースライン画像マッチング、画像ローカリゼーションベンチマークを顕著なマージンで上回る。
論文 参考訳(メタデータ) (2021-01-03T09:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。