論文の概要: More Than Irrational: Modeling Belief-Biased Agents
- arxiv url: http://arxiv.org/abs/2511.12359v1
- Date: Sat, 15 Nov 2025 21:14:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.989178
- Title: More Than Irrational: Modeling Belief-Biased Agents
- Title(参考訳): 不合理性以上のもの: 信念バイアス剤をモデル化する
- Authors: Yifan Zhu, Sammie Katt, Samuel Kaski,
- Abstract要約: 本稿では,認知的拘束力のあるエージェントに対して,偏見的信念の下で最適に作用する計算合理的(CR)ユーザモデルについて紹介する。
受動的観察から、潜伏するユーザ固有の境界を識別し、バイアスのある信念状態を推定するという課題に対処する。
CRモデルはメモリ容量の異なるレベルに対応する直感的に妥当な振る舞いを生成する。
- 参考スコア(独自算出の注目度): 25.274115351731325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the explosive growth of AI and the technologies built upon it, predicting and inferring the sub-optimal behavior of users or human collaborators remains a critical challenge. In many cases, such behaviors are not a result of irrationality, but rather a rational decision made given inherent cognitive bounds and biased beliefs about the world. In this paper, we formally introduce a class of computational-rational (CR) user models for cognitively-bounded agents acting optimally under biased beliefs. The key novelty lies in explicitly modeling how a bounded memory process leads to a dynamically inconsistent and biased belief state and, consequently, sub-optimal sequential decision-making. We address the challenge of identifying the latent user-specific bound and inferring biased belief states from passive observations on the fly. We argue that for our formalized CR model family with an explicit and parameterized cognitive process, this challenge is tractable. To support our claim, we propose an efficient online inference method based on nested particle filtering that simultaneously tracks the user's latent belief state and estimates the unknown cognitive bound from a stream of observed actions. We validate our approach in a representative navigation task using memory decay as an example of a cognitive bound. With simulations, we show that (1) our CR model generates intuitively plausible behaviors corresponding to different levels of memory capacity, and (2) our inference method accurately and efficiently recovers the ground-truth cognitive bounds from limited observations ($\le 100$ steps). We further demonstrate how this approach provides a principled foundation for developing adaptive AI assistants, enabling adaptive assistance that accounts for the user's memory limitations.
- Abstract(参考訳): AIの爆発的な成長とそれに基づいて構築された技術にもかかわらず、ユーザーまたは人間の協力者の最適な振る舞いを予測し、推測することは、依然として重要な課題である。
多くの場合、そのような行動は不合理性の結果ではなく、本質的な認知境界と世界に対する偏見のある信念を与えられた合理的な決定である。
本稿では,認知的拘束力のあるエージェントがバイアスの強い信念の下で最適な行動を行うための,計算論理的(CR)ユーザモデルのクラスを正式に紹介する。
重要な新規性は、境界メモリプロセスが動的に矛盾しバイアスのある信念状態にどのように結びつくかを明確にモデル化することにある。
我々は、潜伏したユーザ固有の境界を識別し、ハエの受動的観察からバイアスのある信念状態を推定するという課題に対処する。
我々は、明示的でパラメータ化された認知プロセスを持つ形式化されたCRモデルファミリでは、この課題は解決可能であると論じる。
本主張を支援するために,ネストされた粒子フィルタリングに基づく効率的なオンライン推論手法を提案し,ユーザの潜伏状態を追跡し,未知の認知境界を観測行動のストリームから推定する。
本稿では,認知的境界の例として記憶減衰を用いた代表的なナビゲーションタスクにおけるアプローチを検証する。
シミュレーションにより, CRモデルでは, 記憶容量の異なるレベルに対応する直感的に妥当な動作が生成され, 推定法は, 限られた観測値(100ドルステップ)から精度よく, かつ効率的に認識境界を復元することを示した。
さらに我々は、このアプローチが、ユーザのメモリ制限を考慮に入れた適応型AIアシスタントを開発するための、原則化された基盤を提供する方法を実証する。
関連論文リスト
- What Does Your Benchmark Really Measure? A Framework for Robust Inference of AI Capabilities [0.773472615056109]
ベンチマークデータに対する生成モデルの評価は今や至るところで行われている。
しかし、懐疑論の高まりはその信頼性を取り巻く。
報告された正確さがモデルの性能を真に反映しているとどうやってわかるのか?
このステップは、推論として評価するための原則的なフレームワークを提案することで明確化します。
論文 参考訳(メタデータ) (2025-09-23T21:29:04Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - Query-Level Uncertainty in Large Language Models [39.59641844929696]
クエリーレベル不確実性を用いて知識境界を検出する手法を提案する。
この方法は、任意のトークンを生成する前に、モデルが所定のクエリに応答できるかどうかを推定する。
我々は、適応推論設定におけるその利点を示し、RAGとモデルカスケーディングは、全体的な性能を維持しながら、推論コストを削減することを示す。
論文 参考訳(メタデータ) (2025-06-11T12:39:48Z) - Dynamic Programming Techniques for Enhancing Cognitive Representation in Knowledge Tracing [125.75923987618977]
認知表現動的プログラミングに基づく知識追跡(CRDP-KT)モデルを提案する。
質問の難易度とそれらの間の性能間隔に基づいて認知表現を最適化する動的プログラミングアルゴリズムである。
これは、その後のモデルトレーニングのためにより正確で体系的な入力機能を提供し、それによって認知状態のシミュレーションにおける歪みを最小限にする。
論文 参考訳(メタデータ) (2025-06-03T14:44:48Z) - Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training [86.70255651945602]
我々はReinforcecing Cognitive Experts(RICE)と呼ばれる新しい推論時ステアリング手法を導入する。
RICEは、追加のトレーニングや複雑化なしに推論のパフォーマンスを改善することを目的としている。
先行する MoE ベースの LRM を用いた経験的評価は、推論精度、認知効率、ドメイン間の一般化において顕著で一貫した改善を示す。
論文 参考訳(メタデータ) (2025-05-20T17:59:16Z) - Inverse decision-making using neural amortized Bayesian actors [19.128377007314317]
我々は、教師なしの方法で幅広いパラメータ設定で訓練されたニューラルネットワークを用いてベイズアクターを記憶する。
本稿では,本手法がモデル比較の原理と,先行とコストの識別不能につながる要因を解消するためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2024-09-04T10:31:35Z) - Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders [9.401989343015364]
連続的に外生的でない共同設立者が存在する場合、ロバストな政策評価と政策最適化について検討する。
本研究は,敗血症治療のシミュレーションと実世界の縦断医療データの両方において,複雑性境界,洞察,有効性を示す。
論文 参考訳(メタデータ) (2023-02-01T18:40:53Z) - Modeling human road crossing decisions as reward maximization with
visual perception limitations [23.561752465516047]
我々は,計算的合理性に基づく歩行者横断決定のモデルを開発する。
提案した認知-RLモデルは、ギャップ受容と交差開始時間の人間的なパターンをキャプチャする。
以上の結果から,これは人間の知覚的限界に対する合理的適応である可能性が示唆された。
論文 参考訳(メタデータ) (2023-01-27T14:20:35Z) - Neural Causal Models for Counterfactual Identification and Estimation [62.30444687707919]
本稿では,ニューラルモデルによる反事実文の評価について検討する。
まず、神経因果モデル(NCM)が十分に表現可能であることを示す。
第2に,反事実分布の同時同定と推定を行うアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-09-30T18:29:09Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。