論文の概要: A Theory of Bounded Inductive Rationality
- arxiv url: http://arxiv.org/abs/2307.05068v1
- Date: Tue, 11 Jul 2023 07:13:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-12 16:03:13.493384
- Title: A Theory of Bounded Inductive Rationality
- Title(参考訳): 有界帰納的合理性の理論
- Authors: Caspar Oesterheld (Carnegie Mellon University), Abram Demski (Machine
Intelligence Research Institute), Vincent Conitzer (Carnegie Mellon
University)
- Abstract要約: 我々は論理的全理性を前提としない合理的な意思決定の理論を開発する。
我々は、piの桁に賭けるなど、意思決定問題に何度も直面するエージェントについて検討する。
この意味で合理的なエージェントには、他の望ましい性質があることを証明します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The dominant theories of rational choice assume logical omniscience. That is,
they assume that when facing a decision problem, an agent can perform all
relevant computations and determine the truth value of all relevant
logical/mathematical claims. This assumption is unrealistic when, for example,
we offer bets on remote digits of pi or when an agent faces a computationally
intractable planning problem. Furthermore, the assumption of logical
omniscience creates contradictions in cases where the environment can contain
descriptions of the agent itself. Importantly, strategic interactions as
studied in game theory are decision problems in which a rational agent is
predicted by its environment (the other players). In this paper, we develop a
theory of rational decision making that does not assume logical omniscience. We
consider agents who repeatedly face decision problems (including ones like
betting on digits of pi or games against other agents). The main contribution
of this paper is to provide a sensible theory of rationality for such agents.
Roughly, we require that a boundedly rational inductive agent tests each
efficiently computable hypothesis infinitely often and follows those hypotheses
that keep their promises of high rewards. We then prove that agents that are
rational in this sense have other desirable properties. For example, they learn
to value random and pseudo-random lotteries at their expected reward. Finally,
we consider strategic interactions between different agents and prove a folk
theorem for what strategies bounded rational inductive agents can converge to.
- Abstract(参考訳): 合理的選択の有力な理論は論理的な全科学を仮定する。
すなわち、決定問題に直面した場合、エージェントはすべての関連する計算を実行し、関連する論理/数学的主張の真理値を決定することができると仮定する。
この仮定は、例えば、piのリモート桁に賭けたり、エージェントが計算的に難解な計画問題に直面したときに、非現実的である。
さらに、論理的全科学の仮定は、環境がエージェント自体の記述を含むことができる場合に矛盾を生じさせる。
ゲーム理論における戦略的相互作用は、合理的エージェントが環境(他のプレイヤー)によって予測される決定問題である。
本稿では,論理的全理性を前提としない合理的意思決定の理論を考案する。
決定問題(piの桁に賭けたり、他のエージェントと対戦するゲームなどを含む)に何度も直面するエージェントについて検討する。
この論文の主な貢献は、そのようなエージェントに対して合理的な理論を提供することである。
概して、有界に有理な帰納的エージェントは、それぞれ効率的に計算可能な仮説を無限にテストし、高い報酬の約束を守る仮説に従う必要がある。
そして、この意味で合理的なエージェントが他の望ましい性質を持つことを証明する。
例えば、期待される報酬でランダムで擬似ランダムな宝くじを価値付けすることを学ぶ。
最後に、異なるエージェント間の戦略的相互作用を考察し、有理誘導的エージェントが収束できる戦略の民間定理を証明する。
関連論文リスト
- How Ambiguous are the Rationales for Natural Language Reasoning? A Simple Approach to Handling Rationale Uncertainty [0.0]
答の背後にある合理性は、モデル決定を説明するだけでなく、複雑な推論タスクをうまく推理するために言語モデルを促進する。
モデルパフォーマンスを促進するのに十分な根拠が忠実である程度を見積もるのは簡単ではない。
本稿では,不完全理理性に対処する方法を提案する。
論文 参考訳(メタデータ) (2024-02-22T07:12:34Z) - (Ir)rationality in AI: State of the Art, Research Challenges and Open
Questions [2.9008806248012333]
合理性の概念は人工知能の分野の中心である。
有理エージェントを構成するものの統一的な定義は存在しない。
特定のシナリオで最適であることを示す不合理な行動を考える。
論文 参考訳(メタデータ) (2023-11-28T19:01:09Z) - Decision-Making Among Bounded Rational Agents [5.24482648010213]
本稿では,情報理論の観点からの有界合理性の概念をゲーム理論の枠組みに導入する。
これにより、ロボットは他のエージェントの準最適動作を推論し、計算上の制約の下で行動することができる。
その結果,ロボットが他のエージェントの理性行動の異なるレベルを推論し,その計算制約の下で合理的な戦略を計算できることが実証された。
論文 参考訳(メタデータ) (2022-10-17T00:29:24Z) - Rationality in current era -- A recent survey [0.0]
本論文は,近年の合理性に関する異質な見解に関する調査(過去5年間)を提起するものである。
最初の学校はAIの進歩に懐疑的であり、人間の知性は常にマシンインテリジェンスに取って代わられると信じている。
第2の学校は、AIの出現とコンピューティングの進歩が、有界な合理性を理解するのに役立つと考えている。
論文 参考訳(メタデータ) (2022-04-27T12:09:41Z) - Logical Credal Networks [87.25387518070411]
本稿では,論理と確率を組み合わせた先行モデルの多くを一般化した表現的確率論的論理である論理的クレダルネットワークを紹介する。
本稿では,不確実性のあるマスターミンドゲームを解くこと,クレジットカード詐欺を検出することを含む,最大後部推論タスクの性能について検討する。
論文 参考訳(メタデータ) (2021-09-25T00:00:47Z) - CausalCity: Complex Simulations with Agency for Causal Discovery and
Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。
私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。
我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文 参考訳(メタデータ) (2021-06-25T00:21:41Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z) - Empirically Verifying Hypotheses Using Reinforcement Learning [58.09414653169534]
本稿では,仮説検証をRL問題として定式化する。
我々は、世界の力学に関する仮説を前提として、仮説が真か偽かを予測するのに役立つ観測結果を生成することができるエージェントを構築することを目指している。
論文 参考訳(メタデータ) (2020-06-29T01:01:10Z) - Logical Neural Networks [51.46602187496816]
ニューラルネットワーク(学習)と記号論理(知識と推論)の両方の重要な特性をシームレスに提供する新しいフレームワークを提案する。
すべてのニューロンは、重み付けされた実数値論理における公式の構成要素としての意味を持ち、非常に解釈不能な非絡み合い表現をもたらす。
推論は事前に定義されたターゲット変数ではなく、オムニであり、論理的推論に対応する。
論文 参考訳(メタデータ) (2020-06-23T16:55:45Z) - Bistable Probabilities: A Unified Framework for Studying Rationality and
Irrationality in Classical and Quantum Games [0.8924669503280334]
ゲームにおける不合理な意思決定をモデル化するための原則的かつ真正面の手法として、ビスタブル確率が提案される。
3つの古典的双安定ゲームに最大3つのナッシュ平衡が存在し、エージェントが有理であるときに最大効用が達成された。
3つの量子双安定ゲームに最大3つのナッシュ平衡が存在するが、有効性はより高いエージェント不合理性によって増大した。
論文 参考訳(メタデータ) (2020-04-04T12:41:39Z) - Invariant Rationalization [84.1861516092232]
典型的な合理化基準、すなわち最大相互情報(MMI)は、合理性のみに基づいて予測性能を最大化する合理性を見つける。
ゲーム理論の不変な有理化基準を導入し、各環境において同じ予測器を最適にするために、有理を制約する。
理論的にも実証的にも、提案された理性は、素早い相関を除外し、異なるテストシナリオをより一般化し、人間の判断とよく一致させることができることを示す。
論文 参考訳(メタデータ) (2020-03-22T00:50:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。