論文の概要: On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2210.16877v1
- Date: Sun, 30 Oct 2022 16:39:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 15:40:11.018600
- Title: On Rate-Distortion Theory in Capacity-Limited Cognition & Reinforcement
Learning
- Title(参考訳): 容量制限認知・強化学習におけるレートゆがみ理論について
- Authors: Dilip Arumugam, Mark K. Ho, Noah D. Goodman, Benjamin Van Roy
- Abstract要約: 現実世界の意思決定エージェントは、限られた情報処理能力の下で、認知や計算資源にアクセスできない。
本稿では,生物エージェントと人工エージェントの容量制限意思決定に関する情報理論モデルに関する簡単な調査を行う。
- 参考スコア(独自算出の注目度): 43.19983737333797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Throughout the cognitive-science literature, there is widespread agreement
that decision-making agents operating in the real world do so under limited
information-processing capabilities and without access to unbounded cognitive
or computational resources. Prior work has drawn inspiration from this fact and
leveraged an information-theoretic model of such behaviors or policies as
communication channels operating under a bounded rate constraint. Meanwhile, a
parallel line of work also capitalizes on the same principles from
rate-distortion theory to formalize capacity-limited decision making through
the notion of a learning target, which facilitates Bayesian regret bounds for
provably-efficient learning algorithms. In this paper, we aim to elucidate this
latter perspective by presenting a brief survey of these information-theoretic
models of capacity-limited decision making in biological and artificial agents.
- Abstract(参考訳): 認知科学の文献を通じて、現実世界で活動する意思決定エージェントは、限られた情報処理能力と、無制限の認知資源や計算資源にアクセスできないという広く合意されている。
先行研究はこの事実からインスピレーションを得ており、境界レート制約の下で通信チャネルが動作するような行動やポリシーの情報理論モデルを活用している。
一方、平行な作業の行は、レートゆがみ理論から同じ原理に乗じて、学習対象の概念を通じて容量制限された意思決定を形式化することで、証明可能な効率的な学習アルゴリズムのためのベイズ的後悔の境界を促進する。
本稿では, 生体および人工エージェントの能力制限決定に関する情報理論モデルについて, 簡潔な調査を行い, 後者の視点を明らかにすることを目的としている。
関連論文リスト
- Cognitive LLMs: Towards Integrating Cognitive Architectures and Large Language Models for Manufacturing Decision-making [51.737762570776006]
LLM-ACTRは、ヒトに適応し、多目的な意思決定を提供する新しいニューロシンボリックアーキテクチャである。
我々のフレームワークは、ACT-Rの内部決定過程の知識を潜在神経表現として抽出し、組み込む。
デザイン・フォー・マニュファクチャリング・タスクに関する我々の実験は、タスク性能の向上と基礎的意思決定能力の向上を両立させたものである。
論文 参考訳(メタデータ) (2024-08-17T11:49:53Z) - Probing the Decision Boundaries of In-context Learning in Large Language Models [31.977886254197138]
本稿では,テキスト内二項分類のための決定境界のレンズからテキスト内学習を探索し,理解するための新しいメカニズムを提案する。
驚いたことに、単純な二項分類タスクにおいて、現在のLLMによって学習される決定境界は、しばしば不規則で非滑らかである。
論文 参考訳(メタデータ) (2024-06-17T06:00:24Z) - A Novel Neural-symbolic System under Statistical Relational Learning [50.747658038910565]
本稿では,GBPGRと呼ばれる2段階の確率的グラフィカル推論フレームワークを提案する。
GBPGRでは、シンボル推論の結果を用いて、ディープラーニングモデルによる予測を洗練し、修正する。
提案手法は高い性能を示し, 帰納的タスクと帰納的タスクの両方において効果的な一般化を示す。
論文 参考訳(メタデータ) (2023-09-16T09:15:37Z) - Bayesian Reinforcement Learning with Limited Cognitive Load [43.19983737333797]
適応行動の理論は、エージェントの学習履歴、決定、容量制約の間の複雑な相互作用を考慮に入れなければならない。
コンピュータ科学における最近の研究は、強化学習、ベイズ的意思決定、レート歪曲理論からアイデアをブリッジすることで、これらの力学を形作る原理を明確にし始めている。
論文 参考訳(メタデータ) (2023-05-05T03:29:34Z) - Deep Learning Reproducibility and Explainable AI (XAI) [9.13755431537592]
ディープラーニング(DL)学習アルゴリズムの非決定性とそのニューラルネットワーク(NN)モデルの説明可能性への影響について検討した。
この問題について議論するため、2つの畳み込みニューラルネットワーク(CNN)をトレーニングし、その結果を比較した。
論文 参考訳(メタデータ) (2022-02-23T12:06:20Z) - Explaining Black-Box Algorithms Using Probabilistic Contrastive
Counterfactuals [7.727206277914709]
ブラックボックス決定システムを説明するための因果性に基づく原則的アプローチを提案する。
本稿では,変数の直接的および間接的影響が,アルゴリズムによる決定に与える影響を定量的に示す。
このような反事実は,アルゴリズムの決定に負の影響を受ける個人に対して,どのように行動可能なリコースを提供できるかを示す。
論文 参考訳(メタデータ) (2021-03-22T16:20:21Z) - Deep RL With Information Constrained Policies: Generalization in
Continuous Control [21.46148507577606]
情報フローに対する自然な制約は, 連続制御タスクにおいて, 人工エージェントに干渉する可能性があることを示す。
CLAC(Capacity-Limited Actor-Critic)アルゴリズムを実装した。
実験の結果、CLACは代替手法と比較して、トレーニング環境と修正テスト環境の一般化に改善をもたらすことがわかった。
論文 参考訳(メタデータ) (2020-10-09T15:42:21Z) - Developing Constrained Neural Units Over Time [81.19349325749037]
本稿では,既存のアプローチと異なるニューラルネットワークの定義方法に焦点をあてる。
ニューラルネットワークの構造は、データとの相互作用にも拡張される制約の特別なクラスによって定義される。
提案した理論は時間領域にキャストされ, データを順序づけられた方法でネットワークに提示する。
論文 参考訳(メタデータ) (2020-09-01T09:07:25Z) - Neuro-symbolic Architectures for Context Understanding [59.899606495602406]
本稿では,データ駆動型アプローチと知識駆動型アプローチの強みを組み合わせたフレームワークとして,ハイブリッドAI手法を提案する。
具体的には、知識ベースを用いて深層ニューラルネットワークの学習過程を導く方法として、ニューロシンボリズムの概念を継承する。
論文 参考訳(メタデータ) (2020-03-09T15:04:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。