論文の概要: On the Relationship Between Active Inference and Control as Inference
- arxiv url: http://arxiv.org/abs/2006.12964v3
- Date: Mon, 29 Jun 2020 14:52:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 21:39:41.309534
- Title: On the Relationship Between Active Inference and Control as Inference
- Title(参考訳): 能動推論と推論としての制御の関係について
- Authors: Beren Millidge, Alexander Tschantz, Anil K Seth, Christopher L Buckley
- Abstract要約: アクティブ推論(英: Active Inference、AIF)は、生物学的エージェントがモデルエビデンスに束縛された変動を最小限に抑えることを示唆する脳科学の新たな枠組みである。
制御・アズ・推論(英: Control-as-Inference, CAI)は、意思決定を変分推論問題とみなす強化学習の枠組みである。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active Inference (AIF) is an emerging framework in the brain sciences which
suggests that biological agents act to minimise a variational bound on model
evidence. Control-as-Inference (CAI) is a framework within reinforcement
learning which casts decision making as a variational inference problem. While
these frameworks both consider action selection through the lens of variational
inference, their relationship remains unclear. Here, we provide a formal
comparison between them and demonstrate that the primary difference arises from
how value is incorporated into their respective generative models. In the
context of this comparison, we highlight several ways in which these frameworks
can inform one another.
- Abstract(参考訳): 能動推論 (active inference, aif) は脳科学における新たな枠組みであり、生物学的エージェントがモデル証拠の変動を最小限に抑えることを示唆している。
control-as-inference (cai) は強化学習におけるフレームワークであり、変分推論問題として意思決定をキャストする。
これらのフレームワークはどちらも変分推論のレンズによる行動選択を考慮しているが、それらの関係は未だ不明である。
ここでは,それらの形式的比較を行い,それぞれの生成モデルに価値がどのように組み込まれているかから,主な違いが生まれることを示す。
この比較の文脈では、これらのフレームワークが互いに情報を伝達する方法をいくつか紹介する。
関連論文リスト
- A Unifying Framework for Action-Conditional Self-Predictive Reinforcement Learning [48.59516337905877]
優れた表現を学ぶことは、強化学習(RL)エージェントにとって重要な課題である。
近年の研究では、これらのアルゴリズムに関する理論的洞察が生まれている。
我々は,行動条件の自己予測的目的を分析することによって,理論と実践のギャップを埋める一歩を踏み出した。
論文 参考訳(メタデータ) (2024-06-04T07:22:12Z) - Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。
不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。
エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文 参考訳(メタデータ) (2024-05-02T13:06:50Z) - SAIE Framework: Support Alone Isn't Enough -- Advancing LLM Training
with Adversarial Remarks [47.609417223514605]
この研究は、学習者とパートナーモデルの間の支援的および敵対的な議論を促進するSAIEフレームワークを紹介している。
実験により,SAIEフレームワークで微調整したモデルでは,従来の微調整手法で訓練したモデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-11-14T12:12:25Z) - Discourse Relations Classification and Cross-Framework Discourse
Relation Classification Through the Lens of Cognitive Dimensions: An
Empirical Investigation [5.439020425819001]
We show that discourse relations can be effectively capture by some simple Cognitively inspired dimensions by Sanders et al.(2018)
クロスフレームな談話関係分類(PDTB & RST)に関する実験により,あるフレームワークの談話関係に関する知識を,これらの次元を用いて他のフレームワークに伝達できることが実証された。
論文 参考訳(メタデータ) (2023-11-01T11:38:19Z) - Inverse Decision Modeling: Learning Interpretable Representations of
Behavior [72.80902932543474]
我々は,逆決定モデルに関する表現的,統一的な視点を開拓する。
これを逆問題(記述モデルとして)の形式化に用います。
この構造が(有界な)有理性の学習(解釈可能な)表現を可能にする方法について説明する。
論文 参考訳(メタデータ) (2023-10-28T05:05:01Z) - Fairness Increases Adversarial Vulnerability [50.90773979394264]
フェアネスとロバストネスの間に二分法が存在することを示し、フェアネスを達成するとモデルロバストネスを減少させる。
非線形モデルと異なるアーキテクチャの実験は、複数の視覚領域における理論的発見を検証する。
フェアネスとロバストネスの良好なトレードオフを達成するためのモデルを構築するための,シンプルで効果的なソリューションを提案する。
論文 参考訳(メタデータ) (2022-11-21T19:55:35Z) - On the duality between contrastive and non-contrastive self-supervised
learning [0.0]
自己指導型学習は、対照的なアプローチと非対照的なアプローチに分けることができる。
コントラストと非コントラストの家族がいかに近いかを示します。
また、下流のパフォーマンスにデザイン選択の影響(またはその欠如)を示す。
論文 参考訳(メタデータ) (2022-06-03T08:04:12Z) - Learning to Decouple Relations: Few-Shot Relation Classification with
Entity-Guided Attention and Confusion-Aware Training [49.9995628166064]
本稿では,2つのメカニズムを備えたモデルであるCTEGを提案する。
一方、注意を誘導するEGA機構を導入し、混乱を引き起こす情報をフィルタリングする。
一方,コンフュージョン・アウェア・トレーニング(CAT)法は,関係の識別を明示的に学習するために提案されている。
論文 参考訳(メタデータ) (2020-10-21T11:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。