論文の概要: On the Relationship Between Active Inference and Control as Inference
- arxiv url: http://arxiv.org/abs/2006.12964v3
- Date: Mon, 29 Jun 2020 14:52:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 21:39:41.309534
- Title: On the Relationship Between Active Inference and Control as Inference
- Title(参考訳): 能動推論と推論としての制御の関係について
- Authors: Beren Millidge, Alexander Tschantz, Anil K Seth, Christopher L Buckley
- Abstract要約: アクティブ推論(英: Active Inference、AIF)は、生物学的エージェントがモデルエビデンスに束縛された変動を最小限に抑えることを示唆する脳科学の新たな枠組みである。
制御・アズ・推論(英: Control-as-Inference, CAI)は、意思決定を変分推論問題とみなす強化学習の枠組みである。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active Inference (AIF) is an emerging framework in the brain sciences which
suggests that biological agents act to minimise a variational bound on model
evidence. Control-as-Inference (CAI) is a framework within reinforcement
learning which casts decision making as a variational inference problem. While
these frameworks both consider action selection through the lens of variational
inference, their relationship remains unclear. Here, we provide a formal
comparison between them and demonstrate that the primary difference arises from
how value is incorporated into their respective generative models. In the
context of this comparison, we highlight several ways in which these frameworks
can inform one another.
- Abstract(参考訳): 能動推論 (active inference, aif) は脳科学における新たな枠組みであり、生物学的エージェントがモデル証拠の変動を最小限に抑えることを示唆している。
control-as-inference (cai) は強化学習におけるフレームワークであり、変分推論問題として意思決定をキャストする。
これらのフレームワークはどちらも変分推論のレンズによる行動選択を考慮しているが、それらの関係は未だ不明である。
ここでは,それらの形式的比較を行い,それぞれの生成モデルに価値がどのように組み込まれているかから,主な違いが生まれることを示す。
この比較の文脈では、これらのフレームワークが互いに情報を伝達する方法をいくつか紹介する。
関連論文リスト
- SAIE Framework: Support Alone Isn't Enough -- Advancing LLM Training
with Adversarial Remarks [47.609417223514605]
この研究は、学習者とパートナーモデルの間の支援的および敵対的な議論を促進するSAIEフレームワークを紹介している。
実験により,SAIEフレームワークで微調整したモデルでは,従来の微調整手法で訓練したモデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-11-14T12:12:25Z) - Discourse Relations Classification and Cross-Framework Discourse
Relation Classification Through the Lens of Cognitive Dimensions: An
Empirical Investigation [5.439020425819001]
We show that discourse relations can be effectively capture by some simple Cognitively inspired dimensions by Sanders et al.(2018)
クロスフレームな談話関係分類(PDTB & RST)に関する実験により,あるフレームワークの談話関係に関する知識を,これらの次元を用いて他のフレームワークに伝達できることが実証された。
論文 参考訳(メタデータ) (2023-11-01T11:38:19Z) - Inverse Decision Modeling: Learning Interpretable Representations of
Behavior [72.80902932543474]
我々は,逆決定モデルに関する表現的,統一的な視点を開拓する。
これを逆問題(記述モデルとして)の形式化に用います。
この構造が(有界な)有理性の学習(解釈可能な)表現を可能にする方法について説明する。
論文 参考訳(メタデータ) (2023-10-28T05:05:01Z) - Jointly Learning Consistent Causal Abstractions Over Multiple
Interventional Distributions [8.767175335575386]
抽象化は、同じシステムを表す2つの構造因果モデルを異なる解像度で関連付けるために使用できる。
リシェルが最近提案した抽象化の形式化に基づく,SCM間の因果的抽象化学習のための第1のフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-01-14T11:22:16Z) - Fairness Increases Adversarial Vulnerability [50.90773979394264]
フェアネスとロバストネスの間に二分法が存在することを示し、フェアネスを達成するとモデルロバストネスを減少させる。
非線形モデルと異なるアーキテクチャの実験は、複数の視覚領域における理論的発見を検証する。
フェアネスとロバストネスの良好なトレードオフを達成するためのモデルを構築するための,シンプルで効果的なソリューションを提案する。
論文 参考訳(メタデータ) (2022-11-21T19:55:35Z) - Towards a Grounded Theory of Causation for Embodied AI [12.259552039796027]
既存のフレームワークは、どの行動方針や状態空間の物理的変換を介入とみなすべきかを示すものではありません。
このフレームワークは、例えばポリシーを実行するエージェントによって誘導される状態空間の変換としてアクションを記述する。
これにより、マイクロ状態空間の変換とその抽象モデルの両方を均一に記述することができる。
論文 参考訳(メタデータ) (2022-06-28T12:56:43Z) - On the duality between contrastive and non-contrastive self-supervised
learning [0.0]
自己指導型学習は、対照的なアプローチと非対照的なアプローチに分けることができる。
コントラストと非コントラストの家族がいかに近いかを示します。
また、下流のパフォーマンスにデザイン選択の影響(またはその欠如)を示す。
論文 参考訳(メタデータ) (2022-06-03T08:04:12Z) - Variational Causal Networks: Approximate Bayesian Inference over Causal
Structures [132.74509389517203]
離散DAG空間上の自己回帰分布をモデル化したパラメトリック変分族を導入する。
実験では,提案した変分後部が真の後部を良好に近似できることを示した。
論文 参考訳(メタデータ) (2021-06-14T17:52:49Z) - Learning to Decouple Relations: Few-Shot Relation Classification with
Entity-Guided Attention and Confusion-Aware Training [49.9995628166064]
本稿では,2つのメカニズムを備えたモデルであるCTEGを提案する。
一方、注意を誘導するEGA機構を導入し、混乱を引き起こす情報をフィルタリングする。
一方,コンフュージョン・アウェア・トレーニング(CAT)法は,関係の識別を明示的に学習するために提案されている。
論文 参考訳(メタデータ) (2020-10-21T11:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。