Fugu-MT 論文翻訳(概要): On the Relationship Between Active Inference and Control as Inference

論文の概要: On the Relationship Between Active Inference and Control as Inference

arxiv url: http://arxiv.org/abs/2006.12964v3
Date: Mon, 29 Jun 2020 14:52:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-17 21:39:41.309534
Title: On the Relationship Between Active Inference and Control as Inference
Title（参考訳）: 能動推論と推論としての制御の関係について
Authors: Beren Millidge, Alexander Tschantz, Anil K Seth, Christopher L Buckley
Abstract要約: アクティブ推論(英: Active Inference、AIF)は、生物学的エージェントがモデルエビデンスに束縛された変動を最小限に抑えることを示唆する脳科学の新たな枠組みである。制御・アズ・推論(英: Control-as-Inference, CAI)は、意思決定を変分推論問題とみなす強化学習の枠組みである。
参考スコア（独自算出の注目度）: 62.997667081978825
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Active Inference (AIF) is an emerging framework in the brain sciences which suggests that biological agents act to minimise a variational bound on model evidence. Control-as-Inference (CAI) is a framework within reinforcement learning which casts decision making as a variational inference problem. While these frameworks both consider action selection through the lens of variational inference, their relationship remains unclear. Here, we provide a formal comparison between them and demonstrate that the primary difference arises from how value is incorporated into their respective generative models. In the context of this comparison, we highlight several ways in which these frameworks can inform one another.
Abstract（参考訳）: 能動推論 (active inference, aif) は脳科学における新たな枠組みであり、生物学的エージェントがモデル証拠の変動を最小限に抑えることを示唆している。 control-as-inference (cai) は強化学習におけるフレームワークであり、変分推論問題として意思決定をキャストする。これらのフレームワークはどちらも変分推論のレンズによる行動選択を考慮しているが、それらの関係は未だ不明である。ここでは,それらの形式的比較を行い,それぞれの生成モデルに価値がどのように組み込まれているかから,主な違いが生まれることを示す。この比較の文脈では、これらのフレームワークが互いに情報を伝達する方法をいくつか紹介する。

関連論文リスト

Unifying Feature-Based Explanations with Functional ANOVA and Cooperative Game Theory [21.405333804566357]
局所的およびグローバルな特徴に基づく説明のための統一的なフレームワークを導入する。特徴分布の影響を決定する3つのfANOVA分解を導入する。次に、合成および実世界のデータセットにおけるフレームワークの有用性を実証的に示す。
論文参考訳（メタデータ） (2024-12-22T20:12:16Z)
Counterfactual Generative Modeling with Variational Causal Inference [1.9287470458589586]
本稿では, 逆ファクト生成モデリングタスクを扱うための変分ベイズ因果推論フレームワークを提案する。実験では, 反ファクト生成モデルにおける最先端モデルと比較して, フレームワークの利点を実証する。
論文参考訳（メタデータ） (2024-10-16T16:44:12Z)
Demonstrating the Continual Learning Capabilities and Practical Application of Discrete-Time Active Inference [0.0]
アクティブ推論は、エージェントが環境とどのように相互作用するかを理解するための数学的フレームワークである。本稿では,個別の時間環境で動作するエージェントのための連続学習フレームワークを提案する。我々は、エージェントがモデルを再学習し、効率的に洗練する能力を示し、金融や医療といった複雑な分野に適合する。
論文参考訳（メタデータ） (2024-09-30T21:18:46Z)
Sequential Representation Learning via Static-Dynamic Conditional Disentanglement [58.19137637859017]
本稿では,ビデオ中の時間非依存要因と時間変化要因を分離することに着目し,逐次的データ内での自己教師付き不整合表現学習について検討する。本稿では,静的/動的変数間の因果関係を明示的に考慮し,それらの因子間の通常の独立性仮定を破る新しいモデルを提案する。実験により、提案手法は、シーンのダイナミックスが内容に影響されるシナリオにおいて、従来の複雑な最先端技術よりも優れていることが示された。
論文参考訳（メタデータ） (2024-08-10T17:04:39Z)
A Unifying Framework for Action-Conditional Self-Predictive Reinforcement Learning [48.59516337905877]
優れた表現を学ぶことは、強化学習(RL)エージェントにとって重要な課題である。近年の研究では、これらのアルゴリズムに関する理論的洞察が生まれている。我々は,行動条件の自己予測的目的を分析することによって,理論と実践のギャップを埋める一歩を踏み出した。
論文参考訳（メタデータ） (2024-06-04T07:22:12Z)
Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文参考訳（メタデータ） (2024-05-02T13:06:50Z)
SAIE Framework: Support Alone Isn't Enough -- Advancing LLM Training with Adversarial Remarks [47.609417223514605]
この研究は、学習者とパートナーモデルの間の支援的および敵対的な議論を促進するSAIEフレームワークを紹介している。実験により,SAIEフレームワークで微調整したモデルでは,従来の微調整手法で訓練したモデルよりも優れた性能を示した。
論文参考訳（メタデータ） (2023-11-14T12:12:25Z)
Discourse Relations Classification and Cross-Framework Discourse Relation Classification Through the Lens of Cognitive Dimensions: An Empirical Investigation [5.439020425819001]
We show that discourse relations can be effectively capture by some simple Cognitively inspired dimensions by Sanders et al.(2018) クロスフレームな談話関係分類(PDTB & RST)に関する実験により,あるフレームワークの談話関係に関する知識を,これらの次元を用いて他のフレームワークに伝達できることが実証された。
論文参考訳（メタデータ） (2023-11-01T11:38:19Z)
Inverse Decision Modeling: Learning Interpretable Representations of Behavior [72.80902932543474]
我々は,逆決定モデルに関する表現的,統一的な視点を開拓する。これを逆問題(記述モデルとして)の形式化に用います。この構造が(有界な)有理性の学習(解釈可能な)表現を可能にする方法について説明する。
論文参考訳（メタデータ） (2023-10-28T05:05:01Z)
Fairness Increases Adversarial Vulnerability [50.90773979394264]
フェアネスとロバストネスの間に二分法が存在することを示し、フェアネスを達成するとモデルロバストネスを減少させる。非線形モデルと異なるアーキテクチャの実験は、複数の視覚領域における理論的発見を検証する。フェアネスとロバストネスの良好なトレードオフを達成するためのモデルを構築するための,シンプルで効果的なソリューションを提案する。
論文参考訳（メタデータ） (2022-11-21T19:55:35Z)
On the duality between contrastive and non-contrastive self-supervised learning [0.0]
自己指導型学習は、対照的なアプローチと非対照的なアプローチに分けることができる。コントラストと非コントラストの家族がいかに近いかを示します。また、下流のパフォーマンスにデザイン選択の影響(またはその欠如)を示す。
論文参考訳（メタデータ） (2022-06-03T08:04:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。