Fugu-MT 論文翻訳(概要): Enhancing Population-based Search with Active Inference

論文の概要: Enhancing Population-based Search with Active Inference

arxiv url: http://arxiv.org/abs/2408.09548v1
Date: Sun, 18 Aug 2024 17:21:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-20 18:24:47.938144
Title: Enhancing Population-based Search with Active Inference
Title（参考訳）: アクティブ推論による人口ベース検索の強化
Authors: Nassim Dehouche, Daniel Friedman,
Abstract要約: 本稿では,アクティブ推論を人口ベースメタヒューリスティクスに統合し,性能を向上させることを提案する。実験結果から,能動推論は計算コストを極端に増加させるだけで,いくつかの改善された解が得られることが示唆された。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The Active Inference framework models perception and action as a unified process, where agents use probabilistic models to predict and actively minimize sensory discrepancies. In complement and contrast, traditional population-based metaheuristics rely on reactive environmental interactions without anticipatory adaptation. This paper proposes the integration of Active Inference into these metaheuristics to enhance performance through anticipatory environmental adaptation. We demonstrate this approach specifically with Ant Colony Optimization (ACO) on the Travelling Salesman Problem (TSP). Experimental results indicate that Active Inference can yield some improved solutions with only a marginal increase in computational cost, with interesting patterns of performance that relate to number and topology of nodes in the graph. Further work will characterize where and when different types of Active Inference augmentation of population metaheuristics may be efficacious.
Abstract（参考訳）: Active Inferenceフレームワークは、エージェントが確率論的モデルを使用して知覚的不一致を予測し、積極的に最小化する統合プロセスとして知覚とアクションをモデル化する。補完的かつ対照的に、伝統的な人口ベースのメタヒューリスティックは、予測適応なしでは反応性のある環境相互作用に依存している。本稿では,これらのメタヒューリスティックスへのアクティブ推論の統合を提案し,予測環境適応による性能向上を提案する。本稿では,このアプローチを,旅行セールスマン問題(TSP)におけるAnt Colony Optimization(ACO)を用いて実証する。実験結果から,Active Inferenceは計算コストを極端に増加させるだけで,グラフ内のノードの数とトポロジに関連する興味深い性能パターンを持つ,いくつかの改善された解が得られることが示唆された。さらなる研究は、集団メタヒューリスティックスの様々なタイプのアクティブ推論の増大が有効である場所と時期を特徴づける。

関連論文リスト

TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making [75.29820290660065]
本稿では,効果的な具体的意思決定のための思考中心推論最適化(TCPO)を提案する。モデルの中間的推論プロセスの整合性を強調し、モデル劣化の問題を緩和する。 ALFWorld環境での実験では、平均成功率は26.67%であり、RL4VLMよりも6%向上している。
論文参考訳（メタデータ） (2025-09-10T11:16:21Z)
Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文参考訳（メタデータ） (2025-06-07T02:24:44Z)
Demonstrating the Continual Learning Capabilities and Practical Application of Discrete-Time Active Inference [0.0]
アクティブ推論は、エージェントが環境とどのように相互作用するかを理解するための数学的フレームワークである。本稿では,個別の時間環境で動作するエージェントのための連続学習フレームワークを提案する。我々は、エージェントがモデルを再学習し、効率的に洗練する能力を示し、金融や医療といった複雑な分野に適合する。
論文参考訳（メタデータ） (2024-09-30T21:18:46Z)
ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization [52.5587113539404]
因果関係を考慮したエントロピー(entropy)という用語を導入し,効率的な探索を行うための潜在的影響の高いアクションを効果的に識別し,優先順位付けする。提案アルゴリズムであるACE:Off-policy Actor-critic with Causality-aware Entropy regularizationは,29種類の連続制御タスクに対して,大幅な性能上の優位性を示す。
論文参考訳（メタデータ） (2024-02-22T13:22:06Z)
Confronting Reward Overoptimization for Diffusion Models: A Perspective of Inductive and Primacy Biases [76.9127853906115]
拡散モデルと人間の嗜好のギャップを埋めることが、実用的生成への統合に不可欠である。本稿では,拡散モデルの時間的帰納バイアスを利用したポリシー勾配アルゴリズムTDPO-Rを提案する。実験の結果,報酬過小評価を緩和する手法が有効であることが示された。
論文参考訳（メタデータ） (2024-02-13T15:55:41Z)
Disentangled Neural Relational Inference for Interpretable Motion Prediction [38.40799770648501]
グラフベース表現と時系列モデルを統合した変分自動エンコーダフレームワークを開発した。本モデルでは,対話を特徴付ける解釈可能なエッジ特徴を付加した動的相互作用グラフを推論する。シミュレーションと実世界の両方のデータセットに関する広範な実験を通じて、我々のアプローチを検証する。
論文参考訳（メタデータ） (2024-01-07T22:49:24Z)
Asymptotically Fair Participation in Machine Learning Models: an Optimal Control Perspective [21.962258178900065]
最先端の機械学習モデルのパフォーマンスは、トレーニングデータセットで表現されていない人口層をテストすると、しばしば低下する。我々は,最適制御の定式化を通じて,巧妙に公正な参加を実現することの課題に対処することを目的とする。最適制御解を推定するために、ポントリャーギンの最大原理の効率的な実装を適用する。
論文参考訳（メタデータ） (2023-11-16T22:28:38Z)
A Neural Active Inference Model of Perceptual-Motor Learning [62.39667564455059]
アクティブ推論フレームワーク(英: active inference framework、AIF)は、現代の神経科学を基盤とした、有望な新しい計算フレームワークである。本研究では,ヒトの視覚行動指導において,AIFが期待する役割を捉える能力をテストする。本稿では,多次元世界状態から自由エネルギーの一次元分布にマッピングする先行関数の新たな定式化について述べる。
論文参考訳（メタデータ） (2022-11-16T20:00:38Z)
Preference Enhanced Social Influence Modeling for Network-Aware Cascade Prediction [59.221668173521884]
本稿では,ユーザの嗜好モデルを強化することで,カスケードサイズ予測を促進する新しいフレームワークを提案する。エンド・ツー・エンドの手法により,ユーザの情報拡散プロセスがより適応的で正確になる。
論文参考訳（メタデータ） (2022-04-18T09:25:06Z)
Harnessing Heterogeneity: Learning from Decomposed Feedback in Bayesian Modeling [68.69431580852535]
サブグループフィードバックを取り入れた新しいGPレグレッションを導入する。我々の修正された回帰は、以前のアプローチと比べて、明らかにばらつきを減らし、したがってより正確な後続を減らした。我々は2つの異なる社会問題に対してアルゴリズムを実行する。
論文参考訳（メタデータ） (2021-07-07T03:57:22Z)
Online reinforcement learning with sparse rewards through an active inference capsule [62.997667081978825]
本稿では,将来期待される新しい自由エネルギーを最小化するアクティブ推論エージェントを提案する。我々のモデルは、非常に高いサンプル効率でスパース・リワード問題を解くことができる。また、複雑な目的の表現を単純化する報奨関数から事前モデルを近似する新しい手法を提案する。
論文参考訳（メタデータ） (2021-06-04T10:03:36Z)
Demarcating Endogenous and Exogenous Opinion Dynamics: An Experimental Design Approach [27.975266406080152]
本稿では,実験的な設計手法に基づく教師なし分類手法のスイートを設計する。平均推定誤差の異なる測度を最小化するイベントのサブセットを選択することを目的としている。我々の実験は、不衛生事象や衛生事象に対する予測性能の検証から、様々な大きさの最適なサブセットを選択する効果の検証まで多岐にわたる。
論文参考訳（メタデータ） (2021-02-11T11:38:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。