Fugu-MT 論文翻訳(概要): Multi-Modal and Multi-Factor Branching Time Active Inference

論文の概要: Multi-Modal and Multi-Factor Branching Time Active Inference

arxiv url: http://arxiv.org/abs/2206.12503v1
Date: Fri, 24 Jun 2022 22:07:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-03 10:40:09.523562
Title: Multi-Modal and Multi-Factor Branching Time Active Inference
Title（参考訳）: マルチモーダルおよびマルチファクタ分岐時間アクティブ推論
Authors: Th\'eophile Champion and Marek Grze\'s and Howard Bowman
Abstract要約: モンテカルロ木探索に基づく分枝時間アクティブ推論(BTAI)の2つのバージョンが開発されている。しかし、BTAIのこれらの2つのバージョンはいまだ指数複雑性クラスに悩まされており、観測変数と潜伏変数の数がモデル化されている。本稿では、この制限をいくつかの観測をモデル化することで解決する。推論アルゴリズムは、後部の計算を高速化するために、可能性と遷移写像の分解を利用する。
参考スコア（独自算出の注目度）: 2.513785998932353
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Active inference is a state-of-the-art framework for modelling the brain that explains a wide range of mechanisms such as habit formation, dopaminergic discharge and curiosity. Recently, two versions of branching time active inference (BTAI) based on Monte-Carlo tree search have been developed to handle the exponential (space and time) complexity class that occurs when computing the prior over all possible policies up to the time horizon. However, those two versions of BTAI still suffer from an exponential complexity class w.r.t the number of observed and latent variables being modelled. In the present paper, we resolve this limitation by first allowing the modelling of several observations, each of them having its own likelihood mapping. Similarly, we allow each latent state to have its own transition mapping. The inference algorithm then exploits the factorisation of the likelihood and transition mappings to accelerate the computation of the posterior. Those two optimisations were tested on the dSprites environment in which the metadata of the dSprites dataset was used as input to the model instead of the dSprites images. On this task, $BTAI_{VMP}$ (Champion et al., 2022b,a) was able to solve 96.9\% of the task in 5.1 seconds, and $BTAI_{BF}$ (Champion et al., 2021a) was able to solve 98.6\% of the task in 17.5 seconds. Our new approach ($BTAI_{3MF}$) outperformed both of its predecessors by solving the task completly (100\%) in only 2.559 seconds. Finally, $BTAI_{3MF}$ has been implemented in a flexible and easy to use (python) package, and we developed a graphical user interface to enable the inspection of the model's beliefs, planning process and behaviour.
Abstract（参考訳）: アクティブ推論は、習慣形成、ドーパミン作動性放電、好奇心などの幅広いメカニズムを説明する脳をモデル化するための最先端のフレームワークである。近年,モンテカルロ木探索に基づく分枝時間アクティブ推論 (BTAI) の2つのバージョンが開発され,時間的地平線まで可能なすべてのポリシーを計算する際に生じる指数的(空間と時間)複雑性クラスを扱うようになった。しかし、BTAIのこれらの2つのバージョンはいまだ指数複雑性クラスに悩まされており、観測変数と潜伏変数の数がモデル化されている。本稿では,まず,複数の観測をモデル化し,それぞれが独自の確率写像を持つことにより,この限界を解消する。同様に、各潜在状態が独自の遷移写像を持つようにします。推論アルゴリズムは、確率と遷移写像の因子化を利用して、後方の計算を加速する。これらの2つの最適化は、dSpritesイメージの代わりにdSpritesデータセットのメタデータをモデルへの入力として使用するdSprites環境でテストされた。このタスクでは、$btai_{vmp}$ (champion et al., 2022b,a) が96.9\%のタスクを5.1秒で解くことができ、$btai_{bf}$ (champion et al., 2021a) が98.6\%のタスクを17.5秒で解くことができた。我々の新しいアプローチ(BTAI_{3MF}$)は、タスクをたった2.559秒で完全に(100\%)解決することで、前者よりも優れていた。最後に、$BTAI_{3MF}$は柔軟で使いやすい(ピソン)パッケージで実装され、モデルの信念、計画プロセス、行動の検査を可能にするグラフィカルなユーザインタフェースを開発した。

関連論文リスト

Intention-Conditioned Flow Occupancy Models [69.79049994662591]
大規模な事前学習は、今日の機械学習研究のやり方を根本的に変えた。同じフレームワークを強化学習に適用することは、RLの中核的な課題に対処するための魅力的な方法を提供するので、魅力的です。生成AIの最近の進歩は、高度に複雑な分布をモデリングするための新しいツールを提供している。
論文参考訳（メタデータ） (2025-06-10T15:27:46Z)
Topo-VM-UNetV2: Encoding Topology into Vision Mamba UNet for Polyp Segmentation [4.856498016044607]
Topo-VMUNetV2を提案する。これはMambaベースのポリプセグメンテーションモデルVMUNetV2にトポロジ的特徴をエンコードする。提案手法は2つの段階から構成される: VMUNetV2はトレーニングおよびテスト画像の確率マップ(PM)を生成するために使用され、トポロジ注意マップの計算に使用される。
論文参考訳（メタデータ） (2025-05-09T17:41:13Z)
SChanger: Change Detection from a Semantic Change and Spatial Consistency Perspective [0.6749750044497732]
我々は,データ不足問題に対処するため,セマンティック・チェンジ・ネットワーク(SCN)と呼ばれる微調整戦略を開発した。両画像間の変化位置は空間的に同一であり,空間的整合性(空間的整合性)の概念である。これにより、マルチスケールな変更のモデリングが強化され、変更検出セマンティクスの基盤となる関係を捉えるのに役立ちます。
論文参考訳（メタデータ） (2025-03-26T17:15:43Z)
s1: Simple test-time scaling [148.4204982041058]
テスト時間スケーリングは、パフォーマンスを改善するために余分なテスト時間計算を使用する言語モデリングに対する、有望な新しいアプローチである。テストタイムのスケーリングと強力な推論性能を実現するための最もシンプルなアプローチを探します。
論文参考訳（メタデータ） (2025-01-31T18:48:08Z)
Truncated Consistency Models [57.50243901368328]
トレーニング一貫性モデルは、PF ODE 軌道に沿ったすべての中間点を対応するエンドポイントにマッピングする学習を必要とする。このトレーニングパラダイムが一貫性モデルの1ステップ生成性能を制限することを実証的に見出した。整合性関数の新しいパラメータ化と2段階の訓練手順を提案し,時間外学習が崩壊することを防ぐ。
論文参考訳（メタデータ） (2024-10-18T22:38:08Z)
Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
論文参考訳（メタデータ） (2024-05-27T22:15:23Z)
Technical Report for ICCV 2023 Visual Continual Learning Challenge: Continuous Test-time Adaptation for Semantic Segmentation [18.299549256484887]
この課題の目標は、セマンティックセグメンテーションタスクのためのビデオシーケンスのドメインを徐々に変更するようにモデルを適応させるテスト時間適応(TTA)手法を開発することである。 TTA法は、各画像シーケンス(ビデオ)で別々に評価され、つまり、次のシーケンスの前に、モデルがソースモデル状態にリセットされる。提案されたソリューションは、チャレンジで3位を獲得し、イノベーションアワードを受賞した。
論文参考訳（メタデータ） (2023-10-20T14:20:21Z)
Stochastic Principal-Agent Problems: Efficient Computation and Learning [25.637633553882985]
プリンシパルとエージェントは環境の中で相互作用し、それぞれが互いに利用できない状態に関する観察を行う。このモデルは、特殊ケースワイドフォームゲーム(EFG)を包含し、マルコフ決定プロセス(POMDP)のゲームにアプローチする。遷移確率が未知のエピソード強化学習環境において,効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-06-06T16:20:44Z)
Decoupled Multi-task Learning with Cyclical Self-Regulation for Face Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2022-03-28T02:12:30Z)
Branching Time Active Inference: empirical study and complexity class analysis [3.5450828190071655]
迷路解決剤の文脈における分枝時間能動推論手法(BTAI)について実験的に検討した。事前の嗜好の改善とより深い検索が、この脆弱性を局所的なミニマに緩和する助けとなることを示す。
論文参考訳（メタデータ） (2021-11-22T15:30:35Z)
Bandit Linear Optimization for Sequential Decision Making and Extensive-Form Games [102.23975166536326]
tree-form sequential decision making (tfsdm) は、エージェントと潜在的に敵対的な環境の間のツリー形式の相互作用をモデル化することで、古典的なワンショット意思決定を拡張する。これは、各プレイヤーが幅広い形式のゲームで直面するオンライン意思決定問題、およびマルコフ決定プロセス、およびエージェントが観測された履歴を条件とする部分観察可能なマルコフ決定プロセスをキャプチャする。本稿では, (i) 線形時間損失と (ii) $o(sqrtt)$ cumulative regret の両方を提供する拡張dmのバンディット線形最適化問題に対する最初のアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-03-08T05:00:13Z)
Improving Robustness and Generality of NLP Models Using Disentangled Representations [62.08794500431367]
スーパービジョンニューラルネットワークはまず入力$x$を単一の表現$z$にマップし、次に出力ラベル$y$にマッピングする。本研究では,非交叉表現学習の観点から,NLPモデルの堅牢性と汎用性を改善する手法を提案する。提案した基準でトレーニングしたモデルは、広範囲の教師付き学習タスクにおいて、より堅牢性とドメイン適応性を向上することを示す。
論文参考訳（メタデータ） (2020-09-21T02:48:46Z)
Approximated Bilinear Modules for Temporal Modeling [116.6506871576514]
CNNの2層は補助ブランチサンプリングを追加することで、時間的双線形モジュールに変換できる。我々のモデルは、事前トレーニングなしで、Something v1とv2データセットの最先端メソッドよりも優れている。
論文参考訳（メタデータ） (2020-07-25T09:07:35Z)
Query Training: Learning a Worse Model to Infer Better Marginals in Undirected Graphical Models with Hidden Variables [11.985433487639403]
確率的グラフィカルモデル(PGM)は、柔軟な方法でクエリできる知識のコンパクトな表現を提供する。我々は,PGMを学習するメカニズムであるクエリトレーニング(QT)を導入し,それと組み合わせる近似推論アルゴリズムに最適化する。実験により,QTを用いて隠れ変数を持つ8連結グリッドマルコフランダム場を学習できることが実証された。
論文参考訳（メタデータ） (2020-06-11T20:34:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。