Fugu-MT 論文翻訳(概要): Hierarchical Neuro-Symbolic Decision Transformer

論文の概要: Hierarchical Neuro-Symbolic Decision Transformer

arxiv url: http://arxiv.org/abs/2503.07148v3
Date: Thu, 29 May 2025 13:21:50 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-30 15:42:33.40474
Title: Hierarchical Neuro-Symbolic Decision Transformer
Title（参考訳）: 階層型ニューロシンボリック決定変換器
Authors: Ali Baheri, Cecilia O. Alm,
Abstract要約: 本稿では,古典的シンボリックプランナーとトランスフォーマーベースのポリシーを密結合した階層型ニューロシンボリックコントロールフレームワークを提案する。高いレベルでは、プランナーは、タスク制約との論理的一貫性を保証する演算子の解釈可能なシーケンスを組み立てる。低レベルでは、各オペレータは、決定変換器にきめ細かいアクションを生成するように要求するサブゴールトークンとして描画される。
参考スコア（独自算出の注目度）: 6.4149117677272525
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present a hierarchical neuro-symbolic control framework that tightly couples a classical symbolic planner with a transformer-based policy to address long-horizon decision-making under uncertainty. At the high level, the planner assembles an interpretable sequence of operators that guarantees logical coherence with task constraints, while at the low level each operator is rendered as a sub-goal token that conditions a decision transformer to generate fine-grained actions directly from raw observations. This bidirectional interface preserves the combinatorial efficiency and explainability of symbolic reasoning without sacrificing the adaptability of deep sequence models, and it permits a principled analysis that tracks how approximation errors from both planning and execution accumulate across the hierarchy. Empirical studies in stochastic grid-world domains demonstrate that the proposed method consistently surpasses purely symbolic, purely neural and existing hierarchical baselines in both success and efficiency, highlighting its robustness for sequential tasks.
Abstract（参考訳）: 本稿では,古典的象徴的プランナーとトランスフォーマーに基づく政策を密結合させて,不確実性の下での長期的意思決定に対処する階層型ニューロシンボリック・コントロール・フレームワークを提案する。高いレベルでは、プランナーは、タスク制約との論理的一貫性を保証する演算子の解釈可能なシーケンスを組み立て、低いレベルでは、各演算子は、決定変換器を条件として、生の観測から直接きめ細かなアクションを生成するサブゴールトークンとして描画される。この双方向インタフェースは、ディープシーケンスモデルの適応性を犠牲にすることなく、記号推論の組合せ効率と説明可能性を保持し、計画と実行の両方からの近似誤差が階層にわたってどのように蓄積されるかを追跡する、原則化された分析を可能にする。確率的グリッドワールド領域における実証的研究は、提案手法が成功と効率の両方において純粋に記号的、純粋に神経的、既存の階層的ベースラインを一貫して超越していることを示し、シーケンシャルなタスクに対する堅牢性を強調している。

関連論文リスト

Weights to Code: Extracting Interpretable Algorithms from the Discrete Transformer [65.38883376379812]
本稿では,連続表現と離散記号論理のギャップを埋めるアーキテクチャである離散変換器を提案する。実証的には、Discrete TransformerはRNNベースのベースラインに匹敵するパフォーマンスを達成するだけでなく、連続的な変数ドメインへの解釈可能性を大幅に拡張する。
論文参考訳（メタデータ） (2026-01-09T12:49:41Z)
Ontology Neural Networks for Topologically Conditioned Constraint Satisfaction [0.0]
トポロジカルコンディショニングと勾配安定化機構を統合した拡張フレームワークを提案する。このフレームワークは、シード非依存の収束と、20ノード問題までの優雅なスケーリング挙動を示す。
論文参考訳（メタデータ） (2026-01-08T18:01:52Z)
Parallel BiLSTM-Transformer networks for forecasting chaotic dynamics [24.960864709838436]
本研究では,Transformer と Bidirectional Long Short-Term Memory Network を統合した並列予測フレームワークを提案する。提案したハイブリッドモデルはデュアルブランチアーキテクチャを採用しており、Transformerブランチは主に長距離依存関係をキャプチャする。結果は、提案されたハイブリッドフレームワークがタスク間でシングルブランチアーキテクチャの両方より優れていることを一貫して示している。
論文参考訳（メタデータ） (2025-10-27T16:17:10Z)
Distributionally Robust Control with End-to-End Statistically Guaranteed Metric Learning [5.309590159815129]
我々は、新しいエンドツーエンド有限ホライズン・ワッサーシュタイン DRC フレームワークを提案する。これは、異方性ワッサースタインメトリクスの学習と下流制御タスクを閉ループ方式で統合する。提案手法は,最先端手法と比較して,クローズドループ性能とロバスト性に優れることを示す。
論文参考訳（メタデータ） (2025-10-11T13:40:49Z)
Hierarchical Feature-level Reverse Propagation for Post-Training Neural Networks [24.442592456755698]
エンド・ツー・エンドの自動運転は支配的なパラダイムとして現れてきたが、その高度に絡み合ったブラックボックスモデルは、解釈可能性と安全性の保証の観点から課題を提起している。本稿では,事前学習ニューラルネットワークに適した階層的かつ非結合なポストトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2025-06-08T15:19:03Z)
Certified Neural Approximations of Nonlinear Dynamics [52.79163248326912]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文参考訳（メタデータ） (2025-05-21T13:22:20Z)
Symbolic Rule Extraction from Attention-Guided Sparse Representations in Vision Transformers [1.3812010983144802]
最近のニューロシンボリックアプローチは、解釈可能性を高めるためにCNNベースのモデルからシンボリック・ルールセットを抽出することに成功している。本稿では、スパースオートエンコーダ(SAE)にインスパイアされたスパース概念層を導入し、視覚変換器(ViT)からシンボルルールを抽出するフレームワークを提案する。本手法は,記号的推論が可能でありながら,標準のViTよりも5.14%の精度で分類できる。
論文参考訳（メタデータ） (2025-05-10T19:45:15Z)
Hierarchical Neural Constructive Solver for Real-world TSP Scenarios [27.986011761759567]
本稿では,産業環境に関連する現実的なトラベリングセールスマン問題(TSP)について紹介する。我々の階層的アプローチは、古典的モデルと最近のトランスモデルの両方と比較して優れたパフォーマンスをもたらす。
論文参考訳（メタデータ） (2024-08-07T06:44:47Z)
Emergent Language Symbolic Autoencoder (ELSA) with Weak Supervision to Model Hierarchical Brain Networks [0.12075823996747355]
脳ネットワークには階層的な組織があり、既存のディープラーニングモデルに課題をもたらす複雑性がある。本稿では,弱い監督と創発的言語(EL)フレームワークによって情報を得るシンボリックオートエンコーダを提案する。私たちの革新には、文と画像の両方が機能的脳ネットワークの階層構造を正確に反映するように設計された一般化階層的損失関数が含まれています。
論文参考訳（メタデータ） (2024-04-15T13:51:05Z)
Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文参考訳（メタデータ） (2024-02-09T07:45:26Z)
Exploiting hidden structures in non-convex games for convergence to Nash equilibrium [62.88214569402201]
現代の機械学習アプリケーションは、非協調的なナッシュリリアとして定式化することができる。決定論的環境と決定論的環境の両方に明確な収束保証を提供する。
論文参考訳（メタデータ） (2023-12-27T15:21:25Z)
Rethinking Decision Transformer via Hierarchical Reinforcement Learning [54.3596066989024]
決定変換器(Decision Transformer, DT)は、強化学習(RL)における変換器アーキテクチャの最近の進歩を活用する革新的なアルゴリズムである。本稿では,階層RLのレンズを用いたシーケンシャル意思決定のための汎用シーケンスモデリングフレームワークを提案する。 DTは、高レベルかつ低レベルなポリシーを選択することで、このフレームワークの特別なケースとして現れ、これらの選択の潜在的な失敗について議論する。
論文参考訳（メタデータ） (2023-11-01T03:32:13Z)
Discrete, compositional, and symbolic representations through attractor dynamics [51.20712945239422]
我々は,思考の確率的言語(PLoT)に似た認知過程をモデル化するために,アトラクタダイナミクスを記号表現と統合した新しいニューラルシステムモデルを導入する。我々のモデルは、連続表現空間を、事前定義されたプリミティブに頼るのではなく、教師なし学習を通じて、記号系の意味性と構成性の特徴を反映する、記号列に対応する引き付け状態を持つ離散盆地に分割する。このアプローチは、認知操作の複雑な双対性を反映したより包括的なモデルを提供する、AIにおける表現力の証明された神経弁別可能な基質であるニューラルダイナミクスを通じて、シンボル処理とサブシンボル処理の両方を統合する統一的なフレームワークを確立する。
論文参考訳（メタデータ） (2023-10-03T05:40:56Z)
Semantic Strengthening of Neuro-Symbolic Learning [85.6195120593625]
ニューロシンボリックアプローチは一般に確率論的目的のファジィ近似を利用する。トラクタブル回路において,これを効率的に計算する方法を示す。我々は,Warcraftにおける最小コストパスの予測,最小コスト完全マッチングの予測,スドクパズルの解法という3つの課題に対して,アプローチを検証した。
論文参考訳（メタデータ） (2023-02-28T00:04:22Z)
An Auction-based Coordination Strategy for Task-Constrained Multi-Agent Stochastic Planning with Submodular Rewards [7.419725234099728]
既存のタスク調整アルゴリズムはプロセスを無視したり、計算強度に悩まされる。新たに定式化されたスコア関数を用いた分散オークションベースのコーディネート戦略を提案する。大規模アプリケーションの実装には,提案手法の近似変種,すなわちDeep Auctionも提案されている。
論文参考訳（メタデータ） (2022-12-30T10:25:25Z)
Interpreting Neural Policies with Disentangled Tree Representations [58.769048492254555]
本稿では,コンパクトなニューラルポリシーの解釈可能性について,不整合表現レンズを用いて検討する。決定木を利用して,ロボット学習における絡み合いの要因を抽出する。学習したニューラルダイナミクスの絡み合いを計測する解釈可能性指標を導入する。
論文参考訳（メタデータ） (2022-10-13T01:10:41Z)
Semantic Probabilistic Layers for Neuro-Symbolic Learning [83.25785999205932]
我々は構造化出力予測(SOP)のための予測層を設計する。予測が事前に定義されたシンボリック制約のセットと一致していることを保証するため、任意のニューラルネットワークにプラグインすることができる。我々のセマンティック確率層(SPL)は、構造化された出力空間上で複雑な相関や制約をモデル化することができる。
論文参考訳（メタデータ） (2022-06-01T12:02:38Z)
Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文参考訳（メタデータ） (2022-05-13T21:09:41Z)
Latent Event-Predictive Encodings through Counterfactual Regularization [0.9449650062296823]
本稿では,新しい正則化方式を用いたSUGAR(Surprise-GAted Recurrent Neural Network)を提案する。隠れたグラフ構造を交互に並べてシーケンスを生成する階層的シーケンス予測タスクでモデルをテストします。
論文参考訳（メタデータ） (2021-05-12T18:30:09Z)
Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文参考訳（メタデータ） (2020-07-06T05:13:20Z)
Deep Autoencoding Topic Model with Scalable Hybrid Bayesian Inference [55.35176938713946]
我々は、ガンマ分布の階層構造を用いて、その多確率層生成ネットワークを構築するディープ・オートエンコーディング・トピック・モデル(DATM)を開発した。 Weibull上向き変分エンコーダを提案する。このエンコーダは深層ニューラルネットワークを介して情報を上向きに伝播し,次いで下向き生成モデルを提案する。大規模コーパス上での教師なしおよび教師なしの学習タスクにおいて,モデルの有効性とスケーラビリティを実証した。
論文参考訳（メタデータ） (2020-06-15T22:22:56Z)
From proprioception to long-horizon planning in novel environments: A hierarchical RL model [4.44317046648898]
本稿では,異なるタイプの推論を反映した,単純で3段階の階層型アーキテクチャを提案する。本手法をMujoco Ant環境における一連のナビゲーションタスクに適用する。
論文参考訳（メタデータ） (2020-06-11T17:19:12Z)
Learning Functionally Decomposed Hierarchies for Continuous Control Tasks with Path Planning [36.050432925402845]
我々は、長い水平方向制御タスクをうまく解決する新しい階層型強化学習アーキテクチャであるHiDeを提案する。実験により,本手法は未知のテスト環境にまたがって一般化され,学習法および非学習法と比較して3倍の地平線長に拡張可能であることが示された。
論文参考訳（メタデータ） (2020-02-14T10:19:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。