論文の概要: NeSyC: A Neuro-symbolic Continual Learner For Complex Embodied Tasks In Open Domains
- arxiv url: http://arxiv.org/abs/2503.00870v2
- Date: Fri, 07 Mar 2025 02:28:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 15:56:25.312891
- Title: NeSyC: A Neuro-symbolic Continual Learner For Complex Embodied Tasks In Open Domains
- Title(参考訳): NeSyC:オープンドメインにおける複雑な身体的タスクのためのニューロシンボリック連続学習システム
- Authors: Wonje Choi, Jinwoo Park, Sanghyun Ahn, Daehee Lee, Honguk Woo,
- Abstract要約: エンボディエージェントの鍵となる課題は、様々な環境における知識の一般化である。
NeSyCは、仮説推論モデルをエミュレートする神経共生型連続学習機である。
NeSyCは、様々なオープンドメイン環境における複雑なエンボディされたタスクの解決に非常に効果的である。
- 参考スコア(独自算出の注目度): 5.15053708399583
- License:
- Abstract: We explore neuro-symbolic approaches to generalize actionable knowledge, enabling embodied agents to tackle complex tasks more effectively in open-domain environments. A key challenge for embodied agents is the generalization of knowledge across diverse environments and situations, as limited experiences often confine them to their prior knowledge. To address this issue, we introduce a novel framework, NeSyC, a neuro-symbolic continual learner that emulates the hypothetico-deductive model by continually formulating and validating knowledge from limited experiences through the combined use of Large Language Models (LLMs) and symbolic tools. Specifically, we devise a contrastive generality improvement scheme within NeSyC, which iteratively generates hypotheses using LLMs and conducts contrastive validation via symbolic tools. This scheme reinforces the justification for admissible actions while minimizing the inference of inadmissible ones. Additionally, we incorporate a memory-based monitoring scheme that efficiently detects action errors and triggers the knowledge refinement process across domains. Experiments conducted on diverse embodied task benchmarks-including ALFWorld, VirtualHome, Minecraft, RLBench, and a real-world robotic scenario-demonstrate that NeSyC is highly effective in solving complex embodied tasks across a range of open-domain environments.
- Abstract(参考訳): 我々は、行動可能な知識を一般化するための神経象徴的アプローチを探求し、オープンドメイン環境で複雑なタスクにより効果的に対処できるようにする。
実施エージェントにとって重要な課題は、様々な環境や状況にまたがる知識の一般化である。
この問題に対処するため,我々は,Large Language Models(LLM)とシンボルツールを組み合わせて,限られた経験から知識を連続的に定式化し,検証することにより,仮説推論モデルをエミュレートするニューラルシンボリック連続学習システムNeSyCを導入する。
具体的には,LLMを用いて仮説を反復的に生成し,シンボリックツールによる対照的な検証を行う,NeSyC内の対照的な一般性改善スキームを考案する。
このスキームは、許容できないアクションの推論を最小化しながら、許容可能なアクションの正当化を強化する。
さらに、動作エラーを効率的に検出し、ドメイン間の知識改善プロセスをトリガーするメモリベースの監視スキームを組み込んだ。
ALFWorld、VirtualHome、Minecraft、RLBenchを含む多様な実施タスクベンチマークと、NeSyCが様々なオープンドメイン環境における複雑な実施タスクの解決に非常に効果的である実世界のシナリオ実証実験を行った。
関連論文リスト
- Vintix: Action Model via In-Context Reinforcement Learning [72.65703565352769]
In-context reinforcement learning を通じて振る舞いを学習できる固定されたクロスドメインモデルを導入することで ICRL のスケールアップに向けた第一歩を提示する。
ICRLを促進するために設計されたフレームワークであるアルゴリズム蒸留は、多目的な作用モデルを構築するために、専門家蒸留に代わる魅力的な、競争力のある代替手段を提供することを示した。
論文 参考訳(メタデータ) (2025-01-31T18:57:08Z) - DANA: Domain-Aware Neurosymbolic Agents for Consistency and Accuracy [3.2354860243748873]
大規模言語モデル(LLM)は目覚ましい能力を示しているが、その固有の確率論的性質は複雑な問題解決タスクの不整合と不正確性をもたらすことが多い。
本稿では、ドメイン固有の知識とニューロシンボリックアプローチを統合することで、これらの問題に対処するアーキテクチャであるDANAを紹介する。
論文 参考訳(メタデータ) (2024-09-27T18:29:23Z) - Cognitive LLMs: Towards Integrating Cognitive Architectures and Large Language Models for Manufacturing Decision-making [51.737762570776006]
LLM-ACTRは、ヒトに適応し、多目的な意思決定を提供する新しいニューロシンボリックアーキテクチャである。
我々のフレームワークは、ACT-Rの内部決定過程の知識を潜在神経表現として抽出し、組み込む。
デザイン・フォー・マニュファクチャリング・タスクに関する我々の実験は、タスク性能の向上と基礎的意思決定能力の向上を両立させたものである。
論文 参考訳(メタデータ) (2024-08-17T11:49:53Z) - Compromising Embodied Agents with Contextual Backdoor Attacks [69.71630408822767]
大型言語モデル(LLM)は、エンボディドインテリジェンスの発展に変化をもたらした。
本稿では,このプロセスにおけるバックドアセキュリティの重大な脅威を明らかにする。
ほんの少しの文脈的デモンストレーションを毒殺しただけで、攻撃者はブラックボックスLDMの文脈的環境を隠蔽することができる。
論文 参考訳(メタデータ) (2024-08-06T01:20:12Z) - CLR-Fact: Evaluating the Complex Logical Reasoning Capability of Large Language Models over Factual Knowledge [44.59258397967782]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる印象的な機能を示している。
本稿では,LLMの複雑な論理的推論能力の体系的評価について述べる。
LLMは一般世界の知識の推論に優れるが、専門分野固有の知識では重大な課題に直面している。
論文 参考訳(メタデータ) (2024-07-30T05:40:32Z) - Machine Psychology: Integrating Operant Conditioning with the Non-Axiomatic Reasoning System for Advancing Artificial General Intelligence Research [0.0]
本稿では,AI(Artificial General Intelligence, AGI)研究を強化するための学際的枠組みであるマシン心理学を紹介する。
このフレームワークの中核となる前提は、適応が生物学的および人工知能の両方にとって重要であることである。
本研究は,OpenNARS for Applications を用いた3つの操作型学習タスクを用いて,このアプローチを評価する。
論文 参考訳(メタデータ) (2024-05-29T20:23:57Z) - Scalable Language Model with Generalized Continual Learning [58.700439919096155]
The Joint Adaptive Re-ization (JARe) is integrated with Dynamic Task-related Knowledge Retrieval (DTKR) to enable adapt adjust of language model based on specific downstream task。
提案手法は,様々なバックボーンやベンチマーク上での最先端性能を実証し,最小限の忘れを伴い,フルセットおよび少数ショットのシナリオにおいて効果的な連続学習を実現する。
論文 参考訳(メタデータ) (2024-04-11T04:22:15Z) - Exploring Failure Cases in Multimodal Reasoning About Physical Dynamics [5.497036643694402]
我々は、シンプルなシミュレーション環境を構築し、ゼロショット環境では、テキストとマルチモーダルLLMの両方が、様々なオブジェクトに関する原子世界の知識を示すが、オブジェクト操作と配置タスクのための正しいソリューションで、この知識を構成するのに失敗する例を示す。
また、より洗練されたクロスモーダルな注意で訓練された視覚言語モデルBLIPを使用して、そのモデルがグラウンドに失敗するオブジェクトの物理的特性に関連する事例を特定する。
論文 参考訳(メタデータ) (2024-02-24T00:01:01Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Staged Reinforcement Learning for Complex Tasks through Decomposed
Environments [4.883558259729863]
RL問題を実問題に近似する2つの方法について議論する。
交通ジャンクションシミュレーションの文脈において、複雑なタスクを複数のサブタスクに分解できれば、これらのタスクを最初に解くのが有利であることを示す。
多エージェントの観点から、我々は、CTDE(Centralized Training Decentralized Execution)と呼ばれる一般的なパラダイムの下で学んだ経験の活用を活用するトレーニング構造化機構を導入する。
論文 参考訳(メタデータ) (2023-11-05T19:43:23Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。