論文の概要: NEXUS: Continual Learning of Symbolic Constraints for Safe and Robust Embodied Planning
- arxiv url: http://arxiv.org/abs/2605.09387v1
- Date: Sun, 10 May 2026 07:25:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.225254
- Title: NEXUS: Continual Learning of Symbolic Constraints for Safe and Robust Embodied Planning
- Title(参考訳): NEXUS:安全でロバストな計画のためのシンボリック制約の継続的な学習
- Authors: Tiehan Cui, Peipei Liu, Yanxu Mao, Congying Liu, Mingzhe Xing, Datao You,
- Abstract要約: 本稿では,エンボディエージェントの継続的な学習を目的としたモジュール型フレームワークであるNEXUSを紹介する。
このフレームワークは、安全仕様から物理的実現可能性を明確に分離する。
SafeAgentBenchの実験は、NEXUSが安全でない命令を効果的に拒否しながら、タスクの成功率に優れていることを示した。
- 参考スコア(独自算出の注目度): 8.274913538875387
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While Large Language Models (LLMs) have catalyzed progress in embodied intelligence, a fundamental gap between their inherent probabilistic uncertainty and the strict determinism and verifiable safety required in the physical world. To mitigate this gap, this paper introduces NEXUS, a modular framework designed for continual learning in embodied agents. Different from prior works that treat symbolic artifacts merely as static interfaces, NEXUS leverages them for symbolic grounding and knowledge evolution. The framework explicitly decouples physical feasibility from safety specifications: capability of agents is improved through closed-loop execution feedback, while probabilistic risk assessments are grounded into deterministic hard constraints to establish a rigorous pre-action defense. Experiments on SafeAgentBench demonstrate that NEXUS achieves superior task success rates while effectively refusing unsafe instructions, exhibiting robust defense against adversarial attacks, and progressively improving planning efficiency through knowledge accumulation.
- Abstract(参考訳): 大規模言語モデル(LLM)は、インテリジェンスにおける進歩を触媒しているが、その固有の確率的不確実性と厳密な決定論と物理的世界で必要とされる検証可能な安全性の間には、根本的なギャップがある。
このギャップを軽減するために,本論文では,エンボディエージェントの継続的な学習を目的としたモジュール型フレームワークであるNEXUSを紹介する。
シンボリックアーティファクトを単に静的インターフェースとして扱う以前の作品とは異なり、NEXUSはシンボリックグラウンドと知識進化のためにそれらを活用している。
クローズドループ実行フィードバックによってエージェントの能力が向上し、確率論的リスク評価は厳格な事前行動防御を確立するための決定論的ハード制約に基礎を置いている。
SafeAgentBenchの実験では、NEXUSは安全でない命令を効果的に拒否し、敵の攻撃に対する堅牢な防御を示し、知識の蓄積を通じて計画効率を徐々に改善し、優れたタスク成功率を達成することを示した。
関連論文リスト
- Leveraging the Power of Ensemble Learning for Secure Low Altitude Economy [64.39232788946173]
低高度経済(LAE)は社会福祉の強化と経済成長の推進に大きく貢献している。
本稿では,セキュアなLAEのためのアンサンブル学習,研究の焦点,解決策,ケーススタディについて検討する。
論文 参考訳(メタデータ) (2026-02-07T23:15:58Z) - RoboSafe: Safeguarding Embodied Agents via Executable Safety Logic [56.38397499463889]
視覚言語モデル(VLM)を利用するエージェントは、複雑な現実世界のタスクを実行する能力がますます高まっている。
しかし、安全でない行動を引き起こす可能性のある危険な指示に弱いままである。
提案するRoboSafeは,実行可能述語ベースの安全ロジックを通じて,エージェントを具体化するためのランタイムセーフガードである。
論文 参考訳(メタデータ) (2025-12-24T15:01:26Z) - How Brittle is Agent Safety? Rethinking Agent Risk under Intent Concealment and Task Complexity [55.441602598245744]
LLM駆動エージェントの現在の安全性評価は、主に原子害に焦点を当てており、悪意のある意図が複雑なタスクで隠されたり希釈されたりする高度な脅威に対処できなかった。
このギャップを,意図隠蔽とタスク複雑性の圧力下でのエージェントの安全性の脆さを二次元的に解析することで解決する。
目的が明確になるにつれて、安全アライメントは急激かつ予測的に低下し、「複雑パラドックス」が出現する。
論文 参考訳(メタデータ) (2025-11-11T17:27:27Z) - Real-Time Out-of-Distribution Failure Prevention via Multi-Modal Reasoning [18.28480383898768]
FORTRESSはロボットの安全性のための共同推論と計画のフレームワークである。
セマンティックに安全なフォールバック戦略を生成し、安全クリティカルなOOD障害を防ぐ。
論文 参考訳(メタデータ) (2025-05-15T17:55:28Z) - Reasoning-to-Defend: Safety-Aware Reasoning Can Defend Large Language Models from Jailbreaking [54.10710423370126]
本稿では,大規模言語モデルの生成プロセスに安全性を考慮した推論機構を統合する訓練パラダイムであるReasoning-to-Defend(R2D)を提案する。
CPOは、与えられた対話の安全性に対するモデルの認識を高める。
実験によると、R2Dは様々な攻撃を効果的に軽減し、元の性能を維持しながら全体の安全性を向上させる。
論文 参考訳(メタデータ) (2025-02-18T15:48:46Z) - SCANS: Mitigating the Exaggerated Safety for LLMs via Safety-Conscious Activation Steering [56.92068213969036]
悪意のある命令から脅威を守るために、LLM(Large Language Models)には安全アライメントが不可欠である。
近年の研究では、過大な安全性の問題により、安全性に配慮したLCMは、良質な問い合わせを拒否する傾向にあることが明らかになっている。
過大な安全性の懸念を和らげるために,SCANS法を提案する。
論文 参考訳(メタデータ) (2024-08-21T10:01:34Z) - Fail-Safe Adversarial Generative Imitation Learning [9.594432031144716]
本稿では, 安全な生成連続ポリシー, エンドツーエンドの生成逆トレーニング, 最悪の場合の安全性保証を, クローズドフォームの確率密度/勾配で実現する安全層を提案する。
安全層は、すべてのアクションを安全なアクションの集合にマッピングし、変量式と密度の測定値の加算率を使用する。
実世界のドライバーのインタラクションデータに関する実験では,提案手法のトラクタビリティ,安全性,模倣性能を実証的に実証した。
論文 参考訳(メタデータ) (2022-03-03T13:03:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。