論文の概要: SafeRun: Enabling Determinism in LLM Planning for Running
- arxiv url: http://arxiv.org/abs/2606.09027v1
- Date: Mon, 08 Jun 2026 04:53:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.700357
- Title: SafeRun: Enabling Determinism in LLM Planning for Running
- Title(参考訳): SafeRun: LLMの実行計画における決定性の実現
- Authors: Meilin Chen, Zepeng Zhai, Jiaxuan Zhao, Yuan Lu,
- Abstract要約: 大規模言語モデルは柔軟な自然言語計画を可能にするが、決定論に批判的な領域では信頼できない。
我々は、疎結合アーキテクチャによるLCMに基づく決定論的計画のためのフレームワークであるSafeRunを提案する。
現実的な生理的・安全的制約の下で計画を実行するための総合的なベンチマークを構築します。
- 参考スコア(独自算出の注目度): 6.727403784723227
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models enable flexible natural-language planning but remain unreliable in determinism-critical domains due to their probabilistic nature. This limitation is especially problematic in running planning, where violating safety rules can lead to safety risks. We propose SafeRun, a framework for deterministic LLM-based planning via a decoupled architecture. SafeRun separates soft interpretation by an LLM from hard constraint enforcement by a deterministic solver, ensuring strict safety constraints while preserving natural-language flexibility. To validate SafeRun, we build a comprehensive benchmark for running planning under realistic physiological and safety constraints. Experiments across five LLMs show that SafeRun achieves 100\% safety score (vs.\ 79.1\% PE average and 97.6\% CodeAct average) while maintaining competitive instruction-following scores. The SafeRun benchmark is publicly available at \href{https://huggingface.co/datasets/zzp-seeker/SafeRun-RunPlanning-Benchmark}{huggingface}.
- Abstract(参考訳): 大規模言語モデルは柔軟な自然言語計画を可能にするが、確率論的性質のため決定論的な領域では信頼できない。
この制限は、安全規則違反が安全リスクにつながるような計画実行において特に問題となる。
我々は、疎結合アーキテクチャによるLCMに基づく決定論的計画のためのフレームワークであるSafeRunを提案する。
SafeRunは、LLMによるソフトな解釈を、決定論的解決器による厳格な制約執行から切り離し、自然言語の柔軟性を維持しながら厳格な安全制約を確保する。
SafeRunを検証するために,現実的な生理的および安全上の制約の下で計画を実行するための包括的なベンチマークを構築した。
5つのLCMでの実験では、SafeRunが100\%の安全性スコア(vs)を達成した。
平均 79.1\% PE と 97.6\% の CodeAct であり、競争力のある命令フォロースコアを維持している。
SafeRunベンチマークは、 \href{https://huggingface.co/datasets/zzp-seeker/SafeRun-RunPlanning-Benchmark}{huggingface}で公開されている。
関連論文リスト
- Inverting the Shield: Systematically Generating Safety Tests from Policy Specifications [34.429470292997145]
我々は、仕様ベースのソフトウェアテストの厳格さをAIの安全性にもたらす新しいフレームワークを紹介します。
POLARISは、構造化されていない自然言語ポリシーを第一次論理表現にコンパイルし、高レベルのルールと具体的なテストケースの間のトレース可能なリンクを確立する。
この形式化により、複雑なポリシー違反シナリオをトラバース可能なパスとしてエンコードするセマンティックポリシーグラフの構築が可能になる。
実験により、POLARISは確立されたベースラインよりも高いポリシーカバレッジとアタック成功数を達成することが示された。
論文 参考訳(メタデータ) (2026-05-24T05:51:23Z) - SafeSeek: Universal Attribution of Safety Circuits in Language Models [49.59795225914787]
我々は,統合された安全解釈可能性フレームワークである ourmethod を提案する。
提案手法は,大規模言語モデルにおける機能的完全安全回路を同定する。
LLMの安全性には2つの重要なシナリオがある。
論文 参考訳(メタデータ) (2026-03-24T14:32:53Z) - LPS-Bench: Benchmarking Safety Awareness of Computer-Use Agents in Long-Horizon Planning under Benign and Adversarial Scenarios [51.52395368061729]
LPS-Benchは,長期作業下でのMPPベースのCUAの計画時安全意識を評価するベンチマークである。
実験は、安全な行動を維持する既存のCUAの能力に重大な欠陥があることを明らかにする。
MCPに基づくCUAシステムにおける長期計画の安全性向上のための緩和戦略を提案する。
論文 参考訳(メタデータ) (2026-02-03T08:40:24Z) - RoboSafe: Safeguarding Embodied Agents via Executable Safety Logic [56.38397499463889]
視覚言語モデル(VLM)を利用するエージェントは、複雑な現実世界のタスクを実行する能力がますます高まっている。
しかし、安全でない行動を引き起こす可能性のある危険な指示に弱いままである。
提案するRoboSafeは,実行可能述語ベースの安全ロジックを通じて,エージェントを具体化するためのランタイムセーフガードである。
論文 参考訳(メタデータ) (2025-12-24T15:01:26Z) - LogicGuard: Improving Embodied LLM agents through Temporal Logic based Critics [3.3890411643175646]
大規模言語モデル(LLM)はゼロショットと単一ステップの推論と意思決定の問題において有望であることを示している。
LogicGuardは,LLMアクターを軌跡レベルのLCM評論家に案内するモジュール型アクター・クリティックアーキテクチャである。
我々のセットアップは、言語モデルの推論強度と形式論理の保証を組み合わせる。
論文 参考訳(メタデータ) (2025-07-04T04:53:53Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z) - SafePath: Conformal Prediction for Safe LLM-Based Autonomous Navigation [67.22657932549723]
SafePathは,LLM(Large Language Models)を公式な安全保証とともに拡張するフレームワークである。
第1段階では,多様な候補経路を生成するLCMを用いて,エージェントの挙動と環境条件に基づく軌道探索を行う。
第2段階では、SafePathはリスクの高いトラジェクトリをフィルタリングし、少なくとも1つのセーフオプションがユーザ定義の確率に含まれていることを保証します。
最終段階では,不確実性が低い場合や不確実性が高い場合,人間に制御を委譲する場合の衝突リスクが最も低い経路を選択する。
論文 参考訳(メタデータ) (2025-05-14T14:28:24Z) - Graphormer-Guided Task Planning: Beyond Static Rules with LLM Safety Perception [4.424170214926035]
本稿では,大規模言語モデルと構造化安全モデリングを組み合わせたリスク対応タスク計画フレームワークを提案する。
提案手法は,空間的および文脈的危険因子を抽出し,動的セマンティック安全グラフを構築する。
既定の安全性制約に依存する既存の手法とは異なり、我々のフレームワークはコンテキスト認識型リスク認識モジュールを導入している。
論文 参考訳(メタデータ) (2025-03-10T02:43:54Z) - Introspective Planning: Aligning Robots' Uncertainty with Inherent Task Ambiguity [0.659529078336196]
大規模言語モデル(LLM)は高度な推論能力を示し、ロボットが自然言語の指示を理解し、高レベルの行動を戦略的に計画することを可能にする。
LLMの幻覚は、ロボットがユーザー目標と不一致の計画を実行したり、クリティカルなシナリオでは安全でないりする可能性がある。
本稿では,LLMの不確かさとタスク固有のあいまいさを一致させる系統的手法であるイントロスペクティブプランニングを提案する。
論文 参考訳(メタデータ) (2024-02-09T16:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。