論文の概要: Self-Supervised Path Planning in Unstructured Environments via Global-Guided Differentiable Hard Constraint Projection
- arxiv url: http://arxiv.org/abs/2601.19354v1
- Date: Tue, 27 Jan 2026 08:37:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 05:38:53.434052
- Title: Self-Supervised Path Planning in Unstructured Environments via Global-Guided Differentiable Hard Constraint Projection
- Title(参考訳): グローバル誘導型微分可能ハード制約投影による非構造環境における自己監督経路計画
- Authors: Ziqian Wang, Chenxi Fang, Zhen Zhang,
- Abstract要約: 本研究では,非構造化環境における自律ナビゲーションのためのディープラーニングエージェントをデプロイするための自己教師型フレームワークを提案する。
データ不足を軽減するため,手動ラベリングを使わずに高密度の監視信号を提供するG-APF(Global-Guided Artificial Potential Field)を構築した。
20,000のシナリオからなるテストセットのベンチマークでは、88.75%の成功率を示し、強化された運用安全性を実証している。
- 参考スコア(独自算出の注目度): 5.665217514922631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying deep learning agents for autonomous navigation in unstructured environments faces critical challenges regarding safety, data scarcity, and limited computational resources. Traditional solvers often suffer from high latency, while emerging learning-based approaches struggle to ensure deterministic feasibility. To bridge the gap from embodied to embedded intelligence, we propose a self-supervised framework incorporating a differentiable hard constraint projection layer for runtime assurance. To mitigate data scarcity, we construct a Global-Guided Artificial Potential Field (G-APF), which provides dense supervision signals without manual labeling. To enforce actuator limitations and geometric constraints efficiently, we employ an adaptive neural projection layer, which iteratively rectifies the coarse network output onto the feasible manifold. Extensive benchmarks on a test set of 20,000 scenarios demonstrate an 88.75\% success rate, substantiating the enhanced operational safety. Closed-loop experiments in CARLA further validate the physical realizability of the planned paths under dynamic constraints. Furthermore, deployment verification on an NVIDIA Jetson Orin NX confirms an inference latency of 94 ms, showing real-time feasibility on resource-constrained embedded hardware. This framework offers a generalized paradigm for embedding physical laws into neural architectures, providing a viable direction for solving constrained optimization in mechatronics. Source code is available at: https://github.com/wzq-13/SSHC.git.
- Abstract(参考訳): 構造化されていない環境での自律ナビゲーションのためのディープラーニングエージェントのデプロイは、安全性、データの不足、限られた計算リソースに関する重要な課題に直面します。
従来の問題解決者は高いレイテンシに悩まされることが多いが、新しい学習ベースのアプローチは決定論的実現性を確保するのに苦労する。
組込み型インテリジェンスから組込み型インテリジェンスへのギャップを埋めるため,ランタイム保証のための微分可能なハード制約プロジェクション層を組み込んだ自己教師型フレームワークを提案する。
データ不足を軽減するため,手動ラベリングを使わずに高密度の監視信号を提供するG-APF(Global-Guided Artificial Potential Field)を構築した。
アクチュエータの制約と幾何的制約を効率的に実施するために,適応型ニューラルネットワークプロジェクション層を用いる。
20,000のシナリオからなるテストセットの大規模なベンチマークでは、88.75 %の成功率を示し、強化された運用安全性を実証している。
CARLAにおける閉ループ実験は、動的制約の下で計画された経路の物理的実現可能性をさらに検証する。
さらに、NVIDIA Jetson Orin NX上のデプロイメント検証では、94msの推論遅延を確認し、リソース制約の組込みハードウェアに対するリアルタイム実現可能性を示している。
このフレームワークは、ニューラルネットワークに物理法則を埋め込むための一般化パラダイムを提供し、メカトロニクスにおける制約付き最適化を解決するための実行可能な方向を提供する。
ソースコードは、https://github.com/wzq-13/SSHC.git.comで入手できる。
関連論文リスト
- BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Kernel-Based Learning of Safety Barriers [0.9367224590861915]
安全クリティカルなアプリケーションにおけるAIアルゴリズムの迅速な統合は、厳格な安全基準を満たす能力に対する懸念を高めている。
従来の安全検証ツールでは、AI駆動システムのブラックボックスの性質に苦戦している。
離散時間力学を用いたブラックボックスシステムの安全性検証と合成のためのデータ駆動方式を提案する。
論文 参考訳(メタデータ) (2026-01-17T10:42:35Z) - AmbShield: Enhancing Physical Layer Security with Ambient Backscatter Devices against Eavesdroppers [69.56534335936534]
AmbShieldは自然分布のAmBDを利用して正規チャネルを強化し、eavesdropperを分解するAmBD支援PSSスキームである。
AmbShieldでは、AmBDはランダムに後方散乱して盗聴者の干渉を発生させるフレンドリーなジャマーとして利用され、受動的リレーは所望の信号を後方散乱して正当な装置の容量を高める。
論文 参考訳(メタデータ) (2026-01-14T20:56:50Z) - PILOT: Planning via Internalized Latent Optimization Trajectories for Large Language Models [51.43746425777865]
大規模言語モデル(LLM)は、しばしばグローバル戦略を定式化する能力に欠けており、長い水平タスクにおけるエラーの伝播につながる。
PILOTは,大規模モデルの戦略的監視を本質的な潜伏誘導に内部化するためのフレームワークである。
論文 参考訳(メタデータ) (2026-01-07T12:38:56Z) - Latent Space Reinforcement Learning for Multi-Robot Exploration [0.0]
未知環境の自動マッピングシステムを開発した。
必須空間情報を保存しつつ,高忠実度占有率マップを潜在状態ベクトルに圧縮する。
共有データへの依存を変調する重み付きコンセンサス機構を導入する。
論文 参考訳(メタデータ) (2026-01-03T10:06:40Z) - Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning [52.03884701766989]
オフライン強化学習(RL)アルゴリズムは、通常、アクション選択に制約を課す。
本稿では,Bellmanターゲットにおける行動選択を,データセットアクションの近傍の結合に制限する新しい地区制約を提案する。
我々は,この制約を満たす目標動作を用いてQ学習を行うための,単純で効果的なアルゴリズムであるAdaptive Neighborhood-Constrained Q Learning(ANQ)を開発した。
論文 参考訳(メタデータ) (2025-11-04T13:42:05Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - GOAT: GPU Outsourcing of Deep Learning Training With Asynchronous
Probabilistic Integrity Verification Inside Trusted Execution Environment [0.0]
Deep Neural Networks(DNN)に基づく機械学習モデルは、自動運転車から新型コロナウイルスの治療発見まで、さまざまなアプリケーションにますます導入されている。
DNNを学習するために必要な計算能力をサポートするために、専用のハードウェアサポートを備えたクラウド環境が重要なインフラストラクチャとして登場した。
これらの課題に対処する様々なアプローチが開発され、信頼できる実行環境(TEE)上に構築されている。
論文 参考訳(メタデータ) (2020-10-17T20:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。