論文の概要: Momentum-constrained Hybrid Heuristic Trajectory Optimization Framework with Residual-enhanced DRL for Visually Impaired Scenarios
- arxiv url: http://arxiv.org/abs/2509.15582v1
- Date: Fri, 19 Sep 2025 04:33:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.996011
- Title: Momentum-constrained Hybrid Heuristic Trajectory Optimization Framework with Residual-enhanced DRL for Visually Impaired Scenarios
- Title(参考訳): 視覚障害者のための残像強調DRLを用いたモーメント制約ハイブリッドヒューリスティック軌道最適化フレームワーク
- Authors: Yuting Zeng, Zhiwen Zheng, You Zhou, JiaLing Xiao, Yongbin Yu, Manping Fan, Bo Gong, Liyong Ren,
- Abstract要約: 本稿では,視覚障害者の補助ナビゲーションに適した運動量制約付きハイブリッド軌道最適化フレームワーク(MHHTOF)を提案する。
残留深部強化学習(DRL)による軌道サンプリング生成、最適化、評価の統合
実験の結果,提案したLSTM-BResPPOは,PPOが要求する約半数のトレーニングにおいて,安定な政策性能を実現することができることがわかった。
- 参考スコア(独自算出の注目度): 4.735413508037063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a momentum-constrained hybrid heuristic trajectory optimization framework (MHHTOF) tailored for assistive navigation in visually impaired scenarios, integrating trajectory sampling generation, optimization and evaluation with residual-enhanced deep reinforcement learning (DRL). In the first stage, heuristic trajectory sampling cluster (HTSC) is generated in the Frenet coordinate system using third-order interpolation with fifth-order polynomials and momentum-constrained trajectory optimization (MTO) constraints to ensure smoothness and feasibility. After first stage cost evaluation, the second stage leverages a residual-enhanced actor-critic network with LSTM-based temporal feature modeling to adaptively refine trajectory selection in the Cartesian coordinate system. A dual-stage cost modeling mechanism (DCMM) with weight transfer aligns semantic priorities across stages, supporting human-centered optimization. Experimental results demonstrate that the proposed LSTM-ResB-PPO achieves significantly faster convergence, attaining stable policy performance in approximately half the training iterations required by the PPO baseline, while simultaneously enhancing both reward outcomes and training stability. Compared to baseline method, the selected model reduces average cost and cost variance by 30.3% and 53.3%, and lowers ego and obstacle risks by over 77%. These findings validate the framework's effectiveness in enhancing robustness, safety, and real-time feasibility in complex assistive planning tasks.
- Abstract(参考訳): 本稿では、視覚障害のあるシナリオにおける補助ナビゲーションに適した運動量制約付きハイブリッドヒューリスティック軌道最適化フレームワーク(MHHTOF)を提案する。
第1段階では、Frenet座標系において、第5次多項式との3階補間と運動量制約付き軌道最適化(MTO)制約を用いてヒューリスティック軌道サンプリングクラスタ(HTSC)を生成し、滑らかさと実現性を確保する。
第1段階のコスト評価の後、第2段階はLSTMに基づく時間的特徴モデリングによる残留拡大アクタークリティカルネットワークを利用して、カルト座標系における軌道選択を適応的に洗練する。
重み移動を伴う二段階コストモデリング機構(DCMM)は、人間中心の最適化をサポートする。
実験の結果,提案したLSTM-ResB-PPOは,PPOベースラインが要求するトレーニングイテレーションの約半分で安定なポリシ性能を実現するとともに,報奨結果とトレーニング安定性の両面を同時に向上することがわかった。
基準法と比較して、選択されたモデルは平均コストとコストのばらつきを30.3%と53.3%に減らし、エゴと障害物リスクを77%以上下げる。
これらの結果から, 複雑な支援計画作業における堅牢性, 安全性, リアルタイム実現可能性を高める枠組みの有効性が検証された。
関連論文リスト
- TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making [75.29820290660065]
本稿では,効果的な具体的意思決定のための思考中心推論最適化(TCPO)を提案する。
モデルの中間的推論プロセスの整合性を強調し、モデル劣化の問題を緩和する。
ALFWorld環境での実験では、平均成功率は26.67%であり、RL4VLMよりも6%向上している。
論文 参考訳(メタデータ) (2025-09-10T11:16:21Z) - WSM: Decay-Free Learning Rate Schedule via Checkpoint Merging for LLM Pre-training [64.0932926819307]
本稿では,学習速度減衰とモデルマージの正式な関係を確立するフレームワークであるWarmup-Stable and Merge(WSM)を紹介する。
WSMは様々な崩壊戦略をエミュレートするための統一された理論基盤を提供する。
私たちのフレームワークは、複数のベンチマークで広く採用されているWarmup-Stable-Decay(WSD)アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-07-23T16:02:06Z) - Enhancing Spatiotemporal Networks with xLSTM: A Scalar LSTM Approach for Cellular Traffic Forecasting [0.7111641404908191]
本稿では,空間的特徴抽出のための3層Conv3Dモジュールと,より効率的なモデリングのためのグラデラーLSTMを利用する軽量なデュアルパス時空間ネットワークを提案する。
ConvLSTMベースラインよりも優れた予測性能を示し、未確認領域への強力な一般化を実現し、大規模次世代ネットワーク展開に適していることを示す。
論文 参考訳(メタデータ) (2025-07-17T22:48:46Z) - Reward-Guided Speculative Decoding for Efficient LLM Reasoning [80.55186052123196]
Reward-Guided Speculative Decoding (RSD)は,大規模言語モデル(LLM)における推論の効率向上を目的とした新しいフレームワークである。
RSDは、厳密な偏りを強制する既存の投機的復号法とは対照的に、制御されたバイアスをハイリワード出力の優先順位付けに取り入れている。
RSDは,対象モデルのみでの復号化に対して,高い効率向上を実現し,並列復号法よりも高い精度を実現している。
論文 参考訳(メタデータ) (2025-01-31T17:19:57Z) - A RankNet-Inspired Surrogate-Assisted Hybrid Metaheuristic for Expensive Coverage Optimization [5.757318591302855]
大規模カバレッジ最適化タスクを処理するために,RangeNetによるSurrogate支援ハイブリッドメタヒューリスティックを提案する。
我々のアルゴリズムは、EMVOPの最先端アルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2025-01-13T14:49:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。