論文の概要: User-Feedback-Driven Continual Adaptation for Vision-and-Language Navigation
- arxiv url: http://arxiv.org/abs/2512.10322v1
- Date: Thu, 11 Dec 2025 06:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.217388
- Title: User-Feedback-Driven Continual Adaptation for Vision-and-Language Navigation
- Title(参考訳): 視覚・言語ナビゲーションのためのユーザフィードバック駆動型連続適応
- Authors: Yongqiang Yu, Xuhui Li, Hazza Mahmood, Jinxing Zhou, Haodong Hong, Longtao Jiang, Zhiqiang Xu, Qi Wu, Xiaojun Chang,
- Abstract要約: VLN(Vision-and-Language Navigation)は、エージェントが自然言語の指示に従うことで複雑な環境をナビゲートする必要がある。
現在のGSA-VLNフレームワークは、環境暴露の繰り返しによる教師なし適応のみに依存するため、ユーザのフィードバックを除外している。
本稿では,GSA-VLNを拡張したユーザフィードバック型適応フレームワークを提案する。
- 参考スコア(独自算出の注目度): 50.51140007672333
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Vision-and-Language Navigation (VLN) requires agents to navigate complex environments by following natural-language instructions. General Scene Adaptation for VLN (GSA-VLN) shifts the focus from zero-shot generalization to continual, environment-specific adaptation, narrowing the gap between static benchmarks and real-world deployment. However, current GSA-VLN frameworks exclude user feedback, relying solely on unsupervised adaptation from repeated environmental exposure. In practice, user feedback offers natural and valuable supervision that can significantly enhance adaptation quality. We introduce a user-feedback-driven adaptation framework that extends GSA-VLN by systematically integrating human interactions into continual learning. Our approach converts user feedback-navigation instructions and corrective signals-into high-quality, environment-aligned training data, enabling efficient and realistic adaptation. A memory-bank warm-start mechanism further reuses previously acquired environmental knowledge, mitigating cold-start degradation and ensuring stable redeployment. Experiments on the GSA-R2R benchmark show that our method consistently surpasses strong baselines such as GR-DUET, improving navigation success and path efficiency. The memory-bank warm start stabilizes early navigation and reduces performance drops after updates. Results under both continual and hybrid adaptation settings confirm the robustness and generality of our framework, demonstrating sustained improvement across diverse deployment conditions.
- Abstract(参考訳): VLN(Vision-and-Language Navigation)は、エージェントが自然言語の指示に従うことで複雑な環境をナビゲートする必要がある。
General Scene Adaptation for VLN (GSA-VLN) はゼロショットの一般化から連続的な環境適応へと焦点を移し、静的ベンチマークと実世界の展開のギャップを狭める。
しかし、現在のGSA-VLNフレームワークは、環境暴露の繰り返しによる教師なし適応のみに依存するため、ユーザのフィードバックを除外している。
実際には、ユーザフィードバックは、適応品質を大幅に向上させる、自然で価値のある監視を提供する。
本稿では,GSA-VLNを拡張したユーザフィードバック型適応フレームワークを提案する。
提案手法は,ユーザのフィードバック・ナビゲーション指示と補正信号から,高品質で環境に整合したトレーニングデータに変換し,効率的かつ現実的な適応を可能にする。
メモリバンクウォームスタート機構は、以前取得した環境知識をさらに再利用し、コールドスタート劣化を緩和し、安定した再デプロイを確保する。
GSA-R2Rベンチマーク実験により,GR-DUETなどの強力なベースラインを一貫して超越し,航法成功と経路効率が向上した。
メモリバンクウォームスタートは早期ナビゲーションを安定させ、更新後のパフォーマンス低下を低減する。
連続的およびハイブリッドな適応設定による結果から,フレームワークの堅牢性と汎用性が確認され,多様な展開条件における継続的な改善が示された。
関連論文リスト
- Adapting to Fragmented and Evolving Data: A Fisher Information Perspective [0.0]
FADEは動的環境下での堅牢な学習のための軽量フレームワークである。
フィッシャー情報幾何学に固定されたシフトアウェアの正規化機構を採用している。
FADEは固定メモリでオンラインで動作し、ターゲットラベルにアクセスできない。
論文 参考訳(メタデータ) (2025-07-25T06:50:09Z) - NavMorph: A Self-Evolving World Model for Vision-and-Language Navigation in Continuous Environments [67.18144414660681]
VLN-CE(Vision-and-Language Navigation in Continuous Environments)は、自然言語命令によって誘導される複雑な環境において、エージェントがシーケンシャルなナビゲーションアクションを実行する必要がある。
人間の認知にインスパイアされたNavMorphは、VLN-CEタスクにおける環境理解と意思決定を強化する自己進化型世界モデルフレームワークである。
論文 参考訳(メタデータ) (2025-06-30T02:20:00Z) - VEM: Environment-Free Exploration for Training GUI Agent with Value Environment Model [34.98047665907545]
政策最適化から価値推定を分離する環境のないRLフレームワークを提案する。
本フレームワークは,(1)長期活動ユーティリティを推定するためにVEMを事前訓練すること,(2)凍結したVEM信号による政策探索を導くこと,の2段階からなる。
Android-in-the-Wildベンチマークで評価すると、VEMはオフラインとオンラインの両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-26T07:52:02Z) - Generalized Back-Stepping Experience Replay in Sparse-Reward Environments [2.6887381380521878]
バックステッピング体験リプレイ(BER)は、可逆環境における学習効率を向上する強化学習技術である。
元のアルゴリズムは複雑な探索を必要としない密集再帰環境のために設計されている。
本稿では,従来のアルゴリズムをスパース・リワード環境に拡張した汎用BER(Generalized BER, GBER)を提案する。
論文 参考訳(メタデータ) (2024-12-20T03:31:23Z) - Analysis of the Memorization and Generalization Capabilities of AI
Agents: Are Continual Learners Robust? [91.682459306359]
連続学習(CL)では、AIエージェントが動的環境下で非定常データストリームから学習する。
本稿では,過去の知識を維持しつつ,動的環境への堅牢な一般化を実現するための新しいCLフレームワークを提案する。
提案フレームワークの一般化と記憶性能を理論的に解析した。
論文 参考訳(メタデータ) (2023-09-18T21:00:01Z) - RE-MOVE: An Adaptive Policy Design for Robotic Navigation Tasks in
Dynamic Environments via Language-Based Feedback [56.219221064727016]
継続的制御ロボットナビゲーションタスクのための強化学習ベースのポリシーは、リアルタイムデプロイメント中に環境の変化に適応できないことが多い。
本稿では,RE-MOVEと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T04:20:59Z) - Anticipating the Unseen Discrepancy for Vision and Language Navigation [63.399180481818405]
視覚言語ナビゲーションでは、エージェントは特定のターゲットに到達するために自然言語命令に従う必要がある。
目に見える環境と目に見えない環境の間に大きな違いがあるため、エージェントがうまく一般化することは困難である。
本研究では,テストタイムの視覚的整合性を促進することによって,未知の環境への一般化を学習する,未知の離散性予測ビジョンと言語ナビゲーション(DAVIS)を提案する。
論文 参考訳(メタデータ) (2022-09-10T19:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。