Fugu-MT 論文翻訳(概要): CHOP: Counterfactual Human Preference Labels Improve Obstacle Avoidance in Visuomotor Navigation Policies

論文の概要: CHOP: Counterfactual Human Preference Labels Improve Obstacle Avoidance in Visuomotor Navigation Policies

arxiv url: http://arxiv.org/abs/2603.02004v1
Date: Mon, 02 Mar 2026 15:55:03 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.829109
Title: CHOP: Counterfactual Human Preference Labels Improve Obstacle Avoidance in Visuomotor Navigation Policies
Title（参考訳）: CHOP:視覚障害者ナビゲーション政策の障害物回避を改善した対人選好ラベル
Authors: Gershom Seneviratne, Jianyu An, Vaibhav Shende, Sahire Ellahy, Yaxita Amin, Kondapi Manasanjani, Samarth Chopra, Jonathan Deepak Kannan, Dinesh Manocha,
Abstract要約: ナビゲーションにおける安全性と障害物回避の人間の直感にバイスモータナビゲーションポリシーを整合させる新しいアプローチであるCHOPを紹介する。 CHOPは、人間の安全と障害物回避に対する人間の直感にバイスモータナビゲーションポリシーを合わせるために、対実的人間選好ラベルを使用する。実験により、CHOPで微調整された視覚運動ナビゲーションポリシーは、近距離衝突イベントを49.7%減らし、人間に好まれる軌道からの偏差を45.0%減らし、平均的な障害物クリアランスを19.8%増すことが示された。
参考スコア（独自算出の注目度）: 38.639825310372224
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Visuomotor navigation policies have shown strong perception-action coupling for embodied agents, yet they often struggle with safe navigation and dynamic obstacle avoidance in complex real-world environments. We introduce CHOP, a novel approach that leverages Counterfactual Human Preference Labels to align visuomotor navigation policies towards human intuition of safety and obstacle avoidance in navigation. In CHOP, for each visual observation, the robot's executed trajectory is included among a set of counterfactual navigation trajectories: alternative trajectories the robot could have followed under identical conditions. Human annotators provide pairwise preference labels over these trajectories based on anticipated outcomes such as collision risk and path efficiency. These aggregated preferences are then used to fine-tune visuomotor navigation policies, aligning their behavior with human preferences in navigation. Experiments on the SCAND dataset show that visuomotor navigation policies fine-tuned with CHOP reduce near-collision events by 49.7%, decrease deviation from human-preferred trajectories by 45.0%, and increase average obstacle clearance by 19.8% on average across multiple state-of-the-art models, compared to their pretrained baselines. These improvements transfer to real-world deployments on a Ghost Robotics Vision60 quadruped, where CHOP-aligned policies improve average goal success rates by 24.4%, increase minimum obstacle clearance by 6.8%, reduce collision and intervention events by 45.7%, and improve normalized path completion by 38.6% on average across navigation scenarios, compared to their pretrained baselines. Our results highlight the value of counterfactual preference supervision in bridging the gap between large-scale visuomotor policies and human-aligned, safety-aware embodied navigation.
Abstract（参考訳）: ビジュモータナビゲーションポリシーは、エンボディエージェントに対して強い知覚-作用結合を示すが、複雑な現実世界環境において安全なナビゲーションと動的障害物回避に苦慮することが多い。提案手法は,人間による安全観と障害物回避を両立させるために,対人選好ラベルを利用した新しいアプローチであるCHOPを導入する。 CHOPでは、それぞれの視覚的観察のために、ロボットが実行した軌道は、対物的な航法軌道のセットに含まれる。人間のアノテータは、衝突リスクや経路効率などの予測結果に基づいて、これらの軌道に対してペアワイズな選好ラベルを提供する。これらの集計された嗜好は、ナビゲーションの行動と人間の嗜好を一致させて、ヴィジュモータナビゲーションポリシーを微調整するために使用される。 SCANDデータセットの実験では、CHOPで微調整されたビズモータナビゲーションポリシーは、近コリジョンイベントを49.7%削減し、人間の優先軌道からの偏差を45.0%低減し、複数の最先端モデルの平均的な障害物クリアランスを19.8%増加させることが示されている。これらの改善は、ゴーストロボティクス・ビジョン60の4倍の現実世界への展開に移行し、CHOP対応のポリシーは平均目標達成率を24.4%改善し、最小障害物クリアランスを6.8%増加させ、衝突や介入イベントを45.7%減少させ、通常の経路完了を平均38.6%改善する。本研究は,大規模ビジュモータ政策と人間対応型安全意識型ナビゲーションのギャップを埋める上での,対物的選好監督の重要性を強調した。

論文の概要: CHOP: Counterfactual Human Preference Labels Improve Obstacle Avoidance in Visuomotor Navigation Policies

関連論文リスト