論文の概要: Openpi Comet: Competition Solution For 2025 BEHAVIOR Challenge
- arxiv url: http://arxiv.org/abs/2512.10071v3
- Date: Mon, 05 Jan 2026 19:28:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.26928
- Title: Openpi Comet: Competition Solution For 2025 BEHAVIOR Challenge
- Title(参考訳): Openpi Comet:2025年のBehavior Challengeのコンペティションソリューション
- Authors: Junjie Bai, Yu-Wei Chao, Qizhi Chen, Jinwei Gu, Moo Jin Kim, Zhaoshuo Li, Xuan Li, Tsung-Yi Lin, Ming-Yu Liu, Nic Ma, Kaichun Mo, Delin Qu, Shangkun Sun, Hongchi Xia, Fangyin Wei, Xiaohui Zeng,
- Abstract要約: 2025 BEHAVIOR Challengeは、シミュレーション環境での物理エージェントによる長期タスクの解決に向けた進捗を厳格に追跡するように設計されている。
本報告では,2025 BEHAVIOR チャレンジを2位に近づき,残りの提案を著しく上回っている。
- 参考スコア(独自算出の注目度): 54.28288180330569
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The 2025 BEHAVIOR Challenge is designed to rigorously track progress toward solving long-horizon tasks by physical agents in simulated environments. BEHAVIOR-1K focuses on everyday household tasks that people most want robots to assist with and these tasks introduce long-horizon mobile manipulation challenges in realistic settings, bridging the gap between current research and real-world, human-centric applications. This report presents our solution to the 2025 BEHAVIOR Challenge in a very close 2nd place and substantially outperforms the rest of the submissions. Building on $π_{0.5}$, we focus on systematically building our solution by studying the effects of training techniques and data. Through careful ablation studies, we reveal the scaling benefits in both the pre-training and post-training phases, leading to a validation Q-score of 0.345, significantly surpassing previous state-of-the-art performance. We summarize our practical lessons and design recommendations that we hope will provide actionable insights for the broader embodied AI community when adapting powerful foundation models to complex embodied scenarios. Project page: https://github.com/mli0603/openpi-comet
- Abstract(参考訳): 2025 BEHAVIOR Challengeは、シミュレーション環境での物理エージェントによる長期タスクの解決に向けた進捗を厳格に追跡するように設計されている。
BEHAVIOR-1Kは、人々がロボットに助けを求める日常的な家庭作業に重点を置いており、これらのタスクは、現実的な環境での長距離移動操作の課題を導入し、現在の研究と現実世界の人間中心のアプリケーションとのギャップを埋める。
本報告では,2025 BEHAVIOR チャレンジを2位に近づき,残りの提案を著しく上回っている。
π_{0.5}$をベースとして、トレーニング手法とデータの効果を研究することによって、ソリューションを体系的に構築することに注力する。
本研究では,事前学習と後学習の両段階におけるスケーリングのメリットを明らかにするとともに,従来の最先端性能を大きく上回る0.345の検証Qスコアを達成した。
私たちは、複雑な実施シナリオに強力な基礎モデルを適用する際に、より広範な具体的AIコミュニティに対して実行可能な洞察を提供することを期待している、実践的な教訓と設計勧告を要約します。
プロジェクトページ:https://github.com/mli0603/openpi-comet
関連論文リスト
- LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces [65.11019654023978]
LongCLI-Benchは、長期にわたる現実的なタスクにまたがるエージェント能力を評価するために設計されたベンチマークである。
私たちは、1000以上のコンピュータサイエンスの課題と現実世界のタスクから、20の高品質で長い水平タスクをキュレートしました。
実験によると、最先端のエージェントでさえLongCLI-Benchの20%未満のパスレートを達成する。
論文 参考訳(メタデータ) (2026-02-15T23:12:57Z) - Task adaptation of Vision-Language-Action model: 1st Place Solution for the 2025 BEHAVIOR Challenge [0.0]
我々は,2025年のBehavior Challengeで優勝したビジョンアクション政策を提示する。
BEHAVIOR Challengeは、写真リアリスティックなシミュレーションで50種類の多種多様な家庭用タスクを特徴とする大規模なベンチマークである。
このアプローチは、パブリックとプライベートの両方のリーダボード上の50のタスクすべてに対して、26%のqスコアを実現しています。
論文 参考訳(メタデータ) (2025-12-07T18:08:45Z) - The 1st Solution for MOSEv1 Challenge on LSVOS 2025: CGFSeg [19.13013862040698]
Video Object(VOS)は、ビデオシーケンス全体にわたって特定のオブジェクトを追跡し、セグメンテーションすることを目的としている。
本稿では,MOSEv1チャレンジにおけるVOSタスクに対する信頼性誘導核融合抽出法(CGFSeg)を提案する。
LSVOS 2025のMOSEv1チャレンジでは,テストセットで86.37%のJ&Fスコアを達成した。
論文 参考訳(メタデータ) (2025-09-30T03:50:56Z) - Benchmarking Generalizable Bimanual Manipulation: RoboTwin Dual-Arm Collaboration Challenge at CVPR 2025 MEIS Workshop [120.2806035123366]
RoboTwin Dual-Arm Collaboration Challengeは、CVPR 2025の第2回MeISワークショップで行われた。
ライバルは、剛性、変形性、触覚ベースのシナリオをカバーする17のデュアルアーム操作タスクに完全に取り組んだ。
コンペティションの設定、タスク設計、評価方法論、重要な発見と今後の方向性について概説する。
論文 参考訳(メタデータ) (2025-06-29T17:56:41Z) - Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge [93.4434417387526]
ロボット工学における鍵となるベンチマークタスクとして,Open Vocabulary Mobile Manipulationを提案する。
我々は,この課題に対する解決策を評価するために,シミュレーションと実世界のコンポーネントを兼ね備えたNeurIPS 2023コンペティションを組織した。
シミュレーションと実環境設定の両方で使用される結果と方法論を詳述する。
論文 参考訳(メタデータ) (2024-07-09T15:15:01Z) - 2nd Place Solution for SODA10M Challenge 2021 -- Continual Detection
Track [35.06282647572304]
ResNet50-FPNをベースラインとして採用し、最終的な提案モデルのいくつかの改善を試みる。
タスク固有のリプレイ方式,学習率スケジューリング,モデルキャリブレーション,原画像スケールの使用により,画像中の大小オブジェクトの性能向上が期待できる。
論文 参考訳(メタデータ) (2021-10-25T15:58:19Z) - Two-Stream Consensus Network: Submission to HACS Challenge 2021
Weakly-Supervised Learning Track [78.64815984927425]
弱い監督による時間的行動ローカライゼーションの目標は、ビデオの興味ある動作を時間的に特定し、分類することである。
この課題では,2ストリームコンセンサスネットワーク(TSCN)を主要なフレームワークとして採用しています。
この課題では,本手法が今後の学術研究のベースラインとなることを期待して,第2位にランクインした。
論文 参考訳(メタデータ) (2021-06-21T03:36:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。