論文の概要: ObjView-Bench: Rethinking Difficulty and Deployment for Object-Centric View Planning
- arxiv url: http://arxiv.org/abs/2605.10707v1
- Date: Mon, 11 May 2026 15:20:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.932855
- Title: ObjView-Bench: Rethinking Difficulty and Deployment for Object-Centric View Planning
- Title(参考訳): ObjView-Bench: オブジェクト中心のビュープランニングの難しさとデプロイを再考する
- Authors: Sicong Pan, Hao Hu, Xuying Huang, Benno Wingender, Maren Bennewitz,
- Abstract要約: オブジェクト中心のビュープランニングにおける困難と展開を再考するための評価フレームワークであるView-Benchを紹介する。
まず、オブジェクト指向の属性としての全方位幾何学的自己隠蔽、観測飽和困難、および集合被覆の定式化によって定義されたプロトコルに依存した計画困難の3つを分離する。
第2に、予算と到達可能なビュー制約がメソッドの動作をどのように変化させるかを明らかにする、デプロイメント指向の評価プロトコルを設計する。
- 参考スコア(独自算出の注目度): 8.29202043365381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object-centric view planning is a core component of active geometric 3D reconstruction in robotics, yet existing evaluations often conflate object complexity, planning difficulty, budget assumptions, and physical reachability constraints. As a result, conclusions drawn from idealized view-planning evaluations may not reliably predict performance under realistic reconstruction settings. We introduce ObjView-Bench, an evaluation framework for rethinking difficulty and deployment in object-centric view planning. First, we disentangle three quantities underlying view-planning evaluation: omnidirectional self-occlusion as an object-side attribute, observation saturation difficulty, and protocol-dependent planning difficulty defined through a set-cover formulation. This separation supports controlled dataset construction, analysis of slow-saturation objects, and a case study showing that planning difficulty-aware sampling can improve learned view planners. Second, we design deployment-oriented evaluation protocols that reveal how budget regimes and reachable-view constraints alter method behavior. Across classical, learned, and hybrid planners, ObjView-Bench shows that difficulty, budget, and reachability constraints substantially change method rankings and failure modes.
- Abstract(参考訳): オブジェクト中心のビュープランニングは、ロボット工学におけるアクティブな幾何学的3D再構成のコアコンポーネントである。
その結果、理想化された視点計画評価から得られた結論は、現実的な再構成設定下での性能を確実に予測できない。
ObjView-Benchは、オブジェクト指向のビュープランニングにおける難易度とデプロイメントを再考するための評価フレームワークです。
まず、オブジェクト指向属性としての全方位自己隠蔽、観測飽和難度、および集合被覆定式化によって定義されたプロトコル依存計画難度という、ビュープランニング評価の基礎となる3つの量を切り離す。
この分離は、制御されたデータセットの構築、遅い飽和度オブジェクトの分析、そして、困難なサンプリングの計画が学習されたビュープランナーを改善できることを示すケーススタディをサポートする。
第2に,予算体系と到達可能なビュー制約がメソッドの動作をどのように変化させるかを明らかにする,デプロイメント指向評価プロトコルを設計する。
古典的、学習的、ハイブリッドなプランナー全体で、ObjView-Bench氏は、難易度、予算、到達可能性の制約がメソッドのランキングと失敗モードを大きく変えていることを示している。
関連論文リスト
- From Perception to Action: An Interactive Benchmark for Vision Reasoning [51.11355591375073]
Causal Hierarchy of Actions and Interactions (CHAIN)ベンチマークは、モデルが物理的制約に基づいて構造化されたアクションシーケンスを理解し、計画し、実行できるかを評価するために設計された。
CHAINは、受動的知覚からアクティブな問題解決、機械パズルのインターロックや3D積み重ね、パッキングといったタスクへと評価をシフトする。
以上の結果から,トップパフォーマンスモデルでは,物理構造や因果制約の内在化に苦慮し,信頼性の高い長期計画の作成に失敗することが多く,認識された構造を効果的に翻訳することができないことが示唆された。
論文 参考訳(メタデータ) (2026-02-24T15:33:02Z) - Spatial Understanding from Videos: Structured Prompts Meet Simulation Data [89.77871049500546]
本稿では,事前学習された視覚言語モデルにおける3次元空間推論を,アーキテクチャを変更することなく拡張するための統一的なフレームワークを提案する。
このフレームワークは、複雑なシーンと質問を解釈可能な推論ステップに分解する構造化プロンプト戦略であるSpatialMindと、多様な3Dシミュレーションシーンから構築されたスケーラブルな質問応答データセットであるScanForgeQAを組み合わせる。
論文 参考訳(メタデータ) (2025-06-04T07:36:33Z) - Seeing is Believing: Belief-Space Planning with Foundation Models as Uncertainty Estimators [34.28879194786174]
オープンワールド環境における汎用的なロボット移動操作は、長い地平線、複雑な目標、部分的な観測可能性といった大きな課題を生んでいる。
これらの課題に対処するための有望なアプローチは、タスクプランナーがこれらのスキルをシーケンスして、構造化言語で指定された目標を達成する、パラメータ化されたスキルのライブラリを計画することである。
本稿では、視覚言語モデルを利用して不確実性を推定し、シンボリックグラウンド化を促進する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-04T07:48:53Z) - Exploiting Priors from 3D Diffusion Models for RGB-Based One-Shot View Planning [24.44253219419552]
本稿では,拡散モデルの強力な3次元生成能力を先行として活用したワンショットビュー計画手法を提案する。
シミュレーションと実環境における実験により, オブジェクト再構成の品質と移動コストのバランスが良好であることが示唆された。
論文 参考訳(メタデータ) (2024-03-25T14:21:49Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Effective Baselines for Multiple Object Rearrangement Planning in
Partially Observable Mapped Environments [5.32429768581469]
本研究の目的は, 自家用知的エージェントが部分観測可能性の下で効率的に再配置を計画できるようにすることである。
本研究では, モノリシック・モジュール型深層強化学習(DRL)法について検討した。
モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。
また、再配置が必要なオブジェクトが環境に均一に分散されている場合、我々の欲張りのあるモジュラーエージェントは経験的に最適であることを示す。
論文 参考訳(メタデータ) (2023-01-24T08:03:34Z) - Sequence-Based Plan Feasibility Prediction for Efficient Task and Motion
Planning [36.300564378022315]
本稿では,移動環境における移動操作問題を解決するための学習可能なタスク・アンド・モーション・プランニング(TAMP)アルゴリズムを提案する。
本アルゴリズムのコアは,タスク計画,目標,初期状態を考慮したトランスフォーマーに基づく新しい学習手法であるPIGINetであり,タスク計画に関連する運動軌跡の発見確率を予測する。
論文 参考訳(メタデータ) (2022-11-03T04:12:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。