論文の概要: RFM-Pose:Reinforcement-Guided Flow Matching for Fast Category-Level 6D Pose Estimation
- arxiv url: http://arxiv.org/abs/2602.05257v1
- Date: Thu, 05 Feb 2026 03:26:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.741665
- Title: RFM-Pose:Reinforcement-Guided Flow Matching for Fast Category-Level 6D Pose Estimation
- Title(参考訳): RFM-Pose:Reinforcement-Guided Flow Matching for Fast Category-Level 6D Pose Estimation
- Authors: Diya He, Qingchen Liu, Cong Zhang, Jiahu Qin,
- Abstract要約: 我々は,サンプル仮説を積極的に評価しながら,カテゴリレベルの6次元オブジェクトポーズ生成を加速する新しいフレームワーク RFM-Pose を提案する。
REAL275ベンチマークの実験では、RAM-Poseは計算コストを大幅に削減し、良好な性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 8.3336796041978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object pose estimation is a fundamental problem in computer vision and plays a critical role in virtual reality and embodied intelligence, where agents must understand and interact with objects in 3D space. Recently, score based generative models have to some extent solved the rotational symmetry ambiguity problem in category level pose estimation, but their efficiency remains limited by the high sampling cost of score-based diffusion. In this work, we propose a new framework, RFM-Pose, that accelerates category-level 6D object pose generation while actively evaluating sampled hypotheses. To improve sampling efficiency, we adopt a flow-matching generative model and generate pose candidates along an optimal transport path from a simple prior to the pose distribution. To further refine these candidates, we cast the flow-matching sampling process as a Markov decision process and apply proximal policy optimization to fine-tune the sampling policy. In particular, we interpret the flow field as a learnable policy and map an estimator to a value network, enabling joint optimization of pose generation and hypothesis scoring within a reinforcement learning framework. Experiments on the REAL275 benchmark demonstrate that RFM-Pose achieves favorable performance while significantly reducing computational cost. Moreover, similar to prior work, our approach can be readily adapted to object pose tracking and attains competitive results in this setting.
- Abstract(参考訳): オブジェクトのポーズ推定はコンピュータビジョンの基本的な問題であり、エージェントが3D空間のオブジェクトを理解し、対話しなければならない仮想現実や具現化インテリジェンスにおいて重要な役割を果たす。
近年、スコアベースの生成モデルは、カテゴリレベルのポーズ推定において、回転対称性の曖昧さをある程度解決しなければならないが、スコアベースの拡散のサンプリングコストが高いため、その効率は制限されている。
本研究では,サンプル仮説を積極的に評価しながら,カテゴリレベルの6次元オブジェクトポーズ生成を高速化する新しいフレームワーク RFM-Pose を提案する。
サンプリング効率を向上させるために,フローマッチング生成モデルを採用し,ポーズ分布の単純な前から最適な輸送経路に沿ってポーズ候補を生成する。
これらの候補をさらに洗練するために、フローマッチングサンプリングプロセスをマルコフ決定プロセスとして使用し、サンプリングポリシーを微調整するために近似ポリシー最適化を適用した。
特に、フローフィールドを学習可能なポリシとして解釈し、推定器を値ネットワークにマッピングすることで、強化学習フレームワーク内でのポーズ生成と仮説のスコアリングを共同で最適化することができる。
REAL275ベンチマークの実験では、RAM-Poseは計算コストを大幅に削減し、良好な性能を発揮することが示された。
さらに,従来の研究と同様,提案手法はオブジェクトのポーズ追跡に容易に適用でき,この設定における競合的な結果を得ることができる。
関連論文リスト
- Aligning Latent Spaces with Flow Priors [72.24305287508474]
本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。
特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文 参考訳(メタデータ) (2025-06-05T16:59:53Z) - Efficient Safety Alignment of Large Language Models via Preference Re-ranking and Representation-based Reward Modeling [84.00480999255628]
大規模言語モデル(LLM)の安全性アライメントのための強化学習アルゴリズムは,分散シフトの課題に直面している。
現在のアプローチでは、ターゲットポリシーからのオンラインサンプリングを通じてこの問題に対処するのが一般的である。
モデル固有の安全判断能力を活用して報酬信号を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-13T06:40:34Z) - Can foundation models actively gather information in interactive environments to test hypotheses? [43.42688356541211]
基礎モデルはシングルターン推論において優れているが、動的環境におけるマルチターン探索に苦慮している。
これらのモデルを,経験から学び,適応し,情報を収集する能力に基づいて評価した。
論文 参考訳(メタデータ) (2024-12-09T12:27:21Z) - GenPose: Generative Category-level Object Pose Estimation via Diffusion
Models [5.1998359768382905]
カテゴリーレベルのオブジェクトポーズ推定を条件付き生成モデルとして再検討することで,新しい解を提案する。
提案手法は,厳密な5d2cmおよび5d5cmの計測値に対して50%と60%を越え,REAL275データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-18T11:45:42Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。