論文の概要: RFM-Pose:Reinforcement-Guided Flow Matching for Fast Category-Level 6D Pose Estimation
- arxiv url: http://arxiv.org/abs/2602.05257v1
- Date: Thu, 05 Feb 2026 03:26:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.741665
- Title: RFM-Pose:Reinforcement-Guided Flow Matching for Fast Category-Level 6D Pose Estimation
- Title(参考訳): RFM-Pose:Reinforcement-Guided Flow Matching for Fast Category-Level 6D Pose Estimation
- Authors: Diya He, Qingchen Liu, Cong Zhang, Jiahu Qin,
- Abstract要約: 我々は,サンプル仮説を積極的に評価しながら,カテゴリレベルの6次元オブジェクトポーズ生成を加速する新しいフレームワーク RFM-Pose を提案する。
REAL275ベンチマークの実験では、RAM-Poseは計算コストを大幅に削減し、良好な性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 8.3336796041978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object pose estimation is a fundamental problem in computer vision and plays a critical role in virtual reality and embodied intelligence, where agents must understand and interact with objects in 3D space. Recently, score based generative models have to some extent solved the rotational symmetry ambiguity problem in category level pose estimation, but their efficiency remains limited by the high sampling cost of score-based diffusion. In this work, we propose a new framework, RFM-Pose, that accelerates category-level 6D object pose generation while actively evaluating sampled hypotheses. To improve sampling efficiency, we adopt a flow-matching generative model and generate pose candidates along an optimal transport path from a simple prior to the pose distribution. To further refine these candidates, we cast the flow-matching sampling process as a Markov decision process and apply proximal policy optimization to fine-tune the sampling policy. In particular, we interpret the flow field as a learnable policy and map an estimator to a value network, enabling joint optimization of pose generation and hypothesis scoring within a reinforcement learning framework. Experiments on the REAL275 benchmark demonstrate that RFM-Pose achieves favorable performance while significantly reducing computational cost. Moreover, similar to prior work, our approach can be readily adapted to object pose tracking and attains competitive results in this setting.
- Abstract(参考訳): オブジェクトのポーズ推定はコンピュータビジョンの基本的な問題であり、エージェントが3D空間のオブジェクトを理解し、対話しなければならない仮想現実や具現化インテリジェンスにおいて重要な役割を果たす。
近年、スコアベースの生成モデルは、カテゴリレベルのポーズ推定において、回転対称性の曖昧さをある程度解決しなければならないが、スコアベースの拡散のサンプリングコストが高いため、その効率は制限されている。
本研究では,サンプル仮説を積極的に評価しながら,カテゴリレベルの6次元オブジェクトポーズ生成を高速化する新しいフレームワーク RFM-Pose を提案する。
サンプリング効率を向上させるために,フローマッチング生成モデルを採用し,ポーズ分布の単純な前から最適な輸送経路に沿ってポーズ候補を生成する。
これらの候補をさらに洗練するために、フローマッチングサンプリングプロセスをマルコフ決定プロセスとして使用し、サンプリングポリシーを微調整するために近似ポリシー最適化を適用した。
特に、フローフィールドを学習可能なポリシとして解釈し、推定器を値ネットワークにマッピングすることで、強化学習フレームワーク内でのポーズ生成と仮説のスコアリングを共同で最適化することができる。
REAL275ベンチマークの実験では、RAM-Poseは計算コストを大幅に削減し、良好な性能を発揮することが示された。
さらに,従来の研究と同様,提案手法はオブジェクトのポーズ追跡に容易に適用でき,この設定における競合的な結果を得ることができる。
関連論文リスト
- Unbiased Dynamic Pruning for Efficient Group-Based Policy Optimization [60.87651283510059]
Group Relative Policy Optimization (GRPO) はLLM推論を効果的にスケールするが、計算コストは禁じている。
本研究では,非バイアス勾配推定を保ちながら動的プルーニングを可能にする動的プルーニングポリシー最適化(DPPO)を提案する。
刈り込みによって引き起こされるデータの空間性を軽減するため,ウィンドウベースの欲求戦略であるDense Prompt Packingを導入する。
論文 参考訳(メタデータ) (2026-03-04T14:48:53Z) - UniTac2Pose: A Unified Approach Learned in Simulation for Category-level Visuotactile In-hand Pose Estimation [19.042061670329733]
本稿では,手動ポーズ推定のための新しい3段階フレームワークを提案する。
最初の段階では、サンプリングとプレランクのポーズ候補、続いてこれらの候補を反復的に洗練する。
最終段階では、最も可能性の高いポーズ候補を特定するためにポストランクが適用される。
論文 参考訳(メタデータ) (2025-09-19T12:39:31Z) - Aligning Latent Spaces with Flow Priors [72.24305287508474]
本稿では,学習可能な潜在空間を任意の目標分布に整合させるための新しいフレームワークを提案する。
特に,提案手法は計算コストの高い確率評価を排除し,最適化時のODE解決を回避する。
論文 参考訳(メタデータ) (2025-06-05T16:59:53Z) - Efficient Safety Alignment of Large Language Models via Preference Re-ranking and Representation-based Reward Modeling [84.00480999255628]
大規模言語モデル(LLM)の安全性アライメントのための強化学習アルゴリズムは,分散シフトの課題に直面している。
現在のアプローチでは、ターゲットポリシーからのオンラインサンプリングを通じてこの問題に対処するのが一般的である。
モデル固有の安全判断能力を活用して報酬信号を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-13T06:40:34Z) - Can foundation models actively gather information in interactive environments to test hypotheses? [43.42688356541211]
基礎モデルはシングルターン推論において優れているが、動的環境におけるマルチターン探索に苦慮している。
これらのモデルを,経験から学び,適応し,情報を収集する能力に基づいて評価した。
論文 参考訳(メタデータ) (2024-12-09T12:27:21Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - GenPose: Generative Category-level Object Pose Estimation via Diffusion
Models [5.1998359768382905]
カテゴリーレベルのオブジェクトポーズ推定を条件付き生成モデルとして再検討することで,新しい解を提案する。
提案手法は,厳密な5d2cmおよび5d5cmの計測値に対して50%と60%を越え,REAL275データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-18T11:45:42Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - VL4Pose: Active Learning Through Out-Of-Distribution Detection For Pose
Estimation [79.50280069412847]
VL4Poseは、分布外検出によるアクティブな学習のための第一原理的アプローチである。
我々の解は、最大推定により訓練された単純なパラメトリックベイズネットワークを介してポーズをモデル化することを含む。
我々はMPII, LSP, ICVLの3つのデータセットに対して定性的かつ定量的な実験を行い, 人手ポーズ推定を行った。
論文 参考訳(メタデータ) (2022-10-12T09:03:55Z) - Robust Ego and Object 6-DoF Motion Estimation and Tracking [5.162070820801102]
本稿では,動的多体視覚計測における高精度な推定と一貫した追跡性を実現するためのロバストな解を提案する。
セマンティック・インスタンスレベルのセグメンテーションと正確な光フロー推定の最近の進歩を活用して、コンパクトで効果的なフレームワークを提案する。
追従点の品質と運動推定精度を向上させる新しい定式化SE(3)運動と光流が導入された。
論文 参考訳(メタデータ) (2020-07-28T05:12:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。