論文の概要: COG: Confidence-aware Optimal Geometric Correspondence for Unsupervised Single-reference Novel Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2603.00493v1
- Date: Sat, 28 Feb 2026 06:23:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.226337
- Title: COG: Confidence-aware Optimal Geometric Correspondence for Unsupervised Single-reference Novel Object Pose Estimation
- Title(参考訳): COG: Unsupervised Single-Reference Novel Object Pose Estimationのための信頼度を考慮した最適幾何対応
- Authors: Yuchen Che, Jingtu Wu, Hao Zheng, Asako Kanezaki,
- Abstract要約: 信頼を意識した最適幾何対応(COG)は、信頼を意識した最適輸送問題として対応推定を定式化する教師なしのフレームワークである。
COGは、ポイントワイズ信頼度を予測し、それらを最適な輸送限界として注入することでバランスの取れたソフト対応を生成し、重複しない領域を抑える。
実験により、教師なしCOGは教師付きメソッドに匹敵する性能を示し、教師付きCOGはそれらを上回る性能を示す。
- 参考スコア(独自算出の注目度): 11.409666919754747
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating the 6DoF pose of a novel object with a single reference view is challenging due to occlusions, view-point changes, and outliers. A core difficulty lies in finding robust cross-view correspondences, as existing methods often rely on discrete one-to-one matching that is non-differentiable and tends to collapse onto sparse key-points. We propose Confidence-aware Optimal Geometric Correspondence (COG), an unsupervised framework that formulates correspondence estimation as a confidence-aware optimal transport problem. COG produces balanced soft correspondences by predicting point-wise confidences and injecting them as optimal transport marginals, suppressing non-overlapping regions. Semantic priors from vision foundation models further regularize the correspondences, leading to stable pose estimation. This design integrates confidence into the correspondence finding and pose estimation pipeline, enabling unsupervised learning. Experiments show unsupervised COG achieves comparable performance to supervised methods, and supervised COG outperforms them.
- Abstract(参考訳): 単一の参照ビューで新しいオブジェクトの6DoFのポーズを推定することは、オクルージョン、ビューポイントの変更、アウトリーチのために難しい。
既存の手法は、しばしば非微分可能で、スパースキーポイントに崩壊する傾向にある離散的な1対1マッチングに依存しているため、中核的な困難は、堅牢なクロスビュー対応を見つけることである。
信頼性を考慮した最適幾何対応法(COG)を提案する。
COGは、ポイントワイズ信頼度を予測し、それらを最適な輸送限界として注入することでバランスの取れたソフト対応を生成し、重複しない領域を抑える。
視覚基盤モデルからのセマンティック先行は、さらに対応を規則化し、安定したポーズ推定をもたらす。
この設計は、信頼度を対応探索とポーズ推定パイプラインに統合し、教師なし学習を可能にする。
実験により、教師なしCOGは教師付きメソッドに匹敵する性能を示し、教師付きCOGはそれらを上回る性能を示す。
関連論文リスト
- SURE: Semi-dense Uncertainty-REfined Feature Matching [28.68008638977835]
SUREは、一致と信頼を共同で予測する半密度不確実性再定義マッチングフレームワークである。
我々のアプローチは、軽量な空間融合モジュールとともに、信頼に値する座標回帰のための新しい明らかな頭部を軌道に乗せる。
提案手法は精度と効率の両面で既存の最先端のセミセンスマッチングモデルより一貫して優れている。
論文 参考訳(メタデータ) (2026-03-05T06:53:11Z) - GTS: Inference-Time Scaling of Latent Reasoning with a Learnable Gaussian Thought Sampler [54.10960908347221]
我々は、学習可能な密度から条件付きサンプリングとして潜在思考探索をモデル化し、このアイデアをガウス思想サンプリング(GTS)としてインスタンス化する。
GTSは、連続的推論状態における文脈依存摂動分布を予測し、バックボーンを凍結させながらGRPOスタイルのポリシー最適化を訓練する。
論文 参考訳(メタデータ) (2026-02-15T09:57:47Z) - VI-CuRL: Stabilizing Verifier-Independent RL Reasoning via Confidence-Guided Variance Reduction [55.04308051033549]
RLVR(Reinforcement Learning with Verifiable Rewards)は、LLM(Large Language Models)推論を向上するための主要なパラダイムとして登場した。
モデル固有の信頼性を活用して外部検証から独立したカリキュラムを構築するフレームワークであるVerifier-Independent Curriculum Reinforcement Learning (VI-CuRL)を紹介する。
論文 参考訳(メタデータ) (2026-02-13T03:40:52Z) - CORE: Context-Robust Remasking for Diffusion Language Models [51.59514489363897]
我々は、推論時リビジョンのためのトレーニング不要フレームワークであるContext-Robust Remasking (CORE)を提案する。
静的トークンの確率を信頼するのではなく、COREは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Baseでは、COREは推論とコードベンチマークの間で一貫した改善を行い、計算に適合したベースラインを上回り、MBPPを最大9.2%改善した。
論文 参考訳(メタデータ) (2026-02-04T00:12:30Z) - Invariance on Manifolds: Understanding Robust Visual Representations for Place Recognition [19.200074425090595]
本稿では,2次幾何統計フレームワークを提案する。
提案手法では、固定されたトレーニング済みのバックボーン上に構築されたトレーニング不要のフレームワークを導入し、パラメータ更新なしで強力なゼロショット一般化を実現する。
論文 参考訳(メタデータ) (2026-01-31T18:12:29Z) - Decoupling the Effect of Chain-of-Thought Reasoning: A Human Label Variation Perspective [60.45433515408158]
長いチェーン・オブ・ソート(CoT)がトップオプションの決定的決定要因となるが、あいまいなタスクの粒度分布キャリブレータとして機能しないことを示す。
CoTは分布アライメントを改善するが、CoTの内容によって最終的な精度が決定される。
論文 参考訳(メタデータ) (2026-01-06T16:26:40Z) - Cumulative Consensus Score: Label-Free and Model-Agnostic Evaluation of Object Detectors in Deployment [3.6178660238507843]
オブジェクト検出モデルをデプロイで評価することは難しい。
実環境における検知器の連続的な監視と比較を可能にするラベルフリーメトリックであるCumulative Consensus Score (CCS)を紹介した。
論文 参考訳(メタデータ) (2025-09-16T09:24:37Z) - Consistency Regularisation for Unsupervised Domain Adaptation in Monocular Depth Estimation [15.285720572043678]
整合性に基づく半教師付き学習問題として,単眼深度推定のための教師なし領域適応を定式化する。
複数の拡張ビューにまたがって一貫性を保ちながら、ソースドメイン上の予測を規則化するペアワイズ損失関数を導入する。
実験では, KITTI と NYUv2 の標準深度推定ベンチマークを用いて,最先端の結果を示す。
論文 参考訳(メタデータ) (2024-05-27T23:32:06Z) - Greedy based Value Representation for Optimal Coordination in
Multi-agent Reinforcement Learning [64.05646120624287]
LVDとMVDの結合Q値関数を導出する。
最適な整合性を確保するために、最適なノードは独自のSTNである必要がある。
本手法は,様々なベンチマーク実験において,最先端のベースラインよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-22T08:14:50Z) - Towards Higher-order Topological Consistency for Unsupervised Network
Alignment [41.763907024585926]
完全教師なしネットワークアライメントフレームワークであるHTCを提案する。
提案した高次位相整合性は、エッジ軌道に基づいて定式化される。
エンコーダはマルチビット対応に訓練され、さらに信頼性の高いアンカーリンクを特定するように洗練される。
論文 参考訳(メタデータ) (2022-08-26T07:09:13Z) - Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth
Games: Convergence Analysis under Expected Co-coercivity [49.66890309455787]
本稿では,SGDA と SCO の最終的な収束保証として,期待されるコヒーレンシティ条件を導入し,その利点を説明する。
定常的なステップサイズを用いた場合、両手法の線形収束性を解の近傍に証明する。
我々の収束保証は任意のサンプリングパラダイムの下で保たれ、ミニバッチの複雑さに関する洞察を与える。
論文 参考訳(メタデータ) (2021-06-30T18:32:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。