論文の概要: 2K Retrofit: Entropy-Guided Efficient Sparse Refinement for High-Resolution 3D Geometry Prediction
- arxiv url: http://arxiv.org/abs/2603.19964v1
- Date: Fri, 20 Mar 2026 14:05:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.163928
- Title: 2K Retrofit: Entropy-Guided Efficient Sparse Refinement for High-Resolution 3D Geometry Prediction
- Title(参考訳): 2Kリトロフィ:高分解能3次元幾何予測のためのエントロピー誘導高効率スパース微細化
- Authors: Tianbao Zhang, Zhenyu Liang, Zhenbo Song, Nana Wang, Xiaomei Zhang, Xudong Cai, Zheng Zhu, Kejian Wu, Gang Wang, Zhaoxin Fan,
- Abstract要約: 2K Retrofitは、任意の幾何学的基礎モデルに対して効率的な2K分解能推論を可能にする新しいフレームワークである。
提案手法は, 高速粗い予測とエントロピーに基づくスパース改良を選択的に活用し, 高不確かさ領域を向上する。
広範に使用されているベンチマーク実験により、2K Retrofit が常に最先端の精度と速度を達成することが示された。
- 参考スコア(独自算出の注目度): 38.02331315557929
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: High-resolution geometric prediction is essential for robust perception in autonomous driving, robotics, and AR/MR, but current foundation models are fundamentally limited by their scalability to real-world, high-resolution scenarios. Direct inference on 2K images with these models incurs prohibitive computational and memory demands, making practical deployment challenging. To tackle the issue, we present 2K Retrofit, a novel framework that enables efficient 2K-resolution inference for any geometric foundation model, without modifying or retraining the backbone. Our approach leverages fast coarse predictions and an entropy-based sparse refinement to selectively enhance high-uncertainty regions, achieving precise and high-fidelity 2K outputs with minimal overhead. Extensive experiments on widely used benchmark demonstrate that 2K Retrofit consistently achieves state-of-the-art accuracy and speed, bridging the gap between research advances and scalable deployment in high-resolution 3D vision applications. Code will be released upon acceptance.
- Abstract(参考訳): 高解像度の幾何学的予測は、自律運転、ロボティクス、AR/MRの堅牢な認識に不可欠であるが、現在の基礎モデルは、そのスケーラビリティから現実の高解像度シナリオへの拡張性によって根本的に制限されている。
これらのモデルによる2K画像の直接推論は、計算とメモリの要求を禁止し、実用的な配置を困難にしている。
そこで本研究では,任意の幾何学的基礎モデルに対して,背骨の変形や再トレーニングを伴わずに,効率的な2K分解能推論を可能にする新しいフレームワークである2K Retrofitを提案する。
提案手法は,高速粗い予測とエントロピーに基づくスパース改良を利用して,高不確かさ領域を選択的に拡張し,オーバーヘッドを最小限に抑えた高精度かつ高忠実な2K出力を実現する。
広範に使用されているベンチマーク実験により、2K Retrofitは最先端の精度とスピードを一貫して達成し、高解像度の3Dビジョンアプリケーションにおける研究の進歩とスケーラブルな展開のギャップを埋めることを示した。
コードは受理時にリリースされる。
関連論文リスト
- GauSSmart: Enhanced 3D Reconstruction through 2D Foundation Models and Geometric Filtering [50.675710727721786]
2次元基礎モデルと3次元ガウススプラッティング再構成をブリッジするハイブリッド手法であるGauSSmartを提案する。
提案手法は,凸フィルタリングや意味的特徴監視など,確立した2次元コンピュータビジョン技術を統合している。
GauSSmartは既存のGaussian Splattingよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-10-16T03:38:26Z) - H3R: Hybrid Multi-view Correspondence for Generalizable 3D Reconstruction [39.22287224290769]
H3Rは、潜在融合と注目に基づく機能集約を統合するハイブリッドフレームワークである。
両パラダイムを統合することで,既存手法よりも2$times$高速に収束しながら,一般化が促進される。
本手法は,ロバストなクロスデータセットの一般化を実証しながら,可変数および高分解能な入力ビューをサポートする。
論文 参考訳(メタデータ) (2025-08-05T05:56:30Z) - Ultra-Resolution Adaptation with Ease [62.56434979517156]
我々は,EmphURAEと呼ばれる超高分解能適応のための重要なガイドラインのセットを提案する。
重み行列の小さな成分のチューニングは、合成データが利用できない場合に広く使用される低ランクアダプタよりも優れていることを示す。
URAEは、FLUX1.1[Pro] Ultraのような最先端のクローズドソースモデルに匹敵する2K世代の性能を達成している。
論文 参考訳(メタデータ) (2025-03-20T16:44:43Z) - GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文 参考訳(メタデータ) (2024-12-12T17:59:03Z) - Occlusion-Robust Object Pose Estimation with Holistic Representation [42.27081423489484]
State-of-the-art(SOTA)オブジェクトのポーズ推定器は2段階のアプローチを取る。
我々は,新しいブロック・アンド・ブラックアウトバッチ拡張技術を開発した。
また,総合的なポーズ表現学習を促進するためのマルチ精度監視アーキテクチャも開発している。
論文 参考訳(メタデータ) (2021-10-22T08:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。