論文の概要: Advances in Global Solvers for 3D Vision
- arxiv url: http://arxiv.org/abs/2602.14662v1
- Date: Mon, 16 Feb 2026 11:40:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.384634
- Title: Advances in Global Solvers for 3D Vision
- Title(参考訳): 3次元ビジョンのためのグローバル・ソリューションの進歩
- Authors: Zhenjun Zhao, Heng Yang, Bangyan Liao, Yingping Zeng, Shaocheng Yan, Yingdong Gu, Peidong Liu, Yi Zhou, Haoang Li, Javier Civera,
- Abstract要約: グローバル・ソルバは3次元幾何学的推定問題の強力なパラダイムとして登場した。
3つのコアパラダイム: Branch-and-Bound(BnB)、Convex Relaxation(CR)、Convexity(NC)
この調査は、現実世界のアプリケーションに対する信頼できる認識に向けて、統一された視点とロードマップを提供する。
- 参考スコア(独自算出の注目度): 35.87338485756263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Global solvers have emerged as a powerful paradigm for 3D vision, offering certifiable solutions to nonconvex geometric optimization problems traditionally addressed by local or heuristic methods. This survey presents the first systematic review of global solvers in geometric vision, unifying the field through a comprehensive taxonomy of three core paradigms: Branch-and-Bound (BnB), Convex Relaxation (CR), and Graduated Non-Convexity (GNC). We present their theoretical foundations, algorithmic designs, and practical enhancements for robustness and scalability, examining how each addresses the fundamental nonconvexity of geometric estimation problems. Our analysis spans ten core vision tasks, from Wahba problem to bundle adjustment, revealing the optimality-robustness-scalability trade-offs that govern solver selection. We identify critical future directions: scaling algorithms while maintaining guarantees, integrating data-driven priors with certifiable optimization, establishing standardized benchmarks, and addressing societal implications for safety-critical deployment. By consolidating theoretical foundations, practical advances, and broader impacts, this survey provides a unified perspective and roadmap toward certifiable, trustworthy perception for real-world applications. A continuously-updated literature summary and companion code tutorials are available at https://github.com/ericzzj1989/Awesome-Global-Solvers-for-3D-Vision.
- Abstract(参考訳): グローバル・ソルバは3次元視覚の強力なパラダイムとして登場し、局所的あるいはヒューリスティックな方法で伝統的に解決されてきた非凸幾何学的最適化問題に対する証明可能な解決策を提供している。
本調査では,3つのコアパラダイム(BnB),Convex Relaxation(CR),Compleced Non-Convexity(GNC))を包括的に分類することで,幾何学的視界におけるグローバル・ソルバの体系的レビューを行う。
本稿では, それらの理論的基礎, アルゴリズム設計, およびロバスト性およびスケーラビリティの実践的拡張について, 幾何推定問題の基本的な非凸性にどのように対処するかを考察する。
我々の分析は、ワフバ問題からバンドル調整までの10のコアビジョンタスクにまたがっており、ソルバ選択を管理する最適性-ロバスト性-スケール性トレードオフを明らかにしている。
保証を維持しながらアルゴリズムをスケーリングし、データ駆動の事前を認証可能な最適化に統合し、標準化されたベンチマークを確立し、安全クリティカルなデプロイメントに対する社会的影響に対処する。
理論的基盤、実践的進歩、そしてより広範な影響を統合することで、この調査は現実世界のアプリケーションに対して、証明可能で信頼できる認識への統一された視点とロードマップを提供する。
継続的に更新された文献の要約とチュートリアルはhttps://github.com/ericzzj1989/Awesome-Global-Solvers-for-3D-Visionで公開されている。
関連論文リスト
- GeoBench: Rethinking Multimodal Geometric Problem-Solving via Hierarchical Evaluation [48.04396968707237]
幾何学的問題解決における4つの推論レベルを特徴とする階層型ベンチマークであるGeoBenchを提案する。
属性抽出から論理的誤り訂正まで,様々な機能を体系的に評価する。
これらの結果はGeoBenchを総合的なベンチマークとして確立し、幾何学的問題解決システムを開発するための実用的なガイドラインを提供する。
論文 参考訳(メタデータ) (2025-12-30T09:56:37Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - Explainable Swarm: A Methodological Framework for Interpreting Swarm Intelligence [5.095351428807715]
本研究は、人気のあるSwarmアルゴリズムの1つであるParticle Swarm Optimizationについて、多面的な解釈可能性に関する調査を行う。
我々は、新しい機械学習アプローチを用いて、PSOにおける様々なトポロジとパラメータの役割を解釈可能で説明可能なフレームワークを提供する。
この研究は、Swarmトポロジが情報の流れ、多様性、収束にどのように影響するかを解読することに成功した。
論文 参考訳(メタデータ) (2025-09-08T01:39:32Z) - Alignment and Safety in Large Language Models: Safety Mechanisms, Training Paradigms, and Emerging Challenges [47.14342587731284]
本調査では,大規模言語モデル(LLM)アライメントにおけるアライメント手法,トレーニングプロトコル,経験的発見について概観する。
我々は多種多様なパラダイムをまたいだアライメント手法の開発を分析し、コアアライメント目標間の基本的なトレードオフを特徴づける。
我々は、直接選好最適化(DPO)、構成AI、脳インスパイアされた方法、アライメント不確実性定量化(AUQ)など、最先端技術について議論する。
論文 参考訳(メタデータ) (2025-07-25T20:52:58Z) - Unified Domain Generalization and Adaptation for Multi-View 3D Object Detection [14.837853049121687]
マルチビューカメラを利用した3次元物体検出は, 視覚課題における実用的, 経済的価値を実証した。
典型的な教師付き学習アプローチは、目に見えない、ラベルなしのターゲットデータセットに対する満足な適応を達成する上で、課題に直面します。
本稿では、これらの欠点を軽減するための実践的なソリューションとして、統一ドメイン一般化・適応(UDGA)を提案する。
論文 参考訳(メタデータ) (2024-10-29T18:51:49Z) - GARNet: Global-Aware Multi-View 3D Reconstruction Network and the
Cost-Performance Tradeoff [10.8606881536924]
本稿では,各ブランチとグローバル間の相関関係を構築し,重み付け推論の包括的基盤を提供する,グローバルアウェアアテンションベースの融合手法を提案する。
ネットワークの能力を高めるために,ネットワーク全体の形状を監督する新たな損失関数を導入する。
ShapeNetの実験により,本手法が既存のSOTA法より優れていることを確認した。
論文 参考訳(メタデータ) (2022-11-04T07:45:19Z) - A Survey of Trustworthy Graph Learning: Reliability, Explainability, and
Privacy Protection [136.71290968343826]
信頼できるグラフ学習(TwGL)は、技術的観点から上記の問題を解決することを目的としている。
モデル性能を主に重視する従来のグラフ学習研究とは対照的に、TwGLは様々な信頼性と安全性を考慮に入れている。
論文 参考訳(メタデータ) (2022-05-20T08:10:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。