論文の概要: Geometric Constraints in Deep Learning Frameworks: A Survey
- arxiv url: http://arxiv.org/abs/2403.12431v1
- Date: Tue, 19 Mar 2024 04:41:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 15:22:07.554038
- Title: Geometric Constraints in Deep Learning Frameworks: A Survey
- Title(参考訳): ディープラーニングフレームワークにおける幾何学的制約:サーベイ
- Authors: Vibhas K Vats, David J Crandall,
- Abstract要約: ステレオフォトグラム法はシーン理解の新たな技術である。
幾何ベースのフレームワークと深層学習ベースのフレームワークの重複について検討する。
本稿では、現代のディープラーニングフレームワークで使用される制約を規定する、一般的な幾何学のための新しい分類法を提案する。
- 参考スコア(独自算出の注目度): 12.021629185200807
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Stereophotogrammetry is an emerging technique of scene understanding. Its origins go back to at least the 1800s when people first started to investigate using photographs to measure the physical properties of the world. Since then, thousands of approaches have been explored. The classic geometric techniques of Shape from Stereo is built on using geometry to define constraints on scene and camera geometry and then solving the non-linear systems of equations. More recent work has taken an entirely different approach, using end-to-end deep learning without any attempt to explicitly model the geometry. In this survey, we explore the overlap for geometric-based and deep learning-based frameworks. We compare and contrast geometry enforcing constraints integrated into a deep learning framework for depth estimation or other closely related problems. We present a new taxonomy for prevalent geometry enforcing constraints used in modern deep learning frameworks. We also present insightful observations and potential future research directions.
- Abstract(参考訳): ステレオフォトグラム法はシーン理解の新たな技術である。
起源は1800年代まで遡り、人々が世界の物理的特性を測定するために写真を使って調査を始めた。
それ以来、何千ものアプローチが検討されている。
Stereoの形状の古典的な幾何学的技法は、幾何学を用いてシーン幾何学とカメラ幾何学の制約を定義し、方程式の非線形系を解く。
より最近の研究は、幾何学を明示的にモデル化することなしに、エンドツーエンドのディープラーニングを使用して、まったく異なるアプローチを取っている。
本稿では,幾何学ベースのフレームワークと深層学習ベースのフレームワークの重複について検討する。
我々は、深度推定や他の密接に関連する問題に対して、制約を深層学習フレームワークに統合した幾何を比較し、対比する。
本稿では、現代のディープラーニングフレームワークで使用される制約を規定する、一般的な幾何学のための新しい分類法を提案する。
また、洞察に富んだ観察と今後の研究の方向性を示す。
関連論文リスト
- Diagram Formalization Enhanced Multi-Modal Geometry Problem Solver [11.69164802295844]
視覚的特徴,幾何学的形式言語,自然言語表現を統合した新しいフレームワークを提案する。
本稿では,新しい合成データ手法を提案し,形式的および自然言語のキャプションを付加した大規模幾何データセットSynthGeo228Kを提案する。
我々のフレームワークは,MLLMの幾何学図処理能力を改善し,フォーマルなgeo7kデータセット上のオープンなタスクに応用範囲を広げる。
論文 参考訳(メタデータ) (2024-09-06T12:11:06Z) - Geometry-guided Feature Learning and Fusion for Indoor Scene Reconstruction [14.225228781008209]
本稿では3次元シーン再構成のための新しい幾何学的統合機構を提案する。
提案手法は,特徴学習,特徴融合,ネットワーク監視という3段階の3次元幾何学を取り入れている。
論文 参考訳(メタデータ) (2024-08-28T08:02:47Z) - Beyond Euclid: An Illustrated Guide to Modern Machine Learning with Geometric, Topological, and Algebraic Structures [3.5357133304100326]
現代の機械学習は、本質的に非ユークリッド的なリッチな構造化されたデータに遭遇する。
そのような非ユークリッドデータから知識を抽出するには、より広範な数学的視点が必要である。
我々は最近の進歩を直感的な統合フレームワークに統合するグラフィカルな分類法を提案する。
論文 参考訳(メタデータ) (2024-07-12T17:48:36Z) - Adaptive Surface Normal Constraint for Geometric Estimation from Monocular Images [56.86175251327466]
本稿では,幾何学的文脈を取り入れつつ,画像から深度や表面正規度などの測地を学習するための新しい手法を提案する。
提案手法は,入力画像に存在する幾何学的変動を符号化した幾何学的文脈を抽出し,幾何的制約と深度推定を相関付ける。
本手法は,画像から高品質な3次元形状を生成可能な密着型フレームワーク内での深度と表面の正規分布推定を統一する。
論文 参考訳(メタデータ) (2024-02-08T17:57:59Z) - Exploring Data Geometry for Continual Learning [64.4358878435983]
非定常データストリームのデータ幾何を探索することにより,新しい視点から連続学習を研究する。
提案手法は,新しいデータによって引き起こされる幾何構造に対応するために,基底空間の幾何学を動的に拡張する。
実験により,本手法はユークリッド空間で設計したベースライン法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2023-04-08T06:35:25Z) - Geoclidean: Few-Shot Generalization in Euclidean Geometry [36.203651858533]
ユークリッド幾何学は数学的思考の最も初期の形態の一つである。
自然画像で訓練されたコンピュータビジョンモデルはユークリッド幾何学と同じ感度を示すのだろうか?
ユークリッド幾何学のためのドメイン固有言語であるGeoclideanを紹介する。
論文 参考訳(メタデータ) (2022-11-30T01:17:22Z) - Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges [50.22269760171131]
過去10年間、データサイエンスと機械学習の実験的な革命が、ディープラーニングの手法によって生まれた。
このテキストは、統一幾何学的原理によって事前に定義された規則性を公開することに関するものである。
CNN、RNN、GNN、Transformersなど、最も成功したニューラルネットワークアーキテクチャを研究するための一般的な数学的フレームワークを提供する。
論文 参考訳(メタデータ) (2021-04-27T21:09:51Z) - DSG-Net: Learning Disentangled Structure and Geometry for 3D Shape
Generation [98.96086261213578]
DSG-Netは3次元形状の非交叉構造と幾何学的メッシュ表現を学習するディープニューラルネットワークである。
これは、幾何(構造)を不変に保ちながら構造(幾何学)のような不整合制御を持つ新しい形状生成アプリケーションの範囲をサポートする。
本手法は,制御可能な生成アプリケーションだけでなく,高品質な合成形状を生成できる。
論文 参考訳(メタデータ) (2020-08-12T17:06:51Z) - Deep Geometric Texture Synthesis [83.9404865744028]
幾何学的テクスチャを合成するための新しい枠組みを提案する。
単一の参照3Dモデルの局所的な近傍からテクスチャ統計を学習する。
我々のネットワークはメッシュ頂点を任意の方向に変位させ、幾何学的テクスチャの合成を可能にする。
論文 参考訳(メタデータ) (2020-06-30T19:36:38Z) - Consistent Video Depth Estimation [57.712779457632024]
モノクロ映像中の全画素に対して, 密度, 幾何的に整合した深度を再構成するアルゴリズムを提案する。
動画中の画素の幾何的制約を確立するために、従来の動きから再構成した構造を利用する。
我々のアルゴリズムは、手持ちの映像をある程度のダイナミックな動きで処理することができる。
論文 参考訳(メタデータ) (2020-04-30T17:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。