論文の概要: Geometric Reasoning in the Embedding Space
- arxiv url: http://arxiv.org/abs/2504.02018v1
- Date: Wed, 02 Apr 2025 14:13:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 12:55:55.568946
- Title: Geometric Reasoning in the Embedding Space
- Title(参考訳): 埋め込み空間における幾何学的推論
- Authors: Jan Hůla, David Mojžíšek, Jiří Janeček, David Herel, Mikoláš Janota,
- Abstract要約: グラフニューラルネットとトランスフォーマーは、幾何学的制約について推論することを学ぶことができることを示す。
我々は、制約の集合から離散的な2次元格子内の点の空間的位置を予測するよう訓練する。
また、タスク用に設計したグラフニューラルネットワークは、Transformerよりも大幅に性能が良く、スケールも容易であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In this contribution, we demonstrate that Graph Neural Networks and Transformers can learn to reason about geometric constraints. We train them to predict spatial position of points in a discrete 2D grid from a set of constraints that uniquely describe hidden figures containing these points. Both models are able to predict the position of points and interestingly, they form the hidden figures described by the input constraints in the embedding space during the reasoning process. Our analysis shows that both models recover the grid structure during training so that the embeddings corresponding to the points within the grid organize themselves in a 2D subspace and reflect the neighborhood structure of the grid. We also show that the Graph Neural Network we design for the task performs significantly better than the Transformer and is also easier to scale.
- Abstract(参考訳): このコントリビューションでは、グラフニューラルネットワークとトランスフォーマーが、幾何学的制約について推論することを学ぶことができることを示す。
我々は、これらの点を含む隠蔽図形を一意に記述する制約の集合から、離散2次元格子内の点の空間的位置を予測するよう訓練する。
どちらのモデルも点の位置を予測でき、興味深いことに、推論過程中に埋め込み空間の入力制約によって記述される隠れ図形を形成する。
本分析により, 2つのモデルが訓練中にグリッド構造を復元し, グリッド内の点に対応する埋め込みを2次元部分空間に整理し, グリッドの近傍構造を反映するようにした。
また、タスク用に設計したグラフニューラルネットワークは、Transformerよりも大幅に性能が良く、スケールも容易であることを示す。
関連論文リスト
- GridFormer: Point-Grid Transformer for Surface Reconstruction [37.30776475324579]
我々はGridFormer(GridFormer)という名前のグリッドとポイントの特徴の間に新しい注意機構を導入する。
このメカニズムは、グリッドを空間と点雲を繋ぐ移動点として扱う。
また,差分二項クロスエントロピー損失と境界サンプリングを併用した境界最適化手法を提案する。
論文 参考訳(メタデータ) (2024-01-04T14:31:56Z) - Spherical Frustum Sparse Convolution Network for LiDAR Point Cloud Semantic Segmentation [62.258256483231484]
LiDARポイントクラウドセマンティックセグメンテーションにより、ロボットは周囲の環境のきめ細かいセマンティック情報を得ることができる。
多くの研究が2Dイメージ上にポイントクラウドを投影し、LiDARポイントクラウドセマンティックセグメンテーションのための2D畳み込みニューラルネットワーク(CNN)またはビジョントランスフォーマーを採用する。
本稿では,情報損失の定量化を回避するために,新しい球状フラストラム構造を提案する。
論文 参考訳(メタデータ) (2023-11-29T09:55:13Z) - Shape-Graph Matching Network (SGM-net): Registration for Statistical
Shape Analysis [20.58923754314197]
本稿では,形状グラフと呼ばれるデータオブジェクトの形状の統計的解析に着目する。
ここでの重要なニーズは、オブジェクト間のポイント(ノードからノード、エッジからエッジ)の制限された登録である。
本稿では,ニューラルネットアーキテクチャを用いて,この登録問題に対処する。
論文 参考訳(メタデータ) (2023-08-14T00:42:03Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - A singular Riemannian geometry approach to Deep Neural Networks II.
Reconstruction of 1-D equivalence classes [78.120734120667]
入力空間における出力多様体内の点の事前像を構築する。
我々は、n-次元実空間から(n-1)-次元実空間へのニューラルネットワークマップの場合の簡易性に焦点をあてる。
論文 参考訳(メタデータ) (2021-12-17T11:47:45Z) - Dual Geometric Graph Network (DG2N) -- Iterative network for deformable
shape alignment [8.325327265120283]
局所的特徴が写像確率である双対グラフ構造を用いて幾何学的モデルを整列する新しい手法を提案する。
メッシュと点の雲の高速で安定な解における伸縮性ドメインのアライメントに関する技術成果を報告する。
論文 参考訳(メタデータ) (2020-11-30T12:03:28Z) - Primal-Dual Mesh Convolutional Neural Networks [62.165239866312334]
本稿では,グラフ・ニューラル・ネットワークの文献からトライアングル・メッシュへ引き起こされた原始双対のフレームワークを提案する。
提案手法は,3次元メッシュのエッジと顔の両方を入力として特徴付け,動的に集約する。
メッシュ単純化の文献から得られたツールを用いて、我々のアプローチに関する理論的知見を提供する。
論文 参考訳(メタデータ) (2020-10-23T14:49:02Z) - node2coords: Graph Representation Learning with Wasserstein Barycenters [59.07120857271367]
グラフの表現学習アルゴリズムである node2coords を導入する。
低次元空間を同時に学習し、その空間内のノードを座標する。
実験の結果,node2coordで学習した表現は解釈可能であることがわかった。
論文 参考訳(メタデータ) (2020-07-31T13:14:25Z) - Cylindrical Convolutional Networks for Joint Object Detection and
Viewpoint Estimation [76.21696417873311]
3次元空間で定義された畳み込みカーネルの円筒形表現を利用する学習可能なモジュールである円筒型畳み込みネットワーク(CCN)を導入する。
CCNはビュー固有の畳み込みカーネルを通してビュー固有の特徴を抽出し、各視点におけるオブジェクトカテゴリスコアを予測する。
本実験は,円柱状畳み込みネットワークが関節物体の検出と視点推定に与える影響を実証する。
論文 参考訳(メタデータ) (2020-03-25T10:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。