論文の概要: GeometricImageNet: Extending convolutional neural networks to vector and
tensor images
- arxiv url: http://arxiv.org/abs/2305.12585v1
- Date: Sun, 21 May 2023 22:44:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 19:26:25.500692
- Title: GeometricImageNet: Extending convolutional neural networks to vector and
tensor images
- Title(参考訳): Geometric ImageNet: 畳み込みニューラルネットワークをベクトルおよびテンソル画像に拡張
- Authors: Wilson Gregory, David W. Hogg, Ben Blum-Smith, Maria Teresa Arias,
Kaze W. K. Wong, Soledad Villar
- Abstract要約: GeometricImageNetは、外部積、テンソルインデックスの縮小、テンソルインデックスの置換との畳み込みの一般化である。
数値実験により,GeometricImageNetはシミュレーション物理系に優れた一般化が得られた。
このツールは、例えば宇宙論や海洋力学など、科学と工学の機械学習にとって価値のあるものになるだろう。
- 参考スコア(独自算出の注目度): 6.540771405203322
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional neural networks and their ilk have been very successful for
many learning tasks involving images. These methods assume that the input is a
scalar image representing the intensity in each pixel, possibly in multiple
channels for color images. In natural-science domains however, image-like data
sets might have vectors (velocity, say), tensors (polarization, say),
pseudovectors (magnetic field, say), or other geometric objects in each pixel.
Treating the components of these objects as independent channels in a CNN
neglects their structure entirely. Our formulation -- the GeometricImageNet --
combines a geometric generalization of convolution with outer products, tensor
index contractions, and tensor index permutations to construct geometric-image
functions of geometric images that use and benefit from the tensor structure.
The framework permits, with a very simple adjustment, restriction to function
spaces that are exactly equivariant to translations, discrete rotations, and
reflections. We use representation theory to quantify the dimension of the
space of equivariant polynomial functions on 2-dimensional vector images. We
give partial results on the expressivity of GeometricImageNet on small images.
In numerical experiments, we find that GeometricImageNet has good
generalization for a small simulated physics system, even when trained with a
small training set. We expect this tool will be valuable for scientific and
engineering machine learning, for example in cosmology or ocean dynamics.
- Abstract(参考訳): 畳み込みニューラルネットワークとそのイルクは、画像を含む多くの学習タスクで非常に成功した。
これらの方法は、入力が各ピクセルの強度を表すスカラー画像であると仮定し、色画像の複数のチャネルで表現する。
しかし、自然科学領域では、画像のようなデータセットはベクトル(速度など)、テンソル(分極など)、擬ベクトル(磁場など)、その他の幾何学的対象を各ピクセルに持つことがある。
これらのオブジェクトのコンポーネントをCNNの独立したチャネルとして扱うことは、その構造を完全に無視する。
我々の定式化(gemetryimagenet)は、外積との畳み込みの幾何学的一般化、テンソル指数の縮小、テンソル構造の恩恵を受ける幾何学的イメージの幾何学的イメージ関数を構成するテンソル指数の置換を組み合わせる。
この枠組みは、非常に単純な調整で、変換、離散回転、反射と完全に同値な函数空間の制限を許す。
表現理論を用いて2次元ベクトル画像上の同変多項式関数の空間の次元を定量化する。
小画像上でGeometric ImageNetの表現性に関する部分的な結果を与える。
数値実験では,GeometricImageNetは,小さなトレーニングセットでトレーニングした場合であっても,小さなシミュレーション物理系に対して優れた一般化が可能であることがわかった。
このツールは、例えば宇宙論や海洋力学など、科学と工学の機械学習にとって価値のあるものになるだろう。
関連論文リスト
- Simplicial Representation Learning with Neural $k$-Forms [14.566552361705499]
本稿では,ノード座標を用いて,$mathbbRn$に埋め込まれた単体錯体から得られる幾何学的情報を活用することに焦点を当てる。
我々は mathbbRn の微分 k-形式を用いて単純化の表現を作成し、メッセージパッシングなしに解釈可能性と幾何学的整合性を提供する。
本手法は, グラフ, simplicial Complex, セルコンプレックスなど, 様々な入力コンプレックスに適用可能である。
論文 参考訳(メタデータ) (2023-12-13T21:03:39Z) - A Hitchhiker's Guide to Geometric GNNs for 3D Atomic Systems [87.30652640973317]
原子系の計算モデリングの最近の進歩は、これらを3次元ユークリッド空間のノードとして埋め込まれた原子を含む幾何学的グラフとして表現している。
Geometric Graph Neural Networksは、タンパク質構造予測から分子シミュレーション、物質生成まで、幅広い応用を駆動する機械学習アーキテクチャとして好まれている。
本稿では,3次元原子システムのための幾何学的GNNの分野について,包括的で自己完結した概要を述べる。
論文 参考訳(メタデータ) (2023-12-12T18:44:19Z) - Geometric Clifford Algebra Networks [53.456211342585824]
本稿では,動的システムのモデリングのためのGeometric Clifford Algebra Networks (GCANs)を提案する。
GCANは幾何学的(クリフォード)代数を用いた対称性群変換に基づいている。
論文 参考訳(メタデータ) (2023-02-13T18:48:33Z) - Prediction of Geometric Transformation on Cardiac MRI via Convolutional
Neural Network [13.01021780124613]
画像に適用される幾何学的変換を認識するために,ConvNetsを訓練して医用画像の特徴を学習することを提案する。
幾何学的変換を容易に予測できる簡単な自己教師型タスクを提案する。
論文 参考訳(メタデータ) (2022-11-12T11:29:14Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - A singular Riemannian geometry approach to Deep Neural Networks II.
Reconstruction of 1-D equivalence classes [78.120734120667]
入力空間における出力多様体内の点の事前像を構築する。
我々は、n-次元実空間から(n-1)-次元実空間へのニューラルネットワークマップの場合の簡易性に焦点をあてる。
論文 参考訳(メタデータ) (2021-12-17T11:47:45Z) - OSLO: On-the-Sphere Learning for Omnidirectional images and its
application to 360-degree image compression [59.58879331876508]
全方向画像の表現モデルの学習について検討し、全方向画像の深層学習モデルで使用される数学的ツールを再定義するために、HEALPixの球面一様サンプリングの特性を利用することを提案する。
提案したオン・ザ・スフィア・ソリューションは、等方形画像に適用された類似の学習モデルと比較して、13.7%のビットレートを節約できる圧縮ゲインを向上させる。
論文 参考訳(メタデータ) (2021-07-19T22:14:30Z) - The Intrinsic Dimension of Images and Its Impact on Learning [60.811039723427676]
自然画像データは従来の画素表現の高次元にもかかわらず低次元構造を示すと広く信じられている。
本研究では,一般的なデータセットに次元推定ツールを適用し,深層学習における低次元構造の役割を検討する。
論文 参考訳(メタデータ) (2021-04-18T16:29:23Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - Learning Geometry-Dependent and Physics-Based Inverse Image
Reconstruction [9.565653662306806]
本稿では,その基盤となる幾何学と物理を活かした逆画像の学習手法を提案する。
まず,未知変数と計測変数を記述可能な非ユークリッド符号化復号ネットワークを提案する。
次に、2つの領域間の幾何依存物理学を2部グラフで明示的にモデル化することで学習する。
論文 参考訳(メタデータ) (2020-07-18T21:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。