論文の概要: Algebraic Machine Learning with an Application to Chemistry
- arxiv url: http://arxiv.org/abs/2205.05795v3
- Date: Sat, 17 Feb 2024 00:19:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 07:45:09.833333
- Title: Algebraic Machine Learning with an Application to Chemistry
- Title(参考訳): 代数機械学習と化学への応用
- Authors: Ezzeddine El Sai, Parker Gara, Markus J. Pflaum
- Abstract要約: 我々はスムーズな仮定に頼ることなく、微粒な幾何学的情報をキャプチャする機械学習パイプラインを開発した。
特に,基礎変数の特異点近傍にある点を数値的に検出する手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As datasets used in scientific applications become more complex, studying the
geometry and topology of data has become an increasingly prevalent part of the
data analysis process. This can be seen for example with the growing interest
in topological tools such as persistent homology. However, on the one hand,
topological tools are inherently limited to providing only coarse information
about the underlying space of the data. On the other hand, more geometric
approaches rely predominately on the manifold hypothesis, which asserts that
the underlying space is a smooth manifold. This assumption fails for many
physical models where the underlying space contains singularities.
In this paper we develop a machine learning pipeline that captures fine-grain
geometric information without having to rely on any smoothness assumptions. Our
approach involves working within the scope of algebraic geometry and algebraic
varieties instead of differential geometry and smooth manifolds. In the setting
of the variety hypothesis, the learning problem becomes to find the underlying
variety using sample data. We cast this learning problem into a Maximum A
Posteriori optimization problem which we solve in terms of an eigenvalue
computation. Having found the underlying variety, we explore the use of
Gr\"obner bases and numerical methods to reveal information about its geometry.
In particular, we propose a heuristic for numerically detecting points lying
near the singular locus of the underlying variety.
- Abstract(参考訳): 科学応用で使われるデータセットが複雑化するにつれて、データの幾何学とトポロジを研究することが、データ分析プロセスにおいてますます普及している。
これは例えば、永続ホモロジーのようなトポロジカルツールへの関心が高まる中で見られる。
しかし、トポロジカルツールは本質的に、データの基本空間に関する粗い情報のみを提供することに限られている。
一方、より幾何学的なアプローチは、基礎となる空間が滑らかな多様体であると主張する多様体仮説に優先的に依拠する。
この仮定は、基礎空間が特異点を含む多くの物理モデルに対して失敗する。
本稿では,スムーズな仮定を必要とせず,微粒な幾何学的情報を捉える機械学習パイプラインを開発する。
この手法は微分幾何学や滑らかな多様体の代わりに代数幾何学や代数多様体の範囲内で働く。
バラエティ仮説の設定では、サンプルデータを用いて基礎となるバラエティを見つけることが学習問題となる。
我々は、この学習問題を、固有値計算の観点で解決する最大Aポストエリオリ最適化問題に投入した。
基礎となる多様体を見出し, gr\"obner基底と数値解法を用いてその幾何学的情報を明らかにする。
特に,基礎となる多様体の特異点近傍にある点を数値的に検出するためのヒューリスティックを提案する。
関連論文リスト
- Persistent de Rham-Hodge Laplacians in Eulerian representation for manifold topological learning [7.0103981121698355]
多様体トポロジカルラーニングのための持続的ド・ラム・ホッジ・ラプラシアン(英語版)、または持続的ホッジ・ラプラシアン(英語版)を導入する。
我々のPHLは、カルテシアン格子を構造パーバーするユーレリア表現で構築されている。
本稿では,タンパク質-リガンド結合親和性の2つのベンチマークデータセットによる予測について考察する。
論文 参考訳(メタデータ) (2024-08-01T01:15:52Z) - Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - Unraveling the Single Tangent Space Fallacy: An Analysis and Clarification for Applying Riemannian Geometry in Robot Learning [6.253089330116833]
幾何学的制約を効果的に扱うには、微分幾何学から機械学習手法の定式化へのツールの導入が必要である。
ロボット学習の最近の普及は、主に数学的に定型化された単純化によって特徴づけられている。
本論文は, このアプローチを取り巻く様々な誤解を理論的に解明し, その欠点を実験的に証明するものである。
論文 参考訳(メタデータ) (2023-10-11T21:16:01Z) - Neural Latent Geometry Search: Product Manifold Inference via
Gromov-Hausdorff-Informed Bayesian Optimization [21.97865037637575]
我々は、この新しい定式化を数学的に定義し、ニューラル潜在幾何探索(NLGS)として作成する。
計量幾何学からのグロモフ・ハウスドルフ距離に基づいて、候補潜在測地間の距離の新たな概念を提案する。
次に、潜在測地間の滑らかさの概念に基づいてグラフ探索空間を設計し、その計算を帰納バイアスとして利用する。
論文 参考訳(メタデータ) (2023-09-09T14:29:22Z) - Symmetry-Informed Geometric Representation for Molecules, Proteins, and
Crystalline Materials [66.14337835284628]
幾何戦略の有効性をベンチマークできるGeom3Dというプラットフォームを提案する。
Geom3Dは16の高度な対称性インフォームド幾何表現モデルと46の多様なデータセット上の14の幾何事前学習方法を含んでいる。
論文 参考訳(メタデータ) (2023-06-15T05:37:25Z) - Exploring Data Geometry for Continual Learning [64.4358878435983]
非定常データストリームのデータ幾何を探索することにより,新しい視点から連続学習を研究する。
提案手法は,新しいデータによって引き起こされる幾何構造に対応するために,基底空間の幾何学を動的に拡張する。
実験により,本手法はユークリッド空間で設計したベースライン法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2023-04-08T06:35:25Z) - Study of Manifold Geometry using Multiscale Non-Negative Kernel Graphs [32.40622753355266]
データの幾何学的構造を研究するための枠組みを提案する。
我々は最近導入された非負のカーネル回帰グラフを用いて、点密度、固有次元、およびデータ多様体(曲率)の線型性を推定する。
論文 参考訳(メタデータ) (2022-10-31T17:01:17Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - Quadric hypersurface intersection for manifold learning in feature space [52.83976795260532]
適度な高次元と大きなデータセットに適した多様体学習技術。
この手法は、二次超曲面の交点という形で訓練データから学習される。
テスト時、この多様体は任意の新しい点に対する外れ値スコアを導入するのに使うことができる。
論文 参考訳(メタデータ) (2021-02-11T18:52:08Z) - Computational Analysis of Deformable Manifolds: from Geometric Modelling
to Deep Learning [0.0]
非平坦空間の多様性が豊富な研究領域を提供することを示す。
形状処理とデータ解析のための幾何学的手法について検討する。
論文 参考訳(メタデータ) (2020-09-03T16:50:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。