論文の概要: The role of feature space in atomistic learning
- arxiv url: http://arxiv.org/abs/2009.02741v4
- Date: Thu, 10 Dec 2020 10:17:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 08:40:10.432298
- Title: The role of feature space in atomistic learning
- Title(参考訳): 原子学学習における特徴空間の役割
- Authors: Alexander Goscinski and Guillaume Fraux and Giulio Imbalzano and
Michele Ceriotti
- Abstract要約: 物理的にインスパイアされた記述子は、原子論シミュレーションへの機械学習技術の応用において重要な役割を果たしている。
異なる記述子のセットを比較するためのフレームワークを導入し、メトリクスとカーネルを使ってそれらを変換するさまざまな方法を紹介します。
原子密度のn-体相関から構築した表現を比較し,低次特徴の利用に伴う情報損失を定量的に評価した。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Eficient, physically-inspired descriptors of the structure and composition of
molecules and materials play a key role in the application of machine-learning
techniques to atomistic simulations. The proliferation of approaches, as well
as the fact that each choice of features can lead to very different behavior
depending on how they are used, e.g. by introducing non-linear kernels and
non-Euclidean metrics to manipulate them, makes it difficult to objectively
compare different methods, and to address fundamental questions on how one
feature space is related to another. In this work we introduce a framework to
compare different sets of descriptors, and different ways of transforming them
by means of metrics and kernels, in terms of the structure of the feature space
that they induce. We define diagnostic tools to determine whether alternative
feature spaces contain equivalent amounts of information, and whether the
common information is substantially distorted when going from one feature space
to another. We compare, in particular, representations that are built in terms
of n-body correlations of the atom density, quantitatively assessing the
information loss associated with the use of low-order features. We also
investigate the impact of different choices of basis functions and
hyperparameters of the widely used SOAP and Behler-Parrinello features, and
investigate how the use of non-linear kernels, and of a Wasserstein-type
metric, change the structure of the feature space in comparison to a simpler
linear feature space.
- Abstract(参考訳): 分子と物質の構造と構成に関する、物理的にインスパイアされた記述子は、原子論的シミュレーションへの機械学習技術の適用において重要な役割を果たす。
アプローチの拡散は、機能の選択が、例えば、非線形カーネルと非ユークリッドメトリクスを導入してそれらを操作することによって、異なるメソッドを客観的に比較し、ある機能空間が他の機能空間とどのように関係しているかという根本的な問題に対処するなど、それらがどのように使用されるかによって、非常に異なる振る舞いをもたらすことにつながる。
本研究では、異なる記述子の集合と、それらが引き起こす特徴空間の構造の観点から、メトリクスとカーネルによってそれらを変換する方法を比較するためのフレームワークを導入する。
我々は,代替特徴空間が等価な情報量を含むか,共通情報が機能空間から他の特徴空間へ移動する際に実質的に歪んでいるかを決定するための診断ツールを定義する。
特に、原子密度のn体相関の観点から構築された表現を比較し、低次特徴の使用に伴う情報損失を定量的に評価する。
また、広く使われているSOAPおよびBehler-Parrinello特徴の基底関数とハイパーパラメータの異なる選択の影響について検討し、非線形カーネルとワッサーシュタイン型計量を用いて、より単純な線形特徴空間と比較して特徴空間の構造を変化させる方法について検討する。
関連論文リスト
- Automatic feature selection and weighting using Differentiable Information Imbalance [41.452380773977154]
本稿では,特徴集合間で情報内容のランク付けを行う自動データ解析手法DIIを紹介する。
地上の真理特徴空間における距離に応じて最も近い隣人に基づいて、入力特徴量の低次元部分集合を求める。
識別可能な情報不均衡を損失関数として利用することにより、入力の相対的特徴重みを最適化し、ユニットアライメントと相対的重要スケーリングを同時に行う。
論文 参考訳(メタデータ) (2024-10-30T11:19:10Z) - Normalization in Proportional Feature Spaces [49.48516314472825]
データ表現、特徴付け、可視化、分析、比較、分類、モデリングにおいて、正規化は重要な中心的な役割を果たす。
適切な正規化手法の選択は、関連する特徴の種類と特徴を考慮する必要がある。
論文 参考訳(メタデータ) (2024-09-17T17:46:27Z) - Going Beyond Neural Network Feature Similarity: The Network Feature
Complexity and Its Interpretation Using Category Theory [64.06519549649495]
機能的に等価な機能と呼ぶものの定義を提供します。
これらの特徴は特定の変換の下で等価な出力を生成する。
反復的特徴マージ(Iterative Feature Merging)というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-10T16:27:12Z) - Measuring dissimilarity with diffeomorphism invariance [94.02751799024684]
DID(DID)は、幅広いデータ空間に適用可能なペアワイズな相似性尺度である。
我々は、DIDが理論的研究と実用に関係のある特性を享受していることを証明する。
論文 参考訳(メタデータ) (2022-02-11T13:51:30Z) - Feature Weighted Non-negative Matrix Factorization [92.45013716097753]
本稿では,FNMF(Feature weighted Non- negative Matrix Factorization)を提案する。
FNMFはその重要性に応じて特徴の重みを適応的に学習する。
提案する最適化アルゴリズムを用いて効率的に解くことができる。
論文 参考訳(メタデータ) (2021-03-24T21:17:17Z) - Product Manifold Learning [7.394643746798322]
多様体分解と呼ばれる非線形独立成分分析のための新しいパラダイムを提案する。
構造生物学における重要な課題として,本手法の可能性を示す。
論文 参考訳(メタデータ) (2020-10-19T22:51:06Z) - Linear Classifier Combination via Multiple Potential Functions [0.6091702876917279]
決定境界からクラスセントロイドまでの距離との距離に基づいてスコアリング関数を計算する新しい概念を提案する。
重要な性質は、提案されたスコア関数がすべての線形基底分類器に対して同じ性質を持つことである。
論文 参考訳(メタデータ) (2020-10-02T08:11:51Z) - A Functional Perspective on Learning Symmetric Functions with Neural
Networks [48.80300074254758]
本研究では,測定値に基づいて定義されたニューラルネットワークの学習と表現について検討する。
正規化の異なる選択の下で近似と一般化境界を確立する。
得られたモデルは効率よく学習でき、入力サイズにまたがる一般化保証を享受できる。
論文 参考訳(メタデータ) (2020-08-16T16:34:33Z) - A Deep Joint Sparse Non-negative Matrix Factorization Framework for
Identifying the Common and Subject-specific Functional Units of Tongue Motion
During Speech [7.870139900799612]
音声中の舌運動の共通および主観的機能単位を特定するための新しいディープラーニングフレームワークを開発した。
スパースとグラフ正規化によるNMFを、ディープニューラルネットワークに似たモジュラーアーキテクチャに変換する。
論文 参考訳(メタデータ) (2020-07-09T15:05:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。