論文の概要: Random functions as data compressors for machine learning of molecular processes
- arxiv url: http://arxiv.org/abs/2509.17937v1
- Date: Sun, 07 Sep 2025 11:45:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-28 15:30:14.350398
- Title: Random functions as data compressors for machine learning of molecular processes
- Title(参考訳): 分子過程の機械学習のためのデータ圧縮機としてのランダム関数
- Authors: Jayashrita Debnath, Gerhard Hummer,
- Abstract要約: ランダムな非線形射影は、大きな特徴空間を圧縮し、かなりの情報損失を伴わずに高速に計算できることを示す。
テストケース NTL9 と villin ヘッドピースの二重ノルロイシン変種に対して、ランダム圧縮は、中核の静的および動的情報を保持する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine learning (ML) is rapidly transforming the way molecular dynamics simulations are performed and analyzed, from materials modeling to studies of protein folding and function. ML algorithms are often employed to learn low-dimensional representations of conformational landscapes and to cluster trajectories into relevant metastable states. Most of these algorithms require selecting a small number of features that describe the problem of interest. Although deep neural networks can tackle large numbers of input features, the training costs increase with input size, which makes the selection of a subset of features mandatory for most problems of practical interest. Here, we show that random nonlinear projections can be used to compress large feature spaces and make computations faster without substantial loss of information. We describe an efficient way to produce random projections and then exemplify the general procedure for protein folding. For our test cases NTL9 and the double-norleucin variant of the villin headpiece, we find that random compression retains the core static and dynamic information of the original high dimensional feature space and makes trajectory analysis more robust.
- Abstract(参考訳): 機械学習(ML)は、物質モデリングからタンパク質の折りたたみと機能の研究まで、分子動力学シミュレーションの実行と解析の方法に急速に変化している。
MLアルゴリズムは、しばしばコンフォメーションランドスケープの低次元表現を学習し、関連する準安定状態へのクラスタ・トラジェクトリに使用される。
これらのアルゴリズムの多くは、関心事の問題を記述した少数の特徴を選択する必要がある。
ディープニューラルネットワークは多数の入力特徴に対処できるが、トレーニングコストは入力サイズとともに増加し、実践的な関心を持つほとんどの問題に必須の機能のサブセットが選択される。
ここでは、ランダムな非線形射影を用いて大きな特徴空間を圧縮し、かなりの情報損失を伴わずに高速に計算できることを示す。
ランダムなプロジェクションを効率よく生成し、タンパク質折り畳みの一般的な手順を例示する。
テストケース NTL9 と villin ヘッドピースの二重ノルロイシン変種に対して、ランダム圧縮は元の高次元特徴空間の中核の静的および動的情報を保持し、軌道解析をより堅牢にする。
関連論文リスト
- Low-dimensional Functions are Efficiently Learnable under Randomly Biased Distributions [12.410304632874531]
第一モーメントのランダムシフトにより、データ分布に小さなランダムな摂動を導入することで、任意のガウス指標モデルを線形関数として容易に学習できることを証明した。
この結果をマルチインデックスモデル、すなわちスパースブール関数のクラス、つまりユンタス(Juntas)に拡張する。
論文 参考訳(メタデータ) (2025-02-10T13:19:30Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Score-based Diffusion Models in Function Space [137.70916238028306]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
この研究は、関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)と呼ばれる数学的に厳密なフレームワークを導入する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Scalable Gaussian Processes for Data-Driven Design using Big Data with
Categorical Factors [14.337297795182181]
ガウス過程(GP)は、大きなデータセット、カテゴリ入力、および複数の応答を調節するのに困難である。
本稿では,変分推論によって得られた潜伏変数と関数を用いて,上記の課題を同時に解決するGPモデルを提案する。
本手法は三元系酸化物材料の機械学習と多スケール対応機構のトポロジー最適化に有用である。
論文 参考訳(メタデータ) (2021-06-26T02:17:23Z) - Time Varying Particle Data Feature Extraction and Tracking with Neural
Networks [20.825102707056647]
我々は, 特徴抽出と追跡を支援するために, 科学的粒子データのための特徴表現を作成するために, 深層学習アプローチを採用する。
本研究では,局所近傍における空間的位置と物理的属性の関係を表現するために,潜在ベクトルを生成する深層学習モデルを用いる。
高速な特徴追跡を実現するために,特徴空間に平均シフト追跡アルゴリズムを適用した。
論文 参考訳(メタデータ) (2021-05-27T15:38:14Z) - Adaptive Latent Space Tuning for Non-Stationary Distributions [62.997667081978825]
本稿では,ディープエンコーダ・デコーダ方式cnnの低次元潜在空間の適応チューニング法を提案する。
粒子加速器における時間変動荷電粒子ビームの特性を予測するためのアプローチを実証する。
論文 参考訳(メタデータ) (2021-05-08T03:50:45Z) - Quantum Algorithms for Data Representation and Analysis [68.754953879193]
機械学習におけるデータ表現のための固有problemsの解を高速化する量子手続きを提供する。
これらのサブルーチンのパワーと実用性は、主成分分析、対応解析、潜在意味解析のための入力行列の大きさのサブ線形量子アルゴリズムによって示される。
その結果、入力のサイズに依存しない実行時のパラメータは妥当であり、計算モデル上の誤差が小さいことが示され、競合的な分類性能が得られる。
論文 参考訳(メタデータ) (2021-04-19T00:41:43Z) - Random Sampling High Dimensional Model Representation Gaussian Process
Regression (RS-HDMR-GPR) for representing multidimensional functions with
machine-learned lower-dimensional terms allowing insight with a general
method [0.0]
RS-HDMR-GPR(Random Smpling High-dimensional Model Representation Gaussian Process Regression)のためのPython実装
コードにより、変数の欠落した値を計算し、HDMR項の有用な数を大幅に減らすことができる。
この回帰ツールの能力は、合成分析機能、水分子のポテンシャルエネルギー表面、物質の運動エネルギー密度、金融市場データを含む試験ケースで実証される。
論文 参考訳(メタデータ) (2020-11-24T00:12:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。