論文の概要: A data driven approach to classify descriptors based on their efficiency in translating noisy trajectories into physically-relevant information
- arxiv url: http://arxiv.org/abs/2411.12570v1
- Date: Tue, 19 Nov 2024 15:39:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-20 13:35:32.709019
- Title: A data driven approach to classify descriptors based on their efficiency in translating noisy trajectories into physically-relevant information
- Title(参考訳): 雑音トラジェクトリの物理関連情報への変換におけるデクリプタの効率性に基づくデータ駆動手法
- Authors: Simone Martino, Domiziano Doria, Chiara Lionello, Matteo Becchi, Giovanni M. Pavan,
- Abstract要約: ノイズトラジェクトリから情報を抽出する際の各種記述子の効率を比較検討する。
SOAPやLENSのような先進的な記述子は、信号と雑音の比率が高いため、古典的な記述よりも優れています。
この研究は、分子軌道からの情報抽出におけるノイズの重要な役割を強調している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Reconstructing the physical complexity of many-body dynamical systems can be challenging. Starting from the trajectories of their constitutive units (raw data), typical approaches require selecting appropriate descriptors to convert them into time-series, which are then analyzed to extract interpretable information. However, identifying the most effective descriptor is often non-trivial. Here, we report a data-driven approach to compare the efficiency of various descriptors in extracting information from noisy trajectories and translating it into physically relevant insights. As a prototypical system with non-trivial internal complexity, we analyze molecular dynamics trajectories of an atomistic system where ice and water coexist in equilibrium near the solid/liquid transition temperature. We compare general and specific descriptors often used in aqueous systems: number of neighbors, molecular velocities, Smooth Overlap of Atomic Positions (SOAP), Local Environments and Neighbors Shuffling (LENS), Orientational Tetrahedral Order, and distance from the fifth neighbor ($d_5$). Using Onion Clustering -- an efficient unsupervised method for single-point time-series analysis -- we assess the maximum extractable information for each descriptor and rank them via a high-dimensional metric. Our results show that advanced descriptors like SOAP and LENS outperform classical ones due to higher signal-to-noise ratios. Nonetheless, even simple descriptors can rival or exceed advanced ones after local signal denoising. For example, $d_5$, initially among the weakest, becomes the most effective at resolving the system's non-local dynamical complexity after denoising. This work highlights the critical role of noise in information extraction from molecular trajectories and offers a data-driven approach to identify optimal descriptors for systems with characteristic internal complexity.
- Abstract(参考訳): 多体力学系の物理的複雑さを再構築することは困難である。
構成単位の軌跡(生データ)から始めると、典型的なアプローチでは、それらを時系列に変換する適切な記述子を選択し、解析して解釈可能な情報を抽出する必要がある。
しかし、最も効果的な記述子を特定することは、しばしば非自明である。
本稿では,様々な記述子の効率性を比較するためのデータ駆動型手法について,雑音のトラジェクトリから情報を抽出し,それを物理的に関連性のある洞察に翻訳する手法について報告する。
非自明な内部複雑性を持つ原型系として、固体/液体遷移温度付近で氷と水が平衡に共存する原子系の分子動力学軌跡を解析する。
水系でよく使われる一般的な記述子と特定の記述子を比較する: 隣人の数、分子速度、原子位置の平らなオーバーラップ(SOAP)、局所環境と近隣のシャッフルリング(LENS)、配向テトラメドラルオーダー、および5番目の隣人の距離(d_5$)。
単一点時系列解析のための効率的な教師なし手法であるオニオンクラスタリングを用いて、各記述子に対して最大抽出可能な情報を評価し、それらを高次元の計量でランク付けする。
以上の結果から,SOAPやLENSのような先進的な記述子は信号と雑音の比率が高いため,従来の記述よりも優れていた。
それでも、単純な記述子でさえ、局所的な信号のデノイングの後、高度な記述子と競合したり、超えたりすることができる。
例えば、$d_5$は、当初は最も弱いものの1つで、デノナイズ後にシステムの非局所的力学複雑性を解決するのに最も効果的である。
この研究は、分子軌道からの情報抽出におけるノイズの重要な役割を強調し、内部複雑さに特徴的なシステムに対して最適な記述子を特定するためのデータ駆動型アプローチを提供する。
関連論文リスト
- Automating the Discovery of Partial Differential Equations in Dynamical Systems [0.0]
適応型ラッソを用いてスパースレグレッションを利用して自動的にPDEを識別するARGOSフレームワークARGOS-RALの拡張を提案する。
各種ノイズレベルおよびサンプルサイズの下での標準PDEの同定におけるARGOS-RALの性能を厳格に評価した。
以上の結果から,ARGOS-ALはデータから基礎となるPDEを効果的かつ確実に同定し,ほとんどの場合において逐次しきい値リッジ回帰法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-04-25T09:23:03Z) - Score-based Data Assimilation [7.215767098253208]
軌道推定のためのスコアベースのデータ同化を導入する。
我々は、任意の長さの軌道のスコアを、短いセグメントにまたがって一連のスコアに分解できるというキーインサイトに基づいて、状態軌道のスコアに基づく生成モデルを学ぶ。
論文 参考訳(メタデータ) (2023-06-18T14:22:03Z) - Automated classification of pre-defined movement patterns: A comparison
between GNSS and UWB technology [55.41644538483948]
リアルタイム位置情報システム(RTLS)は、人間の動きパターンからデータを収集することができる。
本研究の目的は、小さな領域における人間の動きパターンを分類する自動化された枠組みを設計し、評価することである。
論文 参考訳(メタデータ) (2023-03-10T14:46:42Z) - Score-based Diffusion Models in Function Space [140.792362459734]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
本稿では,関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)という,数学的に厳密なフレームワークを提案する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Neural Information Squeezer for Causal Emergence [2.2788045178734726]
本稿では,効果的な粗粒化戦略とマクロ状態のダイナミクスを自動的に抽出する,Neural Information Squeezerと呼ばれる汎用機械学習フレームワークを提案する。
我々のフレームワークは、異なるレベルのダイナミクスを抽出し、いくつかの例のシステムでデータから因果関係の出現を識別する方法を示す。
論文 参考訳(メタデータ) (2022-01-25T07:55:06Z) - Extracting stochastic dynamical systems with $\alpha$-stable L\'evy
noise from data [14.230182518492311]
本稿では,短時間のバーストデータから$$alpha$-stable L'evyノイズを持つシステムを抽出するデータ駆動方式を提案する。
より具体的には、最初にL'evyジャンプ測度と雑音強度を推定する。
次に,非局所クラマース・モヤル式と正規化流を組み合わせることでドリフト係数を近似する。
論文 参考訳(メタデータ) (2021-09-30T06:57:42Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Learning based signal detection for MIMO systems with unknown noise
statistics [84.02122699723536]
本論文では,未知のノイズ統計による信号を堅牢に検出する一般化最大確率(ML)推定器を考案する。
実際には、システムノイズに関する統計的な知識はほとんどなく、場合によっては非ガウス的であり、衝動的であり、分析不可能である。
我々のフレームワークは、ノイズサンプルのみを必要とする教師なしの学習アプローチによって駆動される。
論文 参考訳(メタデータ) (2021-01-21T04:48:15Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Weak SINDy For Partial Differential Equations [0.0]
我々はWeak SINDy(WSINDy)フレームワークを偏微分方程式(PDE)の設定にまで拡張する。
弱い形状による点微分近似の除去は、ノイズフリーデータからモデル係数の効率的な機械的精度回復を可能にする。
我々は、いくつかの挑戦的なPDEに対して、WSINDyの堅牢性、速度、精度を実証する。
論文 参考訳(メタデータ) (2020-07-06T16:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。