論文の概要: TriForces: Augmenting Atomistic GNNs for Transferable Representations
- arxiv url: http://arxiv.org/abs/2605.20581v1
- Date: Wed, 20 May 2026 00:38:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.420129
- Title: TriForces: Augmenting Atomistic GNNs for Transferable Representations
- Title(参考訳): TriForces: 転送可能な表現のためのAtomistic GNNの拡張
- Authors: Ali Ramlaoui, Alexandre Duval, Hannah Bull, Victor Schmidt, Hugues Talbot, Fragkiskos D. Malliaros, Joseph Musielewicz,
- Abstract要約: 機械学習の原子間ポテンシャル(MLIP)は、大きな密度汎関数理論(DFT)データに基づいてトレーニングされた場合、優れた精度を達成する。
MLIPはドメイン間で矛盾なく転送し、しばしばアクセス可能な構成や構造情報を緩く表現する。
本稿では、構成と構造情報を分離したモデルに依存しない3ストリームフレームワークであるTriForcesと、自己教師付き学習を組み合わせて、転送可能な表現を保存する。
- 参考スコア(独自算出の注目度): 41.22575447426028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning interatomic potentials (MLIPs) achieve excellent accuracy when trained on large Density Functional Theory (DFT) data. To be useful in practice, they must often be adapted to target chemistries using small and expensive task-specific datasets. However, MLIPs transfer inconsistently across domains, with representations that often loose accessible composition and structure information. To address this, we present TriForces, a model-agnostic three-stream framework that separates composition and structure information, combined with self-supervised learning to preserve transferable representations. TriForces improves performance on MatBench and QM9 over baselines without needing DFT labels and enables efficient similar structure retrieval through its learned latent space. On OMat24, in limited-data training regime, TriForces reduces energy MAE by 57% at 20K samples only and improves force MAE across sample sizes. We release pretrained TriForces variants across multiple MLIP architectures with code at https://github.com/Ramlaoui/triforces.
- Abstract(参考訳): 機械学習の原子間ポテンシャル(MLIP)は、大きな密度汎関数理論(DFT)データに基づいてトレーニングされた場合、優れた精度を達成する。
実用上有用であるためには、小さくて高価なタスク固有のデータセットを使用して、化学をターゲットとするように適応する必要がある。
しかし、MLIPはドメイン間で矛盾なく移動し、しばしば緩やかな構成や構造情報を表現している。
そこで本研究では,構成と構造情報を分離したモデルに依存しない3ストリームフレームワークであるTriForcesと,自己教師付き学習を組み合わせることで,伝達可能な表現を保存する。
TriForcesは、DFTラベルを必要とせずにベースライン上のMateBenchとQM9の性能を改善し、学習された潜伏空間を通して効率的に類似した構造検索を可能にする。
OMat24では、限られたデータトレーニング体制において、TriForcesは20KサンプルでのみエネルギーMAEを57%削減し、サンプルサイズで力MAEを改善する。
複数のMLIPアーキテクチャにまたがる事前トレーニング済みの TriForces 変種を https://github.com/Ramlaoui/triforces でリリースしています。
関連論文リスト
- LeMat-Traj: A Scalable and Unified Dataset of Materials Trajectories for Atomistic Modeling [34.31458248589154]
大規模リポジトリから集約された1億2000万以上の原子構成からなるキュレートデータセットであるLeMat-Trajを紹介した。
LeMat-Trajはデータ表現を標準化し、結果とフィルタを調和させ、広く使われているDFT機能にまたがる高品質な構成を実現する。
LeMaterial-Fetcherは、新しいデータソースを容易に組み込むために、コミュニティに再現可能なフレームワークを提供するために設計された、モジュラーでオープンソースのライブラリである。
論文 参考訳(メタデータ) (2025-08-28T15:06:32Z) - MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale [66.73529246309033]
MLLM(Multimodal large language model)は、多モーダルタスクにおいて大きな可能性を秘めている。
既存の命令チューニングデータセットは、中間的合理性のないフレーズレベルの答えのみを提供する。
そこで本研究では,大規模マルチモーダル・インストラクション・チューニング・データセットを構築するためのスケーラブルで費用対効果の高い手法を提案する。
論文 参考訳(メタデータ) (2024-12-06T18:14:24Z) - Building on Efficient Foundations: Effectively Training LLMs with Structured Feedforward Layers [16.253898272659242]
大規模言語モデル(LLM)における最先端の結果は、しばしばスケールに依存し、計算コストがかかる。
本研究は,計算集約型フィードフォワードネットワーク(FFN)を対象とするトランスフォーマーベースLLMに着目した。
広範かつ構造化されたネットワークは、最適なトレードオフにおいて、パラメータが少なく、高密度モデルよりも損失が少ないFLOPをより効率的に活用できることを示す。
論文 参考訳(メタデータ) (2024-06-24T08:43:21Z) - Compute Better Spent: Replacing Dense Layers with Structured Matrices [77.61728033234233]
画像領域における畳み込みネットワークの成功が示すように、高密度行列に対するより効率的な代替手段を同定する。
異なる構造は、しばしばパフォーマンスに不可欠な、非常に異なる初期化尺度と学習率を必要とする。
本稿では,モナール行列を含む新しい行列族Block-Trainを提案する。
論文 参考訳(メタデータ) (2024-06-10T13:25:43Z) - Towards Compact 3D Representations via Point Feature Enhancement Masked
Autoencoders [52.66195794216989]
本稿では,コンパクトな3D表現を学習するために,ポイント特徴強調マスク付きオートエンコーダ(Point-FEMAE)を提案する。
Point-FEMAEはグローバルブランチとローカルブランチで構成され、潜在意味的特徴をキャプチャする。
本手法は, クロスモーダル方式と比較して, 事前学習効率を著しく向上させる。
論文 参考訳(メタデータ) (2023-12-17T14:17:05Z) - Towards Large-scale 3D Representation Learning with Multi-dataset Point Prompt Training [44.790636524264]
ポイント・プロンプト・トレーニング(Point Prompt Training)は、3D表現学習の文脈におけるマルチデータセットのシナジスティック学習のための新しいフレームワークである。
シナジスティック学習に関連する負の移動を克服し、一般化可能な表現を生成する。
教師付きマルチデータセットトレーニングを備えた1つの重み付きモデルを用いて、各データセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-08-18T17:59:57Z) - ULIP-2: Towards Scalable Multimodal Pre-training for 3D Understanding [96.95120198412395]
本稿では,3次元形状の全体言語記述を自動的に生成するトリオモーダル事前学習フレームワークを提案する。
入力として3Dデータしか必要とせず、手動の3Dアノテーションを必要としないため、大規模なデータセットにスケーラブルである。
NNとShapeNetの2つの大規模3Dデータセットの実験を行い、これらを3Dポイントクラウド、キャプション、トレーニングのための言語という3つのモーダルデータセットで拡張する。
実験により、NN-2は、ゼロショット3D分類、ファインタニングによる標準3D分類、3D3Dという3つの下流タスクにおいて有意義な利点を示すことが示された。
論文 参考訳(メタデータ) (2023-05-14T23:14:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。