Fugu-MT 論文翻訳(概要): MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials Modeling

論文の概要: MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials Modeling

arxiv url: http://arxiv.org/abs/2309.05934v1
Date: Tue, 12 Sep 2023 03:08:37 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-13 14:32:41.570604
Title: MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials Modeling
Title（参考訳）: MatSciML: 固体材料モデリングのための多タスクベンチマーク
Authors: Kin Long Kelvin Lee, Carmelo Gonzales, Marcel Nassar, Matthew Spellings, Mikhail Galkin, Santiago Miret
Abstract要約: MatSci MLは機械学習(MatSci ML)法を用いたMATerials SCIenceをモデル化するためのベンチマークである。 MatSci MLは、モデルトレーニングと評価のための多様な材料システムとプロパティデータを提供する。マルチデータセットの学習環境において、MatchSci MLは、研究者が複数のデータセットからの観測を組み合わせ、共通の特性を共同で予測することを可能にする。
参考スコア（独自算出の注目度）: 7.142619575624596
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose MatSci ML, a novel benchmark for modeling MATerials SCIence using Machine Learning (MatSci ML) methods focused on solid-state materials with periodic crystal structures. Applying machine learning methods to solid-state materials is a nascent field with substantial fragmentation largely driven by the great variety of datasets used to develop machine learning models. This fragmentation makes comparing the performance and generalizability of different methods difficult, thereby hindering overall research progress in the field. Building on top of open-source datasets, including large-scale datasets like the OpenCatalyst, OQMD, NOMAD, the Carolina Materials Database, and Materials Project, the MatSci ML benchmark provides a diverse set of materials systems and properties data for model training and evaluation, including simulated energies, atomic forces, material bandgaps, as well as classification data for crystal symmetries via space groups. The diversity of properties in MatSci ML makes the implementation and evaluation of multi-task learning algorithms for solid-state materials possible, while the diversity of datasets facilitates the development of new, more generalized algorithms and methods across multiple datasets. In the multi-dataset learning setting, MatSci ML enables researchers to combine observations from multiple datasets to perform joint prediction of common properties, such as energy and forces. Using MatSci ML, we evaluate the performance of different graph neural networks and equivariant point cloud networks on several benchmark tasks spanning single task, multitask, and multi-data learning scenarios. Our open-source code is available at https://github.com/IntelLabs/matsciml.
Abstract（参考訳）: 本稿では,周期的結晶構造を有する固体材料に着目した機械学習(matsci ml)を用いた材料科学のモデリングベンチマークであるmatsci mlを提案する。固相材料に機械学習手法を適用することは、機械学習モデルを開発するために使用される多種多様なデータセットによって大きく断片化され、生まれたばかりの分野である。この断片化により、異なる手法の性能と一般化性の比較が困難になり、この分野における全体的な研究の進展を妨げる。 opencatalyst, oqmd, nomad, carolina materials database, and materials projectのような大規模なデータセットを含むオープンソースのデータセットの上に構築されたmatsci mlベンチマークは、シミュレーションエネルギー、原子力、物質バンドギャップ、および宇宙グループによる結晶対称性の分類データを含む、モデルトレーニングと評価のための多様な材料システムと特性データを提供する。 MatSci MLのプロパティの多様性は、固体材料に対するマルチタスク学習アルゴリズムの実装と評価を可能にし、データセットの多様性は、複数のデータセットにまたがる新しいより一般化されたアルゴリズムとメソッドの開発を促進する。マルチデータセットの学習環境では、MatchSci MLは研究者が複数のデータセットからの観測を組み合わせることで、エネルギーや力などの共通特性を共同で予測することを可能にする。 matsci mlを用いて,単一タスク,マルチタスク,マルチデータ学習シナリオにまたがるベンチマークタスクにおいて,異なるグラフニューラルネットワークと等変点クラウドネットワークの性能を評価する。当社のオープンソースコードはhttps://github.com/intellabs/matscimlで利用可能です。

関連論文リスト

TokaMind: A Multi-Modal Transformer Foundation Model for Tokamak Plasma Dynamics [56.073642366268764]
TokaMindは、核融合プラズマモデリングのためのオープンソースの基礎モデルフレームワークである。公開されているMASTデータセットから、異種トカマク診断をトレーニングする。我々は最近発表されたMASTベンチマークのTokaMarkでTokaMindを評価した。
論文参考訳（メタデータ） (2026-02-16T12:26:07Z)
NaViL: Rethinking Scaling Properties of Native Multimodal Large Language Models under Data Constraints [100.02131897927484]
本稿では,Multimodal Large Language Models(MLLM)のエンドツーエンドなネイティブトレーニングに焦点を当てる。そこで我々は,NaViLと呼ばれるネイティブMLLMと,シンプルで費用対効果の高いレシピを組み合わせて提案する。 14のマルチモーダルベンチマークによる実験結果から,既存のMLLMに対するNaViLの競合性能が確認された。
論文参考訳（メタデータ） (2025-10-09T17:59:37Z)
LeMat-Traj: A Scalable and Unified Dataset of Materials Trajectories for Atomistic Modeling [34.31458248589154]
大規模リポジトリから集約された1億2000万以上の原子構成からなるキュレートデータセットであるLeMat-Trajを紹介した。 LeMat-Trajはデータ表現を標準化し、結果とフィルタを調和させ、広く使われているDFT機能にまたがる高品質な構成を実現する。 LeMaterial-Fetcherは、新しいデータソースを容易に組み込むために、コミュニティに再現可能なフレームワークを提供するために設計された、モジュラーでオープンソースのライブラリである。
論文参考訳（メタデータ） (2025-08-28T15:06:32Z)
Beyond Atomic Geometry Representations in Materials Science: A Human-in-the-Loop Multimodal Framework [2.172419551358714]
MultiCrystalSpectrumSet(MCS-Set)は、原子構造と2Dプロジェクションと構造化テキストアノテーションを統合することで、材料データセットを拡張するキュレートされたフレームワークである。 MCS-Setは,(1)マルチモーダル特性と要約予測,(2)部分クラスタ管理による制約結晶生成の2つの重要なタスクを実現する。
論文参考訳（メタデータ） (2025-05-30T23:18:42Z)
Data Fusion of Deep Learned Molecular Embeddings for Property Prediction [44.99833362998488]
我々はデータ融合技術を用いて、様々な単一タスクモデルの学習された分子組込みを組み合わせ、この組込みについてマルチタスクモデルを訓練した。融合マルチタスクモデルはスパースデータセットの標準マルチタスクモデルより優れており、単一タスクモデルと比較してデータ制限特性の予測が拡張可能であることを示す。
論文参考訳（メタデータ） (2025-04-09T21:40:15Z)
Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文参考訳（メタデータ） (2024-12-16T09:14:32Z)
MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale [66.73529246309033]
MLLM(Multimodal large language model)は、多モーダルタスクにおいて大きな可能性を秘めている。既存の命令チューニングデータセットは、中間的合理性のないフレーズレベルの答えのみを提供する。そこで本研究では,大規模マルチモーダル・インストラクション・チューニング・データセットを構築するためのスケーラブルで費用対効果の高い手法を提案する。
論文参考訳（メタデータ） (2024-12-06T18:14:24Z)
Assessing data-driven predictions of band gap and electrical conductivity for transparent conducting materials [10.3054383984768]
本稿では,新しい透明導電材料発見の促進を目的としたデータ駆動型フレームワークを提案する。利用可能なデータの不足を軽減するため、ユニークな実験データベースを作成し、検証する。我々は、既知のTCMの典型的な要素を含む55の合成の一覧において、本手法を検証した。
論文参考訳（メタデータ） (2024-11-21T11:37:05Z)
Towards a Classification of Open-Source ML Models and Datasets for Software Engineering [52.257764273141184]
オープンソースの事前訓練モデル(PTM)とデータセットは、さまざまな機械学習(ML)タスクに広範なリソースを提供する。これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。我々は、人気のあるオープンソースのMLリポジトリであるHugging Face (HF)上で、SE指向の分類をPTMとデータセットに適用し、時間とともにPTMの進化を分析する。
論文参考訳（メタデータ） (2024-11-14T18:52:05Z)
Multi-Task Multi-Fidelity Learning of Properties for Energetic Materials [34.8008617873679]
マルチタスクニューラルネットワークは、マルチモーダルデータから学習でき、特定の特性のために訓練されたシングルタスクモデルより優れている。予想通り、データスカースプロパティでは改善がより重要になります。このアプローチは、エネルギー材料以外の分野にも広く適用できる。
論文参考訳（メタデータ） (2024-08-21T12:54:26Z)
Img-Diff: Contrastive Data Synthesis for Multimodal Large Language Models [49.439311430360284]
コントラスト学習と画像差分キャプションにインスパイアされた新しいデータ合成手法を提案する。私たちのキーとなるアイデアは、マッチングと異なる要素の両方を識別するためにモデルに挑戦することです。我々は、この生成されたデータセットを利用して、最先端(SOTA)MLLMを微調整する。
論文参考訳（メタデータ） (2024-08-08T17:10:16Z)
MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
このデータセットには、スキーマ図、シミュレーション画像、マクロ/顕微鏡写真、実験的可視化などの図が含まれている。我々は,6つのプロプライエタリモデルと10以上のオープンソースモデルを評価し,科学的フィギュアキャプションと複数選択質問のベンチマークを開発した。データセットとベンチマークは、さらなる研究をサポートするためにリリースされる予定だ。
論文参考訳（メタデータ） (2024-07-06T00:40:53Z)
Multimodal Learning for Materials [7.167520424757711]
材料の基礎モデルの自己教師型マルチモーダルトレーニングを可能にするマルチモーダル・ラーニング・フォー・マテリアル(MultiMat)を紹介した。複数の軸上のMaterial Projectデータベースからのデータを用いてフレームワークの可能性を示す。
論文参考訳（メタデータ） (2023-11-30T18:35:29Z)
MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文参考訳（メタデータ） (2023-08-25T01:41:04Z)
TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文参考訳（メタデータ） (2022-08-16T20:46:08Z)
PyHard: a novel tool for generating hardness embeddings to support data-centric analysis [0.38233569758620045]
PyHardは、複数のMLモデルの予測パフォーマンスに関連するデータセットの硬度埋め込みを生成する。ユーザは、この埋め込みを複数の方法で操作することで、データとアルゴリズムのパフォーマンスに関する有用な洞察を得ることができる。我々は、この分析が、MLモデルに挑戦するハードな観察のポケットの識別をどのように支援したかを示す。
論文参考訳（メタデータ） (2021-09-29T14:08:26Z)
Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-06-09T08:47:58Z)
Intelligent multiscale simulation based on process-guided composite database [0.0]
本稿では、プロセスモデリング、材料均質化、機械学習に基づく統合データ駆動モデリングフレームワークを提案する。我々は, 自動車, 航空宇宙, エレクトロニクス産業において重要な材料システムとして認識されてきた, 射出成形した短繊維強化複合材料に興味を持っている。
論文参考訳（メタデータ） (2020-03-20T20:39:19Z)
Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文参考訳（メタデータ） (2020-01-06T13:37:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。