論文の概要: Big-Data Science in Porous Materials: Materials Genomics and Machine
Learning
- arxiv url: http://arxiv.org/abs/2001.06728v3
- Date: Mon, 8 Jun 2020 20:05:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 05:29:59.570557
- Title: Big-Data Science in Porous Materials: Materials Genomics and Machine
Learning
- Title(参考訳): 多孔質材料のビッグデータ科学:材料ゲノムと機械学習
- Authors: Kevin Maik Jablonka, Daniele Ongari, Seyed Mohamad Moosavi, Berend
Smit
- Abstract要約: 非常に多くの材料を持つことで、これらの材料を研究するための強力な技術としてビッグデータ手法が利用できることが示される。
このレビューの重要な部分は、これらの材料を特徴空間で表現するために使用される異なるアプローチである。
特に、MLプロセスを最適化する異なる手法と、異なる手法の性能を定量化する方法についてレビューする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: By combining metal nodes with organic linkers we can potentially synthesize
millions of possible metal organic frameworks (MOFs). At present, we have
libraries of over ten thousand synthesized materials and millions of in-silico
predicted materials. The fact that we have so many materials opens many
exciting avenues to tailor make a material that is optimal for a given
application. However, from an experimental and computational point of view we
simply have too many materials to screen using brute-force techniques. In this
review, we show that having so many materials allows us to use big-data methods
as a powerful technique to study these materials and to discover complex
correlations. The first part of the review gives an introduction to the
principles of big-data science. We emphasize the importance of data collection,
methods to augment small data sets, how to select appropriate training sets. An
important part of this review are the different approaches that are used to
represent these materials in feature space. The review also includes a general
overview of the different ML techniques, but as most applications in porous
materials use supervised ML our review is focused on the different approaches
for supervised ML. In particular, we review the different method to optimize
the ML process and how to quantify the performance of the different methods. In
the second part, we review how the different approaches of ML have been applied
to porous materials. In particular, we discuss applications in the field of gas
storage and separation, the stability of these materials, their electronic
properties, and their synthesis. The range of topics illustrates the large
variety of topics that can be studied with big-data science. Given the
increasing interest of the scientific community in ML, we expect this list to
rapidly expand in the coming years.
- Abstract(参考訳): 金属ノードと有機リンカーを組み合わせることで、数百万の金属有機フレームワーク(MOF)を合成することができる。
現在、1万以上の合成材料と数百万のインシリコ予測材料からなる図書館がある。
これほど多くの材料があるという事実は、特定の用途に最適な材料を仕立てるために多くのエキサイティングな道を開く。
しかし、実験的かつ計算的な観点からは、単にブルートフォース技術を使ってスクリーンに映す材料が多すぎるだけである。
本総説では,大量の材料を持つことで,これらの材料の研究や複雑な相関関係の発見にビッグデータ手法を活用できることを示す。
レビューの最初のパートでは、ビッグデータ科学の原則を紹介している。
我々は、データ収集の重要性、小さなデータセットの強化方法、適切なトレーニングセットの選択方法について強調する。
このレビューの重要な部分は、これらの材料を特徴空間で表現するために使用される異なるアプローチである。
このレビューには、さまざまなMLテクニックの概観も含まれているが、多孔質材料におけるほとんどのアプリケーションは、教師付きMLを使用するため、我々のレビューは、教師付きMLの異なるアプローチに焦点を当てている。
特に、MLプロセスを最適化する異なる手法と、異なる手法の性能を定量化する方法についてレビューする。
第2部では,多孔質材料にMLの異なるアプローチを適用した方法について述べる。
特に, ガス貯蔵・分離分野, 材料安定性, 電子特性, 合成分野への応用について論じる。
トピックの範囲は、ビッグデータ科学で研究可能な、さまざまなトピックを示しています。
mlにおける科学コミュニティの関心が高まる中、このリストは今後数年で急速に拡大すると予想しています。
関連論文リスト
- Assessing data-driven predictions of band gap and electrical conductivity for transparent conducting materials [10.3054383984768]
本稿では,新しい透明導電材料発見の促進を目的としたデータ駆動型フレームワークを提案する。
利用可能なデータの不足を軽減するため、ユニークな実験データベースを作成し、検証する。
我々は、既知のTCMの典型的な要素を含む55の合成の一覧において、本手法を検証した。
論文 参考訳(メタデータ) (2024-11-21T11:37:05Z) - Recent Advances on Machine Learning for Computational Fluid Dynamics: A Survey [51.87875066383221]
本稿では、基本概念、従来の手法、ベンチマークデータセットを紹介し、CFDを改善する上で機械学習が果たす様々な役割について検討する。
我々は,空気力学,燃焼,大気・海洋科学,生物流体,プラズマ,記号回帰,秩序の低減など,CFDにおけるMLの現実的な応用を強調した。
シミュレーションの精度を向上し、計算時間を短縮し、流体力学のより複雑な解析を可能にすることにより、MLはCFD研究を大きく変革する可能性があるという結論を導いた。
論文 参考訳(メタデータ) (2024-08-22T07:33:11Z) - Accelerating materials discovery for polymer solar cells: Data-driven insights enabled by natural language processing [5.527358421206627]
本稿では, 高分子太陽電池ドナー/アクセプターペアの発見のための各種能動的学習手法のシミュレーションを行う。
提案手法は, 材料革新の15年間の加速に相当し, 発見時間を約75%短縮する可能性を示した。
論文 参考訳(メタデータ) (2024-02-29T18:54:46Z) - MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials
Modeling [7.142619575624596]
MatSci MLは機械学習(MatSci ML)法を用いたMATerials SCIenceをモデル化するためのベンチマークである。
MatSci MLは、モデルトレーニングと評価のための多様な材料システムとプロパティデータを提供する。
マルチデータセットの学習環境において、MatchSci MLは、研究者が複数のデータセットからの観測を組み合わせ、共通の特性を共同で予測することを可能にする。
論文 参考訳(メタデータ) (2023-09-12T03:08:37Z) - Large Language Models as Master Key: Unlocking the Secrets of Materials
Science with GPT [9.33544942080883]
本稿では,物質科学におけるデバイスレベルでの情報抽出の複雑さに対処するため,構造化情報推論(SII)と呼ばれる自然言語処理(NLP)タスクを提案する。
我々は、既存のペロブスカイト型太陽電池FAIRデータセットに91.8%のF1スコアでGPT-3をチューニングし、リリース以来のデータでデータセットを拡張した。
また、太陽電池の電気性能を予測する実験を設計し、大規模言語モデル(LLM)を用いてターゲットパラメータを持つ材料や装置の設計を行った。
論文 参考訳(メタデータ) (2023-04-05T04:01:52Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Joint machine learning analysis of muon spectroscopy data from different
materials [0.0]
我々は、主成分分析(PCA)を用いて、ミューオン分光からのデータを調べる。
PCAは教師なしの機械学習ツールであり、入力データに関する仮定は不要である。
この方法は、基礎となる物理の異なる様々な磁性材料に適用された。
論文 参考訳(メタデータ) (2021-12-17T16:21:53Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Machine Learning Force Fields [54.48599172620472]
機械学習(ML)は、計算化学の多くの進歩を可能にした。
最も有望な応用の1つは、MLベースの力場(FF)の構築である。
本稿では,ML-FFの応用と,それらから得られる化学的知見について概説する。
論文 参考訳(メタデータ) (2020-10-14T13:14:14Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。