論文の概要: Information fusion strategy integrating pre-trained language model and contrastive learning for materials knowledge mining
- arxiv url: http://arxiv.org/abs/2506.12516v1
- Date: Sat, 14 Jun 2025 14:09:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.40093
- Title: Information fusion strategy integrating pre-trained language model and contrastive learning for materials knowledge mining
- Title(参考訳): 知識マイニングのための事前学習言語モデルとコントラスト学習を組み合わせた情報融合戦略
- Authors: Yongqian Peng, Zhouran Zhang, Longhui Zhang, Fengyuan Zhao, Yahao Li, Yicong Ye, Shuxin Bai,
- Abstract要約: 機械学習は材料設計に革命をもたらしたが、合金の延性のような複雑な特性を予測することは依然として難しい。
本稿では,これらの制約を克服するために,材料科学文献のドメイン固有テキストと量的物理記述子を統合する,革新的な情報融合アーキテクチャを提案する。
本フレームワークでは,テキスト理解の高度化にMatSciBERTを使用し,処理パラメータや微細構造特性に関する暗黙的な知識を自動的に抽出するコントラスト学習を取り入れている。
- 参考スコア(独自算出の注目度): 0.4128284355136163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning has revolutionized materials design, yet predicting complex properties like alloy ductility remains challenging due to the influence of processing conditions and microstructural features that resist quantification through traditional reductionist approaches. Here, we present an innovative information fusion architecture that integrates domain-specific texts from materials science literature with quantitative physical descriptors to overcome these limitations. Our framework employs MatSciBERT for advanced textual comprehension and incorporates contrastive learning to automatically extract implicit knowledge regarding processing parameters and microstructural characteristics. Through rigorous ablation studies and comparative experiments, the model demonstrates superior performance, achieving coefficient of determination (R2) values of 0.849 and 0.680 on titanium alloy validation set and refractory multi-principal-element alloy test set. This systematic approach provides a holistic framework for property prediction in complex material systems where quantitative descriptors are incomplete and establishes a foundation for knowledge-guided materials design and informatics-driven materials discovery.
- Abstract(参考訳): 機械学習は材料設計に革命をもたらしたが、従来の還元主義的アプローチによる処理条件や量子化に抵抗する微細構造の影響により、合金の延性のような複雑な特性を予測することは依然として困難である。
本稿では,これらの制約を克服するために,材料科学文献のドメイン固有テキストと量的物理記述子を統合する,革新的な情報融合アーキテクチャを提案する。
本フレームワークでは,テキスト理解の高度化にMatSciBERTを使用し,処理パラメータや微細構造特性に関する暗黙的な知識を自動的に抽出するコントラスト学習を取り入れている。
厳密なアブレーション実験および比較実験により, チタン合金評価セットの0.849および0.680の判定値(R2)と耐火性多元合金試験セットの判定値(R2)を達成し, 優れた性能を示す。
この体系的なアプローチは、量的記述子が不完全であり、知識誘導材料の設計と情報駆動材料発見の基礎を確立する複雑な材料システムにおいて、資産予測のための全体的枠組みを提供する。
関連論文リスト
- Causal Discovery from Data Assisted by Large Language Models [50.193740129296245]
知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。
本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。
SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文 参考訳(メタデータ) (2025-03-18T02:14:49Z) - Foundation Model for Composite Microstructures: Reconstruction, Stiffness, and Nonlinear Behavior Prediction [0.0]
複合材料に特化して設計された基礎モデルを提案する。
本研究は, 複合材料における基礎モデルの有効性と有効性について検証した。
このフレームワークは実験データが少ない場合でも高精度な予測を可能にする。
論文 参考訳(メタデータ) (2024-11-10T19:06:25Z) - From Tokens to Materials: Leveraging Language Models for Scientific Discovery [12.211984932142537]
本研究では, 材料科学における材料特性予測のための言語モデル埋め込みの適用について検討した。
本研究では、ドメイン固有モデル、特にMatBERTが、複合名や材料特性から暗黙的な知識を抽出する際の汎用モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-21T16:31:23Z) - Multimodal machine learning for materials science: composition-structure
bimodal learning for experimentally measured properties [4.495968252019426]
本稿では,構成構造ビモーダル学習による材料科学におけるマルチモーダル機械学習の新しいアプローチを提案する。
提案するCOSNetは,不完全な構造情報を持つ実験材料特性の学習と予測を強化するために設計されている。
論文 参考訳(メタデータ) (2023-08-04T02:04:52Z) - Structural and Statistical Texture Knowledge Distillation for Semantic Segmentation [72.19108372163868]
セグメンテーションのための構造的・統計的テクスチャ知識蒸留(SSTKD)フレームワークを提案する。
構造的テクスチャ知識のために,低レベルの特徴を分解するContourlet Decomposition Module (CDM)を導入する。
本稿では, 統計的テクスチャ知識を適応的に抽出し, 強化するDenoized Texture Intensity Equalization Module (DTIEM)を提案する。
論文 参考訳(メタデータ) (2023-05-06T06:01:11Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。