論文の概要: Topic Modeling and Link-Prediction for Material Property Discovery
- arxiv url: http://arxiv.org/abs/2507.06139v1
- Date: Tue, 08 Jul 2025 16:20:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:38.340714
- Title: Topic Modeling and Link-Prediction for Material Property Discovery
- Title(参考訳): 資料発見のためのトピックモデリングとリンク予測
- Authors: Ryan C. Barron, Maksim E. Eren, Valentin Stanev, Cynthia Matuszek, Boian S. Alexandrov,
- Abstract要約: リンク予測は、接続パターンに基づいて、グラフノード間の欠落または将来の関係を推測する。
本稿では,行列因数分解を統合し,隠れた関係を推定するAI駆動階層型リンク予測フレームワークを提案する。
本手法は, 科学文献から構築した潜伏する話題の関連付けに, 資料のグラフに隠れた関係を見出す。
- 参考スコア(独自算出の注目度): 6.0045906216050815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Link prediction infers missing or future relations between graph nodes, based on connection patterns. Scientific literature networks and knowledge graphs are typically large, sparse, and noisy, and often contain missing links between entities. We present an AI-driven hierarchical link prediction framework that integrates matrix factorization to infer hidden associations and steer discovery in complex material domains. Our method combines Hierarchical Nonnegative Matrix Factorization (HNMFk) and Boolean matrix factorization (BNMFk) with automatic model selection, as well as Logistic matrix factorization (LMF), we use to construct a three-level topic tree from a 46,862-document corpus focused on 73 transition-metal dichalcogenides (TMDs). These materials are studied in a variety of physics fields with many current and potential applications. An ensemble BNMFk + LMF approach fuses discrete interpretability with probabilistic scoring. The resulting HNMFk clusters map each material onto coherent topics like superconductivity, energy storage, and tribology. Also, missing or weakly connected links are highlight between topics and materials, suggesting novel hypotheses for cross-disciplinary exploration. We validate our method by removing publications about superconductivity in well-known superconductors, and show the model predicts associations with the superconducting TMD clusters. This shows the method finds hidden connections in a graph of material to latent topic associations built from scientific literature, especially useful when examining a diverse corpus of scientific documents covering the same class of phenomena or materials but originating from distinct communities and perspectives. The inferred links generating new hypotheses, produced by our method, are exposed through an interactive Streamlit dashboard, designed for human-in-the-loop scientific discovery.
- Abstract(参考訳): リンク予測は、接続パターンに基づいて、グラフノード間の欠落または将来の関係を推測する。
科学文献ネットワークと知識グラフは、典型的には大きく、疎く、騒々しく、しばしば実体間のリンクが欠落している。
複雑な物質領域における隠れた関連やステア発見を推論するために,行列因数分解を統合したAIによる階層的リンク予測フレームワークを提案する。
本手法は階層的非負行列因子化(HNMFk)とブール行列因子化(BNMFk)と自動モデル選択とを組み合わせるとともに,遷移金属シアルコゲナイド(TMDs)に焦点をあてた46,862個の文書コーパスから3段階のトピックツリーを構築する。
これらの材料は、様々な物理学分野において、多くの現在および潜在的応用について研究されている。
アンサンブルBNMFk + LMFアプローチは、確率的スコアリングと離散的解釈可能性を融合させる。
得られたHNMFkクラスターは、各物質を超伝導、エネルギー貯蔵、トライボロジーといったコヒーレントなトピックにマッピングする。
また、欠落したリンクや弱いリンクはトピックと材料の間のハイライトであり、学際的な探索のための新しい仮説を示唆している。
本手法は, 超伝導体における超伝導の公告を除去し, 超伝導TMDクラスターとの相関を予測できることを示す。
この方法では、科学文献から構築された潜伏する話題の関連性に関するグラフに隠された関係を見出すことができ、特に、同じ種類の現象や物質をカバーしているが、異なるコミュニティや視点から派生した様々な科学文書のコーパスを調べる際に有用である。
提案手法によって生成された新しい仮説を生成する推論リンクは,人間とループの科学的発見のために設計されたインタラクティブなStreamlitダッシュボードを通じて公開される。
関連論文リスト
- Causal Discovery from Data Assisted by Large Language Models [50.193740129296245]
知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。
本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。
SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文 参考訳(メタデータ) (2025-03-18T02:14:49Z) - Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Representation, and Multimodal Intelligent Graph Reasoning [0.0]
我々は1000の科学論文からなるデータセットを、オントロジ知識グラフに変換した。
我々はノード度を計算し、コミュニティと接続性を同定し、クラスタリング係数とピボットノード間の重心性を評価した。
グラフは本質的に無スケールの性質を持ち、高連結であり、グラフ推論に使用できる。
論文 参考訳(メタデータ) (2024-03-18T17:30:27Z) - Learning Complete Topology-Aware Correlations Between Relations for Inductive Link Prediction [121.65152276851619]
関係性間の意味的相関は本質的にエッジレベルとエンティティ非依存であることを示す。
本研究では,関係関係のトポロジ・アウェア・コレレーションをモデル化するための新しいサブグラフベース手法,TACOを提案する。
RCNのポテンシャルをさらに活用するために, 完全コモンニアインダストリアルサブグラフを提案する。
論文 参考訳(メタデータ) (2023-09-20T08:11:58Z) - Band-gap regression with architecture-optimized message-passing neural
networks [1.9590152885845324]
AFLOWデータベースからの密度汎関数理論データから材料を金属または半導体/絶縁体として分類するMPNNを訓練する。
次に,MPNNのモデル構造とハイパーパラメータ空間を探索し,非金属と同定された材料のバンドギャップを予測する。
検索から得られる最高のパフォーマンスモデルはアンサンブルにまとめられ、既存のモデルよりもはるかに優れています。
論文 参考訳(メタデータ) (2023-09-12T16:13:10Z) - Knowledge-Enhanced Hierarchical Information Correlation Learning for
Multi-Modal Rumor Detection [82.94413676131545]
マルチモーダルなうわさ検出のための知識強化型階層型情報相関学習手法(KhiCL)を提案する。
KhiCLは異質な一様性特徴を共通特徴空間に伝達するために、クロスモーダルな関節辞書を利用する。
画像やテキストから視覚的およびテキスト的実体を抽出し、知識関連推論戦略を設計する。
論文 参考訳(メタデータ) (2023-06-28T06:08:20Z) - Sawtooth Factorial Topic Embeddings Guided Gamma Belief Network [49.458250193768826]
本稿では,文書の深部生成モデルであるGBNのソートゥース要素埋め込みについて述べる。
単語も話題も同じ次元の埋め込みベクトルとして表現される。
我々のモデルは、より深い解釈可能なトピックを抽出する他のニューラルネットワークモデルよりも優れています。
論文 参考訳(メタデータ) (2021-06-30T10:14:57Z) - Graph Neural Network for Hamiltonian-Based Material Property Prediction [56.94118357003096]
無機材料のバンドギャップを予測できるいくつかの異なるグラフ畳み込みネットワークを提示し、比較する。
モデルは、それぞれの軌道自体の情報と相互の相互作用の2つの異なる特徴を組み込むように開発されている。
その結果,クロスバリデーションにより予測精度が期待できることがわかった。
論文 参考訳(メタデータ) (2020-05-27T13:32:10Z) - Learning Bijective Feature Maps for Linear ICA [73.85904548374575]
画像データに適した既存の確率的深層生成モデル (DGM) は, 非線形ICAタスクでは不十分であることを示す。
そこで本研究では,2次元特徴写像と線形ICAモデルを組み合わせることで,高次元データに対する解釈可能な潜在構造を学習するDGMを提案する。
画像上のフローベースモデルや線形ICA、変分オートエンコーダよりも、高速に収束し、訓練が容易なモデルを作成し、教師なしの潜在因子発見を実現する。
論文 参考訳(メタデータ) (2020-02-18T17:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。