論文の概要: Beyond Atomic Geometry Representations in Materials Science: A Human-in-the-Loop Multimodal Framework
- arxiv url: http://arxiv.org/abs/2506.00302v1
- Date: Fri, 30 May 2025 23:18:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.176692
- Title: Beyond Atomic Geometry Representations in Materials Science: A Human-in-the-Loop Multimodal Framework
- Title(参考訳): 材料科学における原子幾何表現の超越--人間とロボットのマルチモーダル・フレームワーク
- Authors: Can Polat, Hasan Kurban, Erchin Serpedin, Mustafa Kurban,
- Abstract要約: MultiCrystalSpectrumSet(MCS-Set)は、原子構造と2Dプロジェクションと構造化テキストアノテーションを統合することで、材料データセットを拡張するキュレートされたフレームワークである。
MCS-Setは,(1)マルチモーダル特性と要約予測,(2)部分クラスタ管理による制約結晶生成の2つの重要なタスクを実現する。
- 参考スコア(独自算出の注目度): 2.172419551358714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most materials science datasets are limited to atomic geometries (e.g., XYZ files), restricting their utility for multimodal learning and comprehensive data-centric analysis. These constraints have historically impeded the adoption of advanced machine learning techniques in the field. This work introduces MultiCrystalSpectrumSet (MCS-Set), a curated framework that expands materials datasets by integrating atomic structures with 2D projections and structured textual annotations, including lattice parameters and coordination metrics. MCS-Set enables two key tasks: (1) multimodal property and summary prediction, and (2) constrained crystal generation with partial cluster supervision. Leveraging a human-in-the-loop pipeline, MCS-Set combines domain expertise with standardized descriptors for high-quality annotation. Evaluations using state-of-the-art language and vision-language models reveal substantial modality-specific performance gaps and highlight the importance of annotation quality for generalization. MCS-Set offers a foundation for benchmarking multimodal models, advancing annotation practices, and promoting accessible, versatile materials science datasets. The dataset and implementations are available at https://github.com/KurbanIntelligenceLab/MultiCrystalSpectrumSet.
- Abstract(参考訳): ほとんどの材料科学データセットは、アトミックジオメトリ(例えばXYZファイル)に限られており、マルチモーダル学習と包括的データ中心分析の用途に制限されている。
これらの制約は、この分野における高度な機械学習技術の採用を歴史的に妨げてきた。
このフレームワークは、原子構造と2Dプロジェクションと構造化されたテキストアノテーションを統合することで、材料データセットを拡張する。
MCS-Setは,(1)マルチモーダル特性と要約予測,(2)部分クラスタ管理による制約結晶生成の2つの重要なタスクを実現する。
ヒューマン・イン・ザ・ループパイプラインを活用して、MCS-Setはドメインの専門知識と高品質なアノテーションのための標準化された記述子を組み合わせる。
最先端言語とビジョン言語モデルを用いた評価では、モダリティ固有のパフォーマンスギャップが著しく示され、一般化のためのアノテーション品質の重要性が強調される。
MCS-Setは、マルチモーダルモデルのベンチマーク、アノテーションの実践の進歩、アクセス可能な汎用的な材料科学データセットの促進のための基盤を提供する。
データセットと実装はhttps://github.com/KurbanIntelligenceLab/MultiCrystalSpectrumSetで公開されている。
関連論文リスト
- UniMat: Unifying Materials Embeddings through Multi-modal Learning [0.0]
材料科学における最も重要なモダリティを統一する上で,多モーダル学習(アライメントと融合)の手法を評価する。
構造グラフのモダリティはXRDパターンと整合することで向上できることを示す。
また、XRDパターンやコンポジションなどの実験的に利用できるデータフォーマットの整列と融合により、より堅牢な関節埋め込みが実現可能であることを示す。
論文 参考訳(メタデータ) (2024-11-13T14:55:08Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - Uni-MoE: Scaling Unified Multimodal LLMs with Mixture of Experts [54.529880848937104]
そこで我々は,MoEアーキテクチャをUni-MoEと呼ぶ一貫したMLLMを開発し,様々なモダリティを扱えるようにした。
具体的には、統一マルチモーダル表現のためのコネクタを持つモダリティ特化エンコーダを特徴とする。
マルチモーダルデータセットの包括的集合を用いた命令調整Uni-MoEの評価を行った。
論文 参考訳(メタデータ) (2024-05-18T12:16:01Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Pink: Unveiling the Power of Referential Comprehension for Multi-modal
LLMs [49.88461345825586]
本稿では,MLLMの微細な画像理解能力を高めるための新しい枠組みを提案する。
本稿では,既存のデータセットのアノテーションを活用して,命令チューニングデータセットを低コストで構築する手法を提案する。
本研究では,Qwen-VLよりも5.2%精度が向上し,Kosmos-2の精度が24.7%向上したことを示す。
論文 参考訳(メタデータ) (2023-10-01T05:53:15Z) - MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials
Modeling [7.142619575624596]
MatSci MLは機械学習(MatSci ML)法を用いたMATerials SCIenceをモデル化するためのベンチマークである。
MatSci MLは、モデルトレーニングと評価のための多様な材料システムとプロパティデータを提供する。
マルチデータセットの学習環境において、MatchSci MLは、研究者が複数のデータセットからの観測を組み合わせ、共通の特性を共同で予測することを可能にする。
論文 参考訳(メタデータ) (2023-09-12T03:08:37Z) - MESED: A Multi-modal Entity Set Expansion Dataset with Fine-grained
Semantic Classes and Hard Negative Entities [25.059177235004952]
本稿では,マルチモーダル・エンティティ・セット・エクスパンジョン(MESE)を提案する。
4つのマルチモーダル事前学習タスクで事前学習を行う強力なマルチモーダルモデルであるMultiExpanを提案する。
MESEDデータセットは、大規模かつ精巧な手動キャリブレーションを備えたESEのための最初のマルチモーダルデータセットである。
論文 参考訳(メタデータ) (2023-07-27T14:09:59Z) - Self-Supervised Multimodal Learning: A Survey [23.526389924804207]
マルチモーダル学習は、複数のモーダルからの情報を理解し分析することを目的としている。
高価なヒューマンアノテーションと組み合わせたデータへの大きな依存は、モデルのスケールアップを妨げる。
大規模無意味なデータが野生で利用可能であることを考えると、自己教師型学習は、アノテーションボトルネックを軽減するための魅力的な戦略となっている。
論文 参考訳(メタデータ) (2023-03-31T16:11:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。