論文の概要: A unified multimodal understanding and generation model for cross-disciplinary scientific research
- arxiv url: http://arxiv.org/abs/2601.01363v1
- Date: Sun, 04 Jan 2026 04:31:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.255981
- Title: A unified multimodal understanding and generation model for cross-disciplinary scientific research
- Title(参考訳): 学際的科学研究のための統合マルチモーダル理解と生成モデル
- Authors: Xiaomeng Yang, Zhiyu Tan, Xiaohui Zhong, Mengping Yang, Qiusheng Huang, Lei Chen, Libo Wu, Hao Li,
- Abstract要約: FuXi-Uniは、科学的理解と単一のアーキテクチャ内の科学領域にわたる高忠実度生成のためのネイティブ統一マルチモーダルモデルである。
特に、FuXi-Uniは、自然言語トークン内の学際的な科学トークンを整列させ、科学トークンを再構築するために科学デコーダを使用している。
地球システムモデリングにおいて、このモデルは、グローバルな天気予報、熱帯サイクロン(TC)予測の編集、言語命令のみによって駆動される空間的ダウンスケーリングをサポートする。
- 参考スコア(独自算出の注目度): 20.510417042775973
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Scientific discovery increasingly relies on integrating heterogeneous, high-dimensional data across disciplines nowadays. While AI models have achieved notable success across various scientific domains, they typically remain domain-specific or lack the capability of simultaneously understanding and generating multimodal scientific data, particularly for high-dimensional data. Yet, many pressing global challenges and scientific problems are inherently cross-disciplinary and require coordinated progress across multiple fields. Here, we present FuXi-Uni, a native unified multimodal model for scientific understanding and high-fidelity generation across scientific domains within a single architecture. Specifically, FuXi-Uni aligns cross-disciplinary scientific tokens within natural language tokens and employs science decoder to reconstruct scientific tokens, thereby supporting both natural language conversation and scientific numerical prediction. Empirically, we validate FuXi-Uni in Earth science and Biomedicine. In Earth system modeling, the model supports global weather forecasting, tropical cyclone (TC) forecast editing, and spatial downscaling driven by only language instructions. FuXi-Uni generates 10-day global forecasts at 0.25° resolution that outperform the SOTA physical forecasting system. It shows superior performance for both TC track and intensity prediction relative to the SOTA physical model, and generates high-resolution regional weather fields that surpass standard interpolation baselines. Regarding biomedicine, FuXi-Uni outperforms leading multimodal large language models on multiple biomedical visual question answering benchmarks. By unifying heterogeneous scientific modalities within a native shared latent space while maintaining strong domain-specific performance, FuXi-Uni provides a step forward more general-purpose, multimodal scientific models.
- Abstract(参考訳): 科学的な発見は、近年、様々な分野にまたがる異質で高次元のデータの統合にますます依存している。
AIモデルは、様々な科学的領域で顕著な成功を収めてきたが、通常、ドメイン固有のままであり、特に高次元データに対して、マルチモーダルな科学データを同時に理解し、生成する能力が欠如している。
しかし、グローバルな課題や科学的問題の多くは本質的に学際的であり、複数の分野にまたがって協調的な進歩を必要としている。
本稿では,科学的理解と単一アーキテクチャ内の科学的領域にわたる高忠実度生成のための,ネイティブ統一マルチモーダルモデルであるFuXi-Uniを紹介する。
特に、FuXi-Uniは、自然言語トークン内の学際的な科学トークンを整列させ、科学デコーダを使用して科学トークンを再構築し、自然言語の会話と科学的数値予測の両方をサポートする。
実証実験により,地球科学と生物医学におけるFuXi-Uniの検証を行った。
地球システムモデリングにおいて、このモデルは、グローバルな天気予報、熱帯サイクロン(TC)予測の編集、言語命令のみによって駆動される空間的ダウンスケーリングをサポートする。
FuXi-Uniは、SOTA物理予測システムを上回る0.25°解像度で10日間の世界予測を生成する。
標準補間基準を超越した高分解能の地域気象場を生成するため,SOTA物理モデルと比較して,TCトラックと強度予測の双方において優れた性能を示す。
バイオメディシンに関して、FuXi-Uniは、複数のバイオメディカル視覚的質問応答ベンチマークにおいて、マルチモーダルな大規模言語モデルよりも優れています。
ドメイン固有の強い性能を維持しながら、ネイティブ共有潜在空間内で異質な科学的モダリティを統一することにより、FuXi-Uniはより汎用的でマルチモーダルな科学モデルを前進させる。
関連論文リスト
- A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - Leveraging Large Language Models for Generating Research Topic Ontologies: A Multi-Disciplinary Study [0.8633013637160062]
本研究では,研究トピック間の意味的関係を識別する大規模言語モデルについて検討する。
実験の結果,PEM-Rel-8Kの微調整により,すべての分野において優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2025-08-28T11:53:45Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。
我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文 参考訳(メタデータ) (2024-06-16T08:03:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。