論文の概要: On the workflow, opportunities and challenges of developing foundation model in geophysics
- arxiv url: http://arxiv.org/abs/2504.17384v2
- Date: Fri, 25 Apr 2025 07:35:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.308897
- Title: On the workflow, opportunities and challenges of developing foundation model in geophysics
- Title(参考訳): 物理基礎モデル構築のワークフロー, 可能性, 課題について
- Authors: Hanlin Sheng, Xinming Wu, Hang Gao, Haibin Di, Sergey Fomel, Jintao Li, Xu Si,
- Abstract要約: 本稿では,地球物理データと連動して基礎モデルを開発する過程を体系的に検討する。
物理データの多様性,複雑性,物理的整合性の制約を考慮すると,対象とする解について論じる。
本稿では,基礎モデルの伝達学習能力を活用してラベル付きデータへの依存を減らし,計算効率を向上し,物理的制約をモデルトレーニングに組み込む方法について論じる。
- 参考スコア(独自算出の注目度): 9.358947092397052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models, as a mainstream technology in artificial intelligence, have demonstrated immense potential across various domains in recent years, particularly in handling complex tasks and multimodal data. In the field of geophysics, although the application of foundation models is gradually expanding, there is currently a lack of comprehensive reviews discussing the full workflow of integrating foundation models with geophysical data. To address this gap, this paper presents a complete framework that systematically explores the entire process of developing foundation models in conjunction with geophysical data. From data collection and preprocessing to model architecture selection, pre-training strategies, and model deployment, we provide a detailed analysis of the key techniques and methodologies at each stage. In particular, considering the diversity, complexity, and physical consistency constraints of geophysical data, we discuss targeted solutions to address these challenges. Furthermore, we discuss how to leverage the transfer learning capabilities of foundation models to reduce reliance on labeled data, enhance computational efficiency, and incorporate physical constraints into model training, thereby improving physical consistency and interpretability. Through a comprehensive summary and analysis of the current technological landscape, this paper not only fills the gap in the geophysics domain regarding a full-process review of foundation models but also offers valuable practical guidance for their application in geophysical data analysis, driving innovation and advancement in the field.
- Abstract(参考訳): 近年、人工知能の主流技術であるファンデーションモデルは、特に複雑なタスクやマルチモーダルデータの処理において、様々な領域で大きな可能性を実証している。
物理物理学の分野では、基礎モデルの適用は徐々に拡大しているが、現在、基礎モデルと物理データを統合するための完全なワークフローを議論する包括的なレビューの欠如がある。
このギャップに対処するために,本論文では,物理データとともに基礎モデルを開発する過程全体を体系的に探求する,完全な枠組みを提案する。
データ収集や前処理からモデルアーキテクチャの選択、事前学習戦略、モデル展開に至るまで、各段階で重要な技術や方法論を詳細に分析する。
特に、物理データの多様性、複雑さ、物理的一貫性の制約を考慮すると、これらの課題に対処するためのターゲットとなる解決策について議論する。
さらに,基礎モデルの伝達学習能力を活用してラベル付きデータへの依存を低減し,計算効率を向上し,物理的制約をモデルトレーニングに組み込むことにより,物理的整合性と解釈可能性を向上させる方法について考察する。
本論文は,現在の技術展望の包括的要約と分析を通じて,基礎モデルの全プロセスレビューにおける物理領域のギャップを埋めるだけでなく,物理データ解析,イノベーションの推進,分野の進歩に活用するための貴重な実践的ガイダンスを提供する。
関連論文リスト
- Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.17057231661371]
時系列解析は複雑なシステムの力学を理解するために重要である。
基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。
彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。
本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文 参考訳(メタデータ) (2025-03-14T13:53:46Z) - A Survey of Foundation Models for Environmental Science [16.426772639157704]
ファンデーションモデルは、多様なデータソースを統合することによって、変革的な機会を提供する。
我々は、学際的なコラボレーションを促進し、環境科学における持続可能なソリューションのための最先端の機械学習の統合を促進することを目的としている。
論文 参考訳(メタデータ) (2025-03-05T03:33:31Z) - A Survey of Model Architectures in Information Retrieval [64.75808744228067]
機能抽出のためのバックボーンモデルと、関連性推定のためのエンドツーエンドシステムアーキテクチャの2つの重要な側面に焦点を当てる。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
我々は、パフォーマンスとスケーラビリティのアーキテクチャ最適化、マルチモーダル、マルチランガルデータの処理、従来の検索パラダイムを超えた新しいアプリケーションドメインへの適応など、新たな課題と今後の方向性について議論することで結論付けた。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - Redefining Data-Centric Design: A New Approach with a Domain Model and Core Data Ontology for Computational Systems [2.872069347343959]
本稿では,新しい情報ドメインモデルを導入することにより,計算システムを設計するための革新的なデータ中心パラダイムを提案する。
提案モデルは従来のノード中心のフレームワークから離れ、オブジェクト、イベント、コンセプト、アクションを組み込んだマルチモーダルアプローチを使用して、データ中心の分類に焦点を当てている。
論文 参考訳(メタデータ) (2024-09-01T22:34:12Z) - Relational Learning in Pre-Trained Models: A Theory from Hypergraph Recovery Perspective [60.64922606733441]
我々は,関係学習をハイパーグラフリカバリとして形式化する数学的モデルを導入し,基礎モデル(FM)の事前学習について検討する。
我々のフレームワークでは、世界はハイパーグラフとして表現され、データはハイパーエッジからランダムなサンプルとして抽象化される。我々は、このハイパーグラフを復元するための事前学習モデル(PTM)の有効性を理論的に検証し、ミニマックスに近い最適スタイルでデータ効率を解析する。
論文 参考訳(メタデータ) (2024-06-17T06:20:39Z) - Towards Next-Generation Urban Decision Support Systems through AI-Powered Construction of Scientific Ontology using Large Language Models -- A Case in Optimizing Intermodal Freight Transportation [1.6230958216521798]
本研究では,事前学習された大規模言語モデル(LLM)を活用する可能性について検討する。
推論コアとしてChatGPT APIを採用することで、自然言語処理、メソノロジーベースのプロンプトチューニング、トランスフォーマーを含む統合ワークフローを概説する。
我々の方法論の成果は、広く採用されているオントロジー言語(OWL、RDF、SPARQLなど)の知識グラフである。
論文 参考訳(メタデータ) (2024-05-29T16:40:31Z) - Graph Foundation Models: Concepts, Opportunities and Challenges [66.37994863159861]
ファンデーションモデルは、さまざまな人工知能アプリケーションにおいて重要なコンポーネントとして現れてきた。
一般化と適応における基礎モデルの能力は、グラフ機械学習研究者を動機付け、新しいグラフ学習パラダイムを開発する可能性について議論する。
本稿では,グラフ基礎モデル(GFM)の概念を紹介し,その重要な特徴と基礎技術について概説する。
論文 参考訳(メタデータ) (2023-10-18T09:31:21Z) - When Geoscience Meets Foundation Models: Towards General Geoscience Artificial Intelligence System [6.445323648941926]
地球科学基礎モデル(Geoscience foundation model, GFMs)は、地球系の力学のシミュレーションと理解を強化するために、広範な学際データを統合するパラダイムシフトソリューションである。
GFMのユニークな長所は、フレキシブルなタスク仕様、多様な入出力能力、マルチモーダルな知識表現である。
このレビューは、先進的なAI技術と地球科学の交差点における未解決の機会を強調した、新興の地球科学研究パラダイムの包括的概要を提供する。
論文 参考訳(メタデータ) (2023-09-13T08:44:09Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Towards Geospatial Foundation Models via Continual Pretraining [22.825065739563296]
資源コストと炭素の影響を最小限に抑えた高効率基礎モデルを構築するための新しいパラダイムを提案する。
まず、複数のソースからコンパクトだが多様なデータセットを構築し、GeoPileと呼ぶ特徴の多様性を促進する。
次に,大規模なImageNet-22kモデルからの継続事前学習の可能性について検討し,多目的連続事前学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-09T07:39:02Z) - Constructing Neural Network-Based Models for Simulating Dynamical
Systems [59.0861954179401]
データ駆動モデリングは、真のシステムの観測からシステムの力学の近似を学ぼうとする代替パラダイムである。
本稿では,ニューラルネットワークを用いた動的システムのモデル構築方法について検討する。
基礎的な概要に加えて、関連する文献を概説し、このモデリングパラダイムが克服すべき数値シミュレーションから最も重要な課題を概説する。
論文 参考訳(メタデータ) (2021-11-02T10:51:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。