論文の概要: MULTISEISMO: A Multimodal Seismic Dataset and Model for Cross-Modal Seismic Understanding
- arxiv url: http://arxiv.org/abs/2605.26320v1
- Date: Mon, 25 May 2026 20:35:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.460912
- Title: MULTISEISMO: A Multimodal Seismic Dataset and Model for Cross-Modal Seismic Understanding
- Title(参考訳): 多モード地震データベースMultiSEISMOとクロスモーダル地震理解モデル
- Authors: Sai Munikoti, Ian Stewart, Chengping Chai, Lisa Linville, Scott Vasquez, Sameera Horawalavithana, Karl Pazdernik,
- Abstract要約: 地震学では、地震現象を理解するためには、時系列波形データ、地理画像、文脈メタデータの合成が必要である。
我々は,2010年から2023年までの13年間にわたる16K以上の地震事象にまたがる大規模構造的マルチモーダルデータセットであるMultiSeismoを提案する。
各イベントデータは、グローバルステーションネットワーク、強度マップ、人口暴露の可視化、および包括的なテキストフォーマットからの波形記録を統合する。
我々は,既存のマルチモーダルモデル (Unified IO 2) を特殊時間エンコーダで拡張したファインチューンを利用して,包括的地震解析のための最初のドメイン固有マルチモーダルモデルであるSeesModalを生成する。
- 参考スコア(独自算出の注目度): 1.0407464689506312
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The application of generalist multimodal models (GMMs) to specialized scientific domains remains limited due to the scarcity of comprehensive domain-specific datasets that integrate multiple data modalities beyond text and images. In seismology, understanding earthquake phenomena requires the synthesis of timeseries waveform data, geographical imagery, and contextual metadata, a multimodal integration absent in existing seismic datasets. We present MultiSeismo, a large scale structured multimodal seismic dataset, comprising over 16K seismic events spanning 13 years (2010 to 2023) across diverse geographical regions. Each event data integrates waveform recordings from global station networks, intensity maps, population exposure visualizations, and a comprehensive textual description within a standardized JSON format. We additionally develop MISCE, a multimodal instruction set on top of raw data to enable supervised training and evaluation of GMMs on seismic reasoning tasks ranging from basic information retrieval to complex cross modal analysis. We leverage MISCE to finetune an existing multimodal model (Unified IO 2) enhanced with a specialized timeseries encoder, which yields SeisModal, the first domain specific multimodal model for comprehensive seismic analysis. Evaluation of state of the art multimodal models on MultiSeismo reveals significant challenges, particularly with time-series data processing for general purpose models, while demonstrating SeisModal's superior performance on seismic multimodal reasoning tasks. These results prove that MultiSeismo provides a rigorous benchmark for future multimodal research in seismology and validate the success of our domain specific architectural adaptations.
- Abstract(参考訳): 汎用マルチモーダルモデル(GMM)の専門分野への応用は、テキストや画像以外の複数のデータモダリティを統合する包括的なドメイン固有データセットが不足しているため、依然として限られている。
地震学では、地震現象を理解するためには、既存の地震データセットにない時系列波形データ、地理画像、文脈メタデータの合成が必要である。
本研究は,2010年から2023年までの13年間にわたる16K以上の地震活動を含む大規模構造型マルチモーダル地震観測データであるMultiSeismoについて述べる。
各イベントデータは、グローバルステーションネットワークからの波形記録、強度マップ、人口暴露の可視化、標準化されたJSONフォーマット内の包括的なテキスト記述を統合する。
さらに、基本情報検索から複雑なクロスモーダル解析に至るまでの地震推論タスクにおいて、GMMの教師付きトレーニングと評価を可能にするために、原データ上に設定されたマルチモーダル命令であるMISCEを開発する。
我々はMISCEを利用して既存のマルチモーダルモデルを微調整する(Unified IO2)。
マルチ地震によるマルチモーダルモデルの評価は,特に汎用モデルにおける時系列データ処理において,地震動マルチモーダル推論タスクにおけるSeesModalの優れた性能を示しながら,重要な課題を浮き彫りにしている。
これらの結果から,MultiSeismoは今後の地震学のマルチモーダル研究のための厳密なベンチマークを提供し,ドメイン固有のアーキテクチャ適応の成功を検証している。
関連論文リスト
- Empowering Time Series Analysis with Large-Scale Multimodal Pretraining [34.22079919081765]
マルチモーダル・ファンデーション・モデルの構築は次の自然なステップだが、重要な課題に直面している。
時系列解析のための統合型マルチモーダル事前学習パラダイムと大規模マルチモーダルコーパスの欠如
不均一なモジュラリティを効果的に統合し、モデルの一般化を強化する方法。
論文 参考訳(メタデータ) (2026-02-05T13:26:35Z) - A General-Purpose Diversified 2D Seismic Image Dataset from NAMSS [1.9685228653779]
Unicamp-NAMSSデータセットは、大きく、多様性があり、地理的に分散した2D地震の集合体である。
我々は,国立海洋地震調査資料館 (NAMSS) から, 数十年にわたって公開されている海洋地震データを含むデータセットを構築した。
論文 参考訳(メタデータ) (2026-01-27T14:01:29Z) - GridMind: A Multi-Agent NLP Framework for Unified, Cross-Modal NFL Data Insights [0.0]
本稿では,Retrieval-Augmented Generation (RAG) と大規模言語モデル (LLM) を通じて構造化,半構造化,非構造化データを統一するフレームワークであるGridMindを紹介する。
このアプローチはマルチモーダル表現学習の進化する分野と一致する。
論文 参考訳(メタデータ) (2025-03-24T18:33:36Z) - Multi-modal Time Series Analysis: A Tutorial and Survey [36.93906365779472]
マルチモーダル時系列分析はデータマイニングにおいて顕著な研究領域となっている。
しかし、マルチモーダル時系列の効果的な解析は、データの不均一性、モダリティギャップ、不整合、固有ノイズによって妨げられる。
マルチモーダル時系列法の最近の進歩は、クロスモーダル相互作用を通じて、マルチモーダルコンテキストを利用した。
論文 参考訳(メタデータ) (2025-03-17T20:30:02Z) - mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data [71.352883755806]
マルチモーダル埋め込みモデルは、テキストや画像などの様々なモダリティからデータを統一表現空間にマッピングする能力において、大きな注目を集めている。
しかし、ラベル付きマルチモーダルデータは、しばしば埋め込み性能を妨げる。
近年のアプローチでは、この問題に対処するためにデータ合成を活用しているが、合成データの質は依然として重大なボトルネックとなっている。
論文 参考訳(メタデータ) (2025-02-12T15:03:33Z) - SM3Det: A Unified Model for Multi-Modal Remote Sensing Object Detection [79.58755811919366]
本稿では,リモートセンシングのためのマルチモーダルデータセットとマルチタスクオブジェクト検出(M2Det)という新しいタスクを提案する。
水平方向または指向方向の物体を、あらゆるセンサーから正確に検出するように設計されている。
この課題は、1)マルチモーダルモデリングの管理に関わるトレードオフ、2)マルチタスク最適化の複雑さに起因する。
論文 参考訳(メタデータ) (2024-12-30T02:47:51Z) - UniTraj: Learning a Universal Trajectory Foundation Model from Billion-Scale Worldwide Traces [64.24594320103066]
ユニバーサルな軌跡基礎モデルを構築することは、既存の軌跡モデリングアプローチの限界に対処するための有望な解決策である。
以下、UniTrajを紹介します。UniTrajは3つの重要なイノベーションを通じてこれらの制限に対処することを目的としています。
まず、70か国にまたがる数十億のGPSポイントを持つ、前例のない245万のトラジェクトリのデータセットであるWorldTraceを構築します。
論文 参考訳(メタデータ) (2024-11-06T12:06:43Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - SeisCLIP: A seismology foundation model pre-trained by multi-modal data
for multi-purpose seismic feature extraction [16.01738433164131]
マルチモーダルデータからのコントラスト学習を通じて学習した地震基盤モデルであるSeesCLIPを開発した。
時間周波数の地震スペクトルから重要な特徴を抽出するトランスフォーマーエンコーダと、同じ事象の位相とソース情報を統合するための基礎エンコーダから構成される。
特に、SeesCLIPのパフォーマンスは、イベント分類、ローカライゼーション、焦点機構解析タスクにおけるベースライン手法を上回る。
論文 参考訳(メタデータ) (2023-09-05T15:40:13Z) - High-Modality Multimodal Transformer: Quantifying Modality & Interaction
Heterogeneity for High-Modality Representation Learning [112.51498431119616]
本稿では,多種多様なモダリティを含む高モダリティシナリオに対する効率的な表現学習について検討する。
単一のモデルであるHighMMTは、テキスト、画像、オーディオ、ビデオ、センサー、プロプレセプション、スピーチ、時系列、セット、テーブル)と5つの研究領域から15のタスクをスケールする。
論文 参考訳(メタデータ) (2022-03-02T18:56:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。