論文の概要: OpenSeisML: Open Large-Scale Real Seismic and well-log Dataset for Generative AI
- arxiv url: http://arxiv.org/abs/2605.20539v1
- Date: Tue, 19 May 2026 22:22:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.400309
- Title: OpenSeisML: Open Large-Scale Real Seismic and well-log Dataset for Generative AI
- Title(参考訳): OpenSeisML: ジェネレーティブAIのための大規模実地震と適切なログデータセット
- Authors: Ipsita Bhar, Huseyin Tuna Erdinc, Thales Souza, Charles Jones, Felix J. Herrmann,
- Abstract要約: 我々は, 地震インバージョンのための生成AI(Gen-AI)を支援する, 実地震の集合であるOpenSeisMLを提案する。
データセットは、英国国立データリポジトリ(NDR)で公開されている調査から収集される。
我々は、チェックショットデータを用いて、時間-深度関係を確立し、データセットを通して速度モデルを構築し、ポストスタック地震データの正確な変換を行う。
- 参考スコア(独自算出の注目度): 1.379457310965574
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of machine learning (ML) and computer vision has significantly accelerated seismic inversion workflows by reducing the computational cost of traditionally expensive iterative methods. However, the development and evaluation of ML methods remain limited by the scarcity of realistic velocity models, as most high-quality data are privately owned by oil and gas companies. To address this gap, we present OpenSeisML, a collection of real seismic datasets designed to support generative AI (Gen-AI) workflows for seismic inversion. The datasets are curated from publicly available surveys in the UK National Data Repository (NDR). When seismic volumes are in the time domain and wells are in depth, a time-to-depth conversion is required. We use checkshot data to establish the time-depth relationship and construct a velocity model through interpolation for accurate conversion of post-stack seismic data. Here, we present an automated data curation pipeline that enables seismic data preparation while ensuring reproducibility. The objective is to train a generative model that captures the statistical distribution of subsurface properties, enabling the synthesis of multiple statistically consistent realizations for uncertainty quantification which can act as a prior for seismic inversion.
- Abstract(参考訳): 機械学習(ML)とコンピュータビジョンの出現は、従来の高価な反復手法の計算コストを削減し、地震の逆転ワークフローを著しく加速させた。
しかし、ほとんどの高品質データは石油・ガス会社によって私有されているため、現実的な速度モデルが不足しているため、ML手法の開発と評価は依然として限られている。
このギャップに対処するために、私たちは、地震インバージョンのための生成AI(Gen-AI)ワークフローをサポートするように設計された、実際の地震データセットのコレクションであるOpenSeisMLを紹介します。
データセットは、英国国立データリポジトリ(NDR)で公開されている調査から収集される。
地震量が時間領域にあり、井戸が深さが深い場合には、時間から深さへの変換が必要となる。
我々は、チェックショットデータを用いて、時間-深度関係を確立し、補間による速度モデルを構築し、ポストスタック地震データの正確な変換を行う。
本稿では,再現性を確保しつつ,耐震データ作成を可能にする自動データキュレーションパイプラインを提案する。
目的は, 地下特性の統計的分布を捉えた生成モデルを訓練し, 地震インバージョンの前兆となる不確実な定量化のために, 複数の統計的に一貫した実現法を合成することである。
関連論文リスト
- SAGE: Subsurface AI-driven Geostatistical Extraction with proxy posterior [0.06524460254566902]
不完全な観測から統計的に一貫したプロキシ速度を生成するための新しいフレームワークであるSAGEを紹介する。
トレーニング中、SAGEは、両方のモード(井戸と地震)で条件付けられた速度モデル上のプロキシ後部モデルを学ぶ。
推論の際には、学習した分布に暗黙的に符号化された良質な情報を持つ、移行した画像にのみ条件付きフル解像度の速度場を生成する。
論文 参考訳(メタデータ) (2026-03-31T23:06:32Z) - Generative MIMO Beam Map Construction for Location Recovery and Beam Tracking [67.65578956523403]
本稿では,スパースチャネル状態情報(CSI)から位置ラベルを直接復元する生成フレームワークを提案する。
生のCSIを直接格納する代わりに、小型の低次元無線地図の埋め込みを学び、生成モデルを利用して高次元CSIを再構築する。
数値実験により,NLOSシナリオにおける局所化精度が30%以上向上し,20%のキャパシティゲインが得られることが示された。
論文 参考訳(メタデータ) (2025-11-21T07:25:49Z) - MAWIFlow Benchmark: Realistic Flow-Based Evaluation for Network Intrusion Detection [47.86433139298671]
本稿では,MAWILAB v1.1データセットから得られたフローベースベンチマークであるMAWIFlowを紹介する。
得られたデータセットは、2011年1月、2016年、2021年に太平洋横断のバックボーンのトラフィックから引き出された、時間的に異なるサンプルで構成されている。
決定木、ランダムフォレスト、XGBoost、ロジスティック回帰を含む伝統的な機械学習手法は、CNN-BiLSTMアーキテクチャに基づいたディープラーニングモデルと比較される。
論文 参考訳(メタデータ) (2025-06-20T14:51:35Z) - Deep Generative Data Assimilation in Multimodal Setting [0.1052166918701117]
本研究では,マルチモーダル・セッティングにおけるスコアベースラテント・アシミレーション(SLAMS)を提案する。
気象観測所のデータと衛星画像とを同化して、垂直温度分布を世界規模で校正する。
私たちの研究は、実世界のデータセットを用いたマルチモーダルデータ同化に、初めて深層生成フレームワークを適用しました。
論文 参考訳(メタデータ) (2024-04-10T00:25:09Z) - An Automated Machine Learning Approach for Detecting Anomalous Peak
Patterns in Time Series Data from a Research Watershed in the Northeastern
United States Critical Zone [3.1747517745997014]
本稿では,米国北東部臨界水域におけるセンサによる時系列データの異常検出を支援する機械学習フレームワークを提案する。
このフレームワークは特に、センサーの故障や自然現象から生じるピークパターンの異常を識別することに焦点を当てている。
論文 参考訳(メタデータ) (2023-09-14T19:07:50Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。