論文の概要: A Large-scale Benchmark on Geological Fault Delineation Models: Domain Shift, Training Dynamics, Generalizability, Evaluation and Inferential Behavior
- arxiv url: http://arxiv.org/abs/2505.08585v1
- Date: Tue, 13 May 2025 13:56:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.593879
- Title: A Large-scale Benchmark on Geological Fault Delineation Models: Domain Shift, Training Dynamics, Generalizability, Evaluation and Inferential Behavior
- Title(参考訳): 地質断層線モデルに関する大規模ベンチマーク:ドメインシフト、トレーニングダイナミクス、一般化可能性、評価および推論行動
- Authors: Jorge Quesada, Chen Zhou, Prithwijit Chowdhury, Mohammad Alotaibi, Ahmad Mustafa, Yusufjon Kumamnov, Mohit Prabhushankar, Ghassan AlRegib,
- Abstract要約: 本稿では,地震解析における領域シフト戦略の回答とガイドラインを提供するために設計された,最初の大規模ベンチマーク研究について述べる。
我々のベンチマークは、3つの異種データセットでトレーニングされ評価された200ドル以上のモデルを含んでいる。
我々の分析は、現在の微調整プラクティスの脆弱さ、破滅的な忘れの出現、そして、パフォーマンスを体系的に解釈することの難しさを強調している。
- 参考スコア(独自算出の注目度): 12.23379456993682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning has taken a critical role in seismic interpretation workflows, especially in fault delineation tasks. However, despite the recent proliferation of pretrained models and synthetic datasets, the field still lacks a systematic understanding of the generalizability limits of these models across seismic data representing a variety of geologic, acquisition and processing settings. Distributional shifts between different data sources, limitations in fine-tuning strategies and labeled data accessibility, and inconsistent evaluation protocols all represent major roadblocks in the deployment of reliable and robust models in real-world exploration settings. In this paper, we present the first large-scale benchmarking study explicitly designed to provide answers and guidelines for domain shift strategies in seismic interpretation. Our benchmark encompasses over $200$ models trained and evaluated on three heterogeneous datasets (synthetic and real data) including FaultSeg3D, CRACKS, and Thebe. We systematically assess pretraining, fine-tuning, and joint training strategies under varying degrees of domain shift. Our analysis highlights the fragility of current fine-tuning practices, the emergence of catastrophic forgetting, and the challenges of interpreting performance in a systematic manner. We establish a robust experimental baseline to provide insights into the tradeoffs inherent to current fault delineation workflows, and shed light on directions for developing more generalizable, interpretable and effective machine learning models for seismic interpretation. The insights and analyses reported provide a set of guidelines on the deployment of fault delineation models within seismic interpretation workflows.
- Abstract(参考訳): 機械学習は地震解釈のワークフロー、特に断層記述タスクにおいて重要な役割を担っている。
しかし、最近の事前訓練されたモデルと合成データセットの増大にもかかわらず、この分野は、様々な地質学的、取得および処理設定を表す地震データ全体にわたって、これらのモデルの一般化可能性限界の体系的な理解を欠いている。
異なるデータソース間の分散シフト、微調整戦略の制限、ラベル付きデータアクセシビリティ、一貫性のない評価プロトコルはすべて、実世界の探索環境における信頼性と堅牢なモデルのデプロイにおける主要な障害を表している。
本稿では,地震の解釈における領域シフト戦略に対する回答とガイドラインを提供するために設計された,最初の大規模ベンチマーク研究について述べる。
我々のベンチマークは、FaultSeg3D、CRACKS、Thebeを含む3つの異種データセット(合成データと実データ)でトレーニングされ評価された200ドル以上のモデルを含んでいる。
ドメインシフトの度合いの異なる事前訓練,微調整,共同トレーニング戦略を体系的に評価した。
我々の分析は、現在の微調整プラクティスの脆弱さ、破滅的な忘れの出現、そして、パフォーマンスを体系的に解釈することの難しさを強調している。
我々は,現行の断層決定ワークフローに固有のトレードオフを把握し,より一般化可能な,解釈可能な,効果的な機械学習モデルを構築するための方向性に光を当てるために,堅牢な実験ベースラインを構築した。
報告された知見と分析は、地震の解釈ワークフローにおける断層記述モデルの展開に関する一連のガイドラインを提供する。
関連論文リスト
- Constructing balanced datasets for predicting failure modes in structural systems under seismic hazards [1.192436948211501]
本研究では、異なる障害モードを含むバランスのとれたデータセットを構築するためのフレームワークを提案する。
ディープニューラルネットワークモデルは、データセットのバランシングの重要性を強調するために、バランスの取れたデータセットと不均衡なデータセットに基づいてトレーニングされる。
論文 参考訳(メタデータ) (2025-02-26T22:11:51Z) - Mitigating Attrition: Data-Driven Approach Using Machine Learning and Data Engineering [0.0]
本稿では、機械学習とデータエンジニアリング技術を用いて、従業員の誘惑を緩和する新しいデータ駆動アプローチを提案する。
提案フレームワークは, 多様な人的資源システムからのデータを統合し, 高度な特徴工学を活用して, 誘惑に影響を及ぼす要因を包括的に把握する。
論文 参考訳(メタデータ) (2025-02-25T05:29:45Z) - Out-of-Distribution Detection on Graphs: A Survey [58.47395497985277]
グラフアウト・オブ・ディストリビューション(GOOD)検出は、トレーニング中に見られる分布から逸脱するグラフデータを特定することに焦点を当てる。
既存の手法を,拡張ベース,再構築ベース,情報伝達ベース,分類ベースという4つのタイプに分類する。
本稿では,グラフデータによるユニークな課題を浮き彫りにして,実践的応用と理論的基礎について論じる。
論文 参考訳(メタデータ) (2025-02-12T04:07:12Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - FaultSeg Swin-UNETR: Transformer-Based Self-Supervised Pretraining Model
for Fault Recognition [13.339333273943842]
本稿では,自己教師付き事前学習による地震断層認識の高度化手法を提案する。
我々は,Swin Transformerモデルをコアネットワークとして採用し,SimMIMプレトレーニングタスクを用いて,地震データにおける不連続性に関連する特徴を抽出した。
実験の結果,提案手法は,OISおよびODS測定値から,Thebeデータセット上での最先端性能を実現することができた。
論文 参考訳(メタデータ) (2023-10-27T08:38:59Z) - SimSCOOD: Systematic Analysis of Out-of-Distribution Generalization in
Fine-tuned Source Code Models [58.78043959556283]
本研究は,Low-Rank Adaptation (LoRA)ファインチューニング手法を含む,異なる微調整手法によるモデルの挙動について検討する。
解析の結果、LoRAファインチューニングは様々なシナリオにおけるフルファインチューニングよりも、OODの一般化性能が大幅に向上していることが判明した。
論文 参考訳(メタデータ) (2022-10-10T16:07:24Z) - An Information-theoretic Approach to Distribution Shifts [9.475039534437332]
機械学習モデルを現実世界に安全にデプロイすることは、しばしば難しいプロセスである。
特定の地理的位置から得られたデータで訓練されたモデルは、他の場所で得られたデータでクエリされたときに失敗する傾向がある。
集団のサブセットに適合するニューラルネットワークは 選択バイアスを 与えるかもしれない
論文 参考訳(メタデータ) (2021-06-07T16:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。