論文の概要: On the role of memorization in learned priors for geophysical inverse problems
- arxiv url: http://arxiv.org/abs/2603.19629v1
- Date: Fri, 20 Mar 2026 04:22:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.991102
- Title: On the role of memorization in learned priors for geophysical inverse problems
- Title(参考訳): 物理逆問題における先行学習における暗記の役割について
- Authors: Ali Siahkoohi, Davide Sabeddu,
- Abstract要約: 記憶化は拡散モデルの閉形式に先立ってガウス混合をもたらす。
フルウェーブフォームインバージョンのための拡散後サンプリングによる暗記の結果を示す。
- 参考スコア(独自算出の注目度): 2.5405233238972564
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learned priors based on deep generative models offer data-driven regularization for seismic inversion, but training them requires a dataset of representative subsurface models -- a resource that is inherently scarce in geoscience applications. Since the training objective of most generative models can be cast as maximum likelihood on a finite dataset, any such model risks converging to the empirical distribution -- effectively memorizing the training examples rather than learning the underlying geological distribution. We show that the posterior under such a memorized prior reduces to a reweighted empirical distribution -- i.e., a likelihood-weighted lookup among the stored training examples. For diffusion models specifically, memorization yields a Gaussian mixture prior in closed form, and linearizing the forward operator around each training example gives a Gaussian mixture posterior whose components have widths and shifts governed by the local Jacobian. We validate these predictions on a stylized inverse problem and demonstrate the consequences of memorization through diffusion posterior sampling for full waveform inversion.
- Abstract(参考訳): 深部生成モデルに基づく事前学習は、地震の逆転に対するデータ駆動の規則化を提供するが、それらのトレーニングには、代表的な地下モデルのデータセット -- 地学の応用に本質的に不足しているリソース -- を必要とする。ほとんどの生成モデルのトレーニング目的は、有限データセット上で最大限にキャストできるため、そのようなモデルが経験的分布に収束するリスク -- 基礎となる地層分布を学習するのではなく、トレーニング例を効果的に記憶する。
このような記憶された事前の後方は、記憶されたトレーニング例の中で、再重み付けされた経験的分布、すなわち、潜在的に重み付けされたルックアップに還元されることを示す。
拡散モデルに特化して、記憶化は閉形式に先立ってガウス混合を生じ、各訓練例の周りで前方作用素を線型化すると、成分が局所ジャコビアンによって支配される幅とシフトを持つガウス混合が後続する。
我々は,これらの予測をスタイリングされた逆問題に対して検証し,フルウェーブフォームインバージョンのための拡散後サンプリングによる記憶結果を示す。
関連論文リスト
- Reducing Memorisation in Generative Models via Riemannian Bayesian Inference [40.41090345118905]
データ分布の変動をよりよく捉えた予測後部を構築する。
提案手法は,一般化を保ちながら記憶を減少させることを示した。
全体として,損失の幾何学を考えることで,パラメータ空間の有効利用が可能となることを示す。
論文 参考訳(メタデータ) (2026-01-30T11:08:51Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - Tackling the Problem of Distributional Shifts: Correcting Misspecified, High-Dimensional Data-Driven Priors for Inverse Problems [39.58317527488534]
天体物理学の応用では、基礎となるデータ生成プロセスから独立した、あるいは同一に分散したサンプルを取得することはしばしば困難または不可能である。
本稿では,異なる観測セットの後方サンプルを用いてモデルを再学習し,集団レベルの分布を反復的に更新することでこの問題に対処することを提案する。
そこで本研究では,不特定分布から,更新分布が個体群レベルの分布に徐々に近づきつつあることを示す。
論文 参考訳(メタデータ) (2024-07-24T22:39:27Z) - Amortizing intractable inference in diffusion models for vision, language, and control [89.65631572949702]
本稿では,p(mathbfx)$以前の拡散生成モデルとブラックボックス制約,あるいは関数$r(mathbfx)$からなるモデルにおいて,データ上の後部サンプルである $mathbfxsim prm post(mathbfx)propto p(mathbfx)r(mathbfx)$について検討する。
我々は,データフリー学習目標である相対軌道バランスの正しさを,サンプルから抽出した拡散モデルの訓練のために証明する。
論文 参考訳(メタデータ) (2024-05-31T16:18:46Z) - Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Out of the Ordinary: Spectrally Adapting Regression for Covariate Shift [12.770658031721435]
本稿では,学習前のニューラル回帰モデルの最後の層の重みを適応させて,異なる分布から得られる入力データを改善する手法を提案する。
本稿では,この軽量なスペクトル適応手法により,合成および実世界のデータセットの分布外性能が向上することを示す。
論文 参考訳(メタデータ) (2023-12-29T04:15:58Z) - Fast Estimation of Bayesian State Space Models Using Amortized
Simulation-Based Inference [0.0]
本稿では,ベイズ状態空間モデルの隠れ状態を推定するための高速アルゴリズムを提案する。
事前トレーニングの後、データセットの後方分布を見つけるには、100分の1秒から10分の1秒かかる。
論文 参考訳(メタデータ) (2022-10-13T16:37:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。