論文の概要: Deterministic Denominator Design for Localized Tamed Stochastic-Gradient Langevin Dynamics
- arxiv url: http://arxiv.org/abs/2606.10559v1
- Date: Tue, 09 Jun 2026 08:25:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.390771
- Title: Deterministic Denominator Design for Localized Tamed Stochastic-Gradient Langevin Dynamics
- Title(参考訳): 局所化確率勾配ランゲヴィンダイナミクスに対する決定論的決定子設計
- Authors: Yiwei Zhou, Ziheng Chen,
- Abstract要約: Tamed-gradient Langevin dynamics (SGLD) は、更新に分母を追加することで大きなドリフトを安定化する。
本研究では, 状態依存エンベロープを現行のオラクルサンプルを描画する前に固定する決定論的ディノミネータについて検討する。
実験により、プロキシ量子分母はオラクルスコアの挙動に近づき、ランダム・デノミネータ平均シフトチャネルを避け、単純な決定論的選択を改善することが示されている。
- 参考スコア(独自算出の注目度): 10.599439539657785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tamed stochastic-gradient Langevin dynamics (SGLD) stabilizes large drifts by adding a denominator to the update. If this denominator uses the same stochastic-gradient sample as the update step, it can also change the conditional mean drift. We study deterministic denominators: the state-dependent envelope is fixed before the current oracle sample is drawn. The main question is how to design this envelope in practice. The design starts from an oracle score, builds a low-cost proxy score on pilot states, chooses activation thresholds by empirical quantiles, and then applies a small calibration layer. The analysis tracks three steps: proxy and threshold errors become envelope errors; envelope errors perturb one SGLD step; and the local residuals give stationary errors through a conditional perturbation bridge. Experiments show that the proxy-quantile denominators are close to oracle-score behavior, avoid the random-denominator mean-shift channel, and improve simple deterministic taming choices.
- Abstract(参考訳): Tamed stochastic-gradient Langevin dynamics (SGLD)は、更新に分母を追加することで大きなドリフトを安定化する。
この分母が更新ステップと同じ確率勾配サンプルを使用する場合、条件平均ドリフトを変更することもできる。
本研究では, 状態依存エンベロープを現行のオラクルサンプルを描画する前に固定する決定論的ディノミネータについて検討する。
主な問題は、どのようにしてこの封筒を実際に設計するかである。
設計はオラクルのスコアから始まり、パイロット状態に低コストのプロキシスコアを構築し、経験的量子化によってアクティベーションしきい値を選択し、小さなキャリブレーション層を適用します。
分析では、プロキシとしきい値エラーがエンベロープエラーになり、エンベロープエラーが1つのSGLDステップに乱れ、ローカル残差が条件付き摂動ブリッジを介して定常的なエラーを与える。
実験により、プロキシ量子化分母はオラクルスコアの挙動に近づき、ランダムデノミネータ平均シフトチャネルを回避し、単純な決定論的テイミング選択を改善することが示されている。
関連論文リスト
- Deterministic Envelopes for Tamed SGLD: Decoupling Stochastic-Gradient Noise and Localizing Taming [10.599439539657785]
ランゲヴィンアルゴリズムは、しばしば非グロブリーリプシッツドリフトを安定化するためにテーマディノミネーターを使用する。
本稿では, 安定化分母が数値化子と同じ段階的実現に依存する場合, テーキングステップがオラクル自体を変化させ, 定常バイアスを生じさせることを示す。
そこで我々は, 組込み型分母を設計するための構造保存フレームワークを提案する。
論文 参考訳(メタデータ) (2026-06-03T07:23:16Z) - Bandit Convex Optimization with Gradient Prediction Adaptivity [56.816177049016794]
本研究では, 楽観的な勾配予測が, 最悪の後悔の保証を予測順応的に改善できるかどうかを考察する。
鍵となるアイデアは、分散が勾配ノルムではなく予測誤差でスケールする、新しい分散還元勾配推定器である。
我々は、$(sqrtmathbbE[S_T])$としてスケールする情報理論の下限を確立し、最も達成可能な予測適応的後悔の基本的な特徴を提供する。
論文 参考訳(メタデータ) (2026-05-21T08:57:38Z) - AnyFlow: Any-Step Video Diffusion Model with On-Policy Flow Map Distillation [70.80207977907908]
フローマップをベースとした,最初のノンステップビデオ拡散蒸留フレームワークであるAnyFlowを紹介した。
我々は、AnyFlowがいくつかの段階において、パフォーマンスの一致を達成するか、一貫性ベースの結果を上回ることを示す。
論文 参考訳(メタデータ) (2026-05-13T16:06:34Z) - Correction and Corruption: A Two-Rate View of Error Flow in LLM Protocols [51.56484100374058]
そこで本研究では,単一プロトコルステップを正確なマッチングタスクで監査するためのペアアウトカム計測インタフェースを提案する。
各インスタンスについて、インターフェースはベースラインの正当性ビットと後ステップの正当性ビットを記録する。
これらのレートは精度の変化を予測し、種、混合物、パイプライン間でテスト可能な再利用可能な経験的インターフェースを定義する。
論文 参考訳(メタデータ) (2026-04-20T13:25:40Z) - Does "Do Differentiable Simulators Give Better Policy Gradients?'' Give Better Policy Gradients? [25.53040167917892]
不連続力学はバイアスを引き起こし、1階推定器の有効性を損なう。
非滑らかな領域で推定器を切り替える軽量なテストであるDDCGを導入する。
また,各ステップ毎の逆分散実装であるIVW-Hについて,明示的な不連続検出を伴わずに分散を安定化する。
論文 参考訳(メタデータ) (2026-04-20T12:23:48Z) - Stratified Hazard Sampling: Minimal-Variance Event Scheduling for CTMC/DTMC Discrete Diffusion and Flow Models [0.0]
累積ハザード(CTMC)または累積ジャンプ質量(DTMC)によって駆動される事象としての階層的ハザードサンプリングサンプリング(SHS)モデル
SHSは、累積ハザード(CTMC)または累積ジャンプ質量(DTMC)によって駆動されるイベントとして編集され、累積量を成層化することによってイベントを配置する。
また、ブラックリストスタイルの語彙制約に対する位相アロケーション変種を導入し、リスクの高い位置での早期編集を優先し、遅延マスキングアーティファクトを緩和する。
論文 参考訳(メタデータ) (2026-01-06T08:19:02Z) - Adapt in the Wild: Test-Time Entropy Minimization with Sharpness and Feature Regularization [85.50560211492898]
テスト時適応(TTA)は、テストデータが分散シフトが混在している場合、モデルの性能を改善または損なう可能性がある。
これはしばしば、既存のTTAメソッドが現実世界にデプロイされるのを防ぐ重要な障害である。
両面からTTAを安定化させるため,SARと呼ばれる鋭く信頼性の高いエントロピー最小化手法を提案する。
論文 参考訳(メタデータ) (2025-09-05T10:03:00Z) - Guess-and-Learn (G&L): Measuring the Cumulative Error Cost of Cold-Start Adaptation [0.11102988539107704]
機械学習モデルの評価は、スクラッチから学習中に発生する累積誤差の適応コストを見越して、最終的な精度を強調するのが一般的である。
Guess-and- Learn (G&L) v1.0は、コールドスタート適応性を測定することで、このギャップに対処する。
論文 参考訳(メタデータ) (2025-08-29T00:13:02Z) - Bridging Discrete and Backpropagation: Straight-Through and Beyond [62.46558842476455]
本稿では,離散潜在変数の生成に関わるパラメータの勾配を近似する新しい手法を提案する。
本稿では,Hunの手法とODEを解くための2次数値法を統合することで,2次精度を実現するReinMaxを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:59:49Z) - Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese
Grammatical Error Correction [49.25830718574892]
本稿では,Tail-to-Tail (textbfTtT) という新しいフレームワークを提案する。
ほとんどのトークンが正しいので、ソースからターゲットに直接転送でき、エラー位置を推定して修正することができる。
標準データセット、特に可変長データセットに関する実験結果は、文レベルの精度、精度、リコール、F1-Measureの観点からTtTの有効性を示す。
論文 参考訳(メタデータ) (2021-06-03T05:56:57Z) - Borrowing From the Future: Addressing Double Sampling in Model-free
Control [8.282602586225833]
本稿では,BFFアルゴリズムをアクション値関数に基づくモデルフリー制御に拡張する。
BFF が非バイアスの SGD に近づき、基礎となる力学が動作に関してゆっくりと変化する。
論文 参考訳(メタデータ) (2020-06-11T03:50:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。