論文の概要: Oracle Supervision Transfers for Hyperparameter Prediction in Model-Based Image Denoising
- arxiv url: http://arxiv.org/abs/2605.20479v1
- Date: Tue, 19 May 2026 20:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.372953
- Title: Oracle Supervision Transfers for Hyperparameter Prediction in Model-Based Image Denoising
- Title(参考訳): Oracle Supervision Transfers for Hyperparameter Prediction in Model-based Image Denoising
- Authors: Jianmin Liao, Lixin Shen, Yuesheng Xu,
- Abstract要約: HyperDnは、ソース設定にまたがってオラクルの監督をプールする単一の構成条件付き予測器である。
ターゲットのオラクルラベルがわずか2ドルで、HyperDnはオラクルの$0.90$,dB以内で$0.23$,dBに達する。
ターゲットのオラクルラベルがなければ、HyperDnは目に見えない2種類のノイズの混合で、ほぼ視線に近いPSNRに達する。
- 参考スコア(独自算出の注目度): 7.476786975019034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hyperparameter prediction is a critical practical bottleneck for model-based image denoisers, ranging from classical TV/TGV variational solvers to modern diffusion-based models such as DiffPIR. While existing learned predictors can achieve near-oracle performance, this approach scales poorly: each new configuration conventionally requires its own oracle-labeled training set, and each label requires a hierarchical grid search evaluated against clean ground truth. We therefore ask whether oracle supervision collected on source configurations can transfer to target configurations with few or no target oracle labels. We propose HyperDn, a single configuration-conditioned predictor that pools oracle supervision across source configurations and predicts heterogeneous hyperparameters for new denoiser--noise configurations. In a cross-paradigm experiment, HyperDn transfers from relatively cheap TV/TGV variational sources to more expensive diffusion-based DiffPIR. With only $2$ target oracle labels, it reaches $30.23$\,dB, within $0.90$\,dB of the oracle, and outperforms the $64$-label per-configuration predictor trained from scratch, using $1/32$ as many target labels as that baseline point. Without any target oracle labels, HyperDn also reaches near-oracle PSNR on two unseen mixtures of seen noise types and on transfer from relatively cheap $96\times 96$ source images to $512\times 768$ targets. Together, these results show that expensive oracle supervision for hyperparameter prediction can be transferred from source to new target configurations, reducing the need to rebuild oracle labels for each new denoising configuration.
- Abstract(参考訳): ハイパーパラメータ予測は、古典的TV/TGV変動解法から、DiffPIRのような近代拡散モデルまで、モデルベースの画像復号器にとって重要な実用的ボトルネックである。
既存の学習された予測器は、ほぼオーラルに近い性能を達成できるが、このアプローチはスケールが悪く、各新しい構成では、従来は独自のオラクルラベル付きトレーニングセットが必要であり、各ラベルは、クリーングラウンドの真実に対して階層的なグリッドサーチが必要である。
したがって、ソース設定に基づいて収集されたオラクルの監督が、ターゲットのオラクルラベルがほとんど、あるいは全くないターゲット設定に転送できるかどうかを問う。
我々は、ソース構成全体にわたってオラクルの監督をプールし、新しいデノイザ-ノイズ構成のための異種ハイパーパラメータを予測する、単一の構成条件付き予測器HyperDnを提案する。
クロスパラダイム実験では、HyperDnは比較的安価なTV/TGVからより高価な拡散ベースのDiffPIRへ転送する。
目標オークルラベルはわずか2ドル(約2,800円)で、オラクルの0.90$\,dB以内で30.23$\,dBに達し、そのベースラインポイントとして1/32ドル(約1,300円)のターゲットラベルを使用して、ゼロからトレーニングされた6,4ドル(約6,800円)のラベル毎の設定予測器を上回ります。
ターゲットのオラクルラベルがなければ、HyperDnは目に見えない2種類のノイズの混ざり合わせのPSNRに近づき、比較的安価な960\times 96$ソースイメージから512\times 768$ターゲットへ転送する。
これらの結果から、高パラメータ予測のための高価なオラクルの監督は、ソースから新しいターゲット設定に移行でき、新しいデノナイジング構成ごとにオラクルラベルを再構築する必要がなくなることが示唆された。
関連論文リスト
- Adaptive Regularization for Sparsity Control in Bregman-Based Optimizers [14.98763942493771]
本稿では,モデルの現在の空間とターゲット空間との差に基づいて$$を更新する適応正規化手法を提案する。
提案手法は,75%から99%の範囲の空間的目標を確実に達成する。
初期のトレーニングでは、オラクルで調整された非適応ベースラインよりも早く収束し、同じエラー率で最終的なパフォーマンスを達成または上回っている。
論文 参考訳(メタデータ) (2026-05-08T15:37:24Z) - SpecEyes: Accelerating Agentic Multimodal LLMs via Speculative Perception and Planning [104.01865949020304]
エージェント・マルチモーダル・大規模言語モデル(MLLM)は,反復的な視覚的ツールの実行によって顕著な推論能力を達成する。
しかし、カスケード認識、推論、ツール呼び出しループは、重要なシーケンシャルなオーバーヘッドをもたらす。
このオーバーヘッドはエージェントディープと呼ばれ、禁止されたレイテンシを発生させ、システムレベルのスループットを著しく制限します。
本稿では,エージェントレベルの投機的アクセラレーションフレームワークであるSpecEyesを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:45:47Z) - Market-Driven Subset Selection for Budgeted Training [1.7969777786551429]
それぞれのトレーニング例を取引可能な契約として扱う,市場ベースのフレームワークを提案する。
厳格な60kの予算の下でのGSM8Kの数学的推論では、セレクタは強い単一信号基底線でパリティを達成する。
本フレームワークは,逐次的推論および分類タスクのための固定的な計算予算の下で,多信号データキュレーションを統一する。
論文 参考訳(メタデータ) (2025-10-02T18:12:03Z) - Reevaluating Convolutional Neural Networks for Spectral Analysis: A Focus on Raman Spectroscopy [1.1545092788508224]
我々は1次元畳み込みニューラルネットワーク(CNN)を評価し,4つの進歩を報告した。
コンパクトCNNは、手作りの機能で$k$-nearest-neborsを上回っている。
ラベル効率の学習: 半教師付き生成的敵ネットワークと対照的な事前学習により、最大で11%の精度が向上し、わずか10%のラベルしか取得できない。
このワークフローには、生のスペクトルのトレーニング、プールのチューニング、ラベルの不足時に半スーパービジョンの追加、新しいターゲットに対する微調整が含まれる。
論文 参考訳(メタデータ) (2025-09-30T09:01:38Z) - Test time training enhances in-context learning of nonlinear functions [51.56484100374058]
テストタイムトレーニング(TTT)は、各予測に先立って指定されたパラメータを明示的に更新することで、モデル性能を向上させる。
本研究では,TTTとテキスト内学習(ICL)の組み合わせについて検討する。
論文 参考訳(メタデータ) (2025-09-30T03:56:44Z) - HyperTTA: Test-Time Adaptation for Hyperspectral Image Classification under Distribution Shifts [28.21559601586271]
HyperTTA (Test-Time Adaptable Transformer for Hyperspectral Degradation) は、様々な劣化条件下でモデルロバスト性を高める統一フレームワークである。
テスト時の適応戦略である、信頼を意識したエントロピー最小化LayerNorm Adapter (CELA)は、LayerNorm層のアフィンパラメータのみを動的に更新する。
2つのベンチマークデータセットの実験では、HyperTTAがさまざまな劣化シナリオで最先端のベースラインを上回っていることが示されている。
論文 参考訳(メタデータ) (2025-09-10T09:31:37Z) - Exploring Microstructural Dynamics in Cryptocurrency Limit Order Books: Better Inputs Matter More Than Stacking Another Hidden Layer [9.2463347238923]
ニューラルネットワークに余分な隠蔽層やパラメータを追加することで、短期的な価格予測が真に向上するかどうかを検討することを目的としている。
我々は,BTC/USDT LOBスナップショットを100ミリ秒から複数秒間隔で公開して,解釈可能なベースライン,ロジスティック回帰,XGBoostからディープアーキテクチャ(DeepLOB,Conv1D+LSTM)まで,モデルをベンチマークする。
論文 参考訳(メタデータ) (2025-06-06T05:43:30Z) - Transformers as Support Vector Machines [54.642793677472724]
自己アテンションの最適化幾何と厳密なSVM問題との間には,形式的等価性を確立する。
勾配降下に最適化された1層変圧器の暗黙バイアスを特徴付ける。
これらの発見は、最適なトークンを分離し選択するSVMの階層としてのトランスフォーマーの解釈を刺激していると信じている。
論文 参考訳(メタデータ) (2023-08-31T17:57:50Z) - Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition [98.25592165484737]
CMPL(Cross-Model Pseudo-Labeling)と呼ばれる,より効果的な擬似ラベル方式を提案する。
CMPLは、それぞれRGBモダリティとラベル付きデータのみを使用して、Kinetics-400とUCF-101のTop-1の精度を17.6%と25.1%で達成している。
論文 参考訳(メタデータ) (2021-12-17T18:59:41Z) - Hyperparameter Tuning is All You Need for LISTA [92.7008234085887]
Learned Iterative Shrinkage-Thresholding Algorithm (LISTA)は、反復アルゴリズムをアンロールしてニューラルネットワークのようにトレーニングするという概念を導入している。
LISTAネットワークの中間変数に運動量を加えることで、より優れた収束率が得られることを示す。
この超軽量ネットワークをHyperLISTAと呼ぶ。
論文 参考訳(メタデータ) (2021-10-29T16:35:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。