論文の概要: Learning to reconstruct from saturated data: audio declipping and high-dynamic range imaging
- arxiv url: http://arxiv.org/abs/2602.22279v1
- Date: Wed, 25 Feb 2026 10:37:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.349761
- Title: Learning to reconstruct from saturated data: audio declipping and high-dynamic range imaging
- Title(参考訳): 飽和データから再構成する学習--オーディオデクリッピングと高ダイナミックレンジイメージング
- Authors: Victor Sechaud, Laurent Jacques, Patrice Abry, Julián Tachella,
- Abstract要約: この研究は、自己教師付き学習を、クリップされた測定から音声と画像を復元する非線形問題に拡張する。
飽和信号のみからの再構成を学習するための十分な条件と自己管理的損失を提供する。
オーディオデータと画像データの両方で実験したところ、提案手法は完全な教師付きアプローチと同じくらい効果的であることがわかった。
- 参考スコア(独自算出の注目度): 15.223658462501893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning based methods are now ubiquitous for solving inverse problems, but their deployment in real-world applications is often hindered by the lack of ground truth references for training. Recent self-supervised learning strategies offer a promising alternative, avoiding the need for ground truth. However, most existing methods are limited to linear inverse problems. This work extends self-supervised learning to the non-linear problem of recovering audio and images from clipped measurements, by assuming that the signal distribution is approximately invariant to changes in amplitude. We provide sufficient conditions for learning to reconstruct from saturated signals alone and a self-supervised loss that can be used to train reconstruction networks. Experiments on both audio and image data show that the proposed approach is almost as effective as fully supervised approaches, despite relying solely on clipped measurements for training.
- Abstract(参考訳): 学習ベースの手法は今や逆問題の解決にはユビキタスなものとなっているが、実世界のアプリケーションへの展開は、トレーニングのための基礎的な真理参照の欠如によって妨げられていることが多い。
最近の自己指導型学習戦略は、真理を根本から避けて、有望な代替手段を提供する。
しかし、既存の手法のほとんどは線形逆問題に限られている。
この研究は、信号分布が振幅の変化にほぼ不変であると仮定して、クリップ計測から音声と画像を復元する非線形問題まで、自己教師付き学習を拡張した。
飽和信号のみからの再構成を学習するための十分な条件と、再構成ネットワークのトレーニングに使用できる自己監督的損失を提供する。
オーディオデータと画像データの両方で実験したところ、提案手法は訓練用クリップ計測のみに頼っているにも関わらず、完全に教師されたアプローチと同じくらい効果的であることがわかった。
関連論文リスト
- Self-Supervised Learning from Noisy and Incomplete Data [11.852526434070839]
科学と工学の問題は、ノイズや不完全な観測から信号を推測することである。
最近のデータ駆動手法は、地上の信号や関連する観測例から直接解法を学習することで、より良い解を提供することが多い。
自己教師付き学習手法は、測定データのみからソルバを学習することで、有望な代替手段を提供する。
論文 参考訳(メタデータ) (2026-01-06T18:40:50Z) - Retrieval-augmented Prompt Learning for Pre-trained Foundation Models [101.13972024610733]
本稿では,記憶と一般化のバランスをとることを目的としたRetroPromptを提案する。
従来のプロンプトメソッドとは異なり、RetroPromptは入力、トレーニング、推論ステージ全体にわたって検索メカニズムを組み込んでいる。
提案手法の優れた性能を示すために,自然言語処理やコンピュータビジョンタスクにまたがる様々なデータセットに関する総合的な実験を行った。
論文 参考訳(メタデータ) (2025-12-23T08:15:34Z) - Equivariant Splitting: Self-supervised learning from incomplete data [11.641086974203924]
本研究では,単一不完全観測モデルを用いて測定結果が観測される難易度設定のために考案された,新たな自己教師型学習戦略を提案する。
自己監督型分割損失と同変型再構成ネットワークの組み合わせは,教師型分割損失と同程度に最小化できることを示す。
論文 参考訳(メタデータ) (2025-10-01T14:08:17Z) - U-DREAM: Unsupervised Dereverberation guided by a Reverberation Model [12.192022160630165]
本稿では,弱教師付きから完全教師なしまでの監督設定を施した最先端のデリバベーションモデルの訓練結果について検討する。
既存のディープラーニングアプローチの多くは、通常、ペア化された乾式と残響式のデータを必要とするが、実際は入手が困難である。
そこで, ディープニューラルネットワークを用いた残響入力から, 音響パラメータとドライ信号が推定される。
論文 参考訳(メタデータ) (2025-07-17T12:26:18Z) - Equivariance-based self-supervised learning for audio signal recovery from clipped measurements [13.829249782527363]
クリップ計測から音声信号を復元する非線形逆問題に対する自己教師型学習について検討した。
提案手法は, 自己教師付き自己教師型復号法の性能を, 完全教師付き学習と良好に比較できることを示す。
論文 参考訳(メタデータ) (2024-09-03T06:12:01Z) - Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration [64.84134880709625]
拡散モデルを用いて,雑音空間を介して領域適応を行うことが可能であることを示す。
特に、補助的な条件入力が多段階の復調過程にどのように影響するかというユニークな性質を活用することにより、有意義な拡散損失を導出する。
拡散モデルにおけるチャネルシャッフル層や残留スワッピング型コントラスト学習などの重要な戦略を提案する。
論文 参考訳(メタデータ) (2024-06-26T17:40:30Z) - Learning Sparsity-Promoting Regularizers using Bilevel Optimization [9.18465987536469]
本稿では,信号や画像の識別のための疎結合型正規化器の教師あり学習法を提案する。
構造化された1D信号と自然画像を用いて実験したところ,提案手法はよく知られた正規化器よりも優れた演算子を学習できることがわかった。
論文 参考訳(メタデータ) (2022-07-18T20:50:02Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Self-supervised Transformer for Deepfake Detection [112.81127845409002]
現実世界のシナリオにおけるディープフェイク技術は、顔偽造検知器のより強力な一般化能力を必要とする。
転送学習に触発されて、他の大規模な顔関連タスクで事前訓練されたニューラルネットワークは、ディープフェイク検出に有用な機能を提供する可能性がある。
本稿では,自己教師型変換器を用いた音声視覚コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-02T17:44:40Z) - Denoising Diffusion Restoration Models [110.1244240726802]
Denoising Diffusion Restoration Models (DDRM) は効率的で教師なしの後方サンプリング手法である。
DDRMの汎用性を、超高解像度、デブロアリング、インペイント、カラー化のためにいくつかの画像データセットに示す。
論文 参考訳(メタデータ) (2022-01-27T20:19:07Z) - Recursive Least-Squares Estimator-Aided Online Learning for Visual
Tracking [58.14267480293575]
オフライン学習を必要とせず、簡単な効果的なオンライン学習手法を提案する。
これは、モデルが以前見たオブジェクトに関する知識を記憶するための、内蔵されたメモリ保持メカニズムを可能にする。
我々は、RT-MDNetにおける多層パーセプトロンと、DiMPにおける畳み込みニューラルネットワークの追跡のためのオンライン学習ファミリーにおける2つのネットワークに基づくアプローチを評価する。
論文 参考訳(メタデータ) (2021-12-28T06:51:18Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。