論文の概要: Experts-Guided Unbalanced Optimal Transport for ISP Learning from Unpaired and/or Paired Data
- arxiv url: http://arxiv.org/abs/2512.05635v1
- Date: Fri, 05 Dec 2025 11:27:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:57.005785
- Title: Experts-Guided Unbalanced Optimal Transport for ISP Learning from Unpaired and/or Paired Data
- Title(参考訳): ISP学習のためのエキスパートガイド付き最適トランスポート
- Authors: Georgy Perevozchikov, Nancy Mehta, Egor Ershov, Radu Timofte,
- Abstract要約: 我々は、任意のISPアーキテクチャをペアモードとペアモードの両方でトレーニングできる教師なしのトレーニングフレームワークを導入する。
我々のフレームワークは、ターゲットのsRGBデータにおける外れ値に対して堅牢性を提供し、マップに著しくコストがかかる非定型サンプルを割引することができる。
実験の結果、我々のフレームワークは、ペアリングモードで訓練された場合、全てのメトリクスで元のペアリングメソッドのパフォーマンスを上回るが、未ペアリングモードは競合する量的および質的なパフォーマンスを同時に達成し、場合によっては、元のペアリングされたメソッドを上回っていることがわかった。
- 参考スコア(独自算出の注目度): 48.3649059876439
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learned Image Signal Processing (ISP) pipelines offer powerful end-to-end performance but are critically dependent on large-scale paired raw-to-sRGB datasets. This reliance on costly-to-acquire paired data remains a significant bottleneck. To address this challenge, we introduce a novel, unsupervised training framework based on Optimal Transport capable of training arbitrary ISP architectures in both unpaired and paired modes. We are the first to successfully apply Unbalanced Optimal Transport (UOT) for this complex, cross-domain translation task. Our UOT-based framework provides robustness to outliers in the target sRGB data, allowing it to discount atypical samples that would be prohibitively costly to map. A key component of our framework is a novel ``committee of expert discriminators,'' a hybrid adversarial regularizer. This committee guides the optimal transport mapping by providing specialized, targeted gradients to correct specific ISP failure modes, including color fidelity, structural artifacts, and frequency-domain realism. To demonstrate the superiority of our approach, we retrained existing state-of-the-art ISP architectures using our paired and unpaired setups. Our experiments show that while our framework, when trained in paired mode, exceeds the performance of the original paired methods across all metrics, our unpaired mode concurrently achieves quantitative and qualitative performance that rivals, and in some cases surpasses, the original paired-trained counterparts. The code and pre-trained models are available at: https://github.com/gosha20777/EGUOT-ISP.git.
- Abstract(参考訳): Learned Image Signal Processing (ISP)パイプラインは、強力なエンドツーエンドパフォーマンスを提供するが、大規模にペア化された生-SRGBデータセットに依存している。
このコスト対取得データへの依存は、依然として重大なボトルネックである。
この課題に対処するために、我々は、任意のISPアーキテクチャをペアモードとペアモードの両方でトレーニングできる、Optimal Transportに基づく、新しい教師なしトレーニングフレームワークを導入する。
我々は、この複雑なドメイン間翻訳タスクにUn Balanced Optimal Transport (UOT)をうまく適用した最初の人です。
われわれのUOTベースのフレームワークは、ターゲットのsRGBデータの外れ値に対して堅牢性を提供し、マップに著しくコストがかかる非定型的なサンプルを割引することができる。
我々のフレームワークのキーとなるコンポーネントは、"‘専門家差別者のコミット’、ハイブリッド対正則化器'である。
本委員会では、カラー忠実度、構造的アーティファクト、周波数領域リアリズムなど、特定のISP障害モードを補正するために、特定の目標勾配を提供することにより、最適なトランスポートマッピングを導出する。
提案手法の優位性を示すため,既存のISPアーキテクチャをペアとアンペアのセットアップを用いて再訓練した。
実験の結果、我々のフレームワークは、ペアリングモードで訓練された場合、全てのメトリクスで元のペアリングメソッドのパフォーマンスを上回るが、未ペアリングモードは競合する量的および質的なパフォーマンスを同時に達成し、場合によっては、元のペアリングされたメソッドを上回っていることがわかった。
コードと事前訓練されたモデルは、https://github.com/gosha20777/EGUOT-ISP.gitで利用可能である。
関連論文リスト
- Don't Just Fine-tune the Agent, Tune the Environment [25.7349297100143]
合成データの微調整の監督は、過度な適合につながる。
標準的な強化学習は、重要なコールドスタート問題とトレーニング不安定性に苦慮している。
本研究は,静的軌道の教師付き微調整から動的環境探索へのパラダイムシフトを示す。
論文 参考訳(メタデータ) (2025-10-11T12:35:15Z) - Dataset Distillation by Automatic Training Trajectories [13.502303920701163]
本稿では, 軌道長NSを動的かつ適応的に調整し, 累積ミスマッチ問題(AMP)に対処する新しいアプローチであるATT(Automatic Training Trajectories)を提案する。
本手法は, クロスアーキテクチャを含むテストにおいて, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2024-07-19T12:27:11Z) - Heterogeneous Federated Learning with Splited Language Model [22.65325348176366]
フェデレート・スプリット・ラーニング(FSL)は、実際には有望な分散学習パラダイムである。
本稿では,前訓練画像変換器(PIT)をFedVと呼ばれる初期モデルとして利用し,トレーニングプロセスの高速化とモデルロバスト性の向上を図る。
我々は、実世界のデータセット、異なる部分的デバイス参加、異種データ分割におけるPITを用いたFSL手法の体系的評価を初めて行った。
論文 参考訳(メタデータ) (2024-03-24T07:33:08Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Distributed Adversarial Training to Robustify Deep Neural Networks at
Scale [100.19539096465101]
現在のディープニューラルネットワーク(DNN)は、入力に対する敵の摂動が分類を変更したり操作したりする敵の攻撃に対して脆弱である。
このような攻撃を防御するために、敵の訓練(AT)として知られる効果的なアプローチが、堅牢な訓練を緩和するために示されている。
複数のマシンにまたがって実装された大規模バッチ対逆トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-13T15:39:43Z) - Supernet Training for Federated Image Classification under System
Heterogeneity [15.2292571922932]
本研究では,2つのシナリオ,すなわちフェデレーション・オブ・スーパーネット・トレーニング(FedSup)を考えるための新しい枠組みを提案する。
フェデレートラーニング(FL)のモデルアグリゲーション段階でのパラメータの平均化は、スーパーネットトレーニングにおけるウェイトシェアリングとどのように似ているかに着想を得ている。
本フレームワークでは,通信コストの削減とトレーニングオーバーヘッドの低減のために,放送段階のクライアントにサブモデルを送信することで,効率的なアルゴリズム(E-FedSup)を提案する。
論文 参考訳(メタデータ) (2022-06-03T02:21:01Z) - Mutual-Information Based Few-Shot Classification [34.95314059362982]
数ショット学習のためのTIM(Transductive Infomation Maximization)を提案する。
提案手法は,与えられた数発のタスクに対して,クエリ特徴とラベル予測との相互情報を最大化する。
そこで我々は,勾配に基づく最適化よりもトランスダクティブ推論を高速化する交代方向解法を提案する。
論文 参考訳(メタデータ) (2021-06-23T09:17:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。