論文の概要: Distilling Knowledge for Designing Computational Imaging Systems
- arxiv url: http://arxiv.org/abs/2501.17898v1
- Date: Wed, 29 Jan 2025 03:49:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-31 15:14:00.818004
- Title: Distilling Knowledge for Designing Computational Imaging Systems
- Title(参考訳): コンピュータイメージングシステム設計のための蒸留知識
- Authors: Leon Suarez-Rodriguez, Roman Jacome, Henry Arguello,
- Abstract要約: E2E最適化の性能はエンコーダに課される物理的制約により著しく低下する。
我々は、事前訓練された、制約の少ないCIシステムの知識を伝達することで、物理的に制約されたCIシステムを設計するための知識蒸留の概念を再解釈する。
提案手法は再構成性能とエンコーダ設計を大幅に向上させ,E2E最適化と従来の非データ駆動エンコーダ設計の両方に優れる。
- 参考スコア(独自算出の注目度): 15.662108754691864
- License:
- Abstract: Designing the physical encoder is crucial for accurate image reconstruction in computational imaging (CI) systems. Currently, these systems are designed via end-to-end (E2E) optimization, where the encoder is modeled as a neural network layer and is jointly optimized with the decoder. However, the performance of E2E optimization is significantly reduced by the physical constraints imposed on the encoder. Also, since the E2E learns the parameters of the encoder by backpropagating the reconstruction error, it does not promote optimal intermediate outputs and suffers from gradient vanishing. To address these limitations, we reinterpret the concept of knowledge distillation (KD) for designing a physically constrained CI system by transferring the knowledge of a pretrained, less-constrained CI system. Our approach involves three steps: (1) Given the original CI system (student), a teacher system is created by relaxing the constraints on the student's encoder. (2) The teacher is optimized to solve a less-constrained version of the student's problem. (3) The teacher guides the training of the student through two proposed knowledge transfer functions, targeting both the encoder and the decoder feature space. The proposed method can be employed to any imaging modality since the relaxation scheme and the loss functions can be adapted according to the physical acquisition and the employed decoder. This approach was validated on three representative CI modalities: magnetic resonance, single-pixel, and compressive spectral imaging. Simulations show that a teacher system with an encoder that has a structure similar to that of the student encoder provides effective guidance. Our approach achieves significantly improved reconstruction performance and encoder design, outperforming both E2E optimization and traditional non-data-driven encoder designs.
- Abstract(参考訳): 物理エンコーダの設計は、計算画像(CI)システムにおける正確な画像再構成に不可欠である。
現在、これらのシステムはエンドツーエンド(E2E)最適化によって設計されており、エンコーダはニューラルネットワーク層としてモデル化され、デコーダと共同で最適化されている。
しかし、エンコーダに課される物理的制約により、E2E最適化の性能は大幅に低下する。
また、E2Eは再構成エラーをバックプロパゲートすることでエンコーダのパラメータを学習するため、最適な中間出力を促進せず、勾配の消失に悩まされる。
これらの制約に対処するために、事前訓練された、制約の少ないCIシステムの知識を伝達することにより、物理的に制約されたCIシステムを設計するための知識蒸留(KD)の概念を再解釈する。
従来のCIシステム(学生)を前提として,学生のエンコーダの制約を緩和して教師システムを構築する。
2)教師は,制約の少ない生徒の問題を解くように最適化されている。
3)教師は,エンコーダとデコーダの特徴空間の両方を対象として,2つの提案された知識伝達機能を通じて,生徒の指導を指導する。
提案手法は,リラクゼーション方式や損失関数を物理取得やデコーダに応じて適用できるため,任意の画像モダリティに適用することができる。
このアプローチは、磁気共鳴、単画素、圧縮スペクトルイメージングの3つの代表的CIモードで検証された。
シミュレーションにより, 生徒エンコーダに類似した構造を持つエンコーダを持つ教師システムが, 効果的な指導を行うことを示す。
提案手法は再構成性能とエンコーダ設計を大幅に向上させ,E2E最適化と従来の非データ駆動エンコーダ設計の両方に優れる。
関連論文リスト
- END$^2$: Robust Dual-Decoder Watermarking Framework Against Non-Differentiable Distortions [15.774214187916423]
現実世界の歪みは、しばしば微分不可能であり、エンドツーエンドのトレーニングの課題に繋がる。
本稿では,非微分歪みをトレーニングにうまく組み込むために,新しいデュアルデコーダアーキテクチャ (END$2$) を提案する。
提案手法は, 様々な非微分歪みの下で, 最先端のアルゴリズムより優れる。
論文 参考訳(メタデータ) (2024-12-13T08:37:30Z) - Highly Constrained Coded Aperture Imaging Systems Design Via a Knowledge Distillation Approach [15.662108754691864]
本稿では,高度に物理的に制約されたCOIシステムの設計のための知識蒸留(KD)フレームワークを提案する。
単色・マルチスペクトル画像再構成のためのバイナリ符号化開口単画素カメラを用いて,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-06-25T23:03:48Z) - Joint Beam Search Integrating CTC, Attention, and Transducer Decoders [53.297697898510194]
4つのデコーダが同一のエンコーダを共有するような共同モデリング手法を提案する。
4Dモデルは共同で訓練され、モデルの正規化とモデルの堅牢性を最大化する。
さらに,3つのデコーダを組み合わせることで,新しい3つのビーム探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-05T05:18:20Z) - Learning Linear Block Error Correction Codes [62.25533750469467]
本稿では,バイナリ線形ブロック符号の統一エンコーダデコーダトレーニングを初めて提案する。
また,コード勾配の効率的なバックプロパゲーションのために,自己注意マスキングを行うトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2024-05-07T06:47:12Z) - Efficient Transformer Encoders for Mask2Former-style models [57.54752243522298]
ECO-M2Fは、入力画像上に条件付きエンコーダ内の隠蔽層数を自己選択する戦略である。
提案手法は、性能を維持しながら、予測エンコーダの計算コストを削減する。
アーキテクチャ構成では柔軟性があり、セグメンテーションタスクを超えてオブジェクト検出まで拡張できる。
論文 参考訳(メタデータ) (2024-04-23T17:26:34Z) - A Principled Hierarchical Deep Learning Approach to Joint Image
Compression and Classification [27.934109301041595]
本研究は,エンコーダを誘導し,コンパクトで差別的で,一般的な拡張/変換に適した特徴を抽出する3段階共同学習戦略を提案する。
CIFAR-10では最大1.5%,CIFAR-100では3%,従来のE2Eクロスエントロピートレーニングでは3%の精度向上が得られた。
論文 参考訳(メタデータ) (2023-10-30T15:52:18Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - Deep Optical Coding Design in Computational Imaging [16.615106763985942]
計算光学画像(COI)システムは、そのセットアップにおいて光学的符号化要素(CE)を利用して、1つまたは複数のスナップショットで高次元シーンを符号化し、計算アルゴリズムを用いて復号する。
COIシステムの性能は、CEパターンと与えられたタスクを実行するのに使用される計算方法という、主要なコンポーネントの設計に大きく依存する。
ディープニューラルネットワーク(DNN)は、光エンコーダと計算デコーダを共同で検討するCEデータ駆動設計において、新たな地平を開拓した。
論文 参考訳(メタデータ) (2022-06-27T04:41:48Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Machine Learning Framework for Quantum Sampling of Highly-Constrained,
Continuous Optimization Problems [101.18253437732933]
本研究では,連続空間の逆設計問題を,制約のないバイナリ最適化問題にマッピングする,汎用的な機械学習ベースのフレームワークを開発する。
本研究では, 熱発光トポロジを熱光応用に最適化し, (ii) 高効率ビームステアリングのための拡散メタグレーティングを行うことにより, 2つの逆設計問題に対するフレームワークの性能を示す。
論文 参考訳(メタデータ) (2021-05-06T02:22:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。