論文の概要: Computational Spectral Imaging with Unified Encoding Model: A
Comparative Study and Beyond
- arxiv url: http://arxiv.org/abs/2312.13310v1
- Date: Wed, 20 Dec 2023 07:01:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-22 17:13:55.831073
- Title: Computational Spectral Imaging with Unified Encoding Model: A
Comparative Study and Beyond
- Title(参考訳): 統一符号化モデルを用いた計算スペクトルイメージング : 比較研究と超越
- Authors: Xinyuan Liu, Lizhi Wang, Lingen Li, Chang Chen, Xue Hu, Fenglong Song,
Youliang Yan
- Abstract要約: 本稿では,3種類の符号化方式を用いて,すべての物理システムをカバーする統一符号化モデル(UEM)を提案する。
具体的には、UEMは物理振幅、物理位相、物理波長符号化モデルからなる。
我々はUEMを、物理的制約のない理想振幅、理想位相、理想波長符号化モデルに拡張する。
- 参考スコア(独自算出の注目度): 26.921433934150514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computational spectral imaging is drawing increasing attention owing to the
snapshot advantage, and amplitude, phase, and wavelength encoding systems are
three types of representative implementations. Fairly comparing and
understanding the performance of these systems is essential, but challenging
due to the heterogeneity in encoding design. To overcome this limitation, we
propose the unified encoding model (UEM) that covers all physical systems using
the three encoding types. Specifically, the UEM comprises physical amplitude,
physical phase, and physical wavelength encoding models that can be combined
with a digital decoding model in a joint encoder-decoder optimization framework
to compare the three systems under a unified experimental setup fairly.
Furthermore, we extend the UEMs to ideal versions, namely, ideal amplitude,
ideal phase, and ideal wavelength encoding models, which are free from physical
constraints, to explore the full potential of the three types of computational
spectral imaging systems. Finally, we conduct a holistic comparison of the
three types of computational spectral imaging systems and provide valuable
insights for designing and exploiting these systems in the future.
- Abstract(参考訳): スペクトルイメージングはスナップショットの利点により注目を集めており、振幅、位相、波長のエンコーディングシステムは3種類の代表的な実装である。
これらのシステムの性能をかなり比較し理解することは不可欠であるが、エンコーディング設計の多様性のために困難である。
この制限を克服するために,3種類の符号化方式を用いて物理系を網羅する統一符号化モデル (UEM) を提案する。
具体的には、ジョイントエンコーダ・デコーダ最適化フレームワークにおいて、デジタルデコードモデルと組み合わせて、3つのシステムを統一実験的な設定で比較することができる物理振幅、物理位相、物理波長符号化モデルを含む。
さらに,UEMの理想的なバージョン,すなわち理想振幅,理想位相,理想波長符号化モデルに拡張して,3種類の計算スペクトルイメージングシステムのフルポテンシャルを探索する。
最後に,3種類のスペクトルイメージングシステムの総合的な比較を行い,将来これらのシステムの設計と活用に有用な知見を提供する。
関連論文リスト
- LVSM: A Large View Synthesis Model with Minimal 3D Inductive Bias [50.13457154615262]
スパースビュー入力からのスケーラブルで一般化可能な新規ビュー合成のためのトランスフォーマーに基づくアプローチを提案する。
本稿では,(1)入力画像トークンを1次元遅延トークンにエンコードするエンコーダデコーダLVSM,(2)入力画像を直接新規ビュー出力にマッピングするデコーダのみLVSMの2つのアーキテクチャを紹介する。
論文 参考訳(メタデータ) (2024-10-22T17:58:28Z) - A Single Transformer for Scalable Vision-Language Modeling [74.05173379908703]
我々はvisiOn-Language mOdelingのための単一変換器SOLOを提案する。
SOLOのような統一された単一トランスフォーマーアーキテクチャは、LVLMにおけるこれらのスケーラビリティ上の懸念に効果的に対処する。
本稿では,オープンソースの7B LVLMであるSOLOの開発のための,最初のオープンソーストレーニングレシピを紹介する。
論文 参考訳(メタデータ) (2024-07-08T22:40:15Z) - Highly Constrained Coded Aperture Imaging Systems Design Via a Knowledge Distillation Approach [15.662108754691864]
本稿では,高度に物理的に制約されたCOIシステムの設計のための知識蒸留(KD)フレームワークを提案する。
単色・マルチスペクトル画像再構成のためのバイナリ符号化開口単画素カメラを用いて,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-06-25T23:03:48Z) - 4D ASR: Joint Beam Search Integrating CTC, Attention, Transducer, and Mask Predict Decoders [53.297697898510194]
我々は、4つのデコーダが同一のエンコーダを共有する共同モデリング手法を提案し、これを4Dモデリングと呼ぶ。
4Dモデルを効率的に訓練するために,マルチタスク学習を安定化させる2段階のトレーニング戦略を導入する。
さらに,3つのデコーダを組み合わせることで,新しい1パスビーム探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-05T05:18:20Z) - Global Search Optics: Automatically Exploring Optimal Solutions to Compact Computational Imaging Systems [15.976326291076377]
モバイルビジョンの人気は、高度なコンパクト・コンピュート・イメージング・システムへの需要を生み出している。
共同設計パイプラインが最前線に現れ、2つの重要なコンポーネントがデータ駆動学習によって同時に最適化される。
本稿では,GSO(Global Search Optimization)を用いて,コンパクトな画像処理システムの設計を行う。
論文 参考訳(メタデータ) (2024-04-30T01:59:25Z) - Optimization of array encoding for ultrasound imaging [2.357055571094446]
機械学習(ML)を用いて、時間遅延とアポッド化重みによってパラメータ化されたスキャンシーケンスを構築し、高品質なBモード画像を生成する。
これらの結果は,ワイヤターゲットと組織模倣ファントムの両方で実験的に実証された。
論文 参考訳(メタデータ) (2024-03-01T05:19:59Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - On the Suitability of Representations for Quality Diversity Optimization
of Shapes [77.34726150561087]
進化的アルゴリズムで使用される表現、あるいは符号化は、その性能に大きな影響を及ぼす。
本研究では, 直接符号化, 辞書ベース表現, パラメトリック符号化, 合成パターン生成ネットワーク, セルオートマトンなどの表現が, 酸化メッシュの生成に与える影響について比較した。
論文 参考訳(メタデータ) (2023-04-07T07:34:23Z) - Deep Optical Coding Design in Computational Imaging [16.615106763985942]
計算光学画像(COI)システムは、そのセットアップにおいて光学的符号化要素(CE)を利用して、1つまたは複数のスナップショットで高次元シーンを符号化し、計算アルゴリズムを用いて復号する。
COIシステムの性能は、CEパターンと与えられたタスクを実行するのに使用される計算方法という、主要なコンポーネントの設計に大きく依存する。
ディープニューラルネットワーク(DNN)は、光エンコーダと計算デコーダを共同で検討するCEデータ駆動設計において、新たな地平を開拓した。
論文 参考訳(メタデータ) (2022-06-27T04:41:48Z) - Efficient VVC Intra Prediction Based on Deep Feature Fusion and
Probability Estimation [57.66773945887832]
本稿では,フレーム内予測におけるVersatile Video Coding (VVC) の複雑性を,深層融合と確率推定の2段階のフレームワークを用いて最適化することを提案する。
特に高精細度(HD)および超高精細度(UHD)ビデオシーケンスにおいて,提案手法の優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2022-05-07T08:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。