論文の概要: Perspective-Equivariant Fine-tuning for Multispectral Demosaicing without Ground Truth
- arxiv url: http://arxiv.org/abs/2603.01332v1
- Date: Mon, 02 Mar 2026 00:16:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.63096
- Title: Perspective-Equivariant Fine-tuning for Multispectral Demosaicing without Ground Truth
- Title(参考訳): 地中真実のないマルチスペクトル復調のためのパースペクティブ・平等な微視的微視的微視的調整
- Authors: Andrew Wang, Mike Davies,
- Abstract要約: マルチスペクトル復調は、スナップショットモザイクド測定から全高解像度の分光像を再構成する上で重要である。
モザイク測度のみから多スペクトル復調を学習するフレームワークであるPEFDを提案する。
- 参考スコア(独自算出の注目度): 7.7070534338691035
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multispectral demosaicing is crucial to reconstruct full-resolution spectral images from snapshot mosaiced measurements, enabling real-time imaging from neurosurgery to autonomous driving. Classical methods are blurry, while supervised learning requires costly ground truth (GT) obtained from slow line-scanning systems. We propose Perspective-Equivariant Fine-tuning for Demosaicing (PEFD), a framework that learns multispectral demosaicing from mosaiced measurements alone. PEFD a) exploits the projective geometry of camera-based imaging systems to leverage a richer group structure than previous demosaicing methods to recover more null-space information, and b) learns efficiently without GT by adapting pretrained foundation models designed for 1-3 channel imaging. On intraoperative and automotive datasets, PEFD recovers fine details such as blood vessels and preserves spectral fidelity, substantially outperforming recent approaches, nearing supervised performance.
- Abstract(参考訳): マルチスペクトルの偏光は、スナップショットモザイクド測定から全高解像度のスペクトル像を再構成し、神経外科から自律運転までリアルタイムな画像化を可能にするために重要である。
古典的な手法はぼやけており、教師あり学習には、遅い線走査システムから得られる高価な基底真理(GT)が必要である。
モザイク測度のみから多スペクトル復調を学習するフレームワークであるPEFDを提案する。
PEFD
a) カメラベースの撮像システムの投影幾何学を利用して、従来の復号法よりもリッチなグループ構造を利用して、よりヌル空間情報を復元し、
b) 1-3チャンネルイメージング用に設計された事前訓練された基礎モデルを適用することにより,GTなしで効率よく学習する。
術中および自動車のデータセットでは、PEFDは血管などの微細な細部を回復し、スペクトルの忠実さを保ち、監督された性能に近づいた最近のアプローチを大幅に上回っている。
関連論文リスト
- Efficient Sequential Neural Network with Spatial-Temporal Attention and Linear LSTM for Robust Lane Detection Using Multi-Frame Images [3.8825198843426345]
レーン検出は、自動走行車(AV)と先進運転支援システムにとって重要な認識課題である。
現行の手法では、正確で堅牢でリアルタイムに車線検出を実現するための汎用性が欠如している。
本研究では,車線の重要な特徴に焦点をあてる空間的注意機構を備えた新しい逐次ニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2026-02-03T15:51:29Z) - Visual Odometry with Transformers [68.453547770334]
特徴抽出により単眼フレームのシーケンスを処理するビジュアル・オドメトリ・トランスフォーマ(VoT)を導入する。
従来の方法とは異なり、VoTは密度の高い幾何学を推定することなくカメラの動きを直接予測し、監視のためにカメラのポーズのみに依存する。
VoTは、より大きなデータセットで効果的にスケールし、より強力なトレーニング済みバックボーンの恩恵を受け、多様なカメラモーションとキャリブレーション設定を一般化し、従来のメソッドよりも3倍以上高速に動作しながらパフォーマンスを向上する。
論文 参考訳(メタデータ) (2025-10-02T17:00:14Z) - Physics-Guided Null-Space Diffusion with Sparse Masking for Corrective Sparse-View CT Reconstruction [5.479463752172751]
拡散モデルは画像処理タスクにおいて顕著な生成能力を示した。
スパース・ビューCT再構成のためのスパース・コンディション・リワイト統合分布推定誘導拡散モデル(STRIDE)を提案する。
実験結果から,PSNRでは2.58dB,SSIMでは2.37%,MSEでは0.236に改善した。
論文 参考訳(メタデータ) (2025-09-07T09:42:16Z) - One-Step Diffusion-based Real-World Image Super-Resolution with Visual Perception Distillation [53.24542646616045]
画像超解像(SR)生成に特化して設計された新しい視覚知覚拡散蒸留フレームワークであるVPD-SRを提案する。
VPD-SRは2つのコンポーネントから構成される: 明示的セマンティック・アウェア・スーパービジョン(ESS)と高周波知覚(HFP)損失。
提案したVPD-SRは,従来の最先端手法と教師モデルの両方と比較して,たった1ステップのサンプリングで優れた性能が得られる。
論文 参考訳(メタデータ) (2025-06-03T08:28:13Z) - CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.02751635551724]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z) - DIPLI: Deep Image Prior Lucky Imaging for Blind Astronomical Image Restoration [4.378167136812483]
この研究は、バックプロジェクション技術を用いて、シングルフレームからマルチフレームのトレーニングに移行するフレームワークであるDIPLIを提案する。
総合評価では、ラッキーイメージング、DIP、トランスフォーマーベースモデルRVRT、拡散ベースモデルDiffIR2VR-Zeroと比較する。
論文 参考訳(メタデータ) (2025-03-20T09:33:16Z) - Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging [8.819370643243012]
Coded Aperture Snapshot Spectral Imaging (CASSI)は3次元マルチスペクトル画像(MSI)を撮影するための重要な技術である
現在の最先端の手法は、主にエンドツーエンドであり、高周波の詳細を再構築する際の制限に直面している。
本稿では,Snapshot Compressive Imagingのための自己教師型適応フレームワークにおいて,新しい1段階拡散確率モデルを提案する。
論文 参考訳(メタデータ) (2024-09-11T17:02:10Z) - Inter-slice Super-resolution of Magnetic Resonance Images by Pre-training and Self-supervised Fine-tuning [49.197385954021456]
臨床実践では、2次元磁気共鳴(MR)シーケンスが広く採用されている。個々の2次元スライスを積み重ねて3次元ボリュームを形成できるが、比較的大きなスライスススペーシングは可視化とその後の解析タスクに課題をもたらす可能性がある。
スライス間隔を低減するため,ディープラーニングに基づく超解像技術が広く研究されている。
現在のほとんどのソリューションは、教師付きトレーニングのために、かなりの数の高解像度と低解像度の画像を必要とするが、通常は現実のシナリオでは利用できない。
論文 参考訳(メタデータ) (2024-06-10T02:20:26Z) - Efficient Visual State Space Model for Image Deblurring [99.54894198086852]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
提案したEVSSMは、ベンチマークデータセットや実世界の画像に対する最先端の手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - RetiFluidNet: A Self-Adaptive and Multi-Attention Deep Convolutional
Network for Retinal OCT Fluid Segmentation [3.57686754209902]
OCTガイド下治療には網膜液の定量化が必要である。
RetiFluidNetと呼ばれる新しい畳み込みニューラルアーキテクチャは、多クラス網膜流体セグメンテーションのために提案されている。
モデルは、テクスチャ、コンテキスト、エッジといった特徴の階層的な表現学習の恩恵を受ける。
論文 参考訳(メタデータ) (2022-09-26T07:18:00Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - Limited-angle tomographic reconstruction of dense layered objects by
dynamical machine learning [68.9515120904028]
強い散乱準透明物体の有限角トモグラフィーは困難で、非常に不適切な問題である。
このような問題の状況を改善することにより、アーティファクトの削減には、事前の定期化が必要である。
我々は,新しい分割畳み込みゲート再帰ユニット(SC-GRU)をビルディングブロックとして,リカレントニューラルネットワーク(RNN)アーキテクチャを考案した。
論文 参考訳(メタデータ) (2020-07-21T11:48:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。