Fugu-MT 論文翻訳(概要): Boosting Visual Recognition for Autonomous Driving in Real-world Degradations with Deep Channel Prior

論文の概要: Boosting Visual Recognition for Autonomous Driving in Real-world Degradations with Deep Channel Prior

arxiv url: http://arxiv.org/abs/2404.01703v1
Date: Tue, 2 Apr 2024 07:16:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-03 17:38:25.631926
Title: Boosting Visual Recognition for Autonomous Driving in Real-world Degradations with Deep Channel Prior
Title（参考訳）: ディープチャネルを優先した実世界劣化における自律走行のための視覚認識の強化
Authors: Zhanwen Liu, Yuhang Li, Yang Wang, Bolin Gao, Yisheng An, Xiangmo Zhao,
Abstract要約: 霧、低照度、動きのぼかしは画像の品質を低下させ、自動運転の安全性を脅かす。本研究は、劣化した視覚認識のための新しいDeep Channel Prior (DCP)を提案する。これに基づいて、教師なし特徴補正を実現するために、新しいプラグアンドプレイunsupervised Feature Enhancement Module (UFEM)を提案する。
参考スコア（独自算出の注目度）: 22.323789227447755
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The environmental perception of autonomous vehicles in normal conditions have achieved considerable success in the past decade. However, various unfavourable conditions such as fog, low-light, and motion blur will degrade image quality and pose tremendous threats to the safety of autonomous driving. That is, when applied to degraded images, state-of-the-art visual models often suffer performance decline due to the feature content loss and artifact interference caused by statistical and structural properties disruption of captured images. To address this problem, this work proposes a novel Deep Channel Prior (DCP) for degraded visual recognition. Specifically, we observe that, in the deep representation space of pre-trained models, the channel correlations of degraded features with the same degradation type have uniform distribution even if they have different content and semantics, which can facilitate the mapping relationship learning between degraded and clear representations in high-sparsity feature space. Based on this, a novel plug-and-play Unsupervised Feature Enhancement Module (UFEM) is proposed to achieve unsupervised feature correction, where the multi-adversarial mechanism is introduced in the first stage of UFEM to achieve the latent content restoration and artifact removal in high-sparsity feature space. Then, the generated features are transferred to the second stage for global correlation modulation under the guidance of DCP to obtain high-quality and recognition-friendly features. Evaluations of three tasks and eight benchmark datasets demonstrate that our proposed method can comprehensively improve the performance of pre-trained models in real degradation conditions. The source code is available at https://github.com/liyuhang166/Deep_Channel_Prior
Abstract（参考訳）: 通常の環境下での自動運転車の環境認識は、過去10年間にかなりの成功を収めてきた。しかし、霧、低照度、動きのぼかしなどの様々な不快な条件は、画像の品質を低下させ、自動運転の安全性に重大な脅威をもたらす。すなわち、劣化画像に適用した場合、画像の統計的・構造的特性の破壊による特徴量損失やアーチファクトの干渉により、最先端の視覚モデルが性能低下に悩まされることがしばしばある。そこで本研究では,劣化した視覚認識のための新しいDeep Channel Prior (DCP)を提案する。具体的には、事前学習されたモデルの深部表現空間において、劣化した特徴と同一の劣化型とのチャネル相関が、異なる内容や意味を持つ場合でも一様分布を持ち、高分離性特徴空間における劣化した特徴と明確な表現の間のマッピング関係の学習を容易にすることを観察する。そこで,UFEMの第1段階では,多目的機構を導入して,高分離性特徴空間における遅延コンテンツ復元とアーティファクト除去を実現する,新しいプラグアンドプレイunsupervised Feature Enhancement Module (UFEM)を提案する。次に、DCPの指導の下、大域的相関変調のための第2段階に生成した特徴を移し、高品質で認識しやすい特徴を得る。 3つのタスクと8つのベンチマークデータセットの評価結果から,提案手法は実劣化条件下での事前学習モデルの性能を総合的に向上できることを示した。ソースコードはhttps://github.com/liyuhang166/Deep_Channel_Priorで入手できる。

関連論文リスト

Understanding Degradation with Vision Language Model [56.09241449206817]
視覚的劣化を理解することは、コンピュータビジョンにおいて重要な問題であるが、難しい問題である。本稿では,教師付き微調整と強化学習を併用したマルチモーダル・チェーン・オブ・ソート・モデルであるDU-VLMを紹介する。また,110,000個のクリーン劣化ペアと接地された物理アノテーションからなる大規模データセットである textbfDU-110k も導入した。
論文参考訳（メタデータ） (2026-02-04T13:51:15Z)
Towards Any-Quality Image Segmentation via Generative and Adaptive Latent Space Enhancement [27.566673104431725]
Segment Anything Models (SAM) は例外的なゼロショットセグメンテーション性能で知られている。しかし、その性能は著しく劣化した低品質の画像に対して著しく低下し、現実のシナリオではその効果が制限される。低画質画像におけるロバスト性を高めるために生成遅延空間拡張を利用するGleSAM++を提案する。
論文参考訳（メタデータ） (2026-01-05T11:28:58Z)
All-in-One Video Restoration under Smoothly Evolving Unknown Weather Degradations [102.94052335735326]
All-in-one画像復元は、単一のモデルを用いて、さまざまな未知の劣化からクリーンなイメージを復元することを目的としている。既存のアプローチは主に、現実世界の劣化過程に自然に存在する時間的連続性を見越して、フレームワイドの劣化変動に焦点を当てている。 Smoothly Evolving Unknown Degradations (SEUD) のシナリオでは、アクティブな劣化セットと劣化強度の両方が時間とともに連続的に変化する。
論文参考訳（メタデータ） (2026-01-02T02:20:57Z)
Unlocking the Potential of Diffusion Priors in Blind Face Restoration [63.419272650578165]
本研究では、2つのモードを切り替えて特定のギャップを解消する統合ネットワークFLIPNETを提案する。復元モードでは、モデルは徐々にBFR指向の特徴とLQ画像からの顔埋め込みを統合し、真正かつ忠実な顔復元を実現する。劣化モードでは、実際の劣化データセットから学んだ知識に基づいて、劣化した画像のような現実世界を合成する。
論文参考訳（メタデータ） (2025-08-12T01:50:55Z)
Manifold-aware Representation Learning for Degradation-agnostic Image Restoration [135.90908995927194]
画像復元(IR)は、ノイズ、ぼかし、迷路、雨、低照度といった様々な汚職に影響を受ける劣化した入力から高品質な画像を復元することを目的としている。我々は、入力特徴空間を3つのセマンティックに整列した並列分岐に明示的に分解する1つのIRにおいて、すべてに統一されたフレームワークであるMIRAGEを提案する。このモジュラ分解は、多種多様な分解の一般化と効率を大幅に改善する。
論文参考訳（メタデータ） (2025-05-24T12:52:10Z)
Degradation-Aware Feature Perturbation for All-in-One Image Restoration [7.062305871428267]
オールインワン画像復元は、様々な劣化タイプやレベルから鮮明な画像を統一モデルで復元することを目的としている。 DFPIRは、特徴空間を統一されたパラメータ空間に合わせるように調整するために、分解を意識した特徴摂動を導入した。 DFPIRは、画像のデノイング、画像のデハージング、画像のデライニング、モーションのデブロアリング、低照度画像のエンハンスメントを含む複数のオールインワン画像復元タスクにおいて、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-05-19T02:37:11Z)
Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。 Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。 nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-12-28T14:23:58Z)
Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文参考訳（メタデータ） (2024-07-04T05:01:10Z)
Suppressing Uncertainties in Degradation Estimation for Blind Super-Resolution [31.89605287039615]
ブラインド画像の超解像問題は、未知の劣化モードで低解像度(LR)画像から高解像度(HR)画像を復元することを目的としている。既存のほとんどの手法は、ぼやけたカーネルを使って画像劣化過程をモデル化している。盲目的のtextbf Super-textbfResolution フレームワークに対して,textbfUncertainty に基づく分解表現を提案する。
論文参考訳（メタデータ） (2024-06-24T08:58:43Z)
DeeDSR: Towards Real-World Image Super-Resolution via Degradation-Aware Stable Diffusion [27.52552274944687]
低解像度画像のコンテンツや劣化を認識する拡散モデルの能力を高める新しい2段階の劣化認識フレームワークを提案する。最初の段階では、教師なしのコントラスト学習を用いて画像劣化の表現を得る。第2段階では、分解対応モジュールを単純化されたControlNetに統合し、様々な劣化への柔軟な適応を可能にします。
論文参考訳（メタデータ） (2024-03-31T12:07:04Z)
DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文参考訳（メタデータ） (2023-12-12T06:07:21Z)
DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。 MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-12-11T18:38:28Z)
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。水中画像強調(UIE)の課題も、時間とともに現れた。本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文参考訳（メタデータ） (2023-06-15T07:41:12Z)
DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文参考訳（メタデータ） (2023-03-13T06:05:18Z)
Panini-Net: GAN Prior Based Degradation-Aware Feature Interpolation for Face Restoration [4.244692655670362]
Panini-Netは、顔修復のための劣化認識機能ネットワークである。抽象表現を学び、様々な劣化を区別する。マルチ劣化顔復元と超解像のための最先端性能を実現する。
論文参考訳（メタデータ） (2022-03-16T07:41:07Z)
HDNet: High-resolution Dual-domain Learning for Spectral Compressive Imaging [138.04956118993934]
HSI再構成のための高分解能デュアルドメイン学習ネットワーク(HDNet)を提案する。一方、高効率な特徴融合によるHR空間スペクトルアテンションモジュールは、連続的かつ微細な画素レベルの特徴を提供する。一方、HSI再構成のために周波数領域学習(FDL)を導入し、周波数領域の差を狭める。
論文参考訳（メタデータ） (2022-03-04T06:37:45Z)
Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文参考訳（メタデータ） (2020-03-02T13:28:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。