Fugu-MT 論文翻訳(概要): Multi-scale Progressive Feature Embedding for Accurate NIR-to-RGB Spectral Domain Translation

論文の概要: Multi-scale Progressive Feature Embedding for Accurate NIR-to-RGB Spectral Domain Translation

arxiv url: http://arxiv.org/abs/2312.16040v1
Date: Tue, 26 Dec 2023 13:07:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-27 15:13:55.076299
Title: Multi-scale Progressive Feature Embedding for Accurate NIR-to-RGB Spectral Domain Translation
Title（参考訳）: 高精度NIR-RGBスペクトル領域変換のためのマルチスケールプログレッシブな特徴埋め込み
Authors: Xingxing Yang, Jie Chen, Zaifeng Yang
Abstract要約: 我々は、NIRソース画像をグレースケールターゲットドメインに変換するドメイン翻訳モジュールを導入する。プログレッシブトレーニング戦略を取り入れることで、両方のタスク領域からの統計的および意味的な知識を効率的に整合させる。実験により、我々のMPFNetはNIR-to-RGBスペクトル領域変換タスクにおいて最先端の2.55dBより優れていることが示された。
参考スコア（独自算出の注目度）: 6.580484964018551
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: NIR-to-RGB spectral domain translation is a challenging task due to the mapping ambiguities, and existing methods show limited learning capacities. To address these challenges, we propose to colorize NIR images via a multi-scale progressive feature embedding network (MPFNet), with the guidance of grayscale image colorization. Specifically, we first introduce a domain translation module that translates NIR source images into the grayscale target domain. By incorporating a progressive training strategy, the statistical and semantic knowledge from both task domains are efficiently aligned with a series of pixel- and feature-level consistency constraints. Besides, a multi-scale progressive feature embedding network is designed to improve learning capabilities. Experiments show that our MPFNet outperforms state-of-the-art counterparts by 2.55 dB in the NIR-to-RGB spectral domain translation task in terms of PSNR.
Abstract（参考訳）: NIR-to-RGBスペクトル領域変換は、マッピングのあいまいさのため難しい課題であり、既存の手法では学習能力が限られている。これらの課題に対処するため,我々は,マルチスケールプログレッシブ特徴埋め込みネットワーク (mpfnet) によるnir画像のカラー化を提案する。具体的には、まずNIRソース画像をグレースケールターゲットドメインに変換するドメイン翻訳モジュールを導入する。プログレッシブトレーニング戦略を導入することにより、両方のタスクドメインからの統計的および意味的知識を、一連のピクセルおよび機能レベルの一貫性制約と効率的に一致させる。さらに、学習能力を向上させるために、マルチスケールのプログレッシブ機能埋め込みネットワークが設計されている。 NIR-to-RGBスペクトル領域変換タスクにおいて、我々のMPFNetは2.55dBの性能をPSNRで上回ることを示した。

関連論文リスト

RAW-Flow: Advancing RGB-to-RAW Image Reconstruction with Deterministic Latent Flow Matching [55.03149221192589]
本稿では,RGBとRAW表現のギャップを埋めるためにRAW-Flowという新しいフレームワークを提案する。また、階層的なRGB機能をフロー推定プロセスに注入する、大規模コンテキストガイダンスモジュールも導入する。 RAW-Flowは、定量的にも視覚的にも最先端のアプローチより優れている。
論文参考訳（メタデータ） (2026-01-28T08:27:38Z)
IrisNet: Infrared Image Status Awareness Meta Decoder for Infrared Small Targets Detection [92.56025546608699]
IrisNetは、入力赤外線画像ステータスに検出戦略を適用する、新しいメタ学習フレームワークである。提案手法は,赤外線画像特徴量とデコーダパラメータ全体の動的マッピングを確立する。 NUDT-SIRST、NUAA-SIRST、IRSTD-1Kデータセットの実験は、我々のIrisNetの優位性を示している。
論文参考訳（メタデータ） (2025-11-25T13:53:54Z)
RealRep: Generalized SDR-to-HDR Conversion via Attribute-Disentangled Representation Learning [51.19027658873778]
WCG(High-Dynamic-Range Wide-Color-Gamut)技術が普及し,標準ダイナミックレンジ(SDR)コンテンツをHDRに変換する必要性が高まっている。既存の方法は固定トーンマッピング演算子に依存しており、現実世界のSDRコンテンツに存在する様々な外観や劣化を扱うのに苦労している。本稿では,構成不整合表現の学習により頑健性を高める一般化されたSDR-to- attributeフレームワークを提案する。
論文参考訳（メタデータ） (2025-05-12T08:08:58Z)
Bringing RGB and IR Together: Hierarchical Multi-Modal Enhancement for Robust Transmission Line Detection [67.02804741856512]
高速かつ高精度なTL検出のために,RGBとIRデータを統合したHMMEN(Hierarchical Multi-Modal Enhancement Network)を提案する。提案手法では,(1)階層的RGBおよびIR特徴写像を大まかに融合・拡張するMMEB,(2)デコーダ出力とIR特徴写像の不整合を変形可能な畳み込みを利用して補正するFAB,の2つの重要な構成要素を紹介する。
論文参考訳（メタデータ） (2025-01-25T06:21:06Z)
Pix2Next: Leveraging Vision Foundation Models for RGB to NIR Image Translation [0.536022165180739]
RGB入力から高画質近赤外(NIR)画像を生成する新しい画像画像変換フレームワークPix2Nextを提案する。マルチスケールのPatchGAN識別器は、様々な詳細レベルでリアルな画像生成を保証し、慎重に設計された損失関数は、グローバルなコンテキスト理解と局所的な特徴保存を結びつける。提案手法により、追加のデータ取得やアノテーションの取り組みなしに、NIRデータセットのスケールアップが可能となり、NIRベースのコンピュータビジョンアプリケーションの進歩が加速する可能性がある。
論文参考訳（メタデータ） (2024-09-25T07:51:47Z)
Near-Infrared and Low-Rank Adaptation of Vision Transformers in Remote Sensing [3.2088888904556123]
近赤外反射率(NIR)を測定するマルチスペクトルセンサを用いて植物の健康状態を動的に監視できるこのような可能性にもかかわらず、高解像度のNIR画像の取得と注釈付けは、ディープニューラルネットワークのトレーニングにおいて重要な課題となっている。本研究では、RGB領域で事前訓練された視覚変換器(ViT)バックボーンの利点について検討し、NIR領域の下流タスクに対する低ランク適応について検討した。
論文参考訳（メタデータ） (2024-05-28T07:24:07Z)
Multi-scale HSV Color Feature Embedding for High-fidelity NIR-to-RGB Spectrum Translation [5.596598303356484]
既存の手法では、テクスチャディテールの忠実さの維持と多彩な色変化の達成の間の緊張を和らげることができない。マルチスケールなHSVカラー特徴埋め込みネットワーク (MCFNet) を提案し, マッピング処理を3つのサブタスクに分割する。提案したMCFNetは、NIR画像のカラー化タスクよりもかなりの性能向上を示した。
論文参考訳（メタデータ） (2024-04-25T15:33:23Z)
You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文参考訳（メタデータ） (2024-02-08T16:47:43Z)
Cooperative Colorization: Exploring Latent Cross-Domain Priors for NIR Image Spectrum Translation [5.28882362783108]
近赤外線(NIR)画像スペクトル変換は多くの有望な応用において難しい問題である。そこで本研究では,NIR画像のカラー化を他の代用グレースケールカラー化タスクと並行して行う協調学習パラダイムを提案する。実験により,提案する協調学習フレームワークは,多彩な色と豊かなテクスチャを持つ良好なスペクトル変換出力を生成することが示された。
論文参考訳（メタデータ） (2023-08-07T07:02:42Z)
Towards Reliable Image Outpainting: Learning Structure-Aware Multimodal Fusion with Depth Guidance [49.94504248096527]
異なるモードの特徴表現をモデル化するためのDGONet(Depth-Guided Outpainting Network)を提案する。 1)マルチモーダル学習モジュールは、異なるモーダル特性の観点から独自の深さとRGBの特徴表現を生成する。我々は、不明瞭な輪郭を増進し、信頼性の高いコンテンツ生成を迅速化するために、クロスモーダルロスとエッジロスからなる追加の制約戦略を特別に設計する。
論文参考訳（メタデータ） (2022-04-12T06:06:50Z)
TBNet:Two-Stream Boundary-aware Network for Generic Image Manipulation Localization [49.521622399483846]
汎用画像操作のローカライゼーションのための新しいエンド・ツー・エンド2ストリーム境界対応ネットワーク(TBNet)を提案する。提案したTBNetは、MCCとF1の両方の観点から、最先端の汎用画像操作のローカライズ手法を大幅に上回ることができる。
論文参考訳（メタデータ） (2021-08-10T08:22:05Z)
Cross-modality Discrepant Interaction Network for RGB-D Salient Object Detection [78.47767202232298]
本稿では,RGB-D SODのためのクロスモダリティ離散相互作用ネットワーク(CDINet)を提案する。 2つのコンポーネントは、効果的な相互モダリティ相互作用を実装するように設計されている。我々のネットワークは、定量的にも質的にも15ドルの最先端の手法より優れています。
論文参考訳（メタデータ） (2021-08-04T11:24:42Z)
Attention-Guided NIR Image Colorization via Adaptive Fusion of Semantic and Texture Clues [6.437931036166344]
近赤外(NIR)イメージングは、低照度イメージングのシナリオに広く応用されている。人間やアルゴリズムが無色のNIRドメインの実際のシーンを知覚することは困難である。セマンティックおよびテクスチャのアダプティブフュージョンを用いた注意に基づく新しいNIR画像カラー化フレームワークを提案する。
論文参考訳（メタデータ） (2021-07-20T03:00:51Z)
Self-Supervised Representation Learning for RGB-D Salient Object Detection [93.17479956795862]
我々は、自己教師付き表現学習を用いて、クロスモーダルオートエンコーダと深さ-輪郭推定という2つのプレテキストタスクを設計する。我々のプレテキストタスクは、ネットワークがリッチなセマンティックコンテキストをキャプチャする事前トレーニングを実行するのに、少数のRGB-Dデータセットしか必要としない。 RGB-D SODにおけるクロスモーダル核融合の固有の問題として,マルチパス核融合モジュールを提案する。
論文参考訳（メタデータ） (2021-01-29T09:16:06Z)
Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文参考訳（メタデータ） (2020-03-15T11:04:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。