論文の概要: LLM-HDR: Bridging LLM-based Perception and Self-Supervision for Unpaired LDR-to-HDR Image Reconstruction
- arxiv url: http://arxiv.org/abs/2410.15068v2
- Date: Tue, 11 Mar 2025 06:46:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:40:59.173493
- Title: LLM-HDR: Bridging LLM-based Perception and Self-Supervision for Unpaired LDR-to-HDR Image Reconstruction
- Title(参考訳): LLM-HDR: ブリッジングLDMによるLDR-HDR画像再構成のための自己スーパービジョン
- Authors: Hrishav Bakul Barua, Kalin Stefanov, Lemuel Lai En Che, Abhinav Dhall, KokSheik Wong, Ganesh Krishnasamy,
- Abstract要約: 本稿では,Large Language Models (LLM) の知覚を改良したセマンティックアーティファクト・一貫性のある対角的アーキテクチャに統合する手法を提案する。
本手法は,複数のベンチマークデータセットにまたがって最先端の性能を達成し,高品質なHDR画像の再構成を行う。
- 参考スコア(独自算出の注目度): 10.957314050894652
- License:
- Abstract: The translation of Low Dynamic Range (LDR) to High Dynamic Range (HDR) images is an important computer vision task. There is a significant amount of research utilizing both conventional non-learning methods and modern data-driven approaches, focusing on using both single-exposed and multi-exposed LDR for HDR image reconstruction. However, most current state-of-the-art methods require high-quality paired {LDR,HDR} datasets for model training. In addition, there is limited literature on using unpaired datasets for this task, that is, the model learns a mapping between domains, i.e., {LDR,HDR}. This paper proposes LLM-HDR, a method that integrates the perception of Large Language Models (LLM) into a modified semantic- and cycle-consistent adversarial architecture that utilizes unpaired {LDR,HDR} datasets for training. The method introduces novel artifact- and exposure-aware generators to address visual artifact removal and an encoder and loss to address semantic consistency, another under-explored topic. LLM-HDR is the first to use an LLM for the {LDR,HDR} translation task in a self-supervised setup. The method achieves state-of-the-art performance across several benchmark datasets and reconstructs high-quality HDR images. The official website of this work is available at: https://github.com/HrishavBakulBarua/LLM-HDR
- Abstract(参考訳): 低ダイナミックレンジ(LDR)から高ダイナミックレンジ(HDR)への変換は重要なコンピュータビジョンタスクである。
従来の非学習手法と現代のデータ駆動手法の両方を用いて、HDR画像再構成のための単一露光LDRと多露光LDRの両方の利用に焦点を当てた研究が多数存在する。
しかし、現在の最先端手法のほとんどは、モデルトレーニングのために高品質なペア化された {LDR, HDR} データセットを必要とする。
さらに、このタスクに未ペアデータセットを使用する場合、すなわち、モデルがドメイン間のマッピング、すなわち {LDR, HDR} を学ぶ場合、限られた文献がある。
本稿ではLLM-HDRを提案する。LLM(Large Language Models, LLM)の認識を, 未ペアの {LDR, HDR} データセットをトレーニングに用いる改良型セマンティックおよびサイクル一貫性の対向アーキテクチャに統合する手法である。
視覚的アーティファクト除去とエンコーダに対処する新しいアーティファクトおよび露出対応ジェネレータを導入し、セマンティック一貫性に対処する。
LLM-HDR は LLM を LDR,HDR 翻訳タスクに初めて使用する。
本手法は,複数のベンチマークデータセットにまたがって最先端の性能を達成し,高品質なHDR画像の再構成を行う。
https://github.com/HrishavBakulBarua/LLM-HDR
関連論文リスト
- Generating Content for HDR Deghosting from Frequency View [56.103761824603644]
近年の拡散モデル (DM) はHDRイメージング分野に導入されている。
DMは画像全体を推定するために大きなモデルで広範囲の反復を必要とする。
ゴーストフリーHDRイメージングのための低周波数対応拡散(LF-Diff)モデルを提案する。
論文 参考訳(メタデータ) (2024-04-01T01:32:11Z) - HistoHDR-Net: Histogram Equalization for Single LDR to HDR Image
Translation [12.45632443397018]
高ダイナミックレンジ(HDR)イメージングは、現実世界のシーンの高画質と明快さを再現することを目的としている。
この文献は、低ダイナミックレンジ(Low Dynamic Range, LDR)からのHDR画像再構成のための様々なデータ駆動手法を提供している。
これらのアプローチの共通する制限は、再構成されたHDR画像の領域における詳細が欠けていることである。
細部を復元するためのシンプルで効果的な手法Histo-Netを提案する。
論文 参考訳(メタデータ) (2024-02-08T20:14:46Z) - Towards High-quality HDR Deghosting with Conditional Diffusion Models [88.83729417524823]
高ダイナミックレンジ(LDR)画像は、既存のディープニューラルネットワーク(DNN)技術により、複数の低ダイナミックレンジ(LDR)画像から復元することができる。
DNNは、LDR画像が飽和度と大きな動きを持つ場合、ゴーストアーティファクトを生成する。
拡散モデルの条件としてLDR特徴を利用する画像生成としてHDRデゴースト問題を定式化する。
論文 参考訳(メタデータ) (2023-11-02T01:53:55Z) - Self-Supervised High Dynamic Range Imaging with Multi-Exposure Images in
Dynamic Scenes [58.66427721308464]
Selfは、訓練中にダイナミックなマルチ露光画像のみを必要とする自己教師型再構成手法である。
Selfは最先端の自己管理手法に対して優れた結果を出し、教師付き手法に匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-10-03T07:10:49Z) - Learning Continuous Exposure Value Representations for Single-Image HDR
Reconstruction [23.930923461672894]
LDRスタックに基づく手法は, 深層学習により生成したHDRスタックからHDR画像を生成する単一像HDR再構成に使用される。
現在の方法では、所定の露光値(EV)を持つスタックを生成し、HDR再構成の品質を制限できる。
本稿では、暗黙の関数を用いて任意のEVでLDR画像を生成する連続露光値表現(CEVR)を提案する。
論文 参考訳(メタデータ) (2023-09-07T17:59:03Z) - SMAE: Few-shot Learning for HDR Deghosting with Saturation-Aware Masked
Autoencoders [97.64072440883392]
そこで本研究では,SSHDRと呼ばれる2段階の訓練を通した短距離HDRイメージングを実現するための,新しい半教師付きアプローチを提案する。
以前の方法とは異なり、コンテンツを直接回復し、ゴーストを同時に除去することは、最適に達成することが難しい。
実験により、SSHDRは異なるデータセットの内外における定量的かつ定性的に最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-04-14T03:42:51Z) - GlowGAN: Unsupervised Learning of HDR Images from LDR Images in the Wild [74.52723408793648]
そこで本研究では,HDR画像の生成モデルを構築するための第1の手法について述べる。
鍵となる考え方は、GAN(Generative Adversarial Network)を訓練して、様々な露光下でLDRに投影された場合、実際のLDR画像と区別できないHDR画像を生成することである。
実験の結果,GlowGANはランドスケープ,雷,窓など多くの難題において,光現実的HDR画像を合成できることがわかった。
論文 参考訳(メタデータ) (2022-11-22T15:42:08Z) - A Two-stage Deep Network for High Dynamic Range Image Reconstruction [0.883717274344425]
本研究では,新しい2段階深層ネットワークを提案することにより,シングルショットLDRからHDRマッピングへの課題に取り組む。
提案手法は,カメラ応答機能(CRF)や露光設定など,ハードウェア情報を知ることなくHDR画像の再構築を図ることを目的とする。
論文 参考訳(メタデータ) (2021-04-19T15:19:17Z) - MetaHDR: Model-Agnostic Meta-Learning for HDR Image Reconstruction [0.0]
低ダイナミックレンジ画像を高ダイナミックレンジ画像に変換する既存のアプローチは、すべての変換が同じ非線形マッピングによって管理されるという仮定によって制限される。
既存のHDRデータセットを用いたLDR-to-Model変換問題にメタラーニングを適用したHDR-Agnostic Image Reconstruction (Meta)を提案する。
論文 参考訳(メタデータ) (2021-03-20T07:56:45Z) - HDR-GAN: HDR Image Reconstruction from Multi-Exposed LDR Images with
Large Motions [62.44802076971331]
マルチ露光LDR画像からHDR画像を合成するための新しいGANモデルHDR-GANを提案する。
本手法は,敵対学習を取り入れることで,欠落したコンテンツのある領域に忠実な情報を生成することができる。
論文 参考訳(メタデータ) (2020-07-03T11:42:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。