Fugu-MT 論文翻訳(概要): LLM-HDR: Bridging LLM-based Perception and Self-Supervision for Unpaired LDR-to-HDR Image Reconstruction

論文の概要: LLM-HDR: Bridging LLM-based Perception and Self-Supervision for Unpaired LDR-to-HDR Image Reconstruction

arxiv url: http://arxiv.org/abs/2410.15068v2
Date: Tue, 11 Mar 2025 06:46:42 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-12 16:15:11.476099
Title: LLM-HDR: Bridging LLM-based Perception and Self-Supervision for Unpaired LDR-to-HDR Image Reconstruction
Title（参考訳）: LLM-HDR: ブリッジングLDMによるLDR-HDR画像再構成のための自己スーパービジョン
Authors: Hrishav Bakul Barua, Kalin Stefanov, Lemuel Lai En Che, Abhinav Dhall, KokSheik Wong, Ganesh Krishnasamy,
Abstract要約: 本稿では,Large Language Models (LLM) の知覚を改良したセマンティックアーティファクト・一貫性のある対角的アーキテクチャに統合する手法を提案する。本手法は,複数のベンチマークデータセットにまたがって最先端の性能を達成し,高品質なHDR画像の再構成を行う。
参考スコア（独自算出の注目度）: 10.957314050894652
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The translation of Low Dynamic Range (LDR) to High Dynamic Range (HDR) images is an important computer vision task. There is a significant amount of research utilizing both conventional non-learning methods and modern data-driven approaches, focusing on using both single-exposed and multi-exposed LDR for HDR image reconstruction. However, most current state-of-the-art methods require high-quality paired {LDR,HDR} datasets for model training. In addition, there is limited literature on using unpaired datasets for this task, that is, the model learns a mapping between domains, i.e., {LDR,HDR}. This paper proposes LLM-HDR, a method that integrates the perception of Large Language Models (LLM) into a modified semantic- and cycle-consistent adversarial architecture that utilizes unpaired {LDR,HDR} datasets for training. The method introduces novel artifact- and exposure-aware generators to address visual artifact removal and an encoder and loss to address semantic consistency, another under-explored topic. LLM-HDR is the first to use an LLM for the {LDR,HDR} translation task in a self-supervised setup. The method achieves state-of-the-art performance across several benchmark datasets and reconstructs high-quality HDR images. The official website of this work is available at: https://github.com/HrishavBakulBarua/LLM-HDR
Abstract（参考訳）: 低ダイナミックレンジ(LDR)から高ダイナミックレンジ(HDR)への変換は重要なコンピュータビジョンタスクである。従来の非学習手法と現代のデータ駆動手法の両方を用いて、HDR画像再構成のための単一露光LDRと多露光LDRの両方の利用に焦点を当てた研究が多数存在する。しかし、現在の最先端手法のほとんどは、モデルトレーニングのために高品質なペア化された {LDR, HDR} データセットを必要とする。さらに、このタスクに未ペアデータセットを使用する場合、すなわち、モデルがドメイン間のマッピング、すなわち {LDR, HDR} を学ぶ場合、限られた文献がある。本稿ではLLM-HDRを提案する。LLM(Large Language Models, LLM)の認識を, 未ペアの {LDR, HDR} データセットをトレーニングに用いる改良型セマンティックおよびサイクル一貫性の対向アーキテクチャに統合する手法である。視覚的アーティファクト除去とエンコーダに対処する新しいアーティファクトおよび露出対応ジェネレータを導入し、セマンティック一貫性に対処する。 LLM-HDR は LLM を LDR,HDR 翻訳タスクに初めて使用する。本手法は,複数のベンチマークデータセットにまたがって最先端の性能を達成し,高品質なHDR画像の再構成を行う。 https://github.com/HrishavBakulBarua/LLM-HDR

関連論文リスト

iHDR: Iterative HDR Imaging with Arbitrary Number of Exposures [1.9686770963118383]
高ダイナミックレンジ(LDR)画像は、複数の低ダイナミックレンジ(LDR)画像からの情報を融合して高品質なHDR画像を得る。我々のフレームワークはゴーストフリーのデュアルインプット・フュージョン・ネットワーク(Di)と物理ベースのドメインマッピング・ネットワーク(ToneNet)で構成されている。 Diは中間HDR画像を推定し、ToneNetはそれを非線形領域にマッピングし、次のペア融合の基準として機能する。
論文参考訳（メタデータ） (2025-05-29T01:20:31Z)
HDR-GS: Efficient High Dynamic Range Novel View Synthesis at 1000x Speed via Gaussian Splatting [76.5908492298286]
既存のHDR NVS法は主にNeRFに基づいている。訓練時間は長く、推論速度は遅い。我々は新しいフレームワークHigh Dynamic Range Gaussian Splatting (-GS)を提案する。
論文参考訳（メタデータ） (2024-05-24T00:46:58Z)
Generating Content for HDR Deghosting from Frequency View [56.103761824603644]
近年の拡散モデル (DM) はHDRイメージング分野に導入されている。 DMは画像全体を推定するために大きなモデルで広範囲の反復を必要とする。ゴーストフリーHDRイメージングのための低周波数対応拡散(LF-Diff)モデルを提案する。
論文参考訳（メタデータ） (2024-04-01T01:32:11Z)
HistoHDR-Net: Histogram Equalization for Single LDR to HDR Image Translation [12.45632443397018]
高ダイナミックレンジ(HDR)イメージングは、現実世界のシーンの高画質と明快さを再現することを目的としている。この文献は、低ダイナミックレンジ(Low Dynamic Range, LDR)からのHDR画像再構成のための様々なデータ駆動手法を提供している。これらのアプローチの共通する制限は、再構成されたHDR画像の領域における詳細が欠けていることである。細部を復元するためのシンプルで効果的な手法Histo-Netを提案する。
論文参考訳（メタデータ） (2024-02-08T20:14:46Z)
Towards High-quality HDR Deghosting with Conditional Diffusion Models [88.83729417524823]
高ダイナミックレンジ(LDR)画像は、既存のディープニューラルネットワーク(DNN)技術により、複数の低ダイナミックレンジ(LDR)画像から復元することができる。 DNNは、LDR画像が飽和度と大きな動きを持つ場合、ゴーストアーティファクトを生成する。拡散モデルの条件としてLDR特徴を利用する画像生成としてHDRデゴースト問題を定式化する。
論文参考訳（メタデータ） (2023-11-02T01:53:55Z)
Self-Supervised High Dynamic Range Imaging with Multi-Exposure Images in Dynamic Scenes [58.66427721308464]
Selfは、訓練中にダイナミックなマルチ露光画像のみを必要とする自己教師型再構成手法である。 Selfは最先端の自己管理手法に対して優れた結果を出し、教師付き手法に匹敵するパフォーマンスを実現している。
論文参考訳（メタデータ） (2023-10-03T07:10:49Z)
Learning Continuous Exposure Value Representations for Single-Image HDR Reconstruction [23.930923461672894]
LDRスタックに基づく手法は, 深層学習により生成したHDRスタックからHDR画像を生成する単一像HDR再構成に使用される。現在の方法では、所定の露光値(EV)を持つスタックを生成し、HDR再構成の品質を制限できる。本稿では、暗黙の関数を用いて任意のEVでLDR画像を生成する連続露光値表現(CEVR)を提案する。
論文参考訳（メタデータ） (2023-09-07T17:59:03Z)
SMAE: Few-shot Learning for HDR Deghosting with Saturation-Aware Masked Autoencoders [97.64072440883392]
そこで本研究では,SSHDRと呼ばれる2段階の訓練を通した短距離HDRイメージングを実現するための,新しい半教師付きアプローチを提案する。以前の方法とは異なり、コンテンツを直接回復し、ゴーストを同時に除去することは、最適に達成することが難しい。実験により、SSHDRは異なるデータセットの内外における定量的かつ定性的に最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2023-04-14T03:42:51Z)
HDR Video Reconstruction with a Large Dynamic Dataset in Raw and sRGB Domains [23.309488653045026]
高ダイナミックレンジ(HDR)ビデオ再構成は、低ダイナミックレンジ(LDR)ビデオと比較して視覚的品質が優れているため、ますます注目を集めている。同時にLDRフレームを取得するのが難しいため、動的シーンのための実際のLDR-ペアはいまだに存在しない。本研究では,2つの異なる露光画像を同時にキャプチャするスタッガーセンサを用いて,生領域とsRGB領域のHDRフレームに融合する手法を提案する。
論文参考訳（メタデータ） (2023-04-10T11:59:03Z)
GlowGAN: Unsupervised Learning of HDR Images from LDR Images in the Wild [74.52723408793648]
そこで本研究では,HDR画像の生成モデルを構築するための第1の手法について述べる。鍵となる考え方は、GAN(Generative Adversarial Network)を訓練して、様々な露光下でLDRに投影された場合、実際のLDR画像と区別できないHDR画像を生成することである。実験の結果,GlowGANはランドスケープ,雷,窓など多くの難題において,光現実的HDR画像を合成できることがわかった。
論文参考訳（メタデータ） (2022-11-22T15:42:08Z)
A Two-stage Deep Network for High Dynamic Range Image Reconstruction [0.883717274344425]
本研究では,新しい2段階深層ネットワークを提案することにより,シングルショットLDRからHDRマッピングへの課題に取り組む。提案手法は,カメラ応答機能(CRF)や露光設定など,ハードウェア情報を知ることなくHDR画像の再構築を図ることを目的とする。
論文参考訳（メタデータ） (2021-04-19T15:19:17Z)
HDR Video Reconstruction: A Coarse-to-fine Network and A Real-world Benchmark Dataset [30.249052175655606]
HDRビデオ再構築のための粗い深層学習フレームワークを紹介します。まず,画像空間において粗いアライメントとピクセルブレンドを行い,粗いhdr映像を推定する。第二に、粗いHDRビデオの特徴空間でより洗練されたアライメントと時間融合を行い、より良い再構築を実現します。
論文参考訳（メタデータ） (2021-03-27T16:40:05Z)
MetaHDR: Model-Agnostic Meta-Learning for HDR Image Reconstruction [0.0]
低ダイナミックレンジ画像を高ダイナミックレンジ画像に変換する既存のアプローチは、すべての変換が同じ非線形マッピングによって管理されるという仮定によって制限される。既存のHDRデータセットを用いたLDR-to-Model変換問題にメタラーニングを適用したHDR-Agnostic Image Reconstruction (Meta)を提案する。
論文参考訳（メタデータ） (2021-03-20T07:56:45Z)
HDR-GAN: HDR Image Reconstruction from Multi-Exposed LDR Images with Large Motions [62.44802076971331]
マルチ露光LDR画像からHDR画像を合成するための新しいGANモデルHDR-GANを提案する。本手法は,敵対学習を取り入れることで,欠落したコンテンツのある領域に忠実な情報を生成することができる。
論文参考訳（メタデータ） (2020-07-03T11:42:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。