論文の概要: MUJICA: Reforming SISR Models for PBR Material Super-Resolution via Cross-Map Attention
- arxiv url: http://arxiv.org/abs/2508.09802v1
- Date: Wed, 13 Aug 2025 13:34:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.903888
- Title: MUJICA: Reforming SISR Models for PBR Material Super-Resolution via Cross-Map Attention
- Title(参考訳): MUJICA: 交差マップによるPBR材料超解法のSISRモデル改革
- Authors: Xin Du, Maoyuan Xu, Zhi Ying,
- Abstract要約: SVBRDFのアップスケールは、現代の3Dグラフィックアプリケーションに有用である。
既存のSingle Image Super-Resolution(SISR)メソッドは、クロスマップの不整合に対処する。
クロスマップアテンション(MUJICA)を用いたマルチモーダル・アップスケーリング・ジョイント推論を提案する。
- 参考スコア(独自算出の注目度): 18.167577989282247
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Physically Based Rendering (PBR) materials are typically characterized by multiple 2D texture maps such as basecolor, normal, metallic, and roughness which encode spatially-varying bi-directional reflectance distribution function (SVBRDF) parameters to model surface reflectance properties and microfacet interactions. Upscaling SVBRDF material is valuable for modern 3D graphics applications. However, existing Single Image Super-Resolution (SISR) methods struggle with cross-map inconsistency, inadequate modeling of modality-specific features, and limited generalization due to data distribution shifts. In this work, we propose Multi-modal Upscaling Joint Inference via Cross-map Attention (MUJICA), a flexible adapter that reforms pre-trained Swin-transformer-based SISR models for PBR material super-resolution. MUJICA is seamlessly attached after the pre-trained and frozen SISR backbone. It leverages cross-map attention to fuse features while preserving remarkable reconstruction ability of the pre-trained SISR model. Applied to SISR models such as SwinIR, DRCT, and HMANet, MUJICA improves PSNR, SSIM, and LPIPS scores while preserving cross-map consistency. Experiments demonstrate that MUJICA enables efficient training even with limited resources and delivers state-of-the-art performance on PBR material datasets.
- Abstract(参考訳): 物理ベースレンダリング(PBR)材料は、通常、表面反射特性やマイクロフェイス相互作用をモデル化するために、空間的に変化する双方向反射率分布関数(SVBRDF)パラメータを符号化するベースカラー、ノーマル、メタル、粗さなどの複数の2次元テクスチャマップによって特徴づけられる。
SVBRDFのアップスケールは、現代の3Dグラフィックアプリケーションに有用である。
しかし、既存のSingle Image Super-Resolution (SISR) 法は、交差マップの不整合、モダリティ固有の特徴の不十分なモデリング、データ分散シフトによる限定的な一般化に苦慮している。
本研究では,PBR材料超解像のためのSwin-transformer-based SISRモデルを改良したフレキシブルアダプタであるMulti-modal Upscaling Joint Inference(MUJICA)を提案する。
MUJICAは、トレーニング済みで凍結したSISRのバックボーンの後、シームレスに取り付けられる。
これは、事前訓練されたSISRモデルの顕著な再構築能力を保ちながら、地図横断の注意をヒューズの特徴に活用する。
SwinIR、DRCT、HMANetなどのSISRモデルに適用すると、MUJICAはPSNR、SSIM、LPIPSのスコアを改善し、クロスマップの一貫性を保つ。
実験では、MUJICAは限られたリソースでも効率的なトレーニングを可能にし、PBR素材データセット上で最先端のパフォーマンスを提供する。
関連論文リスト
- Robust and Generalizable Heart Rate Estimation via Deep Learning for Remote Photoplethysmography in Complex Scenarios [7.2297623319815845]
非リモート光合成技術は、顔ビデオからの心拍測定を可能にする。
既存のネットワークモデルは、アクアリアシー、堅牢性、一般化能力の課題に直面している。
本稿では,3次元畳み込みニューラルネットワークを用いたエンドツーエンドのr抽出ネットワークを提案する。
論文 参考訳(メタデータ) (2025-07-10T14:23:11Z) - DiMoSR: Feature Modulation via Multi-Branch Dilated Convolutions for Efficient Image Super-Resolution [7.714092783675679]
本稿では、軽量SISRネットワークにおける注目を補うために、変調による特徴表現を強化する新しいアーキテクチャであるDiMoSRを紹介する。
実験により、DiMoSRは様々なベンチマークデータセットで最先端の軽量メソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-05-27T14:40:05Z) - Enhanced Super-Resolution Training via Mimicked Alignment for Real-World Scenes [51.92255321684027]
トレーニング中、LR入力とHR画像の整列により、誤調整問題を緩和する新しいプラグアンドプレイモジュールを提案する。
具体的には,従来のLR試料の特徴を保ちながらHRと整合する新しいLR試料を模倣する。
本手法を合成および実世界のデータセット上で総合的に評価し,SRモデルのスペクトル間での有効性を実証した。
論文 参考訳(メタデータ) (2024-10-07T18:18:54Z) - Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文 参考訳(メタデータ) (2024-06-09T10:30:25Z) - IRSRMamba: Infrared Image Super-Resolution via Mamba-based Wavelet Transform Feature Modulation Model [7.842507196763463]
IRSRMambaはマルチスケール適応のためのウェーブレット変換特徴変調を統合する新しいフレームワークである。
IRSRMambaはPSNR、SSIM、知覚品質において最先端の手法より優れている。
この研究は、高忠実度赤外線画像強調のための有望な方向として、Mambaベースのアーキテクチャを確立する。
論文 参考訳(メタデータ) (2024-05-16T07:49:24Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - SRDiff: Single Image Super-Resolution with Diffusion Probabilistic
Models [19.17571465274627]
単一の画像スーパーリゾリューション(SISR)は、与えられた低リゾリューション(LR)画像から高解像度(HR)画像を再構成することを目的とする。
新規な単像超解像拡散確率モデル(SRDiff)を提案する。
SRDiffはデータ可能性の変動境界の変種に最適化されており、多様で現実的なSR予測を提供することができる。
論文 参考訳(メタデータ) (2021-04-30T12:31:25Z) - DDet: Dual-path Dynamic Enhancement Network for Real-World Image
Super-Resolution [69.2432352477966]
実画像超解像(Real-SR)は、実世界の高分解能画像(HR)と低分解能画像(LR)の関係に焦点を当てている。
本稿では,Real-SRのためのデュアルパス動的拡張ネットワーク(DDet)を提案する。
特徴表現のための大規模な畳み込みブロックを積み重ねる従来の手法とは異なり、非一貫性のある画像対を研究するためのコンテンツ認識フレームワークを導入する。
論文 参考訳(メタデータ) (2020-02-25T18:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。