論文の概要: InfoBFR: Real-World Blind Face Restoration via Information Bottleneck
- arxiv url: http://arxiv.org/abs/2501.15443v1
- Date: Sun, 26 Jan 2025 08:11:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:56:31.911801
- Title: InfoBFR: Real-World Blind Face Restoration via Information Bottleneck
- Title(参考訳): InfoBFR:Information Bottleneckによるリアルタイムブラインド顔復元
- Authors: Nan Gao, Jia Li, Huaibo Huang, Ke Shang, Ran He,
- Abstract要約: 本稿では, プリエントバイアス, トポロジ的歪み, テクスチュラル歪み, アーティファクト残留などのニューラル劣化に対処するプラグイン・アンド・プレイフレームワークInfoBFRを提案する。
InfoBFRは属性やアイデンティティの歪みのない高忠実な面を効果的に合成する。
InfoBFRは、ニューラルネットワークの劣化を克服するために様々なBFRモデルに普遍的に使用される最初のプラグアンドプレイ復元器となることを約束している。
- 参考スコア(独自算出の注目度): 66.14954670338967
- License:
- Abstract: Blind face restoration (BFR) is a highly challenging problem due to the uncertainty of data degradation patterns. Current BFR methods have realized certain restored productions but with inherent neural degradations that limit real-world generalization in complicated scenarios. In this paper, we propose a plug-and-play framework InfoBFR to tackle neural degradations, e.g., prior bias, topological distortion, textural distortion, and artifact residues, which achieves high-generalization face restoration in diverse wild and heterogeneous scenes. Specifically, based on the results from pre-trained BFR models, InfoBFR considers information compression using manifold information bottleneck (MIB) and information compensation with efficient diffusion LoRA to conduct information optimization. InfoBFR effectively synthesizes high-fidelity faces without attribute and identity distortions. Comprehensive experimental results demonstrate the superiority of InfoBFR over state-of-the-art GAN-based and diffusion-based BFR methods, with around 70ms consumption, 16M trainable parameters, and nearly 85% BFR-boosting. It is promising that InfoBFR will be the first plug-and-play restorer universally employed by diverse BFR models to conquer neural degradations.
- Abstract(参考訳): ブラインド顔復元(BFR)は、データ劣化パターンの不確実性のため、非常に難しい問題である。
現在のBFR法は、ある種の復元された生産を実現しているが、複雑なシナリオにおける現実の一般化を制限する固有の神経劣化を実現している。
本稿では, 様々な自然・異種シーンにおいて, 高一般化顔復元を実現するための, ニューラル劣化, 例えば, 先行バイアス, トポロジカル歪み, テクスチュラル歪み, アーティファクト残留に対処するプラグイン・アンド・プレイ・フレームワークInfoBFRを提案する。
具体的には、事前学習されたBFRモデルの結果に基づいて、多様体情報ボトルネック(MIB)を用いた情報圧縮と効率的な拡散LoRAによる情報補償を考慮し、情報最適化を行う。
InfoBFRは属性やアイデンティティの歪みのない高忠実な顔を効果的に合成する。
包括的実験により,70msの消費,16Mのトレーニング可能なパラメータ,約85%のBFRブースティングを含む,最先端のGAN法および拡散型BFR法よりもInfoBFRの方が優れていることが示された。
InfoBFRは、ニューラルネットワークの劣化を克服するために様々なBFRモデルに普遍的に使用される最初のプラグアンドプレイ復元器となることを約束している。
関連論文リスト
- DR-BFR: Degradation Representation with Diffusion Models for Blind Face Restoration [7.521850476177286]
低品質 (LQ) の顔画像から様々な劣化を分解する能力を持つ拡散モデルを開発した。
DR-BFRと呼ばれる新しい修復手法は、劣化表現(DR)とLQ画像からのコンテンツ特徴を取り入れることで、遅延拡散モデル(LDM)の認知を導く。
DR-BFRは、様々なデータセットに対して定量的かつ質的に最先端の手法を著しく上回る。
論文 参考訳(メタデータ) (2024-11-15T15:24:42Z) - IB-AdCSCNet:Adaptive Convolutional Sparse Coding Network Driven by Information Bottleneck [4.523653503622693]
IB-AdCSCNetは情報ボトルネック理論に基づくディープラーニングモデルである。
IB-AdCSCNetは、情報ボトルネックトレードオフ戦略をディープネットワークにシームレスに統合する。
CIFAR-10とCIFAR-100データセットの実験結果は、IB-AdCSCNetが深い残差畳み込みネットワークの性能にマッチするだけでなく、破損したデータを扱う際の性能も優れていることを示した。
論文 参考訳(メタデータ) (2024-05-23T05:35:57Z) - Towards Real-world Video Face Restoration: A New Benchmark [33.01372704755186]
我々は,「フル,オクルード,サイド」の顔を持つFOSという新しい実世界のデータセットを紹介した。
FOSデータセットは、より多様な劣化をカバーし、より複雑なシナリオからの顔サンプルを含む。
我々は、最先端のBFR法とビデオスーパー解像度(VSR)法の両方をベンチマークして、現在のアプローチを網羅的に研究した。
論文 参考訳(メタデータ) (2024-04-30T12:37:01Z) - An Aggregation-Free Federated Learning for Tackling Data Heterogeneity [50.44021981013037]
フェデレートラーニング(FL)は、分散データセットからの知識を活用する効果に頼っている。
従来のFLメソッドでは、クライアントが前回のトレーニングラウンドからサーバが集約したグローバルモデルに基づいてローカルモデルを更新するアグリゲート-then-adaptフレームワークを採用している。
我々は,新しいアグリゲーションフリーFLアルゴリズムであるFedAFを紹介する。
論文 参考訳(メタデータ) (2024-04-29T05:55:23Z) - DiffMAC: Diffusion Manifold Hallucination Correction for High Generalization Blind Face Restoration [62.44659039265439]
視覚障害者の視力回復を支援するための拡散情報拡散フレームワークを提案する。
DiffMACは、多種多様な劣化シーンと異種ドメインにおいて、高度な顔の復元を実現する。
結果は,最先端手法よりもDiffMACの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-15T08:44:15Z) - BFRFormer: Transformer-based generator for Real-World Blind Face
Restoration [37.77996097891398]
本稿では,トランスフォーマーをベースとしたブラインドフェイス復元手法BFRFormerを提案する。
提案手法は, 合成データセットと実世界の4つのデータセットにおいて, 最先端の手法より優れる。
論文 参考訳(メタデータ) (2024-02-29T02:31:54Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - Generative Diffusion Prior for Unified Image Restoration and Enhancement [62.76390152617949]
既存の画像復元法は、主に自然画像の後方分布を利用する。
教師なしサンプリング方式で後部分布を効果的にモデル化するための生成拡散優先(GDP)を提案する。
GDPは、線形逆問題、非線形問題、ブラインド問題を解くために、プレトレインデノナイジング拡散生成モデル(DDPM)を利用する。
論文 参考訳(メタデータ) (2023-04-03T16:52:43Z) - Panini-Net: GAN Prior Based Degradation-Aware Feature Interpolation for
Face Restoration [4.244692655670362]
Panini-Netは、顔修復のための劣化認識機能ネットワークである。
抽象表現を学び、様々な劣化を区別する。
マルチ劣化顔復元と超解像のための最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-16T07:41:07Z) - A Generalizable Model-and-Data Driven Approach for Open-Set RFF
Authentication [74.63333951647581]
高周波指紋(RFF)は、低コストな物理層認証を実現するための有望な解決策である。
RFF抽出と識別のために機械学習に基づく手法が提案されている。
生受信信号からRFFを抽出するエンド・ツー・エンドのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-10T03:59:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。