論文の概要: GVTNet: Graph Vision Transformer For Face Super-Resolution
- arxiv url: http://arxiv.org/abs/2502.12570v1
- Date: Tue, 18 Feb 2025 06:15:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 14:07:06.014196
- Title: GVTNet: Graph Vision Transformer For Face Super-Resolution
- Title(参考訳): GVTNet:顔の超解像のためのグラフビジョントランスフォーマー
- Authors: Chao Yang, Yong Fan, Cheng Lu, Minghao Yuan, Zhijing Yang,
- Abstract要約: 本稿では,グラフビジョントランスネットワークと呼ばれる,グラフニューラルネットワークに基づくトランスフォーマーアーキテクチャを提案する。
それぞれのパッチをグラフノードとして扱い、パッチ間の情報に基づいて隣接行列を確立する。
このようにして、パッチは隣のパッチの間でのみ相互作用し、さらに顔コンポーネントの関係を処理する。
- 参考スコア(独自算出の注目度): 9.27272284458893
- License:
- Abstract: Recent advances in face super-resolution research have utilized the Transformer architecture. This method processes the input image into a series of small patches. However, because of the strong correlation between different facial components in facial images. When it comes to super-resolution of low-resolution images, existing algorithms cannot handle the relationships between patches well, resulting in distorted facial components in the super-resolution results. To solve the problem, we propose a transformer architecture based on graph neural networks called graph vision transformer network. We treat each patch as a graph node and establish an adjacency matrix based on the information between patches. In this way, the patch only interacts between neighboring patches, further processing the relationship of facial components. Quantitative and visualization experiments have underscored the superiority of our algorithm over state-of-the-art techniques. Through detailed comparisons, we have demonstrated that our algorithm possesses more advanced super-resolution capabilities, particularly in enhancing facial components. The PyTorch code is available at https://github.com/continueyang/GVTNet
- Abstract(参考訳): 顔の超解像研究の最近の進歩は、Transformerアーキテクチャを利用した。
この方法は入力画像を一連の小さなパッチに処理する。
しかし,顔画像の異なる顔成分の相関が強いためである。
低解像度画像の超解像に関しては、既存のアルゴリズムではパッチ間の関係をうまく扱えないため、超解像結果の変形した顔成分が生じる。
そこで本研究では,グラフ・ビジョン・トランスフォーマー・ネットワークと呼ばれる,グラフニューラルネットワークに基づくトランスフォーマー・アーキテクチャを提案する。
それぞれのパッチをグラフノードとして扱い、パッチ間の情報に基づいて隣接行列を確立する。
このようにして、パッチは隣のパッチの間でのみ相互作用し、さらに顔コンポーネントの関係を処理する。
定量化および可視化実験は、最先端技術よりもアルゴリズムの優位性を裏付けている。
より詳細な比較を通して、我々のアルゴリズムは、特に顔成分の強化において、より高度な超解像能力を有することを示した。
PyTorchのコードはhttps://github.com/continueyang/GVTNetで公開されている。
関連論文リスト
- Transformer based Pluralistic Image Completion with Reduced Information Loss [72.92754600354199]
トランスフォーマーをベースとした手法は,近年,イメージインペイントにおいて大きな成功を収めている。
彼らは各ピクセルをトークンとみなし、情報損失の問題に悩まされる。
我々はPUTと呼ばれる新しいトランスフォーマーベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T01:20:16Z) - Learning from small data sets: Patch-based regularizers in inverse
problems for image reconstruction [1.1650821883155187]
機械学習の最近の進歩は、ネットワークを訓練するために大量のデータとコンピュータ能力を必要とする。
本稿は,ごく少数の画像のパッチを考慮に入れることで,小さなデータセットから学習する問題に対処する。
本稿では,Langevin Monte Carlo法を用いて後部を近似することにより,不確実な定量化を実現する方法を示す。
論文 参考訳(メタデータ) (2023-12-27T15:30:05Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - Accurate Image Restoration with Attention Retractable Transformer [50.05204240159985]
画像復元のためのアテンション・リトラクタブル・トランス (ART) を提案する。
ARTはネットワーク内の密集モジュールと疎開モジュールの両方を提示する。
画像超解像、デノナイジング、JPEG圧縮アーティファクト削減タスクについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-10-04T07:35:01Z) - Graph Reasoning Transformer for Image Parsing [67.76633142645284]
本稿では,画像解析のためのグラフ推論変換器(GReaT)を提案する。
従来の変圧器と比較して、GReaTは高い相互作用効率とより目的のある相互作用パターンを有する。
その結果、GReaTは、最先端のトランスフォーマーベースラインにわずかに計算オーバーヘッドを伴って、一貫した性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2022-09-20T08:21:37Z) - HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。
入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。
このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文 参考訳(メタデータ) (2022-03-19T05:09:34Z) - A new face swap method for image and video domains: a technical report [60.47144478048589]
FaceShifterアーキテクチャに基づいた新しいフェイススワップパイプラインを導入する。
新しいアイロス機能、超解像ブロック、ガウスベースのフェイスマスク生成は、品質改善につながる。
論文 参考訳(メタデータ) (2022-02-07T10:15:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。