論文の概要: Trans-Adapter: A Plug-and-Play Framework for Transparent Image Inpainting
- arxiv url: http://arxiv.org/abs/2508.01098v1
- Date: Fri, 01 Aug 2025 22:27:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.711989
- Title: Trans-Adapter: A Plug-and-Play Framework for Transparent Image Inpainting
- Title(参考訳): Trans-Adapter: 透明なイメージインペインティングのためのプラグイン・アンド・プレイフレームワーク
- Authors: Yuekun Dai, Haitian Li, Shangchen Zhou, Chen Change Loy,
- Abstract要約: 既存の画像の塗装法は、RGB画像専用に設計されている。
Trans-Adapterは、拡散ベースのインペイントモデルで透過的な画像を直接処理できるプラグイン・アンド・プレイアダプタである。
- 参考スコア(独自算出の注目度): 60.062438188868306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: RGBA images, with the additional alpha channel, are crucial for any application that needs blending, masking, or transparency effects, making them more versatile than standard RGB images. Nevertheless, existing image inpainting methods are designed exclusively for RGB images. Conventional approaches to transparent image inpainting typically involve placing a background underneath RGBA images and employing a two-stage process: image inpainting followed by image matting. This pipeline, however, struggles to preserve transparency consistency in edited regions, and matting can introduce jagged edges along transparency boundaries. To address these challenges, we propose Trans-Adapter, a plug-and-play adapter that enables diffusion-based inpainting models to process transparent images directly. Trans-Adapter also supports controllable editing via ControlNet and can be seamlessly integrated into various community models. To evaluate our method, we introduce LayerBench, along with a novel non-reference alpha edge quality evaluation metric for assessing transparency edge quality. We conduct extensive experiments on LayerBench to demonstrate the effectiveness of our approach.
- Abstract(参考訳): RGBA画像は、アルファチャンネルを追加して、ブレンディング、マスキング、透明な効果を必要とするアプリケーションにとって極めて重要であり、標準のRGB画像よりも多用途である。
それにもかかわらず、既存の画像塗装法はRGB画像専用に設計されている。
透過的な画像の塗装への従来のアプローチは、通常、RGBA画像の下に背景を配置し、2段階のプロセスを使用する。
しかし、このパイプラインは、編集されたリージョンにおける透明性の整合性を維持するのに苦労している。
これらの課題に対処するため,トランスアダプタを提案する。トランスアダプタは,拡散型インペインティングモデルにより透過的な画像を直接処理できる。
Trans-Adapterはコントロールネットによるコントロール可能な編集もサポートしており、様々なコミュニティモデルにシームレスに統合できる。
提案手法の評価には,新しい非参照αエッジ品質評価指標とともにLayerBenchを導入し,透明性エッジ品質の評価を行う。
提案手法の有効性を実証するため,LayerBench上で広範囲に実験を行った。
関連論文リスト
- ART: Anonymous Region Transformer for Variable Multi-Layer Transparent Image Generation [108.69315278353932]
可変多層透明画像の直接生成を容易にするAnonymous Region Transformer(ART)を導入する。
正確な制御とスケーラブルなレイヤ生成を可能にすることで、ARTはインタラクティブなコンテンツ作成のための新しいパラダイムを確立します。
論文 参考訳(メタデータ) (2025-02-25T16:57:04Z) - LayerFusion: Harmonized Multi-Layer Text-to-Image Generation with Generative Priors [38.47462111828742]
階層化されたコンテンツ生成はグラフィックデザイン、アニメーション、デジタルアートといった創造的な分野に不可欠である。
本稿では,2層画像を生成する遅延拡散モデル(LDM)に基づく新しい画像生成パイプラインを提案する。
ベースライン法と比較して,視覚的コヒーレンス,画像品質,レイヤの整合性に大きな改善が見られた。
論文 参考訳(メタデータ) (2024-12-05T18:59:18Z) - Generative Image Layer Decomposition with Visual Effects [49.75021036203426]
LayerDecompは、イメージ層分解のための生成フレームワークである。
清潔な背景と、忠実に保存された視覚効果を持つ高品質な透明な前景を作り出す。
本手法は,オブジェクト除去や空間編集作業において,既存の手法よりも優れた分解特性を実現する。
論文 参考訳(メタデータ) (2024-11-26T20:26:49Z) - MVIP-NeRF: Multi-view 3D Inpainting on NeRF Scenes via Diffusion Prior [65.05773512126089]
露光RGBと深度2Dの塗布監督を基盤としたNeRF塗布法は,その基礎となる2D塗布能力によって本質的に制限されている。
我々は,NeRF塗装における拡散先行の可能性を生かし,外観面と幾何学面の両方に対処するMVIP-NeRFを提案する。
実験の結果,従来のNeRF塗装法よりも外観や形状の回復性が良好であった。
論文 参考訳(メタデータ) (2024-05-05T09:04:42Z) - Sketch-guided Image Inpainting with Partial Discrete Diffusion Process [5.005162730122933]
スケッチ誘導インペイントのための新しい部分離散拡散法(PDDP)を提案する。
PDDPは画像のマスキング領域を破損させ、手描きスケッチで条件付けられたこれらのマスキング領域を再構築する。
提案するトランスモジュールは,2つの入力を受信する。マスク領域を含む画像はインペイントされ,クエリスケッチは逆拡散過程をモデル化する。
論文 参考訳(メタデータ) (2024-04-18T07:07:38Z) - Transparent Image Layer Diffusion using Latent Transparency [30.77316047044662]
本稿では,大規模な事前学習型潜伏拡散モデルを用いて透過的な画像を生成する手法であるLayerDiffuseを提案する。
この手法は,アルファチャネル透過性を事前学習した潜伏拡散モデルの潜伏多様体に符号化する「潜伏透過性」を学習する。
これは、付加された透明性を潜在オフセットとして調節することにより、大きな拡散モデルの生産可能な品質を保っている。
論文 参考訳(メタデータ) (2024-02-27T01:19:53Z) - HI-GAN: Hierarchical Inpainting GAN with Auxiliary Inputs for Combined
RGB and Depth Inpainting [3.736916304884176]
画像中のピクセルや領域を埋め込む。
既存の方法は、複数のカメラを必要とするデジタル交換技術に頼っている。
本稿では3つのGANを階層的に構成した新しいアプローチであるHI-GAN(Hierarchical Inpainting GAN)を提案する。
論文 参考訳(メタデータ) (2024-02-15T21:43:56Z) - Diverse Inpainting and Editing with GAN Inversion [4.234367850767171]
近年の逆転法では、実画像はStyleGANの潜伏空間に逆転可能であることが示されている。
本稿では,より困難な課題に取り組み,消去された画像をGANの潜伏空間に逆転させ,リアルな塗り絵や編集を行う。
論文 参考訳(メタデータ) (2023-07-27T17:41:36Z) - MAT: Mask-Aware Transformer for Large Hole Image Inpainting [79.67039090195527]
本稿では, 変圧器と畳み込みの利点を統一する, 大穴塗装の新しいモデルを提案する。
実験では、複数のベンチマークデータセット上で、新しいモデルの最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-03-29T06:36:17Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。