Fugu-MT 論文翻訳(概要): TextureDiffusion: Target Prompt Disentangled Editing for Various Texture Transfer

論文の概要: TextureDiffusion: Target Prompt Disentangled Editing for Various Texture Transfer

arxiv url: http://arxiv.org/abs/2409.09610v2
Date: Tue, 14 Jan 2025 09:44:01 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-15 17:02:04.182633
Title: TextureDiffusion: Target Prompt Disentangled Editing for Various Texture Transfer
Title（参考訳）: テクスチャ拡散:様々なテクスチャ転送のためのアンタングル編集用ターゲットプロンプト
Authors: Zihan Su, Junhao Zhuang, Chun Yuan,
Abstract要約: 各種テクスチャ転送に適用可能なチューニング不要な画像編集手法であるTextureDiffusionを提案する。テクスチャ拡散は様々なテクスチャを高い構造と背景保存で調和的に伝達できることを示す。
参考スコア（独自算出の注目度）: 32.53299128227546
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, text-guided image editing has achieved significant success. However, existing methods can only apply simple textures like wood or gold when changing the texture of an object. Complex textures such as cloud or fire pose a challenge. This limitation stems from that the target prompt needs to contain both the input image content and <texture>, restricting the texture representation. In this paper, we propose TextureDiffusion, a tuning-free image editing method applied to various texture transfer. Initially, the target prompt is directly set to "<texture>", making the texture disentangled from the input image content to enhance texture representation. Subsequently, query features in self-attention and features in residual blocks are utilized to preserve the structure of the input image. Finally, to maintain the background, we introduce an edit localization technique which blends the self-attention results and the intermediate latents. Comprehensive experiments demonstrate that TextureDiffusion can harmoniously transfer various textures with excellent structure and background preservation. Code is publicly available at https://github.com/THU-CVML/TextureDiffusion
Abstract（参考訳）: 近年,テキスト誘導画像編集は大きな成功を収めている。しかし、既存の手法では、物体のテクスチャを変える際には、木や金のような単純なテクスチャしか適用できない。雲や火のような複雑なテクスチャが課題となる。この制限は、ターゲットプロンプトが入力された画像内容と<texture>の両方を含む必要があり、テクスチャ表現が制限されることに由来する。本稿では,様々なテクスチャ転送に適用可能なチューニング不要な画像編集手法であるTextureDiffusionを提案する。当初、ターゲットプロンプトは「<texture>」に直接設定され、入力された画像内容からテクスチャが切り離されてテクスチャ表現が強化される。その後、自己アテンションにおけるクエリ特徴と残留ブロックにおける特徴を利用して、入力画像の構造を保存する。最後に、その背景を維持するために、自己注意結果と中間潜伏者をブレンドする編集ローカライズ手法を導入する。総合的な実験により、テクスチャ拡散は様々なテクスチャを、優れた構造と背景保存で調和的に伝達できることが示されている。コードはhttps://github.com/THU-CVML/TextureDiffusionで公開されている。

関連論文リスト

TexTailor: Customized Text-aligned Texturing via Effective Resampling [14.861723817863806]
テキスト記述から一貫したテクスチャを生成する新しい方法であるTexTailorを提案する。既存のテキスト・テクスチャ合成アプローチでは、深度認識拡散モデルを用いて画像を生成し、複数の視点でテクスチャを合成する。我々は、オブジェクトの形状に基づいてカメラの位置を適応的に調整することで、ビュー一貫性テクスチャの合成を改善する。
論文参考訳（メタデータ） (2025-06-12T11:55:44Z)
DragText: Rethinking Text Embedding in Point-based Image Editing [3.1923251959845214]
拡散モデルにおける入力画像のプログレッシブな編集において,テキスト埋め込みは一定であることを示す。そこで我々はDragTextを提案する。DragTextはドラッグ処理と同時にテキスト埋め込みを最適化し、修正された画像埋め込みと組み合わせる。
論文参考訳（メタデータ） (2024-07-25T07:57:55Z)
Infinite Texture: Text-guided High Resolution Diffusion Texture Synthesis [61.189479577198846]
Infinite Textureはテキストプロンプトから任意の大きさのテクスチャ画像を生成する方法である。本手法は,1つのテクスチャ上に拡散モデルを微調整し,その分布をモデルの出力領域に埋め込むことを学習する。 1つのGPU上で任意の解像度の出力テクスチャ画像を生成するためのスコアアグリゲーションストラテジーによって、我々の微調整拡散モデルが生成される。
論文参考訳（メタデータ） (2024-05-13T21:53:09Z)
TexSliders: Diffusion-Based Texture Editing in CLIP Space [17.449209402077276]
既存の編集手法を分析し,テクスチャに直接適用できないことを示す。拡散生成を条件にCLIP画像埋め込みを操作する新しい手法を提案する。
論文参考訳（メタデータ） (2024-05-01T17:57:21Z)
Compositional Neural Textures [25.885557234297835]
この研究は、合成ニューラルモデルを用いてテクスチャを表現するための、完全に教師なしのアプローチを導入する。我々は,各テキストを,空間的支持がその形状を近似する2次元ガウス関数と,その詳細な外観を符号化する関連する特徴として表現する。このアプローチは、画像テクスチャから他のイメージへの外観の移動、テクスチャの多様化、テクスチャのバリエーションの明示/修正、編集の伝播、テクスチャアニメーション、ダイレクトテキスト操作など、幅広いアプリケーションを可能にする。
論文参考訳（メタデータ） (2024-04-18T21:09:34Z)
FlashTex: Fast Relightable Mesh Texturing with LightControlNet [105.4683880648901]
ControlNetアーキテクチャに基づいた新しいテキスト・ツー・イメージモデルであるLightControlNetを紹介した。本手法は, メッシュを任意の照明環境下で適切に切断し, レンダリングできるように, 結果として生じるテクスチャの材質/反射率を下げるためのものである。
論文参考訳（メタデータ） (2024-02-20T18:59:00Z)
TextureDreamer: Image-guided Texture Synthesis through Geometry-aware Diffusion [64.49276500129092]
TextureDreamerは画像誘導型テクスチャ合成法である。少数の入力画像から任意のカテゴリでターゲットの3D形状に光沢のあるテクスチャを転送することができる。
論文参考訳（メタデータ） (2024-01-17T18:55:49Z)
Text2Scene: Text-driven Indoor Scene Stylization with Part-aware Details [12.660352353074012]
複数のオブジェクトからなる仮想シーンの現実的なテクスチャを自動生成するText2Sceneを提案する。我々のパイプラインは、室内のラベル付き3Dジオメトリに詳細なテクスチャを追加し、生成した色が、しばしば類似の材料から構成される階層構造や意味的な部分を尊重するようにします。
論文参考訳（メタデータ） (2023-08-31T17:37:23Z)
TEXTure: Text-Guided Texturing of 3D Shapes [71.13116133846084]
TEXTureは,テクスチャのテクスチャのテクスチャの編集,編集,転送を行う新しい方法である。表面テクスチャを明示することなくシームレスな3次元テクスチャを生成する3次元マップ分割プロセスを定義する。
論文参考訳（メタデータ） (2023-02-03T13:18:45Z)
Imagen Editor and EditBench: Advancing and Evaluating Text-Guided Image Inpainting [53.708523312636096]
本稿では,テキスト誘導画像のインペイントを微調整し,カスケード拡散モデルであるImagen Editorを提案する。編集はテキストプロンプトに忠実で、オブジェクト検出器を使用してトレーニング中に塗装マスクを提案する。質的,定量的な評価を改善するために,テキスト誘導画像の塗り絵の体系的ベンチマークであるEditBenchを導入する。
論文参考訳（メタデータ） (2022-12-13T21:25:11Z)
Exploring Stroke-Level Modifications for Scene Text Editing [86.33216648792964]
シーンテキスト編集(STE)は、元のテキストの背景とスタイルを保存しながら、テキストを所望のテキストに置き換えることを目的としている。画像全体を編集するには、背景領域とテキスト領域の異なる翻訳規則を同時に学習する必要がある。 Scene Text Image at strokE Level (MOSTEL) を用いた新しいネットワークを提案する。
論文参考訳（メタデータ） (2022-12-05T02:10:59Z)
DiffEdit: Diffusion-based semantic image editing with mask guidance [64.555930158319]
DiffEditは、セマンティック画像編集のタスクにテキスト条件付き拡散モデルを利用する方法である。私たちの主なコントリビューションは、編集が必要な入力画像の領域をハイライトするマスクを自動的に生成できることです。
論文参考訳（メタデータ） (2022-10-20T17:16:37Z)
Text2LIVE: Text-Driven Layered Image and Video Editing [13.134513605107808]
自然画像やビデオにおけるゼロショット・テキスト駆動の外観操作法を提案する。入力画像またはビデオとターゲットテキストプロンプトが与えられた場合、我々の目標は既存のオブジェクトの外観を編集することである。さまざまなオブジェクトやシーンにまたがる高解像度の自然画像やビデオに対して,局所的でセマンティックな編集を実演する。
論文参考訳（メタデータ） (2022-04-05T21:17:34Z)
Image Inpainting Guided by Coherence Priors of Semantics and Textures [62.92586889409379]
セマンティクスとテクスチャ間のコヒーレンスプリエンスを導入することにより、セマンティクス的な方法で別々のテクスチャを完成させることに集中できる。また,全体構造と詳細なテクスチャの観点から,セマンティクスとインペインテッドイメージの一貫性を制約する2つのコヒーレンス損失を提案する。
論文参考訳（メタデータ） (2020-12-15T02:59:37Z)
Texture Transform Attention for Realistic Image Inpainting [6.275013056564918]
本研究では,細心の注意を払って絵を描いていない領域をより良く生成するテクスチャトランスフォーメーション・アテンション・ネットワークを提案する。 Texture Transform Attentionは、細かいテクスチャと粗いセマンティクスを使用して、新しい再組み立てテクスチャマップを作成するために使用されます。我々は,公開データセット celeba-hq と places2 を用いて,エンドツーエンドでモデルを評価する。
論文参考訳（メタデータ） (2020-12-08T06:28:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。