Fugu-MT 論文翻訳(概要): Inpaint Anything: Segment Anything Meets Image Inpainting

論文の概要: Inpaint Anything: Segment Anything Meets Image Inpainting

arxiv url: http://arxiv.org/abs/2304.06790v1
Date: Thu, 13 Apr 2023 19:23:52 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-17 15:29:41.024148
Title: Inpaint Anything: Segment Anything Meets Image Inpainting
Title（参考訳）: Inpaint Anything:Segment Anythingが画像のインペイントに挑戦
Authors: Tao Yu, Runseng Feng, Ruoyu Feng, Jinming Liu, Xin Jin, Wenjun Zeng, Zhibo Chen
Abstract要約: Inpaint Anything (IA) と名づけられたマスクフリー画像のインペイントを初めて試み、クリックとフィリングの新しいパラダイムを提案する。 i) Remove Anything: ユーザーはオブジェクトをクリックし、IAがコンテキストで'穴を滑らかに'する。 (ii) Fill Anything: あるオブジェクトを削除した後、ユーザはIAにテキストベースのプロンプトを提供することができ、その後、Stable DiffusionのようなAIGCモデルを駆動することで、対応する生成コンテンツで穴を埋める。
参考スコア（独自算出の注目度）: 65.23202630256793
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modern image inpainting systems, despite the significant progress, often struggle with mask selection and holes filling. Based on Segment-Anything Model (SAM), we make the first attempt to the mask-free image inpainting and propose a new paradigm of ``clicking and filling'', which is named as Inpaint Anything (IA). The core idea behind IA is to combine the strengths of different models in order to build a very powerful and user-friendly pipeline for solving inpainting-related problems. IA supports three main features: (i) Remove Anything: users could click on an object and IA will remove it and smooth the ``hole'' with the context; (ii) Fill Anything: after certain objects removal, users could provide text-based prompts to IA, and then it will fill the hole with the corresponding generative content via driving AIGC models like Stable Diffusion; (iii) Replace Anything: with IA, users have another option to retain the click-selected object and replace the remaining background with the newly generated scenes. We are also very willing to help everyone share and promote new projects based on our Inpaint Anything (IA). Our codes are available at https://github.com/geekyutao/Inpaint-Anything.
Abstract（参考訳）: 現代の画像塗装システムは、大きな進歩にもかかわらず、しばしばマスクの選択と穴埋めに苦しむ。 SAM(Segment-Anything Model)に基づいて,マスクレス画像のインペイントを初めて試み,「クリック&フィリング」という新しいパラダイムを提案し,これをInpaint Anything(IA)と呼ぶ。 iaの中核となるアイデアは、異なるモデルの強みを組み合わせることで、インペインティング関連の問題を解決するための非常に強力でユーザフレンドリーなパイプラインを構築することです。 IAは3つの主要な特徴をサポートしている。 i) 削除: ユーザはオブジェクトをクリックすることができ、IAはそれを削除し、コンテキストで ``hole'' を滑らかにする。 (ii)対象物を取り除いた後、ユーザはIAにテキストベースのプロンプトを提供し、安定拡散のようなAIGCモデルを駆動することで、対応する生成コンテンツで穴を埋めることができる。 (iii) iaでは、クリック選択されたオブジェクトを保持し、残りの背景を新たに生成されたシーンに置き換えるオプションがある。また、私たちのInpaint Anything(IA)に基づいて、誰もが新しいプロジェクトを共有し、推進するのを積極的に支援しています。私たちのコードはhttps://github.com/geekyutao/inpaint-anything.comで利用可能です。

関連論文リスト

I Dream My Painting: Connecting MLLMs and Diffusion Models via Prompt Generation for Text-Guided Multi-Mask Inpainting [8.94249680213101]
塗装は、画像の欠落した領域や破損した領域を埋めて、周囲のコンテンツやスタイルとシームレスにブレンドすることに焦点を当てている。本稿では,異なるプロンプトを用いて複数の領域を同時に塗布するマルチマスク塗装の新たな課題を紹介する。私たちのパイプラインは、創造的で正確なインペイント結果を提供します。
論文参考訳（メタデータ） (2024-11-28T10:55:09Z)
Improving Text-guided Object Inpainting with Semantic Pre-inpainting [95.17396565347936]
我々は,典型的な単一ステージオブジェクトを2つのカスケードプロセス – セマンティックプリペイントと高磁場オブジェクト生成 – に分解する。これを実現するために,トランスフォーマーをベースとしたセマンティックインパインとオブジェクトインパインティング拡散モデルをカスケードし,新しいCAscaded Transformer-Diffusionフレームワークを実現する。
論文参考訳（メタデータ） (2024-09-12T17:55:37Z)
MVInpainter: Learning Multi-View Consistent Inpainting to Bridge 2D and 3D Editing [90.30646271720919]
新規ビュー合成(NVS)と3D生成は、最近顕著に改善されている。我々はMVInpainterを提案し、3D編集を多視点2Dインペインティングタスクとして再フォーマットする。 MVInpainterは、スクラッチから完全に新しいビューを生成するのではなく、参照ガイダンスで複数のビューイメージを部分的に描き込む。
論文参考訳（メタデータ） (2024-08-15T07:57:28Z)
Diffree: Text-Guided Shape Free Object Inpainting with Diffusion Model [81.96954332787655]
テキスト制御のみによるテキスト誘導オブジェクトの追加を容易にするテキスト・ツー・イメージ(T2I)モデルであるDiffreeを紹介する。実験では、Diffreeはバックグラウンドの一貫性、空間、オブジェクトの関連性、品質を維持しながら、高い成功率を持つ新しいオブジェクトを追加します。
論文参考訳（メタデータ） (2024-07-24T03:58:58Z)
Paint by Inpaint: Learning to Add Image Objects by Removing Them First [8.399234415641319]
我々は、画像にオブジェクトを効果的に付加して、塗布過程を逆転させる拡散モデルを訓練する。その結果,トレーニングされたモデルは,オブジェクトの追加タスクと一般的な編集タスクの両方において,既存のモデルを上回っていることがわかった。
論文参考訳（メタデータ） (2024-04-28T15:07:53Z)
Towards Enhanced Image Inpainting: Mitigating Unwanted Object Insertion and Preserving Color Consistency [78.0488707697235]
ASUKA(Aigned Stable Inpainting with UnKnown Areas)と呼ばれるポストプロセッシングアプローチは、インパインティングモデルを改善する。 Masked Auto-Encoder (MAE) は、オブジェクト幻覚を緩和する。ローカルタスクとしてラテント・ツー・イメージ・デコーディングを扱う特殊なVAEデコーダ。
論文参考訳（メタデータ） (2023-12-08T05:08:06Z)
A Task is Worth One Word: Learning with Task Prompts for High-Quality Versatile Image Inpainting [38.53807472111521]
我々は,複数の塗装タスクに優れる最初の高品質で多用途な塗装モデルであるPowerPaintを紹介する。本稿では,PowerPaintにおけるタスクプロンプトの汎用性について,オブジェクト削除の負のプロンプトとしての有効性を示す。我々は, 形状誘導型物体の塗布を制御可能とし, 形状誘導型アプリケーションにおけるモデルの適用性を高めるために, プロンプト技術を活用している。
論文参考訳（メタデータ） (2023-12-06T16:34:46Z)
Inst-Inpaint: Instructing to Remove Objects with Diffusion Models [18.30057229657246]
本研究では,自然言語入力に基づいて除去対象を推定し,同時に除去する画像インペイントアルゴリズムに興味を持つ。本稿では,テキストプロンプトとして与えられた命令に基づいて画像からオブジェクトを除去する新しいインペイントフレームワークInst-Inpaintを提案する。
論文参考訳（メタデータ） (2023-04-06T17:29:50Z)
Contextual Attention Mechanism, SRGAN Based Inpainting System for Eliminating Interruptions from Images [2.894944733573589]
完全な機械学習アプローチを用いて,画像のインペイントのためのエンドツーエンドパイプラインを提案する。まず、YOLOモデルを使用して、画像から削除したいオブジェクトを自動的に識別し、ローカライズします。その後、領域を埋めるためにコンテキストアテンション法を用いたGANモデルにマスク画像とオリジナル画像を提供する。
論文参考訳（メタデータ） (2022-04-06T05:51:04Z)
RePaint: Inpainting using Denoising Diffusion Probabilistic Models [161.74792336127345]
Free-form Inpaintingは任意のバイナリマスクで指定された領域のイメージに新しいコンテンツを追加するタスクである。 RePaint: A Denoising Probabilistic Model (DDPM) を用いた塗装手法を提案する。本手法は,標準的なマスクと極端マスクを用いて,顔と汎用画像の塗装の両面で検証する。
論文参考訳（メタデータ） (2022-01-24T18:40:15Z)
In&Out : Diverse Image Outpainting via GAN Inversion [89.84841983778672]
image outpaintingは、利用可能なコンテンツを超えて、入力画像の意味的に一貫した拡張を求める。本研究では、生成的対向ネットワークの反転の観点から問題を定式化する。私達の発電機はイメージの彼らの共同潜入コードそして個々の位置で調節されるマイクロパッチをレンダリングします。
論文参考訳（メタデータ） (2021-04-01T17:59:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。