論文の概要: Contour-guided Image Completion with Perceptual Grouping
- arxiv url: http://arxiv.org/abs/2111.11322v1
- Date: Mon, 22 Nov 2021 16:26:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 19:37:42.282304
- Title: Contour-guided Image Completion with Perceptual Grouping
- Title(参考訳): 知覚的グループ化による輪郭誘導画像補完
- Authors: Morteza Rezanejad, Sidharth Gupta, Chandra Gummaluru, Ryan Marten,
John Wilder, Michael Gruninger, Dirk B. Walther
- Abstract要約: 本稿では,コンプリーション・フィールド(SCF)アルゴリズムの近代化モデルを実装した。
SCFアルゴリズムが人間の知覚にどのように影響するかを示す。
我々は,SCF完成輪郭を塗装用ガイドとして使用し,そのガイドが最先端モデルの性能を向上させることを示す。
- 参考スコア(独自算出の注目度): 7.588025965572449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans are excellent at perceiving illusory outlines. We are readily able to
complete contours, shapes, scenes, and even unseen objects when provided with
images that contain broken fragments of a connected appearance. In vision
science, this ability is largely explained by perceptual grouping: a
foundational set of processes in human vision that describes how separated
elements can be grouped. In this paper, we revisit an algorithm called
Stochastic Completion Fields (SCFs) that mechanizes a set of such processes --
good continuity, closure, and proximity -- through contour completion. This
paper implements a modernized model of the SCF algorithm, and uses it in an
image editing framework where we propose novel methods to complete fragmented
contours. We show how the SCF algorithm plausibly mimics results in human
perception. We use the SCF completed contours as guides for inpainting, and
show that our guides improve the performance of state-of-the-art models.
Additionally, we show that the SCF aids in finding edges in high-noise
environments. Overall, our described algorithms resemble an important mechanism
in the human visual system, and offer a novel framework that modern computer
vision models can benefit from.
- Abstract(参考訳): 人間は幻想的な輪郭を知覚するのに優れている。
接続された外観の破片を含む画像が提供されると、輪郭、形、シーン、さらには見えないオブジェクトも簡単に完成できます。
視覚科学において、この能力は知覚的グループ化 (perceptual grouping) によって主に説明される。
本稿では,連続性,閉鎖性,近接性といった一連の処理を輪郭補完を通じて機械化するSCF(Stochastic Completion Fields)と呼ばれるアルゴリズムを再検討する。
本稿では,SCFアルゴリズムの近代化モデルを実装し,これを画像編集フレームワークとして利用し,断片化された輪郭を補完する新しい手法を提案する。
scfアルゴリズムが人間の知覚にどのように影響するかを示す。
我々は,SCF完成輪郭を塗装用ガイドとして使用し,そのガイドが最先端モデルの性能を向上させることを示す。
さらに,SCFは高雑音環境におけるエッジの発見に有効であることを示す。
概して、我々の記述したアルゴリズムは、人間の視覚システムにおいて重要なメカニズムに似ており、現代のコンピュータビジョンモデルが恩恵を受ける新しいフレームワークを提供する。
関連論文リスト
- Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Deep Medial Voxels: Learned Medial Axis Approximations for Anatomical Shape Modeling [5.584193645582203]
画像量からトポロジカルな骨格を忠実に近似する半単純表現であるディープ・メディアル・ボクセルを導入する。
再現技術は,可視化と計算機シミュレーションの両方の可能性を示している。
論文 参考訳(メタデータ) (2024-03-18T13:47:18Z) - Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis [65.7968515029306]
PGPIS(Pose-Guided Person Image Synthesis)のためのCFLD(Coarse-to-Fine Latent Diffusion)法を提案する。
認識修正デコーダは、学習可能なクエリの集合を段階的に洗練し、粗いプロンプトとして人物画像の意味的理解を抽出するように設計されている。
論文 参考訳(メタデータ) (2024-02-28T06:07:07Z) - UpFusion: Novel View Diffusion from Unposed Sparse View Observations [66.36092764694502]
UpFusionは、参照画像のスパースセットが与えられたオブジェクトに対して、新しいビュー合成と3D表現を推論することができる。
本研究では,この機構により,付加された(未提示)画像の合成品質を向上しつつ,高忠実度な新規ビューを生成することができることを示す。
論文 参考訳(メタデータ) (2023-12-11T18:59:55Z) - Neural Congealing: Aligning Images to a Joint Semantic Atlas [14.348512536556413]
画像の集合を横断的に意味的に共通するコンテンツを調整するための,ゼロショットの自己教師型フレームワークを提案する。
提案手法は,DINO-ViTの事前学習能力を利用して学習する。
提案手法は,大規模データセットに対する広範囲なトレーニングを必要とする最先端の手法と比較して,好適に動作することを示す。
論文 参考訳(メタデータ) (2023-02-08T09:26:22Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - Cycle-Consistent Counterfactuals by Latent Transformations [5.254093731341154]
C3LT (Cycle-Consistent Counterfactuals by Latent Transformations) は、生成モデルの潜在空間内でのステアリングによって視覚を自動生成する潜時変換を学習する。
C3LTは、どんな最先端の事前訓練された生成ネットワークにも容易に接続できる。
CFの説明を評価するためのいくつかの確立されたメトリクスに加えて、生成されたCFの例の品質を評価するために調整された新しいメトリクスを導入する。
論文 参考訳(メタデータ) (2022-03-28T20:10:09Z) - ViCE: Self-Supervised Visual Concept Embeddings as Contextual and Pixel
Appearance Invariant Semantic Representations [77.3590853897664]
本研究は,NLPにおける単語埋め込みの学習方法に着想を得た画像に対して,意味論的にリッチな視覚埋め込みを学習するための自己指導的手法を提案する。
論文 参考訳(メタデータ) (2021-11-24T12:27:30Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。