論文の概要: PatchNet: Unsupervised Object Discovery based on Patch Embedding
- arxiv url: http://arxiv.org/abs/2106.08599v1
- Date: Wed, 16 Jun 2021 07:56:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-17 17:43:50.910887
- Title: PatchNet: Unsupervised Object Discovery based on Patch Embedding
- Title(参考訳): PatchNet: パッチ埋め込みに基づく教師なしオブジェクトディスカバリ
- Authors: Hankyu Moon, Heng Hao, Sima Didari, Jae Oh Woo, Patrick Bangert
- Abstract要約: 少数の画像からランダムにサンプリングされたパッチを自己スーパービジョンでトレーニングすることで、頻繁に現れる物体が発見できることを実証する。
このアプローチの鍵となるのは、与えられた画像データのすべてのサブイメージを表すパターンの潜在空間であるパターン空間である。
この方法は驚くほど効果的であることが証明され、自然画像から複数の人間の顔や身体を見つけるのに成功している。
- 参考スコア(独自算出の注目度): 0.8399688944263842
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We demonstrate that frequently appearing objects can be discovered by
training randomly sampled patches from a small number of images (100 to 200) by
self-supervision. Key to this approach is the pattern space, a latent space of
patterns that represents all possible sub-images of the given image data. The
distance structure in the pattern space captures the co-occurrence of patterns
due to the frequent objects. The pattern space embedding is learned by
minimizing the contrastive loss between randomly generated adjacent patches. To
prevent the embedding from learning the background, we modulate the contrastive
loss by color-based object saliency and background dissimilarity. The learned
distance structure serves as object memory, and the frequent objects are simply
discovered by clustering the pattern vectors from the random patches sampled
for inference. Our image representation based on image patches naturally
handles the position and scale invariance property that is crucial to
multi-object discovery. The method has been proven surprisingly effective, and
successfully applied to finding multiple human faces and bodies from natural
images.
- Abstract(参考訳): 少数の画像(100から200)からランダムにサンプリングされたパッチを自己監督でトレーニングすることで、頻繁に現れる物体が発見できることを実証する。
このアプローチの鍵は、与えられた画像データのすべての可能なサブイメージを表すパターンの潜在空間であるパターン空間である。
パターン空間における距離構造は、頻繁なオブジェクトによるパターンの共起を捉える。
ランダムに生成された隣接パッチ間のコントラスト損失を最小化することにより、パターン空間埋め込みを学習する。
組込みが背景を学習するのを防ぐため,色に基づく物体の鮮度と背景の相違によるコントラスト損失を変調する。
学習された距離構造はオブジェクトメモリとして機能し、頻繁なオブジェクトは推論のためにサンプリングされたランダムなパッチからパターンベクトルをクラスタリングすることで簡単に見つかる。
画像パッチに基づく画像表現は,マルチオブジェクト発見に不可欠な位置とスケール不変性を自然に処理する。
この方法は驚くほど効果的であることが証明され、自然画像から複数の人間の顔や身体を見つけるのに成功している。
関連論文リスト
- Improving Object Detection via Local-global Contrastive Learning [27.660633883387753]
本稿では,クロスドメインオブジェクト検出を対象とする画像から画像への変換手法を提案する。
ローカル・グローバル情報と対比することでオブジェクトを表現することを学ぶ。
これにより、ドメインシフトの下で、パフォーマンス検出(Performant detection)の取得という、未調査の課題の調査が可能になる。
論文 参考訳(メタデータ) (2024-10-07T14:18:32Z) - The Crystal Ball Hypothesis in diffusion models: Anticipating object positions from initial noise [92.53724347718173]
拡散モデルはテキスト・画像生成タスクにおいて顕著な成功を収めた。
我々は、初期ノイズ画像内の特定の領域をトリガーパッチと呼び、結果として発生する画像のオブジェクト生成に重要な役割を果たす。
論文 参考訳(メタデータ) (2024-06-04T05:06:00Z) - DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Variable Radiance Field for Real-Life Category-Specifc Reconstruction
from Single Image [27.290232027686237]
本稿では,カメラパラメータが未知の単一画像からカテゴリ固有のオブジェクトを再構成できる新しいフレームワークを提案する。
マルチスケールグローバル特徴抽出器を用いてオブジェクトの形状と外観をパラメータ化する。
また,特徴抽出器の改良のために,コントラスト学習に基づく事前学習戦略を提案する。
論文 参考訳(メタデータ) (2023-06-08T12:12:02Z) - Feasibility of Inconspicuous GAN-generated Adversarial Patches against
Object Detection [3.395452700023097]
本研究では,不明瞭なパッチを生成する既存のアプローチを評価した。
我々は、GANトレーニングプロセスにパッチ生成を組み込むことと、事前訓練したGANを使用することで、自然主義的パッチを生成する2つのアプローチを評価した。
実験の結果,事前学習したGANは,従来の対向パッチと同様の性能を維持しつつ,現実的なパッチの獲得に役立つことがわかった。
論文 参考訳(メタデータ) (2022-07-15T08:48:40Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Manifold-Inspired Single Image Interpolation [17.304301226838614]
単画像への多くのアプローチは半局所類似性を利用するために多様体モデルを使用する。
入力画像のエイリアス化は どちらの部分も困難です
本稿では,重度のエイリアス領域におけるエイリアス除去のための適応手法を提案する。
この技術は、強いエイリアスが存在する場合でも、類似したパッチを確実に識別することができる。
論文 参考訳(メタデータ) (2021-07-31T04:29:05Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。