論文の概要: SimSAM: Simple Siamese Representations Based Semantic Affinity Matrix for Unsupervised Image Segmentation
- arxiv url: http://arxiv.org/abs/2406.07986v1
- Date: Wed, 12 Jun 2024 08:17:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 17:45:58.662608
- Title: SimSAM: Simple Siamese Representations Based Semantic Affinity Matrix for Unsupervised Image Segmentation
- Title(参考訳): SimSAM: 教師なし画像セグメンテーションのための単純なシーム表現に基づくセマンティック親和性マトリックス
- Authors: Chanda Grover Kamra, Indra Deep Mastan, Nitin Kumar, Debayan Gupta,
- Abstract要約: 非競合型SSLアプローチ(SimSiam)に触発されて,セマンティック親和性行列を計算するための新しいフレームワークSIMSAMを導入する。
画像が与えられた後、SIMSAMは事前に訓練されたDINO-ViTを使って特徴を抽出し、その特徴を投影し、非コントラスト的な方法で密度の高い特徴の相関を予測する。
- 参考スコア(独自算出の注目度): 11.814765591082441
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent developments in self-supervised learning (SSL) have made it possible to learn data representations without the need for annotations. Inspired by the non-contrastive SSL approach (SimSiam), we introduce a novel framework SIMSAM to compute the Semantic Affinity Matrix, which is significant for unsupervised image segmentation. Given an image, SIMSAM first extracts features using pre-trained DINO-ViT, then projects the features to predict the correlations of dense features in a non-contrastive way. We show applications of the Semantic Affinity Matrix in object segmentation and semantic segmentation tasks. Our code is available at https://github.com/chandagrover/SimSAM.
- Abstract(参考訳): 近年の自己教師型学習(SSL)では,アノテーションを必要とせずにデータ表現を学習できるようになった。
非コントラストSSLアプローチ(SimSiam)に触発されて、セマンティック親和性行列を計算するための新しいフレームワークSIMSAMを導入する。
画像が与えられた後、SIMSAMは事前に訓練されたDINO-ViTを使って特徴を抽出し、その特徴を投影し、非コントラスト的な方法で密度の高い特徴の相関を予測する。
本稿では,セマンティック親和性行列のオブジェクトセグメンテーションおよびセマンティックセグメンテーションタスクへの応用について述べる。
私たちのコードはhttps://github.com/chandagrover/SimSAM.comで公開されています。
関連論文リスト
- Boosting Unsupervised Semantic Segmentation with Principal Mask Proposals [15.258631373740686]
教師なしセマンティックセグメンテーションは、画像コーパス内のグローバルカテゴリをアノテーションなしで識別することで、画像を自動的に意味のある領域に分割することを目的としている。
特徴表現に基づいてイメージを意味的に意味のあるマスクに分解するPriMaPs - principal Mask Proposalsを提案する。
これにより、予測最大化アルゴリズムであるPriMaPs-EMを用いて、クラスプロトタイプをPriMaPsに適合させることで、教師なしセマンティックセマンティックセマンティクスを実現することができる。
PriMaPs-EMは、DINOやDINOv2など、トレーニング済みのバックボーンモデルや、CityscapesやCOCOなど、データセット間の競争結果をもたらす。
論文 参考訳(メタデータ) (2024-04-25T17:58:09Z) - DeiSAM: Segment Anything with Deictic Prompting [27.960890657540443]
DeiSAMは、大きなトレーニング済みニューラルネットワークと微分可能な論理推論器の組み合わせである。
オブジェクトを論理的に推論された画像領域にマッチングすることで、オブジェクトをセグメント化する。
実験の結果,DeiSAMは純粋にデータ駆動ベースラインよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2024-02-21T20:43:49Z) - Exploring Simple Open-Vocabulary Semantic Segmentation [7.245983878396646]
オープン語彙セマンティックセグメンテーションモデルは、任意のオープン語彙テキストの集合から画像中の各ピクセルにセマンティックラベルを正確に割り当てることを目的としている。
本稿では,これらの要素に依存することなく驚くほど高い性能を実現する新モデルであるS-Segを紹介する。
論文 参考訳(メタデータ) (2024-01-22T18:59:29Z) - Semantic-SAM: Segment and Recognize Anything at Any Granularity [83.64686655044765]
本稿では,任意の粒度でセグメンテーションと認識を可能にする汎用画像セグメンテーションモデルであるSemantic-SAMを紹介する。
複数のデータセットを3つの粒度に集約し、オブジェクトとパーツの分離した分類を導入する。
マルチグラニュラリティ機能を実現するために,各クリックで複数のレベルのマスクを生成できるマルチ選択学習方式を提案する。
論文 参考訳(メタデータ) (2023-07-10T17:59:40Z) - IFSeg: Image-free Semantic Segmentation via Vision-Language Model [67.62922228676273]
目的は,対象のセマンティックなカテゴリの集合にのみ依存するセマンティックセマンティックセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなタスクを実現することである。
本研究では、ランダムな意味圏の2次元マップと、対応する単語トークンの別のマップを作成することで、この人工的なトレーニングデータを構築する。
本モデルでは,本課題の効果的なベースラインを確立するだけでなく,既存手法と比較して高い性能を示す。
論文 参考訳(メタデータ) (2023-03-25T08:19:31Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Extracting Semantic Knowledge from GANs with Unsupervised Learning [65.32631025780631]
GAN(Generative Adversarial Networks)は、特徴写像のセマンティクスを線形に分離可能な形でエンコードする。
本稿では,線形分離性を利用してGANの特徴をクラスタリングする新しいクラスタリングアルゴリズムKLiSHを提案する。
KLiSHは、さまざまなオブジェクトのデータセットに基づいてトレーニングされたGANのきめ細かいセマンティクスの抽出に成功している。
論文 参考訳(メタデータ) (2022-11-30T03:18:16Z) - Rethinking Alignment and Uniformity in Unsupervised Image Semantic
Segmentation [5.00167841640205]
教師なしのイメージセマンティックセグメンテーションは、外部の監督なしに、低レベルの視覚特徴とセマンティックレベルの表現とを一致させることを目的としている。
本稿では,UISSモデルにおける特徴アライメントと特徴均一性の観点から,重要な特性について考察する。
本稿では,セマンティック・アテンション・ネットワーク(SAN)と呼ばれるロバストなネットワークを提案し,セマンティック・アテンション(SEAT)というモジュールを動的に生成する手法を提案する。
論文 参考訳(メタデータ) (2022-11-26T08:43:12Z) - Semantic-Aware Generation for Self-Supervised Visual Representation
Learning [116.5814634936371]
セマンティック・アウェア・ジェネレーション(SaGe)は、生成した画像に保存される詳細よりも、よりリッチなセマンティクスを促進する。
SaGeは、ターゲットネットワークをビュー特有の特徴で補完することで、集中的なデータ拡張によって引き起こされるセマンティックな劣化を軽減する。
我々は、ImageNet-1K上でSaGeを実行し、近接検定、線形分類、微視的画像認識を含む5つの下流タスクで事前訓練されたモデルを評価する。
論文 参考訳(メタデータ) (2021-11-25T16:46:13Z) - Predicting What You Already Know Helps: Provable Self-Supervised
Learning [60.27658820909876]
自己教師付き表現学習は、ラベル付きデータを必要としない補助的な予測タスク(プリテキストタスクと呼ばれる)を解決する。
本研究では,特定のエミュレーションに基づくプレテキストタスク間の統計的関係を利用して,優れた表現を学習することを保証する機構を示す。
複素基底真理関数クラスにおいても線形層は近似誤差が小さいことを証明した。
論文 参考訳(メタデータ) (2020-08-03T17:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。