論文の概要: CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive
Self-Supervised Transformers
- arxiv url: http://arxiv.org/abs/2403.07700v1
- Date: Tue, 12 Mar 2024 14:46:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 21:14:36.706625
- Title: CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive
Self-Supervised Transformers
- Title(参考訳): CuVLER: 自励式変圧器による教師なし物体の発見
- Authors: Shahaf Arica, Or Rubin, Sapir Gershov, Shlomi Laufer
- Abstract要約: 本稿では、教師なしオブジェクト発見のための革新的な方法であるVoteCutを紹介する。
また、VoteCutによって生成された擬似ラベルを用いて訓練されたゼロショットモデルCuVLERを提案する。
- 参考スコア(独自算出の注目度): 1.024113475677323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce VoteCut, an innovative method for unsupervised
object discovery that leverages feature representations from multiple
self-supervised models. VoteCut employs normalized-cut based graph
partitioning, clustering and a pixel voting approach. Additionally, We present
CuVLER (Cut-Vote-and-LEaRn), a zero-shot model, trained using pseudo-labels,
generated by VoteCut, and a novel soft target loss to refine segmentation
accuracy. Through rigorous evaluations across multiple datasets and several
unsupervised setups, our methods demonstrate significant improvements in
comparison to previous state-of-the-art models. Our ablation studies further
highlight the contributions of each component, revealing the robustness and
efficacy of our approach. Collectively, VoteCut and CuVLER pave the way for
future advancements in image segmentation.
- Abstract(参考訳): 本稿では,複数の自己教師対象モデルの特徴表現を活用する,非教師対象発見のための革新的な方法であるVoteCutを紹介する。
VoteCutは正規化されたカットベースのグラフパーティショニング、クラスタリング、ピクセル投票アプローチを採用している。
さらに,VoteCut が生成した擬似ラベルを用いたゼロショットモデル CuVLER (Cut-Vote-and-LeaRn) と,セグメンテーション精度を向上させるための新たなソフトターゲット損失を提案する。
複数のデータセットにまたがる厳密な評価といくつかの教師なしのセットアップにより,本手法は従来の最先端モデルと比較して大幅に改善された。
我々のアブレーション研究は、各コンポーネントの貢献をさらに強調し、我々のアプローチの堅牢性と有効性を明らかにする。
集合的に、VoteCutとCuVLERは、画像セグメンテーションの今後の進歩の道を開く。
関連論文リスト
- DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - Self2Seg: Single-Image Self-Supervised Joint Segmentation and Denoising [5.980200432310941]
Self2Segは、単一画像の分割とデノナイズのための自己教師型手法である。
データ駆動の手法とは対照的に、Self2Segはトレーニングデータベースを使わずに、イメージを意味のある領域にセグメントする。
論文 参考訳(メタデータ) (2023-09-19T10:47:32Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Unsupervised Human Action Recognition with Skeletal Graph Laplacian and
Self-Supervised Viewpoints Invariance [20.748083855677816]
本稿では,グラフラプラシア正規化を用いた畳み込みオートエンコーダを用いた新しいアーキテクチャを提案する。
我々のアプローチは、カメラビュー間の一般化を保証する自己教師付き勾配逆層を含むことにより、視点の変化に対して堅牢である。
論文 参考訳(メタデータ) (2022-04-21T17:47:42Z) - Self-Supervised Transformers for Unsupervised Object Discovery using
Normalized Cut [0.0]
画像から物体を発見するために自己教師付きトランスフォーマー機能を利用するグラフベースのアプローチを実証する。
ビジュアルトークンは、トークンの類似性に基づいて接続スコアを表すエッジを持つ重み付きグラフのノードと見なされる。
弱教師付きオブジェクト検出では,CUBとImageNetの競合性能を実現する。
論文 参考訳(メタデータ) (2022-02-23T14:27:36Z) - Dense Unsupervised Learning for Video Segmentation [49.46930315961636]
ビデオオブジェクトセグメンテーション(VOS)のための教師なし学習のための新しいアプローチを提案する。
これまでの研究とは異なり、我々の定式化によって、完全に畳み込みの仕組みで、密集した特徴表現を直接学習することができる。
我々の手法は、トレーニングデータや計算能力が大幅に少ないにもかかわらず、以前の作業のセグメンテーション精度を超える。
論文 参考訳(メタデータ) (2021-11-11T15:15:11Z) - Unsupervised Representation Learning for 3D Point Cloud Data [66.92077180228634]
我々は、教師なしのポイントクラウド学習に対して、シンプルで効果的なアプローチを提案する。
特に、原点雲の優れたコントラストバージョンを生成する非常に有用な変換を同定する。
本研究では,3次元オブジェクト分類,形状部分分割,シーン分割の3つの下流タスクについて実験を行った。
論文 参考訳(メタデータ) (2021-10-13T10:52:45Z) - Clustering by Maximizing Mutual Information Across Views [62.21716612888669]
本稿では,共同表現学習とクラスタリングを組み合わせた画像クラスタリングのための新しいフレームワークを提案する。
提案手法は,様々な画像データセットにおける最先端の単一ステージクラスタリング手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-24T15:36:49Z) - Self-supervised Video Object Segmentation [76.83567326586162]
本研究の目的は、半教師付きビデオオブジェクトセグメンテーション(高密度トラッキング)の解決を目的とした自己教師付き表現学習である。
i) 従来の自己教師型アプローチを改善すること、(ii) オンライン適応モジュールによる自己教師型アプローチの強化により、空間的時間的不連続性によるトラッカーのドリフトを緩和すること、(iv) DAVIS-2017とYouTubeの自己教師型アプローチで最先端の結果を示すこと、などが提案されている。
論文 参考訳(メタデータ) (2020-06-22T17:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。