Fugu-MT 論文翻訳(概要): Uncovering the Inner Workings of STEGO for Safe Unsupervised Semantic Segmentation

論文の概要: Uncovering the Inner Workings of STEGO for Safe Unsupervised Semantic Segmentation

arxiv url: http://arxiv.org/abs/2304.07314v1
Date: Fri, 14 Apr 2023 15:30:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-18 19:40:34.535268
Title: Uncovering the Inner Workings of STEGO for Safe Unsupervised Semantic Segmentation
Title（参考訳）: 安全無監督セマンティックセグメンテーションのためのSTEGOの内部動作の解明
Authors: Alexander Koenig, Maximilian Schambach, Johannes Otterbach
Abstract要約: 近年,コンピュータビジョンにおける汎用的特徴抽出バックボーンのトレーニングにおいて,自己指導型事前学習戦略が顕著な成果を上げている。 DINOの自己蒸留技術は、暗黙のラベルを使わずに、潜在空間における教師なしクラスタリングや生成した特徴の意味的対応など、興味深い特徴を持っている。教師なしセマンティックセグメンテーションコントラストのSTEGO法は、DINO-pre-trained Vision Transformerの特徴対応を蒸留し、最近その新しい状態を設定した。
参考スコア（独自算出の注目度）: 68.8204255655161
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Self-supervised pre-training strategies have recently shown impressive results for training general-purpose feature extraction backbones in computer vision. In combination with the Vision Transformer architecture, the DINO self-distillation technique has interesting emerging properties, such as unsupervised clustering in the latent space and semantic correspondences of the produced features without using explicit human-annotated labels. The STEGO method for unsupervised semantic segmentation contrastively distills feature correspondences of a DINO-pre-trained Vision Transformer and recently set a new state of the art. However, the detailed workings of STEGO have yet to be disentangled, preventing its usage in safety-critical applications. This paper provides a deeper understanding of the STEGO architecture and training strategy by conducting studies that uncover the working mechanisms behind STEGO, reproduce and extend its experimental validation, and investigate the ability of STEGO to transfer to different datasets. Results demonstrate that the STEGO architecture can be interpreted as a semantics-preserving dimensionality reduction technique.
Abstract（参考訳）: 近年,コンピュータビジョンにおける汎用的特徴抽出バックボーンのトレーニングにおいて,自己指導型事前学習戦略が顕著な成果を上げている。 Vision Transformerアーキテクチャと組み合わせて、DINO自己蒸留技術は、暗黙のラベルを使わずに、潜在空間における教師なしクラスタリングや生成した特徴のセマンティック対応など、興味深い特徴を持つ。教師なしセマンティックセグメンテーションのためのSTEGO法は、DINO-pre-trained Vision Transformerの特徴対応を対照的に蒸留し、最近その新しい状態を設定した。しかし、STEGOの詳細な作業はいまだに中断されておらず、安全クリティカルなアプリケーションでの使用を妨げている。本稿では,STEGOの動作メカニズムを解明し,その実験検証を再現・拡張する研究を行い,STEGOの異なるデータセットへの転送能力を検討することによって,STEGOのアーキテクチャとトレーニング戦略についてより深く理解する。その結果,STEGOアーキテクチャはセマンティックス保存次元削減技術として解釈できることがわかった。

関連論文リスト

Explaining the Impact of Training on Vision Models via Activation Clustering [2.8792218859042453]
神経活動型視覚説明法(NAVE)について紹介する。 NAVEは視覚モデルエンコーダの内部表現を抽出し視覚化する手法である。機能アクティベーションのクラスタ化によって、NAVEは微調整なしで学習したセマンティクスに関する洞察を提供する。
論文参考訳（メタデータ） (2024-11-29T13:42:10Z)
ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文参考訳（メタデータ） (2024-07-03T16:33:31Z)
Unsupervised Meta-Learning via In-Context Learning [3.4165401459803335]
本稿では,教師なしメタ学習における教師なしメタ学習の一般化能力を活用した新しい手法を提案する。提案手法は,メタラーニングをシーケンスモデリング問題として再設計し,トランスフォーマーエンコーダがサポート画像からタスクコンテキストを学習できるようにする。
論文参考訳（メタデータ） (2024-05-25T08:29:46Z)
EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation [5.476136494434766]
意味的類似性行列から派生した固有ベイズを通して意味的および構造的手がかりを提供する手法であるEiCueを紹介する。オブジェクトレベルの表現を画像内および画像間の整合性で学習する。 COCO-Stuff、Cityscapes、Potsdam-3データセットの実験では、最先端のUSSの結果が示されている。
論文参考訳（メタデータ） (2024-03-03T11:24:16Z)
A Probabilistic Model Behind Self-Supervised Learning [53.64989127914936]
自己教師付き学習(SSL)では、アノテートラベルなしで補助的なタスクを通じて表現が学習される。自己教師型学習のための生成潜在変数モデルを提案する。対照的な方法を含む識別的SSLのいくつかのファミリーは、表現に匹敵する分布を誘導することを示した。
論文参考訳（メタデータ） (2024-02-02T13:31:17Z)
Segment Any Building [8.12405696290333]
この原稿は、画像にセグメンテーションを構築するための最先端表現学習パラダイムを用いて、多様なデータセットをタンデムで活用する能力をアクセント化する。我々の前衛合同訓練体制は, 都市インフラ整備, 防災戦略, 生態モニタリングなど, 重要な分野に重大な影響を及ぼし, アプローチのメリットを浮き彫りにしている。この研究の結果は、学術的な追求の基盤を固めることと、セグメンテーション構築の分野における革新的な応用による地平線を埋めることの両方に繋がる。
論文参考訳（メタデータ） (2023-10-02T12:49:20Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
Semi-supervised learning made simple with self-supervised clustering [65.98152950607707]
自己教師付き学習モデルは、人間のアノテーションを必要とせずにリッチな視覚表現を学習することが示されている。本稿では,クラスタリングに基づく自己教師付き手法を半教師付き学習者へと変換する,概念的に単純だが経験的に強力な手法を提案する。
論文参考訳（メタデータ） (2023-06-13T01:09:18Z)
OCTAve: 2D en face Optical Coherence Tomography Angiography Vessel Segmentation in Weakly-Supervised Learning with Locality Augmentation [14.322349196837209]
画素レベルのアノテーションを自動化するために,スクリブルベースの弱教師付き学習手法を提案する。 OCTAveと呼ばれる本提案手法は,スクリブルアノテートによる弱教師付き学習と,敵意と自己監督型自己監督型深層学習を組み合わせたものである。
論文参考訳（メタデータ） (2022-07-25T14:40:56Z)
Evaluation of Self-taught Learning-based Representations for Facial Emotion Recognition [62.30451764345482]
この研究は、顔の感情認識のための自己学習の概念を通じて得られた教師なし表現を生成するための様々な戦略を記述する。このアイデアは、オートエンコーダの初期化、アーキテクチャ、トレーニングデータを変化させることで、多様性を促進する補完的な表現を作ることである。 Jaffe と Cohn-Kanade のデータセットに対する残余のサブジェクトアウトプロトコルによる実験結果から,提案した多種多様な表現に基づく FER 手法が最先端のアプローチと好適に比較できることが示唆された。
論文参考訳（メタデータ） (2022-04-26T22:48:15Z)
Self-supervised learning for joint SAR and multispectral land cover classification [38.8529535887097]
マルチチャネルモデルの自己教師型トレーニングのためのフレームワークと特定のタスクを提案する。提案手法は,土地被覆分類のラベルと相関する特徴の学習に有効であることを示す。
論文参考訳（メタデータ） (2021-08-20T09:02:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。