論文の概要: InfoSeg: Unsupervised Semantic Image Segmentation with Mutual
Information Maximization
- arxiv url: http://arxiv.org/abs/2110.03477v1
- Date: Thu, 7 Oct 2021 14:01:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 23:57:49.479227
- Title: InfoSeg: Unsupervised Semantic Image Segmentation with Mutual
Information Maximization
- Title(参考訳): InfoSeg:相互情報最大化による教師なしセマンティックイメージセグメンテーション
- Authors: Robert Harb and Patrick Kn\"obelreiter
- Abstract要約: 局所的特徴と大域的高レベル特徴の相互情報に基づく教師なし画像表現の新しい手法を提案する。
最初のステップでは、ローカル機能とグローバル機能に基づいて、イメージをセグメント化する。
第2のステップでは,各クラスの局所的特徴と高次特徴との相互関係を最大化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We propose a novel method for unsupervised semantic image segmentation based
on mutual information maximization between local and global high-level image
features. The core idea of our work is to leverage recent progress in
self-supervised image representation learning. Representation learning methods
compute a single high-level feature capturing an entire image. In contrast, we
compute multiple high-level features, each capturing image segments of one
particular semantic class. To this end, we propose a novel two-step learning
procedure comprising a segmentation and a mutual information maximization step.
In the first step, we segment images based on local and global features. In the
second step, we maximize the mutual information between local features and
high-level features of their respective class. For training, we provide solely
unlabeled images and start from random network initialization. For quantitative
and qualitative evaluation, we use established benchmarks, and COCO-Persons,
whereby we introduce the latter in this paper as a challenging novel benchmark.
InfoSeg significantly outperforms the current state-of-the-art, e.g., we
achieve a relative increase of 26% in the Pixel Accuracy metric on the
COCO-Stuff dataset.
- Abstract(参考訳): 局所的特徴量と大域的高次特徴量との相互情報最大化に基づく教師なしセマンティックイメージセグメンテーションの新しい手法を提案する。
我々の研究の中核となる考え方は、自己教師付き画像表現学習の最近の進歩を活用することである。
表現学習方法は、画像全体をキャプチャする単一の高レベル特徴を計算する。
対照的に、複数のハイレベルな特徴を計算し、それぞれが特定のセマンティッククラスのイメージセグメントをキャプチャする。
そこで本研究では,セグメンテーションと相互情報最大化ステップを組み合わせた2段階学習手法を提案する。
最初のステップでは、ローカル機能とグローバル機能に基づいてイメージをセグメンテーションします。
第2のステップでは,各クラスの局所的特徴と高次特徴との相互情報を最大化する。
トレーニングでは、ラベルのない画像のみを提供し、ランダムネットワークの初期化から始める。
定量的かつ質的な評価のために,確立されたベンチマークとCOCO-Personsを用いて,後者を挑戦的な新しいベンチマークとして紹介する。
InfoSegは現在の最先端、例えば、COCO-Stuffデータセット上のPixelの精度の26%の相対的な増加を実現しています。
関連論文リスト
- Multi-interactive Feature Learning and a Full-time Multi-modality
Benchmark for Image Fusion and Segmentation [66.15246197473897]
多モード画像融合とセグメンテーションは、自律走行とロボット操作において重要な役割を果たす。
画像融合とtextbfSegmentation のための textbfMulti-textbfinteractive textbfFeature Learning アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-04T01:03:58Z) - Exploring Open-Vocabulary Semantic Segmentation without Human Labels [76.15862573035565]
我々は、既存の事前学習された視覚言語モデル(VL)を利用して意味的セグメンテーションモデルを訓練するZeroSegを提案する。
ZeroSegは、VLモデルで学んだ視覚概念をセグメントトークンの集合に蒸留することでこれを克服し、それぞれが対象画像の局所化領域を要約する。
提案手法は,他のゼロショットセグメンテーション法と比較して,同じトレーニングデータを用いた場合と比較して,最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T08:47:06Z) - In-N-Out Generative Learning for Dense Unsupervised Video Segmentation [89.21483504654282]
本稿では,ラベルなしビデオから視覚的対応を学習する,教師なしビデオオブジェクト(VOS)タスクに焦点を当てる。
In-aNd-Out(INO)生成学習を純粋に生成的観点から提案する。
我々のINOは、最先端の手法をかなりのマージンで上回っている。
論文 参考訳(メタデータ) (2022-03-29T07:56:21Z) - A Pixel-Level Meta-Learner for Weakly Supervised Few-Shot Semantic
Segmentation [40.27705176115985]
Few-shotのセマンティックセマンティックセグメンテーションは、興味のある新しいクラスのために、地上の真実のピクセルレベルのラベルを持つ少数の画像しか利用できない学習タスクに対処する。
限られたデータとその意味ラベルから擬似画素レベルのセグメンテーションマスクを予測するメタラーニングフレームワークを提案する。
提案する学習モデルは,画素レベルのメタラーナーとみなすことができる。
論文 参考訳(メタデータ) (2021-11-02T08:28:11Z) - Maximize the Exploration of Congeneric Semantics for Weakly Supervised
Semantic Segmentation [27.155133686127474]
グラフニューラルネットワーク(P-GNN)を,同一のクラスラベルを含む異なる画像からの自己検出パッチに基づいて構築する。
PASCAL VOC 2012ベンチマークで実験を行い、そのモデルにより最先端の性能が得られた。
論文 参考訳(メタデータ) (2021-10-08T08:59:16Z) - Mining Contextual Information Beyond Image for Semantic Segmentation [37.783233906684444]
セマンティックイメージセグメンテーションにおける文脈集約問題について検討する。
個々の画像以外の文脈情報をマイニングして、ピクセル表現をさらに強化することを提案する。
提案手法は,既存のセグメンテーションフレームワークに強制的に組み込むことができる。
論文 参考訳(メタデータ) (2021-08-26T14:34:23Z) - Learning Meta-class Memory for Few-Shot Semantic Segmentation [90.28474742651422]
全てのクラスで共有可能なメタ情報であるメタクラスの概念を導入する。
本稿では,メタクラスメモリをベースとした少ショットセグメンテーション手法 (MM-Net) を提案する。
提案したMM-Netは1ショット設定でCOCOデータセット上で37.5%のmIoUを達成する。
論文 参考訳(メタデータ) (2021-08-06T06:29:59Z) - Unsupervised Image Segmentation by Mutual Information Maximization and
Adversarial Regularization [7.165364364478119]
InMARS(Information Maximization and Adrial Regularization)と呼ばれる新しい教師なしセマンティックセマンティックセマンティクス手法を提案する。
シーンを知覚群に解析する人間の知覚に触発され、提案手法はまず、入力画像を意味のある領域(スーパーピクセルとも呼ばれる)に分割する。
次に、相互情報最大化(Multual-Information-Maximization)と、それらの領域を意味論的に意味のあるクラスにクラスタ化するための敵対的トレーニング戦略を利用する。
提案手法は2つの非教師付きセマンティックセグメンテーションデータセット上での最先端性能を実現することを実証した。
論文 参考訳(メタデータ) (2021-07-01T18:36:27Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。