論文の概要: FaceMap: Towards Unsupervised Face Clustering via Map Equation
- arxiv url: http://arxiv.org/abs/2203.10090v1
- Date: Mon, 21 Mar 2022 03:23:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 15:03:32.505632
- Title: FaceMap: Towards Unsupervised Face Clustering via Map Equation
- Title(参考訳): FaceMap: マップ方程式による教師なしの顔クラスタリングを目指す
- Authors: Xiaotian Yu, Yifan Yang, Aibo Wang, Ling Xing, Hanling Yi, Guangming
Lu, Xiaoyu Wang
- Abstract要約: 顔のクラスタリングは、拡張現実やフォトアルバム管理といった関連アプリケーションの爆発により、コンピュータビジョンにおいて不可欠なタスクである。
我々は、非重複コミュニティ検出のプロセスとして、顔クラスタリングを定式化することにより、FaceMapと呼ばれる効果的な教師なし手法を開発した。
アブレーション研究による実験では、FaceMapは既存の手法よりも大幅に優れていた。
- 参考スコア(独自算出の注目度): 45.72096482531776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face clustering is an essential task in computer vision due to the explosion
of related applications such as augmented reality or photo album management.
The main challenge of this task lies in the imperfectness of similarities among
image feature representations. Given an existing feature extraction model, it
is still an unresolved problem that how can the inherent characteristics of
similarities of unlabelled images be leveraged to improve the clustering
performance. Motivated by answering the question, we develop an effective
unsupervised method, named as FaceMap, by formulating face clustering as a
process of non-overlapping community detection, and minimizing the entropy of
information flows on a network of images. The entropy is denoted by the map
equation and its minimum represents the least description of paths among images
in expectation. Inspired by observations on the ranked transition probabilities
in the affinity graph constructed from facial images, we develop an outlier
detection strategy to adaptively adjust transition probabilities among images.
Experiments with ablation studies demonstrate that FaceMap significantly
outperforms existing methods and achieves new state-of-the-arts on three
popular large-scale datasets for face clustering, e.g., an absolute improvement
of more than $10\%$ and $4\%$ comparing with prior unsupervised and supervised
methods respectively in terms of average of Pairwise F-score. Our code is
publicly available on github.
- Abstract(参考訳): 顔のクラスタリングは、拡張現実やフォトアルバム管理といった関連アプリケーションの爆発により、コンピュータビジョンにおいて不可欠なタスクである。
このタスクの主な課題は、画像特徴表現間の類似性の不完全さにある。
既存の特徴抽出モデルを考えると、未ラベル画像の類似性の特徴をいかに活用してクラスタリング性能を向上させるかは未解決の問題である。
この疑問に答えて、非重複コミュニティ検出のプロセスとして顔クラスタリングを定式化し、画像ネットワーク上での情報フローのエントロピーを最小化することにより、FaceMapと呼ばれる効果的な教師なし手法を開発した。
エントロピーは写像方程式で表され、その最小限は予想される画像間の経路の最小記述を表す。
顔画像から構築した親和性グラフのランク付けされた遷移確率の観測にインスパイアされ、画像間の遷移確率を適応的に調整する異常検出戦略を開発した。
アブレーション研究による実験により、facemapは既存の方法を大幅に上回っており、顔クラスタリングのための3つの一般的な大規模データセット、例えば、ペアワイズf-scoreの平均で、以前の教師なしと教師なしのメソッドと比較すると、絶対的な改善が10\%$と4\%$である。
私たちのコードはgithubで公開されている。
関連論文リスト
- Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Patch-Based Deep Unsupervised Image Segmentation using Graph Cuts [0.0]
本稿では,従来のグラフ手法のアルゴリズム的助けを借りて,教師なし特徴抽出の進歩を橋渡しするパッチベースの教師なし画像分割戦略を提案する。
画像パッチを分類するために訓練された単純な畳み込みニューラルネットワークは、自然に最先端の完全畳み込み非教師付きピクセルレベルのセグメンタに繋がることを示す。
論文 参考訳(メタデータ) (2023-11-01T19:59:25Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Learning to Mask and Permute Visual Tokens for Vision Transformer
Pre-Training [59.923672191632065]
我々はMasked and Permuted Vision Transformer(MaPeT)という自己教師型事前学習手法を提案する。
MaPeTは、自動回帰および置換予測を使用して、パッチ内依存関係をキャプチャする。
以上の結果から,MaPeTはImageNet上での競合性能を実証した。
論文 参考訳(メタデータ) (2023-06-12T18:12:19Z) - Distributed Solution of the Inverse Rig Problem in Blendshape Facial
Animation [0.0]
リグのインバージョンは、アバターの現実的で魅力的なパフォーマンスを可能にするため、顔アニメーションの中心である。
より高速なソリューションへのアプローチとして、顔の空間的性質を活用するクラスタリングがある。
本稿では、重なり合うコンポーネントのより確実な推定を得るために、クラスタ結合を伴ってさらに一歩進める。
論文 参考訳(メタデータ) (2023-03-11T10:34:07Z) - Semantic-Enhanced Image Clustering [6.218389227248297]
本稿では,視覚言語事前学習モデルの助けを借りて,画像クラスタリングの課題について検討する。
イメージを適切なセマンティック空間にマップする方法と、イメージとセマンティック空間の両方からイメージをクラスタリングする方法は、2つの重要な問題である。
本稿では,与えられた画像を適切な意味空間にマッピングする手法を提案し,画像と意味論の関係に応じて擬似ラベルを生成する。
論文 参考訳(メタデータ) (2022-08-21T09:04:21Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Learning to Cluster Faces via Transformer [8.285052859942443]
顔クラスタリングは、自動顔アノテーションや検索などのアプリケーションに便利なツールです。
従来のクラスタリング手法は、個々の画像と隣人との関係を無視する。
教師付き顔クラスタリングのためのFace Transformerを導入する。
論文 参考訳(メタデータ) (2021-04-23T09:43:36Z) - Unsupervised Learning of Visual Features by Contrasting Cluster
Assignments [57.33699905852397]
ペア比較の計算を必要とせず,コントラスト的手法を生かしたオンラインアルゴリズムSwaVを提案する。
本手法では,クラスタ割り当て間の一貫性を保ちながら,同時にデータをクラスタ化する。
我々の方法は大規模で小さなバッチで訓練でき、無制限のデータにスケールできる。
論文 参考訳(メタデータ) (2020-06-17T14:00:42Z) - GATCluster: Self-Supervised Gaussian-Attention Network for Image
Clustering [9.722607434532883]
画像クラスタリングのための自己教師型クラスタリングネットワーク(GATCluster)を提案する。
まず中間機能を抽出し、次に従来のクラスタリングを実行する代わりに、GATClusterセマンティッククラスタラベルを後処理なしで実行します。
大規模画像のクラスタリングにメモリ効率のよい2段階学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-02-27T00:57:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。