論文の概要: Unsupervised Landmark Discovery Using Consistency Guided Bottleneck
- arxiv url: http://arxiv.org/abs/2309.10518v1
- Date: Tue, 19 Sep 2023 10:57:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 15:06:34.148933
- Title: Unsupervised Landmark Discovery Using Consistency Guided Bottleneck
- Title(参考訳): Consistency Guided Bottleneck を用いた教師なしランドマーク発見
- Authors: Mamona Awan, Muhammad Haris Khan, Sanoojan Baliah, Muhammad Ahmad
Waseem, Salman Khan, Fahad Shahbaz Khan and Arif Mahmood
- Abstract要約: 画像再構成に基づくパイプラインに一貫性のあるボトルネックを導入する。
本稿では,画像間のランドマーク対応を形成することによって,擬似スーパービジョンを得る手法を提案する。
この一貫性は、アダプティブ・ヒートマップの生成において発見されたランドマークの不確かさを変調する。
- 参考スコア(独自算出の注目度): 63.624186864522315
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a challenging problem of unsupervised discovery of object landmarks.
Many recent methods rely on bottlenecks to generate 2D Gaussian heatmaps
however, these are limited in generating informed heatmaps while training,
presumably due to the lack of effective structural cues. Also, it is assumed
that all predicted landmarks are semantically relevant despite having no ground
truth supervision. In the current work, we introduce a consistency-guided
bottleneck in an image reconstruction-based pipeline that leverages landmark
consistency, a measure of compatibility score with the pseudo-ground truth to
generate adaptive heatmaps. We propose obtaining pseudo-supervision via forming
landmark correspondence across images. The consistency then modulates the
uncertainty of the discovered landmarks in the generation of adaptive heatmaps
which rank consistent landmarks above their noisy counterparts, providing
effective structural information for improved robustness. Evaluations on five
diverse datasets including MAFL, AFLW, LS3D, Cats, and Shoes demonstrate
excellent performance of the proposed approach compared to the existing
state-of-the-art methods. Our code is publicly available at
https://github.com/MamonaAwan/CGB_ULD.
- Abstract(参考訳): 対象ランドマークの教師なし発見の課題について検討する。
近年の手法の多くは、2次元ガウス熱マップを生成するためのボトルネックに依存しているが、これはおそらく効果的な構造的手がかりが欠如しているため、訓練中に情報熱マップを生成する場合に限られている。
また、全ての予測されたランドマークは、基礎的真理の監督がないにもかかわらず意味的に関連していると仮定される。
本研究では,画像再構成に基づくパイプラインにおいて,擬似地盤真理との整合性スコアを用いて適応的なヒートマップを生成する,一貫性に基づくボトルネックを提案する。
画像間のランドマーク対応を形成することで擬似スーパービジョンを得る。
この整合性は、その雑音のより上の一貫したランドマークをランク付けする適応型ヒートマップの生成において発見されたランドマークの不確かさを変調し、堅牢性を改善する効果的な構造情報を提供する。
MAFL, AFLW, LS3D, Cats, Shoesを含む5つの多様なデータセットの評価は, 既存の最先端手法と比較して, 提案手法の優れた性能を示している。
私たちのコードはhttps://github.com/MamonaAwan/CGB_ULD.comで公開されています。
関連論文リスト
- Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective [2.969441406380581]
隣接する t-SNE, UMAP, LargeVis などの埋め込み手法は、一般的な可視化手法のファミリーである。
近年の研究では、これらの手法がしばしば視覚的な人工物を生み出し、誤った科学的結論につながる可能性が示唆されている。
本稿では,古典的な統計的概念に基づいて埋め込みマップを学習する,新しい概念的・計算的枠組み LOO-map を紹介する。
論文 参考訳(メタデータ) (2024-10-22T01:40:43Z) - Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Learning Real-World Image De-Weathering with Imperfect Supervision [57.748585821252824]
既存の現実世界のデヒータリングデータセットは、接地トラス画像と入力された劣化画像の間に、一貫性のない照明、位置、テクスチャを示すことが多い。
我々は、入力劣化画像と可能な限り一貫性のある擬似ラベルを生成するための一貫性ラベルコンストラクタ(CLC)を開発した。
我々は,従来の不完全ラベルと擬似ラベルを組み合わせることで,情報割当戦略による脱ウェザリングモデルを共同で監督する。
論文 参考訳(メタデータ) (2023-10-23T14:02:57Z) - VIBUS: Data-efficient 3D Scene Parsing with VIewpoint Bottleneck and
Uncertainty-Spectrum Modeling [2.0624279915507047]
3Dシーン解析モデルの訓練は、興味深い代替手段だ。
このタスクをデータ効率のよい3Dシーン解析と呼ぶ。
そこで本研究では,VIBUSという2段階の有効なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-20T17:59:57Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Deep Structured Prediction for Facial Landmark Detection [59.60946775628646]
本稿では,深層畳み込みネットワークと条件付きランダムフィールドを組み合わせた深層構造顔のランドマーク検出手法を提案する。
顔のランドマーク検出における最先端技術よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-10-18T17:09:24Z) - Gaussian Process Gradient Maps for Loop-Closure Detection in
Unstructured Planetary Environments [17.276441789710574]
以前にマップされた位置を認識する能力は、自律システムにとって不可欠な機能である。
非構造的な惑星のような環境は、地形の類似性のためにこれらのシステムに大きな課題をもたらす。
本稿では,空間情報のみを用いたループ閉鎖問題の解法を提案する。
論文 参考訳(メタデータ) (2020-09-01T04:41:40Z) - BRUL\`E: Barycenter-Regularized Unsupervised Landmark Extraction [2.2758845733923687]
画像特徴の教師なし検索は、アノテーションが欠けている、あるいは不足している多くのコンピュータビジョンタスクにとって不可欠である。
画像中のランドマークを検出するための教師なしの新たなアプローチを提案し,人間の顔のキーポイント抽出の一般的なタスク上で検証する。
提案手法は,非重要情報を捨てつつ,潜在空間における所望のランドマークを自動エンコードする手法に基づく。
論文 参考訳(メタデータ) (2020-06-20T20:04:00Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。