論文の概要: Evaluating Disentanglement of Structured Latent Representations
- arxiv url: http://arxiv.org/abs/2101.04041v1
- Date: Mon, 11 Jan 2021 17:24:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 17:33:55.611804
- Title: Evaluating Disentanglement of Structured Latent Representations
- Title(参考訳): 構造化潜在表現の絡み合いの評価
- Authors: Rapha\"el Dang-Nhu and Angelika Steger
- Abstract要約: 我々は,構造化潜在表現の階層レベルで動作する最初の多層異方性メトリクスを設計する。
我々の測定基準は、潜在スロット間のオブジェクト分離と内部スロットの絡み合いの両方を共通の数学的枠組みに統一する。
- 参考スコア(独自算出の注目度): 3.756550107432323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We design the first multi-layer disentanglement metric operating at all
hierarchy levels of a structured latent representation, and derive its
theoretical properties. Applied to object-centric representations, our metric
unifies the evaluation of both object separation between latent slots and
internal slot disentanglement into a common mathematical framework. It also
addresses the problematic dependence on segmentation mask sharpness of previous
pixel-level segmentation metrics such as ARI. Perhaps surprisingly, our
experimental results show that good ARI values do not guarantee a disentangled
representation, and that the exclusive focus on this metric has led to
counterproductive choices in some previous evaluations. As an additional
technical contribution, we present a new algorithm for obtaining feature
importances that handles slot permutation invariance in the representation.
- Abstract(参考訳): 構造的潜在表現の全ての階層レベルで動作する最初の多層異方性計量を設計し、その理論的性質を導出する。
対象中心の表現に応用し、潜在スロット間のオブジェクト分離と内部スロットの絡み合いの双方の評価を共通の数学的枠組みに統一する。
また、ARIのような以前のピクセルレベルのセグメンテーションメトリクスのセグメンテーションマスクシャープネスに対する問題にも対処する。
おそらく、実験結果から、良いARI値が不整合表現を保証せず、この指標に排他的焦点をあてた結果、過去の評価では非生産的選択が導かれた。
追加の技術的貢献として,表現のスロット置換不変性を扱う特徴重要度を得るための新しいアルゴリズムを提案する。
関連論文リスト
- Interpretability Benchmark for Evaluating Spatial Misalignment of
Prototypical Parts Explanations [13.111196926104485]
我々はこの望ましくない振る舞いを空間的説明の誤りとみなす。
本稿では, 誤り補償手法を提案し, 既存の最先端モデルに適用する。
論文 参考訳(メタデータ) (2023-08-16T06:09:51Z) - Learning Disentangled Discrete Representations [22.5004558029479]
本稿では,標準ガウス変分オートエンコーダをカテゴリー変分オートエンコーダに置き換えることで,離散潜在空間と非交分表現の関係を示す。
本研究では,非絡み合った表現を学習する上で,個別のVAEの利点を示す分析的および実証的な知見を提供する。
論文 参考訳(メタデータ) (2023-07-26T12:29:58Z) - Enriching Disentanglement: Definitions to Metrics [97.34033555407403]
分散表現学習は、複雑なデータの変動の複数の要因を分離する難題である。
不整合表現の学習と評価のための様々な指標が提案されているが、これらの指標が真に何を定量化し、どのように比較するかは定かではない。
論文 参考訳(メタデータ) (2023-05-19T08:22:23Z) - Understanding and Constructing Latent Modality Structures in Multi-modal
Representation Learning [53.68371566336254]
優れたパフォーマンスの鍵は、完全なモダリティアライメントではなく、有意義な潜在モダリティ構造にある、と我々は主張する。
具体的には,1)モダリティ内正規化のための深い特徴分離損失,2)モダリティ間正規化のためのブラウン橋損失,3)モダリティ内正規化およびモダリティ間正規化のための幾何学的整合損失を設計する。
論文 参考訳(メタデータ) (2023-03-10T14:38:49Z) - Synergies between Disentanglement and Sparsity: Generalization and
Identifiability in Multi-Task Learning [79.83792914684985]
我々は,最大スパース基底予測器が不整合表現をもたらす条件を提供する新しい識別可能性の結果を証明した。
この理論的な結果から,両レベル最適化問題に基づくアンタングル表現学習の実践的アプローチを提案する。
論文 参考訳(メタデータ) (2022-11-26T21:02:09Z) - Federated Representation Learning via Maximal Coding Rate Reduction [109.26332878050374]
本稿では,複数のクライアントに分散したデータセットから低次元表現を学習する手法を提案する。
提案手法はFLOWと呼ばれ, MCR2を選択の対象とし, その結果, クラス間判別とクラス内圧縮の両方が可能な表現が得られた。
論文 参考訳(メタデータ) (2022-10-01T15:43:51Z) - NashAE: Disentangling Representations through Adversarial Covariance
Minimization [8.22507807169023]
本研究では,基礎となる変動プロファイルの事前知識に依存しない高次元データにおいて,変動要因を分散させる自己教師手法を提案する。
我々は,NashAEの信頼性が向上し,学習潜在表現における有能なデータ特性を捉える能力が向上したことを示す。
論文 参考訳(メタデータ) (2022-09-21T22:02:26Z) - SGDR: Semantic-guided Disentangled Representation for Unsupervised
Cross-modality Medical Image Segmentation [5.090366802287405]
本稿では,セグメンテーションタスクにおいて意味論的に意味のある特徴を正確に表現するために,意味誘導非絡み合い表現(SGDR)と呼ばれる新しいフレームワークを提案する。
提案手法を2つの公開データセットで検証し, 実験結果から, 2つの評価指標における工法の現状を, 有意差で比較した。
論文 参考訳(メタデータ) (2022-03-26T08:31:00Z) - Unsupervised low-rank representations for speech emotion recognition [78.38221758430244]
音声感情認識のための低ランク特徴表現の抽出に線形および非線形次元削減アルゴリズムを用いて検討する。
異なる分類法を用いて2つのデータベース上で学習した表現の音声認識(SER)結果を報告する。
論文 参考訳(メタデータ) (2021-04-14T18:30:58Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。