Fugu-MT 論文翻訳(概要): Evaluating Disentanglement of Structured Latent Representations

論文の概要: Evaluating Disentanglement of Structured Latent Representations

arxiv url: http://arxiv.org/abs/2101.04041v1
Date: Mon, 11 Jan 2021 17:24:01 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-04 17:33:55.611804
Title: Evaluating Disentanglement of Structured Latent Representations
Title（参考訳）: 構造化潜在表現の絡み合いの評価
Authors: Rapha\"el Dang-Nhu and Angelika Steger
Abstract要約: 我々は,構造化潜在表現の階層レベルで動作する最初の多層異方性メトリクスを設計する。我々の測定基準は、潜在スロット間のオブジェクト分離と内部スロットの絡み合いの両方を共通の数学的枠組みに統一する。
参考スコア（独自算出の注目度）: 3.756550107432323
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We design the first multi-layer disentanglement metric operating at all hierarchy levels of a structured latent representation, and derive its theoretical properties. Applied to object-centric representations, our metric unifies the evaluation of both object separation between latent slots and internal slot disentanglement into a common mathematical framework. It also addresses the problematic dependence on segmentation mask sharpness of previous pixel-level segmentation metrics such as ARI. Perhaps surprisingly, our experimental results show that good ARI values do not guarantee a disentangled representation, and that the exclusive focus on this metric has led to counterproductive choices in some previous evaluations. As an additional technical contribution, we present a new algorithm for obtaining feature importances that handles slot permutation invariance in the representation.
Abstract（参考訳）: 構造的潜在表現の全ての階層レベルで動作する最初の多層異方性計量を設計し、その理論的性質を導出する。対象中心の表現に応用し、潜在スロット間のオブジェクト分離と内部スロットの絡み合いの双方の評価を共通の数学的枠組みに統一する。また、ARIのような以前のピクセルレベルのセグメンテーションメトリクスのセグメンテーションマスクシャープネスに対する問題にも対処する。おそらく、実験結果から、良いARI値が不整合表現を保証せず、この指標に排他的焦点をあてた結果、過去の評価では非生産的選択が導かれた。追加の技術的貢献として,表現のスロット置換不変性を扱う特徴重要度を得るための新しいアルゴリズムを提案する。

関連論文リスト

"Principal Components" Enable A New Language of Images [79.45806370905775]
証明可能なPCAのような構造を潜在トークン空間に組み込む新しい視覚トークン化フレームワークを導入する。提案手法は、最先端の再構築性能を実現し、人間の視覚システムとの整合性を向上する。
論文参考訳（メタデータ） (2025-03-11T17:59:41Z)
Measuring Orthogonality in Representations of Generative Models [81.13466637365553]
教師なしの表現学習において、モデルは高次元データから低次元の学習表現に不可欠な特徴を蒸留することを目的としている。独立した生成過程の切り離しは、長い間、高品質な表現を生み出してきた。我々は、IWO(Importance-Weighted Orthogonality)とIWR(Importance-Weighted Rank)の2つの新しい指標を提案する。
論文参考訳（メタデータ） (2024-07-04T08:21:54Z)
Quantization of Large Language Models with an Overdetermined Basis [73.79368761182998]
本稿では,嘉心表現の原理に基づくデータ量子化アルゴリズムを提案する。以上の結果から, カシ量子化はモデル性能の競争力や優れた品質を達成できることが示唆された。
論文参考訳（メタデータ） (2024-04-15T12:38:46Z)
Interpretability Benchmark for Evaluating Spatial Misalignment of Prototypical Parts Explanations [13.111196926104485]
我々はこの望ましくない振る舞いを空間的説明の誤りとみなす。本稿では, 誤り補償手法を提案し, 既存の最先端モデルに適用する。
論文参考訳（メタデータ） (2023-08-16T06:09:51Z)
Enriching Disentanglement: From Logical Definitions to Quantitative Metrics [59.12308034729482]
複雑なデータにおける説明的要素を遠ざけることは、データ効率の表現学習にとって有望なアプローチである。論理的定義と量的指標の関連性を確立し, 理論的に根ざした絡み合いの指標を導出する。本研究では,非交叉表現の異なる側面を分離することにより,提案手法の有効性を実証的に実証する。
論文参考訳（メタデータ） (2023-05-19T08:22:23Z)
Synergies between Disentanglement and Sparsity: Generalization and Identifiability in Multi-Task Learning [79.83792914684985]
我々は,最大スパース基底予測器が不整合表現をもたらす条件を提供する新しい識別可能性の結果を証明した。この理論的な結果から,両レベル最適化問題に基づくアンタングル表現学習の実践的アプローチを提案する。
論文参考訳（メタデータ） (2022-11-26T21:02:09Z)
Federated Representation Learning via Maximal Coding Rate Reduction [109.26332878050374]
本稿では,複数のクライアントに分散したデータセットから低次元表現を学習する手法を提案する。提案手法はFLOWと呼ばれ, MCR2を選択の対象とし, その結果, クラス間判別とクラス内圧縮の両方が可能な表現が得られた。
論文参考訳（メタデータ） (2022-10-01T15:43:51Z)
NashAE: Disentangling Representations through Adversarial Covariance Minimization [8.22507807169023]
本研究では,基礎となる変動プロファイルの事前知識に依存しない高次元データにおいて,変動要因を分散させる自己教師手法を提案する。我々は,NashAEの信頼性が向上し,学習潜在表現における有能なデータ特性を捉える能力が向上したことを示す。
論文参考訳（メタデータ） (2022-09-21T22:02:26Z)
SGDR: Semantic-guided Disentangled Representation for Unsupervised Cross-modality Medical Image Segmentation [5.090366802287405]
本稿では,セグメンテーションタスクにおいて意味論的に意味のある特徴を正確に表現するために,意味誘導非絡み合い表現(SGDR)と呼ばれる新しいフレームワークを提案する。提案手法を2つの公開データセットで検証し, 実験結果から, 2つの評価指標における工法の現状を, 有意差で比較した。
論文参考訳（メタデータ） (2022-03-26T08:31:00Z)
Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文参考訳（メタデータ） (2021-04-01T03:21:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。