論文の概要: Cousins Of The Vendi Score: A Family Of Similarity-Based Diversity
Metrics For Science And Machine Learning
- arxiv url: http://arxiv.org/abs/2310.12952v1
- Date: Thu, 19 Oct 2023 17:52:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 13:56:26.119841
- Title: Cousins Of The Vendi Score: A Family Of Similarity-Based Diversity
Metrics For Science And Machine Learning
- Title(参考訳): Vendi ScoreのCousins:科学と機械学習のための類似性に基づく多様性メトリクスの家族
- Authors: Amey Pasarkar and Adji Bousso Dieng
- Abstract要約: Vendi Score(ヴェンディ・スコア)は、一般的な類似性に基づく多様性指標である。
ヴェンディスコアは類似性を考慮し、多様性を評価するためにコレクション内のカテゴリの頻度に関する知識を必要としない。
We use the Vendi scores to improve understanding the behavior of image Generative model in terms of memorization, duplication, diversity, and sample quality。
- 参考スコア(独自算出の注目度): 3.5353632767823506
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Measuring diversity accurately is important for many scientific fields,
including machine learning (ML), ecology, and chemistry. The Vendi Score was
introduced as a generic similarity-based diversity metric that extends the Hill
number of order q=1 by leveraging ideas from quantum statistical mechanics.
Contrary to many diversity metrics in ecology, the Vendi Score accounts for
similarity and does not require knowledge of the prevalence of the categories
in the collection to be evaluated for diversity. However, the Vendi Score
treats each item in a given collection with a level of sensitivity proportional
to the item's prevalence. This is undesirable in settings where there is a
significant imbalance in item prevalence. In this paper, we extend the other
Hill numbers using similarity to provide flexibility in allocating sensitivity
to rare or common items. This leads to a family of diversity metrics -- Vendi
scores with different levels of sensitivity -- that can be used in a variety of
applications. We study the properties of the scores in a synthetic controlled
setting where the ground truth diversity is known. We then test their utility
in improving molecular simulations via Vendi Sampling. Finally, we use the
Vendi scores to better understand the behavior of image generative models in
terms of memorization, duplication, diversity, and sample quality.
- Abstract(参考訳): 多様性を正確に測定することは、機械学習(ML)、生態学、化学など多くの科学分野において重要である。
vendiスコアは、量子統計力学のアイデアを活用し、q=1のヒル数を拡張する一般的な類似性に基づく多様性メトリックとして導入された。
生態学における多くの多様性指標とは対照的に、ヴェンディスコアは類似性を考慮し、多様性を評価するためにコレクション内のカテゴリの有病率の知識を必要としない。
しかしながら、Vendi Scoreは、アイテムの頻度に比例する感度のレベルで、所定のコレクション内の各アイテムを扱います。
これはアイテムの頻度にかなりの不均衡がある設定では望ましくない。
本稿では,類似性を用いて他のヒル数を拡張し,希少品や共通品に感度を割り当てる柔軟性を提供する。
これにより、さまざまなアプリケーションで使用可能な、多様性指標のファミリー -- 異なるレベルの感度を持つ自動スコア -- が生まれます。
基底真理の多様性が知られている合成制御環境におけるスコアの特性について検討する。
次に、その有用性をテストし、ヴェンディサンプリングによる分子シミュレーションを改善する。
最後に、記憶、重複、多様性、およびサンプル品質の観点から画像生成モデルの振る舞いをよりよく理解するために、vendiスコアを使用する。
関連論文リスト
- GRADE: Quantifying Sample Diversity in Text-to-Image Models [66.12068246962762]
本稿では,サンプルの多様性を定量化する手法であるGRADE: Granular Attribute Diversity Evaluationを提案する。
400のコンセプト属性ペアを用いて12のT2Iモデルの全体的な多様性を測定し、すべてのモデルが限定的な変動を示すことを示した。
我々の研究は、サンプルの多様性を測定するための現代的で意味論的に駆動されたアプローチを提案し、T2Iモデルによる出力の驚くべき均一性を強調している。
論文 参考訳(メタデータ) (2024-10-29T23:10:28Z) - Inherent Trade-Offs between Diversity and Stability in Multi-Task Benchmarks [20.24270790628136]
社会的選択論のレンズを用いた機械学習におけるマルチタスクベンチマークについて検討する。
ベンチマークの多様性が増すほど、自明な変更に敏感になることが示されます。
論文 参考訳(メタデータ) (2024-05-02T20:28:54Z) - GaussianMLR: Learning Implicit Class Significance via Calibrated
Multi-Label Ranking [0.0]
本稿では,ガウスMLRという新しい多ラベルランキング手法を提案する。
これは、正のラベルのランクを決定する暗黙のクラス重要性の値を学ぶことを目的としている。
提案手法は, 組み込まれた正のランク順の表現を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-03-07T14:09:08Z) - The Vendi Score: A Diversity Evaluation Metric for Machine Learning [4.595428357774472]
我々は、生態学と量子統計力学のアイデアを機械学習(ML)に結びつけるVendi Scoreを提案する。
類似機能を入力として取り込むことで、Vendi Scoreはユーザが望む多様性の形式を指定することができる。
我々は、分子生成モデリングに関するVendi Scoreを紹介し、その領域における現在の多様性指標の欠点に対処することを発見した。
また、Vendi Scoreを画像の生成モデルやテキストの復号アルゴリズムに適用し、それらの領域の多様性に関する既知の結果を確認した。
論文 参考訳(メタデータ) (2022-10-05T17:32:16Z) - Rarity Score : A New Metric to Evaluate the Uncommonness of Synthesized
Images [32.94581354719927]
そこで我々は,各画像の放射率を測定するために,新しい評価基準である「放射率スコア」を提案する。
コードは、研究コミュニティのためにオンラインで公開されます。
論文 参考訳(メタデータ) (2022-06-17T05:16:16Z) - On Quantitative Evaluations of Counterfactuals [88.42660013773647]
本稿では、分析と実験を通じて、視覚的対実例の評価に関する研究を集約する。
ほとんどのメトリクスは、十分な単純なデータセットを意図して振る舞うが、複雑さが増加すると、良い結果と悪い結果の違いを判断できないものもいる。
私たちはラベル変動スコアとOracleスコアという2つの新しい指標を提案しています。
論文 参考訳(メタデータ) (2021-10-30T05:00:36Z) - MultiFair: Multi-Group Fairness in Machine Learning [52.24956510371455]
機械学習におけるマルチグループフェアネスの研究(MultiFair)
この問題を解決するために,汎用的なエンドツーエンドのアルゴリズムフレームワークを提案する。
提案するフレームワークは多くの異なる設定に一般化可能である。
論文 参考訳(メタデータ) (2021-05-24T02:30:22Z) - HOT-VAE: Learning High-Order Label Correlation for Multi-Label
Classification via Attention-Based Variational Autoencoders [8.376771467488458]
High-order Tie-in Variational Autoencoder (HOT-VAE) 形式ごとの適応的高階ラベル相関学習。
本モデルが鳥の分布データセット上で既存の最先端のアプローチを上回ることを実験的に検証した。
論文 参考訳(メタデータ) (2021-03-09T04:30:28Z) - Tweet Sentiment Quantification: An Experimental Re-Evaluation [88.60021378715636]
センチメント定量化(Sentiment Quantification)は、教師付き学習によって、感情関連クラスの相対周波数(prevalence')を推定するタスクである。
統合され、より堅牢な実験プロトコルに従って、これらの定量化手法を再評価する。
結果はガオ・ガオ・セバスティアーニ(Gao Gao Sebastiani)によって得られたものとは大きく異なり、異なる感情量化法の相対的な強さと弱さについて、よりしっかりとした理解を提供する。
論文 参考訳(メタデータ) (2020-11-04T21:41:34Z) - Dataset Bias in Few-shot Image Recognition [57.25445414402398]
まず,基本カテゴリから学習した伝達可能能力の影響について検討する。
第2に、データセット構造と異なる少数ショット学習方法から、異なるデータセットのパフォーマンス差について検討する。
論文 参考訳(メタデータ) (2020-08-18T14:46:23Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。