論文の概要: Comparing Apples to Oranges: Learning Similarity Functions for Data
Produced by Different Distributions
- arxiv url: http://arxiv.org/abs/2208.12731v2
- Date: Mon, 23 Oct 2023 13:27:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 14:56:29.571305
- Title: Comparing Apples to Oranges: Learning Similarity Functions for Data
Produced by Different Distributions
- Title(参考訳): Appleとオレンジの比較:異なる分布から生成されたデータの類似性関数を学習する
- Authors: Leonidas Tsepenekas, Ivan Brugere, Freddy Lecue, Daniele Magazzeni
- Abstract要約: 我々はこれらのグループ間の類似性関数を学習する効率的なサンプリングフレームワークを提案する。
厳密な理論的境界を持つ解析結果を示し、我々のアルゴリズムを実証的に検証する。
- 参考スコア(独自算出の注目度): 6.906621279967866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Similarity functions measure how comparable pairs of elements are, and play a
key role in a wide variety of applications, e.g., notions of Individual
Fairness abiding by the seminal paradigm of Dwork et al., as well as Clustering
problems. However, access to an accurate similarity function should not always
be considered guaranteed, and this point was even raised by Dwork et al. For
instance, it is reasonable to assume that when the elements to be compared are
produced by different distributions, or in other words belong to different
``demographic'' groups, knowledge of their true similarity might be very
difficult to obtain. In this work, we present an efficient sampling framework
that learns these across-groups similarity functions, using only a limited
amount of experts' feedback. We show analytical results with rigorous
theoretical bounds, and empirically validate our algorithms via a large suite
of experiments.
- Abstract(参考訳): 類似度関数は、要素の対が同等であるかを測り、例えば Dwork などの半古典的パラダイムやクラスタリング問題によって導かれる個人的公正の概念など、幅広い応用において重要な役割を果たす。
しかし、正確な類似性関数へのアクセスは必ずしも保証されるべきではなく、この点はDworkらによって提起された。
例えば、比較する要素が異なる分布で生成される場合、あるいは別の「デムグラフィック」グループに属する場合、それらの真の類似性に関する知識を得るのは非常に困難であると考えるのが妥当である。
本研究では, 少数の専門家のフィードバックのみを用いて, グループ間の類似度関数を学習する効率的なサンプリングフレームワークを提案する。
厳密な理論境界を用いて解析結果を示し,大規模な実験によりアルゴリズムを実証的に検証した。
関連論文リスト
- Collaborative Learning with Different Labeling Functions [7.228285747845779]
我々は、$n$のデータ分布ごとに正確な分類器を学習することを目的とした、協調型PAC学習の亜種について研究する。
データ分布がより弱い実現可能性の仮定を満たす場合、サンプル効率の学習は依然として可能であることを示す。
論文 参考訳(メタデータ) (2024-02-16T04:32:22Z) - Comparing Feature Importance and Rule Extraction for Interpretability on
Text Data [7.893831644671976]
異なる手法を用いることで、予想外の異なる説明がもたらされることが示される。
この効果を定量化するために,異なる手法による説明を比較するための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-07-04T13:54:55Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - Instance Similarity Learning for Unsupervised Feature Representation [83.31011038813459]
教師なし特徴表現のための例類似性学習(ISL)手法を提案する。
我々はGAN(Generative Adversarial Networks)を用いて、基礎となる特徴多様体をマイニングする。
画像分類実験は, 最先端手法と比較して, 提案手法の優位性を示した。
論文 参考訳(メタデータ) (2021-08-05T16:42:06Z) - Investigate the Essence of Long-Tailed Recognition from a Unified
Perspective [11.080317683184363]
深層認識モデルは、カテゴリ間の重い不均衡なサンプル数のために、長い尾のデータ分布に悩まされることが多い。
本研究では,長い尾の認識が標本数とカテゴリの類似性の両方に悩まされていることを示す。
論文 参考訳(メタデータ) (2021-07-08T11:08:40Z) - An Empirical Comparison of Instance Attribution Methods for NLP [62.63504976810927]
本研究は,トレーニングサンプルの重要性に関して,異なるインスタンス属性が一致した度合いを評価する。
単純な検索メソッドは、グラデーションベースの方法によって識別されたものと異なるトレーニングインスタンスを生成する。
論文 参考訳(メタデータ) (2021-04-09T01:03:17Z) - Unsupervised Feature Learning by Cross-Level Instance-Group
Discrimination [68.83098015578874]
我々は、インスタンスグループ化ではなく、クロスレベルな識別によって、インスタンス間の類似性を対照的な学習に統合する。
CLDは、教師なし学習を、自然データや現実世界のアプリケーションに効果的に近づける。
セルフスーパービジョン、セミスーパービジョン、トランスファーラーニングベンチマークに関する新たな最先端技術は、報告されたすべてのパフォーマンスでMoCo v2とSimCLRを上回っている。
論文 参考訳(メタデータ) (2020-08-09T21:13:13Z) - Few-shot Visual Reasoning with Meta-analogical Contrastive Learning [141.2562447971]
本稿では,類似推論に頼って,数ショット(または低ショット)の視覚推論問題を解くことを提案する。
両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
論文 参考訳(メタデータ) (2020-07-23T14:00:34Z) - Pairwise Supervision Can Provably Elicit a Decision Boundary [84.58020117487898]
類似性学習は、パターンのペア間の関係を予測することによって有用な表現を引き出す問題である。
類似性学習は、決定境界を直接引き出すことによって二項分類を解くことができることを示す。
論文 参考訳(メタデータ) (2020-06-11T05:35:16Z) - Building and Interpreting Deep Similarity Models [0.0]
そこで本稿では,入力機能の観点から説明することで類似性を解釈する手法を提案する。
我々は,2組の入力特徴に対して類似度スコアを系統的に分解する,スケーラブルで理論的に確立された手法であるBiLRPを開発した。
論文 参考訳(メタデータ) (2020-03-11T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。