論文の概要: Comparing Apples to Oranges: Learning Similarity Functions for Data
Produced by Different Distributions
- arxiv url: http://arxiv.org/abs/2208.12731v1
- Date: Fri, 26 Aug 2022 15:38:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-29 12:38:19.192055
- Title: Comparing Apples to Oranges: Learning Similarity Functions for Data
Produced by Different Distributions
- Title(参考訳): Appleとオレンジの比較:異なる分布から生成されたデータの類似性関数を学習する
- Authors: Leonidas Tsepenekas and Ivan Brugere
- Abstract要約: 本稿では,これらのグループ間の類似性関数を,限られた量の専門家のフィードバックのみを用いて学習するサンプリングフレームワークを提案する。
厳密な境界を持つ解析結果を示し、大規模な実験を通してアルゴリズムを実証的に検証する。
- 参考スコア(独自算出の注目度): 4.473594300236128
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Similarity functions measure how comparable pairs of elements are, and play a
key role in a wide variety of applications, e.g., Clustering problems and
considerations of Individual Fairness. However, access to an accurate
similarity function should not always be considered guaranteed. Specifically,
when the elements to be compared are produced by different distributions, or in
other words belong to different ``demographic'' groups, knowledge of their true
similarity might be very difficult to obtain. In this work, we present a
sampling framework that learns these across-groups similarity functions, using
only a limited amount of experts' feedback. We show analytical results with
rigorous bounds, and empirically validate our algorithms via a large suite of
experiments.
- Abstract(参考訳): 類似度関数は、要素の対が同等であるかを測り、例えばクラスタリング問題や個人フェアネスの考慮など、幅広いアプリケーションにおいて重要な役割を果たす。
しかし、正確な類似性関数へのアクセスは必ずしも保証されるべきではない。
具体的には、比較対象の要素が異なる分布によって生成される場合、あるいは別の「デムグラフィック」グループに属する場合、それらの真の類似性に関する知識を得るのは非常に困難である。
本稿では,これらグループ間の類似度関数を,少数の専門家のフィードバックのみを用いて学習するサンプリングフレームワークを提案する。
厳密な境界で解析結果を示し,大規模な実験によりアルゴリズムを実証的に検証した。
関連論文リスト
- Measuring similarity between embedding spaces using induced neighborhood graphs [10.056989400384772]
本稿では,ペアの項目表現の類似性を評価するための指標を提案する。
この結果から,類似度とゼロショット分類タスクの精度が類似度と相関していることが示唆された。
論文 参考訳(メタデータ) (2024-11-13T15:22:33Z) - Collaborative Learning with Different Labeling Functions [7.228285747845779]
我々は、$n$のデータ分布ごとに正確な分類器を学習することを目的とした、協調型PAC学習の亜種について研究する。
データ分布がより弱い実現可能性の仮定を満たす場合、サンプル効率の学習は依然として可能であることを示す。
論文 参考訳(メタデータ) (2024-02-16T04:32:22Z) - Attributable Visual Similarity Learning [90.69718495533144]
本稿では、画像間のより正確で説明可能な類似度測定のための帰属的視覚類似度学習(AVSL)フレームワークを提案する。
人間の意味的類似性認知に動機づけられた2つの画像とグラフとの類似性を表現するために,一般化された類似性学習パラダイムを提案する。
CUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、既存の深い類似性学習方法よりも大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2022-03-28T17:35:31Z) - Instance Similarity Learning for Unsupervised Feature Representation [83.31011038813459]
教師なし特徴表現のための例類似性学習(ISL)手法を提案する。
我々はGAN(Generative Adversarial Networks)を用いて、基礎となる特徴多様体をマイニングする。
画像分類実験は, 最先端手法と比較して, 提案手法の優位性を示した。
論文 参考訳(メタデータ) (2021-08-05T16:42:06Z) - Investigate the Essence of Long-Tailed Recognition from a Unified
Perspective [11.080317683184363]
深層認識モデルは、カテゴリ間の重い不均衡なサンプル数のために、長い尾のデータ分布に悩まされることが多い。
本研究では,長い尾の認識が標本数とカテゴリの類似性の両方に悩まされていることを示す。
論文 参考訳(メタデータ) (2021-07-08T11:08:40Z) - An Empirical Comparison of Instance Attribution Methods for NLP [62.63504976810927]
本研究は,トレーニングサンプルの重要性に関して,異なるインスタンス属性が一致した度合いを評価する。
単純な検索メソッドは、グラデーションベースの方法によって識別されたものと異なるトレーニングインスタンスを生成する。
論文 参考訳(メタデータ) (2021-04-09T01:03:17Z) - Unsupervised Feature Learning by Cross-Level Instance-Group
Discrimination [68.83098015578874]
我々は、インスタンスグループ化ではなく、クロスレベルな識別によって、インスタンス間の類似性を対照的な学習に統合する。
CLDは、教師なし学習を、自然データや現実世界のアプリケーションに効果的に近づける。
セルフスーパービジョン、セミスーパービジョン、トランスファーラーニングベンチマークに関する新たな最先端技術は、報告されたすべてのパフォーマンスでMoCo v2とSimCLRを上回っている。
論文 参考訳(メタデータ) (2020-08-09T21:13:13Z) - Few-shot Visual Reasoning with Meta-analogical Contrastive Learning [141.2562447971]
本稿では,類似推論に頼って,数ショット(または低ショット)の視覚推論問題を解くことを提案する。
両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
論文 参考訳(メタデータ) (2020-07-23T14:00:34Z) - Pairwise Supervision Can Provably Elicit a Decision Boundary [84.58020117487898]
類似性学習は、パターンのペア間の関係を予測することによって有用な表現を引き出す問題である。
類似性学習は、決定境界を直接引き出すことによって二項分類を解くことができることを示す。
論文 参考訳(メタデータ) (2020-06-11T05:35:16Z) - Building and Interpreting Deep Similarity Models [0.0]
そこで本稿では,入力機能の観点から説明することで類似性を解釈する手法を提案する。
我々は,2組の入力特徴に対して類似度スコアを系統的に分解する,スケーラブルで理論的に確立された手法であるBiLRPを開発した。
論文 参考訳(メタデータ) (2020-03-11T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。