論文の概要: Fuzzy Jaccard Index: A robust comparison of ordered lists
- arxiv url: http://arxiv.org/abs/2008.02216v2
- Date: Tue, 5 Oct 2021 17:01:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 17:47:03.378958
- Title: Fuzzy Jaccard Index: A robust comparison of ordered lists
- Title(参考訳): Fuzzy Jaccard Index: 順序付きリストの堅牢な比較
- Authors: Matej Petkovi\'c, Bla\v{z} \v{S}krlj, Dragi Kocev, Nikola Simidjievski
- Abstract要約: Fuzzy Jaccard Index (FUJI) - ランク付けされた2つのリストの類似性を評価するためのスケール不変スコア。
FUJIスコアの特性に関する理論的知見を提供するとともに,その計算に有効なアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 7.052455038904316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose Fuzzy Jaccard Index (FUJI) -- a scale-invariant score for
assessment of the similarity between two ranked/ordered lists. FUJI improves
upon the Jaccard index by incorporating a membership function which takes into
account the particular ranks, thus producing both more stable and more accurate
similarity estimates. We provide theoretical insights into the properties of
the FUJI score as well as propose an efficient algorithm for computing it. We
also present empirical evidence of its performance on different synthetic
scenarios. Finally, we demonstrate its utility in a typical machine learning
setting -- comparing feature ranking lists relevant to a given machine learning
task. In real-life, and in particular high-dimensional domains, where only a
small percentage of the whole feature space might be relevant, a robust and
confident feature ranking leads to interpretable findings as well as efficient
computation and good predictive performance. In such cases, FUJI correctly
distinguishes between existing feature ranking approaches, while being more
robust and efficient than the benchmark similarity scores.
- Abstract(参考訳): ファジィjaccard index ( fuji) - 2つのランク付け/順序付けリスト間の類似性を評価するためのスケール不変スコア。
FUJIは、特定のランクを考慮に入れた会員関数を組み込むことで、ジャカードインデックスを改善し、より安定かつより正確な類似度推定を生成する。
FUJIスコアの特性に関する理論的知見を提供するとともに,その計算に有効なアルゴリズムを提案する。
また, 異なる合成シナリオにおいて, その性能を示す実証的な証拠を示す。
最後に、そのユーティリティを典型的な機械学習環境で実証し、与えられた機械学習タスクに関連する機能ランキングリストを比較します。
実生活、特に高次元領域において、機能空間全体のごく一部しか関係しないかもしれない場合、堅牢で自信のある機能ランキングは、効率的な計算と優れた予測性能だけでなく、解釈可能な発見につながる。
このような場合、FUJIは既存の機能ランキングのアプローチを正しく区別するが、ベンチマークの類似点よりも堅牢で効率的である。
関連論文リスト
- A Novel Ranking Scheme for the Performance Analysis of Stochastic Optimization Algorithms using the Principles of Severity [9.310464457958844]
複数の単目的最適化問題に対してアルゴリズムをランク付けする新しいランキング方式を提案する。
アルゴリズムの結果は、ロバストなブートストラップに基づく仮説テスト手法を用いて比較される。
論文 参考訳(メタデータ) (2024-05-31T19:35:34Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Efficient Relation-aware Scoring Function Search for Knowledge Graph
Embedding [37.24099392064309]
タスク対応スコアリング関数を設計するための知識グラフにAutoML技術が導入されている。
しかし、検索されたスコアリング関数の有効性は、まだ所望ほど良くありません。
本稿では,スーパーネットとして空間を符号化し,スーパーネットをワンショットで探索する効率的な代替最小化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-22T06:05:13Z) - On the Assessment of Benchmark Suites for Algorithm Comparison [7.501426386641256]
BBOBスイートのほとんどのベンチマーク関数は、高い難易度(最適化アルゴリズムと比較)と低い差別性を有することを示す。
我々は、ベンチマークスイートの設計を改善することを含む、ベンチマークにおけるIRTの潜在的な使用について論じる。
論文 参考訳(メタデータ) (2021-04-15T11:20:11Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - LSF-Join: Locality Sensitive Filtering for Distributed All-Pairs Set
Similarity Under Skew [58.21885402826496]
全ペアセットの類似性は、大規模で高次元のデータセットであっても広く使われているデータマイニングタスクである。
我々は,全対集合の類似性を近似するために,新しい分散アルゴリズム LSF-Join を提案する。
LSF-Joinは、小さな類似度閾値やスキュー入力セットであっても、最も近いペアを効率的に見つける。
論文 参考訳(メタデータ) (2020-03-06T00:06:20Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。