論文の概要: Multi-domain performance analysis with scores tailored to user preferences
- arxiv url: http://arxiv.org/abs/2512.08715v1
- Date: Tue, 09 Dec 2025 15:29:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:08.023054
- Title: Multi-domain performance analysis with scores tailored to user preferences
- Title(参考訳): ユーザの好みに合わせたスコアを用いたマルチドメインパフォーマンス分析
- Authors: Sébastien Piérard, Adrien Deliège, Marc Van Droogenbroeck,
- Abstract要約: 我々は、性能を確率測度(例えば、分類タスクの正規化混乱行列)と考える。
対応する重み付き平均は要約であることが知られており、要約された性能に重み付き算術平均に等しい値を割り当てる注目すべきスコアはわずかである。
ユーザ好みの関数として、最も簡単、最も難しい、先駆的、ボトルネックドメインという4つのドメインを厳格に定義します。
- 参考スコア(独自算出の注目度): 17.215680052668244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of algorithms, methods, and models tends to depend heavily on the distribution of cases on which they are applied, this distribution being specific to the applicative domain. After performing an evaluation in several domains, it is highly informative to compute a (weighted) mean performance and, as shown in this paper, to scrutinize what happens during this averaging. To achieve this goal, we adopt a probabilistic framework and consider a performance as a probability measure (e.g., a normalized confusion matrix for a classification task). It appears that the corresponding weighted mean is known to be the summarization, and that only some remarkable scores assign to the summarized performance a value equal to a weighted arithmetic mean of the values assigned to the domain-specific performances. These scores include the family of ranking scores, a continuum parameterized by user preferences, and that the weights to consider in the arithmetic mean depend on the user preferences. Based on this, we rigorously define four domains, named easiest, most difficult, preponderant, and bottleneck domains, as functions of user preferences. After establishing the theory in a general setting, regardless of the task, we develop new visual tools for two-class classification.
- Abstract(参考訳): アルゴリズム、手法、モデルの性能は、適用されたケースの分布に大きく依存する傾向にあり、この分布は応用領域に特有のものである。
いくつかの領域で評価を行った後、(重み付けされた)平均性能を計算し、この平均値で何が起こるのかを精査することが極めて有益である。
この目的を達成するために、確率的フレームワークを採用し、性能を確率測度(例えば、分類タスクの正規化混乱行列)とみなす。
対応する重み付き平均は要約であることが知られており、要約されたパフォーマンスに割り当てる注目すべきスコアは、ドメイン固有のパフォーマンスに割り当てられた値の重み付き算術平均に等しい値である。
これらのスコアには、ランキングスコアのファミリー、ユーザの嗜好によってパラメータ化された連続体、算術平均で考慮すべき重みがユーザの嗜好に依存することが含まれる。
これに基づいて、ユーザ嗜好の関数として、最も簡単、最も難しい、先駆的、ボトルネックドメインという4つのドメインを厳格に定義する。
一般的な設定で理論を確立した後、タスクにかかわらず、2クラス分類のための新しい視覚ツールを開発する。
関連論文リスト
- Foundations of the Theory of Performance-Based Ranking [10.89980029564174]
性能に基づくランク付けのための普遍理論の基礎を確立する。
ランキングスコアと呼ばれる普遍的なパラメトリックのスコアは、私たちの公理を満たすランクを確立するために使用できる。
2クラス分類の場合、ランキングスコアのファミリーは、よく知られたパフォーマンススコアを含んでいることを示す。
論文 参考訳(メタデータ) (2024-12-05T15:05:25Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - An Upper Bound for the Distribution Overlap Index and Its Applications [22.92968284023414]
本稿では,2つの確率分布間の重なり関数に対する計算容易な上限を提案する。
提案した境界は、一級分類と領域シフト解析においてその値を示す。
私たちの研究は、重複ベースのメトリクスの応用を拡大する大きな可能性を示しています。
論文 参考訳(メタデータ) (2022-12-16T20:02:03Z) - Gradient Matching for Domain Generalization [93.04545793814486]
機械学習システムの重要な要件は、見えないドメインに一般化する能力です。
ドメインの一般化を目標とするドメイン間勾配マッチングの目的を提案する。
我々は、その最適化を近似する単純な一階アルゴリズムfishを導出する。
論文 参考訳(メタデータ) (2021-04-20T12:55:37Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Stochastic batch size for adaptive regularization in deep network
optimization [63.68104397173262]
ディープラーニングフレームワークにおける機械学習問題に適用可能な適応正規化を取り入れた一階最適化アルゴリズムを提案する。
一般的なベンチマークデータセットに適用した従来のネットワークモデルに基づく画像分類タスクを用いて,提案アルゴリズムの有効性を実証的に実証した。
論文 参考訳(メタデータ) (2020-04-14T07:54:53Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。