論文の概要: Regularization-Based Methods for Ordinal Quantification
- arxiv url: http://arxiv.org/abs/2310.09210v1
- Date: Fri, 13 Oct 2023 16:04:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 12:09:14.206208
- Title: Regularization-Based Methods for Ordinal Quantification
- Title(参考訳): 正規化に基づく順序数量化法
- Authors: Mirko Bunse, Alejandro Moreo, Fabrizio Sebastiani, Martin Senz
- Abstract要約: 順序の場合、すなわち n>2 クラスの集合上で全順序が定義される場合について研究する。
本稿では,従来のアルゴリズムよりも優れた正規化OQアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 49.606912965922504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quantification, i.e., the task of training predictors of the class prevalence
values in sets of unlabeled data items, has received increased attention in
recent years. However, most quantification research has concentrated on
developing algorithms for binary and multiclass problems in which the classes
are not ordered. Here, we study the ordinal case, i.e., the case in which a
total order is defined on the set of n>2 classes. We give three main
contributions to this field. First, we create and make available two datasets
for ordinal quantification (OQ) research that overcome the inadequacies of the
previously available ones. Second, we experimentally compare the most important
OQ algorithms proposed in the literature so far. To this end, we bring together
algorithms proposed by authors from very different research fields, such as
data mining and astrophysics, who were unaware of each others' developments.
Third, we propose a novel class of regularized OQ algorithms, which outperforms
existing algorithms in our experiments. The key to this gain in performance is
that our regularization prevents ordinally implausible estimates, assuming that
ordinal distributions tend to be smooth in practice. We informally verify this
assumption for several real-world applications.
- Abstract(参考訳): 近年,未ラベルデータ項目の集合におけるクラス有病率の予測値のトレーニングタスクである量子化が注目されている。
しかし、ほとんどの定量化研究は、クラスが順序付けられていない二進問題と多進問題のためのアルゴリズムの開発に集中している。
ここでは、順序数の場合、すなわち n>2 のクラスの集合上で全順序が定義される場合について研究する。
私たちはこの分野に3つの主要な貢献をします。
まず、既に利用可能なものの不整合を克服する、順序量子化(OQ)研究のための2つのデータセットを作成し、作成する。
第2に,これまでの文献で提案されている最も重要なoqアルゴリズムを実験的に比較する。
この目的のために、我々は、データマイニングや天体物理学など、非常に異なる研究分野の著者によって提案されたアルゴリズムをまとめる。
第3に,既存のアルゴリズムよりも優れる正規化oqアルゴリズムの新たなクラスを提案する。
このパフォーマンス向上の鍵は、我々の正規化が、順序分布が実際には滑らかな傾向があると仮定して、順序的に予測できないことを防いでいることです。
いくつかの実世界のアプリケーションでこの仮定を非公式に検証します。
関連論文リスト
- Absolute Ranking: An Essential Normalization for Benchmarking Optimization Algorithms [0.0]
多くの問題における最適化アルゴリズムの性能評価は,数値スケールの多様性が原因で複雑な問題となる。
本稿では,この問題を広範囲に検討し,根本原因の根本原因を徹底的に解析する上で説得力のある事例を提示する。
本研究では,「絶対ランク付け」と呼ばれる新しい数学的モデルとサンプリングに基づく計算手法を提案する。
論文 参考訳(メタデータ) (2024-09-06T00:55:03Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Towards Better Out-of-Distribution Generalization of Neural Algorithmic
Reasoning Tasks [51.8723187709964]
ニューラルネットワーク推論タスクのOOD一般化について検討する。
目標は、ディープニューラルネットワークを使用して入出力ペアからアルゴリズムを学ぶことである。
論文 参考訳(メタデータ) (2022-11-01T18:33:20Z) - HARRIS: Hybrid Ranking and Regression Forests for Algorithm Selection [75.84584400866254]
両アプローチの強みを両アプローチの弱さを緩和しつつ組み合わせ, 特殊林を利用した新しいアルゴリズムセレクタを提案する。
HARRISの決定は、ハイブリッドランキングと回帰損失関数に基づいて最適化された木を作成する森林モデルに基づいている。
論文 参考訳(メタデータ) (2022-10-31T14:06:11Z) - Stochastic Differentially Private and Fair Learning [7.971065005161566]
我々は、収束することが保証されるフェアラーニングのための最初の微分プライベートアルゴリズムを提供する。
われわれのフレームワークは、人口格差や均等化オッズなど、さまざまな公平さを許容できるほど柔軟である。
本アルゴリズムは,複数の(非バイナリ)機密属性を持つ非バイナリ分類タスクに適用可能である。
論文 参考訳(メタデータ) (2022-10-17T06:54:57Z) - Rank-based Non-dominated Sorting [0.0]
我々は、高額な支配比較を避けるために、ソート安定性と順序情報を利用した非支配的なソート手法であるランクソートを導入する。
2つのアルゴリズム的変種が提案されている: 1つはRandOrdinal (RO) で、支配性を決定するために順序付き階数比較(英語版)(ordinal rank comparisons)を用いており、O(N) 空間を必要とする。
NSGA2アルゴリズムと合成ベンチマークを用いた実験シミュレーションにおいて,提案手法の有効性を他の手法と比較した。
論文 参考訳(メタデータ) (2022-03-25T13:59:42Z) - A Comparative Evaluation of Quantification Methods [3.1499058381005227]
量子化は、データセット内のクラス分布を予測する問題を表す。
近年,様々なアルゴリズムが提案されている。
40以上のデータセットで24の異なるメソッドを比較します。
論文 参考訳(メタデータ) (2021-03-04T18:51:06Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z) - Learning to Accelerate Heuristic Searching for Large-Scale Maximum
Weighted b-Matching Problems in Online Advertising [51.97494906131859]
バイパルタイトbマッチングはアルゴリズム設計の基本であり、経済市場や労働市場などに広く適用されている。
既存の正確で近似的なアルゴリズムは、通常そのような設定で失敗する。
我々は、以前の事例から学んだ知識を活用して、新しい問題インスタンスを解決するtextttNeuSearcherを提案する。
論文 参考訳(メタデータ) (2020-05-09T02:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。