論文の概要: PL-$k$NN: A Parameterless Nearest Neighbors Classifier
- arxiv url: http://arxiv.org/abs/2209.12647v1
- Date: Mon, 26 Sep 2022 12:52:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 16:59:16.510316
- Title: PL-$k$NN: A Parameterless Nearest Neighbors Classifier
- Title(参考訳): PL-$k$NN:パラメータレスに近い近隣の分類器
- Authors: Danilo Samuel Jodas, Leandro Aparecido Passos, Ahsan Adeel, Jo\~ao
Paulo Papa
- Abstract要約: k$-Nearest Neighborsは、多くの問題で使われている最も効果的で簡単なモデルの1つである。
本稿では、$k$の値を定義する必要性を回避した$k$-Nearest Neighbors分類器を提案する。
- 参考スコア(独自算出の注目度): 0.24499092754102875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Demands for minimum parameter setup in machine learning models are desirable
to avoid time-consuming optimization processes. The $k$-Nearest Neighbors is
one of the most effective and straightforward models employed in numerous
problems. Despite its well-known performance, it requires the value of $k$ for
specific data distribution, thus demanding expensive computational efforts.
This paper proposes a $k$-Nearest Neighbors classifier that bypasses the need
to define the value of $k$. The model computes the $k$ value adaptively
considering the data distribution of the training set. We compared the proposed
model against the standard $k$-Nearest Neighbors classifier and two
parameterless versions from the literature. Experiments over 11 public datasets
confirm the robustness of the proposed approach, for the obtained results were
similar or even better than its counterpart versions.
- Abstract(参考訳): 機械学習モデルにおける最小パラメータ設定の要求は、時間を要する最適化プロセスを避けるために望ましい。
k$-Nearest Neighborsは、多くの問題で最も効果的で簡単なモデルの1つである。
その性能はよく知られているが、特定のデータ分散に対してk$の値が必要であり、高価な計算作業を必要とする。
本稿では、$k$の値を定義する必要性を回避した$k$-Nearest Neighbors分類器を提案する。
モデルは、トレーニングセットのデータ分布を考慮して、$k$値を適応的に計算する。
提案モデルを標準の$k$-nearest neighbors分類器と2つのパラメータなしバージョンと比較した。
11の公開データセットを対象とした実験では,提案手法の堅牢性を確認した。
関連論文リスト
- Adaptive $k$-nearest neighbor classifier based on the local estimation of the shape operator [49.87315310656657]
我々は, 局所曲率をサンプルで探索し, 周辺面積を適応的に定義する適応型$k$-nearest(kK$-NN)アルゴリズムを提案する。
多くの実世界のデータセットから、新しい$kK$-NNアルゴリズムは、確立された$k$-NN法と比較してバランスの取れた精度が優れていることが示されている。
論文 参考訳(メタデータ) (2024-09-08T13:08:45Z) - Is $F_1$ Score Suboptimal for Cybersecurity Models? Introducing $C_{score}$, a Cost-Aware Alternative for Model Assessment [1.747623282473278]
偽陽性と偽陰性は等しくなく、応用に依存している。
サイバーセキュリティアプリケーションでは、攻撃を検知しないコストは、攻撃として良心的な活動をマークすることとは大きく異なる。
我々は、精度とリコールに基づいて、新しいコスト対応メトリックである$C_score$を提案する。
論文 参考訳(メタデータ) (2024-07-19T21:01:19Z) - Transfer Q Star: Principled Decoding for LLM Alignment [105.89114186982972]
Transfer $Q*$は、ベースラインモデルを通してターゲット報酬$r$の最適値関数を推定する。
提案手法は, 従来のSoTA法で観測された準最適差を著しく低減する。
論文 参考訳(メタデータ) (2024-05-30T21:36:12Z) - Marich: A Query-efficient Distributionally Equivalent Model Extraction
Attack using Public Data [10.377650972462654]
Black-boxモデル抽出攻撃は、公開データセットから予測APIを通じてターゲットMLモデルに最小限のクエリを送信することができる。
我々は,アクティブサンプリングに基づくクエリ選択アルゴリズムであるMarichを用いて,情報的かつ分布的に等価なターゲットのレプリカを作成する。
Marich氏は、真のモデルの精度を60-95%で達成したモデルを抽出し、公開データセットから$sim 1,000 - 8,500$クエリを使用する。
論文 参考訳(メタデータ) (2023-02-16T18:20:27Z) - N-Gram Nearest Neighbor Machine Translation [101.25243884801183]
本稿では, 自己回帰翻訳(AT)モデルと非自己回帰翻訳(NAT)モデルの両方に適用可能な, モデルに依存しない新しいn$-gram近傍検索手法を提案する。
提案手法は,ATモデルおよびNATモデルおよび一般のドメイン適応翻訳タスクにおいて,トークンレベル法を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2023-01-30T13:19:19Z) - Bayesian Target-Vector Optimization for Efficient Parameter
Reconstruction [0.0]
対象ベクトル最適化方式を導入し,モデル関数のコントリビューションのすべてについて検討し,パラメータ再構成問題に特に適している。
また、実際のモデル関数の観測がほとんどない正確な不確実性推定を決定できる。
論文 参考訳(メタデータ) (2022-02-23T15:13:32Z) - Developing and Improving Risk Models using Machine-learning Based
Algorithms [6.245537312562826]
本研究の目的は,ビジネスの欠陥を分類する優れたリスクモデルを開発することである。
この解析の理論的根拠は、まず正則化により良質な基底二項分類器を得ることである。
優れたベース分類器上で、バッジやブーストを含む2つのモデルアンサンブルアルゴリズムを実行し、さらなるモデル改善を行う。
論文 参考訳(メタデータ) (2020-09-09T20:38:00Z) - AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。
提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文 参考訳(メタデータ) (2020-08-16T11:36:11Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z) - Learning Gaussian Graphical Models via Multiplicative Weights [54.252053139374205]
乗算重み更新法に基づいて,Klivans と Meka のアルゴリズムを適用した。
アルゴリズムは、文献の他のものと質的に類似したサンプル複雑性境界を楽しみます。
ランタイムが低い$O(mp2)$で、$m$サンプルと$p$ノードの場合には、簡単にオンライン形式で実装できる。
論文 参考訳(メタデータ) (2020-02-20T10:50:58Z) - Learning the Stein Discrepancy for Training and Evaluating Energy-Based
Models without Sampling [30.406623987492726]
非正規化密度モデルの評価と訓練のための新しい手法を提案する。
データ密度$p(x)$とデータのベクトル関数で定義されるモデル密度$q(x)$とのスタイン差を推定する。
これは、既存の手法を高次元データで上回る、新しい適合性テストをもたらす。
論文 参考訳(メタデータ) (2020-02-13T16:39:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。