論文の概要: Discretizing Numerical Attributes: An Analysis of Human Perceptions
- arxiv url: http://arxiv.org/abs/2311.03278v1
- Date: Mon, 6 Nov 2023 17:20:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 13:36:58.816343
- Title: Discretizing Numerical Attributes: An Analysis of Human Perceptions
- Title(参考訳): 数値属性の離散化:人間の知覚の分析
- Authors: Minakshi Kaushik, Rahul Sharma, Dirk Draheim
- Abstract要約: 本研究の目的は,数値属性分割のためのベンチマーク手法を確立することである。
数値属性を分割する人間の知覚を解析し、これらの認識を、提案した2つの尺度から得られた結果と比較する。
収集した応答の分析から, 提案した測定値とほぼ一致した6,8.7%の人的応答が得られた。
- 参考スコア(独自算出の注目度): 3.9238169296957794
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning (ML) has employed various discretization methods to
partition numerical attributes into intervals. However, an effective
discretization technique remains elusive in many ML applications, such as
association rule mining. Moreover, the existing discretization techniques do
not reflect best the impact of the independent numerical factor on the
dependent numerical target factor. This research aims to establish a benchmark
approach for numerical attribute partitioning. We conduct an extensive analysis
of human perceptions of partitioning a numerical attribute and compare these
perceptions with the results obtained from our two proposed measures. We also
examine the perceptions of experts in data science, statistics, and engineering
by employing numerical data visualization techniques. The analysis of collected
responses reveals that $68.7\%$ of human responses approximately closely align
with the values generated by our proposed measures. Based on these findings,
our proposed measures may be used as one of the methods for discretizing the
numerical attributes.
- Abstract(参考訳): 機械学習(ML)は、数値属性を間隔に分割する様々な離散化手法を採用している。
しかし、アソシエーション・ルール・マイニングのような多くのML応用においては、効果的な離散化技術が依然として解明されている。
さらに, 既設の離散化手法は, 独立な数値係数が依存する数値的目標因子に与える影響を最善に反映しない。
本研究の目的は,数値属性分割のためのベンチマーク手法を確立することである。
数値属性を分割する人間の知覚を広範囲に分析し,提案する2つの尺度から得られた結果と比較した。
また,数値データ可視化技術を用いて,データ科学,統計学,工学の専門家の認識を調べる。
収集した応答の分析により, 提案した測定値とほぼ一致した6.8.7\%の人的応答が得られた。
これらの結果から,提案手法を数値属性の識別法の一つとして用いることができる。
関連論文リスト
- An Experimental Investigation into the Evaluation of Explainability
Methods [60.54170260771932]
この研究は、9つの最先端XAI法と3つのダミー法(例えば、ランダム・サリエンシ・マップ)に適用された14の異なるメトリクスを比較した。
実験の結果、これらの指標のどれが高い相関関係を示し、潜在的な冗長性を示している。
論文 参考訳(メタデータ) (2023-05-25T08:07:07Z) - Enriching Disentanglement: From Logical Definitions to Quantitative Metrics [59.12308034729482]
複雑なデータにおける説明的要素を遠ざけることは、データ効率の表現学習にとって有望なアプローチである。
論理的定義と量的指標の関連性を確立し, 理論的に根ざした絡み合いの指標を導出する。
本研究では,非交叉表現の異なる側面を分離することにより,提案手法の有効性を実証的に実証する。
論文 参考訳(メタデータ) (2023-05-19T08:22:23Z) - Towards Inferential Reproducibility of Machine Learning Research [16.223631948455797]
非決定性のいくつかの源は測定ノイズとみなすことができる。
研究結果の無視を強制するためにノイズを取り除く傾向は、実装レベルでは非決定論的である。
本稿では,データ特性との相互作用を含む分散の源泉を,機械学習評価の重要度と信頼性の分析に組み入れることを提案する。
論文 参考訳(メタデータ) (2023-02-08T13:47:00Z) - MAUVE Scores for Generative Models: Theory and Practice [95.86006777961182]
本報告では,テキストや画像の生成モデルで発生するような分布のペア間の比較尺度であるMAUVEについて述べる。
我々は、MAUVEが人間の文章の分布と現代のニューラル言語モデルとのギャップを定量化できることを発見した。
我々は、MAUVEが既存のメトリクスと同等以上の画像の既知の特性を識別できることを視覚領域で実証する。
論文 参考訳(メタデータ) (2022-12-30T07:37:40Z) - DDAC-SpAM: A Distributed Algorithm for Fitting High-dimensional Sparse
Additive Models with Feature Division and Decorrelation [16.232378903482143]
本稿では,高次元のスパース加法モデルの下で特徴を分割する分散統計学習アルゴリズムDDAC-SpAMを提案する。
提案アルゴリズムの有効性と有効性は, 合成データと実データの両方に関する理論的解析と実験結果によって実証される。
提案手法は, スパース加法モデルと, 広範囲の領域で有望な応用を実現するための実用的ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-16T18:31:03Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Learning Similarity Metrics for Numerical Simulations [29.39625644221578]
本稿では,様々な数値シミュレーションソースから得られるデータを比較するため,安定かつ一般化された指標(LSiM)をニューラルネットワークで計算する手法を提案する。
提案手法は,計量の数学的性質を動機としたシームズネットワークアーキテクチャを用いている。
論文 参考訳(メタデータ) (2020-02-18T20:11:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。