論文の概要: On pattern classification with weighted dimensions
- arxiv url: http://arxiv.org/abs/2510.20107v1
- Date: Thu, 23 Oct 2025 01:22:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:17.118185
- Title: On pattern classification with weighted dimensions
- Title(参考訳): 重み付き次元をもつパターン分類について
- Authors: Ayatullah Faruk Mollah,
- Abstract要約: 重み付け次元に基づく距離測定は、パターン解析において重要な考慮事項の1つである。
a) 距離測度基準と次元の重みの影響を可視化とともに詳細に分析し, (b) 各次元の新しい重み付け方式, (d) 様々な合成モデルと現実的データセットを用いたパターン分類について述べる。
- 参考スコア(独自算出の注目度): 2.4312421303410927
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Studies on various facets of pattern classification is often imperative while working with multi-dimensional samples pertaining to diverse application scenarios. In this notion, weighted dimension-based distance measure has been one of the vital considerations in pattern analysis as it reflects the degree of similarity between samples. Though it is often presumed to be settled with the pervasive use of Euclidean distance, plethora of issues often surface. In this paper, we present (a) a detail analysis on the impact of distance measure norms and weights of dimensions along with visualization, (b) a novel weighting scheme for each dimension, (c) incorporation of this dimensional weighting schema into a KNN classifier, and (d) pattern classification on a variety of synthetic as well as realistic datasets with the developed model. It has performed well across diverse experiments in comparison to the traditional KNN under the same experimental setups. Specifically, for gene expression datasets, it yields significant and consistent gain in classification accuracy (around 10%) in all cross-validation experiments with different values of k. As such datasets contain limited number of samples of high dimensions, meaningful selection of nearest neighbours is desirable, and this requirement is reasonably met by regulating the shape and size of the region enclosing the k number of reference samples with the developed weighting schema and appropriate norm. It, therefore, stands as an important generalization of KNN classifier powered by weighted Minkowski distance with the present weighting schema.
- Abstract(参考訳): パターン分類の様々な側面の研究は、様々な応用シナリオに関連する多次元サンプルを扱う際にしばしば必須である。
この概念において、重み付き次元に基づく距離測定は、サンプル間の類似度を反映するパターン解析において重要な考慮事項の1つである。
ユークリッド距離の広範利用によって解決されると推定されることが多いが、多くの問題がしばしば表面化している。
本稿では,本稿で紹介する。
(a)距離測定基準と寸法の重みの影響を可視化とともに詳細に分析すること。
(b)各次元の新しい重み付け方式
(c)この次元重み付けスキーマをKNN分類器に組み入れ、
(d) 開発されたモデルを用いて, 様々な合成および現実的なデータセットのパターン分類を行った。
同じ実験環境下では、従来のKNNと比較して、様々な実験でよく機能している。
具体的には、遺伝子発現データセットでは、kの異なる値を持つすべてのクロスバリデーション実験において、分類精度(約10%)において有意かつ一貫した利得が得られる。
このようなデータセットは、高次元のサンプル数が限られているため、近接する近傍の有意義な選択が望ましいものであり、この要求は、改良された重み付けスキーマと適切なノルムにより、参照サンプルのk個を囲む領域の形状と大きさを規制することによって、合理的に満たされる。
したがって、これは現在の重み付けスキーマでミンコフスキー距離を加味したKNN分類器の重要な一般化である。
関連論文リスト
- Maximum diversity, weighting and invariants of time series [0.0]
本稿では、重み付けの連続性、総和が等級の分布、および最大多様性に対応する変動に焦点を当てる。
近年の研究では、データやモデルパラメータの集合を表す点雲に等級理論を適用することで、等級とデータ分析の関連性も照らしている。
論文 参考訳(メタデータ) (2025-09-14T07:33:05Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Intrinsic Dimensionality Estimation within Tight Localities: A
Theoretical and Experimental Analysis [0.0]
そこで本研究では,20個のサンプル点からなるタイトな局所性に対しても安定な局所ID推定手法を提案する。
実験結果から,提案手法の偏差は比較的小さいが, 偏差は比較的小さく, 試料径は最先端の推定値よりもはるかに小さいことがわかった。
論文 参考訳(メタデータ) (2022-09-29T00:00:11Z) - Linear Discriminant Analysis with High-dimensional Mixed Variables [10.774094462083843]
本稿では,混合変数を用いた高次元観測の分類手法を提案する。
データを指数関数的に多くのセルに分割するという課題を克服する。
推定精度と誤分類率に関する結果が確立される。
論文 参考訳(メタデータ) (2021-12-14T03:57:56Z) - Post-mortem on a deep learning contest: a Simpson's paradox and the
complementary roles of scale metrics versus shape metrics [61.49826776409194]
我々は、ニューラルネットワーク(NN)モデルの一般化精度を予測するために、コンテストで公に利用可能にされたモデルのコーパスを分析する。
メトリクスが全体としてよく機能するが、データのサブパーティションではあまり機能しない。
本稿では,データに依存しない2つの新しい形状指標と,一連のNNのテスト精度の傾向を予測できるデータ依存指標を提案する。
論文 参考訳(メタデータ) (2021-06-01T19:19:49Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。