論文の概要: Feature Subset Weighting for Distance-based Supervised Learning through Choquet Integration
- arxiv url: http://arxiv.org/abs/2504.00624v1
- Date: Tue, 01 Apr 2025 10:23:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 15:43:09.0394
- Title: Feature Subset Weighting for Distance-based Supervised Learning through Choquet Integration
- Title(参考訳): ショケット統合による遠隔教師付き学習のための特徴部分集合重み付け
- Authors: Adnan Theerens, Yvan Saeys, Chris Cornelis,
- Abstract要約: 本稿では,遠隔教師あり学習のための単調測度を用いた特徴量重み付けを提案する。
チョーケ積分は、これらの重みを包含する距離計量を定義するために用いられる。
提案手法は, 重複・強相関の付加により, 距離が影響を受けないことを確実にするものである。
- 参考スコア(独自算出の注目度): 2.1943338072179444
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces feature subset weighting using monotone measures for distance-based supervised learning. The Choquet integral is used to define a distance metric that incorporates these weights. This integration enables the proposed distances to effectively capture non-linear relationships and account for interactions both between conditional and decision attributes and among conditional attributes themselves, resulting in a more flexible distance measure. In particular, we show how this approach ensures that the distances remain unaffected by the addition of duplicate and strongly correlated features. Another key point of this approach is that it makes feature subset weighting computationally feasible, since only $m$ feature subset weights should be calculated each time instead of calculating all feature subset weights ($2^m$), where $m$ is the number of attributes. Next, we also examine how the use of the Choquet integral for measuring similarity leads to a non-equivalent definition of distance. The relationship between distance and similarity is further explored through dual measures. Additionally, symmetric Choquet distances and similarities are proposed, preserving the classical symmetry between similarity and distance. Finally, we introduce a concrete feature subset weighting distance, evaluate its performance in a $k$-nearest neighbors (KNN) classification setting, and compare it against Mahalanobis distances and weighted distance methods.
- Abstract(参考訳): 本稿では,遠隔教師あり学習のための単調測度を用いた特徴量重み付けを提案する。
チョーケ積分は、これらの重みを包含する距離計量を定義するために用いられる。
この統合により、提案した距離は、非線形関係を効果的に把握し、条件属性と決定属性の間の相互作用と条件属性自体の相互作用を考慮し、より柔軟な距離測定を行うことができる。
特に, この手法が, 重複・強相関の付加により, 距離が影響を受けないことを確実にする方法を示す。
このアプローチのもう一つの重要な点は、特徴部分集合の重み付けを計算的に実現可能にすることである。なぜなら、全ての特徴部分集合の重み付け(2^m$)を計算する代わりに、各時間に$m$のみ特徴部分集合の重み付けを計算すべきであり、$m$は属性の数である。
次に、類似度の測定にChoquet積分を用いることが、距離の非等価な定義につながるかについても検討する。
距離と類似性の関係はさらに二重測度によって調べられる。
さらに、対称なチョケット距離と類似性を提案し、類似性と距離の間の古典的な対称性を保存する。
最後に,具体的な特徴量の加重距離を導入し,その性能をKNN(Kk$-nearest neighbors)分類設定で評価し,マハラノビス距離と重み付き距離法と比較した。
関連論文リスト
- Learning Temporal Distances: Contrastive Successor Features Can Provide a Metric Structure for Decision-Making [66.27188304203217]
時間的距離は、計画、制御、強化学習のための多くのアルゴリズムの中心にある。
このような時間的距離を設定内で定義しようとする以前の試みは、重要な制限によって妨げられている。
比較学習によって学習された後継特徴が,三角形の不等式を満たす時間的距離を形成することを示す。
論文 参考訳(メタデータ) (2024-06-24T19:36:45Z) - Fuzzy Rough Choquet Distances for Classification [0.6445605125467574]
本稿では,ファジィラフセットに基づく新しいチョケット距離を提案する。
提案手法は,ファジィ粗集合理論から得られる属性情報とチョーケ積分の柔軟性を組み合わせたものである。
論文 参考訳(メタデータ) (2024-03-18T14:53:48Z) - Computing the Distance between unbalanced Distributions -- The flat
Metric [0.0]
平坦計量は、よく知られたワッサーシュタイン距離 W1 を、分布が不等質量である場合に一般化する。
この手法のコアはニューラルネットワークに基づいて、2つの測度間の距離を実現する最適なテスト関数を決定する。
論文 参考訳(メタデータ) (2023-08-02T09:30:22Z) - Robust Ellipsoid Fitting Using Axial Distance and Combination [15.39157287924673]
ランダムサンプルコンセンサス(RANSAC)では、楕円体フィッティングの問題は点からモデルまでの距離を最小化する問題として定式化することができる。
代数的距離から変換される軸距離と呼ばれる新しい距離計量を提案する。
軸方向距離とサンプソン距離の組合せを用いて, 試料集束型楕円体フィッティング法を提案する。
論文 参考訳(メタデータ) (2023-04-02T11:52:33Z) - Counting Like Human: Anthropoid Crowd Counting on Modeling the
Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は 密度マップを補強して 計数結果を得るために統合する。
これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-02T07:00:53Z) - Concrete Score Matching: Generalized Score Matching for Discrete Data [109.12439278055213]
コンクレトスコア(Concrete score)とは、個別の設定のためのスコア(ステイン)の一般化である。
コンクレトスコアマッチング(Concrete Score Matching)は、サンプルからこのようなスコアを学習するフレームワークである。
論文 参考訳(メタデータ) (2022-11-02T00:41:37Z) - Generalized quantum similarity learning [0.0]
我々は、同じ次元を持たないデータ間のタスク依存(a)対称類似性を学習するための量子ネットワーク(GQSim)を提案する。
この手法を用いて導出された類似度尺度が$(epsilon,gamma,tau)$-goodであることを示す。
論文 参考訳(メタデータ) (2022-01-07T03:28:19Z) - Tangent Space and Dimension Estimation with the Wasserstein Distance [10.118241139691952]
ユークリッド空間の滑らかなコンパクト部分多様体の近くで独立にサンプリングされた点の集合を考える。
我々は、その多様体の次元と接空間の両方を推定するために必要なサンプル点の数について数学的に厳密な境界を与える。
論文 参考訳(メタデータ) (2021-10-12T21:02:06Z) - Kernel distance measures for time series, random fields and other
structured data [71.61147615789537]
kdiffは、構造化データのインスタンス間の距離を推定するためのカーネルベースの新しい尺度である。
これはインスタンス間の自己類似性と交差類似性の両方を考慮し、距離分布の低い定量値を用いて定義される。
kdiffをクラスタリングと分類問題のための距離尺度として用いた分離性条件について,いくつかの理論的結果が得られた。
論文 参考訳(メタデータ) (2021-09-29T22:54:17Z) - Towards Certified Robustness of Distance Metric Learning [53.96113074344632]
我々は,距離学習アルゴリズムの一般化とロバスト性を改善するために,入力空間に逆のマージンを付与することを提唱する。
アルゴリズム的ロバスト性の理論手法を用いることにより,拡張マージンは一般化能力に有益であることを示す。
論文 参考訳(メタデータ) (2020-06-10T16:51:53Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。