論文の概要: Impact of Load Demand Dataset Characteristics on Clustering Validation
Indices
- arxiv url: http://arxiv.org/abs/2108.01433v1
- Date: Tue, 3 Aug 2021 12:22:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-20 00:55:09.447728
- Title: Impact of Load Demand Dataset Characteristics on Clustering Validation
Indices
- Title(参考訳): クラスタリング検証指標における負荷需要データセット特性の影響
- Authors: Mayank Jain, Mukta Jain, Tarek AlSkaif, and Soumyabrata Dev
- Abstract要約: 需要プロファイルに基づく家庭のクラスタ化は、このような分析の主要な要素でありながら、重要な要素である。
様々なクラスタ検証指標 (CVI) が文献で提案されている。
本稿では,検証指標の推薦が,異なるデータ特性にどのように影響されているかを示す。
- 参考スコア(独自算出の注目度): 1.5749416770494706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the inclusion of smart meters, electricity load consumption data can be
fetched for individual consumer buildings at high temporal resolutions.
Availability of such data has made it possible to study daily load demand
profiles of the households. Clustering households based on their demand
profiles is one of the primary, yet a key component of such analysis. While
many clustering algorithms/frameworks can be deployed to perform clustering,
they usually generate very different clusters. In order to identify the best
clustering results, various cluster validation indices (CVIs) have been
proposed in the literature. However, it has been noticed that different CVIs
often recommend different algorithms. This leads to the problem of identifying
the most suitable CVI for a given dataset. Responding to the problem, this
paper shows how the recommendations of validation indices are influenced by
different data characteristics that might be present in a typical residential
load demand dataset. Furthermore, the paper identifies the features of data
that prefer/prohibit the use of a particular cluster validation index.
- Abstract(参考訳): スマートメーターを組み込むことで、個々の消費者ビルの電力消費データを高時間分解能で取得することができる。
このようなデータの可用性により、家庭の日々の負荷需要プロファイルを調査できるようになりました。
需要プロファイルに基づいて家庭をクラスタ化することが、このような分析の重要な要素である。
多くのクラスタリングアルゴリズム/フレームワークはクラスタリングを実行するためにデプロイできるが、通常は全く異なるクラスタを生成する。
最適なクラスタリング結果を特定するために,様々なクラスタ検証指標(cvis)が文献に提案されている。
しかし、異なるCVIがしばしば異なるアルゴリズムを推奨していることに気づいた。
これにより、与えられたデータセットに最も適したCVIを特定するという問題が生じる。
そこで本稿では,検証指標の推薦が,一般的な住宅用負荷需要データセットに存在するデータ特性にどのように影響するかを示す。
さらに,特定のクラスタ検証指標の使用を優先・禁止するデータの特徴を明らかにした。
関連論文リスト
- DREW : Towards Robust Data Provenance by Leveraging Error-Controlled Watermarking [58.37644304554906]
誤り訂正符号と透かしを用いたデータ検索法(DREW)を提案する。
DREWはランダムに参照データセットをクラスタ化し、各クラスタに独自のエラー制御された透かしキーを注入する。
関連するクラスタを特定した後、最も正確な一致を見つけるために、クラスタ内に埋め込みベクトル類似性検索を行う。
論文 参考訳(メタデータ) (2024-06-05T01:19:44Z) - Interpretable Clustering with the Distinguishability Criterion [0.4419843514606336]
本稿では,特定クラスタの分離可能性の定量化と推定クラスタ構成の検証を行うために,分散可能性基準と呼ばれるグローバルな基準を提案する。
本稿では、分散可能性基準と多くの一般的なクラスタリング手順を統合した損失関数に基づく計算フレームワークを提案する。
シミュレーション研究および実データアプリケーションに基づく包括的データ解析の結果とともに,これらの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-24T16:38:15Z) - On the Use of Relative Validity Indices for Comparing Clustering Approaches [0.6990493129893111]
相対妥当性指標はクラスタリング結果の評価と最適化に広く用いられている。
クラスタリングのための類似パラダイム(SP)を選択する際に、RVIを使う文献が増えつつある。
本研究では,SP選択のためのRVIの信頼性に関する総合的研究を行った。
論文 参考訳(メタデータ) (2024-04-16T07:39:54Z) - A Machine Learning-Based Framework for Clustering Residential
Electricity Load Profiles to Enhance Demand Response Programs [0.0]
実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
本稿では,実ケーススタディを通じて最適な負荷プロファイルを実現するために,機械学習に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-31T11:23:26Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Clustering performance analysis using new correlation based cluster
validity indices [0.0]
本研究では,2つのデータポイント間の実際の距離と,2つのポイントが位置するクラスタのセントロイド距離との相関に基づく2つの新しいクラスタ妥当性指標を開発した。
提案した指標は, 前述した弱点を克服する異なる数のクラスタにおいて, 常にいくつかのピークを発生させる。
論文 参考訳(メタデータ) (2021-09-23T06:59:41Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。