論文の概要: A multiple k-means cluster ensemble framework for clustering citation
trajectories
- arxiv url: http://arxiv.org/abs/2309.04949v1
- Date: Sun, 10 Sep 2023 07:10:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 15:28:44.242635
- Title: A multiple k-means cluster ensemble framework for clustering citation
trajectories
- Title(参考訳): 複数k-meansクラスタアンサンブルによる引用軌跡のクラスタリング
- Authors: Joyita Chakraborty, Dinesh K. Pradhan, Subrata Nandi
- Abstract要約: 本稿では,クラスタアンサンブル(クラスタアンサンブル)フレームワークを提案する。
Microsoft Academic Graph のデータから引用された 1,95,783 と 41,732 の論文が検討されている。
2つの異なるスパンの個々の軌道差について検討した。
- 参考スコア(独自算出の注目度): 0.11951741880981505
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Citation maturity time varies for different articles. However, the impact of
all articles is measured in a fixed window. Clustering their citation
trajectories helps understand the knowledge diffusion process and reveals that
not all articles gain immediate success after publication. Moreover, clustering
trajectories is necessary for paper impact recommendation algorithms. It is a
challenging problem because citation time series exhibit significant
variability due to non linear and non stationary characteristics. Prior works
propose a set of arbitrary thresholds and a fixed rule based approach. All
methods are primarily parameter dependent. Consequently, it leads to
inconsistencies while defining similar trajectories and ambiguities regarding
their specific number. Most studies only capture extreme trajectories. Thus, a
generalised clustering framework is required. This paper proposes a feature
based multiple k means cluster ensemble framework. 1,95,783 and 41,732 well
cited articles from the Microsoft Academic Graph data are considered for
clustering short term (10 year) and long term (30 year) trajectories,
respectively. It has linear run time. Four distinct trajectories are obtained
Early Rise Rapid Decline (2.2%), Early Rise Slow Decline (45%), Delayed Rise No
Decline (53%), and Delayed Rise Slow Decline (0.8%). Individual trajectory
differences for two different spans are studied. Most papers exhibit Early Rise
Slow Decline and Delayed Rise No Decline patterns. The growth and decay times,
cumulative citation distribution, and peak characteristics of individual
trajectories are redefined empirically. A detailed comparative study reveals
our proposed methodology can detect all distinct trajectory classes.
- Abstract(参考訳): 熟成期間は記事によって異なる。
しかし、すべての物品の影響は固定窓内で測定される。
引用軌道のクラスタ化は、知識拡散プロセスの理解に役立ち、全ての記事が出版後すぐに成功するわけではないことを明らかにする。
また,紙衝撃推薦アルゴリズムにはクラスタリングトラジェクトリが必要である。
非線型および非定常特性により、励起時系列が大きな変動を示すため、これは難しい問題である。
先行研究は任意のしきい値と一定の規則に基づくアプローチを提案する。
すべてのメソッドはパラメータ依存である。
その結果、類似の軌跡やその具体的な数に関する曖昧さを定義しながら、矛盾につながる。
ほとんどの研究は極端な軌道のみを捉えている。
したがって、一般化されたクラスタリングフレームワークが必要である。
本稿では,マルチk平均クラスタアンサンブルフレームワークを提案する。
microsoftのアカデミックグラフデータから引用された1,95,783 と 41,732 は、それぞれ短期(10年)と長期(30年)のトラジェクタをクラスタリングするために考慮される。
ランニングタイムは線形である。
4つの異なる軌道は、早期の上昇速度低下(2.2%)、早期の上昇速度低下(45%)、遅延速度低下(53%)、遅延速度低下(0.8%)である。
2つの異なるスパンの個々の軌道差について検討した。
ほとんどの論文では、早期上昇は緩やかに減少し、遅い上昇は減少パターンを示さない。
個々の軌道の成長と崩壊時間,累積励起分布,ピーク特性を経験的に再定義する。
詳細な比較研究により,提案手法がすべての軌跡クラスを検出できることが判明した。
関連論文リスト
- Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Generalized Representations Learning for Time Series Classification [28.230863650758447]
時間的複雑性は時系列分類における未知の潜在分布に起因していると主張する。
本研究では,ジェスチャー認識,音声コマンド認識,ウェアラブルストレスと感情検出,センサによる人間の活動認識に関する実験を行う。
論文 参考訳(メタデータ) (2022-09-15T03:36:31Z) - Beyond Duplicates: Towards Understanding and Predicting Link Types in
Issue Tracking Systems [8.916420423563478]
15のパブリックリポジトリで698,790件のリンクを607,208件調べました。
一般関係リンクは、重複や時間/因果関係よりも非常に高い推移性スコアを持つ。
論文 参考訳(メタデータ) (2022-04-27T12:57:12Z) - Time to Focus: A Comprehensive Benchmark Using Time Series Attribution
Methods [4.9449660544238085]
本論文は時系列解析といくつかの最先端属性手法のベンチマークに焦点をあてる。
本実験では, 勾配および摂動に基づく帰属法について検討した。
その結果,最も適した帰属法を選択することは,所望のユースケースと強く相関していることが示唆された。
論文 参考訳(メタデータ) (2022-02-08T10:06:13Z) - Relieving Long-tailed Instance Segmentation via Pairwise Class Balance [85.53585498649252]
長い尾のインスタンスセグメンテーションは、クラス間のトレーニングサンプルの極端な不均衡のために難しいタスクである。
尾のついたものに対して、(大多数のサンプルを含む)ヘッドクラスの深刻なバイアスを引き起こす。
そこで本研究では,学習中の予測嗜好を蓄積するために,学習中に更新される混乱行列上に構築された新しいPairwise Class Balance(PCB)手法を提案する。
論文 参考訳(メタデータ) (2022-01-08T07:48:36Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Uncertain Time Series Classification With Shapelet Transform [1.4467794332678539]
時系列分類は時系列データの分類を目的とした課題である。
ユークリッド距離に基づく新しい不確実な相似性尺度を提案する。
そこで,不確実な時系列の分類のための不確実な形状変換アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-03T14:46:01Z) - Unification of HDP and LDA Models for Optimal Topic Clustering of
Subject Specific Question Banks [55.41644538483948]
オンラインコースの人気が高まると、学者向けのコース関連クエリの数が増加することになる。
個々の質問に答えるのに費やす時間を短縮するために、それらをクラスタリングするのは理想的な選択です。
階層ディリクレプロセスを用いて、LDAモデルの実行に対して最適なトピック番号を入力します。
論文 参考訳(メタデータ) (2020-10-04T18:21:20Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z) - Complexity Measures and Features for Times Series classification [0.0]
本稿では,時系列分類問題に対する時系列構造に関する情報を抽出できる特徴セットを提案する。
提案手法の実験結果から, 最先端モデルの2次モデルと3次モデルとに統計的に有意な差は認められなかった。
論文 参考訳(メタデータ) (2020-02-27T11:08:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。