論文の概要: Advanced spectral clustering for heterogeneous data in credit risk monitoring systems
- arxiv url: http://arxiv.org/abs/2509.00546v1
- Date: Sat, 30 Aug 2025 16:06:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.280146
- Title: Advanced spectral clustering for heterogeneous data in credit risk monitoring systems
- Title(参考訳): 信用リスク監視システムにおける異種データのための高度なスペクトルクラスタリング
- Authors: Lu Han, Mengyan Li, Jiping Qiang, Zhi Su,
- Abstract要約: 異種データ中の有意なクラスタを特定するために,Advanced Spectral Clustering (ASC)を提案する。
スペクトルクラスタリング理論を異種データアプリケーションでブリッジすることにより、ASCは、30%低いデフォルトリスクを示す採用中心の中小企業のような意味のあるクラスタの識別を可能にする。
- 参考スコア(独自算出の注目度): 8.92280593592798
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Heterogeneous data, which encompass both numerical financial variables and textual records, present substantial challenges for credit monitoring. To address this issue, we propose Advanced Spectral Clustering (ASC), a method that integrates financial and textual similarities through an optimized weight parameter and selects eigenvectors using a novel eigenvalue-silhouette optimization approach. Evaluated on a dataset comprising 1,428 small and medium-sized enterprises (SMEs), ASC achieves a Silhouette score that is 18% higher than that of a single-type data baseline method. Furthermore, the resulting clusters offer actionable insights; for instance, 51% of low-risk firms are found to include the term 'social recruitment' in their textual records. The robustness of ASC is confirmed across multiple clustering algorithms, including k-means, k-medians, and k-medoids, with {\Delta}Intra/Inter < 0.13 and {\Delta}Silhouette Coefficient < 0.02. By bridging spectral clustering theory with heterogeneous data applications, ASC enables the identification of meaningful clusters, such as recruitment-focused SMEs exhibiting a 30% lower default risk, thereby supporting more targeted and effective credit interventions.
- Abstract(参考訳): 数値的財務変数とテキスト記録の両方を含む不均質なデータは、信用監視に重大な課題をもたらす。
この問題に対処するために、最適化された重みパラメータによって財務的およびテキスト的類似性を統合し、新しい固有値-シルエット最適化アプローチを用いて固有ベクトルを選択するAdvanced Spectral Clustering (ASC)を提案する。
1,428の中小企業(中小企業)からなるデータセットで評価した結果,ASCはSilhouetteスコアを単一のデータベースライン法よりも18%高いスコアで達成した。
さらに、結果として得られたクラスターは、例えば、リスクの低い企業の51%が、彼らのテキスト記録に「社会的採用」という言葉を含めているという、実用的な洞察を提供する。
ASCのロバスト性は、k-means、k-medians、k-medoidsを含む複数のクラスタリングアルゴリズムで確認され、 {\Delta}Intra/Inter < 0.13 および {\Delta}Silhouette Coefficient < 0.02 である。
スペクトルクラスタリング理論を異種データアプリケーションでブリッジすることにより、ASCは、30%低いデフォルトリスクを示す採用中心の中小企業などの有意義なクラスタの識別を可能にし、より標的的で効果的な信用介入を支援する。
関連論文リスト
- Silhouette-Guided Instance-Weighted k-means [2.56711111236449]
K-シル(K-Sil)は、シルエットのスコアに基づいて点を重み付けするk-meansアルゴリズムの改良である。
境界線やノイズの多い領域を抑えながら、適切にクラスタ化されたインスタンスを優先順位付けする。
これらの結果から、K-Silは高品質でよく分離されたクラスタを必要とするアプリケーションの原則的な代替品として確立される。
論文 参考訳(メタデータ) (2025-06-15T15:09:05Z) - AdaptiveMDL-GenClust: A Robust Clustering Framework Integrating Normalized Mutual Information and Evolutionary Algorithms [0.0]
我々は,最小記述長(MDL)原理と遺伝的最適化アルゴリズムを組み合わせたロバストクラスタリングフレームワークを提案する。
このフレームワークは、初期クラスタリングソリューションを生成するためのアンサンブルクラスタリングアプローチから始まり、MDL誘導評価関数を使用して洗練され、遺伝的アルゴリズムによって最適化される。
実験の結果,従来のクラスタリング手法を一貫して上回り,精度の向上,安定性の向上,バイアス低減を実現している。
論文 参考訳(メタデータ) (2024-11-26T20:26:14Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Dirichlet Process-based Robust Clustering using the Median-of-Means Estimator [16.774378814288806]
本稿では,モデルに基づく手法とセントロイド方式の長所を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
本手法は,クラスタリングの品質に及ぼすノイズの影響を緩和するが,同時にクラスタ数を推定する。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Differentially-Private Clustering of Easy Instances [67.04951703461657]
異なるプライベートクラスタリングでは、個々のデータポイントに関する情報を公開せずに、$k$のクラスタセンターを特定することが目標だ。
我々は、データが"簡単"である場合にユーティリティを提供する実装可能な差分プライベートクラスタリングアルゴリズムを提供する。
我々は、非プライベートクラスタリングアルゴリズムを簡単なインスタンスに適用し、結果をプライベートに組み合わせることのできるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-29T08:13:56Z) - A Multi-disciplinary Ensemble Algorithm for Clustering Heterogeneous
Datasets [0.76146285961466]
本稿では,社会階級ランキングとメタヒューリスティックアルゴリズムに基づく進化的クラスタリングアルゴリズム(ECAStar)を提案する。
ECAStarは、再共生進化演算子、レヴィ飛行最適化、いくつかの統計技術と統合されている。
従来の5つのアプローチに対してECAStarを評価する実験を行った。
論文 参考訳(メタデータ) (2021-01-01T07:20:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。