論文の概要: IPBC: An Interactive Projection-Based Framework for Human-in-the-Loop Semi-Supervised Clustering of High-Dimensional Data
- arxiv url: http://arxiv.org/abs/2601.18828v1
- Date: Sun, 25 Jan 2026 15:23:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:50.99504
- Title: IPBC: An Interactive Projection-Based Framework for Human-in-the-Loop Semi-Supervised Clustering of High-Dimensional Data
- Title(参考訳): IPBC:高次元データの半教師付きクラスタリングのための対話型投影ベースフレームワーク
- Authors: Mohammad Zare,
- Abstract要約: 高次元データセットは、科学と工業の領域でますます一般的になっている。
従来の次元削減技術は、限定的な解釈性を提供する静的な2Dまたは3D埋め込みを生成する。
本稿では,対話型プロジェクトベースクラスタリング(IPBC)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-dimensional datasets are increasingly common across scientific and industrial domains, yet they remain difficult to cluster effectively due to the diminishing usefulness of distance metrics and the tendency of clusters to collapse or overlap when projected into lower dimensions. Traditional dimensionality reduction techniques generate static 2D or 3D embeddings that provide limited interpretability and do not offer a mechanism to leverage the analyst's intuition during exploration. To address this gap, we propose Interactive Project-Based Clustering (IPBC), a framework that reframes clustering as an iterative human-guided visual analysis process. IPBC integrates a nonlinear projection module with a feedback loop that allows users to modify the embedding by adjusting viewing angles and supplying simple constraints such as must-link or cannot-link relationships. These constraints reshape the objective of the projection model, gradually pulling semantically related points closer together and pushing unrelated points further apart. As the projection becomes more structured and expressive through user interaction, a conventional clustering algorithm operating on the optimized 2D layout can more reliably identify distinct groups. An additional explainability component then maps each discovered cluster back to the original feature space, producing interpretable rules or feature rankings that highlight what distinguishes each cluster. Experiments on various benchmark datasets show that only a small number of interactive refinement steps can substantially improve cluster quality. Overall, IPBC turns clustering into a collaborative discovery process in which machine representation and human insight reinforce one another.
- Abstract(参考訳): 高次元データセットは、科学的、産業的な領域でますます一般的になっているが、距離メトリクスの有用性の低下や、低次元に投影されたときにクラスタが崩壊または重複する傾向のため、効果的にクラスタ化することは困難である。
従来の次元還元技術は静的な2Dまたは3D埋め込みを生成し、解釈可能性に制限を与え、探索中にアナリストの直感を活用するメカニズムを提供しない。
このギャップに対処するため、我々は、反復的なヒューマンガイドによる視覚分析プロセスとしてクラスタリングを再構成するフレームワークであるInteractive Project-Based Clustering (IPBC)を提案する。
IPBCは非線形プロジェクションモジュールとフィードバックループを統合しており、ユーザーは視角を調整することで埋め込みを修正できる。
これらの制約は射影モデルの目的を再形成し、意味的関連点を徐々に引き寄せ、非関連点をさらに引き離す。
プロジェクションがユーザインタラクションによってより構造化され表現されていくにつれて、最適化された2Dレイアウトで動作する従来のクラスタリングアルゴリズムは、より確実に異なるグループを識別することができる。
追加の説明責任コンポーネントは、検出された各クラスタを元のフィーチャースペースにマップし、解釈可能なルールや各クラスタを区別する機能ランキングを生成する。
さまざまなベンチマークデータセットの実験により、クラスタの品質を大幅に改善できるのは、少数のインタラクティブな改善ステップのみであることが示された。
全体として、IPBCはクラスタリングを、機械表現と人間の洞察が互いに強化する協調的な発見プロセスに変える。
関連論文リスト
- Deep Incomplete Multi-View Clustering via Hierarchical Imputation and Alignment [15.396375506151102]
本稿では,階層的な命令処理と4つのキーコンポーネントのアライメントを統合する,新しいディープIMVCフレームワークを提案する。
ベンチマーク実験により、我々のフレームワークは、様々なレベルの欠落下で優れたパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2026-01-14T00:46:00Z) - Towards Federated Clustering: A Client-wise Private Graph Aggregation Framework [57.04850867402913]
フェデレーションクラスタリングは、分散化されたラベルのないデータからパターンを抽出する課題に対処する。
本研究では,プライバシ保護のための知識共有媒体として,局所構造グラフを革新的に活用する新しいアルゴリズムSPP-FGCを提案する。
我々のフレームワークは最先端のパフォーマンスを実現し、認証可能なプライバシー保証を維持しつつ、フェデレーションベースラインよりも最大10%(NMI)のクラスタリング精度を向上させる。
論文 参考訳(メタデータ) (2025-11-14T03:05:22Z) - Unfolding ADMM for Enhanced Subspace Clustering of Hyperspectral Images [43.152314090830174]
本稿では,スパースサブスペースクラスタリングのためのマルチプライヤの交互方向法(ADMM)に基づく反復解法を展開させることにより,ハイパースペクトル画像(HSI)のための革新的なクラスタリングアーキテクチャを提案する。
提案手法は, 構造保存モジュールの一部として, K近傍近傍のアルゴリズムを用いて, HSIデータの構造特性をよく把握する。
論文 参考訳(メタデータ) (2024-04-10T15:51:46Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - One for all: A novel Dual-space Co-training baseline for Large-scale
Multi-View Clustering [42.92751228313385]
我々は、Dual-space Co-training Large-scale Multi-view Clustering (DSCMC)という新しいマルチビュークラスタリングモデルを提案する。
提案手法の主な目的は,2つの異なる空間における協調学習を活用することにより,クラスタリング性能を向上させることである。
我々のアルゴリズムは近似線形計算複雑性を持ち、大規模データセットへの適用が成功することを保証している。
論文 参考訳(メタデータ) (2024-01-28T16:30:13Z) - Subspace-Contrastive Multi-View Clustering [0.0]
本稿では,SCMC(Subspace-Contrastive Multi-View Clustering)アプローチを提案する。
ビュー固有のオートエンコーダを用いて、元のマルチビューデータを非線形構造を知覚するコンパクトな特徴にマッピングする。
提案モデルの有効性を実証するために,8つの課題データセットに対して比較実験を多数実施する。
論文 参考訳(メタデータ) (2022-10-13T07:19:37Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - Agglomerative Neural Networks for Multi-view Clustering [109.55325971050154]
本稿では,最適コンセンサスを近似する凝集分析法を提案する。
本稿では,制約付きラプラシアンランクに基づくANN(Agglomerative Neural Network)を用いて,マルチビューデータをクラスタリングする。
4つの一般的なデータセットに対する最先端のマルチビュークラスタリング手法に対する我々の評価は、ANNの有望なビュー・コンセンサス分析能力を示している。
論文 参考訳(メタデータ) (2020-05-12T05:39:10Z) - Learning to Cluster Faces via Confidence and Connectivity Estimation [136.5291151775236]
重複する部分グラフを多数必要とせず,完全に学習可能なクラスタリングフレームワークを提案する。
提案手法はクラスタリングの精度を大幅に向上させ,その上で訓練した認識モデルの性能を向上させるが,既存の教師付き手法に比べて桁違いに効率的である。
論文 参考訳(メタデータ) (2020-04-01T13:39:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。