論文の概要: SmartIterator: Visual Analytics Workflows for Supervising Unsupervised Data Grouping
- arxiv url: http://arxiv.org/abs/2605.28219v1
- Date: Wed, 27 May 2026 09:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.937155
- Title: SmartIterator: Visual Analytics Workflows for Supervising Unsupervised Data Grouping
- Title(参考訳): SmartIterator: 教師なしデータグループを監視するためのビジュアル分析ワークフロー
- Authors: Gennady Andrienko, Natalia Andrienko,
- Abstract要約: emphSmartIterator(SI)は、グループ化結果を一級分析対象として扱う視覚分析手法である。
emphIteraScope(IS)は、品質メトリックチャートとカラーエンコーディングを組み合わせたコーディネートされたビジュアルディスプレイであり、Sankeyスタイルのトランジションフローを埋め込んだ1Dグループと、HDBSCAN検出されたリカレントアーチタイプを埋め込んだ2Dグループである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unsupervised learning methods -- topic modeling, partition-based and density-based clustering -- produce data groupings without human guidance, yet choosing and evaluating those groupings should not itself be unsupervised. We present \emph{SmartIterator}~(SI), a visual analytics approach that treats the full sequence of grouping results across a parameter sweep as a first-class analytical object. For each method family, SI provides a structured six-phase workflow that guides the analyst through systematic exploration of grouping results -- from quality-metric overview through transition-stability assessment, membership-confidence evaluation, content and context inspection, and recurrent-archetype verification to an informed decision -- building cumulative understanding of data structure along the way. The workflows are operationalized through \emph{IteraScope}~(IS), a coordinated visual display combining quality-metric charts with semantic color encoding, a 1D group embedding with Sankey-style transition flows and violin plots of membership confidence, a 2D group embedding with HDBSCAN-detected recurrent archetypes that highlights iterations capturing all persistent patterns, and domain-specific linked views for contextualized interpretation. We demonstrate the three workflows on: (1)~simulated social-media messages from the VAST Challenge 2011 (density-based clustering, validated against ground truth), (2)~EU population statistics across ${\sim}1\,500$ NUTS-3 regions (partition-based clustering), and (3)~30 years of IEEE VIS papers (NMF topic modeling). The workflows constitute the main contribution: they provide actionable, method-specific guidance for navigating parameter spaces, studying how data structure evolves across configurations, and grounding analytical understanding in domain context -- yielding knowledge about the data that no single ``best'' result can provide.
- Abstract(参考訳): トピックモデリング、パーティションベース、密度ベースのクラスタリングといった教師なしの学習手法は、人間の指導なしにデータグループ化を生成するが、それらのグループ化を選択して評価することは、それ自体は教師なしであってはならない。
本稿では,パラメータスイープ全体にわたるグループ化結果の全シーケンスを,一級解析対象として扱うビジュアル分析手法である \emph{SmartIterator}~(SI)を提案する。
各メソッドファミリに対して、SIは構造化された6フェーズのワークフローを提供し、グループ化結果の体系的な調査を通じてアナリストを導く。
ワークフローは \emph{IteraScope}~(IS)、品質メトリックチャートとセマンティックカラーエンコーディングを組み合わせたコーディネートされたビジュアルディスプレイ、サンキースタイルのトランジションフローとメンバーシップ信頼のヴァイオリンプロットを組み込んだ1Dグループ、HDBSCANで検出されたリカレントアーチタイプを組み込んだ2Dグループ、すべての永続的なパターンをキャプチャするイテレーションをハイライトするドメイン固有の関連ビューによって操作される。
1) VAST Challenge 2011(密度に基づくクラスタリング,地中真実に対する検証)からのシミュレーションされたソーシャルメディアメッセージ,(2)${\sim}1\,500$ NUTS-3リージョン(パーティションベースのクラスタリング)にわたるEU人口統計,(3) IEEE VIS論文(NMFトピックモデリング)の30年。
パラメータ空間をナビゲートするためのアクション可能なメソッド固有のガイダンス、構成全体にわたるデータ構造がどのように進化するかの研究、ドメインコンテキストにおける分析的理解の基盤 -- 単一の‘best’結果が提供できないデータに関する知識を提供する。
関連論文リスト
- Self-Evolving LLM Memory Extraction Across Heterogeneous Tasks [29.978367623377363]
我々は, 個人化, 問題解決, エージェントタスクにまたがる18の既存データセットを再利用したベンチマークである textbfBEHEMOTH を導入する。
我々の経験的分析は、全てのタスクカテゴリで単一の静的抽出プロンプトが支配的ではなく、既存の自己進化的最適化フレームワークは、もともと均質な分散のために設計されたもので、訓練タスクが不均一であるときに劣化することを確認した。
BEHEMOTHの実験では、CluEは不均一なタスクにまたがって効果的に一般化され、従来の自己進化フレームワークよりも一貫して優れていた。
論文 参考訳(メタデータ) (2026-04-13T15:15:54Z) - Bidirectional Learning of Facial Action Units and Expressions via Structured Semantic Mapping across Heterogeneous Datasets [85.74213192818668]
本研究では,異なるデータ領域下での双方向AU-FE学習のための構造化セマンティックマッピング(SSM)フレームワークを提案する。
SSMは、(1)動的AUとFEビデオから統一された顔表現を学習する共有視覚バックボーン、(2)テキストセマンティックプロトタイプ(TSP)モジュールによるセマンティックメディエーション、(3)顔行動符号化システムから派生した事前知識を組み込んだ動的優先マッピング(DPM)モジュールの3つの主要な構成要素から構成される。
論文 参考訳(メタデータ) (2026-04-12T09:08:32Z) - Simulating Organized Group Behavior: New Framework, Benchmark, and Analysis [49.796228341744076]
実践的な観点から,集団を集合体としてモデル化するタスクを提案する。
実世界8,052のコンテキスト-決定ペアを持つ44のエンティティを対象とするベンチマークであるGROVEを提案する。
また,包括的意思決定イベントを解釈可能,適応的,トレース可能な行動モデルに変換する構造解析フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-10T20:04:33Z) - Incorporating Attributes and Multi-Scale Structures for Heterogeneous Graph Contrastive Learning [8.889313669713918]
異種グラフのための新しいコントラスト学習フレームワーク(ASHGCL)を提案する。
ASHGCLには3つの異なるビューがあり、それぞれがノード属性、高階構造情報、低階構造情報に焦点を当てている。
本稿では,属性情報と属性情報を組み合わせた属性強化型正のサンプル選択手法を提案する。
論文 参考訳(メタデータ) (2025-03-18T05:15:21Z) - Exploiting Contextual Target Attributes for Target Sentiment
Classification [53.30511968323911]
TSCの既存のPTLMベースモデルは、1)PTLMをコンテキストエンコーダとして採用した微調整ベースモデル、2)テキスト/単語生成タスクに分類タスクを転送するプロンプトベースモデル、の2つのグループに分類される。
我々は,PTLM を TSC に活用する新たな視点として,言語モデリングと文脈的ターゲット属性による明示的ターゲットコンテキスト相互作用の利点を同時に活用する。
論文 参考訳(メタデータ) (2023-12-21T11:45:28Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - The Deep Latent Position Topic Model for Clustering and Representation
of Networks with Textual Edges [2.6334900941196087]
Deep-LPTMは、変分グラフ自動エンコーダアプローチに基づくモデルベースのクラスタリング戦略である。
Enron社のメールは分析され、その結果の視覚化が提示される。
論文 参考訳(メタデータ) (2023-04-14T07:01:57Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。