論文の概要: ClustRank: a Visual Quality Measure Trained on Perceptual Data for
Sorting Scatterplots by Cluster Patterns
- arxiv url: http://arxiv.org/abs/2106.00599v1
- Date: Tue, 1 Jun 2021 16:07:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-02 14:05:12.970004
- Title: ClustRank: a Visual Quality Measure Trained on Perceptual Data for
Sorting Scatterplots by Cluster Patterns
- Title(参考訳): clustrank: クラスタパターンによる散乱プロットのソートのための知覚データに基づく視覚品質尺度
- Authors: Mostafa Abbas, Ehsan Ullah, Abdelkader Baggag, Halima Bensmail,
Michael Sedlmair, Michael Aupetit
- Abstract要約: 我々はClustRankと呼ばれる新しいデータ駆動手法を提案する。
ClustRankは、2ガウスのクラスタパターン上の人間の判断を模倣することで、既存のVQMテクニックを改善している。
我々は、ゲノムワイド・アソシエーション研究のための親族データを分析することで、その利点を実証する。
- 参考スコア(独自算出の注目度): 8.206605918056852
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Visual quality measures (VQMs) are designed to support analysts by
automatically detecting and quantifying patterns in visualizations. We propose
a new data-driven technique called ClustRank that allows to rank scatterplots
according to visible grouping patterns. Our model first encodes scatterplots in
the parametric space of a Gaussian Mixture Model, and then uses a classifier
trained on human judgment data to estimate the perceptual complexity of
grouping patterns. The numbers of initial mixture components and final combined
groups determine the rank of the scatterplot. ClustRank improves on existing
VQM techniques by mimicking human judgments on two-Gaussian cluster patterns
and gives more accuracy when ranking general cluster patterns in scatterplots.
We demonstrate its benefit by analyzing kinship data for genome-wide
association studies, a domain in which experts rely on the visual analysis of
large sets of scatterplots. We make the three benchmark datasets and the
ClustRank VQM available for practical use and further improvements.
- Abstract(参考訳): ビジュアル品質測定(VQM)は、視覚化のパターンを自動的に検出し定量化することにより、アナリストを支援するように設計されている。
そこで本研究では,視認可能なグループ化パターンに従って散布確率をランク付けする,clustrankと呼ばれる新しいデータ駆動手法を提案する。
本モデルはまず, ガウス混合モデルのパラメトリック空間に散乱プロットを符号化し, 人間の判断データに基づいて学習した分類器を用いてグループ化パターンの知覚複雑性を推定する。
初期混合成分の個数と最終結合群は散乱指数の階数を決定する。
ClustRankは、2ガウスのクラスタパターン上の人間の判断を模倣することで既存のVQM技術を改善し、スパッタプロットで一般的なクラスタパターンをランク付けする際の精度を高める。
我々は,大規模な散布株の視覚的解析に専門家が依存する領域であるゲノムワイド・アソシエーション研究において,血縁関係データを分析することで,そのメリットを実証する。
3つのベンチマークデータセットとClustRank VQMを実用的な使用とさらなる改善のために利用しています。
関連論文リスト
- GAMformer: In-Context Learning for Generalized Additive Models [53.08263343627232]
本稿では,1つの前方パスにおけるGAMの形状関数を推定するために,文脈内学習を利用した最初の手法であるGAMformerを紹介する。
実験の結果,GAMformerは様々な分類ベンチマークにおいて,他の主要なGAMと同等に動作することがわかった。
論文 参考訳(メタデータ) (2024-10-06T17:28:20Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Anonymous Learning via Look-Alike Clustering: A Precise Analysis of
Model Generalization [18.03833857491361]
プライバシーを強化するための一般的なアプローチは、個々のデータではなく匿名データを使用してモデルをトレーニングすることである。
匿名クラスタセンターを用いたトレーニングモデルが一般化能力に与える影響について分析する。
ある種の高次元状態において、匿名クラスタセンターでのトレーニングは正規化として機能し、訓練されたモデルの一般化誤差を改善する。
論文 参考訳(メタデータ) (2023-10-06T04:52:46Z) - CLAMS: A Cluster Ambiguity Measure for Estimating Perceptual Variability
in Visual Clustering [23.625877882403227]
本稿では,クラスタアンビグニティ(Cluster Ambiguity)と呼ばれる視覚的クラスタリングを行う際の知覚的変動について検討する。
我々は,モノクローム散乱体におけるクラスタのあいまいさを自動的に予測する,データ駆動型視覚品質尺度であるCLAMSを紹介する。
論文 参考訳(メタデータ) (2023-08-01T04:46:35Z) - VAESim: A probabilistic approach for self-supervised prototype discovery [0.23624125155742057]
条件付き変分オートエンコーダに基づく画像階層化アーキテクチャを提案する。
我々は、連続した潜伏空間を用いて障害の連続を表現し、訓練中にクラスターを見つけ、画像/患者の成層に使用することができる。
本手法は,標準VAEに対して,分類タスクで測定されたkNN精度において,ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-25T17:55:31Z) - Learning Spatial Context with Graph Neural Network for Multi-Person Pose
Grouping [71.59494156155309]
イメージベース多人数ポーズ推定のためのボトムアップ手法は,キーポイント検出とグループ化の2段階からなる。
本研究では,グラフ分割問題としてグループ化タスクを定式化し,グラフニューラルネットワーク(gnn)を用いて親和性行列を学習する。
学習された幾何学に基づく親和性は、強固なキーポイント結合を達成するために外観に基づく親和性とさらに融合する。
論文 参考訳(メタデータ) (2021-04-06T09:21:14Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z) - Scaling Graph Clustering with Distributed Sketches [1.1011268090482575]
スペクトルクラスタリングにインスパイアされた手法として,ランダムな次元還元プロジェクションから得られた行列スケッチを用いる。
提案手法は,完全に動的なブロックモデルストリームが与えられた場合,性能の高いクラスタリング結果が得られる埋め込みを生成する。
また、ブロックモデルパラメータがその後の埋め込みの必要次元に与える影響についても検討し、ランダムなプロジェクションが分散メモリにおけるグラフクラスタリングの性能を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2020-07-24T17:38:04Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - Handling missing data in model-based clustering [0.0]
欠損データの存在下でガウス混合体を適合させる2つの方法を提案する。
どちらの手法もデータ拡張のためにモンテカルロ予測最大化アルゴリズムの変種を用いる。
提案手法はクラスタ同定と密度推定の両面で多重計算手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-06-04T15:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。