論文の概要: Understanding Concept Identification as Consistent Data Clustering
Across Multiple Feature Spaces
- arxiv url: http://arxiv.org/abs/2301.05525v1
- Date: Fri, 13 Jan 2023 13:08:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 14:18:34.061149
- Title: Understanding Concept Identification as Consistent Data Clustering
Across Multiple Feature Spaces
- Title(参考訳): 複数の特徴空間にまたがる一貫性データクラスタリングとしての概念同定
- Authors: Felix Lanfermannn, Sebastian Schmitt, Patricia Wollstadt
- Abstract要約: 概念識別は、すべての特徴の合同空間で類似したデザインインスタンスのグループを特定することを目的としている。
これらの特徴のいくつかを個別に考慮し、設計概念の質を評価することが望ましい。
そこで本研究では,概念同定をクラスタリングアルゴリズムの特別な形式として,幅広い潜在的な応用の可能性について考察する。
- 参考スコア(独自算出の注目度): 0.0483420384410068
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Identifying meaningful concepts in large data sets can provide valuable
insights into engineering design problems. Concept identification aims at
identifying non-overlapping groups of design instances that are similar in a
joint space of all features, but which are also similar when considering only
subsets of features. These subsets usually comprise features that characterize
a design with respect to one specific context, for example, constructive design
parameters, performance values, or operation modes. It is desirable to evaluate
the quality of design concepts by considering several of these feature subsets
in isolation. In particular, meaningful concepts should not only identify
dense, well separated groups of data instances, but also provide
non-overlapping groups of data that persist when considering pre-defined
feature subsets separately. In this work, we propose to view concept
identification as a special form of clustering algorithm with a broad range of
potential applications beyond engineering design. To illustrate the differences
between concept identification and classical clustering algorithms, we apply a
recently proposed concept identification algorithm to two synthetic data sets
and show the differences in identified solutions. In addition, we introduce the
mutual information measure as a metric to evaluate whether solutions return
consistent clusters across relevant subsets. To support the novel understanding
of concept identification, we consider a simulated data set from a
decision-making problem in the energy management domain and show that the
identified clusters are more interpretable with respect to relevant feature
subsets than clusters found by common clustering algorithms and are thus more
suitable to support a decision maker.
- Abstract(参考訳): 大規模なデータセットで意味のある概念を特定することは、エンジニアリング設計の問題に対する貴重な洞察を提供する。
概念識別は、すべての特徴のジョイント空間で類似しているが、機能のサブセットだけを考慮すると類似している設計インスタンスの重複しないグループを特定することを目的としている。
これらのサブセットは通常、コンストラクティブな設計パラメータ、パフォーマンス値、オペレーションモードなど、ある特定のコンテキストに関する設計を特徴付ける機能で構成されている。
これらの特徴のいくつかを独立に考慮して設計概念の質を評価することが望ましい。
特に意味のある概念は、データインスタンスの密集した分離されたグループを識別するだけでなく、事前定義された機能サブセットを別々に考えるときに持続する重複しないデータのグループを提供するべきである。
本研究では,概念同定を,工学設計を超えた幅広い応用可能性を持つクラスタリングアルゴリズムの特殊形式として捉えることを提案する。
概念同定アルゴリズムと古典的なクラスタリングアルゴリズムの違いを説明するために,最近提案されている概念識別アルゴリズムを2つの合成データセットに適用し,同定した解の差異を示す。
さらに,ソリューションが関連するサブセット間で一貫したクラスタを返すかどうかを評価する指標として,相互情報測度を導入する。
概念同定の新たな理解を支援するため,エネルギー管理領域における意思決定問題から設定したシミュレーションデータセットを考察し,一般的なクラスタリングアルゴリズムによるクラスタよりも,関連する特徴部分集合に関してより解釈可能であり,意思決定者を支援するのに適していることを示す。
関連論文リスト
- Discriminative Anchor Learning for Efficient Multi-view Clustering [59.11406089896875]
マルチビュークラスタリング(DALMC)のための識別的アンカー学習を提案する。
元のデータセットに基づいて、識別的なビュー固有の特徴表現を学習する。
これらの表現に基づいて異なるビューからアンカーを構築することで、共有アンカーグラフの品質が向上します。
論文 参考訳(メタデータ) (2024-09-25T13:11:17Z) - Normalization in Proportional Feature Spaces [49.48516314472825]
データ表現、特徴付け、可視化、分析、比較、分類、モデリングにおいて、正規化は重要な中心的な役割を果たす。
適切な正規化手法の選択は、関連する特徴の種類と特徴を考慮する必要がある。
論文 参考訳(メタデータ) (2024-09-17T17:46:27Z) - ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。
クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文 参考訳(メタデータ) (2024-07-31T08:29:35Z) - Towards Explainable Clustering: A Constrained Declarative based Approach [0.294944680995069]
古典的クラスタリング基準の観点から,高品質なクラスタリングを実現することを目指しており,その説明が可能である。
クラスタリングに関する優れたグローバルな説明は、各クラスタの特徴を、そのオブジェクトを記述する能力を考慮して与えるべきである。
そこで我々は,ECS と呼ばれる新しい解釈可能な制約付き手法を提案する。
論文 参考訳(メタデータ) (2024-03-26T21:00:06Z) - Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文 参考訳(メタデータ) (2024-03-17T07:02:55Z) - Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.15923939406772]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Concept Identification for Complex Engineering Datasets [0.0]
データセットにおける概念の定義に対する客観的な価値を提供する新しい概念品質尺度が提案されている。
本研究は,これらの概念を用いて,各概念の特徴を示すデータセットの古参代表を選択できることを実証する。
論文 参考訳(メタデータ) (2022-06-09T09:39:46Z) - A Framework for Multi-View Classification of Features [6.660458629649826]
データ分類問題の解決では、機能セットが大きすぎると、典型的なアプローチではその問題を解決することができない。
本研究では,人間の複数視点理論における物体認識の問題に触発された,多視点アンサンブル分類のための革新的な枠組みを提案する。
論文 参考訳(メタデータ) (2021-08-02T16:27:43Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。
厳格なベンチマークのベストプラクティスに関する合意はありません。
このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文 参考訳(メタデータ) (2021-02-13T15:01:34Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。