論文の概要: Understanding Concept Identification as Consistent Data Clustering
Across Multiple Feature Spaces
- arxiv url: http://arxiv.org/abs/2301.05525v1
- Date: Fri, 13 Jan 2023 13:08:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 14:18:34.061149
- Title: Understanding Concept Identification as Consistent Data Clustering
Across Multiple Feature Spaces
- Title(参考訳): 複数の特徴空間にまたがる一貫性データクラスタリングとしての概念同定
- Authors: Felix Lanfermannn, Sebastian Schmitt, Patricia Wollstadt
- Abstract要約: 概念識別は、すべての特徴の合同空間で類似したデザインインスタンスのグループを特定することを目的としている。
これらの特徴のいくつかを個別に考慮し、設計概念の質を評価することが望ましい。
そこで本研究では,概念同定をクラスタリングアルゴリズムの特別な形式として,幅広い潜在的な応用の可能性について考察する。
- 参考スコア(独自算出の注目度): 0.0483420384410068
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Identifying meaningful concepts in large data sets can provide valuable
insights into engineering design problems. Concept identification aims at
identifying non-overlapping groups of design instances that are similar in a
joint space of all features, but which are also similar when considering only
subsets of features. These subsets usually comprise features that characterize
a design with respect to one specific context, for example, constructive design
parameters, performance values, or operation modes. It is desirable to evaluate
the quality of design concepts by considering several of these feature subsets
in isolation. In particular, meaningful concepts should not only identify
dense, well separated groups of data instances, but also provide
non-overlapping groups of data that persist when considering pre-defined
feature subsets separately. In this work, we propose to view concept
identification as a special form of clustering algorithm with a broad range of
potential applications beyond engineering design. To illustrate the differences
between concept identification and classical clustering algorithms, we apply a
recently proposed concept identification algorithm to two synthetic data sets
and show the differences in identified solutions. In addition, we introduce the
mutual information measure as a metric to evaluate whether solutions return
consistent clusters across relevant subsets. To support the novel understanding
of concept identification, we consider a simulated data set from a
decision-making problem in the energy management domain and show that the
identified clusters are more interpretable with respect to relevant feature
subsets than clusters found by common clustering algorithms and are thus more
suitable to support a decision maker.
- Abstract(参考訳): 大規模なデータセットで意味のある概念を特定することは、エンジニアリング設計の問題に対する貴重な洞察を提供する。
概念識別は、すべての特徴のジョイント空間で類似しているが、機能のサブセットだけを考慮すると類似している設計インスタンスの重複しないグループを特定することを目的としている。
これらのサブセットは通常、コンストラクティブな設計パラメータ、パフォーマンス値、オペレーションモードなど、ある特定のコンテキストに関する設計を特徴付ける機能で構成されている。
これらの特徴のいくつかを独立に考慮して設計概念の質を評価することが望ましい。
特に意味のある概念は、データインスタンスの密集した分離されたグループを識別するだけでなく、事前定義された機能サブセットを別々に考えるときに持続する重複しないデータのグループを提供するべきである。
本研究では,概念同定を,工学設計を超えた幅広い応用可能性を持つクラスタリングアルゴリズムの特殊形式として捉えることを提案する。
概念同定アルゴリズムと古典的なクラスタリングアルゴリズムの違いを説明するために,最近提案されている概念識別アルゴリズムを2つの合成データセットに適用し,同定した解の差異を示す。
さらに,ソリューションが関連するサブセット間で一貫したクラスタを返すかどうかを評価する指標として,相互情報測度を導入する。
概念同定の新たな理解を支援するため,エネルギー管理領域における意思決定問題から設定したシミュレーションデータセットを考察し,一般的なクラスタリングアルゴリズムによるクラスタよりも,関連する特徴部分集合に関してより解釈可能であり,意思決定者を支援するのに適していることを示す。
関連論文リスト
- Enhancing Neural Subset Selection: Integrating Background Information
into Set Representations [55.44881879377666]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Object-Centric Conformance Alignments with Synchronization (Extended
Version) [63.105872371236636]
対象中心のペトリネットが一対多の関係を捉える能力と,その同一性に基づいたオブジェクトの比較と同期を行う識別子を持つペトリネットの能力を組み合わせた,新たな形式主義を提案する。
我々は、満足度変調理論(SMT)の符号化に基づく、そのようなネットに対する適合性チェック手法を提案する。
論文 参考訳(メタデータ) (2023-12-13T21:53:32Z) - Anchor-based Multi-view Subspace Clustering with Hierarchical Feature
Descent [50.283640069991]
マルチビュークラスタリングは、様々なソースから情報を集約する能力によって、注目を集めている。
階層的特徴Descentを用いたアンカーベースマルチビューサブスペースクラスタリングを提案する。
提案手法は最先端技術より一貫して優れている。
論文 参考訳(メタデータ) (2023-10-11T03:29:13Z) - Identification of Energy Management Configuration Concepts from a Set of
Pareto-optimal Solutions [9.13918865694443]
概念識別は、構成オプションを意味のあるグループに分類することで意思決定を容易にする。
20000の最適エネルギー管理構成では、複数の概念識別を繰り返している。
記述空間の選択が抽出可能な情報のタイプにどのように影響するかを示す。
論文 参考訳(メタデータ) (2023-06-14T07:38:01Z) - Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement [75.9289887536165]
基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。
本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。
この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文 参考訳(メタデータ) (2023-03-20T18:19:36Z) - Concept Identification for Complex Engineering Datasets [0.0]
データセットにおける概念の定義に対する客観的な価値を提供する新しい概念品質尺度が提案されている。
本研究は,これらの概念を用いて,各概念の特徴を示すデータセットの古参代表を選択できることを実証する。
論文 参考訳(メタデータ) (2022-06-09T09:39:46Z) - A Framework for Multi-View Classification of Features [6.660458629649826]
データ分類問題の解決では、機能セットが大きすぎると、典型的なアプローチではその問題を解決することができない。
本研究では,人間の複数視点理論における物体認識の問題に触発された,多視点アンサンブル分類のための革新的な枠組みを提案する。
論文 参考訳(メタデータ) (2021-08-02T16:27:43Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - Deep Clustering by Semantic Contrastive Learning [67.28140787010447]
Semantic Contrastive Learning (SCL) と呼ばれる新しい変種を紹介します。
従来のコントラスト学習とディープクラスタリングの両方の特徴を探求する。
コントラスト学習と深層クラスタリングの強みを統一的なアプローチで増幅することができる。
論文 参考訳(メタデータ) (2021-03-03T20:20:48Z) - HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。
厳格なベンチマークのベストプラクティスに関する合意はありません。
このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文 参考訳(メタデータ) (2021-02-13T15:01:34Z) - Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from
Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。
5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-08-23T08:25:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。