Fugu-MT 論文翻訳(概要): Understanding Concept Identification as Consistent Data Clustering Across Multiple Feature Spaces

論文の概要: Understanding Concept Identification as Consistent Data Clustering Across Multiple Feature Spaces

arxiv url: http://arxiv.org/abs/2301.05525v1
Date: Fri, 13 Jan 2023 13:08:54 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-16 14:18:34.061149
Title: Understanding Concept Identification as Consistent Data Clustering Across Multiple Feature Spaces
Title（参考訳）: 複数の特徴空間にまたがる一貫性データクラスタリングとしての概念同定
Authors: Felix Lanfermannn, Sebastian Schmitt, Patricia Wollstadt
Abstract要約: 概念識別は、すべての特徴の合同空間で類似したデザインインスタンスのグループを特定することを目的としている。これらの特徴のいくつかを個別に考慮し、設計概念の質を評価することが望ましい。そこで本研究では,概念同定をクラスタリングアルゴリズムの特別な形式として,幅広い潜在的な応用の可能性について考察する。
参考スコア（独自算出の注目度）: 0.0483420384410068
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Identifying meaningful concepts in large data sets can provide valuable insights into engineering design problems. Concept identification aims at identifying non-overlapping groups of design instances that are similar in a joint space of all features, but which are also similar when considering only subsets of features. These subsets usually comprise features that characterize a design with respect to one specific context, for example, constructive design parameters, performance values, or operation modes. It is desirable to evaluate the quality of design concepts by considering several of these feature subsets in isolation. In particular, meaningful concepts should not only identify dense, well separated groups of data instances, but also provide non-overlapping groups of data that persist when considering pre-defined feature subsets separately. In this work, we propose to view concept identification as a special form of clustering algorithm with a broad range of potential applications beyond engineering design. To illustrate the differences between concept identification and classical clustering algorithms, we apply a recently proposed concept identification algorithm to two synthetic data sets and show the differences in identified solutions. In addition, we introduce the mutual information measure as a metric to evaluate whether solutions return consistent clusters across relevant subsets. To support the novel understanding of concept identification, we consider a simulated data set from a decision-making problem in the energy management domain and show that the identified clusters are more interpretable with respect to relevant feature subsets than clusters found by common clustering algorithms and are thus more suitable to support a decision maker.
Abstract（参考訳）: 大規模なデータセットで意味のある概念を特定することは、エンジニアリング設計の問題に対する貴重な洞察を提供する。概念識別は、すべての特徴のジョイント空間で類似しているが、機能のサブセットだけを考慮すると類似している設計インスタンスの重複しないグループを特定することを目的としている。これらのサブセットは通常、コンストラクティブな設計パラメータ、パフォーマンス値、オペレーションモードなど、ある特定のコンテキストに関する設計を特徴付ける機能で構成されている。これらの特徴のいくつかを独立に考慮して設計概念の質を評価することが望ましい。特に意味のある概念は、データインスタンスの密集した分離されたグループを識別するだけでなく、事前定義された機能サブセットを別々に考えるときに持続する重複しないデータのグループを提供するべきである。本研究では,概念同定を,工学設計を超えた幅広い応用可能性を持つクラスタリングアルゴリズムの特殊形式として捉えることを提案する。概念同定アルゴリズムと古典的なクラスタリングアルゴリズムの違いを説明するために,最近提案されている概念識別アルゴリズムを2つの合成データセットに適用し,同定した解の差異を示す。さらに,ソリューションが関連するサブセット間で一貫したクラスタを返すかどうかを評価する指標として,相互情報測度を導入する。概念同定の新たな理解を支援するため,エネルギー管理領域における意思決定問題から設定したシミュレーションデータセットを考察し,一般的なクラスタリングアルゴリズムによるクラスタよりも,関連する特徴部分集合に関してより解釈可能であり,意思決定者を支援するのに適していることを示す。

関連論文リスト

Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering [60.05209293008078]
クラスタ分析のための異種属性再構成と表現(HARR)学習パラダイム HarR はパラメータフリーで収束保証され、異なる要求されたクラスタ数 $k$ に対してより効果的に自己適応することができる。
論文参考訳（メタデータ） (2026-03-03T08:13:16Z)
ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts [54.60525564599342]
ConceptScopeは、ビジュアルデータセットを分析するためのスケーラブルで自動化されたフレームワークである。概念を、その意味的関連性とクラスラベルとの統計的相関に基づいて、ターゲット、コンテキスト、バイアスタイプに分類する。既知のバイアスを確実に検出し、未発表のバイアスを発見できる。
論文参考訳（メタデータ） (2025-10-30T06:46:17Z)
Imputation-free and Alignment-free: Incomplete Multi-view Clustering Driven by Consensus Semantic Learning [65.75756724642932]
不完全なマルチビュークラスタリングでは、欠落したデータがビュー内のプロトタイプシフトとビュー間のセマンティック不整合を誘導する。コンセンサスセマンティクス学習(FreeCSL)のためのIMVCフレームワークを提案する。 FreeCSLは、最先端の競合他社と比較して、IMVCタスクの信頼性と堅牢な割り当てを実現している。
論文参考訳（メタデータ） (2025-05-16T12:37:10Z)
Discriminative Ordering Through Ensemble Consensus [12.714723443928298]
コンセンサスクラスタリングからインスピレーションを得て、クラスタリングモデルのセットがデータに隠された構造を発見できると仮定します。本稿では,クラスタリングモデルとコンセンサス行列との接続距離に基づいて,アンサンブルクラスタリングによる識別順序付けを提案する。
論文参考訳（メタデータ） (2025-05-07T14:35:39Z)
Discriminative Anchor Learning for Efficient Multi-view Clustering [59.11406089896875]
マルチビュークラスタリング(DALMC)のための識別的アンカー学習を提案する。元のデータセットに基づいて、識別的なビュー固有の特徴表現を学習する。これらの表現に基づいて異なるビューからアンカーを構築することで、共有アンカーグラフの品質が向上します。
論文参考訳（メタデータ） (2024-09-25T13:11:17Z)
Normalization in Proportional Feature Spaces [49.48516314472825]
データ表現、特徴付け、可視化、分析、比較、分類、モデリングにおいて、正規化は重要な中心的な役割を果たす。適切な正規化手法の選択は、関連する特徴の種類と特徴を考慮する必要がある。
論文参考訳（メタデータ） (2024-09-17T17:46:27Z)
ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文参考訳（メタデータ） (2024-07-31T08:29:35Z)
Towards Explainable Clustering: A Constrained Declarative based Approach [0.294944680995069]
古典的クラスタリング基準の観点から,高品質なクラスタリングを実現することを目指しており,その説明が可能である。クラスタリングに関する優れたグローバルな説明は、各クラスタの特徴を、そのオブジェクトを記述する能力を考慮して与えるべきである。そこで我々は,ECS と呼ばれる新しい解釈可能な制約付き手法を提案する。
論文参考訳（メタデータ） (2024-03-26T21:00:06Z)
Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文参考訳（メタデータ） (2024-03-17T07:02:55Z)
Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.15923939406772]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文参考訳（メタデータ） (2024-02-05T16:09:35Z)
Concept Identification for Complex Engineering Datasets [0.0]
データセットにおける概念の定義に対する客観的な価値を提供する新しい概念品質尺度が提案されている。本研究は,これらの概念を用いて,各概念の特徴を示すデータセットの古参代表を選択できることを実証する。
論文参考訳（メタデータ） (2022-06-09T09:39:46Z)
A Framework for Multi-View Classification of Features [6.660458629649826]
データ分類問題の解決では、機能セットが大きすぎると、典型的なアプローチではその問題を解決することができない。本研究では,人間の複数視点理論における物体認識の問題に触発された,多視点アンサンブル分類のための革新的な枠組みを提案する。
論文参考訳（メタデータ） (2021-08-02T16:27:43Z)
A review of systematic selection of clustering algorithms and their evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文参考訳（メタデータ） (2021-06-24T07:01:46Z)
HAWKS: Evolving Challenging Benchmark Sets for Cluster Analysis [2.5329716878122404]
クラスタリングアルゴリズムの包括的なベンチマークは難しい。厳格なベンチマークのベストプラクティスに関する合意はありません。このようなベンチマークのフレキシブルな生成を支援するために,進化的アルゴリズムが果たす重要な役割を実証する。
論文参考訳（メタデータ） (2021-02-13T15:01:34Z)
Unsupervised Multi-view Clustering by Squeezing Hybrid Knowledge from Cross View and Each View [68.88732535086338]
本稿では,適応グラフ正規化に基づくマルチビュークラスタリング手法を提案する。 5つの多視点ベンチマークの実験結果から,提案手法が他の最先端手法をクリアマージンで上回ることを示す。
論文参考訳（メタデータ） (2020-08-23T08:25:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。