論文の概要: Subgroup Discovery in Unstructured Data
- arxiv url: http://arxiv.org/abs/2207.07781v1
- Date: Fri, 15 Jul 2022 23:13:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-19 17:51:31.863029
- Title: Subgroup Discovery in Unstructured Data
- Title(参考訳): 非構造データのサブグループ発見
- Authors: Ali Arab, Dev Arora, Jialin Lu, Martin Ester
- Abstract要約: サブグループ発見は知識発見と仮説生成に多くの応用がある。
サブグループ対応変分オートエンコーダは、より高い品質のサブグループにつながる非構造化データの表現を学習する。
- 参考スコア(独自算出の注目度): 7.6323763630645285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Subgroup discovery is a descriptive and exploratory data mining technique to
identify subgroups in a population that exhibit interesting behavior with
respect to a variable of interest. Subgroup discovery has numerous applications
in knowledge discovery and hypothesis generation, yet it remains inapplicable
for unstructured, high-dimensional data such as images. This is because
subgroup discovery algorithms rely on defining descriptive rules based on
(attribute, value) pairs, however, in unstructured data, an attribute is not
well defined. Even in cases where the notion of attribute intuitively exists in
the data, such as a pixel in an image, due to the high dimensionality of the
data, these attributes are not informative enough to be used in a rule. In this
paper, we introduce the subgroup-aware variational autoencoder, a novel
variational autoencoder that learns a representation of unstructured data which
leads to subgroups with higher quality. Our experimental results demonstrate
the effectiveness of the method at learning subgroups with high quality while
supporting the interpretability of the concepts.
- Abstract(参考訳): サブグループ発見(サブグループえい、英: subgroup discovery)は、興味のある個体群を識別する説明的かつ探索的なデータマイニング手法である。
サブグループ発見は知識発見や仮説生成に多くの応用があるが、画像のような非構造化の高次元データには適用できない。
これは、部分群発見アルゴリズムが(属性、値)ペアに基づいた記述規則の定義に依存しているためであるが、非構造化データでは属性が適切に定義されていないためである。
属性の概念がデータの中に直感的に存在する場合、例えば画像のピクセルのように、データの高次元性のためでも、これらの属性はルールで使われるのに十分な情報にならない。
本稿では,非構造化データの表現を学習し,高品質なサブグループへと導く,新しい変分オートエンコーダである subgroup-aware variational autoencoder を提案する。
本研究は,概念の解釈可能性を維持しつつ,高品質なサブグループ学習における手法の有効性を実証する。
関連論文リスト
- Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic
Segmentation [59.37587762543934]
本稿では,弱開語彙セマンティックセマンティックセグメンテーション(WOVSS)の問題点について検討する。
既存の方法は、グループトークンの使用に関する粒度の矛盾に悩まされる。
マルチモーダル正規化を組み込んだプロトタイプ誘導ネットワーク(PGSeg)を提案する。
論文 参考訳(メタデータ) (2023-10-29T13:18:00Z) - How Deep Neural Networks Learn Compositional Data: The Random Hierarchy Model [47.617093812158366]
言語と画像の階層構造にインスパイアされた合成タスクのファミリーであるランダム階層モデルを紹介する。
深層ネットワークは、等価なグループを交換するために不変な内部表現を開発することでタスクを学習する。
この結果から, ネットワークは次元の呪いを克服し, 不変表現を構築できることが示唆された。
論文 参考訳(メタデータ) (2023-07-05T09:11:09Z) - Learning Representations without Compositional Assumptions [79.12273403390311]
本稿では,特徴集合をグラフノードとして表現し,それらの関係を学習可能なエッジとして表現することで,特徴集合の依存関係を学習するデータ駆動型アプローチを提案する。
また,複数のビューから情報を動的に集約するために,より小さな潜在グラフを学習する新しい階層グラフオートエンコーダLEGATOを導入する。
論文 参考訳(メタデータ) (2023-05-31T10:36:10Z) - Identification of Systematic Errors of Image Classifiers on Rare
Subgroups [12.064692111429494]
組織的エラーは、少数民族の公正性だけでなく、ドメインシフト時の堅牢性と安全性にも影響します。
我々は,テキスト・ツー・イメージ・モデルにおける最近の進歩を活用し,ターゲットモデルの性能が低いサブグループに対するサブグループのテキスト記述("prompts")の空間を探索する。
本稿では, PromptAttackによるサブグループカバレッジと識別可能性について検討し, 高い精度で系統的誤りを識別できることを見出した。
論文 参考訳(メタデータ) (2023-03-09T07:08:25Z) - Leveraging Structure for Improved Classification of Grouped Biased Data [8.121462458089143]
データポイントが自然にグループ化されるアプリケーションに対する半教師付きバイナリ分類を検討する。
我々は、この構造を明示的に活用し、最適、グループ対応、確率出力の分類器を学習する半教師付きアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-12-07T15:18:21Z) - Seeking the Truth Beyond the Data. An Unsupervised Machine Learning
Approach [0.0]
クラスタリングは、ラベルのない要素/オブジェクトがグループ化される、教師なしの機械学習方法論である。
この記事では、最も広く使われているクラスタリング手法について詳しく説明する。
3つのデータセットに基づいて、これらのアルゴリズムのクラスタリング効率の比較を強調している。
論文 参考訳(メタデータ) (2022-07-14T14:22:36Z) - The Group Loss++: A deeper look into group loss for deep metric learning [65.19665861268574]
グループ損失 (Group Loss) は、グループの全サンプルに埋め込まれた類似性を強制する微分可能なラベルプロパゲーション法に基づく損失関数である。
4つのデータセットでクラスタリングと画像検索の最先端結果を示し、2人の再識別データセットで競合結果を示す。
論文 参考訳(メタデータ) (2022-04-04T14:09:58Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Identifying Biased Subgroups in Ranking and Classification [12.268135088806613]
性能差を測定するために分散の概念を導入する。
我々は、(i)分類モデルと(ii)ランキングアプリケーションという文脈でこれを活用します。
我々は,データサブグループ内のすべての属性の分散挙動への寄与を,シェープリー値を用いて定量化する。
論文 参考訳(メタデータ) (2021-08-17T05:26:11Z) - Class Introspection: A Novel Technique for Detecting Unlabeled
Subclasses by Leveraging Classifier Explainability Methods [0.0]
潜在構造はデータセットの分析を行う上で重要なステップである。
インスタンス説明手法を利用することで、既存の分類器を拡張して潜在クラスを検出することができる。
本稿では,分類器を自動解析するパイプラインと,この手法による結果を対話的に探索するWebアプリケーションについても述べる。
論文 参考訳(メタデータ) (2021-07-04T14:58:29Z) - Learning Multi-Attention Context Graph for Group-Based Re-Identification [214.84551361855443]
オーバーラップしていないカメラシステムを介して人々のグループを再識別または取得することを学ぶことは、ビデオ監視において重要なアプリケーションです。
本研究では,グループre-idというグループを識別するためのコンテキスト情報の利用を検討する。
本研究では,グループベースリドタスクを同時に処理するグラフニューラルネットワークに基づく新しい統合フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-29T09:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。