論文の概要: Causally-Aware Unsupervised Feature Selection Learning
- arxiv url: http://arxiv.org/abs/2410.12224v1
- Date: Wed, 16 Oct 2024 04:41:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:40:56.466386
- Title: Causally-Aware Unsupervised Feature Selection Learning
- Title(参考訳): 因果認識型教師なし特徴選択学習
- Authors: Zongxin Shen, Yanyong Huang, Minbo Ma, Tianrui Li,
- Abstract要約: 非教師なし特徴選択(UFS)は、最近、ラベルなし高次元データの処理に有効であるとして注目されている。
従来のグラフベースの手法では、類似性グラフの構築において、非因果的特徴と因果的特徴の異なる影響を考慮できない。
Causally-Aware UnSupErvised Feature Selection Learning (CAUSE-FS)と呼ばれる新しいUFS法を提案する。
- 参考スコア(独自算出の注目度): 3.8734875101038706
- License:
- Abstract: Unsupervised feature selection (UFS) has recently gained attention for its effectiveness in processing unlabeled high-dimensional data. However, existing methods overlook the intrinsic causal mechanisms within the data, resulting in the selection of irrelevant features and poor interpretability. Additionally, previous graph-based methods fail to account for the differing impacts of non-causal and causal features in constructing the similarity graph, which leads to false links in the generated graph. To address these issues, a novel UFS method, called Causally-Aware UnSupErvised Feature Selection learning (CAUSE-FS), is proposed. CAUSE-FS introduces a novel causal regularizer that reweights samples to balance the confounding distribution of each treatment feature. This regularizer is subsequently integrated into a generalized unsupervised spectral regression model to mitigate spurious associations between features and clustering labels, thus achieving causal feature selection. Furthermore, CAUSE-FS employs causality-guided hierarchical clustering to partition features with varying causal contributions into multiple granularities. By integrating similarity graphs learned adaptively at different granularities, CAUSE-FS increases the importance of causal features when constructing the fused similarity graph to capture the reliable local structure of data. Extensive experimental results demonstrate the superiority of CAUSE-FS over state-of-the-art methods, with its interpretability further validated through feature visualization.
- Abstract(参考訳): 非教師なし特徴選択(UFS)は、最近、ラベルなし高次元データの処理に有効であるとして注目されている。
しかし、既存の手法はデータ内の本質的な因果関係を無視し、不適切な特徴の選択と解釈可能性の低下をもたらす。
さらに、従来のグラフベースの手法では、類似性グラフを構築する際に、非因果的特徴と因果的特徴の異なる影響を考慮できない。
これらの問題に対処するために、Causally-Aware UnSupErvised Feature Selection Learning (CAUSE-FS)と呼ばれる新しいUFS手法を提案する。
CAUSE-FSは新しい因果正則化器を導入し、各治療特徴の相反する分布のバランスを取るためにサンプルを再重み付けする。
この正規化器はその後、一般化された教師なしスペクトル回帰モデルに統合され、特徴とクラスタリングラベルの急激な関連を緩和し、因果的特徴選択を実現する。
さらにCAUSE-FSでは、因果関係の異なる特徴を複数の粒度に分割するために因果性誘導階層クラスタリングを採用している。
異なる粒度で適応的に学習した類似性グラフを統合することにより、CAUSE-FSは、融合した類似性グラフを構築する際に因果的特徴の重要性を高め、データの信頼性のある局所構造をキャプチャする。
大規模実験により,CAUSE-FSは最先端手法よりも優れており,その解釈性は特徴可視化によってさらに検証されている。
関連論文リスト
- Towards Robust Text Classification: Mitigating Spurious Correlations with Causal Learning [2.7813683000222653]
本稿では,因果関係へのモデル依存を軽減するために,因果相関ロバスト (CCR) を提案する。
CCRは、逆確率重み付け(IPW)損失関数とともに、反ファクト推論に基づく因果的特徴選択法を統合する。
グループラベルを持たないメソッド間でのCCRの最先端性能を示し、場合によってはグループラベルを利用するモデルと競合する。
論文 参考訳(メタデータ) (2024-11-01T21:29:07Z) - A Contrastive Variational Graph Auto-Encoder for Node Clustering [10.52321770126932]
最先端のクラスタリング手法には多くの課題がある。
既存のVGAEは、推論と生成モデルの相違を考慮していない。
私たちのソリューションには、フィーチャーランダムネスとフィーチャードリフトのトレードオフを制御する2つのメカニズムがあります。
論文 参考訳(メタデータ) (2023-12-28T05:07:57Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。
グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文 参考訳(メタデータ) (2023-06-05T12:20:40Z) - Effect Identification in Cluster Causal Diagrams [51.42809552422494]
クラスタ因果図(略してC-DAG)と呼ばれる新しいタイプのグラフィカルモデルを導入する。
C-DAGは、限定された事前知識に基づいて変数間の関係を部分的に定義することができる。
我々はC-DAGに対する因果推論のための基礎と機械を開発する。
論文 参考訳(メタデータ) (2022-02-22T21:27:31Z) - Decorrelate Irrelevant, Purify Relevant: Overcome Textual Spurious
Correlations from a Feature Perspective [47.10907370311025]
自然言語理解(NLU)モデルは、散発的な相関(すなわちデータセットバイアス)に頼る傾向があり、分布内データセットでは高い性能を得るが、分布外データセットでは性能が劣る。
既存のデバイアス法のほとんどは、バイアスのある特徴を持つサンプルを識別し、弱めていることが多い。
サンプルの重み付けは、サンプルの偏りのない部分から学習する際のモデルを妨げる。
本稿では,特徴空間の観点から,微粒な方法でスプリアス相関を除去することを提案する。
論文 参考訳(メタデータ) (2022-02-16T13:23:14Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Causal network learning with non-invertible functional relationships [7.845605663563046]
いくつかの最近の結果は、非ガウスおよび/または非線形構造方程式モデル(SEM)を用いた因果DAGの同定可能性を確立している。
本稿では,多くのデータ領域に存在する非可逆関数によって定義される非線形SEMに着目した。
線形因果関係と非線形因果関係の両方を含むDAGの構造学習において,本試験を組み込む手法を開発した。
論文 参考訳(メタデータ) (2020-04-20T21:32:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。