論文の概要: Feature Selection in the Contrastive Analysis Setting
- arxiv url: http://arxiv.org/abs/2310.18531v1
- Date: Fri, 27 Oct 2023 23:16:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 18:08:45.168303
- Title: Feature Selection in the Contrastive Analysis Setting
- Title(参考訳): コントラスト分析設定における特徴選択
- Authors: Ethan Weinberger, Ian Covert, Su-In Lee
- Abstract要約: コントラスト分析(Contrastive Analysis、CA)は、ターゲットデータセットに独自に濃縮されたバリエーションの探索を指す。
コントラスト特徴選択(CFS)は,CA設定において特徴選択を行う手法である。
提案手法は従来提案されていた教師付きかつ完全に教師なしな特徴選択法よりも一貫して優れていた。
- 参考スコア(独自算出の注目度): 17.90957424147776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contrastive analysis (CA) refers to the exploration of variations uniquely
enriched in a target dataset as compared to a corresponding background dataset
generated from sources of variation that are irrelevant to a given task. For
example, a biomedical data analyst may wish to find a small set of genes to use
as a proxy for variations in genomic data only present among patients with a
given disease (target) as opposed to healthy control subjects (background).
However, as of yet the problem of feature selection in the CA setting has
received little attention from the machine learning community. In this work we
present contrastive feature selection (CFS), a method for performing feature
selection in the CA setting. We motivate our approach with a novel
information-theoretic analysis of representation learning in the CA setting,
and we empirically validate CFS on a semi-synthetic dataset and four real-world
biomedical datasets. We find that our method consistently outperforms
previously proposed state-of-the-art supervised and fully unsupervised feature
selection methods not designed for the CA setting. An open-source
implementation of our method is available at https://github.com/suinleelab/CFS.
- Abstract(参考訳): コントラスト分析(Contrastive Analysis、CA)とは、特定のタスクに無関係な変動源から生成された対応する背景データセットと比較して、ターゲットデータセットに独自に濃縮された変動を探索することである。
例えば、バイオメディカルデータアナリストは、健康管理対象(背景)とは対照的に、与えられた疾患(標的)の患者にのみ存在するゲノムデータの変異の指標として使用する、少数の遺伝子セットを見つけたいかもしれない。
しかし、CA設定における機能選択の問題は、まだ機械学習コミュニティからはほとんど注目されていない。
本稿では,CA設定における特徴選択を行う手法として,コントラスト特徴選択(CFS)を提案する。
我々は、CA設定における表現学習の新たな情報理論分析により、我々のアプローチを動機付け、半合成データセットと4つの実世界のバイオメディカルデータセットでCFSを実証的に検証した。
提案手法は,従来提案されていたca設定に適合しない教師なし特徴選択手法を一貫して上回っていることが判明した。
このメソッドのオープンソース実装は、https://github.com/suinleelab/cfsで入手できる。
関連論文リスト
- Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Source-Free Domain Adaptation for Medical Image Segmentation via
Prototype-Anchored Feature Alignment and Contrastive Learning [57.43322536718131]
医用画像セグメンテーションのための2段階のソースフリードメイン適応(SFDA)フレームワークを提案する。
プロトタイプアンコールされた特徴アライメントの段階では,まず,事前学習した画素ワイド分類器の重みを原プロトタイプとして利用する。
そこで,本研究では,目標となる特徴とクラスプロトタイプとの整合性を期待するコストを最小化し,双方向輸送を導入する。
論文 参考訳(メタデータ) (2023-07-19T06:07:12Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Interpretability-Driven Sample Selection Using Self Supervised Learning
For Disease Classification And Segmentation [4.898744396854313]
解釈可能なサリエンシーマップに含まれる情報を活用した深層特徴に基づく新しいサンプル選択手法を提案する。
提案手法は, より少ないサンプルで, アートパフォーマンスの状態を導く情報的サンプルの選択において, 他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-13T10:46:33Z) - Active Selection of Classification Features [0.0]
人口統計などの補助的データは、最も有益なMRIスキャンを持つ個人を含む小さなサンプルを選択するのに役立ちます。
本研究では,2つの実用的手法を提案し,その性能を3つの実世界のベンチマークデータセットで評価する。
論文 参考訳(メタデータ) (2021-02-26T18:19:08Z) - Selecting Treatment Effects Models for Domain Adaptation Using Causal
Knowledge [82.5462771088607]
監視されていないドメイン適応設定下でITE法用に特別に設計された新しいモデル選択メトリックを提案する。
特に,介入効果の予測が対象領域の既知の因果構造を満たすモデルを選択することを提案する。
論文 参考訳(メタデータ) (2021-02-11T21:03:14Z) - RENT -- Repeated Elastic Net Technique for Feature Selection [0.46180371154032895]
特徴選択のための繰り返し弾性ネット技術(RENT)を提案する。
RENTは、弾力性のあるネット正規化を備えた一般化線形モデルのアンサンブルを使用しており、それぞれがトレーニングデータの異なるサブセットに基づいて訓練されている。
RENTは、トレーニング中に予測が難しいデータ内のオブジェクトの識別に関するモデル解釈のための貴重な情報を提供する。
論文 参考訳(メタデータ) (2020-09-27T07:55:52Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - An Efficient Framework for Automated Screening of Clinically Significant
Macular Edema [0.41998444721319206]
本研究は,臨床上重要な黄斑浮腫(CSME)の自動スクリーニングのための新しいアプローチを提案する。
提案手法は、トレーニング済みのディープニューラルネットワークとメタヒューリスティックな特徴選択を組み合わせたものである。
スクイードデータセットの効果を克服するために、機能領域のオーバーサンプリング技術が使用されている。
論文 参考訳(メタデータ) (2020-01-20T07:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。