論文の概要: Hollow-tree Super: a directional and scalable approach for feature
importance in boosted tree models
- arxiv url: http://arxiv.org/abs/2104.03088v1
- Date: Wed, 7 Apr 2021 12:24:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 12:58:54.446464
- Title: Hollow-tree Super: a directional and scalable approach for feature
importance in boosted tree models
- Title(参考訳): Hollow-tree Super: 拡張木モデルにおける特徴的重要性のための指向性とスケーラブルなアプローチ
- Authors: Stephane Doyen, Hugh Taylor, Peter Nicholas, Lewis Crawford, Isabella
Young, Michael Sughrue
- Abstract要約: ブーストツリーモデルにおける特徴的重要性を解き、可視化する新しい手法であるHollow-tree Super(HOTS)を提案する。
統合失調症患者60名を対象に, HOTSを高次元神経科学データに活用する方法を示す。
hotsは、分類のための最も重要な10の特徴と、他の特徴と比較して分類と大きさの方向性を解決できた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Current limitations in boosted tree modelling prevent the effective scaling
to datasets with a large feature number, particularly when investigating the
magnitude and directionality of various features on classification. We present
a novel methodology, Hollow-tree Super (HOTS), to resolve and visualize feature
importance in boosted tree models involving a large number of features.
Further, HOTS allows for investigation of the directionality and magnitude
various features have on classification. Using the Iris dataset, we first
compare HOTS to Gini Importance, Partial Dependence Plots, and Permutation
Importance, and demonstrate how HOTS resolves the weaknesses present in these
methods. We then show how HOTS can be utilized in high dimensional
neuroscientific data, by taking 60 Schizophrenic subjects and applying the
method to determine which brain regions were most important for classification
of schizophrenia as determined by the PANSS. HOTS effectively replicated and
supported the findings of Gini importance, Partial Dependence Plots and
Permutation importance within the Iris dataset. When applied to the
schizophrenic brain dataset, HOTS was able to resolve the top 10 most important
features for classification, as well as their directionality for classification
and magnitude compared to other features. Cross-validation supported that these
same 10 features were consistently used in the decision-making process across
multiple trees, and these features were localised primarily to the occipital
and parietal cortices, commonly disturbed brain regions in those with
Schizophrenia. It is imperative that a methodology is developed that is able to
handle the demands of working with large datasets that contain a large number
of features. HOTS represents a unique way to investigate both the
directionality and magnitude of feature importance when working at scale with
boosted-tree modelling.
- Abstract(参考訳): 強化木モデリングの現在の制限は、特に分類上の様々な特徴の大きさと方向性を調べる際に、大きな特徴数を持つデータセットへの効果的なスケーリングを妨げている。
本稿では,多数の特徴を含む強化木モデルにおいて,特徴の重要性を解消し可視化するための新しい手法であるHollow-tree Super(HOTS)を提案する。
さらに、HOTSは、分類に関する様々な特徴と方向性を調査することができる。
Irisデータセットを使用して、まずHOTSをGini Importance、Partial Dependence Plots、Permutation Importanceと比較し、HOTSがこれらのメソッドに存在する弱点をどのように解決するかを示す。
次に,高次元神経科学データにHOTSをどのように活用できるかを,60名の統合失調症患者を対象とし,PANSSによって決定された統合失調症の分類においてどの脳領域が重要かを決定する手法を適用した。
HOTSは、Irisデータセット内のGiniの重要性、Partial Dependence Plots、Permutationの重要性の発見を効果的に再現し、サポートした。
統合失調症の脳データセットに適用すると、HOTSは他の特徴と比較して分類と大きさの方向性と同様に、分類において最も重要な特徴のトップ10を解決することができた。
クロスバリデーションは、同じ10の特徴が複数の木をまたいだ意思決定過程において一貫して使われており、これらの特徴は主として統合失調症患者の脳領域が混乱している後頭葉と頭頂葉の皮質に局在していた。
多数の機能を含む大規模なデータセットを扱うことの要求を処理するための方法論が開発されることが不可欠である。
HOTSは、拡張ツリーモデリングを用いて大規模に作業する際の方向性と特徴重要度の両方を調査するユニークな方法である。
関連論文リスト
- Multi-SIGATnet: A multimodal schizophrenia MRI classification algorithm using sparse interaction mechanisms and graph attention networks [8.703026708558157]
分裂病分類のためのスパース相互作用機構(Multi-SIGATnet)に基づく新しいグラフ注意ネットワークを提案した。
このモデルの有効性は、Center for Biomedical Research Excellence (COBRE)とUniversity of California Los Angeles (UCLA)データセットで検証されている。
論文 参考訳(メタデータ) (2024-08-25T13:15:55Z) - Knowledge-Guided Prompt Learning for Lifespan Brain MR Image Segmentation [53.70131202548981]
本稿では,脳MRIにKGPL(Knowledge-Guided Prompt Learning)を用いた2段階のセグメンテーションフレームワークを提案する。
具体的には,大規模データセットと準最適ラベルを用いたトレーニング前セグメンテーションモデルについて述べる。
知識的プロンプトの導入は、解剖学的多様性と生物学的プロセスの間の意味的関係を捉えている。
論文 参考訳(メタデータ) (2024-07-31T04:32:43Z) - Feature graphs for interpretable unsupervised tree ensembles: centrality, interaction, and application in disease subtyping [0.24578723416255746]
特徴の選択は、モデルの解釈可能性を高める上で重要な役割を担います。
決定木を集約することで得られる精度は、解釈可能性の犠牲となる。
この研究では、教師なしランダムな森林から特徴グラフを構築するための新しい手法を紹介した。
論文 参考訳(メタデータ) (2024-04-27T12:47:37Z) - Optimizing contrastive learning for cortical folding pattern detection [0.0]
我々は,囲い領域の折りたたみパターンを検出するための自己教師型ディープラーニングモデルを構築した。
このような大規模なデータセット上の皮質骨格に対して、自己教師付きディープラーニングモデルが適用されたのは、これが初めてである。
論文 参考訳(メタデータ) (2024-01-31T17:59:57Z) - Exploiting the Brain's Network Structure for Automatic Identification of
ADHD Subjects [70.37277191524755]
我々は脳を機能的ネットワークとしてモデル化できることを示し,ADHD被験者と制御対象とではネットワークの特定の特性が異なることを示した。
776名の被験者で分類器を訓練し,ADHD-200チャレンジのために神経局が提供する171名の被験者を対象に試験を行った。
論文 参考訳(メタデータ) (2023-06-15T16:22:57Z) - Language Knowledge-Assisted Representation Learning for Skeleton-Based
Action Recognition [71.35205097460124]
人間が他人の行動を理解して認識する方法は、複雑な神経科学の問題である。
LA-GCNは、大規模言語モデル(LLM)知識アシストを用いたグラフ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-21T08:29:16Z) - An Adaptive Contrastive Learning Model for Spike Sorting [12.043679000694258]
神経科学研究においては、個々のニューロンの活動を分離することが重要である。
大規模なシリコン技術の発展に伴い、スパイクの人工的解釈とラベル付けはますます非現実的になりつつある。
対照的な学習を通してスパイクから表現を学習する新しいモデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-24T09:18:46Z) - Brain Cortical Functional Gradients Predict Cortical Folding Patterns
via Attention Mesh Convolution [51.333918985340425]
我々は,脳の皮質ジャイロ-サルカル分割図を予測するための新しいアテンションメッシュ畳み込みモデルを開発した。
実験の結果,我々のモデルによる予測性能は,他の最先端モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-05-21T14:08:53Z) - Self-Supervised Graph Representation Learning for Neuronal Morphologies [75.38832711445421]
ラベルのないデータセットから3次元神経形態の低次元表現を学習するためのデータ駆動型アプローチであるGraphDINOを提案する。
2つの異なる種と複数の脳領域において、この方法では、専門家による手動の特徴に基づく分類と同程度に形態学的細胞型クラスタリングが得られることを示す。
提案手法は,大規模データセットにおける新しい形態的特徴や細胞型の発見を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - Identifying Autism Spectrum Disorder Based on Individual-Aware
Down-Sampling and Multi-Modal Learning [4.310840361752551]
本稿では,脳ネットワーク全体のパーソナライズされた低解像度表現を学習するfMRIの特徴抽出手法を提案する。
本モデルでは,平均分類精度85.95%,平均AUC0.92を達成している。
論文 参考訳(メタデータ) (2021-09-19T14:22:55Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。