論文の概要: Task-wise Split Gradient Boosting Trees for Multi-center Diabetes
Prediction
- arxiv url: http://arxiv.org/abs/2108.07107v1
- Date: Mon, 16 Aug 2021 14:22:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 18:34:32.811679
- Title: Task-wise Split Gradient Boosting Trees for Multi-center Diabetes
Prediction
- Title(参考訳): 多中心糖尿病予測のためのタスクワイズ・スプリット・グラディエントブースティングツリー
- Authors: Mingcheng Chen, Zhenghui Wang, Zhiyun Zhao, Weinan Zhang, Xiawei Guo,
Jian Shen, Yanru Qu, Jieli Lu, Min Xu, Yu Xu, Tiange Wang, Mian Li, Wei-Wei
Tu, Yong Yu, Yufang Bi, Weiqing Wang, Guang Ning
- Abstract要約: マルチセンター糖尿病予測タスクにTSGB(Task-wise Split Gradient Boosting Trees)を提案する。
TSGBはいくつかの最先端手法に対して優れた性能を発揮する。
TSGB法は早期診断のためのオンライン糖尿病リスク評価ソフトウェアとして展開されている。
- 参考スコア(独自算出の注目度): 37.846368153741395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diabetes prediction is an important data science application in the social
healthcare domain. There exist two main challenges in the diabetes prediction
task: data heterogeneity since demographic and metabolic data are of different
types, data insufficiency since the number of diabetes cases in a single
medical center is usually limited. To tackle the above challenges, we employ
gradient boosting decision trees (GBDT) to handle data heterogeneity and
introduce multi-task learning (MTL) to solve data insufficiency. To this end,
Task-wise Split Gradient Boosting Trees (TSGB) is proposed for the multi-center
diabetes prediction task. Specifically, we firstly introduce task gain to
evaluate each task separately during tree construction, with a theoretical
analysis of GBDT's learning objective. Secondly, we reveal a problem when
directly applying GBDT in MTL, i.e., the negative task gain problem. Finally,
we propose a novel split method for GBDT in MTL based on the task gain
statistics, named task-wise split, as an alternative to standard feature-wise
split to overcome the mentioned negative task gain problem. Extensive
experiments on a large-scale real-world diabetes dataset and a commonly used
benchmark dataset demonstrate TSGB achieves superior performance against
several state-of-the-art methods. Detailed case studies further support our
analysis of negative task gain problems and provide insightful findings. The
proposed TSGB method has been deployed as an online diabetes risk assessment
software for early diagnosis.
- Abstract(参考訳): 糖尿病予測は、社会医療分野における重要なデータサイエンス応用である。
糖尿病予測課題には2つの主な課題がある: 人口統計学と代謝学のデータが異なるためデータの不均一性、単一の医療センターにおける糖尿病症例の数が通常限られているためデータ不足である。
上記の課題に取り組むために,データの不均一性を扱うために勾配強化決定木 (gbdt) を採用し,データ不足を解決するためにマルチタスク学習 (mtl) を導入する。
この目的のために,多施設糖尿病予測タスクにTSGB(Task-wise Split Gradient Boosting Trees)を提案する。
具体的には,GBDTの学習目標を理論的に分析し,木構築中に個別にタスクを評価するタスクゲインを導入する。
第2に,GBDT を MTL に直接適用する際の問題,すなわち負のタスクゲイン問題を明らかにする。
最後に,タスク利得統計に基づくmtlにおけるgbdtの分割手法であるタスク利得統計(task-wise split)を提案する。
大規模な現実世界の糖尿病データセットと一般的に使用されるベンチマークデータセットに関する大規模な実験は、TSGBがいくつかの最先端の手法に対して優れたパフォーマンスを達成することを実証している。
詳細なケーススタディは、負のタスクゲイン問題の解析をさらに支援し、洞察に富んだ発見を提供する。
TSGB法は早期診断のためのオンライン糖尿病リスク評価ソフトウェアとして展開されている。
関連論文リスト
- Privacy Preserved Blood Glucose Level Cross-Prediction: An Asynchronous Decentralized Federated Learning Approach [13.363740869325646]
新たに診断された1型糖尿病(T1D)患者は、効果的な血液グルコース(BG)予測モデルを得るのに苦慮することが多い。
Asynchronous Decentralized Federated Learning による血糖予測である「GluADFL」を提案する。
論文 参考訳(メタデータ) (2024-06-21T17:57:39Z) - Interpretable Causal Inference for Analyzing Wearable, Sensor, and Distributional Data [62.56890808004615]
本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文 参考訳(メタデータ) (2023-12-17T00:42:42Z) - Generalizing to Unseen Domains in Diabetic Retinopathy Classification [8.59772105902647]
糖尿病網膜症分類における分布や領域の特定にモデルを一般化する問題について検討した。
本稿では、視覚変換器の自己蒸留を実現するための、シンプルで効果的な領域一般化(DG)手法を提案する。
本稿では,オープンソースのDR分類データセット上での最先端DG手法の性能について報告する。
論文 参考訳(メタデータ) (2023-10-26T09:11:55Z) - Harvard Glaucoma Detection and Progression: A Multimodal Multitask
Dataset and Generalization-Reinforced Semi-Supervised Learning [16.465424871839627]
我々は、ラベルのないデータを活用するために擬似スーパーバイザと呼ばれる新しい半教師付き学習(SSL)モデルを開発した。
次に、Harvard Glaucoma Detection and Progression (Harvard-GDP)データセットをリリースします。
これは、3D OCTイメージングデータと、一般公開されている最初の緑内障進展予測データセットを備えた、最大の緑内障検出データセットである。
論文 参考訳(メタデータ) (2023-08-25T14:38:51Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Patient Outcome and Zero-shot Diagnosis Prediction with
Hypernetwork-guided Multitask Learning [3.392432412743858]
マルチタスク深層学習は、テキストからの患者結果予測に応用されている。
複数のタスクにおける診断予測は、稀な疾患や未診断の診断による一般化可能性の問題である。
本稿では,タスク条件付きパラメータとマルチタスク予測ヘッドの係数を生成するハイパーネットワークベースの手法を提案する。
論文 参考訳(メタデータ) (2021-09-07T12:52:26Z) - Improving Limited Labeled Dialogue State Tracking with Self-Supervision [91.68515201803986]
既存の対話状態追跡(DST)モデルには多くのラベル付きデータが必要である。
本稿では,潜在的一貫性の維持と対話行動のモデル化という,自己指導型の2つの目的について検討する。
提案する自己教師型信号は,1%のラベル付きデータのみを使用する場合,関節ゴール精度を8.95%向上させることができる。
論文 参考訳(メタデータ) (2020-10-26T21:57:42Z) - Multi-task Learning via Adaptation to Similar Tasks for Mortality
Prediction of Diverse Rare Diseases [10.020413101958944]
電子健康記録(EHR)データを用いた多様な希少疾患の死亡予測は、知的医療にとって重要な課題である。
データ不足とまれな疾患の臨床的多様性により、個々の疾患データに基づいてディープラーニングモデルを直接訓練するのは困難である。
我々はAda-Sitを用いて長期記憶ネットワーク(LSTM)に基づく長手EHRデータに基づく予測モデルを訓練する。
論文 参考訳(メタデータ) (2020-04-11T06:15:23Z) - Short Term Blood Glucose Prediction based on Continuous Glucose
Monitoring Data [53.01543207478818]
本研究では,デジタル意思決定支援ツールの入力として連続グルコースモニタリング(Continuous Glucose Monitoring, CGM)データを利用する方法について検討する。
短時間の血液グルコース (STBG) 予測において, リカレントニューラルネットワーク (Recurrent Neural Networks, RNN) をどのように利用できるかを検討する。
論文 参考訳(メタデータ) (2020-02-06T16:39:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。