論文の概要: Analysis of lifelog data using optimal feature selection based
unsupervised logistic regression (OFS-ULR) for chronic disease classification
- arxiv url: http://arxiv.org/abs/2204.01281v1
- Date: Mon, 4 Apr 2022 07:11:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 01:35:11.622083
- Title: Analysis of lifelog data using optimal feature selection based
unsupervised logistic regression (OFS-ULR) for chronic disease classification
- Title(参考訳): 慢性疾患分類のための最適特徴選択に基づく非教師なしロジスティック回帰(OFS-ULR)を用いたライフログデータの解析
- Authors: Sadhana Tiwari, Sonali Agarwal
- Abstract要約: 慢性疾患分類モデルは現在、より良い医療実践を探求するためにライフログデータの可能性を活用している。
本稿では,慢性疾患の分類に最適な特徴選択に基づく非教師なしロジスティック回帰モデル(OFS-ULR)を構築することを目的とする。
- 参考スコア(独自算出の注目度): 2.3909933791900326
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancement in the field of pervasive healthcare monitoring systems
causes the generation of a huge amount of lifelog data in real-time. Chronic
diseases are one of the most serious health challenges in developing and
developed countries. According to WHO, this accounts for 73% of all deaths and
60% of the global burden of diseases. Chronic disease classification models are
now harnessing the potential of lifelog data to explore better healthcare
practices. This paper is to construct an optimal feature selection-based
unsupervised logistic regression model (OFS-ULR) to classify chronic diseases.
Since lifelog data analysis is crucial due to its sensitive nature; thus the
conventional classification models show limited performance. Therefore,
designing new classifiers for the classification of chronic diseases using
lifelog data is the need of the age. The vital part of building a good model
depends on pre-processing of the dataset, identifying important features, and
then training a learning algorithm with suitable hyper parameters for better
performance. The proposed approach improves the performance of existing methods
using a series of steps such as (i) removing redundant or invalid instances,
(ii) making the data labelled using clustering and partitioning the data into
classes, (iii) identifying the suitable subset of features by applying either
some domain knowledge or selection algorithm, (iv) hyper parameter tuning for
models to get best results, and (v) performance evaluation using Spark
streaming environment. For this purpose, two-time series datasets are used in
the experiment to compute the accuracy, recall, precision, and f1-score. The
experimental analysis proves the suitability of the proposed approach as
compared to the conventional classifiers and our newly constructed model
achieved highest accuracy and reduced training complexity among all among all.
- Abstract(参考訳): 広範医療監視システムの分野における最近の進歩は、大量のライフログデータをリアルタイムで生成する原因となっている。
慢性疾患は発展途上国で最も深刻な健康問題の一つである。
whoによると、これは全死者の73%、世界的な疾病の負担の60%を占めている。
慢性疾患分類モデルは現在、より良い医療実践を探求するためにライフログデータの可能性を活用している。
本稿では,慢性疾患の分類に最適な特徴選択に基づく非教師なしロジスティック回帰モデル(OFS-ULR)を構築する。
ライフログデータ解析は感度の高い性質から重要であるため,従来の分類モデルでは性能が制限されている。
したがって、ライフログデータを用いた慢性疾患分類のための新しい分類器の設計は年齢のニーズである。
よいモデルを構築する上で不可欠な部分は、データセットの事前処理、重要な特徴の特定、パフォーマンス向上のための適切なハイパーパラメータによる学習アルゴリズムのトレーニングなどに依存する。
提案手法は,一連のステップを用いて既存手法の性能を向上させる。
i) 冗長または無効なインスタンスを削除すること
(ii) データをクラスタ化してクラスに分割することでラベル付けする。
(iii)あるドメイン知識又は選択アルゴリズムを適用して、その特徴の適切な部分集合を特定すること。
(iv) モデルが最良の結果を得るためのハイパーパラメータチューニング
(v)sparkストリーミング環境を用いた性能評価。
この目的で、2回の時系列データセットを使用して、精度、リコール、精度、およびf1-scoreを計算する。
実験解析により,従来の分類器と比較して,提案手法の適合性が証明され,新たに構築したモデルが最も精度が高く,訓練の複雑さも低減した。
関連論文リスト
- FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - An Evaluation of Machine Learning Approaches for Early Diagnosis of
Autism Spectrum Disorder [0.0]
自閉症スペクトラム障害(Autistic Spectrum disorder、ASD)は、社会的相互作用、コミュニケーション、反復活動の困難を特徴とする神経疾患である。
本研究は,診断プロセスの強化と自動化を目的として,多様な機械学習手法を用いて重要なASD特性を同定する。
論文 参考訳(メタデータ) (2023-09-20T21:23:37Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Robust self-healing prediction model for high dimensional data [0.685316573653194]
本研究は、ロバスト自己治癒(RSH)ハイブリッド予測モデルを提案する。
それは、データを捨てるのではなく、エラーや不整合を取り除くことによって、データ全体を活用することによって機能する。
提案手法は,既存のハイパフォーマンスモデルと比較し,解析を行った。
論文 参考訳(メタデータ) (2022-10-04T17:55:50Z) - Categorical EHR Imputation with Generative Adversarial Nets [11.171712535005357]
本稿では,データ計算のためのGANに関する従来の研究を基にした,シンプルで効果的な手法を提案する。
従来のデータ計算手法に比べて予測精度が大幅に向上していることを示す。
論文 参考訳(メタデータ) (2021-08-03T18:50:26Z) - An Explainable Classification Model for Chronic Kidney Disease Patients [0.0]
慢性腎臓病(CKD)は、世界的に増加し、医療システムに高いコストがかかる。
データマイニングによるCKD指標の微妙なパターンの発見は、早期診断に寄与する。
本研究は、CKD患者の早期診断において、医療専門家を支援する分類器モデルを開発する。
論文 参考訳(メタデータ) (2021-05-21T14:09:43Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Temporal Phenotyping using Deep Predictive Clustering of Disease
Progression [97.88605060346455]
我々は、時系列データをクラスタリングするためのディープラーニングアプローチを開発し、各クラスタは、同様の将来的な結果を共有する患者から構成される。
2つの実世界のデータセットに対する実験により、我々のモデルは最先端のベンチマークよりも優れたクラスタリング性能が得られることが示された。
論文 参考訳(メタデータ) (2020-06-15T20:48:43Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。