論文の概要: HDformer: A Higher Dimensional Transformer for Diabetes Detection
Utilizing Long Range Vascular Signals
- arxiv url: http://arxiv.org/abs/2303.11340v1
- Date: Fri, 17 Mar 2023 14:11:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 17:54:26.007998
- Title: HDformer: A Higher Dimensional Transformer for Diabetes Detection
Utilizing Long Range Vascular Signals
- Title(参考訳): HDformer:長距離血管信号を利用した糖尿病検出用高次元トランス
- Authors: Ella Lan
- Abstract要約: 本稿では,高次元変換器(HDformer, Higher dimensional Transformer, Higher dimensional Transformer)を新たに提案する。
HDformerは、標準MIMICIIIデータセットにおける最先端の性能(感度98.4、精度97.3、特異度92.8、AUC0.929)をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Diabetes mellitus is a worldwide concern, and early detection can help to
prevent serious complications. Low-cost, non-invasive detection methods, which
take cardiovascular signals into deep learning models, have emerged. However,
limited accuracy constrains their clinical usage. In this paper, we present a
new Transformer-based architecture, Higher Dimensional Transformer (HDformer),
which takes long-range photoplethysmography (PPG) signals to detect diabetes.
The long-range PPG contains broader and deeper signal contextual information
compared to the less-than-one-minute PPG signals commonly utilized in existing
research. To increase the capability and efficiency of processing the long
range data, we propose a new attention module Time Square Attention (TSA),
reducing the volume of the tokens by more than 10x, while retaining the
local/global dependencies. It converts the 1-dimensional inputs into
2-dimensional representations and groups adjacent points into a single 2D
token, using the 2D Transformer models as the backbone of the encoder. It
generates the dynamic patch sizes into a gated mixture-of-experts (MoE) network
as decoder, which optimizes the learning on different attention areas.
Extensive experimentations show that HDformer results in the state-of-the-art
performance (sensitivity 98.4, accuracy 97.3, specificity 92.8, and AUC 0.929)
on the standard MIMIC-III dataset, surpassing existing studies. This work is
the first time to take long-range, non-invasive PPG signals via Transformer for
diabetes detection, achieving a more scalable and convenient solution compared
to traditional invasive approaches. The proposed HDformer can also be scaled to
analyze general long-range biomedical waveforms. A wearable prototype
finger-ring is designed as a proof of concept.
- Abstract(参考訳): 糖尿病は世界中で懸念されており、早期発見は深刻な合併症の予防に役立つ。
心臓血管信号を深層学習モデルに取り入れる低コストで非侵襲的な検出法が登場している。
しかし、精度の制限は臨床使用を制限している。
本稿では,新しいトランスフォーマーアーキテクチャであるhigher dimensional transformer (hdformer) を提案する。
長距離ppgは、既存の研究で一般的に使用されている1分未満のppg信号と比較して、より広範で深い信号文脈情報を含んでいる。
長範囲データの処理能力と効率を向上させるため,新たに注目モジュールであるTime Square Attention (TSA)を提案し,トークンの容量を10倍以上削減し,局所的/グローバル的依存関係を維持した。
1次元入力を2次元表現に変換し、隣接する点をエンコーダのバックボーンとして2次元トランスフォーマーモデルを用いて単一の2次元トークンに変換する。
動的パッチサイズをデコーダとしてゲート混合(MoE)ネットワークに生成し、異なる注意領域での学習を最適化する。
大規模な実験により、HDformerは標準的なMIMIC-IIIデータセット上での最先端の性能(感度98.4、精度97.3、特異度92.8、AUC 0.929)が既存の研究を上回っていることが示された。
この研究は、糖尿病検出のためのトランスフォーマーを介して長距離非侵襲的なppg信号を初めて取得し、従来の侵襲的アプローチよりもスケーラブルで便利なソリューションを実現する。
提案するhdformerは、一般的な長距離生体医学波形を分析するためにもスケールできる。
ウェアラブルのプロトタイプの指リングは、概念実証として設計されている。
関連論文リスト
- Enhancing Early Diabetic Retinopathy Detection through Synthetic DR1 Image Generation: A StyleGAN3 Approach [0.0]
本研究はStyleGAN3を用いて高忠実度および多様性の微小動脈瘤を特徴とする合成DR1画像を生成する。
モデルのトレーニングには,2,602 DR1 画像のデータセットを使用し,次いで定量的指標を用いた総合評価を行った。
最終的なFIDスコアは17.29で、平均FIDは21.18(95%信頼区間20.83から21.56)を上回った。
論文 参考訳(メタデータ) (2025-01-01T21:00:58Z) - Synthetic Time Series Data Generation for Healthcare Applications: A PCG Case Study [43.28613210217385]
我々は、PCGデータを生成するために、最先端の3つの生成モデルを採用し、比較する。
その結果,生成したPCGデータは元のデータセットによく似ていることがわかった。
今後の研究では、この手法をデータ拡張パイプラインに組み込んで、異常なPCG信号を心臓の大腿骨で合成する予定である。
論文 参考訳(メタデータ) (2024-12-17T18:07:40Z) - DDxT: Deep Generative Transformer Models for Differential Diagnosis [51.25660111437394]
より単純な教師付き学習信号と自己教師付き学習信号で訓練した生成的アプローチが,現在のベンチマークにおいて優れた結果が得られることを示す。
The proposed Transformer-based generative network, named DDxT, autoregressive produce a set of possible pathology,, i. DDx, and predicts the real pathology using a neural network。
論文 参考訳(メタデータ) (2023-12-02T22:57:25Z) - Swin-Tempo: Temporal-Aware Lung Nodule Detection in CT Scans as Video
Sequences Using Swin Transformer-Enhanced UNet [2.7547288571938795]
本稿では、畳み込みニューラルネットワークと視覚変換器の長所を利用する革新的なモデルを提案する。
ビデオ中の物体検出にインスパイアされた各3次元CT画像をビデオとして扱い、個々のスライスをフレームとして、肺結節をオブジェクトとして扱い、時系列アプリケーションを可能にする。
論文 参考訳(メタデータ) (2023-10-05T07:48:55Z) - Machine Learning-Based Diabetes Detection Using Photoplethysmography
Signal Features [0.0]
糖尿病は世界中で何百万人もの人々の健康を損なう慢性疾患である。
そこで本研究では,非侵襲性光胸腺撮影による糖尿病検出の問題点を克服する別の方法を提案する。
PPG信号とアルゴリズムを用いて非糖尿病患者と糖尿病患者を分類し,ロジスティック回帰とeXtreme Gradient Boostingを訓練した。
以上の結果から,糖尿病の検出・予防のための遠隔・非侵襲・連続計測装置の開発に機械学習が期待できることが示唆された。
論文 参考訳(メタデータ) (2023-08-02T14:10:03Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Assessing glaucoma in retinal fundus photographs using Deep Feature
Consistent Variational Autoencoders [63.391402501241195]
緑内障は症状が重くなるまで無症状のままでいるため、検出が困難である。
緑内障の早期診断は機能的,構造的,臨床的評価に基づいて行われることが多い。
ディープラーニング手法はこのジレンマを、マーカー識別段階をバイパスし、ハイレベルな情報を分析してデータを分類することで部分的に解決している。
論文 参考訳(メタデータ) (2021-10-04T16:06:49Z) - Human Activity Recognition using Continuous Wavelet Transform and
Convolutional Neural Networks [0.0]
HAR(Human Activity Recognition)は、データサイエンスの分野である。
本稿では,HAR問題に対処する新しいワークフローを提案し,UniMiB SHARデータセット上で評価する。
我々は99.26パーセントの精度に達することに成功しており、この問題にふさわしいパフォーマンスである。
論文 参考訳(メタデータ) (2021-06-23T21:49:17Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。