論文の概要: Comparative Analysis of Pre-trained Deep Learning Models and DINOv2 for Cushing's Syndrome Diagnosis in Facial Analysis
- arxiv url: http://arxiv.org/abs/2501.12023v1
- Date: Tue, 21 Jan 2025 10:33:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:23:45.049680
- Title: Comparative Analysis of Pre-trained Deep Learning Models and DINOv2 for Cushing's Syndrome Diagnosis in Facial Analysis
- Title(参考訳): 顔分析におけるクッシング症候群診断のための事前学習型ディープラーニングモデルとDINOv2の比較分析
- Authors: Hongjun Liu, Changwei Song, Jiaqi Qiang, Jianqiang Li, Hui Pan, Lin Lu, Xiao Long, Qing Zhao, Jiuzuo Huang, Shi Chen,
- Abstract要約: 本研究では,CNN,Transformerベースのモデル,DINOv2などの事前学習モデルの性能を比較した。
その結果、TransformerベースのモデルとDINOv2はCNNよりも優れており、ViTは85.74%のF1スコアを記録した。
- 参考スコア(独自算出の注目度): 19.362336810804283
- License:
- Abstract: Cushing's syndrome is a condition caused by excessive glucocorticoid secretion from the adrenal cortex, often manifesting with moon facies and plethora, making facial data crucial for diagnosis. Previous studies have used pre-trained convolutional neural networks (CNNs) for diagnosing Cushing's syndrome using frontal facial images. However, CNNs are better at capturing local features, while Cushing's syndrome often presents with global facial features. Transformer-based models like ViT and SWIN, which utilize self-attention mechanisms, can better capture long-range dependencies and global features. Recently, DINOv2, a foundation model based on visual Transformers, has gained interest. This study compares the performance of various pre-trained models, including CNNs, Transformer-based models, and DINOv2, in diagnosing Cushing's syndrome. We also analyze gender bias and the impact of freezing mechanisms on DINOv2. Our results show that Transformer-based models and DINOv2 outperformed CNNs, with ViT achieving the highest F1 score of 85.74%. Both the pre-trained model and DINOv2 had higher accuracy for female samples. DINOv2 also showed improved performance when freezing parameters. In conclusion, Transformer-based models and DINOv2 are effective for Cushing's syndrome classification.
- Abstract(参考訳): クッシング症候群は副腎皮質からの過剰なグルココルチコイド分泌によって引き起こされる病態であり、しばしば月食と胸膜が出現し、顔のデータを診断に欠かせない。
これまでの研究では、前頭顔面画像を用いたクッシング症候群の診断に、事前訓練された畳み込みニューラルネットワーク(CNN)が用いられてきた。
しかし、CNNは局所的な特徴を捉えるのが得意であり、クッシング症候群はグローバルな顔の特徴を呈することが多い。
ViTやSWINのようなトランスフォーマーベースのモデルは、自己アテンションメカニズムを利用して、長距離依存関係やグローバル機能をよりよくキャプチャすることができる。
近年,ビジュアルトランスフォーマーに基づく基礎モデルであるDINOv2が注目されている。
本研究は、カッシング症候群の診断におけるCNN、Transformer-based model、DINOv2などの事前訓練モデルの性能を比較した。
また、性別バイアスと凍結機構がDINOv2に与える影響も分析した。
その結果、TransformerベースのモデルとDINOv2はCNNよりも優れており、ViTは85.74%のF1スコアを記録した。
プレトレーニングモデルとDINOv2はともに女性サンプルの精度が高かった。
DINOv2はまた、凍結パラメータのパフォーマンスも改善した。
結論として、トランスフォーマーモデルとDINOv2はクッシング症候群の分類に有効である。
関連論文リスト
- Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Comparative Performance Analysis of Transformer-Based Pre-Trained Models for Detecting Keratoconus Disease [0.0]
本研究は、変性眼疾患である角膜症(keratoconus)の診断のために、訓練済みの8つのCNNを比較した。
MobileNetV2は角膜と正常な症例を誤分類の少ない場合に最も正確なモデルであった。
論文 参考訳(メタデータ) (2024-08-16T20:15:24Z) - Utilizing Machine Learning and 3D Neuroimaging to Predict Hearing Loss: A Comparative Analysis of Dimensionality Reduction and Regression Techniques [0.0]
我々は,脳の灰白質3次元画像における難聴閾値を予測するための機械学習アプローチについて検討した。
第1フェーズでは,3次元CNNモデルを用いて,遅延空間への高次元入力を低減した。
第2フェーズでは、このモデルを使用して、リッチな機能への入力を削減した。
論文 参考訳(メタデータ) (2024-04-30T18:39:41Z) - 1D-Convolutional transformer for Parkinson disease diagnosis from gait [7.213855322671065]
本稿では,歩行からパーキンソン病の診断に有効なディープニューラルネットワークモデルを提案する。
本稿では,重症度を検知し,病状を正確に診断するためのハイブリッドConvNetTransform-erアーキテクチャを提案する。
提案手法は歩行データからパーキンソン病の異なる段階を検出するのに有効であることが示された。
論文 参考訳(メタデータ) (2023-11-06T15:17:17Z) - Detection of keratoconus Diseases using deep Learning [0.0]
最も重篤な角膜疾患の1つとして、角膜は早期に診断が困難であり、失明を引き起こすことがある。
ディープラーニングのアプローチの1つであるCNNは、角膜を正確にタイムリーに診断するための、特に有望なツールとして最近光を当てている。
本研究は,異なるD-CNNモデルを用いて角膜関連疾患の同定を行った。
論文 参考訳(メタデータ) (2023-11-03T15:49:06Z) - Benign Overfitting in Two-Layer ReLU Convolutional Neural Networks for
XOR Data [24.86314525762012]
勾配降下法により訓練されたReLU CNNがベイズ最適精度付近で実現できることを示す。
以上の結果から,CNNは高い相関性のある特徴が存在する場合でも,効率よくXOR問題を学習する能力を有することが明らかとなった。
論文 参考訳(メタデータ) (2023-10-03T11:31:37Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Neural Clamping: Joint Input Perturbation and Temperature Scaling for Neural Network Calibration [62.4971588282174]
我々はニューラルクランプ法と呼ばれる新しい後処理キャリブレーション法を提案する。
実験の結果,Neural Clampingは最先端の処理後のキャリブレーション法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-23T14:18:39Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。