論文の概要: ViTASD: Robust Vision Transformer Baselines for Autism Spectrum Disorder
Facial Diagnosis
- arxiv url: http://arxiv.org/abs/2210.16943v1
- Date: Sun, 30 Oct 2022 20:38:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 15:22:53.591077
- Title: ViTASD: Robust Vision Transformer Baselines for Autism Spectrum Disorder
Facial Diagnosis
- Title(参考訳): ViTASD: 自閉症スペクトラム障害顔面診断のためのロバスト・ビジョン・トランスフォーマーベースライン
- Authors: Xu Cao, Wenqian Ye, Elena Sizikova, Xue Bai, Megan Coffee, Hongwu
Zeng, Jianguo Cao
- Abstract要約: 自閉症スペクトラム障害(Autism spectrum disorder、ASD)は、世界中で非常に高い頻度で進行する、生涯にわたる神経発達障害である。
本稿では,視覚変換器 (ViT) を小児型ASDの計算解析に用いることを提案する。
提示されたモデルはViTASDと呼ばれ、大きな表情データセットから知識を抽出し、モデル構造転送性を提供する。
- 参考スコア(独自算出の注目度): 6.695640702099725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autism spectrum disorder (ASD) is a lifelong neurodevelopmental disorder with
very high prevalence around the world. Research progress in the field of ASD
facial analysis in pediatric patients has been hindered due to a lack of
well-established baselines. In this paper, we propose the use of the Vision
Transformer (ViT) for the computational analysis of pediatric ASD. The
presented model, known as ViTASD, distills knowledge from large facial
expression datasets and offers model structure transferability. Specifically,
ViTASD employs a vanilla ViT to extract features from patients' face images and
adopts a lightweight decoder with a Gaussian Process layer to enhance the
robustness for ASD analysis. Extensive experiments conducted on standard ASD
facial analysis benchmarks show that our method outperforms all of the
representative approaches in ASD facial analysis, while the ViTASD-L achieves a
new state-of-the-art. Our code and pretrained models are available at
https://github.com/IrohXu/ViTASD.
- Abstract(参考訳): 自閉症スペクトラム障害(英: autism spectrum disorder、asd)は、世界中で非常に高い頻度で発症する神経発達障害である。
小児におけるASD顔分析の分野での研究の進歩は、確立されたベースラインの欠如により妨げられている。
本稿では,視覚変換器 (ViT) を小児型ASDの計算解析に用いることを提案する。
提示されたモデルはViTASDと呼ばれ、大きな表情データセットから知識を抽出し、モデル構造転送性を提供する。
特に、ViTASDは、患者の顔画像から特徴を抽出するためにバニラViTを使用し、ASD分析の堅牢性を高めるためにガウスプロセス層を備えた軽量デコーダを採用している。
ASD顔分析ベンチマークで行った大規模な実験により,本手法はASD顔分析における代表的アプローチよりも優れており,ViTASD-Lは新たな最先端技術を実現していることがわかった。
私たちのコードと事前トレーニングされたモデルはhttps://github.com/IrohXu/ViTASD.comで公開されています。
関連論文リスト
- Hugging Rain Man: A Novel Facial Action Units Dataset for Analyzing Atypical Facial Expressions in Children with Autism Spectrum Disorder [2.3001245059699014]
我々は,ASDと典型的発達(TD)の双方に対して,FACSの専門家が手動でアノテートした顔アクションユニット(AU)を含む,新しいデータセットHugging Rain Manを紹介する。
データセットには、ポーズと自発的な表情の豊富なコレクションが含まれており、合計で約130,000フレーム、22のAU、10のAction Descriptors(AD)、非定型評価が含まれている。
論文 参考訳(メタデータ) (2024-11-21T02:51:52Z) - Explainable AI for Autism Diagnosis: Identifying Critical Brain Regions Using fMRI Data [0.29687381456163997]
自閉症スペクトラム障害(ASD)の早期診断と介入は、自閉症者の生活の質を著しく向上させることが示されている。
ASDの客観的バイオマーカーは診断精度の向上に役立つ。
深層学習(DL)は,医療画像データから疾患や病態を診断する上で,優れた成果を上げている。
本研究の目的は, ASD の精度と解釈性を向上させることであり, ASD を正確に分類できるだけでなく,その動作に関する説明可能な洞察を提供する DL モデルを作成することである。
論文 参考訳(メタデータ) (2024-09-19T23:08:09Z) - SkinGEN: an Explainable Dermatology Diagnosis-to-Generation Framework with Interactive Vision-Language Models [52.90397538472582]
SkinGENは、VLMが提供する診断結果から参照デモを生成する、診断から生成までのフレームワークである。
システム性能と説明可能性の両方を評価するために,32人の参加者によるユーザスタディを実施している。
その結果、SkinGENはVLM予測に対するユーザの理解を著しく改善し、診断プロセスへの信頼を高めることが示されている。
論文 参考訳(メタデータ) (2024-04-23T05:36:33Z) - Early Autism Diagnosis based on Path Signature and Siamese Unsupervised Feature Compressor [15.39635888144281]
我々は, 早期自閉症診断のための, 未分化, クラス不均衡, 異種構造MR画像から重要な特徴を抽出する, 深層学習に基づく新しい手法を考案した。
具体的には、不足データを拡張するためのシームズ検証フレームワークと、データ不均衡を軽減するための教師なし圧縮機を提案する。
論文 参考訳(メタデータ) (2023-07-12T22:08:22Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Orientation-Shared Convolution Representation for CT Metal Artifact
Learning [63.67718355820655]
X線CT(CT)スキャン中、患者を乗せた金属インプラントは、しばしば有害なアーティファクトに繋がる。
既存のディープラーニングベースの手法は、有望な再構築性能を得た。
本稿では,人工物の物理的事前構造に適応するために,配向型畳み込み表現戦略を提案する。
論文 参考訳(メタデータ) (2022-12-26T13:56:12Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Proposing a System Level Machine Learning Hybrid Architecture and
Approach for a Comprehensive Autism Spectrum Disorder Diagnosis [1.2691047660244335]
自閉症スペクトラム障害(Autism Spectrum disorder、ASD)は、知的発達、社会的行動、顔の特徴に影響を及ぼす重度の神経精神疾患である。
ASDの診断精度を向上させるために,社会行動と顔の特徴データの両方をフル活用したハイブリッドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T04:33:09Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - A Convolutional Neural Network for gaze preference detection: A
potential tool for diagnostics of autism spectrum disorder in children [0.0]
本稿では,1分間の刺激映像から抽出した画像を用いた視線予測のための畳み込みニューラルネットワーク(CNN)アルゴリズムを提案する。
本モデルでは,被検者の視線方向の予測に高い精度とロバスト性を実現した。
論文 参考訳(メタデータ) (2020-07-28T18:47:21Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。