論文の概要: Multimodal Ensemble with Conditional Feature Fusion for Dysgraphia Diagnosis in Children from Handwriting Samples
- arxiv url: http://arxiv.org/abs/2408.13754v1
- Date: Sun, 25 Aug 2024 07:42:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 18:00:02.885139
- Title: Multimodal Ensemble with Conditional Feature Fusion for Dysgraphia Diagnosis in Children from Handwriting Samples
- Title(参考訳): 手書きサンプルを用いた小児の画像診断における条件付き特徴融合を用いたマルチモーダルアンサンブル
- Authors: Jayakanth Kunhoth, Somaya Al-Maadeed, Moutaz Saleh, Younes Akbari,
- Abstract要約: 発達障害 (Developmental dysgraphia) は、小児の筆記能力を妨げる神経疾患である。
オンラインとオフラインの両方の手書きデータを利用した新しいマルチモーダル機械学習手法を提案する。
提案手法は88.8%の精度を達成し,SVMを12-14%上回った。
- 参考スコア(独自算出の注目度): 0.7671590907056449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developmental dysgraphia is a neurological disorder that hinders children's writing skills. In recent years, researchers have increasingly explored machine learning methods to support the diagnosis of dysgraphia based on offline and online handwriting. In most previous studies, the two types of handwriting have been analysed separately, which does not necessarily lead to promising results. In this way, the relationship between online and offline data cannot be explored. To address this limitation, we propose a novel multimodal machine learning approach utilizing both online and offline handwriting data. We created a new dataset by transforming an existing online handwritten dataset, generating corresponding offline handwriting images. We considered only different types of word data (simple word, pseudoword & difficult word) in our multimodal analysis. We trained SVM and XGBoost classifiers separately on online and offline features as well as implemented multimodal feature fusion and soft-voted ensemble. Furthermore, we proposed a novel ensemble with conditional feature fusion method which intelligently combines predictions from online and offline classifiers, selectively incorporating feature fusion when confidence scores fall below a threshold. Our novel approach achieves an accuracy of 88.8%, outperforming SVMs for single modalities by 12-14%, existing methods by 8-9%, and traditional multimodal approaches (soft-vote ensemble and feature fusion) by 3% and 5%, respectively. Our methodology contributes to the development of accurate and efficient dysgraphia diagnosis tools, requiring only a single instance of multimodal word/pseudoword data to determine the handwriting impairment. This work highlights the potential of multimodal learning in enhancing dysgraphia diagnosis, paving the way for accessible and practical diagnostic tools.
- Abstract(参考訳): 発達障害 (Developmental dysgraphia) は、小児の筆記能力を妨げる神経疾患である。
近年,オフラインやオンラインの筆跡に基づく画像診断を支援する機械学習手法が研究されている。
これまでのほとんどの研究では、2種類の筆跡が別々に分析されており、必ずしも有望な結果をもたらすわけではない。
このように、オンラインデータとオフラインデータの関係を探索することはできない。
この制限に対処するため,オンラインとオフラインの両方の手書きデータを利用した新しいマルチモーダル機械学習手法を提案する。
既存のオンライン手書きデータセットを変換し、対応するオフライン手書き画像を生成することで、新しいデータセットを作成しました。
マルチモーダル分析では, 単語データの種類(単純語, 疑似語, 難解語)のみを検討した。
オンラインとオフラインの機能でSVMとXGBoostの分類器を個別に訓練し、マルチモーダル機能融合とソフトヴォイットアンサンブルを実装しました。
さらに、オンラインとオフラインの分類器からの予測をインテリジェントに組み合わせ、信頼スコアが閾値以下になると特徴融合を選択的に組み込む条件付き特徴融合法を提案する。
提案手法の精度は88.8%であり,シングルモーダルのSVMは12-14%,既存手法は8-9%,従来のマルチモーダルアプローチ(ソフトボイトアンサンブルと特徴融合)は3%,特徴融合は5%であった。
本手法は, 書字障害を判定するために, 複数モーダル語/単語データの単一インスタンスのみを必要とする, 高精度かつ効率的な画像診断ツールの開発に寄与する。
本研究は, マルチモーダル・ラーニング(マルチモーダル・ラーニング, マルチモーダル・ラーニング)の可能性を明らかにするものである。
関連論文リスト
- Explainable AI in Handwriting Detection for Dyslexia Using Transfer Learning [0.0]
本稿では,手書き解析による失読症検出のための説明可能なAI(XAI)フレームワークを提案する。
我々の手法は最先端の手法を超越し、試験精度は0.9958である。
この枠組みは診断精度を向上するだけでなく、教育者、臨床医、両親の信頼と理解を促進する。
論文 参考訳(メタデータ) (2024-10-18T11:14:54Z) - Hybrid Transformer for Early Alzheimer's Detection: Integration of Handwriting-Based 2D Images and 1D Signal Features [2.606124959056959]
アルツハイマー病(英語: Alzheimer's Disease、AD)は、早期発見が不可欠である神経変性疾患である。
ADの初期にしばしば影響を受ける手書き文字は、微妙な運動の変化を捉える非侵襲的でコスト効率のよい方法を提供する。
2次元手書き画像と1次元動的手書き信号を同時に統合した学習可能なマルチモーダルハイブリッドアテンションモデルを提案する。
F1スコア90.32%、タスク8では90.91%の精度でDARWINデータセット上での最先端性能を実現した('L'書き込み)。
論文 参考訳(メタデータ) (2024-10-14T14:26:52Z) - DiffusionPen: Towards Controlling the Style of Handwritten Text Generation [7.398476020996681]
DiffusionPen (DiffPen) は遅延拡散モデルに基づく5ショットスタイルの手書きテキスト生成手法である。
提案手法は,文字と文体の特徴の両面を抽出し,現実的な手書きサンプルを生成する。
提案手法は,既存の手法を質的かつ定量的に上回り,その付加データにより手書き文字認識(HTR)システムの性能を向上させることができる。
論文 参考訳(メタデータ) (2024-09-09T20:58:25Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - DNA-GPT: Divergent N-Gram Analysis for Training-Free Detection of
GPT-Generated Text [82.5469544192645]
ダイバージェントN-Gram解析(DNA-GPT)と呼ばれる新しいトレーニング不要検出手法を提案する。
元の部分と新しい部分の違いをN-gram解析により解析することにより,機械生成テキストと人文テキストの分布に顕著な相違が明らかになった。
その結果, ゼロショットアプローチは, 人文とGPT生成テキストの区別において, 最先端の性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-05-27T03:58:29Z) - Meta Learning for Few-Shot Medical Text Classification [1.2617078020344619]
ベンチマークテキストと医療データの幅広いコーパスにおけるメタラーニングとロバストネス技術の利用について検討する。
テキストによるメタラーニングはテキストベースのデータに適したフレームワークであり、より優れたデータ効率と、少数ショット言語モデルに匹敵するパフォーマンスを提供する。
論文 参考訳(メタデータ) (2022-12-03T06:46:52Z) - Recognizing Handwriting Styles in a Historical Scanned Document Using
Unsupervised Fuzzy Clustering [0.0]
特異な手書きスタイルは、文字サイズ、ストローク幅、ループ、ダクト、スラットアングル、カーシブリグチュアなど、いくつかの要素のブレンドで異なってくることがある。
隠れマルコフモデル、サポートベクターマシン、半教師付きリカレントニューラルネットワークによるラベル付きデータの研究は、中程度から高い成功を収めている。
本研究では, ファジィソフトクラスタリングと線形主成分分析を併用して, 歴史写本の手動変化を検知することに成功した。
論文 参考訳(メタデータ) (2022-10-30T09:07:51Z) - $\textit{latent}$-GLAT: Glancing at Latent Variables for Parallel Text
Generation [65.29170569821093]
並列テキスト生成は、ジェネレーション効率の成功により、広く注目を集めています。
本稿では,単語分類情報を取得するために,離散潜在変数を用いた$textitlatent$-GLATを提案する。
実験結果から,本手法は自己回帰モデルを用いることなく,強いベースラインを達成できることが示唆された。
論文 参考訳(メタデータ) (2022-04-05T07:34:12Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - Revisiting Self-Training for Few-Shot Learning of Language Model [61.173976954360334]
ラベル付きデータにはタスク関連情報が豊富に含まれており、言語モデルの素早い学習に有用であることが証明されている。
本研究では,言語モデルファインチューニングのための自己学習手法を再検討し,最先端のプロンプトベースの少ショット学習者,SFLMを提案する。
論文 参考訳(メタデータ) (2021-10-04T08:51:36Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。