論文の概要: AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs
- arxiv url: http://arxiv.org/abs/2503.18141v1
- Date: Sun, 23 Mar 2025 17:12:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 16:32:17.008212
- Title: AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs
- Title(参考訳): AGIR:LLMに基づく推論による3次元歩行障害の評価
- Authors: Diwei Wang, Cédric Bobenrieth, Hyewon Seo,
- Abstract要約: 歩行障害は、神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を果たす。
近年のディープラーニングベースのアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多い。
本稿では、事前訓練されたVQ-VAEモーショントークンライザと、一対のモーショントークン上で微調整されたLarge Language Model(LLM)からなる新しいパイプラインであるAGIRを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Assessing gait impairment plays an important role in early diagnosis, disease monitoring, and treatment evaluation for neurodegenerative diseases. Despite its widespread use in clinical practice, it is limited by subjectivity and a lack of precision. While recent deep learning-based approaches have consistently improved classification accuracies, they often lack interpretability, hindering their utility in clinical decision-making. To overcome these challenges, we introduce AGIR, a novel pipeline consisting of a pre-trained VQ-VAE motion tokenizer and a subsequent Large Language Model (LLM) fine-tuned over pairs of motion tokens and Chain-of-Thought (CoT) reasonings. To fine-tune an LLM for pathological gait analysis, we first introduce a multimodal dataset by adding rationales dedicated to MDS-UPDRS gait score assessment to an existing PD gait dataset. We then introduce a two-stage supervised fine-tuning (SFT) strategy to enhance the LLM's motion comprehension with pathology-specific knowledge. This strategy includes: 1) a generative stage that aligns gait motions with analytic descriptions through bidirectional motion-description generation, 2) a reasoning stage that integrates logical Chain-of-Thought (CoT) reasoning for impairment assessment with UPDRS gait score. Validation on an existing dataset and comparisons with state-of-the-art methods confirm the robustness and accuracy of our pipeline, demonstrating its ability to assign gait impairment scores from motion input with clinically meaningful rationales.
- Abstract(参考訳): 歩行障害の評価は神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を担っている。
臨床で広く用いられているにもかかわらず、主観性と精度の欠如によって制限されている。
近年の深層学習に基づくアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多く、臨床的な意思決定における有用性を妨げている。
これらの課題を克服するために、我々は、事前訓練されたVQ-VAEモーショントークンライザと、その後のLarge Language Model(LLM)と、一連のモーショントークンとChain-of-Thought(CoT)推論を微調整した新しいパイプラインであるAGIRを紹介する。
まず,MDS-UPDRS歩行スコア評価専用の根拠を既存のPD歩行データセットに付加することにより,マルチモーダルデータセットを導入する。
次に2段階の教師付き微調整(SFT)戦略を導入し,病理学的知識によるLCMの動作理解を強化する。
この戦略には以下のものがある。
1) 歩行動作を双方向動作記述生成による解析記述と整合させる生成段階。
2)UPDRS歩行スコアによる障害評価のための論理的連鎖(CoT)推論を統合する推論段階。
既存のデータセットの検証と最先端の手法との比較により、パイプラインの堅牢性と正確性を確認し、臨床的に有意な有理性を持つモーション入力から歩行障害スコアを割り当てる能力を示す。
関連論文リスト
- PathVLM-R1: A Reinforcement Learning-Driven Reasoning Model for Pathology Visual-Language Tasks [15.497221591506625]
病理画像に特化して設計された視覚言語モデルPathVLM-R1を提案する。
我々は,Qwen2.5-VL-7B-インストラクタをベースとして,厳密に設計したポストトレーニング戦略により,病理的タスクのパフォーマンスを向上させた。
論文 参考訳(メタデータ) (2025-04-12T15:32:16Z) - Cognitive-Mental-LLM: Leveraging Reasoning in Large Language Models for Mental Health Prediction via Online Text [0.0]
本研究では,Reddit から得られた複数のメンタルヘルスデータセットの分類精度を向上させるため,構造化推論手法-Chain-of-Thought (CoT), Self-Consistency (SC-CoT), Tree-of-Thought (ToT) の評価を行った。
我々は,Zero-shot CoTやFew-shot CoTといった推論駆動型プロンプト戦略を,Ba balanced Accuracy,F1 score,Sensitivity/Specificityといった重要なパフォーマンス指標を用いて分析する。
以上の結果から,特に複雑な場合において,推論手法により直接予測よりも分類性能が向上することが示唆された。
論文 参考訳(メタデータ) (2025-03-13T06:42:37Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Enhancing Depression Detection with Chain-of-Thought Prompting: From Emotion to Reasoning Using Large Language Models [9.43184936918456]
うつ病は世界中で障害の主な原因の1つである。
大規模言語モデルの最近の進歩は、精神的な健康問題に対処する上で有望であることを示している。
そこで本研究では,抑うつ検出の性能と解釈性を両立するChain-of-Thought Prompting手法を提案する。
論文 参考訳(メタデータ) (2025-02-09T12:30:57Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Detecting Children with Autism Spectrum Disorder based on Script-Centric Behavior Understanding with Emotional Enhancement [9.55864687646197]
本稿では,ゼロショット自閉症スペクトラム(ASD)検出フレームワークを提案する。
提案したパイプラインは、コンピュータビジョン技術を用いて、音声・視覚データを構造化された行動テキストスクリプトに自動的に変換する。
平均年齢2歳児のASD診断におけるF1スコアは95.24%であり,解釈可能な検出基準が得られた。
論文 参考訳(メタデータ) (2024-11-14T13:07:19Z) - MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Taxonomy Adaptive Cross-Domain Adaptation in Medical Imaging via
Optimization Trajectory Distillation [73.83178465971552]
自動医用画像解析の成功は、大規模かつ専門家による注釈付きトレーニングセットに依存する。
非教師なしドメイン適応(UDA)はラベル付きデータ収集の負担を軽減するための有望なアプローチである。
本稿では,2つの技術的課題に新しい視点から対処する統一的手法である最適化トラジェクトリ蒸留を提案する。
論文 参考訳(メタデータ) (2023-07-27T08:58:05Z) - Towards Stroke Patients' Upper-limb Automatic Motor Assessment Using
Smartwatches [5.132618393976799]
スマートウォッチを用いて脳卒中患者に対する上肢評価パイプラインを設計することを目的としている。
本研究の目的は,Fugl-Meyerアセスメント尺度に触発された4つの重要な動きを自動的に検出し,認識することである。
論文 参考訳(メタデータ) (2022-12-09T14:00:49Z) - Deep Grading based on Collective Artificial Intelligence for AD
Diagnosis and Prognosis [0.0]
アルツハイマー病の診断と予後を自動化するための新しい枠組みを提案する。
フレームワークは2つの段階から構成される。第1段階では,意味のある特徴を抽出するための深い階調モデルを提案する。
第2段階では、ADシグネチャをよりよくキャプチャするために、グラフ畳み込みニューラルネットワークを使用します。
論文 参考訳(メタデータ) (2022-11-28T09:59:08Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。