論文の概要: Text-Guided Multi-Instance Learning for Scoliosis Screening via Gait Video Analysis
- arxiv url: http://arxiv.org/abs/2507.02996v1
- Date: Tue, 01 Jul 2025 22:13:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.512089
- Title: Text-Guided Multi-Instance Learning for Scoliosis Screening via Gait Video Analysis
- Title(参考訳): 歩行映像解析によるスコリシススクリーニングのためのテキストガイド型マルチインスタンス学習
- Authors: Haiqing Li, Yuzhi Guo, Feng Jiang, Thao M. Dang, Hehuan Ma, Qifeng Zhou, Jean Gao, Junzhou Huang,
- Abstract要約: 早期側頭症は、特に遅発性診断が重篤な健康問題を引き起こす青年期において、検出が困難である。
従来のX線ベースの方法は放射線リスクを持ち、臨床の専門知識に大きく依存し、大規模なスクリーニングでの使用を制限する。
歩行映像を用いた非侵襲的側頭症検出のためのテキストガイド型マルチインスタンス学習ネットワーク(TG-MILNet)を提案する。
- 参考スコア(独自算出の注目度): 33.88520129574637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early-stage scoliosis is often difficult to detect, particularly in adolescents, where delayed diagnosis can lead to serious health issues. Traditional X-ray-based methods carry radiation risks and rely heavily on clinical expertise, limiting their use in large-scale screenings. To overcome these challenges, we propose a Text-Guided Multi-Instance Learning Network (TG-MILNet) for non-invasive scoliosis detection using gait videos. To handle temporal misalignment in gait sequences, we employ Dynamic Time Warping (DTW) clustering to segment videos into key gait phases. To focus on the most relevant diagnostic features, we introduce an Inter-Bag Temporal Attention (IBTA) mechanism that highlights critical gait phases. Recognizing the difficulty in identifying borderline cases, we design a Boundary-Aware Model (BAM) to improve sensitivity to subtle spinal deviations. Additionally, we incorporate textual guidance from domain experts and large language models (LLM) to enhance feature representation and improve model interpretability. Experiments on the large-scale Scoliosis1K gait dataset show that TG-MILNet achieves state-of-the-art performance, particularly excelling in handling class imbalance and accurately detecting challenging borderline cases. The code is available at https://github.com/lhqqq/TG-MILNet
- Abstract(参考訳): 早期側頭症は、特に遅発性診断が重篤な健康問題を引き起こす青年期において、検出が困難であることが多い。
従来のX線ベースの方法は放射線リスクを持ち、臨床の専門知識に大きく依存し、大規模なスクリーニングでの使用を制限する。
これらの課題を克服するために,歩行映像を用いた非侵襲的側頭症検出のためのテキストガイド型マルチインスタンス学習ネットワーク(TG-MILNet)を提案する。
歩行系列における時間的ミスアライメントの処理には、ダイナミック・タイム・ウォーピング(DTW)クラスタリングを用い、動画を主要な歩行フェーズに分割する。
最も関連性の高い診断機能に焦点をあてるために、重要な歩行フェーズを強調するIBTA(Inter-Bag Temporal Attention)機構を導入する。
境界線症例を特定することの難しさを認識し, 微妙な脊髄偏差に対する感度を向上させるために境界線認識モデル(BAM)を設計する。
さらに、ドメインエキスパートや大規模言語モデル(LLM)からのテキストガイダンスを取り入れて、特徴表現の強化とモデル解釈性の向上を図る。
大規模なScooliosis1K Gaitデータセットの実験により、TG-MILNetは最先端のパフォーマンスを実現し、特にクラス不均衡の処理に優れ、挑戦的な境界線のケースを正確に検出できることが示されている。
コードはhttps://github.com/lhqqq/TG-MILNetで公開されている。
関連論文リスト
- Hide and Seek with LLMs: An Adversarial Game for Sneaky Error Generation and Self-Improving Diagnosis [51.88592148135258]
本稿では,エラー生成と診断のための動的対向フレームワークであるHie and Seek Game (HSG)を提案する。
HSGには2つの敵対的役割がある: Sneakyは、微妙で偽りの推論エラーを発生させることで「隠す」ことと、それらを正確に検出するために「探す」診断である。
いくつかの数学推論タスクの実験では、HSGはエラー診断を著しく向上し、GPT-4oのようなベースラインよりも16.8%--31.4%高い精度を達成している。
論文 参考訳(メタデータ) (2025-08-05T12:45:21Z) - Demographic-aware fine-grained classification of pediatric wrist fractures [3.4384440967420185]
特に骨折症例の多数を占める小児では、手首の病理が頻繁に見られる。
コンピュータビジョンは、広範囲なデータセットの利用可能性に応じて、有望な道を示す。
極めて限られたデータセットを用いて手首の病態を認識するという課題に対処するために,多面的アプローチを採用する。
論文 参考訳(メタデータ) (2025-07-17T10:03:57Z) - Leveraging Gait Patterns as Biomarkers: An attention-guided Deep Multiple Instance Learning Network for Scoliosis Classification [36.18242379097044]
スコリオーシス(Scooliosis)は、早期発見が困難で、胸腔を圧迫する脊椎曲率障害である。
従来のスコリシス検出法は臨床の専門知識に依存しており、X線イメージングは放射線リスクを生じさせる。
本稿では,歩行パターンから識別的特徴を効果的に捉えるために,注意誘導型深層多インスタンス学習法(Gait-MIL)を提案する。
論文 参考訳(メタデータ) (2025-04-04T19:35:33Z) - Pathological Prior-Guided Multiple Instance Learning For Mitigating Catastrophic Forgetting in Breast Cancer Whole Slide Image Classification [50.899861205016265]
乳癌のWSI分類における破滅的忘れを緩和する新しい枠組みであるPaGMILを提案する。
私たちのフレームワークでは、共通のMILモデルアーキテクチャに2つの重要なコンポーネントを導入しています。
複数の乳がんデータセットを対象としたPaGMILの連続学習性能の評価を行った。
論文 参考訳(メタデータ) (2025-03-08T04:51:58Z) - Gait Patterns as Biomarkers: A Video-Based Approach for Classifying Scoliosis [10.335383345968966]
スコリオーシスは、特に青年期において重要な診断上の課題を呈する。
従来の診断と追跡方法は、臨床専門知識と放射線曝露のリスクのために限界に直面している。
歩行分析を用いた新しいビデオベース非侵襲的スコリオーシス分類法を提案する。
論文 参考訳(メタデータ) (2024-07-08T08:29:02Z) - Diffusion Models with Ensembled Structure-Based Anomaly Scoring for Unsupervised Anomaly Detection [35.46541584018842]
非教師なし異常検出(UAD)は、病理分類の有効な代替手段として現れる。
近年のUAD異常スコアリング機能は、強度のみに焦点を合わせ、構造的差異を無視することが多く、セグメンテーション性能を損なう。
構造的類似性(SSIM)は強度と構造的格差の両方を捉え、古典的な$l1$エラーよりも有利である。
論文 参考訳(メタデータ) (2024-03-21T09:50:39Z) - Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning [65.54680361074882]
アイゲイズガイドマルチモーダルアライメント(EGMA)フレームワークは、アイゲイズデータを利用して、医用視覚的特徴とテキスト的特徴のアライメントを改善する。
我々は4つの医療データセット上で画像分類と画像テキスト検索の下流タスクを行う。
論文 参考訳(メタデータ) (2024-03-19T03:59:14Z) - Shape Matters: Detecting Vertebral Fractures Using Differentiable
Point-Based Shape Decoding [51.38395069380457]
変性性脊椎疾患は高齢者に多い。
骨粗しょう性骨折やその他の変性変形性骨折のタイムリーな診断は、重度の腰痛や障害のリスクを軽減するための前向きな処置を促進する。
本研究では,脊椎動物に対する形状自動エンコーダの使用について検討する。
論文 参考訳(メタデータ) (2023-12-08T18:11:22Z) - Deep Reinforcement Learning Framework for Thoracic Diseases
Classification via Prior Knowledge Guidance [49.87607548975686]
関連疾患に対するラベル付きデータの不足は、正確な診断にとって大きな課題となる。
本稿では,診断エージェントの学習を指導するための事前知識を導入する,新しい深層強化学習フレームワークを提案する。
提案手法の性能はNIHX-ray 14とCheXpertデータセットを用いて実証した。
論文 参考訳(メタデータ) (2023-06-02T01:46:31Z) - A Global and Patch-wise Contrastive Loss for Accurate Automated Exudate
Detection [12.669734891001667]
糖尿病網膜症(DR:diabetic retinopathy)は、視覚障害の主要な原因である。
硬口蓋の早期発見は、糖尿病の治療と視力喪失の予防に役立つDRの同定において重要な役割を担っている。
ハード・エクスデュート・セグメンテーションを最適化する新しい教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-22T17:39:00Z) - FetReg: Placental Vessel Segmentation and Registration in Fetoscopy
Challenge Dataset [57.30136148318641]
Fetoscopy Laser Photocoagulation はツイン・ツー・ツイン・トランスフュージョン症候群(TTTS)の治療に広く用いられている治療法である
これにより、プロシージャ時間と不完全アブレーションが増加し、持続的なTTTSが生じる可能性がある。
コンピュータ支援による介入は、ビデオモザイクによって胎児の視野を広げ、船体ネットワークのより良い視覚化を提供することによって、これらの課題を克服するのに役立つかもしれない。
本稿では,長期フェトスコープビデオからドリフトフリーモザイクを作成することを目的とした,胎児環境のための汎用的でロバストなセマンティックセマンティックセグメンテーションとビデオモザイクアルゴリズムを開発するための大規模マルチセントデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。