論文の概要: Respiratory Status Detection with Video Transformers
- arxiv url: http://arxiv.org/abs/2603.21349v1
- Date: Sun, 22 Mar 2026 18:16:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.371916
- Title: Respiratory Status Detection with Video Transformers
- Title(参考訳): ビデオトランスを用いた呼吸状態検出
- Authors: Thomas Savage, Evan Madill,
- Abstract要約: ビデオトランスの最近の進歩により、人工知能システムがビデオからの呼吸障害の兆候を認識できるかどうかを評価する。
以上の結果から,現代のビデオトランスフォーマーは呼吸力学の微妙な変化を認識できる可能性が示唆された。
- 参考スコア(独自算出の注目度): 1.1101763410958634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognition of respiratory distress through visual inspection is a life saving clinical skill. Clinicians can detect early signs of respiratory deterioration, creating a valuable window for earlier intervention. In this study, we evaluate whether recent advances in video transformers can enable Artificial Intelligence systems to recognize the signs of respiratory distress from video. We collected videos of healthy volunteers recovering after strenuous exercise and used the natural recovery of each participants respiratory status to create a labeled dataset for respiratory distress. Splitting the video into short clips, with earlier clips corresponding to more shortness of breath, we designed a temporal ordering challenge to assess whether an AI system can detect respiratory distress. We found a ViViT encoder augmented with Lie Relative Encodings (LieRE) and Motion Guided Masking, combined with an embedding based comparison strategy, can achieve an F1 score of 0.81 on this task. Our findings suggest that modern video transformers can recognize subtle changes in respiratory mechanics.
- Abstract(参考訳): 視覚検査による呼吸障害の認識は、救命医療技術である。
臨床医は呼吸障害の早期の兆候を検知し、早期介入のための貴重な窓を作ることができる。
本研究では,近年のビデオトランスフォーマーの進歩により,映像からの呼吸障害の兆候を認識することができるかどうかを評価する。
激しい運動の後,健常者が回復する様子をビデオで収集し,各被験者の呼吸状態の自然回復を利用して,呼吸窮迫感のラベル付きデータセットを作成した。
映像を短いクリップに分割し、呼吸の短さに対応する以前のクリップを用いて、AIシステムが呼吸困難を検知できるかどうかを時間順に判断する課題を考案した。
We found a ViViT encoder augmented with Lie Relative Encodings (LieRE) and Motion Guided Masking, with a embedding based comparison strategy, can achieve a F1 score of 0.81。
以上の結果から,現代のビデオトランスフォーマーは呼吸力学の微妙な変化を認識できる可能性が示唆された。
関連論文リスト
- EchoLVFM: One-Step Video Generation via Latent Flow Matching for Echocardiogram Synthesis [1.703077957571322]
本稿では,1段階の遅延ビデオフローマッチングフレームワークであるEchoLVFMを紹介する。
潜時空間で動作するEchoLVFMは、時間的にコヒーレントなビデオを単一の推論ステップで合成する。
その結果、競争力のあるビデオ品質、強いEFの定着、および専門医による57.9%の識別精度が示された。
論文 参考訳(メタデータ) (2026-03-14T14:39:09Z) - Pediatric Asthma Detection with Googles HeAR Model: An AI-Driven Respiratory Sound Classifier [0.8463972278020965]
この研究は、小児の呼吸音から喘息の早期徴候を検出するために、AIを利用した診断パイプラインを提供する。
SPRSoundデータセットは、ホイーズ、クラックル、ロンチ、ストリドール、ノーマルとラベル付けされた2秒のオーディオセグメントを抽出するために使用される。
このシステムは91%以上の精度を達成し、正の場合の精度・リコールの指標に対して高い性能を発揮する。
論文 参考訳(メタデータ) (2025-04-28T12:52:17Z) - Machine learning-based algorithms for at-home respiratory disease monitoring and respiratory assessment [45.104212062055424]
本研究の目的は、在宅呼吸器疾患のモニタリングと評価を容易にする機械学習ベースのアルゴリズムを開発することである。
健常成人30名を対象に, 呼吸圧, 血流, 胸腹部周囲の動的計測を行った。
ランダムフォレスト分類器、ロジスティック回帰、サポートベクターマシン(SVM)など、さまざまな機械学習モデルをトレーニングし、呼吸タイプを予測する。
論文 参考訳(メタデータ) (2024-09-05T02:14:31Z) - Using BOLD-fMRI to Compute the Respiration Volume per Time (RTV) and
Respiration Variation (RV) with Convolutional Neural Networks (CNN) in the
Human Connectome Development Cohort [55.41644538483948]
本研究では, RVとRVTの2つの呼吸対策を再現するための1次元CNNモデルを提案する。
その結果、CNNはBOLD信号の静止から情報的特徴を捉え、現実的なRVとRVTのタイムリーを再構築できることがわかった。
論文 参考訳(メタデータ) (2023-07-03T18:06:36Z) - REGAS: REspiratory-GAted Synthesis of Views for Multi-Phase CBCT
Reconstruction from a single 3D CBCT Acquisition [75.64791080418162]
REGASは、アンダーサンプドトモグラフィビューを合成し、再構成画像中のアーティファクトのエイリアスを緩和する自己教師手法を提案する。
高解像度4Dデータ上でのディープニューラルネットワークの大規模なメモリコストに対処するため、REGASは分散して微分可能なフォワードプロジェクションを可能にする新しいレイパス変換(RPT)を導入した。
論文 参考訳(メタデータ) (2022-08-17T03:42:19Z) - D'ARTAGNAN: Counterfactual Video Generation [3.4079278794252232]
因果的対応の機械学習フレームワークは、臨床医がカウンターファクトの質問に答えることで、治療の最良のコースを特定するのに役立つ。
我々は、D'ARTAGNANを構築するために、ディープニューラルネットワーク、ツイン因果ネットワーク、および生成的敵法を初めて組み合わせる。
新しい超音波ビデオを生成し, 所定の入力に設定したエジェクション・フラクションのバリエーションを用いて, 元の患者の映像スタイルと解剖を保ちながら, 超音波ビデオを生成する。
論文 参考訳(メタデータ) (2022-06-03T15:53:32Z) - An Apparatus for the Simulation of Breathing Disorders: Physically
Meaningful Generation of Surrogate Data [24.50116388903113]
健常者における閉塞性および拘束性呼吸波形の両方をシミュレートする簡便かつ効果的な方法として,PVCチューブと3Dプリント部品からなる装置を提案する。
呼吸抵抗と呼吸抵抗の両方を独立に制御することで、FEV1/FVCの吸気比の全スペクトルを通して閉塞性呼吸障害をシミュレーションすることができる。
人工呼吸障害シミュレーション装置の使用による波形においても、吸気義務周期の変化やピークフローの変化などの呼吸障害の波形特性が観察される。
論文 参考訳(メタデータ) (2021-09-14T14:00:37Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - 2-D Respiration Navigation Framework for 3-D Continuous Cardiac Magnetic
Resonance Imaging [61.701281723900216]
連続スキャン中に2次元呼吸情報を得るためのサンプリング適応を提案する。
我々は、取得した信号から異なる呼吸状態を抽出し、ある呼吸相からデータを再構成するパイプラインを開発した。
論文 参考訳(メタデータ) (2020-12-26T08:29:57Z) - Collaborative Three-Tier Architecture Non-contact Respiratory Rate
Monitoring using Target Tracking and False Peaks Eliminating Algorithms [10.232449356645608]
非接触呼吸モニタリング技術は、照明やモーションアーティファクトのような環境の影響に敏感であるため、精度が低い。
ユーザとクラウド間の頻繁な接触は、サービス要求の遅延と、個人情報の喪失を引き起こす可能性がある。
我々は,呼吸モニタリングの精度を高め,データ伝送遅延を低減するために,協調的な3層設計による非接触呼吸率モニタリングシステムを提案した。
論文 参考訳(メタデータ) (2020-11-17T07:33:00Z) - VideoForensicsHQ: Detecting High-quality Manipulated Face Videos [77.60295082172098]
偽造検知器の性能は、人間の目で見られる人工物の存在にどのように依存するかを示す。
前例のない品質の顔ビデオ偽造検出のための新しいベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2020-05-20T21:17:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。