論文の概要: Self-supervised Learning of Echocardiographic Video Representations via Online Cluster Distillation
- arxiv url: http://arxiv.org/abs/2506.11777v1
- Date: Fri, 13 Jun 2025 13:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.81264
- Title: Self-supervised Learning of Echocardiographic Video Representations via Online Cluster Distillation
- Title(参考訳): オンラインクラスタ蒸留による心エコー画像表現の自己教師付き学習
- Authors: Divyanshu Mishra, Mohammadreza Salehi, Pramit Saha, Olga Patey, Aris T. Papageorghiou, Yuki M. Asano, J. Alison Noble,
- Abstract要約: 心エコービデオ表現学習のための自己教師型デュアルブランチフレームワークであるdisCOVRについて述べる。
DISCOVRは、時間的ダイナミクスをモデル化するクラスタリングベースのビデオエンコーダと、きめ細かい空間意味論を抽出するオンライン画像エンコーダを組み合わせる。
- 参考スコア(独自算出の注目度): 21.738308923180767
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning (SSL) has achieved major advances in natural images and video understanding, but challenges remain in domains like echocardiography (heart ultrasound) due to subtle anatomical structures, complex temporal dynamics, and the current lack of domain-specific pre-trained models. Existing SSL approaches such as contrastive, masked modeling, and clustering-based methods struggle with high intersample similarity, sensitivity to low PSNR inputs common in ultrasound, or aggressive augmentations that distort clinically relevant features. We present DISCOVR (Distilled Image Supervision for Cross Modal Video Representation), a self-supervised dual branch framework for cardiac ultrasound video representation learning. DISCOVR combines a clustering-based video encoder that models temporal dynamics with an online image encoder that extracts fine-grained spatial semantics. These branches are connected through a semantic cluster distillation loss that transfers anatomical knowledge from the evolving image encoder to the video encoder, enabling temporally coherent representations enriched with fine-grained semantic understanding. Evaluated on six echocardiography datasets spanning fetal, pediatric, and adult populations, DISCOVR outperforms both specialized video anomaly detection methods and state-of-the-art video-SSL baselines in zero-shot and linear probing setups, and achieves superior segmentation transfer.
- Abstract(参考訳): 自己教師付き学習(SSL)は、自然画像やビデオ理解において大きな進歩を遂げてきたが、微妙な解剖学的構造、複雑な時間的ダイナミクス、ドメイン固有の事前訓練モデルの欠如など、心エコー(心臓超音波)のような領域では課題が残っている。
既存のSSLアプローチであるコントラッシブ、マスクドモデリング、クラスタリングに基づく手法は、高いサンプル間類似性、超音波に共通する低いPSNR入力に対する感度、あるいは臨床的に関係のある特徴を歪ませる攻撃的な拡張に苦慮している。
DisCOVR(Distilled Image Supervision for Cross Modal Video Representation)は,心エコービデオ表現学習のための,自己教師付きデュアルブランチフレームワークである。
DISCOVRは、時間的ダイナミクスをモデル化するクラスタリングベースのビデオエンコーダと、きめ細かい空間意味論を抽出するオンライン画像エンコーダを組み合わせる。
これらの分岐は、進化する画像エンコーダからビデオエンコーダに解剖学的知識を伝達するセマンティッククラスタ蒸留損失によって接続され、微細なセマンティック理解に富んだ時間的コヒーレントな表現を可能にする。
DisCOVRは、胎児、小児、成人の6つのエコー心電図データセットに基づいて、ゼロショットおよびリニア・プロービングのセットアップにおいて、特殊なビデオ異常検出方法と最先端のビデオ-SSLベースラインの両方を上回り、より優れたセグメンテーション転送を実現する。
関連論文リスト
- EchoWorld: Learning Motion-Aware World Models for Echocardiography Probe Guidance [79.66329903007869]
本稿では,プローブ誘導のためのモーションアウェアな世界モデリングフレームワークであるEchoWorldを紹介する。
解剖学的な知識と運動によって引き起こされる視覚力学を符号化する。
200以上の定期的なスキャンから100万枚以上の超音波画像で訓練されている。
論文 参考訳(メタデータ) (2025-04-17T16:19:05Z) - HDC: Hierarchical Distillation for Multi-level Noisy Consistency in Semi-Supervised Fetal Ultrasound Segmentation [2.964206587462833]
HDCと呼ばれる新しい半教師付きセグメンテーションフレームワークが提案されている。
この枠組みは,特徴表現の整合化のための相関誘導損失と,雑音の多い学生学習を安定化するための相互情報損失の2つの目的を持つ階層的蒸留機構を導入している。
論文 参考訳(メタデータ) (2025-04-14T04:52:24Z) - Automatic Left Ventricular Cavity Segmentation via Deep Spatial Sequential Network in 4D Computed Tomography Studies [20.358413194053103]
心電図を自動分割する新しい手法を提案する。
空間シーケンシャル(SS)ネットワークを導入し,LVCの変形特性と運動特性を教師なしで学習する。
心電図(CT)データセットを用いて,双方向学習法(SS-BL)を用いたネットワークが従来のLCVセグメンテーション法より優れていたことを実証した。
論文 参考訳(メタデータ) (2024-12-17T12:29:32Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - OnUVS: Online Feature Decoupling Framework for High-Fidelity Ultrasound
Video Synthesis [34.07625938756013]
ソノグラフィーは、包括的な情報を集めるために対応する動的解剖構造を観察しなければならない。
アメリカのビデオの合成は、この問題に対する有望な解決策になるかもしれない。
我々は,高忠実度USビデオ合成のためのオンライン機能分離フレームワークOnUVSを提案する。
論文 参考訳(メタデータ) (2023-08-16T10:16:50Z) - Echocardiography Segmentation Using Neural ODE-based Diffeomorphic
Registration Field [0.0]
本稿ではニューラル常微分方程式(ニューラルODE)を用いた新しい拡散画像登録法を提案する。
提案手法であるEcho-ODEでは,従来の最先端技術と比較して,いくつかの改良が加えられている。
その結果,本手法は過去の最先端技術よりも多面的に優れていることがわかった。
論文 参考訳(メタデータ) (2023-06-16T08:37:27Z) - Joint fMRI Decoding and Encoding with Latent Embedding Alignment [77.66508125297754]
我々はfMRIデコーディングと符号化の両方に対処する統合フレームワークを導入する。
本モデルでは、fMRI信号から視覚刺激を同時に回復し、統合された枠組み内の画像から脳活動を予測する。
論文 参考訳(メタデータ) (2023-03-26T14:14:58Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - Unsupervised multi-latent space reinforcement learning framework for
video summarization in ultrasound imaging [0.0]
新型コロナウイルス(COVID-19)のパンデミックは、超音波スキャンのトリアージを高速化するツールの必要性を強調している。
提案手法は,この方向への一歩である。
そこで我々は,新しい報酬を伴う教師なし強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-03T04:50:35Z) - Relational Graph Learning on Visual and Kinematics Embeddings for
Accurate Gesture Recognition in Robotic Surgery [84.73764603474413]
本稿では,マルチモーダルグラフネットワーク(MRG-Net)の新たなオンラインアプローチを提案し,視覚情報とキネマティクス情報を動的に統合する。
本手法の有効性は, JIGSAWSデータセット上での最先端の成果で実証された。
論文 参考訳(メタデータ) (2020-11-03T11:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。