論文の概要: TFM Dataset: A Novel Multi-task Dataset and Integrated Pipeline for Automated Tear Film Break-Up Segmentation
- arxiv url: http://arxiv.org/abs/2510.05615v2
- Date: Wed, 08 Oct 2025 04:45:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 12:02:36.810849
- Title: TFM Dataset: A Novel Multi-task Dataset and Integrated Pipeline for Automated Tear Film Break-Up Segmentation
- Title(参考訳): TFMデータセット: 自動ティアフィルムブレークアップセグメンテーションのための新しいマルチタスクデータセットと統合パイプライン
- Authors: Guangrong Wan, Jun liu, Qiyang Zhou, Tang tang, Lianghao Shi, Wenjun Luo, TingTing Xu,
- Abstract要約: 本稿では,Tear Film Multi-task(TFM)データセットについて紹介する。
まず,新しい,効率的なベースラインセグメンテーションモデルTF-Netを提案する。
さらに、TF-Netと最先端の医療画像セグメンテーションモデルを比較して、TFMセグメンテーションサブセットのベンチマーク性能を確立した。
- 参考スコア(独自算出の注目度): 7.6676819542503525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tear film break-up (TFBU) analysis is critical for diagnosing dry eye syndrome, but automated TFBU segmentation remains challenging due to the lack of annotated datasets and integrated solutions. This paper introduces the Tear Film Multi-task (TFM) Dataset, the first comprehensive dataset for multi-task tear film analysis, comprising 15 high-resolution videos (totaling 6,247 frames) annotated with three vision tasks: frame-level classification ('clear', 'closed', 'broken', 'blur'), Placido Ring detection, and pixel-wise TFBU area segmentation. Leveraging this dataset, we first propose TF-Net, a novel and efficient baseline segmentation model. TF-Net incorporates a MobileOne-mini backbone with re-parameterization techniques and an enhanced feature pyramid network to achieve a favorable balance between accuracy and computational efficiency for real-time clinical applications. We further establish benchmark performance on the TFM segmentation subset by comparing TF-Net against several state-of-the-art medical image segmentation models. Furthermore, we design TF-Collab, a novel integrated real-time pipeline that synergistically leverages models trained on all three tasks of the TFM dataset. By sequentially orchestrating frame classification for BUT determination, pupil region localization for input standardization, and TFBU segmentation, TF-Collab fully automates the analysis. Experimental results demonstrate the effectiveness of the proposed TF-Net and TF-Collab, providing a foundation for future research in ocular surface diagnostics. Our code and the TFM datasets are available at https://github.com/glory-wan/TF-Net
- Abstract(参考訳): Tear Film Break-up (TFBU) 解析はドライアイ症候群の診断に重要であるが、注釈付きデータセットや統合ソリューションが欠如しているため、自動TFBUセグメンテーションは依然として困難である。
本稿では,フレームレベルの分類(「クラー」,「クローズド」,「ブローク」,「ブラー」),プラシドリング検出(Placido Ring),及びTFBU領域分割(Pixel-wise TFBU area segmentation)という,3つのビジョンタスクを付加した15の高解像度ビデオ(トータリング6,247フレーム)からなる,マルチタスク涙膜解析のための最初の包括的データセットであるTFMデータセットを紹介する。
このデータセットを利用して、我々はまず、新しい効率的なベースラインセグメンテーションモデルであるTF-Netを提案する。
TF-NetはMobileOne-miniのバックボーンに再パラメータ化技術と拡張された機能ピラミッドネットワークを備えており、リアルタイム臨床応用における精度と計算効率のバランスが良好である。
さらに、TF-Netと最先端の医療画像セグメンテーションモデルを比較して、TFMセグメンテーションサブセットのベンチマーク性能を確立した。
さらに、TF-Collabを設計する。TF-Collabは、TFMデータセットの3つのタスクすべてで訓練されたモデルを相乗的に活用する、新しい統合リアルタイムパイプラインである。
BUT判定のためのフレーム分類、入力標準化のための瞳孔領域ローカライゼーション、TFBUセグメンテーションを逐次オーケストレーションすることにより、TF-Collabは解析を完全に自動化する。
実験により提案したTF-NetとTF-Collabの有効性が示され,眼表面診断研究の基盤となる。
私たちのコードとFMデータセットはhttps://github.com/glory-wan/TF-Netで公開されています。
関連論文リスト
- AutoMiSeg: Automatic Medical Image Segmentation via Test-Time Adaptation of Foundation Models [11.00876772668728]
本稿では,視覚言語とセグメンテーション基礎モデルを組み合わせたゼロショット自動セグメンテーションパイプラインを提案する。
我々のパイプラインは7つの多様な医用画像データセットに基づいて評価され、有望な結果を示す。
論文 参考訳(メタデータ) (2025-05-23T14:07:21Z) - Multimodality Helps Few-shot 3D Point Cloud Semantic Segmentation [61.91492500828508]
FS-PCS (Few-shot 3D point cloud segmentation) は、最小のサポートサンプルで新しいカテゴリを分割するモデルを一般化することを目的としている。
テキストラベルと潜在的に利用可能な2次元画像モダリティを利用したマルチモーダルFS-PCS構成を提案する。
トレーニングバイアスを軽減するため,テスト時間適応型クロスモーダル(TACC)技術を提案する。
論文 参考訳(メタデータ) (2024-10-29T19:28:41Z) - MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Video-TransUNet: Temporally Blended Vision Transformer for CT VFSS
Instance Segmentation [11.575821326313607]
本稿では,TransUNetの深層学習フレームワークに時間的特徴ブレンドを組み込んだ医療用CTビデオのセグメンテーションのための深層アーキテクチャであるVideo-TransUNetを提案する。
特に,提案手法は,ResNet CNNバックボーンによるフレーム表現,テンポラルコンテキストモジュールによるマルチフレーム機能ブレンディング,UNetベースの畳み込みデコナールアーキテクチャによる複数ターゲットの再構築,などを実現する。
論文 参考訳(メタデータ) (2022-08-17T14:28:58Z) - Adaptive graph convolutional networks for weakly supervised anomaly
detection in videos [42.3118758940767]
本稿では,映像セグメント間のコンテキスト関係をモデル化するために,弱教師付き適応グラフ畳み込みネットワーク(WAGCN)を提案する。
各セグメントの異常確率スコアを生成する際に、他のビデオセグメントが現在のセグメントに与える影響を十分に検討する。
論文 参考訳(メタデータ) (2022-02-14T06:31:34Z) - MDMMT: Multidomain Multimodal Transformer for Video Retrieval [63.872634680339644]
MSRVTTおよびLSMDCベンチマークのテキストからビデオ検索タスクに新しい最新技術を紹介します。
異なるデータセットでのトレーニングは、互いにテスト結果を改善することができることを示す。
論文 参考訳(メタデータ) (2021-03-19T09:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。