論文の概要: APTOS-2024 challenge report: Generation of synthetic 3D OCT images from fundus photographs
- arxiv url: http://arxiv.org/abs/2506.07542v1
- Date: Mon, 09 Jun 2025 08:29:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.866618
- Title: APTOS-2024 challenge report: Generation of synthetic 3D OCT images from fundus photographs
- Title(参考訳): APTOS-2024 Challenge Report: Generation of synthetic 3D OCT images from fundus photos (特集 バイオサイバネティックスとバイオサイバネティックス)
- Authors: Bowen Liu, Weiyi Zhang, Peranut Chotcomwongse, Xiaolan Chen, Ruoyu Chen, Pawin Pakaymaskul, Niracha Arjkongharn, Nattaporn Vongsa, Xuelian Cheng, Zongyuan Ge, Kun Huang, Xiaohui Li, Yiru Duan, Zhenbang Wang, BaoYe Xie, Qiang Chen, Huazhu Fu, Michael A. Mahr, Jiaqi Qu, Wangyiyang Chen, Shiye Wang, Yubo Tan, Yongjie Li, Mingguang He, Danli Shi, Paisan Ruamviboonsuk,
- Abstract要約: アジア太平洋眼科会(Asia Pacific Tele-Ophthalmology Society)は、人工知能に基づくOCT生成(OCT Generation from Fundus Images)という課題を組織した。
本稿では、ベンチマークデータセットを含むチャレンジフレームワーク(APTOS-2024 Challenge)について詳述する。
このチャレンジには342チームが参加し、42の予備出場と9人のファイナリストが参加した。
- 参考スコア(独自算出の注目度): 42.58128666405841
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Optical Coherence Tomography (OCT) provides high-resolution, 3D, and non-invasive visualization of retinal layers in vivo, serving as a critical tool for lesion localization and disease diagnosis. However, its widespread adoption is limited by equipment costs and the need for specialized operators. In comparison, 2D color fundus photography offers faster acquisition and greater accessibility with less dependence on expensive devices. Although generative artificial intelligence has demonstrated promising results in medical image synthesis, translating 2D fundus images into 3D OCT images presents unique challenges due to inherent differences in data dimensionality and biological information between modalities. To advance generative models in the fundus-to-3D-OCT setting, the Asia Pacific Tele-Ophthalmology Society (APTOS-2024) organized a challenge titled Artificial Intelligence-based OCT Generation from Fundus Images. This paper details the challenge framework (referred to as APTOS-2024 Challenge), including: the benchmark dataset, evaluation methodology featuring two fidelity metrics-image-based distance (pixel-level OCT B-scan similarity) and video-based distance (semantic-level volumetric consistency), and analysis of top-performing solutions. The challenge attracted 342 participating teams, with 42 preliminary submissions and 9 finalists. Leading methodologies incorporated innovations in hybrid data preprocessing or augmentation (cross-modality collaborative paradigms), pre-training on external ophthalmic imaging datasets, integration of vision foundation models, and model architecture improvement. The APTOS-2024 Challenge is the first benchmark demonstrating the feasibility of fundus-to-3D-OCT synthesis as a potential solution for improving ophthalmic care accessibility in under-resourced healthcare settings, while helping to expedite medical research and clinical applications.
- Abstract(参考訳): 光コヒーレンス・トモグラフィ(OCT)は、高分解能、3D、非侵襲的な網膜層の可視化を生体内で提供し、病変の局在と疾患診断の重要なツールとして機能する。
しかし、その普及は設備コストと専門事業者の必要性によって制限されている。
対照的に、2Dカラー写真は、より高速な取得とアクセシビリティを提供し、高価なデバイスに依存しない。
生成人工知能は医用画像合成において有望な結果を示してきたが、2Dファウンダス画像を3D OCT画像に変換することは、データ次元とモダリティ間の生物学的情報に固有の違いがあるため、独特な課題を呈している。
ファンドス・トゥ・3D-OCT設定における生成モデルを推し進めるため、アジア太平洋眼科会(APTOS-2024)は、ファンドス・イメージからのOCT生成という題名の挑戦を組織した。
本稿では,APTOS-2024 Challengeと呼ばれる課題の枠組みを詳述する。ベンチマークデータセット,2つの忠実度指標に基づく距離(画素レベル OCT B-scan 類似性)とビデオベース距離(シーケンスレベルボリューム整合性)を備えた評価手法,トップパフォーマンスソリューションの解析などである。
このチャレンジには342チームが参加し、42の予備出場と9人のファイナリストが参加した。
リードする方法論は、ハイブリッドデータ前処理や拡張(モダリティ間の協調パラダイム)、外眼画像データセットの事前トレーニング、ビジョン基盤モデルの統合、モデルアーキテクチャの改善に革新をもたらした。
APTOS-2024 Challengeは、基礎から3D-OCT合成の実現可能性を示す最初のベンチマークである。
関連論文リスト
- RetinaLogos: Fine-Grained Synthesis of High-Resolution Retinal Images Through Captions [15.499798559622528]
RetinaLogos-1400kは、140万のエントリからなる大規模で合成的なCaption-CFPデータセットである。
我々はRetinaLogosと呼ばれる新しい3段階のトレーニングフレームワークを採用し、網膜画像のきめ細かいセマンティック制御を可能にする。
実験では、複数のデータセットにまたがって最先端のパフォーマンスを示し、62.07%のテキスト駆動合成画像が眼科医によって実際のものと区別できない。
論文 参考訳(メタデータ) (2025-05-19T09:18:11Z) - The Quest for Early Detection of Retinal Disease: 3D CycleGAN-based Translation of Optical Coherence Tomography into Confocal Microscopy [11.321411104729002]
生体内OCTを生体内共焦点顕微鏡画像に変換するために, 教師なし3D CycleGANに基づく新しいフレームワークを提案する。
これは、OCTの固有の3D情報を利用して、共焦点顕微鏡のリッチで詳細な色領域に変換する最初の試みである。
論文 参考訳(メタデータ) (2024-08-07T21:13:49Z) - QUBIQ: Uncertainty Quantification for Biomedical Image Segmentation Challenge [93.61262892578067]
医用画像分割作業の不確実性、特にラター間変動性は重要な課題である。
この可変性は、自動セグメンテーションアルゴリズムの開発と評価に直接影響を及ぼす。
バイオメディカル画像量化チャレンジ(QUBIQ)における不確実性の定量化のベンチマーク結果を報告する。
論文 参考訳(メタデータ) (2024-03-19T17:57:24Z) - AI-based association analysis for medical imaging using latent-space geometric confounder correction [6.1230206418222615]
本研究は, 人工知能に基づく医用画像解析におけるコンバウンディング効果と解釈可能性の課題について論じる。
本稿では,画像データに代えて,共同設立者関係の情報を潜在表現として保持する戦略を提案する。
その結果、共同設立者の影響力を減らし、誤りや誤解を招く協会を予防し、臨床・疫学研究者による詳細な調査にユニークな視覚的解釈を提供する方法の有効性が確認された。
論文 参考訳(メタデータ) (2023-10-03T16:09:07Z) - DRAC: Diabetic Retinopathy Analysis Challenge with Ultra-Wide Optical
Coherence Tomography Angiography Images [51.27125547308154]
第25回医用画像コンピューティング・コンピュータ支援介入国際会議(MICCAI 2022)にともなうDRAC糖尿病網膜症解析チャレンジの企画を行った。
この課題は、DR病変の分節化、画像品質評価、DRグレーディングの3つのタスクから構成される。
本稿では,課題の各課題について,トップパフォーマンスのソリューションと結果の要約と分析を行う。
論文 参考訳(メタデータ) (2023-04-05T12:04:55Z) - FetReg2021: A Challenge on Placental Vessel Segmentation and
Registration in Fetoscopy [52.3219875147181]
2-Twin Transfusion Syndrome (TTTS) に対するレーザー光凝固法が広く採用されている。
このプロシージャは、視野が限られたこと、フェトスコープの操作性が悪いこと、視認性が悪いこと、照明の変動性のために特に困難である。
コンピュータ支援介入(CAI)は、シーン内の重要な構造を特定し、ビデオモザイクを通して胎児の視野を広げることで、外科医に意思決定支援と文脈認識を提供する。
7つのチームがこの課題に参加し、そのモデルパフォーマンスを、6フェットから658ピクセルの注釈付き画像の見当たらないテストデータセットで評価した。
論文 参考訳(メタデータ) (2022-06-24T23:44:42Z) - OADAT: Experimental and Synthetic Clinical Optoacoustic Data for
Standardized Image Processing [62.993663757843464]
オプトアコースティック(OA)イメージングは、ナノ秒レーザーパルスによる生体組織の励起と、光吸収による熱弾性膨張によって発生する超音波の検出に基づいている。
OAイメージングは、深部組織における豊富な光学コントラストと高分解能の強力な組み合わせを特徴としている。
臨床環境でのOAの幅広い応用を促進するために、異なるタイプの実験的なセットアップと関連する処理手法で生成される標準化データセットは存在しない。
論文 参考訳(メタデータ) (2022-06-17T08:11:26Z) - REFUGE2 Challenge: Treasure for Multi-Domain Learning in Glaucoma
Assessment [45.41988445653055]
REFUGE2チャレンジでは、Zeiss、Canon、Kowa、Topconを含む4つのモデルの2000枚のカラー・ファンドイメージがリリースされた。
3つのサブタスクは緑内障分類、カップ/光ディスクセグメンテーション、黄斑葉の局在などの課題のために設計された。
この記事では、ファイナリストのメソッドを要約し、その結果を分析します。
論文 参考訳(メタデータ) (2022-02-18T02:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。