Fugu-MT 論文翻訳(概要): Contrastive Learning under Noisy Temporal Self-Supervision for Colonoscopy Videos

論文の概要: Contrastive Learning under Noisy Temporal Self-Supervision for Colonoscopy Videos

arxiv url: http://arxiv.org/abs/2605.12320v2
Date: Tue, 19 May 2026 14:33:39 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-21 01:01:02.77699
Title: Contrastive Learning under Noisy Temporal Self-Supervision for Colonoscopy Videos
Title（参考訳）: 大腸内視鏡画像における雑音を伴う時間的自己監督下でのコントラスト学習
Authors: Luca Parolari, Pietro Gori, Lamberto Ballan, Carlo Biffi, Loic Le Folgoc,
Abstract要約: ポリープ・トラックレットの堅牢な表現を学習することは、AIによる大腸内視鏡の応用を可能にする鍵となる。本研究では,大腸内視鏡手術の逐次的ワークフローを利用して,時間的構造から自己監督的関連を導出する。本稿では,ポリプ検索と再同定,サイズ推定,組織分類など,複数の下流タスクにおける学習表現の有効性を実証する。
参考スコア（独自算出の注目度）: 8.245519663146586
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Learning robust representations of polyp tracklets is key to enabling multiple AI-assisted colonoscopy applications, from polyp characterization to automated reporting and retrieval. Supervised contrastive learning is an effective approach for learning such representations, but it typically relies on correct positive and negative definitions. Collecting these labels requires linking tracklets that depict the same underlying polyp entity throughout the video, which is costly and demands specialized clinical expertise. In this work, we leverage the sequential workflow of colonoscopy procedures to derive self-supervised associations from temporal structure. Since temporally derived associations are not guaranteed to be correct, we introduce a noise-aware contrastive loss to account for noisy associations. We demonstrate the effectiveness of the learned representations across multiple downstream tasks, including polyp retrieval and re-identification, size estimation, and histology classification. Our method outperforms prior self-supervised and supervised baselines, and matches or exceeds recent foundation models across all tasks, using a lightweight encoder trained on only 27 videos. Code is available at https://github.com/lparolari/ntssl.
Abstract（参考訳）: ポリプトラクレットの堅牢な表現を学習することは、ポリプのキャラクタリゼーションから自動レポートと検索に至るまで、複数のAI支援大腸内視鏡アプリケーションを可能にする鍵となる。教師付きコントラスト学習は、そのような表現を学習するための効果的なアプローチであるが、通常は正と負の定義に依存している。これらのラベルを収集するには、ビデオ全体を通して同じポリプ実体を描いているトラックレットをリンクする必要がある。本研究では,大腸内視鏡手術の逐次的ワークフローを利用して,時間的構造から自己監督的関連を導出する。時間的に導出された関連性は正しいことが保証されないため,ノイズを考慮に入れた相関損失がノイズの原因となる。本稿では,ポリプ検索と再同定,サイズ推定,組織分類など,複数の下流タスクにおける学習表現の有効性を実証する。提案手法は,27本のビデオで訓練された軽量エンコーダを用いて,従来の教師付きベースラインよりも優れており,すべてのタスクにまたがる最新の基礎モデルに適合または超越している。コードはhttps://github.com/lparolari/ntssl.comで入手できる。

関連論文リスト

Temporally-Aware Supervised Contrastive Learning for Polyp Counting in Colonoscopy [5.7522869823664005]
既存のポリプカウント法は自己教師あり学習に依存している。本稿では、時間的に認識されたソフトターゲットを含む教師付きコントラスト損失を提案することで、パラダイムシフトを導入する。その結果, 従来の手法に比べてフラグメンテーション率の2.2倍の低下がみられた。
論文参考訳（メタデータ） (2025-07-03T09:55:48Z)
PolypSegTrack: Unified Foundation Model for Colonoscopy Video Analysis [28.764513004699676]
PolypSegTrackは、大腸内視鏡ビデオにおけるPolyp検出、セグメンテーション、分類、教師なし追跡を共同で扱う新しい基礎モデルである。我々のアプローチは、新しい条件付きマスク損失を活用し、ピクセルレベルのセグメンテーションマスクまたはバウンディングボックスアノテーションを持つデータセット間の柔軟なトレーニングを可能にする。我々の教師なし追跡モジュールは、視覚に頼ることなく、オブジェクトクエリを使用して、フレーム全体のポリプインスタンスを確実に関連付けます。
論文参考訳（メタデータ） (2025-03-31T14:00:21Z)
SSTFB: Leveraging self-supervised pretext learning and temporal self-attention with feature branching for real-time video polyp segmentation [4.027361638728112]
本稿では,自己教師型学習を補助課題として行うビデオポリープセグメンテーション手法と,表現学習を改善するための空間的時間的自己認識機構を提案する。実験により, 現状技術(SOTA)法の改良が示された。本研究は,Diceの類似度係数と交叉結合度の両方において,ネットワークの精度が3%以上,10%近く向上することが確認された。
論文参考訳（メタデータ） (2024-06-14T17:33:11Z)
YONA: You Only Need One Adjacent Reference-frame for Accurate and Fast Video Polyp Detection [80.68520401539979]
textbfYONA (textbfYou textbfOnly textbfNeed one textbfAdjacent Reference-frame)は、ビデオポリープ検出のための効率的なエンドツーエンドのトレーニングフレームワークである。提案したYONAは,従来の最先端の競合他社よりも精度と速度の両面で優れています。
論文参考訳（メタデータ） (2023-06-06T13:53:15Z)
Colorectal Polyp Classification from White-light Colonoscopy Images via Domain Alignment [57.419727894848485]
大腸内視鏡画像からの正確な診断を支援するためには,コンピュータ支援診断システムが必要である。これまでのほとんどの研究では、Narrow-Band Imaging (NBI) や他の拡張画像を用いて、ポリプの分化モデルの開発を試みている。正確な大腸ポリープ分類のための教師/学生アーキテクチャに基づく新しい枠組みを提案する。
論文参考訳（メタデータ） (2021-08-05T09:31:46Z)
Colonoscopy Polyp Detection: Domain Adaptation From Medical Report Images to Real-time Videos [76.37907640271806]
大腸内視鏡画像と実時間映像の領域間ギャップに対処する画像-ビデオ結合型ポリープ検出ネットワーク(Ivy-Net)を提案する。収集したデータセットの実験は、Ivy-Netが大腸内視鏡ビデオで最先端の結果を達成することを示した。
論文参考訳（メタデータ） (2020-12-31T10:33:09Z)
CycAs: Self-supervised Cycle Association for Learning Re-identifiable Descriptions [61.724894233252414]
本稿では,人物再識別(re-ID)問題に対する自己教師型学習手法を提案する。既存の教師なしのメソッドは通常、ビデオトラッカーやクラスタリングのような擬似ラベルに依存している。疑似ラベルを使わずに、生のビデオから歩行者の埋め込みを学習できる別の教師なし手法を導入する。
論文参考訳（メタデータ） (2020-07-15T09:52:35Z)
LRTD: Long-Range Temporal Dependency based Active Learning for Surgical Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文参考訳（メタデータ） (2020-04-21T09:21:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。