論文の概要: Endo-Sim2Real: Consistency learning-based domain adaptation for
instrument segmentation
- arxiv url: http://arxiv.org/abs/2007.11514v1
- Date: Wed, 22 Jul 2020 16:18:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 22:22:18.597666
- Title: Endo-Sim2Real: Consistency learning-based domain adaptation for
instrument segmentation
- Title(参考訳): Endo-Sim2Real: 楽器セグメンテーションのための一貫性学習に基づくドメイン適応
- Authors: Manish Sahu, Ronja Str\"omsd\"orfer, Anirban Mukhopadhyay, and Stefan
Zachow
- Abstract要約: 内視鏡的ビデオにおける外科的ツールセグメンテーションは、コンピュータによる介入システムの重要な構成要素である。
完全教師付きディープラーニングアプローチを用いた画像ベースソリューションの最近の成功は、大きなラベル付きデータセットの収集によるものである。
計算機シミュレーションは手動ラベリング問題を緩和するが、シミュレーションデータで訓練されたモデルは実際のデータに一般化しない。
本研究では,シミュレーションおよび実(ラベルなし)内視鏡データの共同学習のための一貫性に基づくフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.086731011437779
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Surgical tool segmentation in endoscopic videos is an important component of
computer assisted interventions systems. Recent success of image-based
solutions using fully-supervised deep learning approaches can be attributed to
the collection of big labeled datasets. However, the annotation of a big
dataset of real videos can be prohibitively expensive and time consuming.
Computer simulations could alleviate the manual labeling problem, however,
models trained on simulated data do not generalize to real data. This work
proposes a consistency-based framework for joint learning of simulated and real
(unlabeled) endoscopic data to bridge this performance generalization issue.
Empirical results on two data sets (15 videos of the Cholec80 and EndoVis'15
dataset) highlight the effectiveness of the proposed \emph{Endo-Sim2Real}
method for instrument segmentation. We compare the segmentation of the proposed
approach with state-of-the-art solutions and show that our method improves
segmentation both in terms of quality and quantity.
- Abstract(参考訳): 内視鏡ビデオにおける手術用ツールのセグメンテーションは,コンピュータ支援介入システムの重要な構成要素である。
完全教師付きディープラーニングアプローチを用いた画像ベースソリューションの最近の成功は、大きなラベル付きデータセットの収集によるものである。
しかし、実際のビデオの巨大なデータセットのアノテーションは、非常に高価で時間がかかります。
計算機シミュレーションは手動ラベリング問題を緩和するが、シミュレーションデータで訓練されたモデルは実際のデータに一般化しない。
本研究は,シミュレーションおよび実(ラベルなし)内視鏡データの協調学習のための一貫性に基づくフレームワークを提案する。
2つのデータセット(Cholec80とEndoVis'15データセットの15の動画)の実証結果から,楽器セグメンテーションにおけるemph{Endo-Sim2Real}法の有効性が明らかになった。
提案手法のセグメンテーションを最先端のソリューションと比較し,提案手法が品質と量の両方においてセグメンテーションを改善することを示す。
関連論文リスト
- Match Stereo Videos via Bidirectional Alignment [15.876953256378224]
最近の学習に基づく手法は、独立ステレオペアのパフォーマンスの最適化に重点を置いており、ビデオの時間的矛盾につながる。
本稿では,新しいビデオ処理フレームワークBiDAStereoとプラグイン安定化ネットワークBiDAStabilizerを紹介する。
本稿では,自然景観に着目したリアルな合成データセットとベンチマークと,様々な都市景観のステレオカメラが捉えた実世界のデータセットを定性評価として提示する。
論文 参考訳(メタデータ) (2024-09-30T13:37:29Z) - Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Video-SwinUNet: Spatio-temporal Deep Learning Framework for VFSS
Instance Segmentation [10.789826145990016]
本稿では,医用ビデオセグメンテーションのためのディープラーニングフレームワークを提案する。
本フレームワークは, 時間次元にまたがる近傍のフレームから特徴を明示的に抽出する。
テンポラリな機能ブレンダーを組み込んで、ハイレベルな時間的特徴をトークン化し、Swin Transformerを介してエンコードされた強力なグローバル機能を形成する。
論文 参考訳(メタデータ) (2023-02-22T12:09:39Z) - Semi-Supervised Image Captioning by Adversarially Propagating Labeled
Data [95.0476489266988]
本稿では、画像キャプションモデルの一般化を改善するための、新しいデータ効率半教師付きフレームワークを提案する。
提案手法は,キャプタにペアデータから学習し,段階的に未ペアデータの関連付けを行うよう訓練する。
1)画像ベースと(2)高密度領域ベースキャプションデータセットの両方を総合的かつ包括的な実験結果とし,それに続いて,少ないペアリングデータセットの包括的分析を行った。
論文 参考訳(メタデータ) (2023-01-26T15:25:43Z) - Mitigating Representation Bias in Action Recognition: Algorithms and
Benchmarks [76.35271072704384]
ディープラーニングモデルは、稀なシーンやオブジェクトを持つビデオに適用すると、パフォーマンスが悪くなります。
この問題にはアルゴリズムとデータセットの2つの異なる角度から対処する。
偏りのある表現は、他のデータセットやタスクに転送するとより一般化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T00:30:35Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z) - Simulation-to-Real domain adaptation with teacher-student learning for
endoscopic instrument segmentation [1.1047993346634768]
注釈付きシミュレーションデータとラベルのない実データから共同学習する教師学習手法を紹介します。
3つのデータセットの実証結果は、提案したフレームワークの有効性を浮き彫りにする。
論文 参考訳(メタデータ) (2021-03-02T09:30:28Z) - Coherent Loss: A Generic Framework for Stable Video Segmentation [103.78087255807482]
ビデオセグメンテーションの結果の視覚的品質を,ジッタリングアーティファクトがいかに劣化させるかを検討する。
本稿では,ニューラルネットワークの性能向上を目的とした汎用フレームワークを備えたコヒーレントロスを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:48:28Z) - Unsupervised Learning Consensus Model for Dynamic Texture Videos
Segmentation [12.462608802359936]
動的テクスチャのセグメンテーションのための効果的な教師なし学習コンセンサスモデルを提案する。
提案モデルでは,分類対象画素の周辺部における再量子化局所2値パターン(LBP)ヒストグラムの値の集合を特徴として用いた。
挑戦的なSynthDBデータセットで実施された実験は、ULCMが大幅に高速で、コーディングが簡単で、単純で、パラメータが限られていることを示している。
論文 参考訳(メタデータ) (2020-06-29T16:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。