論文の概要: RIDE: Self-Supervised Learning of Rotation-Equivariant Keypoint
Detection and Invariant Description for Endoscopy
- arxiv url: http://arxiv.org/abs/2309.09563v1
- Date: Mon, 18 Sep 2023 08:16:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 14:32:51.499395
- Title: RIDE: Self-Supervised Learning of Rotation-Equivariant Keypoint
Detection and Invariant Description for Endoscopy
- Title(参考訳): RIDE: 内視鏡における回転同変キーポイント検出と不変記述の自己教師付き学習
- Authors: Mert Asim Karaoglu, Viktoria Markova, Nassir Navab, Benjamin Busam,
and Alexander Ladikos
- Abstract要約: RIDEは回転同変検出と不変記述のための学習に基づく手法である。
内視鏡画像の大規模なキュレーションを自己指導的に行う。
マッチングと相対的なポーズ推定タスクに対して、最先端のパフォーマンスを新たに設定する。
- 参考スコア(独自算出の注目度): 83.4885991036141
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unlike in natural images, in endoscopy there is no clear notion of an
up-right camera orientation. Endoscopic videos therefore often contain large
rotational motions, which require keypoint detection and description algorithms
to be robust to these conditions. While most classical methods achieve
rotation-equivariant detection and invariant description by design, many
learning-based approaches learn to be robust only up to a certain degree. At
the same time learning-based methods under moderate rotations often outperform
classical approaches. In order to address this shortcoming, in this paper we
propose RIDE, a learning-based method for rotation-equivariant detection and
invariant description. Following recent advancements in group-equivariant
learning, RIDE models rotation-equivariance implicitly within its architecture.
Trained in a self-supervised manner on a large curation of endoscopic images,
RIDE requires no manual labeling of training data. We test RIDE in the context
of surgical tissue tracking on the SuPeR dataset as well as in the context of
relative pose estimation on a repurposed version of the SCARED dataset. In
addition we perform explicit studies showing its robustness to large rotations.
Our comparison against recent learning-based and classical approaches shows
that RIDE sets a new state-of-the-art performance on matching and relative pose
estimation tasks and scores competitively on surgical tissue tracking.
- Abstract(参考訳): 自然画像と異なり、内視鏡では上向きのカメラ指向という明確な概念は存在しない。
したがって、内視鏡ビデオは大きな回転運動を含むことが多く、これらの条件に対してキーポイントの検出と記述アルゴリズムを必要とする。
ほとんどの古典的手法は、回転同変検出と不変記述を設計によって達成するが、多くの学習に基づくアプローチは、ある程度の堅牢性しか持たない。
同時に、適度な回転の下での学習に基づく手法は、しばしば古典的アプローチを上回っている。
本稿では,この欠点に対処するため,回転同変検出と不変記述のための学習ベース手法であるRIDEを提案する。
グループ同変学習の最近の進歩に続いて、ライドモデルはそのアーキテクチャ内で暗黙的に回転同変する。
RIDEは、内視鏡画像の大規模なキュレーションで自己監督的に訓練され、手動によるトレーニングデータのラベル付けは不要である。
我々は,スーパーデータセット上での外科組織追跡の文脈と,怖れるデータセットの再利用版における相対的なポーズ推定の文脈において,ライドをテストした。
さらに,大きな回転に対するロバスト性を示す明示的な研究を行う。
近年の学習ベースおよび古典的アプローチとの比較により,RIDEはマッチングおよび相対ポーズ推定タスクに新たな最先端のパフォーマンスを設定し,手術組織追跡に競争力を持たせた。
関連論文リスト
- Effort: Efficient Orthogonal Modeling for Generalizable AI-Generated Image Detection [66.16595174895802]
既存のAI生成画像(AIGI)検出手法は、しばしば限定的な一般化性能に悩まされる。
本稿では、AIGI検出において、これまで見過ごされてきた重要な非対称性現象を同定する。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Symmetrical Bidirectional Knowledge Alignment for Zero-Shot Sketch-Based
Image Retrieval [69.46139774646308]
本稿ではゼロショットスケッチベース画像検索(ZS-SBIR)の問題点について検討する。
目に見えないカテゴリのスケッチをクエリとして使用して、同じカテゴリのイメージにマッチさせることが目的だ。
ゼロショットスケッチに基づく画像検索(SBKA)のための新しい対称双方向知識アライメントを提案する。
論文 参考訳(メタデータ) (2023-12-16T04:50:34Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Compressed Sensing MRI Reconstruction Regularized by VAEs with
Structured Image Covariance [7.544757765701024]
本稿では, 逆問題に先立って, 地動画像に基づいて学習した生成モデルをどのように利用することができるかを検討する。
可変オートエンコーダ(VAE)を用いて、画像だけでなく、各画像に対する共分散不確実性行列を生成する。
提案した学習規則化手法を,他の学習規則化手法や教師なし,教師なしのディープラーニング手法と比較した。
論文 参考訳(メタデータ) (2022-10-26T09:51:49Z) - Self-Supervised Endoscopic Image Key-Points Matching [1.3764085113103222]
本稿では,深層学習技術に基づく内視鏡画像マッチングのための新しい自己教師型アプローチを提案する。
提案手法は,手作りの標準的なローカル特徴記述子よりも精度とリコールの点で優れていた。
論文 参考訳(メタデータ) (2022-08-24T10:47:21Z) - Robust Collaborative Learning of Patch-level and Image-level Annotations
for Diabetic Retinopathy Grading from Fundus Image [33.904136933213735]
DR重度評価のための,パッチレベルのアノテーションとイメージレベルのアノテーションを協調的に利用する,堅牢なフレームワークを提案する。
エンドツーエンドの最適化により、このフレームワークは微細な病変と画像レベルのグレード情報を双方向に交換することができる。
提案手法は,9年以上の経験を持つ最近の最先端のアルゴリズムと3人の臨床眼科医に比較して,優れた性能を示す。
論文 参考訳(メタデータ) (2020-08-03T02:17:42Z) - Towards Unsupervised Learning for Instrument Segmentation in Robotic
Surgery with Cycle-Consistent Adversarial Networks [54.00217496410142]
本稿では、入力された内視鏡画像と対応するアノテーションとのマッピングを学習することを目的として、未ペア画像から画像への変換を提案する。
当社のアプローチでは,高価なアノテーションを取得することなく,イメージセグメンテーションモデルをトレーニングすることが可能です。
提案手法をEndovis 2017チャレンジデータセットで検証し,教師付きセグメンテーション手法と競合することを示す。
論文 参考訳(メタデータ) (2020-07-09T01:39:39Z) - Autoencoders for Unsupervised Anomaly Segmentation in Brain MR Images: A
Comparative Study [43.26668942258135]
脳MRIにおけるunsupervised Anomaly Detection(UAD)の新しいアプローチ
これらの研究の主な原理は、正常なデータの圧縮と回復を学ぶことによって、正常な解剖学のモデルを学ぶことである。
概念は,医療画像分析のコミュニティにとって大きな関心事である。i) 膨大な量の手作業によるトレーニングデータの必要性から解放される。
論文 参考訳(メタデータ) (2020-04-07T11:12:07Z) - Roto-Translation Equivariant Convolutional Networks: Application to
Histopathology Image Analysis [11.568329857588099]
畳み込みネットワークにおける特殊ユークリッド運動群SE(2)の幾何学的構造を符号化する枠組みを提案する。
提案手法を用いることで,一貫した性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-02-20T13:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。