論文の概要: Extremely Dense Point Correspondences using a Learned Feature Descriptor
- arxiv url: http://arxiv.org/abs/2003.00619v2
- Date: Fri, 27 Mar 2020 17:52:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:15:26.349351
- Title: Extremely Dense Point Correspondences using a Learned Feature Descriptor
- Title(参考訳): 学習特徴記述子を用いた極密点対応
- Authors: Xingtong Liu, Yiping Zheng, Benjamin Killeen, Masaru Ishii, Gregory D.
Hager, Russell H. Taylor, Mathias Unberath
- Abstract要約: 内視鏡画像からの高品質な3D再構成は、手術ナビゲーションを含む多くの臨床応用において重要な役割を担っている。
一般的なマルチビュー3D再構成には多くの方法が存在するが、これらの手法は内視鏡的映像に満足な性能を発揮できないことが多い。
本稿では,高密度記述子学習のための効果的な自己指導型学習手法と新規損失設計を提案する。
- 参考スコア(独自算出の注目度): 24.59943074297299
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: High-quality 3D reconstructions from endoscopy video play an important role
in many clinical applications, including surgical navigation where they enable
direct video-CT registration. While many methods exist for general multi-view
3D reconstruction, these methods often fail to deliver satisfactory performance
on endoscopic video. Part of the reason is that local descriptors that
establish pair-wise point correspondences, and thus drive reconstruction,
struggle when confronted with the texture-scarce surface of anatomy.
Learning-based dense descriptors usually have larger receptive fields enabling
the encoding of global information, which can be used to disambiguate matches.
In this work, we present an effective self-supervised training scheme and novel
loss design for dense descriptor learning. In direct comparison to recent local
and dense descriptors on an in-house sinus endoscopy dataset, we demonstrate
that our proposed dense descriptor can generalize to unseen patients and
scopes, thereby largely improving the performance of Structure from Motion
(SfM) in terms of model density and completeness. We also evaluate our method
on a public dense optical flow dataset and a small-scale SfM public dataset to
further demonstrate the effectiveness and generality of our method. The source
code is available at
https://github.com/lppllppl920/DenseDescriptorLearning-Pytorch.
- Abstract(参考訳): 内視鏡画像からの高品質な3D再構成は、手術ナビゲーションを含む多くの臨床応用において重要な役割を担っている。
一般的なマルチビュー3D再構成には多くの方法が存在するが、これらの手法は内視鏡的映像に満足な性能を発揮できないことが多い。
理由の1つは、解剖学のテクスチャ・スカース面に直面するとき、ペアワイズポイント対応を確立し、したがって再構築を促進する局所記述子である。
学習ベースの高密度ディスクリプタは、大域的な情報の符号化を可能にする、より大きな受容領域を持つ。
本研究では,高次記述型学習のための効果的な自己教師付き学習方式と新しい損失設計を提案する。
内腔内視鏡検査データを用いた最近の局所的・密集的記述装置との比較により,提案する密集ディスクリプタが患者とスコープを認識不能に一般化し,モデル密度と完全性の観点から,構造からの構造(sfm)の性能が大幅に向上することを示す。
また,本手法の有効性と汎用性を示すために,一般の高密度光フローデータセットと小型SfM公開データセットについて評価を行った。
ソースコードはhttps://github.com/lpplpl920/densedescriptorlearning-pytorchで入手できる。
関連論文リスト
- Multi-objective point cloud autoencoders for explainable myocardial
infarction prediction [4.65840670565844]
心筋梗塞は世界で最も多い死因の1つである。
画像ベースのバイオマーカーは、心臓の3D解剖においてより複雑なパターンを捉えることができない。
本稿では,多目的クラウドオートエンコーダについて,説明可能な梗塞予測のための新しい幾何学的深層学習手法として紹介する。
論文 参考訳(メタデータ) (2023-07-20T16:45:16Z) - Advancing 3D finger knuckle recognition via deep feature learning [51.871256510747465]
接触のない3Dフィンガーナックルパターンは、識別性、距離からの視認性、利便性、利便性により、効果的な生体認証として出現している。
近年、ディープニューラルネットワークの中間機能を複数のスケールで同時に組み込むディープ・フィーチャー・コラボレーティブ・ネットワークが開発されている。
本稿では,3次元指のナックル画像を表現するために,最小次元の識別特徴ベクトルを学習する可能性を検討することにより,本手法を推し進める。
論文 参考訳(メタデータ) (2023-01-07T20:55:16Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Deep Direct Volume Rendering: Learning Visual Feature Mappings From
Exemplary Images [57.253447453301796]
本稿では,ディープ・ダイレクト・ボリューム・レンダリング(Deep Direct Volume Rendering,DVR)を導入し,ディープ・ニューラル・ネットワークをDVRアルゴリズムに統合する。
潜在色空間におけるレンダリングを概念化し、深層アーキテクチャを用いて特徴抽出と分類のための暗黙マッピングを学習できるようにする。
我々の一般化は、画像空間の例から直接エンドツーエンドにトレーニングできる新しいボリュームレンダリングアーキテクチャを導き出すのに役立つ。
論文 参考訳(メタデータ) (2021-06-09T23:03:00Z) - Contextual Information Enhanced Convolutional Neural Networks for
Retinal Vessel Segmentation in Color Fundus Images [0.0]
自動網膜血管セグメンテーションシステムは、臨床診断及び眼科研究を効果的に促進することができる。
ディープラーニングベースの手法が提案され、いくつかのカスタマイズされたモジュールが有名なエンコーダデコーダアーキテクチャU-netに統合されている。
その結果,提案手法は先行技術よりも優れ,感性/リコール,F1スコア,MCCの最先端性能を実現している。
論文 参考訳(メタデータ) (2021-03-25T06:10:47Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Towards Dense People Detection with Deep Learning and Depth images [9.376814409561726]
本稿では,1つの深度画像から複数の人物を検出するDNNシステムを提案する。
我々のニューラルネットワークは深度画像を処理し、画像座標の確率マップを出力する。
我々は、この戦略が効果的であることを示し、トレーニング中に使用するものと異なるシーンで動作するように一般化したネットワークを創出する。
論文 参考訳(メタデータ) (2020-07-14T16:43:02Z) - LRTD: Long-Range Temporal Dependency based Active Learning for Surgical
Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。
具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。
手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-21T09:21:22Z) - IntrA: 3D Intracranial Aneurysm Dataset for Deep Learning [18.163031102785904]
IntrAというオープンアクセス型3次元頭蓋内動脈瘤データセットを導入し、ポイントベースおよびメッシュベース分類とセグメンテーションモデルの適用を可能にした。
本データセットは頭蓋内動脈瘤の診断に有用であり, 頸部を摘出し, クリッピング術を施行した。
論文 参考訳(メタデータ) (2020-03-02T05:21:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。