論文の概要: Unleashing the Power of Depth and Pose Estimation Neural Networks by
Designing Compatible Endoscopic Images
- arxiv url: http://arxiv.org/abs/2309.07390v1
- Date: Thu, 14 Sep 2023 02:19:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-15 16:27:35.700900
- Title: Unleashing the Power of Depth and Pose Estimation Neural Networks by
Designing Compatible Endoscopic Images
- Title(参考訳): コンパチブルな内視鏡画像の設計による深度とポス推定ニューラルネットワークの解き放つ
- Authors: Junyang Wu, Yun Gu
- Abstract要約: 内視鏡画像の特性を詳細に解析し、画像とニューラルネットワークの互換性を改善する。
まず,完全な画像情報の代わりに部分的な画像情報を入力するMask Image Modelling (MIM) モジュールを導入する。
第2に、画像とニューラルネットワークの互換性を明確に向上させるために、内視鏡画像を強化する軽量ニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 12.412060445862842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models have witnessed depth and pose estimation framework on
unannotated datasets as a effective pathway to succeed in endoscopic
navigation. Most current techniques are dedicated to developing more advanced
neural networks to improve the accuracy. However, existing methods ignore the
special properties of endoscopic images, resulting in an inability to fully
unleash the power of neural networks. In this study, we conduct a detail
analysis of the properties of endoscopic images and improve the compatibility
of images and neural networks, to unleash the power of current neural networks.
First, we introcude the Mask Image Modelling (MIM) module, which inputs partial
image information instead of complete image information, allowing the network
to recover global information from partial pixel information. This enhances the
network' s ability to perceive global information and alleviates the phenomenon
of local overfitting in convolutional neural networks due to local artifacts.
Second, we propose a lightweight neural network to enhance the endoscopic
images, to explicitly improve the compatibility between images and neural
networks. Extensive experiments are conducted on the three public datasets and
one inhouse dataset, and the proposed modules improve baselines by a large
margin. Furthermore, the enhanced images we proposed, which have higher network
compatibility, can serve as an effective data augmentation method and they are
able to extract more stable feature points in traditional feature point
matching tasks and achieve outstanding performance.
- Abstract(参考訳): 深層学習モデルは、内視鏡ナビゲーションに成功するための有効な経路として、注釈なしデータセットの深さとポーズ推定フレームワークを目撃している。
現在のほとんどのテクニックは、精度を向上させるために、より高度なニューラルネットワークの開発に特化している。
しかし、既存の手法では内視鏡画像の特殊性を無視し、ニューラルネットワークのパワーを完全に解き放つことができない。
本研究では,現在のニューラルネットワークのパワーを解放するために,内視鏡画像の特性を詳細に解析し,画像とニューラルネットワークの互換性を向上させる。
まず、完全画像情報の代わりに部分画像情報を入力するマスク画像モデリング(mim)モジュールを導入し、ネットワークが部分画素情報からグローバル情報を復元できるようにする。
これにより、グローバル情報を知覚するネットワークの能力が向上し、局所的なアーティファクトによる畳み込みニューラルネットワークにおける局所的な過剰フィッティング現象を緩和する。
第2に,画像とニューラルネットワークの互換性を明示的に改善するために,内視鏡画像を強化する軽量ニューラルネットワークを提案する。
3つのパブリックデータセットと1つの社内データセットで大規模な実験を行い、提案したモジュールはベースラインを大きく改善する。
さらに,提案する拡張画像は,ネットワーク互換性が高く,効率的なデータ拡張手法となり,従来の特徴点マッチングタスクにおいて,より安定した特徴点を抽出し,優れた性能を実現することができる。
関連論文リスト
- Research on Deep Learning Model of Feature Extraction Based on Convolutional Neural Network [0.32985979395737786]
AlexNetとInceptionV3はより優れた画像認識結果を得るために選択された。
トレーニングされたAlexNetモデルの予測精度、特異性、感度は4.25ポイント向上した。
グラフィックス処理の使用率は、InceptionV3モードと比較して51%減少した。
論文 参考訳(メタデータ) (2024-06-13T06:00:28Z) - DmADs-Net: Dense multiscale attention and depth-supervised network for medical image segmentation [10.85494240952418]
我々はDmAD-Net(Multiscale Attention and Depth-Supervised Network)を開発した。
異なる深さで機能抽出にResNetを使用し、マルチスケールの畳み込み機能注意ブロックを作成します。
ローカル・フィーチャー・アテンション・ブロックは、高レベルのセマンティック情報に対するローカル・フィーチャー・アテンションを強化するために作成される。
フィーチャーフュージョンフェーズでは、異なるセマンティック情報の融合を強化するために、フィーチャーリファインメントとフュージョンブロックが作成される。
論文 参考訳(メタデータ) (2024-05-01T12:15:58Z) - Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.04145324152541]
本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-03-18T18:01:01Z) - Retinotopic Mapping Enhances the Robustness of Convolutional Neural Networks [0.0]
本研究では,葉緑体視覚の重要成分であるレチノトピックマッピングが,画像分類と局所化性能を向上させることができるかどうかを検討する。
標準オフザシェルフ畳み込みニューラルネットワーク(CNN)の入力にレノトピックマッピングが組み込まれた
驚くべきことに、レチノトピー的にマッピングされたネットワークは、分類において同等のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-02-23T18:15:37Z) - Learning Multimodal Volumetric Features for Large-Scale Neuron Tracing [72.45257414889478]
オーバーセグメントニューロン間の接続を予測し,人間の作業量を削減することを目的としている。
最初はFlyTracingという名前のデータセットを構築しました。
本稿では,高密度なボリュームEM画像の埋め込みを生成するための,新しい接続性を考慮したコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-05T19:45:12Z) - Connecting the Dots: Graph Neural Network Powered Ensemble and
Classification of Medical Images [0.0]
医療画像の深層学習は、大量のトレーニングデータを必要とするため、制限されている。
画像フォレスティング変換を用いて、画像を最適にスーパーピクセルに分割する。
これらのスーパーピクセルはその後、グラフ構造化データに変換され、特徴の巧妙な抽出と関係のモデリングを可能にする。
論文 参考訳(メタデータ) (2023-11-13T13:20:54Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Domain Generalization for Medical Imaging Classification with
Linear-Dependency Regularization [59.5104563755095]
本稿では,医用画像分類分野におけるディープニューラルネットワークの一般化能力向上のための,シンプルだが効果的なアプローチを提案する。
医用画像の領域変数がある程度コンパクトであることに感銘を受けて,変分符号化による代表的特徴空間の学習を提案する。
論文 参考訳(メタデータ) (2020-09-27T12:30:30Z) - A new approach to descriptors generation for image retrieval by
analyzing activations of deep neural network layers [43.77224853200986]
本稿では,ディープニューラルネットワークを用いたコンテンツベース画像検索作業における記述子構築の問題点について考察する。
ネットワークの畳み込み部分のニューロンの総数は多く、その大部分が最終分類決定にほとんど影響を与えないことが知られている。
本稿では,最も重要なニューロン活性化を抽出し,その情報を利用して効果的な記述子を構築する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:53:10Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。