論文の概要: Siamese Network Features for Endoscopy Image and Video Localization
- arxiv url: http://arxiv.org/abs/2103.08504v1
- Date: Mon, 15 Mar 2021 16:24:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 16:38:19.297624
- Title: Siamese Network Features for Endoscopy Image and Video Localization
- Title(参考訳): siamese network features for endoscopy image and video localization
- Authors: Mohammad Reza Mohebbian, Seyed Shahim Vedaei, Khan A. Wahid and Paul
Babyn
- Abstract要約: 位置決めフレームは、異常な位置に関する貴重な情報を提供する。
本研究では,メタラーニングと深層学習を組み合わせることで,内視鏡画像とビデオの両方をローカライズする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conventional Endoscopy (CE) and Wireless Capsule Endoscopy (WCE) are known
tools for diagnosing gastrointestinal (GI) tract disorders. Localizing frames
provide valuable information about the anomaly location and also can help
clinicians determine a more appropriate treatment plan. There are many
automated algorithms to detect the anomaly. However, very few of the existing
works address the issue of localization. In this study, we present a
combination of meta-learning and deep learning for localizing both endoscopy
images and video. A dataset is collected from 10 different anatomical positions
of human GI tract. In the meta-learning section, the system was trained using
78 CE and 27 WCE annotated frames with a modified Siamese Neural Network (SNN)
to predict the location of one single image/frame. Then, a postprocessing
section using bidirectional long short-term memory is proposed for localizing a
sequence of frames. Here, we have employed feature vector, distance and
predicted location obtained from a trained SNN. The postprocessing section is
trained and tested on 1,028 and 365 seconds of CE and WCE videos using hold-out
validation (50%), and achieved F1-score of 86.3% and 83.0%, respectively. In
addition, we performed subjective evaluation using nine gastroenterologists.
The results show that the computer-aided methods can outperform
gastroenterologists assessment of localization. The proposed method is compared
with various approaches, such as support vector machine with hand-crafted
features, convolutional neural network and the transfer learning-based methods,
and showed better results. Therefore, it can be used in frame localization,
which can help in video summarization and anomaly detection.
- Abstract(参考訳): 従来型内視鏡(CE)とワイヤレスカプセル内視鏡(WCE)は消化管疾患(GI)の診断ツールとして知られている。
局所化フレームは異常部位に関する貴重な情報を提供し、臨床医がより適切な治療計画を決定するのに役立つ。
異常を検出する自動アルゴリズムは多数存在する。
しかし、既存の作品の多くはローカリゼーションの問題に対処している。
本研究では,メタラーニングと深層学習を組み合わせることで,内視鏡画像とビデオの両方をローカライズする。
ヒトの消化管の10の異なる解剖学的位置からデータセットを収集する。
メタラーニングセクションでは、78 CEと27 WCEの注釈付きフレームに修正されたシームズニューラルネットワーク(SNN)を用いて、1つの画像/フレームの位置を予測した。
次に、フレーム列のローカライズのために、双方向長短期メモリを用いた後処理部を提案する。
ここでは,訓練したsnから得られた特徴ベクトル,距離,予測位置を用いた。
後処理セクションは、CEおよびWCEビデオの1,028秒と365秒でホールドアウトバリデーション(50%)を使用して訓練およびテストされ、それぞれ86.3%と83.0%のF1スコアを達成した。
また,9名の消化器科医による主観的評価を行った。
以上の結果から,コンピュータ支援手法は胃腸内科医の局在評価を上回りうることが示された。
提案手法は,手作業による支援ベクトルマシン,畳み込みニューラルネットワーク,転送学習に基づく手法など,様々な手法と比較し,より良い結果を示した。
従って、それはビデオ要約および異常な検出で助けることができるフレームのローカライゼーションで使用することができます。
関連論文リスト
- Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Non-invasive Localization of the Ventricular Excitation Origin Without
Patient-specific Geometries Using Deep Learning [0.6999972048611302]
心室頻拍(VT)は、毎年425万人が心不全で死亡する原因の一つとなる。
アブレーション過程における局所化を容易にするために,畳み込みニューラルネットワーク(CNN)に基づく2つの新しい局所化手法を提案する。
論文 参考訳(メタデータ) (2022-09-16T09:30:13Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - A Temporal Learning Approach to Inpainting Endoscopic Specularities and
Its effect on Image Correspondence [13.25903945009516]
本稿では,時間的生成的対位ネットワーク(GAN)を用いて,隠蔽解剖学を特異性の下で描くことを提案する。
これは、胃内視鏡(Hyper-Kvasir)の生検データを用いて、完全に教師なしの方法で達成される。
また,3次元再構成とカメラモーション推定の基盤となるコンピュータビジョンタスクにおける本手法の有効性を評価する。
論文 参考訳(メタデータ) (2022-03-31T13:14:00Z) - Localized Perturbations For Weakly-Supervised Segmentation of Glioma
Brain Tumours [0.5801621787540266]
本研究は,脳腫瘍のセグメンテーションマスクを事前訓練した3次元分類モデルから抽出するための,局所摂動を弱教師付きソリューションとして用いることを提案する。
また,U-netアーキテクチャを用いて,任意の分類において最も関連性の高い領域を見つけるために,3次元スーパーピクセルを利用する新しい摂動法を提案する。
論文 参考訳(メタデータ) (2021-11-29T21:01:20Z) - Hepatic vessel segmentation based on 3Dswin-transformer with inductive
biased multi-head self-attention [46.46365941681487]
Indu BIased Multi-Head Attention Vessel Net という,堅牢なエンドツーエンドのコンテナセグメンテーションネットワークを提案する。
正確な肝血管のボクセルを見つけるために,パッチワイド埋め込みよりもボクセルワイド埋め込みを導入する。
一方,絶対位置埋め込みから帰納的バイアス付き相対的位置埋め込みを学習する帰納的バイアス付きマルチヘッド自己アテンションを提案する。
論文 参考訳(メタデータ) (2021-11-05T10:17:08Z) - Explaining Predictions of Deep Neural Classifier via Activation Analysis [0.11470070927586014]
本稿では,畳み込みニューラルネットワーク(CNN)に基づく深層学習システムを実行する人間専門家に対して,意思決定プロセスの説明と支援を行う新しいアプローチを提案する。
以上の結果から,本手法は既存のアトラスから最も類似した予測を識別できる別個の予測戦略を検出することができることが示された。
論文 参考訳(メタデータ) (2020-12-03T20:36:19Z) - Accurate and Efficient Intracranial Hemorrhage Detection and Subtype
Classification in 3D CT Scans with Convolutional and Long Short-Term Memory
Neural Networks [20.4701676109641]
RSNA頭蓋内出血検出のためのシステムについて紹介する。
提案システムは,畳み込みニューラルネットワーク(CNN)を用いた軽量深層ニューラルネットワークアーキテクチャに基づいている。
最終テストセットの重み付き平均ログ損失は0.04989で、合計1345名から上位30名(2%)にランクインした。
論文 参考訳(メタデータ) (2020-08-01T17:28:25Z) - Y-Net for Chest X-Ray Preprocessing: Simultaneous Classification of
Geometry and Segmentation of Annotations [70.0118756144807]
この研究は、機械学習アルゴリズムに胸部X線入力のための一般的な前処理ステップを導入する。
VGG11エンコーダをベースとした改良Y-Netアーキテクチャを用いて,ラジオグラフィの幾何学的配向とセグメンテーションを同時に学習する。
対照画像の27.0%,34.9%に対し,95.8%,96.2%のアノテーションマスクが認められた。
論文 参考訳(メタデータ) (2020-05-08T02:16:17Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。