Fugu-MT 論文翻訳(概要): Two-Stream Deep Feature Modelling for Automated Video Endoscopy Data Analysis

論文の概要: Two-Stream Deep Feature Modelling for Automated Video Endoscopy Data Analysis

arxiv url: http://arxiv.org/abs/2007.05914v1
Date: Sun, 12 Jul 2020 05:24:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-11 05:29:16.700738
Title: Two-Stream Deep Feature Modelling for Automated Video Endoscopy Data Analysis
Title（参考訳）: 自動ビデオ内視鏡データ解析のための2ストリームDeep Feature Modeling
Authors: Harshala Gammulle, Simon Denman, Sridha Sridharan, Clinton Fookes
Abstract要約: 内視鏡画像解析のための2ストリームモデルを提案する。本モデルでは,2つの深い特徴入力を融合させ,それらの関係関係を新たな関係ネットワークモデルによりマッピングする。
参考スコア（独自算出の注目度）: 45.19890687786009
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Automating the analysis of imagery of the Gastrointestinal (GI) tract captured during endoscopy procedures has substantial potential benefits for patients, as it can provide diagnostic support to medical practitioners and reduce mistakes via human error. To further the development of such methods, we propose a two-stream model for endoscopic image analysis. Our model fuses two streams of deep feature inputs by mapping their inherent relations through a novel relational network model, to better model symptoms and classify the image. In contrast to handcrafted feature-based models, our proposed network is able to learn features automatically and outperforms existing state-of-the-art methods on two public datasets: KVASIR and Nerthus. Our extensive evaluations illustrate the importance of having two streams of inputs instead of a single stream and also demonstrates the merits of the proposed relational network architecture to combine those streams.
Abstract（参考訳）: 内視鏡検査中に撮影された消化管画像の分析を自動化することは、医療従事者に診断支援を提供し、ヒューマンエラーによるミスを減らすことができるため、患者にとって有益である。そこで本研究では,内視鏡画像解析のための2ストリームモデルを提案する。本モデルでは,新たなリレーショナル・ネットワーク・モデルを用いて,特徴の深い入力を2つのストリームに融合させ,症状のモデル化と画像の分類を行う。手作りの機能ベースモデルとは対照的に、提案するネットワークは、KVASIRとNerthusという2つの公開データセット上で、既存の最先端メソッドを自動で学習し、パフォーマンスを向上させることができる。当社の広範な評価は,単一のストリームではなく2つの入力ストリームを持つことの重要性を示し,これらストリームを組み合わせるために提案するリレーショナルネットワークアーキテクチャのメリットも示しています。

関連論文リスト

Mission Balance: Generating Under-represented Class Samples using Video Diffusion Models [1.5678321653327674]
そこで本研究では,2段階のテキストベースで,低表現クラスのための高忠実度手術ビデオを生成する手法を提案する。本手法は,2つの下流タスク(動作認識と術中事象予測)で評価する。
論文参考訳（メタデータ） (2025-05-14T23:43:29Z)
Gradient Attention Map Based Verification of Deep Convolutional Neural Networks with Application to X-ray Image Datasets [1.0208529247755187]
複数の相補的戦略を通じてモデル適合性を評価する包括的検証フレームワークを提案する。まず、グラディエント・アテンション・マップ(GAM)に基づくアプローチを導入し、グラディエント・アテンション・マップを用いて注意パターンを解析する。第2に、初期畳み込み特徴写像に検証を拡張し、注意を欠いた構造的ミスアライメントをキャプチャする。第3に,配布外入力を明示的に拒否するために,新たなガベージクラスを分類モデルに組み込む。
論文参考訳（メタデータ） (2025-04-29T23:41:37Z)
DiffDoctor: Diagnosing Image Diffusion Models Before Treating [57.82359018425674]
DiffDoctorは2段階のパイプラインで、画像拡散モデルがより少ないアーティファクトを生成するのを支援する。我々は100万以上の欠陥のある合成画像のデータセットを収集し、効率的なHuman-in-the-loopアノテーションプロセスを構築した。次に、学習したアーティファクト検出器が第2段階に関与し、ピクセルレベルのフィードバックを提供することで拡散モデルを最適化する。
論文参考訳（メタデータ） (2025-01-21T18:56:41Z)
Synthetic Augmentation for Anatomical Landmark Localization using DDPMs [0.22499166814992436]
拡散型生成モデルは近年,高品質な合成画像を生成する能力に注目が集まっている。ランドマークマッチングのためのマルコフランダムフィールド(MRF)モデルと統計的形状モデル(SSM)を用いて,生成画像の品質を評価する新しい手法を提案する。
論文参考訳（メタデータ） (2024-10-16T12:09:38Z)
Real-time guidewire tracking and segmentation in intraoperative x-ray [52.51797358201872]
リアルタイムガイドワイヤ分割と追跡のための2段階のディープラーニングフレームワークを提案する。第1段階では、ヨロフ5検出器が元のX線画像と合成画像を使って訓練され、ターゲットのガイドワイヤのバウンディングボックスを出力する。第2段階では、検出された各バウンディングボックスにガイドワイヤを分割するために、新規で効率的なネットワークが提案されている。
論文参考訳（メタデータ） (2024-04-12T20:39:19Z)
Unlocking the Heart Using Adaptive Locked Agnostic Networks [4.613517417540153]
医用画像アプリケーションのためのディープラーニングモデルの教師付きトレーニングには、かなりの量のラベル付きデータが必要である。この制限に対処するため、Adaptive Locked Agnostic Network (ALAN)を導入する。 ALANは、大きなバックボーンモデルを用いて、堅牢なセマンティック・セグメンテーションを生成する自己教師付き視覚特徴抽出を含む。自監督型背骨モデルでは, 心臓の解剖学的部分領域を円錐四面体視で強く同定することがわかった。
論文参考訳（メタデータ） (2023-09-21T09:06:36Z)
Two-step interpretable modeling of Intensive Care Acquired Infections [0.0]
本稿では,高解像度長手データと生存モデルの動的予測機能を統合するための新しい手法を提案する。モデルの解釈可能性を維持しながら予測力を向上すること。
論文参考訳（メタデータ） (2023-01-26T14:54:17Z)
MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文参考訳（メタデータ） (2023-01-19T03:42:36Z)
Fast Unsupervised Brain Anomaly Detection and Segmentation with Diffusion Models [1.6352599467675781]
脳画像における異常検出とセグメント分割のための拡散モデルに基づく手法を提案する。拡散モデルは,2次元CTおよびMRIデータを用いた一連の実験において,自己回帰的アプローチと比較して競争性能が向上する。
論文参考訳（メタデータ） (2022-06-07T17:30:43Z)
InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文参考訳（メタデータ） (2021-12-23T15:52:37Z)
Multi-Disease Detection in Retinal Imaging based on Ensembling Heterogeneous Deep Learning Models [0.0]
網膜イメージングのための革新的なマルチディセーゼ検出パイプラインを提案する。当社のパイプラインには、転送学習、クラス重み付け、リアルタイム画像増強、焦点損失利用などの最先端の戦略が含まれます。
論文参考訳（メタデータ） (2021-03-26T18:02:17Z)
Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。共通情報と相補情報の両方を敵意で抽出することを目的としている。特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文参考訳（メタデータ） (2021-02-15T18:46:44Z)
G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。 2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文参考訳（メタデータ） (2021-01-27T19:28:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。