論文の概要: MeVGAN: GAN-based Plugin Model for Video Generation with Applications in
Colonoscopy
- arxiv url: http://arxiv.org/abs/2311.03884v1
- Date: Tue, 7 Nov 2023 10:58:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 16:01:52.159363
- Title: MeVGAN: GAN-based Plugin Model for Video Generation with Applications in
Colonoscopy
- Title(参考訳): MeVGAN:GANベースのビデオ生成用プラグインモデルと大腸内視鏡への応用
- Authors: {\L}ukasz Struski, Tomasz Urba\'nczyk, Krzysztof Bucki, Bart{\l}omiej
Cupia{\l}, Aneta Kaczy\'nska, Przemys{\l}aw Spurek, Jacek Tabor
- Abstract要約: 我々は,GAN(Geneversarative Adrial Network)によるメモリ効率の良いビデオGAN(MeVGAN)を提案する。
事前訓練された2次元画像GANを用いて、ノイズ空間内の各軌跡を構築することにより、GANモデルを通して転送された軌跡が実写映像を構成する。
我々は,MeVGANが高品質な合成大腸内視鏡映像を制作できることを示し,仮想シミュレータで使用することができることを示した。
- 参考スコア(独自算出の注目度): 12.515404169717451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video generation is important, especially in medicine, as much data is given
in this form. However, video generation of high-resolution data is a very
demanding task for generative models, due to the large need for memory. In this
paper, we propose Memory Efficient Video GAN (MeVGAN) - a Generative
Adversarial Network (GAN) which uses plugin-type architecture. We use a
pre-trained 2D-image GAN and only add a simple neural network to construct
respective trajectories in the noise space, so that the trajectory forwarded
through the GAN model constructs a real-life video. We apply MeVGAN in the task
of generating colonoscopy videos. Colonoscopy is an important medical
procedure, especially beneficial in screening and managing colorectal cancer.
However, because colonoscopy is difficult and time-consuming to learn,
colonoscopy simulators are widely used in educating young colonoscopists. We
show that MeVGAN can produce good quality synthetic colonoscopy videos, which
can be potentially used in virtual simulators.
- Abstract(参考訳): ビデオ生成は特に医学において重要であり、この形式で多くのデータが提供される。
しかし、高解像度データの映像生成は、メモリの必要性が大きいため、生成モデルにとって非常に要求の多いタスクである。
本稿では,プラグイン型アーキテクチャを用いたGAN(Generative Adversarial Network)のメモリ効率向上ビデオGAN(MeVGAN)を提案する。
トレーニング済みの2D画像GANを用いて、ノイズ空間内の各軌跡を構成するための単純なニューラルネットワークのみを付加し、GANモデルを通して転送された軌跡が実写映像を構築する。
大腸内視鏡ビデオ作成作業にMeVGANを適用した。
大腸内視鏡は,特に大腸癌のスクリーニングと管理に有用である。
しかし、大腸内視鏡は困難で学習に時間がかかるため、大腸内視鏡シミュレータは若い大腸スコピストの教育に広く用いられている。
我々は,MeVGANが高品質な合成大腸内視鏡映像を制作できることを示し,仮想シミュレータで使用することができることを示した。
関連論文リスト
- Frontiers in Intelligent Colonoscopy [96.57251132744446]
本研究は, インテリジェント大腸内視鏡技術のフロンティアと, マルチモーダル医療への応用の可能性について検討する。
大腸内視鏡的シーン知覚のための4つのタスクを通して,現在のデータ中心およびモデル中心のランドスケープを評価した。
今後のマルチモーダル時代を受け入れるために,大規模マルチモーダル・インストラクション・チューニング・データセットColoninST,大腸内視鏡で設計されたマルチモーダル言語モデルColonGPT,マルチモーダル・ベンチマークの3つの基本イニシアティブを構築した。
論文 参考訳(メタデータ) (2024-10-22T17:57:12Z) - Self-Prompting Polyp Segmentation in Colonoscopy using Hybrid Yolo-SAM 2 Model [18.61909523131399]
本稿では,Segment Anything Model(SAM2)とYOLOv8モデルを統合することで,ポリプセグメンテーションの新たなアプローチを提案する。
本手法では,YOLOv8のバウンディングボックス予測を利用してSAM 2の入力プロンプトを自動生成することで,手動アノテーションの必要性を軽減している。
われわれは,5つのベンチマーク大腸内視鏡画像データセットと2つの大腸内視鏡ビデオデータセットの徹底的な試験を行い,この手法が画像分割タスクおよびビデオ分割タスクの最先端モデルを上回ることを示した。
論文 参考訳(メタデータ) (2024-09-14T17:11:37Z) - Endora: Video Generation Models as Endoscopy Simulators [53.72175969751398]
本稿では,臨床内視鏡シーンをシミュレートする医用ビデオを作成するための革新的な手法であるモデルを紹介する。
また、ビデオ生成モデルを用いた内視鏡シミュレーションのための最初の公開ベンチマークを開拓した。
Endoraは、臨床内視鏡研究のための生成AIの展開において、注目すべきブレークスルーとなる。
論文 参考訳(メタデータ) (2024-03-17T00:51:59Z) - REAL-Colon: A dataset for developing real-world AI applications in
colonoscopy [1.8590283101866463]
本稿では,REAL-Colon(Real-world Multi-center Endoscopy Annotated Video Library)データセットを紹介する。
これは60のフル解像度の実際の大腸内視鏡記録から、2.7Mのネイティブビデオフレームで構成されている。
データセットには350kのバウンディングボックスアノテーションが含まれており、それぞれが専門の消化器科医の監督の下で作成されている。
論文 参考訳(メタデータ) (2024-03-04T16:11:41Z) - Vivim: a Video Vision Mamba for Medical Video Segmentation [52.11785024350253]
本稿では、医用ビデオセグメンテーションタスクのためのビデオビジョンマンバベースのフレームワークVivimを提案する。
我々のビビムは、長期表現を様々なスケールのシーケンスに効果的に圧縮することができる。
超音波検査では甲状腺分節,乳房病変分節,大腸内視鏡検査ではポリープ分節が有効で有効であった。
論文 参考訳(メタデータ) (2024-01-25T13:27:03Z) - Customizing General-Purpose Foundation Models for Medical Report
Generation [64.31265734687182]
ラベル付き医用画像-レポートペアの不足は、ディープニューラルネットワークや大規模ニューラルネットワークの開発において大きな課題となっている。
本稿では,コンピュータビジョンと自然言語処理の基盤モデル (FM) として,市販の汎用大規模事前学習モデルのカスタマイズを提案する。
論文 参考訳(メタデータ) (2023-06-09T03:02:36Z) - Colo-SCRL: Self-Supervised Contrastive Representation Learning for
Colonoscopic Video Retrieval [2.868043986903368]
そこで我々は,Colo-Pairという大規模大腸内視鏡的データセットを構築した。
このデータセットに基づいて、より堅牢な表現学習のために、Colo-SCRLと呼ばれるシンプルで効果的なトレーニング手法を提案する。
マスク付きオートエンコーダをベースとした再構成と運動量コントラストを用いて,大腸の一般的な知識を洗練し,検索性能を向上させることを目的としている。
論文 参考訳(メタデータ) (2023-03-28T01:27:23Z) - NanoNet: Real-Time Polyp Segmentation in Video Capsule Endoscopy and
Colonoscopy [0.6125117548653111]
ビデオカプセル内視鏡と大腸内視鏡画像の分割のための新しいアーキテクチャであるNanoNetを提案する。
提案アーキテクチャはリアルタイム性能を実現し,他の複雑なアーキテクチャに比べて高いセグメンテーション精度を有する。
論文 参考訳(メタデータ) (2021-04-22T15:40:28Z) - Colonoscopy Polyp Detection: Domain Adaptation From Medical Report
Images to Real-time Videos [76.37907640271806]
大腸内視鏡画像と実時間映像の領域間ギャップに対処する画像-ビデオ結合型ポリープ検出ネットワーク(Ivy-Net)を提案する。
収集したデータセットの実験は、Ivy-Netが大腸内視鏡ビデオで最先端の結果を達成することを示した。
論文 参考訳(メタデータ) (2020-12-31T10:33:09Z) - SAG-GAN: Semi-Supervised Attention-Guided GANs for Data Augmentation on
Medical Images [47.35184075381965]
本稿では,GAN(Cycle-Consistency Generative Adversarial Networks)を用いた医用画像生成のためのデータ拡張手法を提案する。
提案モデルでは,正常画像から腫瘍画像を生成することができ,腫瘍画像から正常画像を生成することもできる。
本研究では,従来のデータ拡張手法と合成画像を用いた分類モデルを用いて,実画像を用いた分類モデルを訓練する。
論文 参考訳(メタデータ) (2020-11-15T14:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。