論文の概要: Seeing More with Less: Video Capsule Endoscopy with Multi-Task Learning
- arxiv url: http://arxiv.org/abs/2507.23479v1
- Date: Thu, 31 Jul 2025 12:00:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:09.724077
- Title: Seeing More with Less: Video Capsule Endoscopy with Multi-Task Learning
- Title(参考訳): より少ない視点で見る:マルチタスク学習によるビデオカプセル内視鏡
- Authors: Julia Werner, Oliver Bause, Julius Oexle, Maxime Le Floch, Franz Brinkmann, Jochen Hampe, Oliver Bringmann,
- Abstract要約: 本稿では,消化管内における正確な自己局在機能と,小腸の異常を単一モデルで検出する機能を組み合わせたマルチタスクニューラルネットワークを提案する。
本モデルでは, 局所化タスクでは93.63%, 異常検出タスクでは87.48%の精度が得られた。
- 参考スコア(独自算出の注目度): 0.8824955686704116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video capsule endoscopy has become increasingly important for investigating the small intestine within the gastrointestinal tract. However, a persistent challenge remains the short battery lifetime of such compact sensor edge devices. Integrating artificial intelligence can help overcome this limitation by enabling intelligent real-time decision- making, thereby reducing the energy consumption and prolonging the battery life. However, this remains challenging due to data sparsity and the limited resources of the device restricting the overall model size. In this work, we introduce a multi-task neural network that combines the functionalities of precise self-localization within the gastrointestinal tract with the ability to detect anomalies in the small intestine within a single model. Throughout the development process, we consistently restricted the total number of parameters to ensure the feasibility to deploy such model in a small capsule. We report the first multi-task results using the recently published Galar dataset, integrating established multi-task methods and Viterbi decoding for subsequent time-series analysis. This outperforms current single-task models and represents a significant ad- vance in AI-based approaches in this field. Our model achieves an accu- racy of 93.63% on the localization task and an accuracy of 87.48% on the anomaly detection task. The approach requires only 1 million parameters while surpassing the current baselines.
- Abstract(参考訳): 内視鏡検査は消化管内小腸の検査においてますます重要になっている。
しかし、このようなコンパクトなセンサーエッジデバイスのバッテリー寿命は短い。
人工知能を統合することで、インテリジェントなリアルタイム意思決定を可能にし、エネルギー消費を減らし、バッテリー寿命を長くすることで、この制限を克服することができる。
しかし、データの分散性と、デバイス全体のモデルサイズを制限する限られたリソースのため、これは依然として困難である。
本研究では,消化管内における正確な自己局在機能と,小腸の異常を単一モデルで検出する機能を組み合わせたマルチタスクニューラルネットワークを提案する。
開発プロセスを通じて、我々は、そのようなモデルを小型カプセルに展開する可能性を確保するために、パラメータの総数を一貫して制限した。
本稿では,最近公開されたGalarデータセットを用いたマルチタスクの最初の結果について報告する。
これは現在のシングルタスクモデルより優れており、この分野におけるAIベースのアプローチにおける重要なアドバンスを表している。
本モデルでは, 局所化タスクでは93.63%, 異常検出タスクでは87.48%の精度が得られた。
このアプローチでは、現在のベースラインを超えながら、100万のパラメータしか必要としない。
関連論文リスト
- Enhanced Anomaly Detection for Capsule Endoscopy Using Ensemble Learning Strategies [0.8824955686704116]
本研究は,ビデオカプセル内膜における異常検出タスクの課題に対処するためのアンサンブル戦略を導入する。
本稿では、異常検出フィールドから引き出された各種損失関数を用いて、各ネットワークをトレーニングする。
我々は、Kvasir-Capsuleで76.86%のAUCスコア、Galarデータセットで76.98%のAUCスコアを達成した。
論文 参考訳(メタデータ) (2025-04-08T13:39:39Z) - Optimizing Resource Consumption in Diffusion Models through Hallucination Early Detection [87.22082662250999]
拡散過程の開始時に不正確な世代を迅速に検出する新しいパラダイムであるHEaD(Hallucination Early Detection)を導入する。
HEaDは計算資源を節約し,生成過程を高速化して完全な画像を得ることを示す。
その結果,HEaDは2つのオブジェクトのシナリオで生成時間の最大12%を節約できることがわかった。
論文 参考訳(メタデータ) (2024-09-16T18:00:00Z) - SEDMamba: Enhancing Selective State Space Modelling with Bottleneck Mechanism and Fine-to-Coarse Temporal Fusion for Efficient Error Detection in Robot-Assisted Surgery [7.863539113283565]
選択的状態空間モデル(SSM)を外科的誤り検出に組み込んだSEDMambaという新しい階層モデルを提案する。
SEDMambaは、長期ビデオにおける外科的エラーの検出と時間的局所化のために、ボトルネック機構と微細から粗い時間的融合(FCTF)を備えた選択的SSMを強化する。
我々の研究は、実際の手術症例におけるエラー検出を支援するために、第一種、フレームレベル、生存中の外科的エラーデータセットにも貢献する。
論文 参考訳(メタデータ) (2024-06-22T19:20:35Z) - GENOT: Entropic (Gromov) Wasserstein Flow Matching with Applications to Single-Cell Genomics [20.01834405021846]
単細胞ゲノム学は、細胞行動の理解を深め、治療や精密医療の革新を触媒している。
従来の離散的なソルバは、スケーラビリティ、プライバシ、サンプル外推定の問題によって妨げられています。
我々は、OTマップをパラメータ化するニューラルネットワークベースの解法である、ニューラルOTソルバを提案する。
本研究は, 細胞開発研究, 細胞性薬物応答モデリング, 細胞間翻訳への応用を通じて, その汎用性と堅牢性を実証する。
論文 参考訳(メタデータ) (2023-10-13T17:12:04Z) - The Expressive Leaky Memory Neuron: an Efficient and Expressive Phenomenological Neuron Model Can Solve Long-Horizon Tasks [64.08042492426992]
本稿では,脳皮質ニューロンの生物学的モデルであるExpressive Memory(ELM)ニューロンモデルを紹介する。
ELMニューロンは、上記の入力-出力関係を1万以下のトレーニング可能なパラメータと正確に一致させることができる。
本稿では,Long Range Arena(LRA)データセットなど,時間構造を必要とするタスクで評価する。
論文 参考訳(メタデータ) (2023-06-14T13:34:13Z) - Fast Exploration of the Impact of Precision Reduction on Spiking Neural
Networks [63.614519238823206]
ターゲットハードウェアがコンピューティングの端に達すると、スパイキングニューラルネットワーク(SNN)が実用的な選択となる。
我々は、近似誤差を伝播するそのようなモデルの能力を生かした探索手法を開発するために、インターヴァル算術(IA)モデルを用いる。
論文 参考訳(メタデータ) (2022-11-22T15:08:05Z) - Deep neural networks approach to microbial colony detection -- a
comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。
得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文 参考訳(メタデータ) (2021-08-23T12:06:00Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。