論文の概要: ADA-YOLO: Dynamic Fusion of YOLOv8 and Adaptive Heads for Precise Image
Detection and Diagnosis
- arxiv url: http://arxiv.org/abs/2312.10099v1
- Date: Thu, 14 Dec 2023 18:27:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 18:50:32.190489
- Title: ADA-YOLO: Dynamic Fusion of YOLOv8 and Adaptive Heads for Precise Image
Detection and Diagnosis
- Title(参考訳): ADA-YOLO:正確な画像検出・診断のためのYOLOv8とAdaptive Headの動的融合
- Authors: Shun Liu, Jianan Zhang, Ruocheng Song, Teik Toe Teoh
- Abstract要約: 本稿では,注目に基づく機構をYOLOv8アーキテクチャと統合した,軽量かつ効果的な医療オブジェクト検出手法であるADA-YOLOを提案する。
提案手法は,テキスト適応型ヘッドモジュールによるコンピュータビジョンタスクの動的特徴ローカライゼーションと並列回帰を利用する。
- 参考スコア(独自算出の注目度): 0.9804179673817571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection and localization are crucial tasks for biomedical image
analysis, particularly in the field of hematology where the detection and
recognition of blood cells are essential for diagnosis and treatment decisions.
While attention-based methods have shown significant progress in object
detection in various domains, their application in medical object detection has
been limited due to the unique challenges posed by medical imaging datasets. To
address this issue, we propose ADA-YOLO, a light-weight yet effective method
for medical object detection that integrates attention-based mechanisms with
the YOLOv8 architecture. Our proposed method leverages the dynamic feature
localisation and parallel regression for computer vision tasks through
\textit{adaptive head} module. Empirical experiments were conducted on the
Blood Cell Count and Detection (BCCD) dataset to evaluate the effectiveness of
ADA-YOLO. The results showed that ADA-YOLO outperforms the YOLOv8 model in mAP
(mean average precision) on the BCCD dataset by using more than 3 times less
space than YOLOv8. This indicates that our proposed method is effective.
Moreover, the light-weight nature of our proposed method makes it suitable for
deployment in resource-constrained environments such as mobile devices or edge
computing systems. which could ultimately lead to improved diagnosis and
treatment outcomes in the field of hematology.
- Abstract(参考訳): 特に血液細胞の検出と認識が診断および治療決定に不可欠である血液学分野において、物体の検出と局在は生体画像解析にとって重要な課題である。
注意に基づく手法は様々な領域でオブジェクト検出の著しい進歩を示しているが、医療用オブジェクト検出への応用は、医療用画像データセットによって引き起こされるユニークな課題のために制限されている。
そこで本研究では,注目に基づく機構をYOLOv8アーキテクチャと統合した,軽量かつ効果的な医療オブジェクト検出手法であるADA-YOLOを提案する。
提案手法は, \textit{adaptive head} モジュールによるコンピュータビジョンタスクの動的特徴ローカライズと並列回帰を利用する。
血液細胞数検出(BCCD)データセットを用いてADA-YOLOの有効性を評価する実験を行った。
その結果, ADA-YOLOは, YOLOv8の3倍以上の空間を用いて, BCCDデータセットのmAP(平均精度)において, YOLOv8モデルよりも優れていた。
これは提案手法が有効であることを示している。
さらに,提案手法の軽量性は,モバイルデバイスやエッジコンピューティングシステムなどの資源制約のある環境への展開に適している。
最終的に血液学の分野で診断と治療の結果が改善する可能性がある。
関連論文リスト
- MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文 参考訳(メタデータ) (2024-10-16T23:03:27Z) - LSM-YOLO: A Compact and Effective ROI Detector for Medical Detection [8.812471041082105]
軽量適応抽出(LAE)とマルチパスシャント特徴マッチング(MSFM)を組み合わせた軽量シャントマッチングヨロ(LSM-YOLO)という新しいモデルを提案する。
LSM-YOLOは、膵腫瘍のプライベートデータセットで48.6%AP、BCCD血液細胞検出公開データセットで65.1%AP、Br35h脳腫瘍検出公開データセットで73.0%APを達成した。
論文 参考訳(メタデータ) (2024-08-26T08:16:58Z) - CAF-YOLO: A Robust Framework for Multi-Scale Lesion Detection in Biomedical Imagery [0.0682074616451595]
CAF-YOLOは、畳み込みニューラルネットワーク(CNN)とトランスフォーマーの強みを活用する、医学的対象検出のための、巧妙で堅牢な方法である。
ACFMモジュールはグローバル機能とローカル機能の両方のモデリングを強化し、長期的な機能依存のキャプチャを可能にする。
MSNNは多様なスケールにまたがる特徴を抽出することで、マルチスケールの情報集約を改善する。
論文 参考訳(メタデータ) (2024-08-04T01:44:44Z) - Exploring Machine Learning Algorithms for Infection Detection Using GC-IMS Data: A Preliminary Study [2.4961885884659987]
本研究は, 正確な感染診断の現在進行中の問題に対処することを目的としている。
Gas Chromatography-Ion Mobility Spectrometry (GC-IMS)データを利用して、機械学習アルゴリズムを1つのプラットフォームに組み込むことで、この問題に対処することを目指している。
論文 参考訳(メタデータ) (2024-04-24T09:25:16Z) - Super-resolution of biomedical volumes with 2D supervision [84.5255884646906]
超解像のための仮設スライス拡散は、生物学的標本のすべての空間次元にわたるデータ生成分布の固有同値性を利用する。
我々は,高解像度2次元画像の高速取得を特徴とするSliceRの組織学的刺激(SRH)への応用に着目する。
論文 参考訳(メタデータ) (2024-04-15T02:41:55Z) - Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - Explainable AI in Diagnosing and Anticipating Leukemia Using Transfer
Learning Method [0.0]
本研究は,小児および10代に流行する急性リンパ芽球性白血病(ALL)に焦点をあてる。
ディープラーニング技術を活用したコンピュータ支援診断(CAD)モデルを用いた自動検出手法を提案する。
提案手法は98.38%の精度を達成し、他の試験モデルよりも優れていた。
論文 参考訳(メタデータ) (2023-12-01T10:37:02Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - TE-YOLOF: Tiny and efficient YOLOF for blood cell detection [26.463853328783962]
顕微鏡画像における血液細胞検出は、医用画像処理研究の不可欠な分野である。
本研究では, 赤血球, 白血球, 血小板などの血液細胞物体を検出するために, YOLOFに基づく物体検出法が提案されている。
効率性と柔軟性を向上させるため、提案したオブジェクト検出器のバックボーンとして、EfficientNet Convolutional Neural Networkが使用される。
論文 参考訳(メタデータ) (2021-08-27T14:45:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。