論文の概要: ADA-YOLO: Dynamic Fusion of YOLOv8 and Adaptive Heads for Precise Image
Detection and Diagnosis
- arxiv url: http://arxiv.org/abs/2312.10099v1
- Date: Thu, 14 Dec 2023 18:27:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 18:50:32.190489
- Title: ADA-YOLO: Dynamic Fusion of YOLOv8 and Adaptive Heads for Precise Image
Detection and Diagnosis
- Title(参考訳): ADA-YOLO:正確な画像検出・診断のためのYOLOv8とAdaptive Headの動的融合
- Authors: Shun Liu, Jianan Zhang, Ruocheng Song, Teik Toe Teoh
- Abstract要約: 本稿では,注目に基づく機構をYOLOv8アーキテクチャと統合した,軽量かつ効果的な医療オブジェクト検出手法であるADA-YOLOを提案する。
提案手法は,テキスト適応型ヘッドモジュールによるコンピュータビジョンタスクの動的特徴ローカライゼーションと並列回帰を利用する。
- 参考スコア(独自算出の注目度): 0.9804179673817571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection and localization are crucial tasks for biomedical image
analysis, particularly in the field of hematology where the detection and
recognition of blood cells are essential for diagnosis and treatment decisions.
While attention-based methods have shown significant progress in object
detection in various domains, their application in medical object detection has
been limited due to the unique challenges posed by medical imaging datasets. To
address this issue, we propose ADA-YOLO, a light-weight yet effective method
for medical object detection that integrates attention-based mechanisms with
the YOLOv8 architecture. Our proposed method leverages the dynamic feature
localisation and parallel regression for computer vision tasks through
\textit{adaptive head} module. Empirical experiments were conducted on the
Blood Cell Count and Detection (BCCD) dataset to evaluate the effectiveness of
ADA-YOLO. The results showed that ADA-YOLO outperforms the YOLOv8 model in mAP
(mean average precision) on the BCCD dataset by using more than 3 times less
space than YOLOv8. This indicates that our proposed method is effective.
Moreover, the light-weight nature of our proposed method makes it suitable for
deployment in resource-constrained environments such as mobile devices or edge
computing systems. which could ultimately lead to improved diagnosis and
treatment outcomes in the field of hematology.
- Abstract(参考訳): 特に血液細胞の検出と認識が診断および治療決定に不可欠である血液学分野において、物体の検出と局在は生体画像解析にとって重要な課題である。
注意に基づく手法は様々な領域でオブジェクト検出の著しい進歩を示しているが、医療用オブジェクト検出への応用は、医療用画像データセットによって引き起こされるユニークな課題のために制限されている。
そこで本研究では,注目に基づく機構をYOLOv8アーキテクチャと統合した,軽量かつ効果的な医療オブジェクト検出手法であるADA-YOLOを提案する。
提案手法は, \textit{adaptive head} モジュールによるコンピュータビジョンタスクの動的特徴ローカライズと並列回帰を利用する。
血液細胞数検出(BCCD)データセットを用いてADA-YOLOの有効性を評価する実験を行った。
その結果, ADA-YOLOは, YOLOv8の3倍以上の空間を用いて, BCCDデータセットのmAP(平均精度)において, YOLOv8モデルよりも優れていた。
これは提案手法が有効であることを示している。
さらに,提案手法の軽量性は,モバイルデバイスやエッジコンピューティングシステムなどの資源制約のある環境への展開に適している。
最終的に血液学の分野で診断と治療の結果が改善する可能性がある。
関連論文リスト
- Optimizing Skin Lesion Classification via Multimodal Data and Auxiliary
Task Integration [54.76511683427566]
本研究は, スマートフォンで撮影した画像と本質的な臨床および人口統計情報を統合することで, 皮膚病変を分類する新しいマルチモーダル手法を提案する。
この手法の特徴は、超高解像度画像予測に焦点を当てた補助的なタスクの統合である。
PAD-UFES20データセットを用いて,様々なディープラーニングアーキテクチャを用いて実験を行った。
論文 参考訳(メタデータ) (2024-02-16T05:16:20Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - MedYOLO: A Medical Image Object Detection Framework [0.0]
YOLOモデルのワンショット検出手法を用いた3次元オブジェクト検出フレームワークであるMedYOLOについて報告する。
我々のモデルでは、心臓、肝臓、膵など、現在一般的に使われている中大の構造物で高い性能を実現している。
論文 参考訳(メタデータ) (2023-12-12T20:46:14Z) - Explainable AI in Diagnosing and Anticipating Leukemia Using Transfer
Learning Method [0.0]
本研究は,小児および10代に流行する急性リンパ芽球性白血病(ALL)に焦点をあてる。
ディープラーニング技術を活用したコンピュータ支援診断(CAD)モデルを用いた自動検出手法を提案する。
提案手法は98.38%の精度を達成し、他の試験モデルよりも優れていた。
論文 参考訳(メタデータ) (2023-12-01T10:37:02Z) - RO-LLaMA: Generalist LLM for Radiation Oncology via Noise Augmentation
and Consistency Regularization [51.877826904868975]
放射線腫瘍学の分野に適した汎用汎用大言語モデル(LLM)であるRO-LLaMAを提案する。
このモデルは、臨床報告の要約などの様々なタスクに適応し、放射線腫瘍専門医の幅広いワークフローをシームレスにカバーする。
また,新しいCEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z) - LLM-driven Multimodal Target Volume Contouring in Radiation Oncology [55.20049911531224]
大規模言語モデル(LLM)は、テキスト情報と画像の統合を容易にする。
LLM駆動型マルチモーダルAIを,放射線治療における目標音量調整の課題に適用する。
提案モデルでは,従来の視覚のみのAIモデルと比較して,性能が著しく向上していることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:38:42Z) - Histogram- and Diffusion-Based Medical Out-of-Distribution Detection [2.9359784266087106]
ヒストグラム法と拡散法を組み合わせたパイプラインを提案する。
提案手法は, ぼかしおよびバイアス場サンプルに敏感であるが, 解剖学的変形, 黒スライス, スワップパッチによる課題に直面している。
これらの結果から,医用画像のOOD検出におけるDDPMの性能向上にはさらなる研究が必要であることが示唆された。
論文 参考訳(メタデータ) (2023-10-12T18:26:48Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Data Augmentation-Based Unsupervised Domain Adaptation In Medical
Imaging [0.709016563801433]
脳MRI領域分割における堅牢な領域適応のための教師なし手法を提案する。
その結果,提案手法は高い精度を実現し,幅広い適用性を示し,各種タスクにおけるドメインシフトに対する顕著な堅牢性を示した。
論文 参考訳(メタデータ) (2023-08-08T17:00:11Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - TE-YOLOF: Tiny and efficient YOLOF for blood cell detection [26.463853328783962]
顕微鏡画像における血液細胞検出は、医用画像処理研究の不可欠な分野である。
本研究では, 赤血球, 白血球, 血小板などの血液細胞物体を検出するために, YOLOFに基づく物体検出法が提案されている。
効率性と柔軟性を向上させるため、提案したオブジェクト検出器のバックボーンとして、EfficientNet Convolutional Neural Networkが使用される。
論文 参考訳(メタデータ) (2021-08-27T14:45:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。