論文の概要: A metric learning approach for endoscopic kidney stone identification
- arxiv url: http://arxiv.org/abs/2307.07046v1
- Date: Thu, 13 Jul 2023 20:02:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-17 15:41:33.083609
- Title: A metric learning approach for endoscopic kidney stone identification
- Title(参考訳): 内視鏡的腎臓結石同定のための計量学習法
- Authors: Jorge Gonzalez-Zapata and Francisco Lopez-Tiro and Elias
Villalvazo-Avila and Daniel Flores-Araiza and Jacques Hubert and Andres
Mendez-Vazquez and Gilberto Ochoa-Ruiz and Christian Daul
- Abstract要約: 本稿では,DML(Deep Metric Learning)手法を用いて,サンプル数が少ないクラスを扱えるようにし,また,分散サンプルが存在しないクラスを適切に一般化し,データベースに付加される新しいクラスに対処する。
提案したガイド付き深度学習アプローチは、データ表現を改良された方法で学習するように設計された、新しいアーキテクチャに基づいている。
教師モデル(GEMINI)は、ラベル付きデータから事前知識に基づいて仮説空間を縮小し、知識蒸留方式により学生モデル(ResNet50)のガイドとして使用される。
- 参考スコア(独自算出の注目度): 0.879504058268139
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Several Deep Learning (DL) methods have recently been proposed for an
automated identification of kidney stones during an ureteroscopy to enable
rapid therapeutic decisions. Even if these DL approaches led to promising
results, they are mainly appropriate for kidney stone types for which numerous
labelled data are available. However, only few labelled images are available
for some rare kidney stone types. This contribution exploits Deep Metric
Learning (DML) methods i) to handle such classes with few samples, ii) to
generalize well to out of distribution samples, and iii) to cope better with
new classes which are added to the database. The proposed Guided Deep Metric
Learning approach is based on a novel architecture which was designed to learn
data representations in an improved way. The solution was inspired by Few-Shot
Learning (FSL) and makes use of a teacher-student approach. The teacher model
(GEMINI) generates a reduced hypothesis space based on prior knowledge from the
labeled data, and is used it as a guide to a student model (i.e., ResNet50)
through a Knowledge Distillation scheme. Extensive tests were first performed
on two datasets separately used for the recognition, namely a set of images
acquired for the surfaces of the kidney stone fragments, and a set of images of
the fragment sections. The proposed DML-approach improved the identification
accuracy by 10% and 12% in comparison to DL-methods and other DML-approaches,
respectively. Moreover, model embeddings from the two dataset types were merged
in an organized way through a multi-view scheme to simultaneously exploit the
information of surface and section fragments. Test with the resulting mixed
model improves the identification accuracy by at least 3% and up to 30% with
respect to DL-models and shallow machine learning methods, respectively.
- Abstract(参考訳): 近年, 尿管鏡検査中に腎臓結石を自動同定し, 迅速な治療決定を可能にする方法として, 深層学習法が提案されている。
これらのDLアプローチが有望な結果をもたらしたとしても、多くのラベル付きデータが利用できる腎臓結石タイプに主に適している。
しかし、まれな腎臓結石のタイプでは、ラベル付き画像はごくわずかである。
この貢献はDeep Metric Learning(DML)メソッドを活用する
i) サンプルが少ないクラスを扱うこと。
二 分布サンプルの外部によく一般化すること、及び
三 データベースに追加される新しいクラスをよりよく扱うこと。
提案したガイド付き深度学習アプローチは、データ表現を改良された方法で学習するように設計された新しいアーキテクチャに基づいている。
このソリューションはFew-Shot Learning (FSL)にインスパイアされ、教師と学生のアプローチを利用している。
教師モデル(gemini)は、ラベル付きデータから事前知識に基づいて縮小仮説空間を生成し、知識蒸留スキームを通じて学生モデル(resnet50)へのガイドとして使用する。
この認識のために別々に使用される2つのデータセット、すなわち腎臓石片の表面に取得された画像セットと断片片のイメージセットで、広範囲なテストが最初に行われた。
DML-approachはDL-methodsおよび他のDML-approachesと比較して識別精度を10%および12%改善した。
さらに,2種類のデータセットからのモデル埋め込みをマルチビュー方式で統合し,表面および断面断片の情報を同時に活用した。
その結果得られた混合モデルによるテストは、dlモデルと浅層機械学習法に対して、識別精度を少なくとも3%、最大30%向上させる。
関連論文リスト
- Multi Teacher Privileged Knowledge Distillation for Multimodal Expression Recognition [58.41784639847413]
人間の感情は、表情、声調、ボディランゲージ、生理的信号を通じて伝達され知覚される複雑な現象である。
本稿では, 学生に蒸留する前に, 教師の多様な表現を並べ合わせるために, 自己蒸留による多教師PKD(MT-PKDOT)法を提案する。
その結果,提案手法はSOTA PKD法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-08-16T22:11:01Z) - Deep Prototypical-Parts Ease Morphological Kidney Stone Identification
and are Competitively Robust to Photometric Perturbations [0.9236074230806579]
腎結石サブタイプ当たりのプロトタイプ部分(PP)を学習し,出力分類を生成する。
我々の実装の平均精度は、最先端(SOTA)非解釈可能なDLモデルよりも1.5%低い。
本モデルでは, 対向訓練を伴わずに, 標準偏差の低い摂動画像を2.8%向上させる。
論文 参考訳(メタデータ) (2023-04-08T17:43:31Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - SSD-KD: A Self-supervised Diverse Knowledge Distillation Method for
Lightweight Skin Lesion Classification Using Dermoscopic Images [62.60956024215873]
皮膚がんは最も一般的な悪性腫瘍の1つであり、人口に影響を与え、世界中で経済的な重荷を負っている。
皮膚がん検出のほとんどの研究は、ポータブルデバイス上での計算資源の制限を考慮せずに、高い予測精度を追求している。
本研究は,皮膚疾患分類のための汎用的なKDフレームワークに多様な知識を統一する,SSD-KDと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-22T06:54:29Z) - A Deep Learning-Based Unified Framework for Red Lesions Detection on
Retinal Fundus Images [3.5557219875516646]
糖尿病性網膜症(DR)の早期徴候は,小動脈瘤 (MAs) と出血 (HMs) である。
既存の手法のほとんどは、テクスチャ、サイズ、形態の違いから、MAまたはHMのみを検出する。
そこで本研究では,小病変と大病変を同時に扱う2流レッド病変検出システムを提案する。
論文 参考訳(メタデータ) (2021-09-10T00:12:13Z) - About Explicit Variance Minimization: Training Neural Networks for
Medical Imaging With Limited Data Annotations [2.3204178451683264]
VAT(Variance Aware Training)法は、モデル損失関数に分散誤差を導入することにより、この特性を利用する。
多様な領域から得られた3つの医用画像データセットと様々な学習目標に対するVATの有効性を検証した。
論文 参考訳(メタデータ) (2021-05-28T21:34:04Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - Additive Angular Margin for Few Shot Learning to Classify Clinical
Endoscopy Images [42.74958357195011]
我々は、トレーニングデータが少なくなり、未知のデータセットからテストサンプルのラベルクラスを予測するために使用できる、数ショットの学習手法を提案する。
我々は,マルチセンター,マルチオーガナイズド,マルチモーダル内視鏡データの大規模コホートにおけるいくつかの確立された手法との比較を行った。
論文 参考訳(メタデータ) (2020-03-23T00:20:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。