論文の概要: ePillID Dataset: A Low-Shot Fine-Grained Benchmark for Pill
Identification
- arxiv url: http://arxiv.org/abs/2005.14288v2
- Date: Mon, 7 Sep 2020 22:29:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-11-27 05:55:55.755147
- Title: ePillID Dataset: A Low-Shot Fine-Grained Benchmark for Pill
Identification
- Title(参考訳): ePillIDデータセット: ピン識別のための低ショット細粒度ベンチマーク
- Authors: Naoto Usuyama, Natalia Larios Delgado, Amanda K. Hall, Jessica Lundin
- Abstract要約: 我々は、9804の出現クラスを表す13k画像からなる、ピル画像認識における最大の公開ベンチマークであるePillIDを紹介する。
ほとんどの外観クラスでは、参照画像は1つしか存在せず、ローショットの認識設定に挑戦する。
- 参考スコア(独自算出の注目度): 5.914780964919123
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identifying prescription medications is a frequent task for patients and
medical professionals; however, this is an error-prone task as many pills have
similar appearances (e.g. white round pills), which increases the risk of
medication errors. In this paper, we introduce ePillID, the largest public
benchmark on pill image recognition, composed of 13k images representing 9804
appearance classes (two sides for 4902 pill types). For most of the appearance
classes, there exists only one reference image, making it a challenging
low-shot recognition setting. We present our experimental setup and evaluation
results of various baseline models on the benchmark. The best baseline using a
multi-head metric-learning approach with bilinear features performed remarkably
well; however, our error analysis suggests that they still fail to distinguish
particularly confusing classes. The code and data are available at
https://github.com/usuyama/ePillID-benchmark.
- Abstract(参考訳): 処方薬の特定は、患者や医療専門家にとって頻繁な作業であるが、多くの薬が類似した外観(例えば、白い丸い錠剤)を持つため、薬剤の誤用によるリスクが増大する。
本稿では,9804の出現クラス(4902のピルタイプ)を表す13k画像からなる,ピル画像認識における最大のベンチマークであるePillIDを紹介する。
ほとんどの外観クラスでは、参照画像は1つしか存在せず、ローショットの認識設定に挑戦する。
本稿では,ベンチマークによる各種ベースラインモデルのセットアップと評価結果について述べる。
双線形特徴を持つマルチヘッド・メトリック・ラーニング・アプローチを用いた最良のベースラインは極めて良好に動作したが,誤差解析の結果,特に難解なクラスを区別できないことが示唆された。
コードとデータはhttps://github.com/usuyama/epillid-benchmarkで入手できる。
関連論文リスト
- High Accurate and Explainable Multi-Pill Detection Framework with Graph
Neural Network-Assisted Multimodal Data Fusion [9.197624827438029]
我々はまず,実環境におけるマルチピル検出問題に取り組み,薬の摂取量でユーザによって捕獲された錠剤のローカライズと同定を目的としている。
ハードサンプルを扱うために,3種類のパイプ間関係を組み込んだ不均一な先行グラフを構築する手法を提案する。
次に、検出精度を高めるために、プリオリとピルの視覚的特徴を統合するためのフレームワークを提供する。
論文 参考訳(メタデータ) (2023-03-17T05:48:26Z) - Pixel-Level Explanation of Multiple Instance Learning Models in
Biomedical Single Cell Images [52.527733226555206]
複数のインスタンス学習モデルを説明するための4つの属性法について検討する。
急性骨髄性白血病の2つのデータセットと100万以上の単細胞画像について検討した。
我々は、属性マップと医療専門家の注釈を比較し、モデルの意思決定が人間の基準とどのように異なるかを確認する。
論文 参考訳(メタデータ) (2023-03-15T14:00:11Z) - Few-Shot Meta Learning for Recognizing Facial Phenotypes of Genetic
Disorders [55.41644538483948]
分類の自動化と類似性検索は、医師が可能な限り早期に遺伝状態の診断を行うための意思決定を支援する。
従来の研究は分類問題としてこの問題に対処し、深層学習法を用いてきた。
本研究では,健常人の大規模なコーパスで訓練した顔認識モデルを用いて,顔の表情認識に移行した。
論文 参考訳(メタデータ) (2022-10-23T11:52:57Z) - Multi-stream Fusion for Class Incremental Learning in Pill Image
Classification [5.013866470627594]
従来のピル画像分類システムにクラスインクリメンタルラーニング(CIL)機能を導入する。
本フレームワークでは,ピル画像の色特化情報をガイダンスストリームとして検討する。
CG-IMIFは,タスク設定の相違により,複数の最先端手法を一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-05T15:05:15Z) - A Novel Approach for Pill-Prescription Matching with GNN Assistance and
Contrastive Learning [6.226781755452289]
モバイル画像から薬の処方を正しく識別するシステムを開発した。
PIMAはグラフニューラルネットワーク(GNN)とコントラスト学習を用いた新しいアプローチである。
PIMAは、他のベースラインと比較して精度を19.09%から46.95%に改善している。
論文 参考訳(メタデータ) (2022-09-02T16:18:36Z) - Long-Tailed Classification of Thorax Diseases on Chest X-Ray: A New
Benchmark Study [75.05049024176584]
胸部X線上の胸部疾患の特定領域における長期学習問題についてベンチマーク研究を行った。
我々は,自然に分布する胸部X線データから学ぶことに集中し,一般的な「頭部」クラスだけでなく,稀ながら重要な「尾」クラスよりも分類精度を最適化する。
このベンチマークは、19と20の胸郭疾患分類のための2つの胸部X線データセットで構成され、53,000のクラスと7のラベル付きトレーニング画像を含む。
論文 参考訳(メタデータ) (2022-08-29T04:34:15Z) - Image-based Contextual Pill Recognition with Medical Knowledge Graph
Assistance [3.4123736336071864]
創薬精度を高めるために外部知識を活用するPIKAという新しいアプローチを導入する。
具体的には,患者が服薬を摂取した写真から薬を識別することを目的とした現実的なシナリオ(文脈的錠剤認識)に対処する。
このフレームワーク内では、各錠剤の視覚的表現をグラフ埋め込み空間にマッピングし、グラフ表現に注意を向けるために使用される。
論文 参考訳(メタデータ) (2022-08-04T03:55:53Z) - Diagnosing Ensemble Few-Shot Classifiers [69.15270726640723]
そこで本研究では,視覚解析手法であるFSLDiagnotorを提案し,その原因を解明し,改善する。
2つのケーススタディにより、FSLDiagnotorは、数ショットの分類器を効率的に構築し、精度をそれぞれ12%と21%向上させることを示した。
論文 参考訳(メタデータ) (2022-06-09T09:29:18Z) - Weakly Supervised Contrastive Learning [68.47096022526927]
この問題に対処するために,弱教師付きコントラスト学習フレームワーク(WCL)を導入する。
WCLはResNet50を使用して65%と72%のImageNet Top-1の精度を実現している。
論文 参考訳(メタデータ) (2021-10-10T12:03:52Z) - VeriMedi: Pill Identification using Proxy-based Deep Metric Learning and
Exact Solution [0.0]
このソリューションには、セグメンテーションと識別を行う2つの連続接続型ディープラーニングソリューションがある。
セグメンテーションソリューションは、マスクR-CNNモデルを使用してバイアル画像内の各ピルのマスクを作成し、その後、セグメンテーションと作物を丸薬を作成し、背景をぼやけます。
生成された埋め込みベクトルは、1つの丸薬イメージを予測するために正確なソリューションで訓練された1層の完全に接続されたネットワークに供給されます。
論文 参考訳(メタデータ) (2021-04-22T06:52:30Z) - Do Public Datasets Assure Unbiased Comparisons for Registration
Evaluation? [96.53940048041248]
画像誘導神経外科医の登録をベンチマークするために、2つのデータセットで手動で注釈付けされたランドマークをスクリーニングするために、ヴァリグラムを使用します。
Variograms を用いて, 潜在的に有意な症例を同定し, 経験者により検討した。
論文 参考訳(メタデータ) (2020-03-20T20:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。