論文の概要: Evaluating Few-Shot Pill Recognition Under Visual Domain Shift
- arxiv url: http://arxiv.org/abs/2603.10833v1
- Date: Wed, 11 Mar 2026 14:40:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:33.003098
- Title: Evaluating Few-Shot Pill Recognition Under Visual Domain Shift
- Title(参考訳): 視覚領域シフト下でのFew-Shot Pill認識の評価
- Authors: W. I. Chu, G. Tarroni, L. Li,
- Abstract要約: 本研究は、デプロイ指向の観点から、数発の錠剤認識について検討する。
2段階のオブジェクト検出フレームワークが採用され、ベーストレーニングと数発の微調整が行われる。
視覚的にリアルなマルチプルデータに基づいてトレーニングされたモデルは、ローショットシナリオにおいて、常により堅牢性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adverse drug events are a significant source of preventable harm, which has led to the development of automated pill recognition systems to enhance medication safety. Real-world deployment of these systems is hindered by visually complex conditions, including cluttered scenes, overlapping pills, reflections, and diverse acquisition environments. This study investigates few-shot pill recognition from a deployment-oriented perspective, prioritizing generalization under realistic cross-dataset domain shifts over architectural innovation. A two-stage object detection framework is employed, involving base training followed by few-shot fine-tuning. Models are adapted to novel pill classes using one, five, or ten labeled examples per class and are evaluated on a separate deployment dataset featuring multi-object, cluttered scenes. The evaluation focuses on classification-centric and error-based metrics to address heterogeneous annotation strategies. Findings indicate that semantic pill recognition adapts rapidly with few-shot supervision, with classification performance reaching saturation even with a single labeled example. However, stress testing under overlapping and occluded conditions demonstrates a marked decline in localization and recall, despite robust semantic classification. Models trained on visually realistic, multi-pill data consistently exhibit greater robustness in low-shot scenarios, underscoring the importance of training data realism and the diagnostic utility of few-shot fine-tuning for deployment readiness.
- Abstract(参考訳): 逆薬の事象は予防可能な害の重大な原因であり、医薬品の安全性を高める自動錠剤認識システムの開発に繋がった。
これらのシステムの現実的な展開は、散らかったシーン、重複するピル、リフレクション、多様な取得環境など、視覚的に複雑な状況によって妨げられている。
本研究は、アーキテクチャの革新よりも現実的なクロスデータセットドメインシフトの下での一般化を優先して、デプロイメント指向の観点から、数発の錠剤認識について検討する。
2段階のオブジェクト検出フレームワークが採用され、ベーストレーニングと数発の微調整が行われる。
モデルは、クラス毎に1つ、5つ、10のラベル付き例を使用して、新しいピルクラスに適応し、複数のオブジェクト、散らばったシーンを特徴とする別々のデプロイメントデータセットで評価される。
この評価は、異種アノテーション戦略に対処するため、分類中心およびエラーベースのメトリクスに焦点を当てる。
セマンティック・ピルの認識は、数発の監視で急速に適応し、分類性能は単一のラベル付き例でも飽和状態に達する。
しかし、重なり合いや閉塞状態下でのストレステストは、ロバストなセマンティックな分類にもかかわらず、局所化とリコールの顕著な減少を示す。
視覚的にリアルでマルチプルなデータに基づいてトレーニングされたモデルは、ローショットシナリオにおいて一貫してより堅牢性を示し、トレーニングデータリアリズムの重要性と、デプロイメントの準備のために数ショットの微調整の診断ユーティリティを強調している。
関連論文リスト
- Open-Vocabulary vs Supervised Learning Methods for Post-Disaster Visual Scene Understanding [4.918510966192794]
本稿では,教師付き学習モデルとオープンボキャブラリ視覚モデルの比較評価を行った。
FloodNet+、RescueNet、DFire、LADDなど、複数のデータセットにわたるセマンティックセグメンテーションとオブジェクト検出に重点を置いています。
評価されたベンチマークでもっとも注目すべき点は、教師付きトレーニングが最も信頼できるアプローチであることだ。
論文 参考訳(メタデータ) (2026-03-01T23:50:08Z) - DExTeR: Weakly Semi-Supervised Object Detection with Class and Instance Experts for Medical Imaging [7.5912342399227235]
本稿では,DexTeR (DETR with Experts) について紹介する。
オブジェクトクエリとして単一ポイントアノテーションをエンコードし、提案されたクラス誘導の変形可能な注意で特徴抽出を洗練する。
異なる医療領域にまたがる3つのデータセットにわたる最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-01-20T13:27:14Z) - Crafting Imperceptible On-Manifold Adversarial Attacks for Tabular Data [38.89245780759371]
本稿では,混合入力変分オートエンコーダ(VAE)を用いた遅延空間摂動フレームワークを提案し,統計的に一貫した逆の例を生成する。
提案手法は,従来の入力空間攻撃と比較して,アウトレーラ率と一貫した性能を著しく低下させることを示す。
論文 参考訳(メタデータ) (2025-07-15T05:34:44Z) - Generalized Semantic Contrastive Learning via Embedding Side Information for Few-Shot Object Detection [52.490375806093745]
マイクロショットオブジェクト検出(FSOD)の目的は、少数のトレーニングサンプルで新しいオブジェクトを検出することである。
本稿では,特徴空間とサンプル視点から得られる負の影響を緩和する側面情報を紹介する。
我々のモデルは従来の最先端手法よりも優れており、ほとんどのショット/スプリットにおけるFSODの能力は大幅に向上している。
論文 参考訳(メタデータ) (2025-04-09T17:24:05Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - Zero-shot Degree of Ill-posedness Estimation for Active Small Object Change Detection [8.977792536037956]
日常的な屋内ナビゲーションでは、ロボットは区別できない小さな変化物体を検出する必要がある。
既存の技術は、変更検出モデルを正規化するために、高品質なクラス固有オブジェクトに依存している。
本研究では,受動とアクティブビジョンの両方を改善するために,DoIの概念を検討する。
論文 参考訳(メタデータ) (2024-05-10T01:56:39Z) - Tackling the Incomplete Annotation Issue in Universal Lesion Detection
Task By Exploratory Training [10.627977735890191]
複数の臓器の病変を医用画像上で検出することを目的としているため、ユニバーサル病変検出は臨床実践に非常に有用である。
ディープラーニング手法は有望な結果を示しているが、トレーニングには大量の注釈付きデータを必要とする。
そこで,教師の予測と不完全なアノテーションを組み合わせることで,学生の学習を指導する教師学生検出モデルを提案する。
論文 参考訳(メタデータ) (2023-09-23T08:44:07Z) - Few-shot Forgery Detection via Guided Adversarial Interpolation [56.59499187594308]
既存の偽造検出手法は、見知らぬ新しい偽造手法に適用した場合、大幅な性能低下に悩まされる。
本稿では,数発の偽造検出問題を克服するために,GAI(Guid Adversarial Interpolation)を提案する。
我々の手法は、多数派と少数派の偽造アプローチの選択に対して堅牢であることが検証されている。
論文 参考訳(メタデータ) (2022-04-12T16:05:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。