論文の概要: Assessing Foundation Models for Mold Colony Detection with Limited Training Data
- arxiv url: http://arxiv.org/abs/2510.00561v1
- Date: Wed, 01 Oct 2025 06:25:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.417406
- Title: Assessing Foundation Models for Mold Colony Detection with Limited Training Data
- Title(参考訳): 限定訓練データを用いた金型コロニー検出の基礎モデルの評価
- Authors: Henrik Pichler, Janis Keuper, Matthew Copping,
- Abstract要約: 5000ペトリの食器画像にバウンディングボックスをアノテートした代表的データセットを構築した。
従来のタスク固有のメトリクスのベースラインに対して、3つのビジョンファウンデーションモデルをベンチマークする。
MaskDinoは150枚の画像のみを微調整しながら、広範囲に訓練されたYoloV9モデルでほぼ完成している。
- 参考スコア(独自算出の注目度): 13.811543290168684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The process of quantifying mold colonies on Petri dish samples is of critical importance for the assessment of indoor air quality, as high colony counts can indicate potential health risks and deficiencies in ventilation systems. Conventionally the automation of such a labor-intensive process, as well as other tasks in microbiology, relies on the manual annotation of large datasets and the subsequent extensive training of models like YoloV9. To demonstrate that exhaustive annotation is not a prerequisite anymore when tackling a new vision task, we compile a representative dataset of 5000 Petri dish images annotated with bounding boxes, simulating both a traditional data collection approach as well as few-shot and low-shot scenarios with well curated subsets with instance level masks. We benchmark three vision foundation models against traditional baselines on task specific metrics, reflecting realistic real-world requirements. Notably, MaskDINO attains near-parity with an extensively trained YoloV9 model while finetuned only on 150 images, retaining competitive performance with as few as 25 images, still being reliable on $\approx$ 70% of the samples. Our results show that data-efficient foundation models can match traditional approaches with only a fraction of the required data, enabling earlier development and faster iterative improvement of automated microbiological systems with a superior upper-bound performance than traditional models would achieve.
- Abstract(参考訳): ペトリ皿のカビコロニーの定量化は, 室内空気質の評価において重要な役割を担っている。
従来、このような労働集約的なプロセスの自動化は、微生物学における他のタスクと同様に、大規模なデータセットのマニュアルアノテーションと、YoloV9のようなモデルの拡張的なトレーニングに依存していた。
新しいビジョンタスクに取り組む際には、包括的なアノテーションがもはや必須条件ではないことを示すために、従来のデータ収集アプローチと、インスタンスレベルのマスクを備えた十分にキュレートされたサブセットを備えた、少数ショットと低ショットのシナリオの両方をシミュレートして、5000ペトリの皿イメージの代表的データセットをコンパイルする。
実世界の現実的な要件を反映した3つのビジョン基盤モデルを,タスク固有の指標に基づく従来のベースラインに対してベンチマークする。
特に、MaskDinoは、広範囲に訓練されたYoloV9モデルで、150枚の画像のみを微調整し、25枚の画像で競争性能を保ちながら、サンプルの70%$\approx$で信頼性を保っている。
以上の結果から,データ効率のよい基礎モデルは,必要なデータのごく一部で従来のアプローチと一致し,従来のモデルよりも優れた上界性能を有する自動化微生物システムの早期開発と迅速な反復的改良が可能であることが示唆された。
関連論文リスト
- LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.816876067499415]
我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。
LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。
ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文 参考訳(メタデータ) (2024-10-14T17:51:23Z) - No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance [68.18779562801762]
マルチモーダルモデルは、下流の"ゼロショット"のパフォーマンスを線形改善するために、指数関数的に多くのデータを必要とする。
本研究は,大規模な訓練パラダイムの下での「ゼロショット」一般化能力の鍵となる訓練データに対する指数関数的要求を明らかにする。
論文 参考訳(メタデータ) (2024-04-04T17:58:02Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Rethinking Self-Supervision Objectives for Generalizable Coherence
Modeling [8.329870357145927]
機械生成テキストのコヒーレンス評価は、検討すべきコヒーレンスモデルの主要な応用の1つである。
タスク全体にわたってうまく一般化するモデルをもたらす訓練データと自己超越目標について検討する。
本研究では, 負サンプルの密度の増加が基本モデルを改善することを実証的に示し, 大域的負のキューを用いることで, 強負のサンプルを訓練しながらモデルをさらに改善・安定化する。
論文 参考訳(メタデータ) (2021-10-14T07:44:14Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - CHEER: Rich Model Helps Poor Model via Knowledge Infusion [69.23072792708263]
我々は、そのようなリッチなモデルを伝達可能な表現に簡潔に要約できる知識注入フレームワークCHEERを開発した。
実験の結果、CHEERは複数の生理的データセットのマクロF1スコアにおいて、ベースラインを5.60%から46.80%上回った。
論文 参考訳(メタデータ) (2020-05-21T21:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。