論文の概要: PHOEBI: An Open-World Benchmark for Bacterial Identification in Phase-Contrast Microscopy
- arxiv url: http://arxiv.org/abs/2606.22890v1
- Date: Mon, 22 Jun 2026 06:01:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 03:50:50.574497
- Title: PHOEBI: An Open-World Benchmark for Bacterial Identification in Phase-Contrast Microscopy
- Title(参考訳): PHOEBI: 位相コントラスト顕微鏡における細菌の同定のためのオープンワールドベンチマーク
- Authors: Aaditya Baranwal, Md Jahid Hasan, Shruti Vyas,
- Abstract要約: フィールドサンプルは、通常、多微生物であり、システムトレーニング中に見たことのない有機体を含むこともある。
これらの混合物の位相コントラスト顕微鏡(PCM)からマルチラベル種を同定するコンピュータビジョンベンチマークは存在しない。
そこで我々は,3つの軽量な$textitanchorベースの$デコーダを提案する。
- 参考スコア(独自算出の注目度): 3.8652318379785897
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Optical microscopy enables rapid, label-free imaging of live bacteria and is the standard instrument for species identification across clinical, environmental, and industrial microbiology. Yet field samples are routinely polymicrobial and may contain organisms that were never seen during system training, and no computer-vision benchmark tests multi-label species identification from phase-contrast microscopy (PCM) of such mixtures. We introduce Phase-contrast Optical bEnchmark for Bacterial Identification ($\textbf{PHOEBI}$), a wet-lab-prepared dataset of $120{,}000$ PCM images covering $40$ combinations of six rod-shaped species, paired with a leave-combinations-out (LCO) evaluation protocol that holds out entire species combinations to mirror the practical scenario of a model trained on catalogued mixtures that must generalise to unseen ones. On LCO, every gradient-trained per-image aggregator we test drops $0.39$ to $0.57$ F1 from the in-distribution to the held-out split, a systematic open-world recognition failure in the aggregator, not the visual representation. A linear probe of thirteen different encoders over the same features spreads only about six percentage points of F1 across general-purpose and biomedical pretraining objectives, confirming the representation is sound. We propose three lightweight $\textit{anchor-based}$ decoders that capture per-species presence geometrically over a shared frozen tile-feature pool, scoring $\textit{higher}$ on held-out combinations than on in-distribution validation.
- Abstract(参考訳): 光学顕微鏡は、生菌の迅速かつ無ラベルイメージングを可能にし、臨床、環境、産業微生物学の種同定の標準装置である。
しかし、フィールドサンプルは日常的に多微生物であり、システムトレーニング中に見たことのない生物を含んでいる可能性があり、そのような混合物の位相コントラスト顕微鏡(PCM)から複数のラベル種を識別するコンピュータビジョンのベンチマークは存在しない。
我々は6つの棒状の種の組み合わせを40ドル(約4万4000円)でカバーし、すべての種の組み合わせを格納し、見知らぬ種に一般化しなければならないカタログ混合物で訓練されたモデルの現実的なシナリオを反映する、Left-combinations-out (LCO)評価プロトコルと組み合わせて、相反する光学的bEnchmark for bacteriaal Identification (\textbf{PHOEBI}$)を紹介した。
LCOでは、各勾配訓練された画像ごとのアグリゲータは、視覚表現ではなく、アグリゲータの体系的なオープンワールド認識障害であるホールドアウトスプリットへの分布から、$0.39$から$0.57$F1をドロップする。
同じ特徴に対する13の異なるエンコーダの線形プローブは、汎用的およびバイオメディカルな事前訓練対象に対してF1の6パーセントしか広まらず、その表現が音であることを確認した。
そこで本研究では,共有冷凍タイル機能プール上の種ごとの存在を幾何学的にキャプチャする,軽量な$\textit{anchor-based}$デコーダを3つ提案する。
関連論文リスト
- Predicting Immune Biomarkers with MultiModal Mixture-of-Expert Pathology Foundation Models Empowers Precision Oncology [47.79180201495836]
MixTIMEは、異なるモダリティで訓練された病理基盤モデルを統合したマルチモーダル基礎モデルである。
ヘマトキシリンおよびエオシン全スライディング画像から多重免疫蛍光(mIF)タンパク質の発現を予測する。
MixTIMEは17個のタンパク質マーカーにまたがる最先端のパフォーマンスを相関指標で測定する。
論文 参考訳(メタデータ) (2026-06-16T16:22:42Z) - Towards Label-Free Single-Cell Phenotyping Using Multi-Task Learning [3.846593903209593]
本稿では,ラベルフリー微分位相コントラスト(DPC)画像からWhite Blood Cell (WBC)分類と連続タンパク質発現レグレッションを共同で行う統合ディープラーニングフレームワークを提案する。
バークレー単細胞顕微鏡(BSCCM)と血液細胞画像ベンチマークの実験は、強い性能を示した。
これらの結果は, ラベルフリー単細胞イメージングによる, 低コストな血液学的プロファイリングの可能性を強調し, 蛍光染色を伴わない同時表現型同定と定量的バイオマーカー推定を可能にした。
論文 参考訳(メタデータ) (2026-05-14T11:38:56Z) - Micro-Defects Expose Macro-Fakes: Detecting AI-Generated Images via Local Distributional Shifts [48.75898711300078]
生成モデルは、非常に現実的なように見えるイメージを生成することができ、実際の画像とAI生成イメージを区別する上での課題を提起する。
局所分布認識検出フレームワークであるマクロフェイク(MDMF)のマイクロ欠陥をマクロレベルの分布不規則性に増幅する。
提案手法は, 局所的な法医学的信号が生成画像に存在する場合, パッチワイド・モデリングにより, 明らかな相違が生じることを示す。
論文 参考訳(メタデータ) (2026-05-10T03:44:09Z) - Differential Attention-Augmented BiomedCLIP with Asymmetric Focal Optimization for Imbalanced Multi-Label Video Capsule Endoscopy Classification [1.2246649738388389]
本研究は,ビデオカプセル内視鏡(VCE)のためのマルチラベル分類フレームワークを提案する。
アーキテクチャと最適化レベルの戦略を組み合わせることで、Galarデータセットに固有の極端なクラス不均衡に対処する。
論文 参考訳(メタデータ) (2026-03-18T16:04:50Z) - DIA-CLIP: a universal representation learning framework for zero-shot DIA proteomics [9.005785118040423]
本稿では,DIA分析パラダイムを半教師付きトレーニングから普遍的クロスモーダル表現学習へシフトさせる事前学習モデルであるDIA-CLIPを提案する。
二重エンコーダ・コントラスト学習フレームワークとエンコーダ・デコーダアーキテクチャを統合することにより、DIA-CLIPはペプチドとそれに対応するスペクトルの特徴を統一したクロスモーダル表現を確立する。
論文 参考訳(メタデータ) (2026-02-02T07:55:24Z) - Diffusion-Guided Mask-Consistent Paired Mixing for Endoscopic Image Segmentation [57.37991748282666]
本稿では, 試料混合と拡散合成の強度を融合した拡散誘導型パラダイムを提案する。
各実画像について、合成対を同じマスクの下で生成し、その対をマスク一貫性ペアドミキシング(MCPMix)の制御可能な入力として使用する。
これは、共有幾何学の下で合成および実際の外観を円滑にブリッジする中間サンプルの連続的な族を生成する。
論文 参考訳(メタデータ) (2025-11-05T06:14:19Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Co-Heterogeneous and Adaptive Segmentation from Multi-Source and
Multi-Phase CT Imaging Data: A Study on Pathological Liver and Lesion
Segmentation [48.504790189796836]
我々は,新しいセグメンテーション戦略,コヘテロジネティック・アダプティブセグメンテーション(CHASe)を提案する。
本稿では,外見に基づく半スーパービジョン,マスクに基づく対向ドメイン適応,擬似ラベルを融合した多目的フレームワークを提案する。
CHASeは4.2% sim 9.4%$の範囲で、病理的な肝臓マスクDice-Sorensen係数をさらに改善することができる。
論文 参考訳(メタデータ) (2020-05-27T06:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。