論文の概要: GenCellAgent: Generalizable, Training-Free Cellular Image Segmentation via Large Language Model Agents
- arxiv url: http://arxiv.org/abs/2510.13896v1
- Date: Tue, 14 Oct 2025 17:02:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.521033
- Title: GenCellAgent: Generalizable, Training-Free Cellular Image Segmentation via Large Language Model Agents
- Title(参考訳): GenCellAgent: 大規模言語モデルエージェントによる汎用的でトレーニング不要なセルイメージセグメンテーション
- Authors: Xi Yu, Yang Yang, Qun Liu, Yonghua Du, Sean McSweeney, Yuewei Lin,
- Abstract要約: GenCellAgentは、スペシャリストセグメンタとジェネラリストビジョン言語モデルをオーケストレーションする、トレーニング不要なマルチエージェントフレームワークである。
新しいデータセットから得られる小胞体とミトコンドリアでは、GenCellAgentは専門モデルよりも平均IoUを37.6%改善する。
- 参考スコア(独自算出の注目度): 19.812314316869195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cellular image segmentation is essential for quantitative biology yet remains difficult due to heterogeneous modalities, morphological variability, and limited annotations. We present GenCellAgent, a training-free multi-agent framework that orchestrates specialist segmenters and generalist vision-language models via a planner-executor-evaluator loop (choose tool $\rightarrow$ run $\rightarrow$ quality-check) with long-term memory. The system (i) automatically routes images to the best tool, (ii) adapts on the fly using a few reference images when imaging conditions differ from what a tool expects, (iii) supports text-guided segmentation of organelles not covered by existing models, and (iv) commits expert edits to memory, enabling self-evolution and personalized workflows. Across four cell-segmentation benchmarks, this routing yields a 15.7\% mean accuracy gain over state-of-the-art baselines. On endoplasmic reticulum and mitochondria from new datasets, GenCellAgent improves average IoU by 37.6\% over specialist models. It also segments novel objects such as the Golgi apparatus via iterative text-guided refinement, with light human correction further boosting performance. Together, these capabilities provide a practical path to robust, adaptable cellular image segmentation without retraining, while reducing annotation burden and matching user preferences.
- Abstract(参考訳): 細胞像のセグメンテーションは定量的生物学には不可欠であるが、異質なモダリティ、形態的多様性、限られたアノテーションのために依然として困難である。
我々は、Planner-executor-evaluatorループ(choose tool $\rightarrow$ run $\rightarrow$ quality-check)を通じて、スペシャリストセグメンタと一般的な視覚言語モデルをオーケストレーションする、トレーニング不要のマルチエージェントフレームワークであるGenCellAgentを紹介する。
制度
i) イメージを最適なツールに自動的にルーティングする。
(ii)画像条件がツールの期待と異なる場合、いくつかの基準画像を用いてハエに適応する。
(iii)既存のモデルでカバーされていないオルガネラのテキスト誘導セグメンテーションをサポートし、
(iv) 専門家の編集をメモリにコミットし、自己進化とパーソナライズされたワークフローを可能にする。
4つのセルセグメンテーションベンチマークで、このルーティングにより、最先端のベースラインよりも平均精度が15.7%向上する。
新しいデータセットから得られる小胞体とミトコンドリアでは、GenCellAgentは専門家モデルよりも平均IoUを37.6%改善する。
また、ゴルジ装置のような新しい物体を反復的なテキストガイドによる改良によって分割し、軽快な修正により性能が向上する。
これらの能力は、アノテーションの負担を軽減し、ユーザの好みに合うようにし、再トレーニングすることなく、堅牢で適応可能なセルイメージセグメンテーションへの実践的な経路を提供する。
関連論文リスト
- Unsupervised cell segmentation by fast Gaussian Processes [6.709057867802485]
ノイズ顕微鏡画像に対する高速ガウス過程に基づく新規な教師なしセル分割アルゴリズムを開発した。
異なる部位の異なる輝度を含む異種画像に適応し、背景から物体を分離する頑健な閾値基準を導出した。
論文 参考訳(メタデータ) (2025-05-24T23:28:14Z) - GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation [2.294915015129229]
ビジョントランスフォーマー(ViT)は医療画像セマンティックセグメンテーション(MISS)において有望であることを示した
Gabor and Laplacian of Gaussian Convolutional Swin Network (GLoG-CSUnet) を紹介する。
GLoG-CSUnetは、学習可能な放射能機能を組み込んだトランスフォーマーモデルを強化する新しいアーキテクチャである。
論文 参考訳(メタデータ) (2025-01-06T06:07:40Z) - CellPilot [3.2096430458509317]
この作業では,自動セグメンテーションとインタラクティブセグメンテーションのギャップを埋めるフレームワークであるCellPilotを導入する。
本モデルは16臓器にまたがる9種類の細胞および腺分節データセットの675,000以上のマスクを用いて訓練した。
このモデルとグラフィカルなユーザインターフェースは、実践者がオープンソースとして利用可能な大規模な注釈付きデータセットを作成するのを支援するように設計されています。
論文 参考訳(メタデータ) (2024-11-23T10:31:10Z) - Multi-stream Cell Segmentation with Low-level Cues for Multi-modality
Images [66.79688768141814]
我々は,顕微鏡画像のラベル付けを行うセル分類パイプラインを開発した。
次に、分類ラベルに基づいて分類モデルを訓練する。
2種類のセグメンテーションモデルを、丸みを帯びた形状と不規則な形状のセグメンテーションセルに展開する。
論文 参考訳(メタデータ) (2023-10-22T08:11:08Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Learning from partially labeled data for multi-organ and tumor
segmentation [102.55303521877933]
本稿では,トランスフォーマーに基づく動的オンデマンドネットワーク(TransDoDNet)を提案する。
動的ヘッドにより、ネットワークは複数のセグメンテーションタスクを柔軟に達成することができる。
我々はMOTSと呼ばれる大規模にラベル付けされたMulti-Organ and tumorベンチマークを作成し、他の競合相手よりもTransDoDNetの方が優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-13T13:03:09Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Instance Segmentation of Unlabeled Modalities via Cyclic Segmentation
GAN [27.936725483892076]
本稿では,画像翻訳とインスタンスセグメンテーションを共同で行うCysic Generative Adrial Network(CySGAN)を提案する。
注記電子顕微鏡(en:Annotated electron microscopy, EM)画像とラベルなし拡張顕微鏡(en:Unlabeled expansion microscopy, ExM)データを用いて, ニューロンの3次元セグメンテーションの課題についてベンチマークを行った。
論文 参考訳(メタデータ) (2022-04-06T20:46:39Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - Image segmentation via Cellular Automata [58.86475603234583]
我々は高解像度画像のセグメンテーションを成功させるセルオートマトンを設計し、訓練する。
私たちの最小のオートマトンは、複雑なセグメンテーションタスクを解決するために1万以下のパラメータを使用します。
論文 参考訳(メタデータ) (2020-08-11T19:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。