論文の概要: POPSICLE: Benchmark Datasets for Segmentation and Localization in CryoET
- arxiv url: http://arxiv.org/abs/2606.10255v1
- Date: Mon, 08 Jun 2026 23:47:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.231036
- Title: POPSICLE: Benchmark Datasets for Segmentation and Localization in CryoET
- Title(参考訳): POPSICLE: Cryoetのセグメンテーションとローカライゼーションのためのベンチマークデータセット
- Authors: Jonathan Schwartz, Utz Heinrich Ermel, C. Braxton Owens, Zhuowen Zhao, Ariana Peck, Gus L. W. Hart, Grant J. Jensen, Bridget Carragher, Dari Kimanius,
- Abstract要約: 本稿では,CryoETセグメンテーションとマクロ分子ローカライゼーションのためのベンチマークスイートであるPOPSICLEを提案する。
CryoET Data Portal - トモグラフィデータ、メタデータ、アノテーションのオープンでML対応のリポジトリ。
新しいデータセットとアノテーションが利用可能になると、拡張できる。
- 参考スコア(独自算出の注目度): 1.4588049951137065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cryo-electron tomography (cryoET) has emerged as a powerful tool in structural and cellular biology by enabling direct visualization of macromolecular structures within intact cells, thereby linking molecular architecture to cellular organization in a native context. Realizing the full potential of cryoET, however, increasingly depends on advances in computational analysis, particularly machine learning (ML), to interpret its complex and information-rich data. Despite rapid progress, ML development for cryoET remains bottlenecked by the lack of standardized, well-annotated benchmarks. Existing evaluations are typically small, task-specific, and are assembled in isolation, limiting robust comparisons across methods. Here, we present POPSICLE, a benchmark suite for cryoET segmentation and macromolecular localization built from the CryoET Data Portal - an open, ML-ready repository of tomographic data, metadata, and annotations. POPSICLE spans eukaryotic and prokaryotic systems, both purified and fully in situ samples, and dense voxel-wise segmentation as well as sparse localization tasks. Built on a living data resource, it can expand as new datasets and annotations become available. Baseline experiments reveal substantial variation in model rankings across tasks, underscoring the need for benchmarks tailored to the unique characteristics of cryoET rather than evaluation practices adapted from adjacent biomedical imaging domains. POPSICLE thus provides an open and extensible foundation for reproducible ML evaluation in cryoET.
- Abstract(参考訳): 核電子トモグラフィー(cryoET)は、無傷細胞のマクロ分子構造の直接可視化を可能にし、自然環境下で分子構造と細胞組織を結びつけることによって、構造および細胞生物学における強力なツールとして登場した。
しかし、CryoETの完全な可能性を実現するには、計算分析、特に機械学習(ML)の進歩にますます依存して、その複雑で情報に富んだデータを解釈するようになる。
急速な進歩にもかかわらず、CryoETのML開発は、標準化された、十分に注釈付けされたベンチマークの欠如によって、いまだボトルネックになっている。
既存の評価は、通常小さく、タスク固有であり、分離して組み立てられ、メソッド間での堅牢な比較を制限する。
本稿では,CryoET Data Portalから構築されたCryoETセグメンテーションとマクロ分子ローカライゼーションのためのベンチマークスイートであるPOPSICLEについて述べる。
POPSICLEは真核生物系と真核生物系にまたがっており、精製されたサンプルと完全なin situサンプルの両方、密度の高いボクセルワイドセグメンテーション、およびスパースローカライゼーションタスクがある。
生きたデータリソース上に構築され、新しいデータセットとアノテーションが利用可能になると拡張される。
ベースライン実験は、隣接するバイオメディカルイメージング領域から適応した評価慣行よりも、CryoETの特徴に合わせたベンチマークの必要性を強調し、タスク間でのモデルランキングのかなりのバリエーションを明らかにしている。
したがって、POPSICLEはCryoETで再現可能なML評価のためのオープンで拡張可能な基盤を提供する。
関連論文リスト
- MSAlign: Aligning Molecule and Mass Spectra Foundation Models for Metabolite Identification [11.133897813950789]
分子の集合が与えられたMS/MSスペクトルから代謝物の化学構造を復元することからなる分子検索タスクに対処する。
本稿では,表現アライメントとコントラスト学習に基づく最近のアプローチを包含する統合フレームワークを提案する。
MSAlignは実装が簡単で、トレーニングが速く、すべてのベンチマークで既存のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2026-05-19T12:19:35Z) - CAPSUL: A Comprehensive Human Protein Benchmark for Subcellular Localization [50.559485139565076]
我々は, 多様な3次元構造表現と微細な細胞内局在アノテーションを統合するデータセットである $mathbfCAPSUL$ という新しいベンチマークを導入する。
このベンチマークは、様々な最先端のシーケンスベースモデルと構造ベースモデルを用いて評価し、この課題に構造的特徴を関与させることの重要性を示す。
最後に,Golgi 装置のケーススタディを通じて,構造に基づく手法の強力な解釈可能性を示す。
論文 参考訳(メタデータ) (2026-03-19T07:33:04Z) - SiMiC: Context-Aware Silicon Microstructure Characterization Using Attention-Based Convolutional Neural Networks for Field-Emission Tip Analysis [1.4613896920385958]
Intention-based Convolutional Neural Networks for Field-Emission Tip Analysis を用いたSiMiC: Context-Aware Silicon Structure Characterizationを提案する。
深層学習を利用して,SEM画像から形状,形状,頂点曲率などの形態的特徴を効率的に抽出する。
シリコン系フィールドエミッタチップの特殊なデータセットを開発し,注目機構を取り入れたCNNアーキテクチャを多層構造分類と次元予測のために訓練した。
論文 参考訳(メタデータ) (2026-01-21T04:36:42Z) - Large-scale EM Benchmark for Multi-Organelle Instance Segmentation in the Wild [8.670858548670742]
本研究では, 多様なセルタイプにまたがる10万以上の2次元EM画像と, 実世界の変動を捉えた5つのオルガネラクラスからなる, マルチオルガネラインスタンスセグメンテーションのベンチマークを開発する。
現在のモデルでは、異種EMデータの一般化に苦慮し、グローバルな分散形態を持つオルガネラでは性能が悪くなっている。
これらの知見は,局所文脈モデルと実世界の変動性の存在下での長距離構造的連続性をモデル化する課題との根本的なミスマッチを浮き彫りにした。
論文 参考訳(メタデータ) (2026-01-18T16:09:27Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - CryoFM: A Flow-based Foundation Model for Cryo-EM Densities [50.291974465864364]
生成モデルとして設計された基礎モデルであるCryoFMについて,高品質密度マップの分布を学習する。
フローマッチングに基づいて構築されたCryoFMは、生物分子密度マップの以前の分布を正確に捉えるために訓練されている。
論文 参考訳(メタデータ) (2024-10-11T08:53:58Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - Cryo-shift: Reducing domain shift in cryo-electron subtomograms with
unsupervised domain adaptation and randomization [17.921052986098946]
サブトモグラムの分類と認識は、マクロ分子構造の体系的な回復の第一段階である。
教師付き深層学習法は, サブトモグラム分類において, 精度が高く, 効率的であることが証明されている。
我々は、ディープラーニングに基づくクロスドメインサブトモグラム分類のための、完全に教師なしのドメイン適応およびランダム化フレームワークであるCryo-Shiftを提案する。
論文 参考訳(メタデータ) (2021-11-17T13:43:36Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。