論文の概要: Using Deep Learning Models Pretrained by Self-Supervised Learning for Protein Localization
- arxiv url: http://arxiv.org/abs/2604.10970v1
- Date: Mon, 13 Apr 2026 04:14:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.31395
- Title: Using Deep Learning Models Pretrained by Self-Supervised Learning for Protein Localization
- Title(参考訳): タンパク質局在化のための自己監督学習による深層学習モデルの利用
- Authors: Ben Isselmann, Dilara Göksu, Heinz Neumann, Andreas Weinmann,
- Abstract要約: タスク固有の顕微鏡データセットは小さく、堅牢な機能を学ぶディープラーニングモデルのトレーニングが困難になることが多い。
DINOベースのViTバックボーンはHPA FOVやImageNet-1kで事前訓練され、微調整なしでOpenCellに転送された。
- 参考スコア(独自算出の注目度): 0.23332469289621782
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Task-specific microscopy datasets are often small, making it difficult to train deep learning models that learn robust features. While self-supervised learning (SSL) has shown promise through pretraining on large, domain-specific datasets, generalizability across datasets with differing staining protocols and channel configurations remains underexplored. We investigated the generalizability of SSL models pretrained on ImageNet-1k and HPA FOV, evaluating their embeddings on OpenCell with and without fine-tuning, two channel-mismatch strategies, and varying fine-tuning data fractions. We additionally analyzed single-cell embeddings on a labeled OpenCell subset. Result: DINO-based ViT backbones pretrained on HPA FOV or ImageNet-1k transfer well to OpenCell even without fine-tuning. The HPA FOV-pretrained model achieved the highest zero-shot performance (macro $F_1$ 0.822 $\pm$ 0.007). Fine-tuning further improved performance to 0.860 $\pm$ 0.013. At the single-cell level, the HPA single-cell-pretrained model achieved the highest k-nearest neighbor performance across all neighborhood sizes (macro $F_1$ $\geq$ 0.796). Conclusion: SSL methods like DINO, pretrained on large domain-relevant datasets, enable effective use of deep learning features for fine-tuning on small, task-specific microscopy datasets.
- Abstract(参考訳): 背景: タスク固有の顕微鏡データセットは、しばしば小さく、堅牢な機能を学ぶディープラーニングモデルのトレーニングが困難になる。
自己教師付き学習(SSL)は、大規模でドメイン固有のデータセットの事前トレーニングを通じて約束されているが、異なる染色プロトコルとチャネル構成を持つデータセット間の一般化性はまだ未定である。
我々は、ImageNet-1kとHPA FOVで事前訓練されたSSLモデルの一般化可能性について検討し、細粒度と細粒度を伴わないOpenCellへの埋め込み、チャネルミスマッチの2つの戦略、微粒度データ率の変化を評価した。
さらに,ラベル付きOpenCellサブセットへの単一セル埋め込みを解析した。
結果: DINO ベースの ViT バックボーンは HPA FOV や ImageNet-1k で事前トレーニングされ、微調整なしで OpenCell に転送される。
HPA FOV-pretrained モデルは最高のゼロショット性能を達成した(macro $F_1$ 0.822 $\pm$ 0.007)。
微調整により性能は0.860$\pm$0.013に向上した。
シングルセルレベルでは、HPAのシングルセルプレトレーニングモデルが最も高いkアレスト隣り性能を達成した(macro $F_1$ $\geq$ 0.796)。
結論: DINOのような大規模なドメイン関連データセットで事前トレーニングされたSSLメソッドは、小さなタスク固有の顕微鏡データセットの微調整にディープラーニング機能を有効に活用することができる。
関連論文リスト
- Self-supervised Pretraining of Cell Segmentation Models [37.09823149373976]
セルインスタンスセグメンテーションのための自己教師型フレームワークであるDINOCellを提案する。
DINOv2からの表現を顕微鏡に適応させ、ラベルのない細胞画像に対する自己監督的な訓練を継続する。
LIVECellベンチマークでは、DINOCellのSEGスコアは0.784で、SAMベースのモデルよりも10.42%向上している。
論文 参考訳(メタデータ) (2026-04-12T12:29:39Z) - Generalization of Self-Supervised Vision Transformers for Protein Localization Across Microscopy Domains [0.254890465057467]
自己教師付き学習(SSL)は、大規模なラベルなしデータセットで事前トレーニングすることで、これを緩和することができる。
我々は、ImageNet-1k、Human Protein Atlas(HPA)、OpenCellで事前訓練された3つのDINOバックボーンを用いて画像埋め込みを生成する。
すべての事前訓練されたモデルは、顕微鏡固有のHPA事前訓練モデルにより、最高の性能を達成する。
論文 参考訳(メタデータ) (2026-02-05T10:39:00Z) - Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。
本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。
経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文 参考訳(メタデータ) (2025-06-20T00:17:14Z) - A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.35500308126506]
自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。
SSLの分類に基づく評価プロトコルがどのように相関し、異なるデータセットのダウンストリーム性能を予測するかを検討する。
論文 参考訳(メタデータ) (2024-07-16T23:17:36Z) - UniPredict: Large Language Models are Universal Tabular Classifiers [33.811778526930745]
本稿では、生成モデル、すなわちUniPredictに基づいて、普遍的な表型データ予測器を構築するというアイデアを活用する。
多様なターゲットを持つ169データセットのアグリゲーション上で1つのLLMをトレーニングし、そのパフォーマンスを各データセットで個別にトレーニングされたベースラインと比較する。
我々は、この汎用UniPredictモデルは、最高のツリーブースティングベースラインと最高のニューラルネットワークベースラインと比較して、5.4%から13.4%の範囲で、他のモデルよりも有利であることを示す。
論文 参考訳(メタデータ) (2023-10-05T02:37:09Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - Solving Mixed Integer Programs Using Neural Networks [57.683491412480635]
本稿では,mipソルバの2つのキーサブタスクに学習を適用し,高品質なジョイント変数割当を生成し,その割当と最適課題との客観的値の差を限定する。
提案手法は,ニューラルネットワークに基づく2つのコンポーネントであるニューラルダイバーディングとニューラルブランチを構築し,SCIPなどのベースMIPソルバで使用する。
2つのGoogle生産データセットとMIPLIBを含む6つの現実世界データセットに対するアプローチを評価し、それぞれに別々のニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-12-23T09:33:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。