論文の概要: RxRx1: A Dataset for Evaluating Experimental Batch Correction Methods
- arxiv url: http://arxiv.org/abs/2301.05768v1
- Date: Fri, 13 Jan 2023 21:49:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 19:01:58.082469
- Title: RxRx1: A Dataset for Evaluating Experimental Batch Correction Methods
- Title(参考訳): rxrx1: 実験バッチ補正法を評価するデータセット
- Authors: Maciej Sypetkowski, Morteza Rezanejad, Saber Saberian, Oren Kraus,
John Urbanik, James Taylor, Ben Mabey, Mason Victors, Jason Yosinski, Alborz
Rezazadeh Sereshkeh, Imran Haque, Berton Earnshaw
- Abstract要約: RxRx1はバッチ効果補正法を体系的に研究するためのデータセットである。
データセットは125,510個の高分解能蛍光顕微鏡画像からなる。
- 参考スコア(独自算出の注目度): 6.392792586977196
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-throughput screening techniques are commonly used to obtain large
quantities of data in many fields of biology. It is well known that artifacts
arising from variability in the technical execution of different experimental
batches within such screens confound these observations and can lead to invalid
biological conclusions. It is therefore necessary to account for these batch
effects when analyzing outcomes. In this paper we describe RxRx1, a biological
dataset designed specifically for the systematic study of batch effect
correction methods. The dataset consists of 125,510 high-resolution
fluorescence microscopy images of human cells under 1,138 genetic perturbations
in 51 experimental batches across 4 cell types. Visual inspection of the images
alone clearly demonstrates significant batch effects. We propose a
classification task designed to evaluate the effectiveness of experimental
batch correction methods on these images and examine the performance of a
number of correction methods on this task. Our goal in releasing RxRx1 is to
encourage the development of effective experimental batch correction methods
that generalize well to unseen experimental batches. The dataset can be
downloaded at https://rxrx.ai.
- Abstract(参考訳): 高スループットスクリーニング技術は、多くの生物学分野において大量のデータを取得するために一般的に用いられている。
このようなスクリーン内の異なる実験バッチの技術的実行における可変性に起因する人工物がこれらの観察を混同し、無効な生物学的結論をもたらすことはよく知られている。
したがって、結果を分析する際にこれらのバッチ効果を考慮する必要がある。
本稿では,バッチ効果補正法を体系的に研究するための生物学的データセットRxRx1について述べる。
このデータセットは、ヒト細胞の125,510個の高分解能蛍光顕微鏡画像からなり、4種類の細胞で51の実験バッチで1,138の遺伝的摂動を受ける。
画像のみの視覚検査は、明らかなバッチ効果を示す。
本研究は,これらの画像に対する実験バッチ補正手法の有効性を評価するための分類タスクを提案し,本課題に対する多数の補正手法の性能について検討する。
RxRx1のリリースの目標は、未確認の試験バッチによく適応する効果的な実験バッチ補正手法の開発を促進することである。
データセットはhttps://rxrx.ai.comでダウンロードできる。
関連論文リスト
- Data Augmentation through Background Removal for Apple Leaf Disease Classification Using the MobileNetV2 Model [0.0]
本研究の目的は,実環境下での撮影画像におけるリンゴ葉病の分類性能に対するデータ拡張手法の効果を評価することである。
提案手法は植物病理データベース上で98.71%の分類精度を達成し, 約3%の改善, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-11-29T16:06:34Z) - Mixed Effects Deep Learning for the interpretable analysis of single cell RNA sequencing data by quantifying and visualizing batch effects [6.596656267996196]
シングルセルRNAシークエンシング(scRNA-seq)データは、しばしば技術的または生物学的バッチ効果によって構築される。
既存のディープラーニングモデルはこれらの効果を緩和するが、バッチ固有の情報を捨てることが多い。
本稿では,バッチ不変量(固定効果)とバッチ固有量(ランダム効果)を別々にモデル化したMEDL自動エンコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-11T00:10:48Z) - Active Prompt Tuning Enables Gpt-40 To Do Efficient Classification Of Microscopy Images [0.0]
顕微鏡画像中の細胞の特徴を分類する従来のディープラーニングベースの手法は、トレーニングモデルに時間と労働集約的なプロセスを必要とする。
我々は以前、パイロットデータセット上でOpenAIのGPT-4(V)モデルを使用してこれらの課題を克服するソリューションを提案した。
パイロットデータセットの結果は精度が同等で、ベースラインに比べてスループットが大幅に向上した。
論文 参考訳(メタデータ) (2024-11-04T21:56:48Z) - Diffusion Facial Forgery Detection [56.69763252655695]
本稿では,顔に焦点をあてた拡散生成画像を対象とした包括的データセットであるDiFFを紹介する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果、人間の観察者と自動検出者の2値検出精度は30%以下であることが判明した。
論文 参考訳(メタデータ) (2024-01-29T03:20:19Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Stain-invariant self supervised learning for histopathology image
analysis [74.98663573628743]
乳がんのヘマトキシリンおよびエオシン染色像におけるいくつかの分類課題に対する自己監督アルゴリズムを提案する。
本手法は,いくつかの乳がんデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-11-14T18:16:36Z) - Seamless Iterative Semi-Supervised Correction of Imperfect Labels in
Microscopy Images [57.42492501915773]
生体内試験は、医療機器の毒性に対する動物実験の代替手段である。
人間の疲労は、深層学習を魅力的なものにするために、エラー作成に重要な役割を果たします。
我々は、不完全ラベルのシームレス反復半監督補正(SISSI)を提案する。
本手法は,物体検出に適応的な早期学習補正技術を提供する。
論文 参考訳(メタデータ) (2022-08-05T18:52:20Z) - Texture Characterization of Histopathologic Images Using Ecological
Diversity Measures and Discrete Wavelet Transform [82.53597363161228]
本稿では,病理組織像間でテクスチャを特徴付ける手法を提案する。
2つのHIデータセットに有望な精度で、そのような画像の固有特性を定量化することが可能である。
論文 参考訳(メタデータ) (2022-02-27T02:19:09Z) - Assessment of Treatment Effect Estimators for Heavy-Tailed Data [70.72363097550483]
ランダム化制御試験(RCT)における治療効果の客観的評価における中心的な障害は、その性能をテストするための基礎的真理(または検証セット)の欠如である。
この課題に対処するための新しいクロスバリデーションのような方法論を提供する。
本手法は,Amazonサプライチェーンに実装された709RCTに対して評価を行った。
論文 参考訳(メタデータ) (2021-12-14T17:53:01Z) - Anchoring to Exemplars for Training Mixture-of-Expert Cell Embeddings [15.964908790433855]
そこで本研究では,トレーニングセットの技術的な変化を捉えた専門家の集合を学習し,テスト時に専門家の予測を集約する埋め込み学習アプローチを提案する。
我々は,薬物発見,細胞治療の真の作用機序の同定における性能の向上など,3つの課題に対するアプローチを5.5-11%の精度で評価した。
論文 参考訳(メタデータ) (2021-12-06T18:05:49Z) - Principal component-based image segmentation: a new approach to outline
in vitro cell colonies [0.0]
探索されたコロニーを特徴付け,抽出し,セグメンテーションすることで問題を修正するための,客観的かつ多目的な機械学習手法を提案する。
提案するセグメンテーションアルゴリズムは,人間の観察者による手動計測と同様の品質を示した。
論文 参考訳(メタデータ) (2021-03-10T12:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。