論文の概要: TEPI: Taxonomy-aware Embedding and Pseudo-Imaging for Scarcely-labeled
Zero-shot Genome Classification
- arxiv url: http://arxiv.org/abs/2401.13219v1
- Date: Wed, 24 Jan 2024 04:16:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-25 15:30:28.042510
- Title: TEPI: Taxonomy-aware Embedding and Pseudo-Imaging for Scarcely-labeled
Zero-shot Genome Classification
- Title(参考訳): tepi:希薄なゼロショットゲノム分類のための分類学アウェア埋め込みと擬似画像化
- Authors: Sathyanarayanan Aakur, Vishalini R. Laguduva, Priyadharsini
Ramamurthy, Akhilesh Ramachandran
- Abstract要約: 種の遺伝コードまたはゲノムは、貴重な進化的、生物学的、系統学的情報をコードする。
従来のバイオインフォマティクスツールは顕著な進歩を遂げているが、スケーラビリティに欠け、計算コストも高い。
TEPI, 分類認識型埋め込み, Pseudo-Imaging を用いたゼロショット学習によりこの問題に対処することを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A species' genetic code or genome encodes valuable evolutionary, biological,
and phylogenetic information that aids in species recognition, taxonomic
classification, and understanding genetic predispositions like drug resistance
and virulence. However, the vast number of potential species poses significant
challenges in developing a general-purpose whole genome classification tool.
Traditional bioinformatics tools have made notable progress but lack
scalability and are computationally expensive. Machine learning-based
frameworks show promise but must address the issue of large classification
vocabularies with long-tail distributions. In this study, we propose addressing
this problem through zero-shot learning using TEPI, Taxonomy-aware Embedding
and Pseudo-Imaging. We represent each genome as pseudo-images and map them to a
taxonomy-aware embedding space for reasoning and classification. This embedding
space captures compositional and phylogenetic relationships of species,
enabling predictions in extensive search spaces. We evaluate TEPI using two
rigorous zero-shot settings and demonstrate its generalization capabilities
qualitatively on curated, large-scale, publicly sourced data.
- Abstract(参考訳): 種の遺伝コードまたはゲノムは、種の認識、分類学的分類、薬剤耐性や病原性などの遺伝子前置詞の理解を助ける貴重な進化的、生物学的、系統学的情報をコードしている。
しかし、膨大な数の潜在的な種は、汎用的な全ゲノム分類ツールを開発する上で大きな困難をもたらす。
従来のバイオインフォマティクスツールは顕著な進歩を遂げているが、スケーラビリティがなく、計算コストが高い。
機械学習ベースのフレームワークは、約束を示すが、ロングテール分布を持つ大きな分類語彙の問題に対処する必要がある。
本研究では,TEPI,Taxonomy-aware Embedding,Pseudo-Imagingを用いたゼロショット学習による問題解決を提案する。
各ゲノムを疑似画像として表現し、推論と分類のために分類学を意識した埋め込み空間にマッピングする。
この埋め込み空間は種の構成的および系統的関係を捉え、広い探索空間での予測を可能にする。
2つの厳密なゼロショット設定を用いてTEPIを評価し、その一般化能力をキュレートされた大規模公開データに基づいて定性的に示す。
関連論文リスト
- VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - A Saliency-based Clustering Framework for Identifying Aberrant
Predictions [49.1574468325115]
本稿では, 異常予測の概念を導入し, 分類誤差の性質が頻度と同じくらい重要であることを強調した。
本稿では,誤分類率の低減と異常予測の識別を両立する,新しい,効率的なトレーニング手法を提案する。
本手法を獣医学の分野である獣医学の分野に応用し, 被曝率は高いが, 人体医学に比べて広く研究されていない。
論文 参考訳(メタデータ) (2023-11-11T01:53:59Z) - A Step Towards Worldwide Biodiversity Assessment: The BIOSCAN-1M Insect
Dataset [18.211840156134784]
本稿では,画像に基づく分類学的評価が可能なコンピュータビジョンモデルの訓練を目的とした,100万画像データセットを提案する。
このデータセットは魅力的な特徴も示しており、その研究はより広範な機械学習コミュニティにとって興味深いものとなるだろう。
論文 参考訳(メタデータ) (2023-07-19T20:54:08Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Deep Visual-Genetic Biometrics for Taxonomic Classification of Rare
Species [1.9819034119774483]
本稿では、ドメイン間の関連性を暗黙的に符号化して性能を向上させることを目的とした、協調した視覚的遺伝的推論空間を提案する。
30k以上のプランクティック・フォアミニファー貝殻の顕微鏡像に応用して,この概念の有効性を実験的に実証した。
視覚的遺伝子アライメントは、最も稀な種の視覚のみの認識に大いに有用である。
論文 参考訳(メタデータ) (2023-05-11T10:04:27Z) - Self-Supervised Graph Representation Learning for Neuronal Morphologies [75.38832711445421]
ラベルのないデータセットから3次元神経形態の低次元表現を学習するためのデータ駆動型アプローチであるGraphDINOを提案する。
2つの異なる種と複数の脳領域において、この方法では、専門家による手動の特徴に基づく分類と同程度に形態学的細胞型クラスタリングが得られることを示す。
提案手法は,大規模データセットにおける新しい形態的特徴や細胞型の発見を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - Fine-Grained Zero-Shot Learning with DNA as Side Information [31.82132159867097]
我々は、種を詳細にゼロショット分類するために、DNAをサイド情報として使用しています。
画像空間の階層構造を確立するために,DNA情報を用いた単純な階層型ベイズモデルを実装した。
我々は、一般に、ワードベクトルよりもアクセスしやすい代替手段として、DNAが等しく有望であることを示す。
論文 参考訳(メタデータ) (2021-09-29T01:45:22Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Two-View Fine-grained Classification of Plant Species [66.75915278733197]
本研究では,2視点の葉のイメージ表現に基づく新しい手法と,植物種の粒度認識のための階層的分類戦略を提案する。
シームズ畳み込みニューラルネットワークに基づく深度測定は、多数のトレーニングサンプルへの依存を減らし、新しい植物種に拡張性を持たせるために用いられる。
論文 参考訳(メタデータ) (2020-05-18T21:57:47Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。