論文の概要: Fine-Grained Zero-Shot Learning with DNA as Side Information
- arxiv url: http://arxiv.org/abs/2109.14133v1
- Date: Wed, 29 Sep 2021 01:45:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 15:00:09.616638
- Title: Fine-Grained Zero-Shot Learning with DNA as Side Information
- Title(参考訳): サイド情報としてのDNAを用いたファイングラインドゼロショット学習
- Authors: Sarkhan Badirli, Zeynep Akata, George Mohler, Christine Picard, Murat
Dundar
- Abstract要約: 我々は、種を詳細にゼロショット分類するために、DNAをサイド情報として使用しています。
画像空間の階層構造を確立するために,DNA情報を用いた単純な階層型ベイズモデルを実装した。
我々は、一般に、ワードベクトルよりもアクセスしやすい代替手段として、DNAが等しく有望であることを示す。
- 参考スコア(独自算出の注目度): 31.82132159867097
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Fine-grained zero-shot learning task requires some form of side-information
to transfer discriminative information from seen to unseen classes. As manually
annotated visual attributes are extremely costly and often impractical to
obtain for a large number of classes, in this study we use DNA as side
information for the first time for fine-grained zero-shot classification of
species. Mitochondrial DNA plays an important role as a genetic marker in
evolutionary biology and has been used to achieve near-perfect accuracy in the
species classification of living organisms. We implement a simple hierarchical
Bayesian model that uses DNA information to establish the hierarchy in the
image space and employs local priors to define surrogate classes for unseen
ones. On the benchmark CUB dataset, we show that DNA can be equally promising
yet in general a more accessible alternative than word vectors as a side
information. This is especially important as obtaining robust word
representations for fine-grained species names is not a practicable goal when
information about these species in free-form text is limited. On a newly
compiled fine-grained insect dataset that uses DNA information from over a
thousand species, we show that the Bayesian approach outperforms
state-of-the-art by a wide margin.
- Abstract(参考訳): きめ細かいゼロショット学習タスクは、見知らぬクラスに識別情報を転送するために、ある種のサイド情報を必要とする。
手動でアノテートした視覚属性は非常に高価で、多くのクラスで入手するには実用的ではないため、本研究では、DNAをサイド情報として初めて、種をきめ細かいゼロショット分類に利用した。
ミトコンドリアDNAは進化生物学における遺伝マーカーとして重要な役割を担い、生物の種分類においてほぼ完璧な精度を達成するために用いられている。
我々は,画像空間における階層構造を確立するためにdna情報を用いた単純な階層ベイズモデルを実装し,未認識の階層に対するサーロゲートクラスを定義するために局所前処理を用いる。
ベンチマーク CUB データセットでは,DNA は概して,副次情報としてワードベクトルよりもアクセスしやすい代替手段として期待できることを示す。
特に、細粒度種名に対するロバストな単語表現を得ることは、自由形式のテキストでこれらの種に関する情報が限られている場合、実践可能な目標ではない。
千種を超える種から得られたdna情報を用いた、新たにコンパイルされた細粒度昆虫データセットでは、ベイズ的アプローチが最先端技術を上回ることが示されている。
関連論文リスト
- VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - DNABERT-S: Pioneering Species Differentiation with Species-Aware DNA Embeddings [7.822348354050447]
DNABERT-S(DNABERT-S)は,異なる種のDNA配列を自然にクラスターし,分離するために,種認識の埋め込みを開発するゲノムモデルである。
23の多様なデータセットの創発的な結果は、特に現実的なラベルスカースシナリオにおいて、DNABERT-Sの有効性を示している。
論文 参考訳(メタデータ) (2024-02-13T20:21:29Z) - TEPI: Taxonomy-aware Embedding and Pseudo-Imaging for Scarcely-labeled
Zero-shot Genome Classification [0.0]
種の遺伝コードまたはゲノムは、貴重な進化的、生物学的、系統学的情報をコードする。
従来のバイオインフォマティクスツールは顕著な進歩を遂げているが、スケーラビリティに欠け、計算コストも高い。
TEPI, 分類認識型埋め込み, Pseudo-Imaging を用いたゼロショット学習によりこの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-01-24T04:16:28Z) - BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.005668635562045]
DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文 参考訳(メタデータ) (2023-11-21T12:34:00Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Deep Visual-Genetic Biometrics for Taxonomic Classification of Rare
Species [1.9819034119774483]
本稿では、ドメイン間の関連性を暗黙的に符号化して性能を向上させることを目的とした、協調した視覚的遺伝的推論空間を提案する。
30k以上のプランクティック・フォアミニファー貝殻の顕微鏡像に応用して,この概念の有効性を実験的に実証した。
視覚的遺伝子アライメントは、最も稀な種の視覚のみの認識に大いに有用である。
論文 参考訳(メタデータ) (2023-05-11T10:04:27Z) - Semi-Supervised Domain Adaptation for Cross-Survey Galaxy Morphology
Classification and Anomaly Detection [57.85347204640585]
We developed a Universal Domain Adaptation method DeepAstroUDA。
異なるタイプのクラスオーバーラップしたデータセットに適用することができる。
初めて、我々は2つの非常に異なる観測データセットに対するドメイン適応の有効利用を実演した。
論文 参考訳(メタデータ) (2022-11-01T18:07:21Z) - Few-Shot Meta Learning for Recognizing Facial Phenotypes of Genetic
Disorders [55.41644538483948]
分類の自動化と類似性検索は、医師が可能な限り早期に遺伝状態の診断を行うための意思決定を支援する。
従来の研究は分類問題としてこの問題に対処し、深層学習法を用いてきた。
本研究では,健常人の大規模なコーパスで訓練した顔認識モデルを用いて,顔の表情認識に移行した。
論文 参考訳(メタデータ) (2022-10-23T11:52:57Z) - Taxonomy and evolution predicting using deep learning in images [9.98733710208427]
本研究では,キノコ画像認識問題を体系的に研究することで,新しい認識枠組みを創出する。
そこで本研究では,DNAにDNAをマッピングする最初の方法として,遺伝子距離にエンコーダマッピング画像を使用し,事前に訓練したデコーダを介してDNAをデコードする手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T13:54:14Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。