Fugu-MT 論文翻訳(概要): Hierarchy-Guided Multimodal Representation Learning for Taxonomic Inference

論文の概要: Hierarchy-Guided Multimodal Representation Learning for Taxonomic Inference

arxiv url: http://arxiv.org/abs/2603.25573v1
Date: Thu, 26 Mar 2026 15:47:03 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-27 20:52:48.366953
Title: Hierarchy-Guided Multimodal Representation Learning for Taxonomic Inference
Title（参考訳）: 階層型マルチモーダル表現学習による分類学推論
Authors: Sk Miraj Ahmed, Xi Yu, Yunqi Li, Yuewei Lin, Wei Xu,
Abstract要約: 階層型マルチモーダル学習のためのエンドツーエンドの2つの変種を提案する。 CLiBD-HiRは階層情報正規化(HiR)を導入し、分類学レベルで埋め込み幾何学を形作る。 CLiBD-HiR-Fuseは、画像のみ、DNAのみ、または関節推論をサポートする軽量な融合予測器を訓練する。
参考スコア（独自算出の注目度）: 17.708423679075075
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Accurate biodiversity identification from large-scale field data is a foundational problem with direct impact on ecology, conservation, and environmental monitoring. In practice, the core task is taxonomic prediction - inferring order, family, genus, or species from imperfect inputs such as specimen images, DNA barcodes, or both. Existing multimodal methods often treat taxonomy as a flat label space and therefore fail to encode the hierarchical structure of biological classification, which is critical for robustness under noise and missing modalities. We present two end-to-end variants for hierarchy-aware multimodal learning: CLiBD-HiR, which introduces Hierarchical Information Regularization (HiR) to shape embedding geometry across taxonomic levels, yielding structured and noise-robust representations; and CLiBD-HiR-Fuse, which additionally trains a lightweight fusion predictor that supports image-only, DNA-only, or joint inference and is resilient to modality corruption. Across large-scale biodiversity benchmarks, our approach improves taxonomic classification accuracy by over 14 percent compared to strong multimodal baselines, with particularly large gains under partial and corrupted DNA conditions. These results highlight that explicitly encoding biological hierarchy, together with flexible fusion, is key for practical biodiversity foundation models.
Abstract（参考訳）: 大規模フィールドデータからの正確な生物多様性の同定は、生態学、保全、環境モニタリングに直接影響を与える基礎的な問題である。実際には、中核的なタスクは分類学的予測である - 検体画像、DNAバーコード、またはその両方のような不完全な入力から順序、家系、属、種を推測する。既存のマルチモーダル法は、しばしばフラットなラベル空間として分類学を扱い、従って、ノイズと欠落したモダリティの下で頑健性に重要な生物学的分類の階層構造を符号化することができない。階層型情報正規化を導入するCLiBD-HiRと、画像のみ、DNAのみ、関節推論をサポートする軽量な融合予測器を訓練し、モダリティの破損に耐性のあるCLiBD-HiR-Fuseについて述べる。大規模生物多様性ベンチマークでは, 強いマルチモーダルベースラインに比べて分類学的分類の精度が14%以上向上し, 特に部分的, 腐敗したDNA条件下では顕著に向上した。これらの結果は、生物学的階層を明示的に符号化し、フレキシブルフュージョンとともに、実践的な生物多様性基盤モデルにとって鍵となることを強調している。

関連論文リスト

BarcodeMamba+: Advancing State-Space Models for Fungal Biodiversity Research [19.401485543915452]
本稿では,強力で効率的な状態空間モデルアーキテクチャ上に構築された真菌バーコード分類の基礎モデルを提案する。我々は、このデータスパース環境において、従来の完全教師付き手法よりもはるかに効果的であることを実証した。我々の研究はゲノムに基づく生物多様性研究のための強力な新しいツールを提供する。
論文参考訳（メタデータ） (2025-12-17T19:56:03Z)
scMRDR: A scalable and flexible framework for unpaired single-cell multi-omics data integration [53.683726781791385]
単一セルマルチオミクス(ScMRDR)と呼ばれるスケーラブルでフレキシブルな生成フレームワークを導入する。本手法は, バッチ補正, モダリティアライメント, 生体信号保存の観点から, ベンチマークデータセット上での優れた性能を実現する。
論文参考訳（メタデータ） (2025-10-28T21:28:39Z)
Hyperbolic Multimodal Representation Learning for Biological Taxonomies [23.639218053531962]
生物多様性研究における分類学的分類は、証拠に基づいて生物学的標本を構造化階層に分類することを含む。このような階層モデルに対して,双曲型ネットワークがより良い埋め込み空間を提供できるかどうかを検討する。提案手法は, マルチモーダルな入力を, コントラッシブと新規な重み付きエンテーメントに基づく目的を用いた共有双曲空間に埋め込む。
論文参考訳（メタデータ） (2025-08-22T18:52:50Z)
BioCLIP 2: Emergent Properties from Scaling Hierarchical Contrastive Learning [60.80381372245902]
生体視覚モデルでは,大規模コントラスト視覚言語学習により創発的行動が観察される。我々は、異なる種を区別するために、TreeOfLife-200MでBioCLIP 2を訓練する。得られたBioCLIP 2の埋め込み空間における創発的特性を同定する。
論文参考訳（メタデータ） (2025-05-29T17:48:20Z)
CrypticBio: A Large Multimodal Dataset for Visually Confusing Biodiversity [3.73232466691291]
我々はCrypticBioについて紹介する。 iNaturalistのコミュニティアノテーターの間では、実際の種誤認の傾向から批判され、CrypticBioは67K種にまたがる52Kの独特な暗号グループを含んでいる。
論文参考訳（メタデータ） (2025-05-16T14:35:56Z)
CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale [21.995678534789615]
コントラスト学習を用いて画像、バーコードDNA、および統合埋め込み空間における分類ラベルのテキストベース表現を整列する。本手法は、ゼロショット学習タスクにおいて、従来の単一モダリティアプローチを8%以上精度で上回る。
論文参考訳（メタデータ） (2024-05-27T17:57:48Z)
PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。 GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文参考訳（メタデータ） (2023-10-12T23:46:08Z)
G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。 2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文参考訳（メタデータ） (2021-01-27T19:28:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。