論文の概要: Automatic Image-Level Morphological Trait Annotation for Organismal Images
- arxiv url: http://arxiv.org/abs/2604.01619v1
- Date: Thu, 02 Apr 2026 04:55:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.364416
- Title: Automatic Image-Level Morphological Trait Annotation for Organismal Images
- Title(参考訳): 臓器画像に対する画像レベルの自動トリオアノテーション
- Authors: Vardaan Pahuja, Samuel Stevens, Alyson East, Sydne Record, Yu Su,
- Abstract要約: 本稿では,正規分布領域をローカライズし,視覚言語プロンプトを用いて解釈可能な特徴記述を生成する特徴アノテーションパイプラインを提案する。
我々は,BioSCAN-5Mから19Kの昆虫画像にまたがる80K特性アノテーションのデータセットであるBioscan-Traitsを構築した。
- 参考スコア(独自算出の注目度): 11.844505008466884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Morphological traits are physical characteristics of biological organisms that provide vital clues on how organisms interact with their environment. Yet extracting these traits remains a slow, expert-driven process, limiting their use in large-scale ecological studies. A major bottleneck is the absence of high-quality datasets linking biological images to trait-level annotations. In this work, we demonstrate that sparse autoencoders trained on foundation-model features yield monosemantic, spatially grounded neurons that consistently activate on meaningful morphological parts. Leveraging this property, we introduce a trait annotation pipeline that localizes salient regions and uses vision-language prompting to generate interpretable trait descriptions. Using this approach, we construct Bioscan-Traits, a dataset of 80K trait annotations spanning 19K insect images from BIOSCAN-5M. Human evaluation confirms the biological plausibility of the generated morphological descriptions. We assess design sensitivity through a comprehensive ablation study, systematically varying key design choices and measuring their impact on the quality of the resulting trait descriptions. By annotating traits with a modular pipeline rather than prohibitively expensive manual efforts, we offer a scalable way to inject biologically meaningful supervision into foundation models, enable large-scale morphological analyses, and bridge the gap between ecological relevance and machine-learning practicality.
- Abstract(参考訳): 形態学的特徴は、生物が環境とどのように相互作用するかの重要な手がかりを提供する生物の物理的特徴である。
しかし、これらの特徴を抽出することは、専門家主導のプロセスが遅いままであり、大規模な生態学的研究での使用を制限している。
大きなボトルネックは、生物学的イメージと特性レベルのアノテーションをリンクする高品質なデータセットがないことである。
本研究では, 基礎モデルの特徴を訓練したスパースオートエンコーダが, 意味のある形態的部分に対して一貫した活性化を示す単意味的, 空間的に接地されたニューロンを生み出すことを実証した。
この特性を生かした特徴アノテーションパイプラインを導入し、局所的な領域をローカライズし、視覚言語プロンプトを用いて解釈可能な特徴記述を生成する。
この手法を用いて,BioSCAN-5Mの19Kの昆虫画像にまたがる80K特性アノテーションのデータセットであるBioscan-Traitsを構築した。
人間による評価は、生成された形態学的記述の生物学的妥当性を確認する。
設計感度を総合的アブレーション研究により評価し, 設計選択を体系的に変化させ, 特性記述の質に及ぼす影響を評価する。
コストのかかる手作業ではなく,モジュール型パイプラインで特徴を注釈付けすることで,基盤モデルに生物学的に意味のある監督を注入し,大規模形態解析を可能にし,生態的妥当性と機械学習の実践性のギャップを埋める,スケーラブルな方法を提供する。
関連論文リスト
- Classification of Histopathology Slides with Persistence Homology Convolutions [0.0]
本稿では、永続的ホモロジー畳み込み演算子の修正版を用いて、局所的永続的ホモロジーに基づくデータを生成する新しい手法を提案する。
これらの結果から, 持続的ホモロジー畳み込みは, 病理組織学的スライドから有意な幾何学的情報を抽出することが示唆された。
論文 参考訳(メタデータ) (2025-07-18T21:56:53Z) - BioCLIP 2: Emergent Properties from Scaling Hierarchical Contrastive Learning [60.80381372245902]
生体視覚モデルでは,大規模コントラスト視覚言語学習により創発的行動が観察される。
我々は、異なる種を区別するために、TreeOfLife-200MでBioCLIP 2を訓練する。
得られたBioCLIP 2の埋め込み空間における創発的特性を同定する。
論文 参考訳(メタデータ) (2025-05-29T17:48:20Z) - Learning biologically relevant features in a pathology foundation model using sparse autoencoders [2.5919097694815365]
我々は、病理予知基礎モデルの埋め込みについてスパースオートエンコーダを訓練した。
Sparse Autoencoderの機能は, 解釈可能な, 単意味的な生物学的概念を表す。
論文 参考訳(メタデータ) (2024-07-15T15:03:01Z) - Neural Echos: Depthwise Convolutional Filters Replicate Biological
Receptive Fields [56.69755544814834]
哺乳類網膜で観察される生体受容野を,深部核が効果的に複製していることを示す証拠を提示する。
生体受容の分野からインスピレーションを得る手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T18:06:22Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Learning multi-scale functional representations of proteins from
single-cell microscopy data [77.34726150561087]
局所化分類に基づいて訓練された単純な畳み込みネットワークは、多様な機能情報をカプセル化したタンパク質表現を学習できることを示す。
また,生物機能の異なるスケールでタンパク質表現の質を評価するためのロバストな評価戦略を提案する。
論文 参考訳(メタデータ) (2022-05-24T00:00:07Z) - Self-Supervised Vision Transformers Learn Visual Concepts in
Histopathology [5.164102666113966]
我々は、様々な弱い教師付きおよびパッチレベルのタスクに対する検証を行い、様々な自己教師付きモデルを訓練することにより、病理学における良い表現を探索する。
我々の重要な発見は、DINOベースの知識蒸留を用いたビジョントランスフォーマーが、組織像におけるデータ効率と解釈可能な特徴を学習できることを発見したことである。
論文 参考訳(メタデータ) (2022-03-01T16:14:41Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。