論文の概要: Fish-Vista: A Multi-Purpose Dataset for Understanding & Identification of Traits from Images
- arxiv url: http://arxiv.org/abs/2407.08027v2
- Date: Thu, 27 Feb 2025 07:06:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 14:53:14.143795
- Title: Fish-Vista: A Multi-Purpose Dataset for Understanding & Identification of Traits from Images
- Title(参考訳): Fish-Vista:画像からのトラストの理解と識別のための多目的データセット
- Authors: Kazi Sajeed Mehrab, M. Maruf, Arka Daw, Abhilash Neog, Harish Babu Manogaran, Mridul Khurana, Zhenyang Feng, Bahadir Altintas, Yasin Bakis, Elizabeth G Campolongo, Matthew J Thompson, Xiaojun Wang, Hilmar Lapp, Tanya Berger-Wolf, Paula Mabee, Henry Bart, Wei-Lun Chao, Wasila M Dahdul, Anuj Karpatne,
- Abstract要約: 我々は,コンピュータビジョンにおける問題定式化を用いた画像から直接水生生物の視覚特性を分析するために設計された,最初の生物画像データセットであるFish-Visual Trait Analysis(Fish-Vista)を紹介した。
Fish-Vistaには4,154種の魚種にまたがる69,126枚の注釈付き画像が含まれており、種分類、形質識別、形質分類の3つの下流業務に役立てるために作成・整理されている。
- 参考スコア(独自算出の注目度): 18.79726520825725
- License:
- Abstract: We introduce Fish-Visual Trait Analysis (Fish-Vista), the first organismal image dataset designed for the analysis of visual traits of aquatic species directly from images using problem formulations in computer vision. Fish-Vista contains 69,126 annotated images spanning 4,154 fish species, curated and organized to serve three downstream tasks of species classification, trait identification, and trait segmentation. Our work makes two key contributions. First, we perform a fully reproducible data processing pipeline to process images sourced from various museum collections. We annotate these images with carefully curated labels from biological databases and manual annotations to create an AI-ready dataset of visual traits, contributing to the advancement of AI in biodiversity science. Second, our proposed downstream tasks offer fertile grounds for novel computer vision research in addressing a variety of challenges such as long-tailed distributions, out-of-distribution generalization, learning with weak labels, explainable AI, and segmenting small objects. We benchmark the performance of several existing methods for our proposed tasks to expose future research opportunities in AI for biodiversity science problems involving visual traits.
- Abstract(参考訳): 我々は,コンピュータビジョンにおける問題定式化を用いた画像から直接水生生物の視覚特性を分析するために設計された,最初の生物画像データセットであるFish-Visual Trait Analysis(Fish-Vista)を紹介した。
Fish-Vistaには4,154種の魚種にまたがる69,126枚の注釈付き画像が含まれており、種分類、形質識別、形質分類の3つの下流業務に役立てるために作成・整理されている。
私たちの仕事は2つの重要な貢献をします。
まず,様々な美術館コレクションから得られた画像を処理するために,完全再現可能なデータ処理パイプラインを実行する。
バイオ多様性科学におけるAIの進歩に寄与する、AI対応の視覚特性データセットを作成するために、生物学的データベースや手動アノテーションから慎重にキュレートされたラベルで、これらの画像に注釈を付けます。
第二に、提案した下流タスクは、長い尾の分布、分布外一般化、弱いラベルによる学習、説明可能なAI、小さなオブジェクトのセグメンテーションといった様々な課題に対処する、新しいコンピュータビジョン研究の基盤となる。
本稿では,視覚特性に関わる生物多様性科学問題に対するAIの今後の研究機会を明らかにするために,提案課題に対する既存手法のパフォーマンスをベンチマークする。
関連論文リスト
- FishNet: Deep Neural Networks for Low-Cost Fish Stock Estimation [0.0]
FishNetは、分類分類と魚の大きさ推定の両方を自動化したコンピュータビジョンシステムである。
我々は163種の1.2万魚を含む30万枚の手ラベル画像のデータセットを使用する。
魚の区分け作業では92%、単一魚種分類では89%、魚長推定では2.3cmの平均絶対誤差が達成されている。
論文 参考訳(メタデータ) (2024-03-16T12:44:08Z) - SimFIR: A Simple Framework for Fisheye Image Rectification with
Self-supervised Representation Learning [105.01294305972037]
自己教師型表現学習に基づく魚眼画像修正のためのフレームワークであるSimFIRを紹介する。
まず魚眼画像を複数のパッチに分割し,その表現を視覚変換器で抽出する。
下流修正作業における転送性能が著しく向上し、学習された表現の有効性が検証される。
論文 参考訳(メタデータ) (2023-08-17T15:20:17Z) - Discovering Novel Biological Traits From Images Using Phylogeny-Guided
Neural Networks [10.372001949268636]
本稿では,特徴ラベルに依存しない画像から進化的特徴を直接発見するための新しい手法を提案する。
提案手法であるPhylo-NNは、生物の画像を量子化された特徴ベクトルの列にエンコードする。
本研究は,多くの下流タスクにおいて生物学的に有意義な結果を生み出すためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-06-05T20:22:05Z) - Domain Generalization for Mammographic Image Analysis with Contrastive
Learning [62.25104935889111]
効果的なディープラーニングモデルのトレーニングには、さまざまなスタイルと品質を備えた大規模なデータが必要である。
より優れたスタイルの一般化能力を備えた深層学習モデルを実現するために,新しいコントラスト学習法が開発された。
提案手法は,様々なベンダスタイルドメインのマンモグラムや,いくつかのパブリックデータセットを用いて,広範囲かつ厳密に評価されている。
論文 参考訳(メタデータ) (2023-04-20T11:40:21Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Learning multi-scale functional representations of proteins from
single-cell microscopy data [77.34726150561087]
局所化分類に基づいて訓練された単純な畳み込みネットワークは、多様な機能情報をカプセル化したタンパク質表現を学習できることを示す。
また,生物機能の異なるスケールでタンパク質表現の質を評価するためのロバストな評価戦略を提案する。
論文 参考訳(メタデータ) (2022-05-24T00:00:07Z) - Series Photo Selection via Multi-view Graph Learning [52.33318426088579]
連続写真選択(SPS)は画像美学の質評価の重要な分野である。
我々は,マルチビュー特徴間の関係を構築するために,グラフニューラルネットワークを利用する。
ほぼ同一の一連の写真の中から最適なものを選択するために、シアムズネットワークが提案されている。
論文 参考訳(メタデータ) (2022-03-18T04:23:25Z) - A Survey of Fish Tracking Techniques Based on Computer Vision [11.994865945394139]
本稿では,過去7年間の魚類追跡技術の進歩を概観する。
基本的位置決めと追跡方法に重点を置き、多様な魚の追跡手法を探求する。
また、オープンソースのデータセット、評価指標、課題、魚の追跡研究への応用についても要約している。
論文 参考訳(メタデータ) (2021-10-06T07:46:35Z) - A Realistic Fish-Habitat Dataset to Evaluate Algorithms for Underwater
Visual Analysis [2.6476746128312194]
我々は、DeepFishを大規模データセットでベンチマークスイートとして提示し、いくつかのコンピュータビジョンタスクのためのメソッドをトレーニングし、テストする。
このデータセットは、熱帯オーストラリアの海洋環境にある20の温帯生物から採取された約4万枚の画像で構成されている。
実験では,データセットの特徴を詳細に分析し,いくつかの最先端手法の性能評価を行った。
論文 参考訳(メタデータ) (2020-08-28T12:20:59Z) - Temperate Fish Detection and Classification: a Deep Learning based
Approach [6.282069822653608]
本研究では,2段階の深層学習手法を提案する。
最初のステップは、種や性別によらず、画像中の各魚を検出することです。
第2のステップでは、画像中の各魚を事前フィルタリングせずに分類するために、Squeeze-and-Excitation (SE)アーキテクチャを備えた畳み込みニューラルネットワーク(CNN)を採用する。
論文 参考訳(メタデータ) (2020-05-14T12:40:57Z) - Automatic image-based identification and biomass estimation of
invertebrates [70.08255822611812]
時間を要する分類と分類は、どれだけの昆虫を処理できるかに強い制限を課す。
我々は、人間の専門家による分類と識別の標準的な手動アプローチを、自動画像ベース技術に置き換えることを提案する。
分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。
論文 参考訳(メタデータ) (2020-02-05T21:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。