論文の概要: Feathers dataset for Fine-Grained Visual Categorization
- arxiv url: http://arxiv.org/abs/2004.08606v1
- Date: Sat, 18 Apr 2020 12:40:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 05:36:41.093352
- Title: Feathers dataset for Fine-Grained Visual Categorization
- Title(参考訳): 細粒度視覚分類のためのフェーサーデータセット
- Authors: Alina Belko, Konstantin Dobratulin and Andrey Kuznetsov
- Abstract要約: FeatherV1は、機械学習のための最初の一般公開された鳥の羽毛データセットである。
これは、きめ細かい視覚認識領域における新しいタスクへの関心を高めることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a novel dataset FeatherV1, containing 28,272 images of
feathers categorized by 595 bird species. It was created to perform taxonomic
identification of bird species by a single feather, which can be applied in
amateur and professional ornithology. FeatherV1 is the first publicly available
bird's plumage dataset for machine learning, and it can raise interest for a
new task in fine-grained visual recognition domain. The latest version of the
dataset can be downloaded at
https://github.com/feathers-dataset/feathersv1-dataset. We also present
feathers classification task results. We selected several deep learning
architectures (DenseNet based) for categorical crossentropy values comparison
on the provided dataset.
- Abstract(参考訳): 本稿では,595種に分類される羽毛28,272枚を含むFeatherV1の新たなデータセットを紹介する。
鳥類種を1羽の羽で分類学的に識別するために作られ、アマチュア鳥類学や専門鳥類学に応用できる。
FeatherV1は、機械学習のための最初の一般公開された鳥の羽ばたきデータセットであり、きめ細かい視覚認識領域における新しいタスクへの関心を高めることができる。
最新バージョンはhttps://github.com/feathers-dataset/feathersv1-datasetからダウンロードできる。
羽毛分類タスクの結果も提示する。
提案したデータセットから分類的クロスエントロピー値を比較するために,いくつかのディープラーニングアーキテクチャ(DenseNetベース)を選択した。
関連論文リスト
- Anno-incomplete Multi-dataset Detection [67.69438032767613]
我々は「不完全なマルチデータセット検出」という新しい問題を提案する。
複数の注釈付きデータセットで全ての対象カテゴリを正確に検出できるエンドツーエンドのマルチタスク学習アーキテクチャを開発した。
論文 参考訳(メタデータ) (2024-08-29T03:58:21Z) - AudioProtoPNet: An interpretable deep learning model for bird sound classification [1.49199020343864]
本研究では,マルチラベル鳥の音の分類にPrototypeal Part Network(ProtoPNet)を適応したAudioProtoPNetを紹介する。
これは本質的に解釈可能なモデルであり、埋め込みを抽出するためにConvNeXtのバックボーンを使用する。
このモデルは、9,734種の鳥類と6,800時間以上の録音からなるBirdSetトレーニングデータセットで訓練された。
論文 参考訳(メタデータ) (2024-04-16T09:37:41Z) - Leveraging Habitat Information for Fine-grained Bird Identification [4.392299539811761]
我々は鳥類学者によって鳥類を識別する4つの主要な方法の1つである生息地情報を現代の鳥類分類器に組み込むことを最初に検討した。
我々は、下流の鳥のデータセットに基づいて訓練されたCNNとViTと、オリジナルのマルチモーダルCLIPの2つの主要なモデルタイプに焦点を当てる。
CNNとViTを生息地データでトレーニングすると、NABirdsとCUB-200で最大0.83点、+0.23点が改善される。
論文 参考訳(メタデータ) (2023-12-22T16:23:22Z) - BirdSAT: Cross-View Contrastive Masked Autoencoders for Bird Species
Classification and Mapping [22.30038765017189]
本稿では,世界中の鳥類の詳細な分類と生態地図作成に有用なメタデータ認識型自己教師型学習(SSL)フレームワークを提案する。
当社のフレームワークは,コントラスト学習(CL)とMasked Image Modeling(MIM)の2つのSSL戦略を統合するとともに,鳥の地上レベルの画像にメタデータを付加した埋め込み空間を充実させる。
本研究では,小粒度の視覚的分類(FGVC)とクロスモーダル検索(クロスモーダル検索)という2つの下流課題に基づいて,鳥の細粒度・地理的に条件付けられた特徴を学習できることを実証した。
論文 参考訳(メタデータ) (2023-10-29T22:08:00Z) - Transfer Learning with Semi-Supervised Dataset Annotation for Birdcall
Classification [0.0]
本研究では,BirdCLEF 2023コンペティションのための半教師付きデータセットアノテーションを用いたトランスファー学習について検討する。
提案手法では,既存の市販モデルであるBirdNETとMixITを用いて,コンペティションにおける表現とラベル付けの課題に対処する。
論文 参考訳(メタデータ) (2023-06-29T07:56:27Z) - Thinking Like an Annotator: Generation of Dataset Labeling Instructions [59.603239753484345]
本稿では、公開されていないラベリング命令に対処するため、新しいタスクであるラベリング命令生成を導入する。
1)データセット内のカテゴリ毎に視覚的に代表されるサンプルのセットを生成し,2)サンプルに対応するテキストラベルを提供する。
このフレームワークは人間のアノテーションのプロキシとして機能し、最終的なラベル付け命令セットを生成し、その品質を評価するのに役立つ。
論文 参考訳(メタデータ) (2023-06-24T18:32:48Z) - Minimalist Data Wrangling with Python [4.429175633425273]
Pythonを使ったData Wranglingは、学生によるデータサイエンス入門として構想されている。
これは、重要な概念を詳細に議論するだけでなく、ハイレベルな概要を提供する。
論文 参考訳(メタデータ) (2022-11-09T01:24:39Z) - Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。
これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。
異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文 参考訳(メタデータ) (2021-06-08T06:13:11Z) - Simple multi-dataset detection [83.9604523643406]
複数の大規模データセット上で統合検出器を訓練する簡単な方法を提案する。
データセット固有のアウトプットを共通の意味分類に自動的に統合する方法を示す。
私たちのアプローチは手動の分類学の調整を必要としません。
論文 参考訳(メタデータ) (2021-02-25T18:55:58Z) - Dataset Bias in Few-shot Image Recognition [57.25445414402398]
まず,基本カテゴリから学習した伝達可能能力の影響について検討する。
第2に、データセット構造と異なる少数ショット学習方法から、異なるデータセットのパフォーマンス差について検討する。
論文 参考訳(メタデータ) (2020-08-18T14:46:23Z) - Cross-dataset Training for Class Increasing Object Detection [52.34737978720484]
オブジェクト検出におけるクロスデータセットトレーニングのための,概念的にシンプルで柔軟で汎用的なフレームワークを提案する。
データセット間のトレーニングによって、既存のデータセットを使用して、単一のモデルで統合されたオブジェクトクラスを検出することができる。
クロスデータセットトレーニングを使用している間、新しいデータセットに新しいクラスをラベル付けするだけです。
論文 参考訳(メタデータ) (2020-01-14T04:40:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。