論文の概要: Species196: A One-Million Semi-supervised Dataset for Fine-grained
Species Recognition
- arxiv url: http://arxiv.org/abs/2309.14183v3
- Date: Sat, 28 Oct 2023 07:48:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 19:59:58.910040
- Title: Species196: A One-Million Semi-supervised Dataset for Fine-grained
Species Recognition
- Title(参考訳): species196: きめ細かな種認識のための100万個の半教師付きデータセット
- Authors: Wei He, Kai Han, Ying Nie, Chengcheng Wang, Yunhe Wang
- Abstract要約: 種196(英: species 196)は、196科の外来種の大規模な半教師付きデータセットである。
専門家レベルの正確なアノテーションである種196-Lと、侵入種196-Uの1.2M以上のラベルのない画像を集めている。
- 参考スコア(独自算出の注目度): 30.327642724046903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of foundation vision models has pushed the general visual
recognition to a high level, but cannot well address the fine-grained
recognition in specialized domain such as invasive species classification.
Identifying and managing invasive species has strong social and ecological
value. Currently, most invasive species datasets are limited in scale and cover
a narrow range of species, which restricts the development of deep-learning
based invasion biometrics systems. To fill the gap of this area, we introduced
Species196, a large-scale semi-supervised dataset of 196-category invasive
species. It collects over 19K images with expert-level accurate annotations
Species196-L, and 1.2M unlabeled images of invasive species Species196-U. The
dataset provides four experimental settings for benchmarking the existing
models and algorithms, namely, supervised learning, semi-supervised learning,
self-supervised pretraining and zero-shot inference ability of large
multi-modal models. To facilitate future research on these four learning
paradigms, we conduct an empirical study of the representative methods on the
introduced dataset. The dataset is publicly available at
https://species-dataset.github.io/.
- Abstract(参考訳): 基礎視覚モデルの開発は、一般的な視覚認識を高いレベルに押し上げたが、侵入種分類のような特殊な領域におけるきめ細かい認識にはうまく対応できない。
外来種の同定と管理は、社会的・生態学的価値が強い。
現在、ほとんどの侵入種データセットは規模が限られており、限られた範囲の種をカバーしており、深層学習に基づく侵略バイオメトリックスシステムの開発を制限している。
この領域のギャップを埋めるために,196カテゴリーの侵入種からなる大規模半教師付きデータセットである species196 を導入した。
専門家レベルの正確な注釈種196-l、侵入種種196-uのラベルなし画像1.2mの19k以上の画像を収集する。
データセットは、既存のモデルとアルゴリズムをベンチマークするための4つの実験的な設定、すなわち、教師付き学習、半教師付き学習、自己教師付き事前学習、大規模マルチモーダルモデルのゼロショット推論能力を提供する。
これら4つの学習パラダイムの今後の研究を促進するために,提案したデータセットの代表的な手法を実証研究する。
データセットはhttps://species-dataset.github.io/で公開されている。
関連論文リスト
- Generating Binary Species Range Maps [12.342459602972609]
種分散モデル(SDM)や、より最近では、ディープラーニングベースの変種が、潜在的な自動化された代替手段を提供する。
深層学習に基づくSDMは、特定の場所における種の存在を予測した確率を連続的に生成する。
本研究では,プレゼンスのみのデータを用いたレンジマップのバイナライズのための最適しきい値の自動同定手法について検討した。
論文 参考訳(メタデータ) (2024-08-28T17:17:20Z) - Active Learning-Based Species Range Estimation [20.422188189640053]
そこで本研究では,地上観測の限られた数から,種の地理的範囲を効率的に推定するための,新しいアクティブラーニング手法を提案する。
弱教師付きコミュニティで収集された観測データに基づいて訓練されたモデルを用いて,この候補範囲の集合を生成することができることを示す。
提案手法の詳細な評価を行い,1000種に対する専門家由来の範囲を含む評価データセットを用いて,既存のアクティブラーニング手法と比較した。
論文 参考訳(メタデータ) (2023-11-03T17:45:18Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Semi-Supervised Domain Adaptation for Cross-Survey Galaxy Morphology
Classification and Anomaly Detection [57.85347204640585]
We developed a Universal Domain Adaptation method DeepAstroUDA。
異なるタイプのクラスオーバーラップしたデータセットに適用することができる。
初めて、我々は2つの非常に異なる観測データセットに対するドメイン適応の有効利用を実演した。
論文 参考訳(メタデータ) (2022-11-01T18:07:21Z) - Dise\~no y desarrollo de aplicaci\'on m\'ovil para la clasificaci\'on de
flora nativa chilena utilizando redes neuronales convolucionales [0.0]
本研究は,モバイルアプリに実装されたキリアン種データセットと最適化された分類モデルの開発を紹介する。
データセットは、フィールドで捕獲されたいくつかの種の写真をまとめ、オンラインで利用可能な他のデータセットから利用可能ないくつかの写真を選択することで構築された。
最良のモデルはモバイルアプリ上で実装され、テストセットに対して95%正確な予測率を得た。
論文 参考訳(メタデータ) (2021-06-11T19:43:47Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - I-Nema: A Biological Image Dataset for Nematode Recognition [3.1918817988202606]
線虫は地球上で最も豊富な中生代グループの一つであり、多様な生態的ニッチを占有している。
ネマトドの正確な認識または識別は、害虫駆除、土壌生態学、生物地理学、生息地の保全、気候変動に対する大きな重要性を有する。
コンピュータビジョンと画像処理は、線虫の種認識にいくつかの成功をおさめたが、依然として大きな需要がある。
論文 参考訳(メタデータ) (2021-03-15T12:29:37Z) - TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain
Gait Recognition [77.77786072373942]
本稿では、教師なしクロスドメイン歩行認識のための領域ギャップを橋渡しするTransferable Neighborhood Discovery (TraND) フレームワークを提案する。
我々は、潜在空間におけるラベルなしサンプルの自信ある近傍を自動的に発見するために、エンドツーエンドのトレーニング可能なアプローチを設計する。
提案手法は,CASIA-BとOU-LPの2つの公開データセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-02-09T03:07:07Z) - Two-View Fine-grained Classification of Plant Species [66.75915278733197]
本研究では,2視点の葉のイメージ表現に基づく新しい手法と,植物種の粒度認識のための階層的分類戦略を提案する。
シームズ畳み込みニューラルネットワークに基づく深度測定は、多数のトレーニングサンプルへの依存を減らし、新しい植物種に拡張性を持たせるために用いられる。
論文 参考訳(メタデータ) (2020-05-18T21:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。