論文の概要: Floralens: a Deep Learning Model for the Portuguese Native Flora
- arxiv url: http://arxiv.org/abs/2403.12072v1
- Date: Tue, 13 Feb 2024 15:23:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 07:36:54.692272
- Title: Floralens: a Deep Learning Model for the Portuguese Native Flora
- Title(参考訳): Floralens: ポルトガル原住民の深層学習モデル
- Authors: António Filgueiras, Eduardo R. B. Marques, Luís M. B. Lopes, Miguel Marques, Hugo Silva,
- Abstract要約: 我々は,生物分類のためのデータセットを構築するための方法論を,一般公開された研究グレードデータセットから開発する。
GoogleのAutoML Visionクラウドサービスが提供するような、既製の深層畳み込みニューラルネットワークを使用して、これらのデータセットからモデルを導出します。
慎重にデータセットを設計することで、既成の機械学習クラウドサービスが、最先端の市民科学プラットフォームが提供するものに匹敵する、比較的少ない労力で正確なモデルを生成することが分かりました。
- 参考スコア(独自算出の注目度): 0.5534140394498714
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine-learning techniques, namely deep convolutional neural networks, are pivotal for image-based identification of biological species in many Citizen Science platforms. However, the construction of critically sized and sampled datasets to train the networks and the choice of the network architectures itself remains little documented and, therefore, does not lend itself to be easily replicated. In this paper, we develop a streamlined methodology for building datasets for biological taxa from publicly available research-grade datasets and for deriving models from these datasets using off-the-shelf deep convolutional neural networks such as those provided by Google's AutoML Vision cloud service. Our case study is the Portuguese native flora, anchored in a high-quality dataset, provided by the Sociedade Portuguesa de Bot\^anica, scaled up by adding sampled data from iNaturalist, Pl@ntNet, and Observation.org. We find that with a careful dataset design, off-the-shelf machine-learning cloud services produce accurate models with relatively little effort that rival those provided by state-of-the-art citizen science platforms. The best model we derived, dubbed Floralens, has been integrated into the public website of Project Biolens, where we gather models for other taxa as well. The dataset used to train the model and its namesake is publicly available on Zenodo.
- Abstract(参考訳): 深層畳み込みニューラルネットワーク(Deep Convolutional Neural Network)と呼ばれる機械学習技術は、多くの市民科学プラットフォームにおける生物種のイメージベース同定に重要である。
しかし、ネットワークをトレーニングするための重要なサイズとサンプルデータセットの構築とネットワークアーキテクチャの選択は文書化されていないため、容易に複製できるようにはなっていない。
本稿では,GoogleのAutoML Visionクラウドサービスが提供するような,市販の深層畳み込みニューラルネットワークを用いて,公開可能な研究グレードデータセットから生物分類のためのデータセットを構築するための合理化手法を開発する。
ケーススタディは、iNaturalist, Pl@ntNet, Observation.orgのサンプルデータを追加することで、Sociedade Portuguesa de Bot\^anicaによって提供される高品質なデータセットに固定されたポルトガル原生植物である。
慎重にデータセットを設計することで、既成の機械学習クラウドサービスが、最先端の市民科学プラットフォームが提供するものに匹敵する、比較的少ない労力で正確なモデルを生成することが分かりました。
最も優れたモデルであるFloralensは、Project Biolensの公開ウェブサイトに統合され、他の分類のモデルも収集しています。
モデルのトレーニングに使われるデータセットとその名称はZenodoで公開されている。
関連論文リスト
- RedPajama: an Open Dataset for Training Large Language Models [80.74772646989423]
我々は、オープンソースの言語モデルを前進させるために対処しなければならない3つの中核的なデータ関連課題を特定します。
例えば、(1)データキュレーションプロセス、(2)大量の高品質データへのアクセス、(3)データセットキュレーションと分析のためのアーティファクトとメタデータの可用性などである。
LLaMAトレーニングデータセットのオープンレプリケーションであるRedPajama-V1と、生の未フィルタリングテキストデータと品質信号とメタデータからなる巨大なWeb専用データセットであるRedPajama-V2をリリースする。
論文 参考訳(メタデータ) (2024-11-19T09:35:28Z) - FLIGAN: Enhancing Federated Learning with Incomplete Data using GAN [1.5749416770494706]
Federated Learning (FL)は、ネットワークデバイス上での機械学習モデルの分散トレーニングのためのプライバシ保護メカニズムを提供する。
本稿では,FLにおけるデータ不完全性問題に対処する新しいアプローチであるFLIGANを提案する。
本手法はFLのプライバシ要件に則り,プロセス内の実際のデータを共有せずに合成データをフェデレートした方法で生成する。
論文 参考訳(メタデータ) (2024-03-25T16:49:38Z) - AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud
Registration [69.21282992341007]
Auto Synthは、ポイントクラウド登録のための3Dトレーニングデータを自動的に生成する。
私たちはポイントクラウド登録ネットワークをもっと小さなサロゲートネットワークに置き換え、4056.43$のスピードアップを実現しました。
TUD-L,LINEMOD,Occluded-LINEMODに関する我々の研究結果は,検索データセットでトレーニングされたニューラルネットワークが,広く使用されているModelNet40データセットでトレーニングされたニューラルネットワークよりも一貫してパフォーマンスが向上していることを示す。
論文 参考訳(メタデータ) (2023-09-20T09:29:44Z) - A Deep Learning Model for Heterogeneous Dataset Analysis -- Application
to Winter Wheat Crop Yield Prediction [0.6595290783361958]
LSTM(Long Short Term Memory)のような時系列深層学習モデルはすでに検討され、予測に応用されている。
既存のLSTMは異種データセットを扱えない。
ヘテロジニアスデータセットを扱うことができる効率的なディープラーニングモデルを提案する。
論文 参考訳(メタデータ) (2023-06-20T23:39:06Z) - Predicting COVID-19 pandemic by spatio-temporal graph neural networks: A
New Zealand's study [16.3773496061049]
我々は,ATMGNN(Attention-based Multi resolution Graph Neural Networks)という新しいディープラーニングアーキテクチャを提案する。
本手法は,空間グラフのマルチスケール構造を学習からクラスタ化アルゴリズムにより,データ駆動方式でキャプチャすることができる。
今後は、リアルタイムの予測とグローバルスケールに向けた作業の拡充を予定しています。
論文 参考訳(メタデータ) (2023-05-12T19:00:17Z) - Plankton-FL: Exploration of Federated Learning for Privacy-Preserving
Training of Deep Neural Networks for Phytoplankton Classification [81.04987357598802]
本研究では,植物プランクトン分類のための深層ニューラルネットワークのプライバシー保護トレーニングにフェデレート学習を活用する可能性を検討する。
我々は2つの異なるフェデレーション学習フレームワーク、フェデレーション学習(FL)と相互排他的FL(ME-FL)をシミュレートする。
本研究では,植物プランクトンモニタリングにおけるフェデレート学習の可能性と可能性について実験的に検証した。
論文 参考訳(メタデータ) (2022-12-18T02:11:03Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Transfer Learning with Deep Tabular Models [66.67017691983182]
上流データにより、グラフニューラルネットワークはGBDTモデルよりも決定的な優位性を示す。
そこで本研究では,表在化学習のための現実的な診断ベンチマークを提案する。
上流と下流の特徴セットが異なる場合の擬似特徴法を提案する。
論文 参考訳(メタデータ) (2022-06-30T14:24:32Z) - DeepSatData: Building large scale datasets of satellite images for
training machine learning models [77.17638664503215]
本稿では,機械学習モデルの学習のための衛星画像データセットの自動生成のための設計検討を行う。
本稿では,ニューラルネットワークの深層学習と評価の観点から直面する課題について論じる。
論文 参考訳(メタデータ) (2021-04-28T15:13:12Z) - Tabular Transformers for Modeling Multivariate Time Series [30.717890753132824]
タブラルデータセットは、データサイエンスの応用においてユビキタスである。その重要性から、最先端のディープラーニングアルゴリズムを適用して、その可能性を完全に解き放つことは自然なようだ。
本稿では,その階層構造を活用可能なグラフ時系列を表すニューラルネットワークモデルを提案する。
学習した表現を不正検出と合成データ生成に使用する合成クレジットカードトランザクションデータセットと、学習したエンコーディングを大気汚染物質濃度を予測するための実際の公害データセットの2つのデータセットで実証する。
論文 参考訳(メタデータ) (2020-11-03T16:58:08Z) - Scalable learning for bridging the species gap in image-based plant
phenotyping [2.208242292882514]
ディープラーニング(データ収集、注釈付け、トレーニング)を適用する従来のパラダイムは、イメージベースの植物表現には適用できない。
データコストには、物理的サンプルの育成、イメージングとラベル付けが含まれる。
モデル性能は、各植物種のドメイン間の種間ギャップによって影響を受ける。
論文 参考訳(メタデータ) (2020-03-24T10:26:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。