論文の概要: The DongNiao International Birds 10000 Dataset
- arxiv url: http://arxiv.org/abs/2010.06454v2
- Date: Thu, 5 Nov 2020 05:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 04:34:52.367500
- Title: The DongNiao International Birds 10000 Dataset
- Title(参考訳): DongNiao International Birds 1000000データセット
- Authors: Jian Mei and Hao Dong
- Abstract要約: DongNiao International Birds 10000 (DIB-10K)は、1万種類以上の異なる種類の鳥を持つ、挑戦的な画像データセットである。
機械学習と鳥類学の研究を可能にするために作られた。
- 参考スコア(独自算出の注目度): 1.9794779178665711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DongNiao International Birds 10000 (DIB-10K) is a challenging image dataset
which has more than 10 thousand different types of birds. It was created to
enable the study of machine learning and also ornithology research. DIB-10K
does not own the copyright of these images. It only provides thumbnails of
images, in a way similar to ImageNet.
- Abstract(参考訳): DongNiao International Birds 10000 (DIB-10K)は、1万種類以上の異なる種類の鳥を持つ、挑戦的な画像データセットである。
機械学習と鳥類学の研究を可能にするために作られた。
DIB-10Kはこれらの画像の著作権を所有していない。
これはimagenetに似た方法で、イメージのサムネイルのみを提供する。
関連論文リスト
- SPOTS-10: Animal Pattern Benchmark Dataset for Machine Learning Algorithms [0.08158530638728499]
SPOTS-10(SPOTS-10)は、動物10種における多様なパターンを示す大規模な画像集である。
このデータセットは、その場で機械学習アルゴリズムを評価するためのリソースである。
トレーニングセットは4万の画像で構成され、テストセットは1万の画像を含んでいる。
論文 参考訳(メタデータ) (2024-10-28T14:00:02Z) - Pixtral 12B [61.12291038082914]
12ビリオンパラメータのマルチモーダル言語モデルであるPixtral-12Bを導入する。
Pixtral-12Bは、自然画像と文書の両方を理解するために訓練されている。
多くのオープンソースモデルとは異なり、Pixtralはそのサイズに対する最先端のテキストモデルでもある。
論文 参考訳(メタデータ) (2024-10-09T17:16:22Z) - AirBirds: A Large-scale Challenging Dataset for Bird Strike Prevention
in Real-world Airports [10.295528237139235]
本稿では、118,312の時系列画像からなる大規模な挑戦的データセットAirBirdsを提案する。
すべてのアノテーション付きインスタンスの平均サイズは1920x1080画像の10ピクセルより小さい。
データセット内の画像は、現実世界の空港に配備されたカメラネットワークによって、一年で4シーズンにわたってキャプチャされる。
論文 参考訳(メタデータ) (2023-04-23T14:19:28Z) - Segment Anything [108.16489338211093]
私たちはこれまでで最大のセグメンテーションデータセットを構築し、1100万ライセンスのマスクを10億枚以上使用し、画像のプライバシーを尊重しています。
このモデルは、高速に撮影できるように設計および訓練されており、ゼロショットを新しい画像配信やタスクに転送することができる。
多数のタスクでその能力を評価した結果、ゼロショット性能は印象的であることが判明した。
論文 参考訳(メタデータ) (2023-04-05T17:59:46Z) - Bugs in the Data: How ImageNet Misrepresents Biodiversity [98.98950914663813]
ImageNet-1k検証セットで野生動物を表す269のクラスから13450の画像を解析した。
多くのクラスが未定義あるいは重複しており、画像の12%が誤ってラベル付けされていることがわかった。
また,ImageNet-1kに含まれる野生生物関連ラベルと画像の両方が,地理的,文化的に有意な偏見を呈していることがわかった。
論文 参考訳(メタデータ) (2022-08-24T17:55:48Z) - The ArtBench Dataset: Benchmarking Generative Models with Artworks [32.29345091626141]
ArtBench-10は、アートベンチマーク生成のための最初のクラスバランス、高品質、クリーンな注釈付き、標準化されたデータセットである。
10の独特な芸術様式から6万点のアート作品と、5000枚の訓練画像と1000枚のテスト画像で構成されている。
論文 参考訳(メタデータ) (2022-06-22T22:10:18Z) - Recognition of Unseen Bird Species by Learning from Field Guides [23.137536032163855]
我々は、野のガイドを利用して鳥の種認識を学習し、特に目に見えない種をゼロショットで認識する。
本研究では,(1)標準のゼロショット学習方式に入力可能な画像のコントラスト符号化,(2)イラストも画像であるという事実を活用する新しい手法について検討する。
この結果から,広範囲の種で容易に利用できるフィールドガイドからのイラストが,ゼロショット学習におけるサイド情報の競合源であることが示唆された。
論文 参考訳(メタデータ) (2022-06-03T09:13:46Z) - CNNs and Transformers Perceive Hybrid Images Similar to Humans [47.64219291655723]
深層学習視覚モデルの予測は、ハイブリッド画像の人間の知覚と定性的に一致していることを示す。
我々の結果は、畳み込みニューラルネットワーク(CNN)とトランスフォーマー(Transformer)が、視覚野の腹側の流れにおける情報のフィードフォワードスイープのモデル化に長けているという仮説を支持する新たな証拠を提供する。
論文 参考訳(メタデータ) (2022-03-19T21:37:07Z) - CtlGAN: Few-shot Artistic Portraits Generation with Contrastive Transfer
Learning [77.27821665339492]
CtlGANは、新しいコントラッシブ・トランスファー学習戦略を備えた、数発のアート・ポートレート生成モデルである。
ソースドメインで事前訓練したStyleGANを,対象の芸術領域に適応させる。
実面をZ+空間に埋め込んだ新しいエンコーダを提案し,適応型デコーダに対処するためのデュアルパストレーニング戦略を提案する。
論文 参考訳(メタデータ) (2022-03-16T13:28:17Z) - Object Detection in Aerial Images: A Large-Scale Benchmark and
Challenges [124.48654341780431]
航空画像(DOTA)におけるオブジェクトデテクションの大規模データセットとODAIの総合的ベースラインについて述べる。
提案するDOTAデータセットは,11,268個の空中画像から収集した18カテゴリのオブジェクト指向ボックスアノテーションの1,793,658個のオブジェクトインスタンスを含む。
70以上の構成を持つ10の最先端アルゴリズムをカバーするベースラインを構築し,各モデルの速度と精度を評価した。
論文 参考訳(メタデータ) (2021-02-24T11:20:55Z) - Can Giraffes Become Birds? An Evaluation of Image-to-image Translation
for Data Generation [0.0]
新しいデータを生成するためにGAN(Generative Adrial Networks)を用いて画像から画像への変換を行う。
InstaGANという名前の教師なしクロスドメイン翻訳者は、両方のドメイン間の翻訳を学ぶために、キリンと鳥とそれぞれのマスクで訓練された。
元々の空間配置と背景を保存しつつ、原キリン画像からの翻訳を用いて合成鳥画像のデータセットを生成した。
論文 参考訳(メタデータ) (2020-01-10T19:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。