Fugu-MT 論文翻訳(概要): FungiTastic: A multi-modal dataset and benchmark for image categorization

論文の概要: FungiTastic: A multi-modal dataset and benchmark for image categorization

arxiv url: http://arxiv.org/abs/2408.13632v2
Date: Sun, 27 Oct 2024 20:34:38 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-08 05:15:13.551515
Title: FungiTastic: A multi-modal dataset and benchmark for image categorization
Title（参考訳）: FungiTastic: 画像分類のためのマルチモーダルデータセットとベンチマーク
Authors: Lukas Picek, Klara Janouskova, Milan Sulc, Jiri Matas,
Abstract要約: 我々は,20年間にわたって連続的に収集された菌類記録に基づいて,新しいベンチマークとデータセットFungiTasticを導入する。データセットは専門家によってラベル付けされ、キュレーションされ、5kの細粒度カテゴリー(種)の約350kのマルチモーダル観測で構成されている。 FungiTasticは、前例のないラベルの信頼性に関するDNA配列の真実をテストセットを含む数少ないベンチマークの1つである。
参考スコア（独自算出の注目度）: 21.01939456569417
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce a new, challenging benchmark and a dataset, FungiTastic, based on fungal records continuously collected over a twenty-year span. The dataset is labeled and curated by experts and consists of about 350k multimodal observations of 5k fine-grained categories (species). The fungi observations include photographs and additional data, e.g., meteorological and climatic data, satellite images, and body part segmentation masks. FungiTastic is one of the few benchmarks that include a test set with DNA-sequenced ground truth of unprecedented label reliability. The benchmark is designed to support (i) standard closed-set classification, (ii) open-set classification, (iii) multi-modal classification, (iv) few-shot learning, (v) domain shift, and many more. We provide baseline methods tailored for many use-cases, a multitude of ready-to-use pre-trained models on HuggingFace and a framework for model training. A comprehensive documentation describing the dataset features and the baselines are available at https://bohemianvra.github.io/FungiTastic/ and https://www.kaggle.com/datasets/picekl/fungitastic.
Abstract（参考訳）: 我々は、20年間にわたって継続的に収集された真菌の記録に基づいて、新しい挑戦的なベンチマークとデータセットであるFungiTasticを紹介した。データセットは専門家によってラベル付けされ、キュレーションされ、5kの細粒度カテゴリー(種)の350kのマルチモーダル観測で構成されている。菌類観測には、写真や追加データ、気象・気候データ、衛星画像、身体部分のセグメンテーションマスクが含まれる。 FungiTasticは、前例のないラベルの信頼性に関するDNA配列の真実をテストセットを含む数少ないベンチマークの1つである。ベンチマークはサポートするように設計されています (i)標準閉集合分類 (ii)オープンセット分類 (三)マルチモーダル分類 (4)少人数の学習。 (v)ドメインシフトなど。我々は,多くのユースケースに適したベースラインメソッド,HuggingFace上で多数の事前トレーニング済みモデル,モデルトレーニングのためのフレームワークを提供する。データセットの機能とベースラインを記述する包括的なドキュメントは、https://bohemianvra.github.io/FungiTastic/とhttps://www.kaggle.com/datasets/picekl/fungitasticで公開されている。

関連論文リスト

Transfer Learning and Mixup for Fine-Grained Few-Shot Fungi Classification [0.0]
本稿では,FungiCLEF 2025コンペティションの取り組みについて述べる。 FungiTastic Few-Shotデータセットを使用した、数ショットのきめ細かい視覚分類に焦点を当てている。
論文参考訳（メタデータ） (2025-07-11T01:21:21Z)
THUNDER: Tile-level Histopathology image UNDERstanding benchmark [32.185038017473396]
THUNDERは、デジタル病理基盤モデルのタイルレベルベンチマークである。本稿では,16種類のデータセットに対して,23の基盤モデルを包括的に比較する。
論文参考訳（メタデータ） (2025-07-10T15:41:35Z)
FoundTS: Comprehensive and Unified Benchmarking of Foundation Models for Time Series Forecasting [44.33565276128137]
時系列予測(TSF)は、金融、気象サービス、エネルギー管理など、多くの分野で重要な機能である。ファンデーションモデルは、新しいまたは見えないデータで有望な推論機能を示す。そこで我々は,そのようなモデルの徹底的かつ公平な評価と比較を可能にする新しいベンチマーク FoundTS を提案する。
論文参考訳（メタデータ） (2024-10-15T17:23:49Z)
Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。 DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。 10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文参考訳（メタデータ） (2024-07-20T01:34:13Z)
UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文参考訳（メタデータ） (2024-02-20T11:50:27Z)
Spawrious: A Benchmark for Fine Control of Spurious Correlation Biases [8.455991178281469]
我々は,クラスと背景の素早い相関関係を含む画像分類ベンチマークスイートであるベンチマーク-O2O,M2M-Easy,Medium,Hardを提案する。得られたデータセットは高品質で、約152Kの画像を含んでいる。
論文参考訳（メタデータ） (2023-03-09T18:22:12Z)
MuG: A Multimodal Classification Benchmark on Game Data with Tabular, Textual, and Visual Fields [26.450463943664822]
本研究では,8つのデータセットを用いたマルチモーダル分類ベンチマーク MuG を提案する。マルチアスペクトデータ分析を行い、ラベルバランス率、欠落特徴率、各モード内のデータの分布、ラベルと入力モダリティの相関など、ベンチマークに関する洞察を提供する。
論文参考訳（メタデータ） (2023-02-06T18:09:06Z)
VAESim: A probabilistic approach for self-supervised prototype discovery [0.23624125155742057]
条件付き変分オートエンコーダに基づく画像階層化アーキテクチャを提案する。我々は、連続した潜伏空間を用いて障害の連続を表現し、訓練中にクラスターを見つけ、画像/患者の成層に使用することができる。本手法は,標準VAEに対して,分類タスクで測定されたkNN精度において,ベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2022-09-25T17:55:31Z)
Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文参考訳（メタデータ） (2022-04-08T15:22:33Z)
Image Classification on Small Datasets via Masked Feature Mixing [22.105356244579745]
ChimeraMixと呼ばれるアーキテクチャは、インスタンスの合成を生成することによってデータ拡張を学習する。生成モデルは、画像をペアにエンコードし、マスクでガイドされた特徴を組み合わせて、新しいサンプルを作成する。評価のために、すべてのメソッドは追加データなしでスクラッチからトレーニングされる。
論文参考訳（メタデータ） (2022-02-23T16:51:22Z)
Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。 NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文参考訳（メタデータ） (2021-12-03T13:31:59Z)
CIM: Class-Irrelevant Mapping for Few-Shot Classification [58.02773394658623]
FSC(Few-shot Classification)は近年のホットな問題の一つである。事前訓練されたFEMを評価する方法は、FSCコミュニティにおいて最も重要な焦点である。 CIM(Class-Irrelevant Mapping)と呼ばれるシンプルなフレキシブルな手法を提案する。
論文参考訳（メタデータ） (2021-09-07T03:26:24Z)
Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文参考訳（メタデータ） (2021-08-04T14:51:37Z)
Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文参考訳（メタデータ） (2021-06-08T06:13:11Z)
Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。 Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文参考訳（メタデータ） (2021-06-01T22:33:53Z)
Simple multi-dataset detection [83.9604523643406]
複数の大規模データセット上で統合検出器を訓練する簡単な方法を提案する。データセット固有のアウトプットを共通の意味分類に自動的に統合する方法を示す。私たちのアプローチは手動の分類学の調整を必要としません。
論文参考訳（メタデータ） (2021-02-25T18:55:58Z)
Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文参考訳（メタデータ） (2020-06-06T06:48:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。