論文の概要: Fossil Image Identification using Deep Learning Ensembles of Data
Augmented Multiviews
- arxiv url: http://arxiv.org/abs/2302.08062v1
- Date: Thu, 16 Feb 2023 03:57:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 15:13:13.289968
- Title: Fossil Image Identification using Deep Learning Ensembles of Data
Augmented Multiviews
- Title(参考訳): データ強化マルチビューの深層学習アンサンブルを用いた化石画像の同定
- Authors: Chengbin Hou, Xinyu Lin, Hanhui Huang, Sheng Xu, Junxuan Fan, Yukun
Shi, Hairong Lv
- Abstract要約: ラベル付き化石画像の量と品質は、しばしば化石保存、条件付きサンプリング、ドメインの専門家による高価で一貫性のないラベルアノテーションによって制限される。
本稿では,各標本画像の複数のビューを収集し,複数のベースとなる深層学習モデルを訓練し,ソフト投票による最終決定を行う,新しい多視点アンサンブルフレームワークを提案する。
深層学習に基づく5つのマイルストーンモデルに対するフスリノイド化石データセットの実験結果は、3つのベースモデルを用いたOGSが一貫してベースラインを上回っていることを示している。
- 参考スコア(独自算出の注目度): 4.560846757348724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identification of fossil species is crucial to evolutionary studies. Recent
advances from deep learning have shown promising prospects in fossil image
identification. However, the quantity and quality of labeled fossil images are
often limited due to fossil preservation, conditioned sampling, and expensive
and inconsistent label annotation by domain experts, which pose great
challenges to the training of deep learning based image classification models.
To address these challenges, we follow the idea of the wisdom of crowds and
propose a novel multiview ensemble framework, which collects multiple views of
each fossil specimen image reflecting its different characteristics to train
multiple base deep learning models and then makes final decisions via soft
voting. We further develop OGS method that integrates original, gray, and
skeleton views under this framework to demonstrate the effectiveness.
Experimental results on the fusulinid fossil dataset over five deep learning
based milestone models show that OGS using three base models consistently
outperforms the baseline using a single base model, and the ablation study
verifies the usefulness of each selected view. Besides, OGS obtains the
superior or comparable performance compared to the method under well-known
bagging framework. Moreover, as the available training data decreases, the
proposed framework achieves more performance gains compared to the baseline.
Furthermore, a consistency test with two human experts shows that OGS obtains
the highest agreement with both the labels of dataset and the two experts.
Notably, this methodology is designed for general fossil identification and it
is expected to see applications on other fossil datasets. The results suggest
the potential application when the quantity and quality of labeled data are
particularly restricted, e.g., to identify rare fossil images.
- Abstract(参考訳): 化石種の同定は進化研究に不可欠である。
深層学習による最近の進歩は、化石画像の識別に有望な可能性を示している。
しかし、ラベル付き化石画像の量や品質は、しばしば化石保存、条件付きサンプリング、ドメインの専門家による高価で一貫性のないラベルアノテーションによって制限され、深層学習に基づく画像分類モデルの訓練には大きな課題が生じる。
これらの課題に対処するために,群集の知恵を追求し,その特徴を反映した各標本像の複数ビューを収集し,複数のベース深層学習モデルを訓練し,ソフト投票による最終決定を行う,新しい多視点アンサンブルフレームワークを提案する。
さらに,本フレームワークの下で,オリジナル,グレー,スケルトンビューを統合して有効性を示すOGS手法を開発した。
深層学習に基づく5つのマイルストーンモデルに対するフスリノイド化石データセットの実験結果は、3つのベースモデルを用いたOGSが1つのベースモデルで一貫してベースラインを上回り、それぞれのビューの有用性を検証する。
さらに、ogsは、よく知られたバグングフレームワーク下での手法よりも優れた性能または比較性能を得る。
さらに、利用可能なトレーニングデータが減少するにつれて、提案するフレームワークはベースラインよりもパフォーマンスが向上する。
さらに、2人の人間専門家による一貫性テストでは、OGSはデータセットのラベルと2人の専門家の両方と最高の合意を得る。
特に、この手法は一般的な化石同定のために設計されており、他の化石データセットに応用されることが期待されている。
この結果は、ラベル付きデータの量や品質が特に制限されている場合、例えば希少な化石画像の特定に応用される可能性を示している。
関連論文リスト
- Artificial Intelligence-powered fossil shark tooth identification: Unleashing the potential of Convolutional Neural Networks [10.946419654203613]
本研究では,分離されたサメの歯のイメージを分類するためのCNN(Convolutional Neural Networks)の能力について検討した。
我々は、認識タスクに特化されたSharkNet-XというCNNを開発し、平均精度0.85に5倍の精度で到達した。
結果について古生物学的な視点を与えながらCNNの振る舞いを理解し説明するために, SHAP法を導入した。
論文 参考訳(メタデータ) (2024-05-07T10:49:10Z) - A Fair Evaluation of Various Deep Learning-Based Document Image
Binarization Approaches [5.393847875065119]
文書画像のバイナリ化は、文書解析の分野における重要な前処理ステップである。
深層学習技術は、文脈に依存した特徴を学習することで、画像のバイナライズされたバージョンを生成することができる。
本研究は,同じ評価プロトコル下での異なる深層学習手法の評価に焦点をあてる。
論文 参考訳(メタデータ) (2024-01-22T10:42:51Z) - LCReg: Long-Tailed Image Classification with Latent Categories based
Recognition [81.5551335554507]
本稿では,Lar-tail Recognition(LCReg)法を提案する。
我々の仮説は、頭と尾のクラスで共有される一般的な潜伏的特徴は、特徴表現を改善するために使用できるというものである。
具体的には、頭と尾の両方で共有されるクラス非依存の潜伏特徴の集合を学習し、潜伏特徴のセマンティックデータ拡張を用いてトレーニングサンプルの多様性を暗黙的に増加させる。
論文 参考訳(メタデータ) (2023-09-13T02:03:17Z) - Hierarchical Skeleton Meta-Prototype Contrastive Learning with Hard
Skeleton Mining for Unsupervised Person Re-Identification [70.90142717649785]
本稿では,HSM(Hard Skeleton Mining)を用いた階層型非教師付きメタプロトタイプコントラストラーニング(Hi-MPC)手法を提案する。
原原型を複数の同種変換を伴うメタプロトタイプに変換することにより,原型固有の一貫性を学習し,人体再IDのより効果的な骨格特徴を捉える。
論文 参考訳(メタデータ) (2023-07-24T16:18:22Z) - Improving Data-Efficient Fossil Segmentation via Model Editing [4.683612295430956]
少ないラベル付き画像で化石セグメンテーションを改善するための2つのパラダイムを提案する。
我々は,Mask R-CNNが化石の異なる分類を区別できないことを明らかにするために,ドメインインフォームの画像摂動を適用した。
我々は,画像分類における体系的な誤りを,ラベル付き追加データを必要としない画像分割に補正する既存のモデル編集手法を拡張した。
論文 参考訳(メタデータ) (2022-10-08T02:12:38Z) - Long-tailed Recognition by Learning from Latent Categories [70.6272114218549]
本稿ではLatent Categories based long-tail Recognition (LCReg)法を提案する。
具体的には、頭と尾のクラス間で共有されるクラスに依存しない潜在機能群を学習する。
次に、潜在機能に意味データ拡張を適用することで、トレーニングサンプルの多様性を暗黙的に強化する。
論文 参考訳(メタデータ) (2022-06-02T12:19:51Z) - Towards a Deeper Understanding of Skeleton-based Gait Recognition [4.812321790984493]
近年、ほとんどの歩行認識法は、人のシルエットを使って歩行の特徴を抽出している。
モデルに基づく手法はこれらの問題に悩まされず、身体関節の時間運動を表現することができる。
本研究では,高次入力と残差ネットワークを組み合わせたグラフ畳み込みネットワーク(GCN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-16T18:23:37Z) - Series Photo Selection via Multi-view Graph Learning [52.33318426088579]
連続写真選択(SPS)は画像美学の質評価の重要な分野である。
我々は,マルチビュー特徴間の関係を構築するために,グラフニューラルネットワークを利用する。
ほぼ同一の一連の写真の中から最適なものを選択するために、シアムズネットワークが提案されている。
論文 参考訳(メタデータ) (2022-03-18T04:23:25Z) - Deep Low-Shot Learning for Biological Image Classification and
Visualization from Limited Training Samples [52.549928980694695]
In situ hybridization (ISH) gene expression pattern image from the same developmental stage。
正確な段階のトレーニングデータをラベル付けするのは、生物学者にとっても非常に時間がかかる。
限られた訓練画像を用いてISH画像を正確に分類する2段階の低ショット学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T06:06:06Z) - View-Invariant Gait Recognition with Attentive Recurrent Learning of
Partial Representations [27.33579145744285]
本稿では,まず,フレームレベルの畳み込み特徴から歩行畳み込みエネルギーマップ(GCEM)を抽出するネットワークを提案する。
次に、GCEMの分割されたビンから学ぶために双方向ニューラルネットワークを採用し、学習された部分的リカレント表現の関係を利用する。
提案手法は2つの大規模CASIA-BとOU-Mの歩行データセットで広範囲に検証されている。
論文 参考訳(メタデータ) (2020-10-18T20:20:43Z) - Adversarial Feature Hallucination Networks for Few-Shot Learning [84.31660118264514]
Adversarial Feature Hallucination Networks (AFHN) は条件付き Wasserstein Generative Adversarial Network (cWGAN) に基づいている。
合成された特徴の識別性と多様性を促進するために、2つの新規レギュレータがAFHNに組み込まれている。
論文 参考訳(メタデータ) (2020-03-30T02:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。