論文の概要: Fossil Image Identification using Deep Learning Ensembles of Data
Augmented Multiviews
- arxiv url: http://arxiv.org/abs/2302.08062v2
- Date: Wed, 20 Sep 2023 08:53:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 00:24:52.001162
- Title: Fossil Image Identification using Deep Learning Ensembles of Data
Augmented Multiviews
- Title(参考訳): データ強化マルチビューの深層学習アンサンブルを用いた化石画像の同定
- Authors: Chengbin Hou, Xinyu Lin, Hanhui Huang, Sheng Xu, Junxuan Fan, Yukun
Shi, Hairong Lv
- Abstract要約: 我々は,化石画像のオリジン(O),グレイ(G),スケルトン(S)ビューを収集し,複数のベースモデルを訓練する多視点アンサンブルフレームワークを提案する。
2400枚の画像を持つ最大のフスリノイドデータセットの実験は、提案されたOGSがベースラインを一貫して上回っていることを示している。
提案した枠組みは、化石の同定における不整合の評価と解決の可能性をも示している。
- 参考スコア(独自算出の注目度): 8.877286028859602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identification of fossil species is crucial to evolutionary studies. Recent
advances from deep learning have shown promising prospects in fossil image
identification. However, the quantity and quality of labeled fossil images are
often limited due to fossil preservation, conditioned sampling, and expensive
and inconsistent label annotation by domain experts, which pose great
challenges to training deep learning based image classification models. To
address these challenges, we follow the idea of the wisdom of crowds and
propose a multiview ensemble framework, which collects Original (O), Gray (G),
and Skeleton (S) views of each fossil image reflecting its different
characteristics to train multiple base models, and then makes the final
decision via soft voting. Experiments on the largest fusulinid dataset with
2400 images show that the proposed OGS consistently outperforms baselines
(using a single model for each view), and obtains superior or comparable
performance compared to OOO (using three base models for three the same
Original views). While considering the identification consistency estimation
with respect to human experts, OGS receives the highest agreement with the
original labels of dataset and with the re-identifications of two human
experts. We conclude that the proposed framework can present state-of-the-art
performance in the fusulinid fossil identification case study. This framework
is designed for general fossil identification and it is expected to see
applications to other fossil datasets in future work. Notably, the result,
which shows more performance gains as train set size decreases or over a
smaller imbalance fossil dataset, suggests the potential application to
identify rare fossil images. The proposed framework also demonstrates its
potential for assessing and resolving inconsistencies in fossil identification.
- Abstract(参考訳): 化石種の同定は進化研究に不可欠である。
深層学習による最近の進歩は、化石画像の識別に有望な可能性を示している。
しかし、ラベル付き化石画像の量と品質は、しばしば化石保存、条件付きサンプリング、ドメインの専門家による高価で一貫性のないラベルアノテーションによって制限され、深層学習に基づく画像分類モデルの訓練に大きな課題が生じる。
これらの課題に対処するため,我々は,群集の知恵の考え方に従い,各化石画像のオリジナル(o),グレー(g),スケルトン(s)ビューを収集し,その特徴を反映して複数のベースモデルをトレーニングし,ソフト投票により最終決定を行うマルチビューアンサンブルフレームワークを提案する。
2400のイメージを持つ最大のフスリノイドデータセットの実験では、提案されたOGSはベースライン(ビュー毎に1つのモデルを使用して)を一貫して上回り、OOO(3つのベースモデルで同じオリジナルビューを3つ使用)よりも優れた、あるいは同等のパフォーマンスを得る。
人間の専門家に対する識別整合性の推定を考慮しながら、OGSはデータセットのオリジナルのラベルと2人の人間の専門家の再識別との合意が最も高い。
提案手法は, 化石の発見事例研究において, 最先端の性能を示すことができると結論付けた。
このフレームワークは一般的な化石識別のために設計されており、今後他の化石データセットへの応用が期待されている。
特に、列車のセットのサイズが小さくなるか、あるいはより小さな不均衡な化石データセットを超えると、パフォーマンスが向上し、希少な化石像を識別する可能性を示している。
提案手法は, 化石同定における不整合を評価, 解決する可能性も示している。
関連論文リスト
- Artificial Intelligence-powered fossil shark tooth identification: Unleashing the potential of Convolutional Neural Networks [10.946419654203613]
本研究では,分離されたサメの歯のイメージを分類するためのCNN(Convolutional Neural Networks)の能力について検討した。
我々は、認識タスクに特化されたSharkNet-XというCNNを開発し、平均精度0.85に5倍の精度で到達した。
結果について古生物学的な視点を与えながらCNNの振る舞いを理解し説明するために, SHAP法を導入した。
論文 参考訳(メタデータ) (2024-05-07T10:49:10Z) - A Fair Evaluation of Various Deep Learning-Based Document Image
Binarization Approaches [5.393847875065119]
文書画像のバイナリ化は、文書解析の分野における重要な前処理ステップである。
深層学習技術は、文脈に依存した特徴を学習することで、画像のバイナライズされたバージョンを生成することができる。
本研究は,同じ評価プロトコル下での異なる深層学習手法の評価に焦点をあてる。
論文 参考訳(メタデータ) (2024-01-22T10:42:51Z) - LCReg: Long-Tailed Image Classification with Latent Categories based
Recognition [81.5551335554507]
本稿では,Lar-tail Recognition(LCReg)法を提案する。
我々の仮説は、頭と尾のクラスで共有される一般的な潜伏的特徴は、特徴表現を改善するために使用できるというものである。
具体的には、頭と尾の両方で共有されるクラス非依存の潜伏特徴の集合を学習し、潜伏特徴のセマンティックデータ拡張を用いてトレーニングサンプルの多様性を暗黙的に増加させる。
論文 参考訳(メタデータ) (2023-09-13T02:03:17Z) - Hierarchical Skeleton Meta-Prototype Contrastive Learning with Hard
Skeleton Mining for Unsupervised Person Re-Identification [70.90142717649785]
本稿では,HSM(Hard Skeleton Mining)を用いた階層型非教師付きメタプロトタイプコントラストラーニング(Hi-MPC)手法を提案する。
原原型を複数の同種変換を伴うメタプロトタイプに変換することにより,原型固有の一貫性を学習し,人体再IDのより効果的な骨格特徴を捉える。
論文 参考訳(メタデータ) (2023-07-24T16:18:22Z) - Improving Data-Efficient Fossil Segmentation via Model Editing [4.683612295430956]
少ないラベル付き画像で化石セグメンテーションを改善するための2つのパラダイムを提案する。
我々は,Mask R-CNNが化石の異なる分類を区別できないことを明らかにするために,ドメインインフォームの画像摂動を適用した。
我々は,画像分類における体系的な誤りを,ラベル付き追加データを必要としない画像分割に補正する既存のモデル編集手法を拡張した。
論文 参考訳(メタデータ) (2022-10-08T02:12:38Z) - Long-tailed Recognition by Learning from Latent Categories [70.6272114218549]
本稿ではLatent Categories based long-tail Recognition (LCReg)法を提案する。
具体的には、頭と尾のクラス間で共有されるクラスに依存しない潜在機能群を学習する。
次に、潜在機能に意味データ拡張を適用することで、トレーニングサンプルの多様性を暗黙的に強化する。
論文 参考訳(メタデータ) (2022-06-02T12:19:51Z) - Towards a Deeper Understanding of Skeleton-based Gait Recognition [4.812321790984493]
近年、ほとんどの歩行認識法は、人のシルエットを使って歩行の特徴を抽出している。
モデルに基づく手法はこれらの問題に悩まされず、身体関節の時間運動を表現することができる。
本研究では,高次入力と残差ネットワークを組み合わせたグラフ畳み込みネットワーク(GCN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-16T18:23:37Z) - Series Photo Selection via Multi-view Graph Learning [52.33318426088579]
連続写真選択(SPS)は画像美学の質評価の重要な分野である。
我々は,マルチビュー特徴間の関係を構築するために,グラフニューラルネットワークを利用する。
ほぼ同一の一連の写真の中から最適なものを選択するために、シアムズネットワークが提案されている。
論文 参考訳(メタデータ) (2022-03-18T04:23:25Z) - Deep Low-Shot Learning for Biological Image Classification and
Visualization from Limited Training Samples [52.549928980694695]
In situ hybridization (ISH) gene expression pattern image from the same developmental stage。
正確な段階のトレーニングデータをラベル付けするのは、生物学者にとっても非常に時間がかかる。
限られた訓練画像を用いてISH画像を正確に分類する2段階の低ショット学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T06:06:06Z) - View-Invariant Gait Recognition with Attentive Recurrent Learning of
Partial Representations [27.33579145744285]
本稿では,まず,フレームレベルの畳み込み特徴から歩行畳み込みエネルギーマップ(GCEM)を抽出するネットワークを提案する。
次に、GCEMの分割されたビンから学ぶために双方向ニューラルネットワークを採用し、学習された部分的リカレント表現の関係を利用する。
提案手法は2つの大規模CASIA-BとOU-Mの歩行データセットで広範囲に検証されている。
論文 参考訳(メタデータ) (2020-10-18T20:20:43Z) - Adversarial Feature Hallucination Networks for Few-Shot Learning [84.31660118264514]
Adversarial Feature Hallucination Networks (AFHN) は条件付き Wasserstein Generative Adversarial Network (cWGAN) に基づいている。
合成された特徴の識別性と多様性を促進するために、2つの新規レギュレータがAFHNに組み込まれている。
論文 参考訳(メタデータ) (2020-03-30T02:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。