論文の概要: DINOv2 Rocks Geological Image Analysis: Classification, Segmentation, and Interpretability
- arxiv url: http://arxiv.org/abs/2407.18100v3
- Date: Thu, 12 Sep 2024 16:32:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 21:20:46.233147
- Title: DINOv2 Rocks Geological Image Analysis: Classification, Segmentation, and Interpretability
- Title(参考訳): DINOv2 Rocks Geological Image Analysis: Classification, Segmentation, and Interpretability
- Authors: Florent Brondolo, Samuel Beaussant,
- Abstract要約: 本研究では, 岩石試料のCTスキャン画像の分類, セグメンテーション, 解釈可能性について検討した。
地質画像解析において, その有効性, 効率, 適応性を評価するために, セグメンテーション法の比較を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in computer vision have significantly improved image analysis tasks. Yet, deep learning models often struggle when applied to domains outside their training distribution, such as in geosciences, where domain-specific data can be scarce. This study investigates the classification, segmentation, and interpretability of CT-scan images of rock samples, focusing on the application of modern computer vision techniques to geoscientific tasks. We compare a range of segmentation methods to assess their efficacy, efficiency, and adaptability in geological image analysis. The methods evaluated include Otsu thresholding, clustering techniques (K-means, fuzzy C-means), a supervised machine learning approach (Random Forest), and deep learning models (UNet, ResNet152, and DINOv2), using ten binary sandstone datasets and three multi-class calcite datasets. DINOv2 was selected for its promising results in feature extraction and its potential applicability in geoscientific tasks, prompting further assessment of its interpretability and effectiveness in processing CT-scanned rock data. For classification, a non-fine-tuned DINOv2 demonstrates strong performance in classifying rock images, even when the CT-scans are outside its original training set. In segmentation tasks, thresholding and clustering techniques, though computationally efficient, produce subpar results despite preprocessing efforts. In contrast, supervised methods achieve better performance. While deep learning methods demand greater computational resources, they require minimal intervention and offer superior generalization. A LoRA fine-tuned DINOv2, in particular, excels in out-of-distribution segmentation and outperforms other methods in multi-class tasks, even with limited data. Notably, the segmentation masks generated by DINOv2 often appear more accurate than the original targets, based on visual inspection.
- Abstract(参考訳): コンピュータビジョンの最近の進歩は、画像解析タスクを大幅に改善した。
しかし、ディープラーニングモデルは、ドメイン固有のデータが不足している地球科学のような、トレーニングディストリビューション外のドメインに適用する場合に苦労することが多い。
本研究では, 岩石試料のCTスキャン画像の分類, セグメンテーション, 解釈可能性について検討し, 現代のコンピュータビジョン技術の地質学的タスクへの応用に焦点をあてる。
地質画像解析において, その有効性, 効率, 適応性を評価するために, セグメンテーション法の比較を行った。
評価された手法には,10のバイナリ砂岩データセットと3つのマルチクラスカルサイトデータセットを使用した,大津しきい値設定,クラスタリング技術(K平均,ファジィC平均),教師付き機械学習アプローチ(ランダムフォレスト),ディープラーニングモデル(UNet,ResNet152,DINOv2)などがある。
DINOv2は、特徴抽出の有望な結果と、地質学的タスクの潜在的な適用性から選ばれ、CTスキャンした岩石データの解釈可能性と有効性をさらに評価した。
分類において、非微調整のDINOv2は、CTスキャンが元のトレーニングセット外であっても、岩石画像の分類において強い性能を示す。
セグメンテーションタスクでは、しきい値処理とクラスタリング技術は計算効率が良いが、前処理の努力にもかかわらずサブパー結果を生成する。
対照的に、教師付き手法はより良い性能を達成する。
深層学習法は計算資源を多く要求するが、最小限の介入が必要であり、より優れた一般化を提供する。
特に、LORAで微調整されたDINOv2は、分配外セグメンテーションで優れ、限られたデータであっても、マルチクラスのタスクで他のメソッドよりも優れている。
特に、DINOv2によって生成されたセグメンテーションマスクは、視覚検査に基づいて、元のターゲットよりも正確なように見えることが多い。
関連論文リスト
- Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Comparative Evaluation of Traditional and Deep Learning-Based
Segmentation Methods for Spoil Pile Delineation Using UAV Images [0.0]
本研究は,様々なセグメンテーションアプローチ,特にカラーベースおよびモルフォロジーに基づく手法を洗練・調整する。
本研究の目的は, 鉱業環境の文脈における特性化を損なうため, オブジェクトベース分析の手法を改良し, 評価することである。
評価された多様なセグメンテーション手法のうち,形態素に基づく深層学習セグメンテーション手法であるセグメンション・アシング・モデル(SAM)は,他の手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-02-01T02:54:49Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Inducing Gaussian Process Networks [80.40892394020797]
本稿では,特徴空間と誘導点を同時に学習するシンプルなフレームワークであるGaussian Process Network (IGN)を提案する。
特に誘導点は特徴空間で直接学習され、複雑な構造化領域のシームレスな表現を可能にする。
実世界のデータセットに対する実験結果から,IGNは最先端の手法よりも大幅に進歩していることを示す。
論文 参考訳(メタデータ) (2022-04-21T05:27:09Z) - Learning Fuzzy Clustering for SPECT/CT Segmentation via Convolutional
Neural Networks [5.3123694982708365]
QBSPECT(Quantitative bone single-photon emission Computed Tomography)は、平面骨シンチグラフィよりも骨転移をより定量的に評価する可能性を秘めています。
解剖学的領域-関心(ROI)のセグメント化は、まだ専門家による手動の記述に大きく依存しています。
本研究では,QBSPECT画像を病変,骨,背景に分割するための高速かつ堅牢な自動分割法を提案する。
論文 参考訳(メタデータ) (2021-04-17T19:03:52Z) - Detecting micro fractures with X-ray computed tomography [4.855026133182103]
XRCTを用いたカララ大理石のフラクチャーネットワークの可視化に成功したデータ集合について述べる。
従来の3手法と機械学習に基づく2手法を評価した。
2次元U-netモデルの出力は、機械学習に基づくセグメンテーション手法の1つである。
論文 参考訳(メタデータ) (2021-03-23T20:20:24Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z) - Dense Contrastive Learning for Self-Supervised Visual Pre-Training [102.15325936477362]
入力画像の2つのビュー間の画素レベルでの差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分)を最適化することにより自己教師学習を実現する。
ベースライン法であるMoCo-v2と比較すると,計算オーバーヘッドは1%遅かった。
論文 参考訳(メタデータ) (2020-11-18T08:42:32Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Supervision and Source Domain Impact on Representation Learning: A
Histopathology Case Study [6.762603053858596]
本研究では,表現学習領域におけるディープニューラルネットワークの性能と三重項損失について検討した。
病理画像の類似性や相違性について検討し,教師なし,半教師なし,教師付き学習との違いを比較した。
学習した表現を2つの異なる病理データセットに適用し,高い精度と一般化を実現した。
論文 参考訳(メタデータ) (2020-05-10T21:27:38Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。