論文の概要: Impact of LiDAR visualisations on semantic segmentation of archaeological objects
- arxiv url: http://arxiv.org/abs/2404.05512v1
- Date: Mon, 8 Apr 2024 13:35:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 14:15:19.837588
- Title: Impact of LiDAR visualisations on semantic segmentation of archaeological objects
- Title(参考訳): 考古学的対象のセマンティックセグメンテーションに及ぼすLiDAR可視化の影響
- Authors: Raveerat Jaturapitpornchai, Giulio Poggi, Gregory Sech, Ziga Kokalj, Marco Fiorucci, Arianna Traviglia,
- Abstract要約: 本稿では、総合的なテストフレームワークを通じて、可視化がディープラーニングのパフォーマンスに与える影響について検討する。
実験結果から,適切な視覚化の選択がパフォーマンスに最大8%の影響を及ぼすことが明らかとなった。
観察されたパフォーマンスの変化は、異なるモデル構成に対して最大25%まで到達し、慎重にモデル構成を選択することの重要性を浮き彫りにする。
- 参考スコア(独自算出の注目度): 1.1435139523855764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning methods in LiDAR-based archaeological research often leverage visualisation techniques derived from Digital Elevation Models to enhance characteristics of archaeological objects present in the images. This paper investigates the impact of visualisations on deep learning performance through a comprehensive testing framework. The study involves the use of eight semantic segmentation models to evaluate seven diverse visualisations across two study areas, encompassing five archaeological classes. Experimental results reveal that the choice of appropriate visualisations can influence performance by up to 8%. Yet, pinpointing one visualisation that outperforms the others in segmenting all archaeological classes proves challenging. The observed performance variation, reaching up to 25% across different model configurations, underscores the importance of thoughtfully selecting model configurations and LiDAR visualisations for successfully segmenting archaeological objects.
- Abstract(参考訳): LiDARに基づく考古学研究における深層学習手法は、しばしばデジタル標高モデルから派生した可視化技術を活用して、画像に存在する考古学的対象の特徴を高める。
本稿では、総合的なテストフレームワークを通じて、可視化がディープラーニングのパフォーマンスに与える影響について検討する。
この研究は、2つの研究領域にわたる7つの多様な視覚化を評価するために8つのセマンティックセグメンテーションモデルを使用しており、5つの考古学的クラスを含んでいる。
実験結果から,適切な視覚化の選択がパフォーマンスに最大8%の影響を及ぼすことが明らかとなった。
しかし、全ての考古学的なクラスを区分する上で、他のクラスよりも優れている1つの視覚化をピンポイントで示すことは、難しい。
観測された性能の変化は、異なるモデル構成に対して最大25%まで到達し、考古学的オブジェクトのセグメンテーションに成功するためのモデル構成とLiDAR視覚化を慎重に選択することの重要性を浮き彫りにしている。
関連論文リスト
- Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models [24.579822095003685]
下流視覚質問応答(VQA)における表現学習に関する実証的研究を行った。
我々はOCモデルと代替アプローチの利点とトレードオフを徹底的に検討する。
論文 参考訳(メタデータ) (2024-07-22T12:26:08Z) - Semantic-Based Active Perception for Humanoid Visual Tasks with Foveal Sensors [49.99728312519117]
この研究の目的は、最近の意味に基づくアクティブな知覚モデルが、人間が定期的に行う視覚的なタスクをいかに正確に達成できるかを確立することである。
このモデルは、現在のオブジェクト検出器が多数のオブジェクトクラスをローカライズし、分類し、複数の固定にまたがるシーンのセマンティック記述を更新する能力を利用する。
シーン探索の課題では、セマンティック・ベースの手法は従来のサリエンシ・ベース・モデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T18:15:57Z) - Unveiling Ancient Maya Settlements Using Aerial LiDAR Image Segmentation [0.5261718469769447]
本稿では,近年の深層学習(DL)の進歩が,空中LiDAR画像の考古学的構造を正確にセグメント化するための効率的なソリューションであることを示す。
提案手法は、トレーニングされたYOLOv8ネットワークを生成するために、生のLiDARデータの新しい前処理とデータセット拡張手法を使用する。
その結果,プラットフォームでは0.842,既存手法では0.809であった。
論文 参考訳(メタデータ) (2024-03-09T02:59:48Z) - Impacts of Color and Texture Distortions on Earth Observation Data in Deep Learning [5.128534415575421]
土地被覆分類と変化検出はリモートセンシングと地球観測の重要な応用である。
入力EOデータの異なる視覚特性がモデルの予測に与える影響はよく分かっていない。
ランドカバー分類のための複数の最先端セグメンテーションネットワークを用いて実験を行い、色歪みよりも一般的にテクスチャに敏感であることを示す。
論文 参考訳(メタデータ) (2024-03-07T10:25:23Z) - Masked Modeling for Self-supervised Representation Learning on Vision
and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。
我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文 参考訳(メタデータ) (2023-12-31T12:03:21Z) - Unveiling Backbone Effects in CLIP: Exploring Representational Synergies
and Variances [49.631908848868505]
コントラスト言語-画像事前学習(CLIP)は画像表現学習において顕著な手法である。
各種ニューラルアーキテクチャにおけるCLIP性能の違いについて検討する。
我々は、複数のバックボーンからの予測を組み合わせるためのシンプルで効果的なアプローチを提案し、最大6.34%のパフォーマンス向上につながった。
論文 参考訳(メタデータ) (2023-12-22T03:01:41Z) - Systematic Analysis of COVID-19 Ontologies [5.286727853896068]
この研究は、関連する文献の体系的なレビューを伴って、二重段階のアプローチによって実施される。
新型コロナウイルスのオントロジー(CovOs)を24種選択し,検討した。
METHONTOLOGYアプローチは、しばしばアプリケーションベースまたはデータ中心の評価手法と組み合わせて、好ましい設計手法として現れる。
論文 参考訳(メタデータ) (2023-09-15T18:17:01Z) - The Impact of Different Backbone Architecture on Autonomous Vehicle
Dataset [120.08736654413637]
バックボーンアーキテクチャによって抽出された特徴の質は、全体的な検出性能に大きな影響を与える可能性がある。
本研究は,KITTI,NuScenes,BDDの3つの自律走行車データセットを評価し,対象検出タスクにおける異なるバックボーンアーキテクチャの性能を比較した。
論文 参考訳(メタデータ) (2023-09-15T17:32:15Z) - Transfer Learning of Semantic Segmentation Methods for Identifying
Buried Archaeological Structures on LiDAR Data [1.2116854758481392]
本稿では、2つのLiDARデータセット上の2つのセマンティックセグメンテーションディープニューラルネットワークを用いて、様々な伝達学習構成の性能を比較する。
実験結果から, 考古学における伝達学習に基づくアプローチは, 性能改善につながる可能性が示唆された。
論文 参考訳(メタデータ) (2023-07-07T11:00:44Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。