Fugu-MT 論文翻訳(概要): Viking Hill Dataset: A Lidar-Radar-Camera Dataset for Detection and Segmentation in Forest Scenes

論文の概要: Viking Hill Dataset: A Lidar-Radar-Camera Dataset for Detection and Segmentation in Forest Scenes

arxiv url: http://arxiv.org/abs/2606.19154v1
Date: Wed, 17 Jun 2026 14:58:00 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-18 17:16:51.22399
Title: Viking Hill Dataset: A Lidar-Radar-Camera Dataset for Detection and Segmentation in Forest Scenes
Title（参考訳）: バイキングヒル・データセット:森林景観の検知とセグメンテーションのためのライダー・レーダー・カメラ・データセット
Authors: Vladimír Kubelka, Oleksandr Kotlyar, Unal Artan, Martin Magnusson,
Abstract要約: 我々は,高分解能FMCWイメージングレーダ,ライダー,RGBカメラ,IMU,RTK-GNSSを備えた移動ロボットによって収集されたマルチセンサフォレストデータセットを紹介する。我々はMinkowskiUNetを用いたレーダーとライダー点雲のセマンティックセグメンテーションのためのベースライン結果を提供する。クロスモダリティ解析ではライダーとレーダトランクのセグメンテーションをRGB検出モデルと比較し、直径成層評価により、トランクセグメンテーションの品質が木の大きさによってどのように変化するかを明らかにする。
参考スコア（独自算出の注目度）: 19.50568056035419
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Autonomous robots operating under forest canopies need robust perception of trees and surrounding vegetation across varying seasonal conditions. Existing forestry datasets provide lidar or camera data with per-tree annotations, but none include co-registered 4D imaging radar -- a modality of growing interest for its resilience to visual degradation, surface contamination, and vegetation occlusion. We introduce a multi-sensor forest dataset collected by a mobile robot equipped with a high-resolution FMCW imaging radar, lidar, RGB camera, IMU, and RTK-GNSS. The site was recorded in two sessions under contrasting vegetation states, and 3D cuboid annotations -- including per-tree diameter estimates -- provide shared semantic labels across all three perception modalities. Furthermore, we provide baseline results for semantic segmentation of the radar and lidar point clouds using MinkowskiUNet. Radar achieves IoU scores competitive with lidar for dominant classes (ground 91%, canopy 86%) while lagging on geometrically fine structures such as tree trunks (56% vs. 74%). A cross-modality analysis further compares lidar and radar trunk segmentation against an RGB detection model, and a diameter-stratified evaluation reveals how trunk segmentation quality varies with tree size. Beyond segmentation, the co-registered multi-modal data and RTK-GNSS-aided reference positioning support research in mapping, localization, and sensor fusion under canopy. The dataset and annotation tools are publicly available.
Abstract（参考訳）: 森林キャノピーの下で動く自律ロボットは、季節によって異なる木や周囲の植生をしっかりと認識する必要がある。既存の森林データセットは、木ごとのアノテーションでライダーやカメラのデータを提供するが、登録された4Dイメージングレーダーは含まれていない。我々は,高分解能FMCWイメージングレーダ,ライダー,RGBカメラ,IMU,RTK-GNSSを備えた移動ロボットによって収集されたマルチセンサフォレストデータセットを紹介する。このサイトは対照的な植生状態の下で2つのセッションで記録されており、木ごとの直径推定を含む3次元の立方体アノテーションは、3つの知覚の全てのモードで共有セマンティックラベルを提供する。さらに,MinkowskiUNetを用いたレーダーおよびライダー点雲のセマンティックセグメンテーションのためのベースライン結果を提供する。レーダーは、木幹のような幾何学的に微細な構造物(56%対74%)に遅延しながら、支配階級のライダーと競合するIoUスコア(グラウンド91%、キャノピー86%)を達成している。クロスモダリティ解析ではライダーとレーダトランクのセグメンテーションをRGB検出モデルと比較し、直径成層評価により、トランクセグメンテーションの品質が木の大きさによってどのように変化するかを明らかにする。セグメンテーション以外にも、マルチモーダルデータとRTK-GNSSを共登録した参照位置決めは、マッピング、ローカライゼーション、センサー融合の研究を支援する。データセットとアノテーションツールが公開されている。

関連論文リスト

TransBridge: Boost 3D Object Detection by Scene-Level Completion with Transformer Decoder [66.22997415145467]
本稿では,スパース領域における検出機能を改善する共同補完・検出フレームワークを提案する。具体的には,トランスブリッジ(TransBridge)を提案する。トランスブリッジ(TransBridge)はトランスフォーマーをベースとした新しいアップサンプリングブロックである。その結果,本フレームワークは,各手法の平均精度(mAP)が0.7から1.5の範囲で,エンドツーエンドの3Dオブジェクト検出を一貫して改善していることがわかった。
論文参考訳（メタデータ） (2025-12-12T00:08:03Z)
RS3DBench: A Comprehensive Benchmark for 3D Spatial Perception in Remote Sensing [71.75704516333394]
本稿では、RS3DBenchと呼ばれるリモートセンシング画像の3次元理解のためのビジュアルベンチマークを提案する。このデータセットは、54,951対のリモートセンシング画像とピクセルレベルの一致した深度マップを含んでいる。安定拡散から導かれるリモートセンシング深度推定モデルを導入し,そのマルチモーダル融合機能を利用する。
論文参考訳（メタデータ） (2025-09-23T11:20:51Z)
Cross3DReg: Towards a Large-scale Real-world Cross-source Point Cloud Registration Benchmark [57.42211080221526]
異なるセンサーからのポイントクラウドデータを整列することを目的とした、クロスソースのポイントクラウド登録は、3Dビジョンの基本的なタスクである。ディープ登録モデルをトレーニングするための大規模な実世界のデータセットが公開されていないことや、複数のセンサーによってキャプチャされたポイントクラウド固有の違いが課題となっている。現在世界最大のマルチモーダル・クロスソース・クラウド登録データセットであるCross3DRegを構築している。クロスソース・ポイント・クラウド機能の整合性を高めるために,ビジュアル・ジオメトリ・アテンションガイド付きマッチングモジュールを提案する。
論文参考訳（メタデータ） (2025-09-08T09:01:13Z)
Cross-Spectral Body Recognition with Side Information Embedding: Benchmarks on LLCM and Analyzing Range-Induced Occlusions on IJB-MDF [51.36007967653781]
ViT(Vision Transformers)は、顔や身体の認識を含む幅広い生体計測タスクにおいて、印象的なパフォーマンスを誇示している。本研究では、視認性(VIS)画像に事前訓練されたVTモデルを、クロススペクトル体認識の難しい問題に適用する。このアイデアに基づいて、我々はSide Information Embedding (SIE)を統合し、ドメインとカメラ情報のエンコーディングの影響を調べ、スペクトル間マッチングを強化する。驚くべきことに、我々の結果は、ドメイン情報を明示的に組み込むことなく、カメラ情報のみを符号化することで、LLCMデータセット上で最先端のパフォーマンスが得られることを示している。
論文参考訳（メタデータ） (2025-06-10T16:20:52Z)
Tree Species Classification using Machine Learning and 3D Tomographic SAR -- a case study in Northern Europe [0.0]
樹木種の分類は、自然保護、森林在庫、森林管理、絶滅危惧種の保護において重要な役割を担っている。本研究では,SLC(Single-look Complex)画像のスタックを利用した3次元トモグラフィーデータセットであるTtomoSenseを用いた。
論文参考訳（メタデータ） (2024-11-19T22:25:26Z)
GET-UP: GEomeTric-aware Depth Estimation with Radar Points UPsampling [7.90238039959534]
既存のアルゴリズムは3Dポイントを画像面に投影してレーダデータを処理し、画素レベルの特徴抽出を行う。レーダデータから2次元情報と3次元情報を交換・集約するために,注目度の高いグラフニューラルネットワーク(GNN)を利用するGET-UPを提案する。提案したGET-UPをnuScenesデータセット上でベンチマークし,従来最高のパフォーマンスモデルよりも15.3%,14.7%改善した。
論文参考訳（メタデータ） (2024-09-02T14:15:09Z)
Multimodal Dataset for Localization, Mapping and Crop Monitoring in Citrus Tree Farms [7.666806082770633]
このデータセットは、深度情報を備えたステレオRGB画像と、モノクロ、近赤外線、熱画像を提供する。データセットは、キツネの3つの畑で収集された7つの配列から構成される。総運転時間は1.7時間、走行距離は7.5km、データ量は1.3TBである。
論文参考訳（メタデータ） (2023-09-27T00:30:08Z)
Multimodal Dataset from Harsh Sub-Terranean Environment with Aerosol Particles for Frontier Exploration [55.41644538483948]
本稿では, エアロゾル粒子を用いた過酷で非構造的な地下環境からのマルチモーダルデータセットを提案する。ロボットオペレーティング・システム(ROS)フォーマットのすべてのオンボードセンサーから、同期された生データ計測を含んでいる。本研究の焦点は、時間的・空間的なデータの多様性を捉えることだけでなく、取得したデータに厳しい条件が及ぼす影響を示すことである。
論文参考訳（メタデータ） (2023-04-27T20:21:18Z)
Vision Transformers, a new approach for high-resolution and large-scale mapping of canopy heights [50.52704854147297]
分類(離散化)と連続損失関数を最適化した新しい視覚変換器(ViT)モデルを提案する。このモデルは、従来使用されていた畳み込みベースのアプローチ(ConvNet)よりも、連続損失関数のみで最適化された精度が向上する。
論文参考訳（メタデータ） (2023-04-22T22:39:03Z)
Individual Tree Detection and Crown Delineation with 3D Information from Multi-view Satellite Images [5.185018253122575]
森林在庫管理において,個々の樹冠検出とクラウンデライン化(ITDD)が重要である。マルチビュー衛星データから導出した直視・デジタル表面モデル(DSM)を用いたITDD手法を提案する。 3つの代表地域における手作業による植樹試験の結果,有望な結果が得られた。
論文参考訳（メタデータ） (2021-07-01T16:28:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。