論文の概要: CAVERS: Multimodal SLAM Data from a Natural Karstic Cave with Ground Truth Motion Capture
- arxiv url: http://arxiv.org/abs/2604.15052v1
- Date: Thu, 16 Apr 2026 14:19:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.943119
- Title: CAVERS: Multimodal SLAM Data from a Natural Karstic Cave with Ground Truth Motion Capture
- Title(参考訳): CAVERS: 地上運動キャプチャーを備えた自然カルスケーブからのマルチモーダルSLAMデータ
- Authors: Giacomo Franchini, David Rodríguez-Martínez, Alfonso Martínez-Petersen, C. J. Pérez-del-Pulgar, Marcello Chiaberge,
- Abstract要約: このデータセットは、合計で約335GBのレコードデータからなる24のシーケンスで構成されている。
センサースイートには、Intel RealSense D435i RGB-D-Iカメラ、Optris PI640i近赤外線サーマルカメラ、およびVelodyne VER-16 LiDARが組み込まれている。
ほとんどのシーケンスにおいて、m-精度の6-DoFグラウンド真理のポーズと120Hzの速度は、洞窟内に直接設置されたオプタラックモーションキャプチャーシステムによって提供される。
- 参考スコア(独自算出の注目度): 1.017815799712437
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous robots operating in natural karstic caves face perception and navigation challenges that are qualitatively distinct from those encountered in mines or tunnels: irregular geometry, reflective wet surfaces, near-zero ambient light, and complex branching passages. Yet publicly available datasets targeting this environment remain scarce and offer limited sensing modalities and environmental diversity. We present CAVERS, a multimodal dataset acquired in two structurally distinct rooms of Cueva de la Victoria, Málaga, Spain, comprising 24 sequences totaling approximately 335 GB of recorded data. The sensor suite combines an Intel RealSense D435i RGB-D-I camera, an Optris PI640i near-IR thermal camera, and a Velodyne VLP-16 LiDAR, operated both handheld and mounted on a wheeled rover under full darkness and artificial illumination. For most of the sequences, mm-accurate 6-DoF ground truth pose and velocity at 120 Hz are provided by an Optirack motion capture system installed directly inside the cave. We benchmark seven state-of-the-art SLAM and odometry algorithms spanning visual, visual-inertial, thermal-inertial, and LiDAR-based pipelines, as well as a 3D reconstruction pipeline, demonstrating the dataset's usability. %The dataset and all supplementary material are publicly available at: https://github.com/spaceuma/cavers.
- Abstract(参考訳): 自然のカルスト洞窟で動く自律ロボットは、不規則な幾何学、反射性湿地表面、近ゼロの環境光、複雑な分岐路など、鉱山やトンネルで遭遇するものと質的に異なる知覚とナビゲーションの課題に直面している。
しかし、この環境をターゲットとした公開データセットは依然として乏しいままであり、限定的なセンシングモダリティと環境多様性を提供する。
スペイン・マラガ州クエバ・デ・ラ・ビクトリアの2つの構造的に異なる部屋から得られたマルチモーダルデータセットであるCAVERSについて,約335GBのデータからなる24のシーケンスについて述べる。
センサースイートには、Intel RealSense D435i RGB-D-Iカメラ、Optris PI640i近赤外線サーマルカメラ、そしてVelodyne VLP-16 LiDARが組み込まれている。
ほとんどのシーケンスにおいて、m-精度の6-DoFグラウンド真理のポーズと120Hzの速度は、洞窟内に直接設置されたオプタラックモーションキャプチャーシステムによって提供される。
我々は、ビジュアル、ビジュアル慣性、サーマル慣性、LiDARベースのパイプラインにまたがる7つの最先端SLAMおよびオドメトリアルゴリズムと、3D再構成パイプラインをベンチマークし、データセットのユーザビリティを実証した。
データセットとすべての追加資料は、https://github.com/spaceuma/cavers.comで公開されている。
関連論文リスト
- DSERT-RoLL: Robust Multi-Modal Perception for Diverse Driving Conditions with Stereo Event-RGB-Thermal Cameras, 4D Radar, and Dual-LiDAR [66.23438033222963]
DSERT-RoLLは、ステレオイベント、RGB、サーマルカメラを4DレーダーとデュアルLiDARと組み合わせた駆動データセットである。
データセットは正確な2Dおよび3Dバウンディングボックスを提供し、トラックIDとエゴ車両のオドメトリーを提供する。
論文 参考訳(メタデータ) (2026-04-04T11:03:16Z) - Boreas Road Trip: A Multi-Sensor Autonomous Driving Dataset on Challenging Roads [9.445873585799813]
Boreas-RTは9つの現実世界のルートで収集された60のシーケンスで構成され、総走行距離は643kmである。
データ収集プラットフォームには、5MPのFLIR Blackfly Sカメラ、360度ナビテックRAS6ドップラー対応回転レーダー、128チャンネルのVelodyne Alpha Prime lidar、Dynaparホイールエンコーダが含まれる。
論文 参考訳(メタデータ) (2026-02-18T20:53:59Z) - Sim2Radar: Toward Bridging the Radar Sim-to-Real Gap with VLM-Guided Scene Reconstruction [2.3510064024442374]
Sim2Radarは、単一ビューのRGBイメージから直接レーダーデータを合成するエンドツーエンドのフレームワークである。
Sim2Radarは、単眼深度推定、セグメンテーション、視覚言語推論を組み合わせることで、素材を意識した3Dシーンを再構築する。
Sim2Radarは、現実世界の屋内シーンで評価され、トランスファーラーニングを通じて下流の3Dレーダー知覚を改善する。
論文 参考訳(メタデータ) (2026-02-10T10:56:47Z) - Collaborating Vision, Depth, and Thermal Signals for Multi-Modal Tracking: Dataset and Algorithm [103.36490810025752]
既存のマルチモーダルオブジェクト追跡アプローチは、主にRGB-DepthやRGB-Thermalのようなデュアルモーダルパラダイムに焦点を当てている。
本研究は、可視RGB、深度(D)、熱赤外(TIR)を含む3つの相補的なモードを利用する、新しいマルチモーダルトラッキングタスクを導入する。
我々はRDTTrackと呼ばれる新しいマルチモーダルトラッカーを提案する。これは、事前訓練されたRGBのみのトラッカーモデルを活用することで、ロバストトラッカーのためのトリモーダル情報を統合する。
論文 参考訳(メタデータ) (2025-09-29T13:05:15Z) - V2X-Radar: A Multi-modal Dataset with 4D Radar for Cooperative Perception [61.58737390490639]
V2X-Radarは、4Dレーダを特徴とする世界初の大規模実世界のマルチモーダルデータセットである。
データセットは20KのLiDARフレーム、40Kのカメライメージ、350Kの注釈付きボックスを含む20Kの4Dレーダデータで構成されている。
様々な研究領域をサポートするために, 協調認識のためのV2X-Radar-C, 路面認識のためのV2X-Radar-I, 単車知覚のためのV2X-Radar-Vを確立した。
論文 参考訳(メタデータ) (2024-11-17T04:59:00Z) - DIDLM: A SLAM Dataset for Difficult Scenarios Featuring Infrared, Depth Cameras, LIDAR, 4D Radar, and Others under Adverse Weather, Low Light Conditions, and Rough Roads [20.600516423425688]
積雪天候,雨天,夜間条件,スピードバンプ,荒地など,困難なシナリオをカバーするマルチセンサデータセットを提案する。
このデータセットには、4Dミリ波レーダー、赤外線カメラ、深度カメラなどの極端な状況に利用されないセンサーと、3D LiDAR、RGBカメラ、GPS、IMUが含まれる。
自律走行と地上ロボットの両方のアプリケーションをサポートし、構造化された地形と半構造化された地形をカバーする信頼性の高いGPS/INS地上真実データを提供する。
論文 参考訳(メタデータ) (2024-04-15T09:49:33Z) - TUM-VIE: The TUM Stereo Visual-Inertial Event Dataset [50.8779574716494]
イベントカメラはバイオインスパイアされた視覚センサーで、ピクセルごとの明るさの変化を測定する。
これらは、低レイテンシ、高ダイナミックレンジ、高時間分解能、低消費電力など、従来のフレームベースのカメラよりも多くの利点を提供する。
イベントカメラを用いた3次元認識・ナビゲーションアルゴリズムの開発を促進するため,TUM-VIEデータセットを提案する。
論文 参考訳(メタデータ) (2021-08-16T19:53:56Z) - PixSet : An Opportunity for 3D Computer Vision to Go Beyond Point Clouds
With a Full-Waveform LiDAR Dataset [0.11726720776908521]
Leddar PixSetは、自動運転研究開発のための新しい公開データセット(dataset.leddartech.com)である。
ピクセットデータセットは、高密度の都市部で記録された97のシーケンスから約29kフレームを含む。
論文 参考訳(メタデータ) (2021-02-24T01:13:17Z) - LIBRE: The Multiple 3D LiDAR Dataset [54.25307983677663]
We present LIBRE: LiDAR Benchmarking and Reference, a first-of-in-kind dataset with 10 different LiDAR sensor。
LIBREは、現在利用可能なLiDARを公平に比較するための手段を提供するために、研究コミュニティに貢献する。
また、既存の自動運転車やロボティクス関連のソフトウェアの改善も促進する。
論文 参考訳(メタデータ) (2020-03-13T06:17:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。