論文の概要: STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation
- arxiv url: http://arxiv.org/abs/2603.09175v2
- Date: Thu, 12 Mar 2026 07:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.142986
- Title: STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation
- Title(参考訳): STONE Dataset:オフロードロボットナビゲーションのためのスケーラブルなマルチモーダルサラウンドビュー3Dトラバーサビリティデータセット
- Authors: Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won Choi,
- Abstract要約: STONEはオフロードナビゲーションのための大規模マルチモーダルデータセットである。
データセットは昼夜、草原、農地、建設現場、湖など幅広い環境と環境をカバーしている。
ボクセルレベルの3次元トレーサビリティ予測のベンチマークを確立し,単一モードとマルチモードの両方で強力なベースラインを提供する。
- 参考スコア(独自算出の注目度): 20.183016318362558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable off-road navigation requires accurate estimation of traversable regions and robust perception under diverse terrain and sensing conditions. However, existing datasets lack both scalability and multi-modality, which limits progress in 3D traversability prediction. In this work, we introduce STONE, a large-scale multi-modal dataset for off-road navigation. STONE provides (1) trajectory-guided 3D traversability maps generated by a fully automated, annotation-free pipeline, and (2) comprehensive surround-view sensing with synchronized 128-channel LiDAR, six RGB cameras, and three 4D imaging radars. The dataset covers a wide range of environments and conditions, including day and night, grasslands, farmlands, construction sites, and lakes. Our auto-labeling pipeline reconstructs dense terrain surfaces from LiDAR scans, extracts geometric attributes such as slope, elevation, and roughness, and assigns traversability labels beyond the robot's trajectory using a Mahalanobis-distance-based criterion. This design enables scalable, geometry-aware ground-truth construction without manual annotation. Finally, we establish a benchmark for voxel-level 3D traversability prediction and provide strong baselines under both single-modal and multi-modal settings. STONE is available at: https://konyul.github.io/STONE-dataset/
- Abstract(参考訳): 信頼性の高いオフロードナビゲーションは、多様な地形やセンシング条件下での、正確な走行可能な地域の推定と堅牢な認識を必要とする。
しかし、既存のデータセットにはスケーラビリティとマルチモダリティが欠如しており、3Dトラバーサビリティ予測の進歩が制限されている。
本稿では,オフロードナビゲーションのための大規模マルチモーダルデータセットSTONEを紹介する。
STONEは,(1)完全に自動化された無アノテーションパイプラインによって生成された軌道誘導型3Dトレーサビリティマップ,(2)同期128チャンネルのLiDAR,6台のRGBカメラ,および3台の4Dイメージングレーダを用いた包括的サラウンドビューセンシングを提供する。
データセットは昼夜、草原、農地、建設現場、湖など幅広い環境と環境をカバーしている。
我々の自動標識パイプラインは、LiDARスキャンから密度の高い地形表面を再構成し、傾斜、標高、粗さなどの幾何学的特性を抽出し、マハラノビス距離に基づく基準を用いて、ロボットの軌道を越えてトラバーサビリティラベルを割り当てる。
この設計により、手動のアノテーションを使わずに、スケーラブルで幾何対応の地上構造の構築が可能になる。
最後に, ボクセルレベルの3次元トレーサビリティ予測のベンチマークを構築し, 単一モードとマルチモードの両方で強力なベースラインを提供する。
https://konyul.github.io/STONE-dataset/
関連論文リスト
- RadioGen3D: 3D Radio Map Generation via Adversarial Learning on Large-Scale Synthetic Data [62.63849426834315]
将来の6Gおよび低高度ネットワークにおける効率的な無線資源管理には,無線地図が不可欠である。
ディープ・ラーニング(DL)技術は、無線地図推定における従来のレイトレーシングに代わる効果的な代替手段として登場した。
提案するRadioGen3Dフレームワークは,本質的な3次元信号伝搬特性とアンテナ偏光効果を捉える。
論文 参考訳(メタデータ) (2026-02-21T07:50:05Z) - GaussRender: Learning 3D Occupancy with Gaussian Rendering [86.89653628311565]
GaussRenderは、投影的一貫性を強制することによって3D占有学習を改善するモジュールである。
提案手法は,不整合な2次元プロジェクションを生成する3次元構成をペナライズすることにより,より一貫性のある3次元構造を実現する。
論文 参考訳(メタデータ) (2025-02-07T16:07:51Z) - 3DTTNet: Multimodal Fusion-Based 3D Traversable Terrain Modeling for Off-Road Environments [10.521569910467072]
オフロード環境は、自動運転車にとって重要な課題である。
本稿では,セマンティックシーンの完了によって,横断可能な領域認識を実現する。
3DTTNetと呼ばれる新しいマルチモーダル手法が提案されている。
論文 参考訳(メタデータ) (2024-12-11T08:36:36Z) - M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and Multispectral Data [1.4053129774629076]
M3LEOはマルチモーダルでマルチラベルの地球観測データセットである。
6つの地理的領域から約17M 4x4 kmのデータチップにまたがる。
論文 参考訳(メタデータ) (2024-06-06T16:30:41Z) - Volumetric Environment Representation for Vision-Language Navigation [66.04379819772764]
視覚言語ナビゲーション(VLN)は、視覚的な観察と自然言語の指示に基づいて、エージェントが3D環境をナビゲートする必要がある。
本研究では,物理世界を3次元構造細胞にボクセル化するボリューム環境表現(VER)を提案する。
VERは3D占有率、3D部屋レイアウト、および3Dバウンディングボックスを共同で予測する。
論文 参考訳(メタデータ) (2024-03-21T06:14:46Z) - VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking [78.25819070166351]
完全スパース3次元物体検出のためのVoxelNextを提案する。
私たちの中核となる洞察は、手作りのプロキシに頼ることなく、スパースボクセル機能に基づいてオブジェクトを直接予測することです。
私たちの強力なスパース畳み込みネットワークVoxelNeXtは、voxelの機能を通して3Dオブジェクトを検出し、追跡します。
論文 参考訳(メタデータ) (2023-03-20T17:40:44Z) - IDD-3D: Indian Driving Dataset for 3D Unstructured Road Scenes [79.18349050238413]
デプロイ可能なディープラーニングアーキテクチャの準備とトレーニングには、さまざまなトラフィックシナリオに適したモデルが必要である。
インドなどいくつかの発展途上国で見られる非構造的で複雑な運転レイアウトは、これらのモデルに挑戦している。
我々は、複数のカメラと12kの注釈付き駆動LiDARフレームを備えたLiDARセンサーのマルチモーダルデータからなる新しいデータセットIDD-3Dを構築した。
論文 参考訳(メタデータ) (2022-10-23T23:03:17Z) - Monocular Road Planar Parallax Estimation [25.36368935789501]
乾燥可能な表面および周囲環境の3次元構造を推定することは、補助的かつ自律的な運転にとって重要な課題である。
単眼画像からの3Dセンシングのための新しいディープニューラルネットワークであるRoad Planar Parallax Attention Network (RPANet)を提案する。
RPANetは、路面のホモグラフィに整列した一対の画像を入力として取り、3D再構成のための$gamma$mapを出力する。
論文 参考訳(メタデータ) (2021-11-22T10:03:41Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - RELLIS-3D Dataset: Data, Benchmarks and Analysis [16.803548871633957]
RELLIS-3Dはオフロード環境で収集されたマルチモーダルデータセットである。
データはテキサスA&M大学のRellis Campusで収集されました。
論文 参考訳(メタデータ) (2020-11-17T18:28:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。