論文の概要: StreetSurfaceVis: a dataset of crowdsourced street-level imagery annotated by road surface type and quality
- arxiv url: http://arxiv.org/abs/2407.21454v3
- Date: Wed, 25 Sep 2024 12:24:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 13:51:33.583972
- Title: StreetSurfaceVis: a dataset of crowdsourced street-level imagery annotated by road surface type and quality
- Title(参考訳): StreetSurfaceVis:道路面のタイプと品質を付加したクラウドソーシングストリートレベルの画像データセット
- Authors: Alexandra Kapp, Edith Hoffmann, Esther Weigmann, Helena Mihaljević,
- Abstract要約: ドイツから9,122枚のストリートレベルの画像からなる新しいデータセットであるStreetSurfaceVisを紹介した。
多様な画像ソース間で高い精度を維持する頑健なモデルを実現することを目的としている。
- 参考スコア(独自算出の注目度): 41.94295877935867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Road unevenness significantly impacts the safety and comfort of traffic participants, especially vulnerable groups such as cyclists and wheelchair users. To train models for comprehensive road surface assessments, we introduce StreetSurfaceVis, a novel dataset comprising 9,122 street-level images mostly from Germany collected from a crowdsourcing platform and manually annotated by road surface type and quality. By crafting a heterogeneous dataset, we aim to enable robust models that maintain high accuracy across diverse image sources. As the frequency distribution of road surface types and qualities is highly imbalanced, we propose a sampling strategy incorporating various external label prediction resources to ensure sufficient images per class while reducing manual annotation. More precisely, we estimate the impact of (1) enriching the image data with OpenStreetMap tags, (2) iterative training and application of a custom surface type classification model, (3) amplifying underrepresented classes through prompt-based classification with GPT-4o and (4) similarity search using image embeddings. Combining these strategies effectively reduces manual annotation workload while ensuring sufficient class representation.
- Abstract(参考訳): 道路の不均一性は、交通参加者の安全と快適性、特にサイクリストや車椅子利用者のような脆弱なグループに大きな影響を及ぼす。
クラウドソーシングプラットフォームから収集した9,122枚の街路レベルの画像からなる新しいデータセットであるStreetSurfaceVisを導入し,道路表面のタイプと品質を手動でアノテートした。
不均一なデータセットを構築することにより、多様な画像ソース間で高い精度を維持する堅牢なモデルの実現を目指している。
道路表面のタイプや品質の頻度分布は極めて不均衡であるので,様々な外部ラベル予測資源を取り入れて,手動アノテーションを低減しつつ,クラスごとの十分な画像を確保するサンプリング戦略を提案する。
より正確には,(1)OpenStreetMapタグによる画像データの充実,(2)カスタムサーフェス型分類モデルの反復的訓練と適用,(3)GPT-4oによる即時分類による未表現クラス増幅,(4)画像埋め込みを用いた類似性検索の影響を推定する。
これらの戦略を組み合わせることで、十分なクラス表現を確保しながら、手動のアノテーションの作業量を効果的に削減できる。
関連論文リスト
- AIDOVECL: AI-generated Dataset of Outpainted Vehicles for Eye-level Classification and Localization [0.0]
この研究は、注釈付きデータ不足の問題に対処するために、アウトペイントを活用する新しいアプローチを導入している。
この技術は、自動運転、都市計画、環境モニタリングにおいて特に困難な課題に応用する。
塗装された車両による増強は、全体のパフォーマンス指標を最大8%改善し、未表現クラスの予測を最大20%向上させる。
論文 参考訳(メタデータ) (2024-10-31T16:46:23Z) - SurfaceAI: Automated creation of cohesive road surface quality datasets based on open street-level imagery [41.94295877935867]
SurfaceAIは、路面タイプと品質に関する総合的なジオレファレンスデータセットを、公開可能なストリートレベルの画像から生成する。
モチベーションは、道路不均一が交通参加者の安全と快適性に与える影響に起因している。
論文 参考訳(メタデータ) (2024-09-27T17:13:25Z) - ImPoster: Text and Frequency Guidance for Subject Driven Action Personalization using Diffusion Models [55.43801602995778]
提案するImPosterは,「運転」動作を行う「ソース」対象のターゲット画像を生成する新しいアルゴリズムである。
私たちのアプローチは完全に教師なしで、キーポイントやポーズといった追加のアノテーションへのアクセスは不要です。
論文 参考訳(メタデータ) (2024-09-24T01:25:19Z) - Towards Zero-Shot Annotation of the Built Environment with Vision-Language Models (Vision Paper) [8.071443524030302]
適切な都市交通アプリケーションは、構築された環境の高忠実度デジタル表現を必要とする。
衛星画像から多様な都市特徴を注釈付けするためのメカニズムとして視覚言語モデルを考える。
我々は、最先端のビジョン言語モデルとプロンプト戦略の変種を組み合わせた概念実証を実証する。
論文 参考訳(メタデータ) (2024-08-01T21:50:23Z) - Improving classification of road surface conditions via road area extraction and contrastive learning [2.9109581496560044]
画像中の道路面に下流分類モデルのみを集中させるセグメンテーションモデルを導入する。
公開RTKデータセットに対する実験により,提案手法の大幅な改善が示された。
論文 参考訳(メタデータ) (2024-07-19T15:43:16Z) - NeRO: Neural Road Surface Reconstruction [15.99050337416157]
本稿では,道路路面を設計するためのMLP(Multi-Layer Perceptrons)フレームワークを設計し,世界座標x,yとして入力し,高さ,色,意味情報として出力する。
本手法の有効性は,車載カメラのポーズ,LiDAR点雲,SFM点雲などの道路高度源との互換性,スパースラベルやノイズセマンティック予測などの画像のセマンティックノイズに対する堅牢性,高速なトレーニング速度などにより実証される。
論文 参考訳(メタデータ) (2024-05-17T05:41:45Z) - Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - Few-Shot Learning with Part Discovery and Augmentation from Unlabeled
Images [79.34600869202373]
帰納的バイアスは、ラベルなし画像の平坦な集合から学習でき、目に見えるクラスと目に見えないクラスの間で伝達可能な表現としてインスタンス化されることを示す。
具体的には、トランスファー可能な表現を学習するための、新しいパートベース自己教師型表現学習手法を提案する。
我々の手法は印象的な結果をもたらし、それまでの最高の教師なし手法を7.74%、9.24%上回った。
論文 参考訳(メタデータ) (2021-05-25T12:22:11Z) - Data-driven Meta-set Based Fine-Grained Visual Classification [61.083706396575295]
本稿では, ノイズの多いWeb画像に対して, 微粒化認識のためのデータ駆動型メタセットベースアプローチを提案する。
具体的には、少量のクリーンなメタセットでガイドされ、メタラーニング方式で選択ネットを訓練し、分布内および分布外ノイズ画像の識別を行う。
論文 参考訳(メタデータ) (2020-08-06T03:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。