論文の概要: ParkSense: Where Should a Delivery Driver Park? Leveraging Idle AV Compute and Vision-Language Models
- arxiv url: http://arxiv.org/abs/2604.07912v1
- Date: Thu, 09 Apr 2026 07:28:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.766647
- Title: ParkSense: Where Should a Delivery Driver Park? Leveraging Idle AV Compute and Vision-Language Models
- Title(参考訳): ParkSense: 配達ドライバーはどこに駐車すべきか? Idle AV ComputeとVision-Languageモデルを活用する
- Authors: Die Hu, Henan Li,
- Abstract要約: ParkSenseは、アイドル計算を再利用して、事前キャッシュされた衛星とストリートビューの画像上でビジョン・ランゲージ・モデル(VLM)を実行するフレームワークである。
本研究では,HW4クラスのハードウェア上で,量子化された7B VLMが4~8秒で推論を完了することを示し,Delivery-Aware Precision Parking問題を定式化する。
この未調査の自動運転、コンピュータビジョン、ラストマイルロジスティクスの交差点で、5つのオープンな研究方向が特定されている。
- 参考スコア(独自算出の注目度): 3.320066403039784
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finding parking consumes a disproportionate share of food delivery time, yet no system addresses precise parking-spot selection relative to merchant entrances. We propose ParkSense, a framework that repurposes idle compute during low-risk AV states -- queuing at red lights, traffic congestion, parking-lot crawl -- to run a Vision-Language Model (VLM) on pre-cached satellite and street view imagery, identifying entrances and legal parking zones. We formalize the Delivery-Aware Precision Parking (DAPP) problem, show that a quantized 7B VLM completes inference in 4-8 seconds on HW4-class hardware, and estimate annual per-driver income gains of 3,000-8,000 USD in the U.S. Five open research directions are identified at this unexplored intersection of autonomous driving, computer vision, and last-mile logistics.
- Abstract(参考訳): 駐車場を見つけることは、食事の配達時間の不均等なシェアを消費するが、商店の入り口に対する正確な駐車場選択に対処するシステムは存在しない。
低リスクのAV状態においてアイドル計算を再利用するフレームワークであるParkSenseを提案する。このフレームワークは、赤信号、交通渋滞、パーキングロットクロールをキューし、プリキャッシュされた衛星やストリートビューの画像上でビジョン・ランゲージ・モデル(VLM)を実行し、入り口と法的な駐車ゾーンを特定する。
我々は、Delivery-Aware Precision Parking (DAPP) 問題を定式化し、量子化された7B VLMがHW4クラスのハードウェア上で4~8秒で推論を完了し、米国ではドライバー当たりの年間収入が3,000~8,000米ドルと見積もっていることを示す。
関連論文リスト
- RoboSense: Large-scale Dataset and Benchmark for Egocentric Robot Perception and Navigation in Crowded and Unstructured Environments [62.5830455357187]
我々は3種類のセンサー(Camera, LiDAR, Fisheye)をベースとした自我中心型マルチセンサデータ収集プラットフォームを構築した。
大規模なマルチモーダルデータセットであるRoboSenseは、エゴセントリックなロボット知覚を促進するために構築されている。
論文 参考訳(メタデータ) (2024-08-28T03:17:40Z) - Smart Camera Parking System With Auto Parking Spot Detection [1.0512475026060208]
PakStaと呼ばれる新しい手法で駐車場の状態を自動識別する。
本手法はPakLocのオブジェクト検出器を用いて,ビデオフレーム内の駐車場の占有状況を同時に判定する。
提案手法がPKLotデータセットに与える影響は, 人的労働力の94.25%を大幅に削減する結果となった。
論文 参考訳(メタデータ) (2024-07-07T19:00:11Z) - Your Car Tells Me Where You Drove: A Novel Path Inference Attack via CAN Bus and OBD-II Data [57.22545280370174]
On Path Diagnostic - Intrusion & Inference (OPD-II) は物理カーモデルとマップマッチングアルゴリズムを利用した新しい経路推論攻撃である。
我々は4台の異なる車両と41トラックの道路および交通シナリオに対する攻撃を実行した。
論文 参考訳(メタデータ) (2024-06-30T04:21:46Z) - Haris: an Advanced Autonomous Mobile Robot for Smart Parking Assistance [2.3779780917500544]
このシステムは、自動ナビゲーションと駐車場の正確なマッピングのために、同時位置決めとマッピング(SLAM)を採用している。
提案システムは,スポーツスタジアム等の混雑地において,短期的な大規模屋外駐車場の管理を改善する可能性を秘めている。
論文 参考訳(メタデータ) (2024-01-31T11:00:26Z) - MSight: An Edge-Cloud Infrastructure-based Perception System for
Connected Automated Vehicles [58.461077944514564]
本稿では,自動走行車に特化して設計された最先端道路側認識システムであるMSightについて述べる。
MSightは、リアルタイムの車両検出、ローカライゼーション、トラッキング、短期的な軌道予測を提供する。
評価は、待ち時間を最小限にしてレーンレベルの精度を維持するシステムの能力を強調している。
論文 参考訳(メタデータ) (2023-10-08T21:32:30Z) - Automatic Vision-Based Parking Slot Detection and Occupancy
Classification [3.038642416291856]
パーキング誘導情報(PGI)システムは、最も近い駐車場と空き駐車場の数についてドライバーに情報を提供するために使用される。
近年、視覚ベースのソリューションは標準的なPGIシステムに代わる費用対効果の代替として現れ始めている。
本稿では,入力画像のみに基づいて自動駐車スロット検出・職業分類(APSD-OC)を行うアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-16T07:44:34Z) - Public Parking Spot Detection And Geo-localization Using Transfer
Learning [0.0]
世界中の都市では、公共駐車場と空き駐車場の配置が大きな問題であり、通勤者の時間と交通渋滞が増大している。
この研究は、携帯電話カメラからのGeo-Tagged画像のデータセットを、ニューラルネットワーク駆動のパブリックカメラによって検出された利用可能な駐車スペースを備えたヨハネスブルグの最も便利な公共駐車場へのナビゲートに利用する方法を説明する。
論文 参考訳(メタデータ) (2022-09-01T04:09:51Z) - V2VNet: Vehicle-to-Vehicle Communication for Joint Perception and
Prediction [74.42961817119283]
車両間通信(V2V)を用いて、自動運転車の知覚と運動予測性能を向上させる。
複数の車両から受信した情報をインテリジェントに集約することで、異なる視点から同じシーンを観察することができる。
論文 参考訳(メタデータ) (2020-08-17T17:58:26Z) - Trained Trajectory based Automated Parking System using Visual SLAM on
Surround View Cameras [0.0]
我々は、訓練された軌道自動駐車システムの使用事例、設計、実装について論じる。
提案システムは商用車両に展開し, 消費者アプリケーションについて解説する。
論文 参考訳(メタデータ) (2020-01-07T16:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。