論文の概要: Trajectory-Aware Adaptive Inference in Object Detection Models
- arxiv url: http://arxiv.org/abs/2605.16397v1
- Date: Tue, 12 May 2026 16:04:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.209932
- Title: Trajectory-Aware Adaptive Inference in Object Detection Models
- Title(参考訳): 物体検出モデルにおける軌道認識適応推論
- Authors: Grigorios Papanikolaou, Ioannis Kontopoulos, Giannis Spiliopoulos, Dimitris Zissis, Konstantinos Tserpes,
- Abstract要約: 我々は,GPSトラジェクトリデータを推論プロセスに組み込むことにより,既存のオブジェクト検出フレームワークを構築した。
我々は、動きキューを組み込んだYOLOv8ベースの検出器に早期退避機構を導入する。
その結果、この戦略は予測時間と計算コストを大幅に削減しつつ、良好な検出性能を維持していることが示された。
- 参考スコア(独自算出の注目度): 0.19845233274307664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing integration of sensors in autonomous maritime navigation has led to large-scale multimodal datasets, raising challenges in achieving efficient real-time perception. In such systems, object detection and trajectory perception of nearby vessels are tightly coupled, particularly in dynamic environments such as maritime navigation. However, the efficiency of object detection models during inference remains an often-overlooked aspect. To this end, we build upon an existing object detection framework by incorporating GPS trajectory data into the inference process to enable input-adaptive computation. Specifically, we introduce an early-exit mechanism in a YOLOv8-based detector that incorporates motion cues - such as inter-vessel distances. Frames of vessels that are separated by short distances, converging with high speed, are processed using the full model, while only a subset of the network's architecture is activated otherwise. The difficulty degree (or scene complexity) of a frame or set of frames per second is evaluated by leveraging inter-object distance and the rate at which the distance between them decreases. Experimental results demonstrate that this strategy maintains satisfactory detection performance while significantly reducing inference time and computational cost, thus enabling a flexible trade-off between accuracy and efficiency compared to full-model inference.
- Abstract(参考訳): 自律的な海上航行におけるセンサーの統合が増加し、大規模なマルチモーダルデータセットが生まれ、効率的なリアルタイム認識を実現する上での課題が提起された。
このようなシステムでは、特に海上航行のような動的環境において、近接する船舶の物体検出と軌道知覚が密結合されている。
しかし、推論中の物体検出モデルの効率は、しばしば見過ごされる側面である。
そこで我々は,GPSトラジェクトリデータを推論プロセスに組み込んで既存のオブジェクト検出フレームワークを構築し,入力適応型計算を実現する。
具体的には、YOLOv8ベースの検出器に、車間距離などのモーションキューを組み込んだ早期退避機構を導入する。
短い距離で分離され、高速で収束する容器のフレームは、フルモデルを使用して処理されるが、ネットワークアーキテクチャのサブセットは、そうでなければ活性化されない。
物体間距離とそれらの間の距離が減少する速度を利用して、フレームの難易度(または1秒あたりのフレームの集合)を評価する。
実験結果から,本手法は予測時間と計算コストを大幅に削減しつつ,良好な検出性能を維持しつつ,完全モデル推論と比較して精度と効率のトレードオフが柔軟であることが確認された。
関連論文リスト
- WUTDet: A 100K-Scale Ship Detection Dataset and Benchmarks with Dense Small Objects [68.44670476527155]
WUTDetは100,576イメージと381,378のアノテートされた船舶インスタンスを備えた大規模な船舶検出データセットである。
CNN, Transformer, Mambaの3つの主流検出アーキテクチャから20のベースラインモデルを体系的に評価した。
Ship-GENの結果は、WUTDetでトレーニングされたモデルは、異なるデータ分布下でより強力な一般化を示すことを示している。
論文 参考訳(メタデータ) (2026-04-09T03:28:05Z) - BEVPredFormer: Spatio-temporal Attention for BEV Instance Prediction in Autonomous Driving [1.5327485092552822]
本稿では,BEV予測のためのカメラ専用アーキテクチャであるBEVPredFormerを紹介する。
注意に基づく時間的処理を使用して、シーンの時間的および空間的理解を改善する。
nuScenesデータセットで評価され、State-Of-The-Artメソッドと同程度か超えた。
論文 参考訳(メタデータ) (2026-04-03T09:58:42Z) - Surveillance Video-Based Traffic Accident Detection Using Transformer Architecture [2.621034368312571]
交通事故は、人口増加、都市化、自動車化による死亡率の増加により、世界的死亡率の主要な原因となっている。
事故検出のための伝統的なコンピュータ手法は、限られた理解と貧弱なクロスドメインの一般化を伴う。
本研究では,事前抽出した空間映像特徴を用いた変圧器アーキテクチャに基づく事故検出モデルを提案する。
論文 参考訳(メタデータ) (2025-12-12T07:57:36Z) - MATE: Motion-Augmented Temporal Consistency for Event-based Point Tracking [58.719310295870024]
本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。
事象の間隔に起因する曖昧さを解決するため、運動誘導モジュールは運動ベクトルを局所的なマッチングプロセスに組み込む。
このメソッドは、任意のポイントベースラインのイベントのみのトラッキングに対して、$Survival_50$メトリックを17.9%改善する。
論文 参考訳(メタデータ) (2024-12-02T09:13:29Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - A CNN-LSTM Architecture for Marine Vessel Track Association Using
Automatic Identification System (AIS) Data [2.094022863940315]
本研究では,トラックアソシエーションのための1次元CNN-LSTMアーキテクチャに基づくフレームワークを提案する。
提案した枠組みは、自動識別システム(AIS)を介して収集された船舶の位置と動きデータを入力とし、最も可能性の高い船舶軌道をリアルタイムで出力として返す。
論文 参考訳(メタデータ) (2023-03-24T15:26:49Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - StreamYOLO: Real-time Object Detection for Streaming Perception [84.2559631820007]
将来を予測する能力を備えたモデルを提供し、ストリーミング知覚の結果を大幅に改善する。
本稿では,複数の速度を駆動するシーンについて考察し,VasAP(Velocity-Awared streaming AP)を提案する。
本手法は,Argoverse-HDデータセットの最先端性能を実現し,SAPとVsAPをそれぞれ4.7%,VsAPを8.2%改善する。
論文 参考訳(メタデータ) (2022-07-21T12:03:02Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。