論文の概要: PoseDriver: A Unified Approach to Multi-Category Skeleton Detection for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2603.23215v2
- Date: Wed, 25 Mar 2026 09:59:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 14:25:26.083856
- Title: PoseDriver: A Unified Approach to Multi-Category Skeleton Detection for Autonomous Driving
- Title(参考訳): PoseDriver: 自律運転のためのマルチカテゴリスケルトン検出への統一的アプローチ
- Authors: Yasamin Borhani, Taylor Mordan, Yihan Wang, Reyhaneh Hosseininejad, Javad Khoramdel, Alexandre Alahi,
- Abstract要約: PoseDriverは、駆動シナリオで一般的なオブジェクトに合わせたボトムアップのマルチカテゴリスケルトン検出のための統合フレームワークである。
骨格表現に基づく車線検出のための新しい手法を提案し,OpenLaneデータセット上での最先端性能を実現する。
自転車の骨格検出のための新しいデータセットを提案し,新しいカテゴリーへのフレームワークの転送性を評価する。
- 参考スコア(独自算出の注目度): 72.70946892443236
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object skeletons offer a concise representation of structural information, capturing essential aspects of posture and orientation that are crucial for autonomous driving applications. However, a unified architecture that simultaneously handles multiple instances and categories using only the input image remains elusive. In this paper, we introduce PoseDriver, a unified framework for bottom-up multi-category skeleton detection tailored to common objects in driving scenarios. We model each category as a distinct task to systematically address the challenges of multi-task learning. Specifically, we propose a novel approach for lane detection based on skeleton representations, achieving state-of-the-art performance on the OpenLane dataset. Moreover, we present a new dataset for bicycle skeleton detection and assess the transferability of our framework to novel categories. Experimental results validate the effectiveness of the proposed approach.
- Abstract(参考訳): オブジェクトスケルトンは構造情報の簡潔な表現を提供し、自律運転アプリケーションにとって不可欠な姿勢と方向の基本的な側面を捉えている。
しかし、入力画像のみを使用して複数のインスタンスやカテゴリを同時に扱う統一アーキテクチャは、いまだ解明されていない。
本稿では,PoseDriverについて紹介する。PoseDriverは,運転シナリオにおける共通オブジェクトに適した,ボトムアップ型マルチカテゴリスケルトン検出のための統合フレームワークである。
各カテゴリを個別のタスクとしてモデル化し,マルチタスク学習の課題を体系的に解決する。
具体的には、スケルトン表現に基づくレーン検出のための新しい手法を提案し、OpenLaneデータセット上で最先端の性能を実現する。
さらに,自転車の骨格検出のための新しいデータセットを提案し,新しいカテゴリーへのフレームワークの転送性を評価する。
提案手法の有効性を実験的に検証した。
関連論文リスト
- Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Labeling Indoor Scenes with Fusion of Out-of-the-Box Perception Models [4.157013247909771]
ボトムアップセグメンテーション(SAM)、オブジェクト検出(Detic)、セマンティックセグメンテーション(MaskFormer)の最先端モデルを活用することを提案する。
室内環境におけるセマンティックセグメンテーションとオブジェクトインスタンス検出のための擬似ラベルを得るための,コスト効率の高いラベリング手法を開発することを目的とする。
提案手法の有効性を,Active VisionデータセットとADE20Kデータセットに示す。
論文 参考訳(メタデータ) (2023-11-17T21:58:26Z) - LVLane: Deep Learning for Lane Detection and Classification in
Challenging Conditions [2.5641096293146712]
本稿では,ディープラーニング手法に基づくエンドツーエンドの車線検出・分類システムを提案する。
本研究では,最新技術(SOTA)レーンローカライゼーションモデルにおいて重要な課題を提起するシナリオを包含する,厳密にキュレートされたユニークなデータセットを提案する。
そこで本研究では,CNNをベースとした検知器とシームレスに統合し,異なるレーンの識別を容易にする分類手法を提案する。
論文 参考訳(メタデータ) (2023-07-13T16:09:53Z) - Uncertainty Aware Active Learning for Reconfiguration of Pre-trained
Deep Object-Detection Networks for New Target Domains [0.0]
物体検出はコンピュータビジョンタスクの最も重要かつ基本的な側面の1つである。
オブジェクト検出モデルのトレーニングデータを効率的に取得するために、多くのデータセットは、ビデオフォーマットでアノテーションのないデータを取得することを選択します。
ビデオからすべてのフレームに注釈を付けるのは、多くのフレームがモデルが学ぶのに非常によく似た情報を含んでいるため、費用がかかり非効率である。
本稿では,この問題に対処するためのオブジェクト検出モデルのための新しい能動学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:14:10Z) - Ensemble Learning for Fusion of Multiview Vision with Occlusion and
Missing Information: Framework and Evaluations with Real-World Data and
Applications in Driver Hand Activity Recognition [0.0]
マルチセンサーフレームワークは、アンサンブル学習とセンサー融合の機会を提供する。
欠落した情報を扱うための計算手法を提案し,解析する。
並列畳み込みニューラルネットワーク間のレイトフュージョンアプローチは、最良配置の単一カメラモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-30T00:24:27Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Representation-Centric Survey of Skeletal Action Recognition and the ANUBIS Benchmark [43.00059447663327]
3Dスケルトンに基づく人間の行動認識は、従来のRGBや深さに基づくアプローチの強力な代替手段として登場した。
目覚ましい進歩にもかかわらず、現在の研究は様々な入力表現で断片化されている。
ANUBISは、既存のベンチマークで重要なギャップに対処するために設計された、大規模で挑戦的なスケルトンアクションデータセットである。
論文 参考訳(メタデータ) (2022-05-04T14:03:43Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Adaptive Object Detection with Dual Multi-Label Prediction [78.69064917947624]
本稿では,適応オブジェクト検出のための新しいエンド・ツー・エンドの非教師付き深部ドメイン適応モデルを提案する。
モデルはマルチラベル予測を利用して、各画像内の対象カテゴリ情報を明らかにする。
本稿では,オブジェクト検出を支援するための予測整合正則化機構を提案する。
論文 参考訳(メタデータ) (2020-03-29T04:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。