論文の概要: DG-Labeler and DGL-MOTS Dataset: Boost the Autonomous Driving Perception
- arxiv url: http://arxiv.org/abs/2110.07790v1
- Date: Fri, 15 Oct 2021 01:04:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 13:39:03.289692
- Title: DG-Labeler and DGL-MOTS Dataset: Boost the Autonomous Driving Perception
- Title(参考訳): DG-LabelerとDGL-MOTSデータセット:自律走行知覚を高める
- Authors: Yiming Cui, Zhiwen Cao, Yixin Xie, Xingyu Jiang, Feng Tao, Yingjie
Chen, Lin Li, Dongfang Liu
- Abstract要約: 我々は,DG-LabelerとDGL-MOTSデータセットを導入し,MOTSタスクのトレーニングデータアノテーションを容易にする。
大規模なクロスデータセット評価の結果は、我々のデータセットでトレーニングされたいくつかの最先端手法に対して、大幅な性能向上を示している。
- 参考スコア(独自算出の注目度): 15.988493804970092
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-object tracking and segmentation (MOTS) is a critical task for
autonomous driving applications. The existing MOTS studies face two critical
challenges: 1) the published datasets inadequately capture the real-world
complexity for network training to address various driving settings; 2) the
working pipeline annotation tool is under-studied in the literature to improve
the quality of MOTS learning examples. In this work, we introduce the
DG-Labeler and DGL-MOTS dataset to facilitate the training data annotation for
the MOTS task and accordingly improve network training accuracy and efficiency.
DG-Labeler uses the novel Depth-Granularity Module to depict the instance
spatial relations and produce fine-grained instance masks. Annotated by
DG-Labeler, our DGL-MOTS dataset exceeds the prior effort (i.e., KITTI MOTS and
BDD100K) in data diversity, annotation quality, and temporal representations.
Results on extensive cross-dataset evaluations indicate significant performance
improvements for several state-of-the-art methods trained on our DGL-MOTS
dataset. We believe our DGL-MOTS Dataset and DG-Labeler hold the valuable
potential to boost the visual perception of future transportation.
- Abstract(参考訳): マルチオブジェクトトラッキングとセグメンテーション(MOTS)は、自律運転アプリケーションにとって重要なタスクである。
既存のMOTS研究は2つの重要な課題に直面している。
1) 公開データセットは,様々な運転設定に対応するためのネットワークトレーニングの現実的な複雑さを適切に捉えていない。
2) 動作パイプラインアノテーションツールはMOTS学習例の品質向上のために,文献で未検討である。
本研究では,MOTSタスクのトレーニングデータアノテーションを容易にするため,DG-LabelerとDGL-MOTSデータセットを導入し,ネットワークトレーニングの精度と効率を向上させる。
dg-labelerは、新しい深度粒度モジュールを使用して、インスタンス空間関係を描写し、きめ細かいインスタンスマスクを生成する。
DG-Labelerによって注釈付けされた私たちのDGL-MOTSデータセットは、データ多様性、アノテーションの品質、時間表現における以前の取り組み(KITTI MOTSとBDD100K)を上回る。
広範なデータセット横断評価の結果,dgl-motsデータセット上でトレーニングされた最先端手法の性能改善が確認された。
DGL-MOTSデータセットとDG-Labelerは、将来の輸送に対する視覚的認識を高める貴重な可能性を持っていると考えています。
関連論文リスト
- DA-MoE: Addressing Depth-Sensitivity in Graph-Level Analysis through Mixture of Experts [70.21017141742763]
グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理することで人気を集めている。
既存のメソッドは通常、固定数のGNNレイヤを使用して、すべてのグラフの表現を生成する。
本稿では,GNNに2つの改良を加えたDA-MoE法を提案する。
論文 参考訳(メタデータ) (2024-11-05T11:46:27Z) - Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - EDGE: Enhanced Grounded GUI Understanding with Enriched Multi-Granularity Synthetic Data [15.801018643716437]
本稿では,大規模視覚言語モデル(LVLM)のGUI理解と対話能力を,データ駆動型アプローチにより向上することを目的とする。
本稿では,Web上のWebページから大規模で粒度の高いトレーニングデータを自動的に生成する汎用データ合成フレームワークEDGEを提案する。
提案手法は,手動アノテーションへの依存を著しく低減し,研究者がWeb上で利用可能な膨大な公開リソースを活用して作業を進めることを可能にする。
論文 参考訳(メタデータ) (2024-10-25T10:46:17Z) - UdeerLID+: Integrating LiDAR, Image, and Relative Depth with Semi-Supervised [12.440461420762265]
道路分割は自動運転システムにとって重要な課題である。
我々の研究は、LiDARポイントクラウドデータ、ビジュアルイメージ、および相対深度マップを統合する革新的なアプローチを導入している。
主な課題の1つは、大規模で正確にラベル付けされたデータセットの不足である。
論文 参考訳(メタデータ) (2024-09-10T03:57:30Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - Self-Supervised Graph Neural Network for Multi-Source Domain Adaptation [51.21190751266442]
ドメイン適応(DA)は、テストデータがトレーニングデータの同じ分布に完全に従わない場合に、シナリオに取り組む。
大規模未ラベルサンプルから学習することで、自己教師型学習がディープラーニングの新しいトレンドとなっている。
我々は,より効果的なタスク間情報交換と知識共有を実現するために,新しい textbfSelf-textbf Supervised textbfGraph Neural Network (SSG) を提案する。
論文 参考訳(メタデータ) (2022-04-08T03:37:56Z) - Gram-SLD: Automatic Self-labeling and Detection for Instance Objects [6.512856940779818]
我々はGram-SLD(Gram Self-Labeling and Detection)と呼ばれる協調学習に基づく新しいフレームワークを提案する。
Gram-SLDは、手動でラベル付けされたキーデータで大量のデータを自動アノテートし、競争性能を達成する。
論文 参考訳(メタデータ) (2021-12-07T11:34:55Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。