論文の概要: Accelerating Road Sign Ground Truth Construction with Knowledge Graph
and Machine Learning
- arxiv url: http://arxiv.org/abs/2012.02672v1
- Date: Fri, 4 Dec 2020 15:42:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 02:55:50.541205
- Title: Accelerating Road Sign Ground Truth Construction with Knowledge Graph
and Machine Learning
- Title(参考訳): 知識グラフと機械学習による道路標識地中真理構築の高速化
- Authors: Ji Eun Kim, Cory Henson, Kevin Huang, Tuan A. Tran, Wan-Yi Lin
- Abstract要約: 道路標識の分類を効果的に行うために,知識グラフと機械学習アルゴリズムを用いた新しい手法を提案する。
アノテーションは、視覚属性を使用してRoad Sign Knowledge Graphをクエリし、VPEモデルによって提案される最も近いマッチング候補を受け取ることができる。
知識グラフのアプローチは手話検索スペースを98.9%削減できることを示す。
- 参考スコア(独自算出の注目度): 5.226306460380354
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Having a comprehensive, high-quality dataset of road sign annotation is
critical to the success of AI-based Road Sign Recognition (RSR) systems. In
practice, annotators often face difficulties in learning road sign systems of
different countries; hence, the tasks are often time-consuming and produce poor
results. We propose a novel approach using knowledge graphs and a machine
learning algorithm - variational prototyping-encoder (VPE) - to assist human
annotators in classifying road signs effectively. Annotators can query the Road
Sign Knowledge Graph using visual attributes and receive closest matching
candidates suggested by the VPE model. The VPE model uses the candidates from
the knowledge graph and a real sign image patch as inputs. We show that our
knowledge graph approach can reduce sign search space by 98.9%. Furthermore,
with VPE, our system can propose the correct single candidate for 75% of signs
in the tested datasets, eliminating the human search effort entirely in those
cases.
- Abstract(参考訳): 包括的な高品質な道路標識アノテーションデータセットを持つことは、AIベースの道路標識認識(RSR)システムの成功に不可欠である。
実際には、アノテータは異なる国の道路標識システムを学ぶことの難しさに直面することが多いため、その作業は時間を要することが多く、結果が悪い。
本稿では,知識グラフと機械学習アルゴリズムである可変プロトタイピングエンコーダ(VPE)を用いて,道路標識を効果的に分類する手法を提案する。
アノテーションは視覚属性を使用してロードサイン知識グラフをクエリし、VPEモデルによって提案される最も近いマッチング候補を受け取ることができる。
VPEモデルは知識グラフからの候補と実際のサインイメージパッチを入力として使用する。
知識グラフのアプローチは手話検索スペースを98.9%削減できることを示す。
さらに,本システムはvpeを用いて,テストされたデータセットの75%の符号に対する正しい単一候補を提案することができ,その場合の人的検索の労力を完全に排除できる。
関連論文リスト
- Adversary ML Resilience in Autonomous Driving Through Human Centered
Perception Mechanisms [0.0]
本稿では,3つの物理的攻撃(テープ,落書き,照明)に対する自律走行システムのレジリエンスについて検討する。
攻撃に対する堅牢性を構築するために、敵の訓練や移動学習のような防御技術が導入された。
その結果,道路標識分類の一般化性を向上させるために,形状訓練から得られる知識を付与することにより,伝達学習モデルが性能において重要な役割を担っていることが示された。
論文 参考訳(メタデータ) (2023-11-02T04:11:45Z) - Learning Transferable Pedestrian Representation from Multimodal
Information Supervision [174.5150760804929]
VAL-PATは、移動可能な表現を学習し、様々な歩行者分析タスクをマルチモーダル情報で強化する新しいフレームワークである。
まず、LUPerson-TAデータセットで事前トレーニングを行い、各画像にはテキストと属性アノテーションが含まれている。
次に、学習した表現を、人物のreID、人物属性認識、テキストベースの人物検索など、さまざまな下流タスクに転送する。
論文 参考訳(メタデータ) (2023-04-12T01:20:58Z) - Learning Graph Search Heuristics [48.83557172525969]
本稿では,新しいニューラルネットワークと学習アルゴリズムであるPHIL(Path Heuristic with Imitation Learning)について述べる。
我々の関数は、ノード距離の推測に有用なグラフ埋め込みを学習し、グラフサイズに依存しない一定時間で実行し、テスト時にA*のようなアルゴリズムに容易に組み込むことができる。
実験の結果、PHILはベンチマークデータセットの最先端の手法と比較して平均58.5%の探索ノード数を削減している。
論文 参考訳(メタデータ) (2022-12-07T22:28:00Z) - A Survey on Visual Transfer Learning using Knowledge Graphs [0.8701566919381223]
本調査は知識グラフ(KG)を用いた視覚伝達学習手法に焦点を当てる。
KGは、基礎となるグラフ構造化スキーマやベクトルベースの知識グラフの埋め込みにおいて補助的な知識を表現することができる。
本稿では,知識グラフの埋め込み手法の概要を概説し,それらを高次元の視覚的埋め込みと組み合わせた共同学習の目的について述べる。
論文 参考訳(メタデータ) (2022-01-27T20:19:55Z) - RoadAtlas: Intelligent Platform for Automated Road Defect Detection and
Asset Management [8.441428233111843]
RoadAtlasは、道路欠陥の検出、道路マーキング解析、ユーザによるデータの提示と入力のためのWebベースのダッシュボードをサポートする、新しいエンドツーエンド統合システムである。
論文 参考訳(メタデータ) (2021-09-08T01:26:15Z) - Don't Forget to Sign the Gradients! [60.98885980669777]
GradSignsはディープニューラルネットワーク(DNN)のための新しい透かしフレームワーク
深部ニューラルネットワーク(DNN)のための新しい透かしフレームワークであるGradSignsを紹介します。
論文 参考訳(メタデータ) (2021-03-05T14:24:32Z) - Graph Self-Supervised Learning: A Survey [73.86209411547183]
SSL(Self-supervised Learning)は、グラフデータの有望でトレンドの学習パラダイムとなっています。
グラフデータにSSL技術を用いた既存のアプローチをタイムリーかつ包括的にレビューします。
論文 参考訳(メタデータ) (2021-02-27T03:04:21Z) - Structural Information Preserving for Graph-to-Text Generation [59.00642847499138]
グラフ・トゥ・テキスト生成の課題は、入力グラフの意味を保存した文を生成することである。
入力情報を保存するためのモデルとして,より豊かなトレーニング信号を活用することで,この問題に取り組むことを提案する。
グラフからテキストへの生成のための2つのベンチマークに関する実験は、最先端のベースラインに対するアプローチの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-12T20:09:01Z) - Road images augmentation with synthetic traffic signs using neural
networks [3.330229314824913]
まれな交通標識の検出と分類のタスクを検討します。
合成トレーニングデータを用いて、その課題の解決を目指します。
本稿では,合成標識を外観に整合させる3つの手法を提案する。
論文 参考訳(メタデータ) (2021-01-13T08:10:33Z) - BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in
Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。
本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文 参考訳(メタデータ) (2020-09-22T08:25:44Z) - Automatic Signboard Detection and Localization in Densely Populated
Developing Cities [0.0]
自然シーン画像における看板検出は, エラーのない情報検索における最優先課題である。
本稿では,看板を自動的に検出し,そのような都市に適した新しい物体検出手法を提案する。
提案手法では,符号板を正確に検出できる(背景の形状や色が多様であっても平均精度は0.90 mAP)。
論文 参考訳(メタデータ) (2020-03-04T08:04:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。