論文の概要: Image2PCI -- A Multitask Learning Framework for Estimating Pavement
Condition Indices Directly from Images
- arxiv url: http://arxiv.org/abs/2310.08538v1
- Date: Thu, 12 Oct 2023 17:28:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 08:21:37.641033
- Title: Image2PCI -- A Multitask Learning Framework for Estimating Pavement
Condition Indices Directly from Images
- Title(参考訳): Image2PCI - 画像から直接舗装条件指標を推定するマルチタスク学習フレームワーク
- Authors: Neema Jakisa Owor, Hang Du, Abdulateef Daud, Armstrong Aboah, Yaw
Adu-Gyamfi
- Abstract要約: 本研究では,トップダウン舗装画像から直接舗装条件指数を予測する統合マルチタスクモデルを開発した。
マルチタスクにより、画像から直接PCIを推定するための検出およびセグメント化ヘッドから特徴を抽出することができる。
このモデルは、我々のベンチマーク済みでオープンな舗装救難データセットで非常によく機能します。
- 参考スコア(独自算出の注目度): 8.64316207086894
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The Pavement Condition Index (PCI) is a widely used metric for evaluating
pavement performance based on the type, extent and severity of distresses
detected on a pavement surface. In recent times, significant progress has been
made in utilizing deep-learning approaches to automate PCI estimation process.
However, the current approaches rely on at least two separate models to
estimate PCI values -- one model dedicated to determining the type and extent
and another for estimating their severity. This approach presents several
challenges, including complexities, high computational resource demands, and
maintenance burdens that necessitate careful consideration and resolution. To
overcome these challenges, the current study develops a unified multi-tasking
model that predicts the PCI directly from a top-down pavement image. The
proposed architecture is a multi-task model composed of one encoder for feature
extraction and four decoders to handle specific tasks: two detection heads, one
segmentation head and one PCI estimation head. By multitasking, we are able to
extract features from the detection and segmentation heads for automatically
estimating the PCI directly from the images. The model performs very well on
our benchmarked and open pavement distress dataset that is annotated for
multitask learning (the first of its kind). To our best knowledge, this is the
first work that can estimate PCI directly from an image at real time speeds
while maintaining excellent accuracy on all related tasks for crack detection
and segmentation.
- Abstract(参考訳): 舗装条件指標(pci)は、舗装面に検出された災害の種類、程度、重大度に基づいて舗装性能を評価するために広く用いられる指標である。
近年,PCI推定プロセスの自動化に深層学習アプローチを利用することで大きな進歩を遂げている。
しかしながら、現在のアプローチでは、PCI値を推定するための少なくとも2つの別々のモデルに依存しています。
このアプローチは、複雑度、高い計算資源要求、注意深い考慮と解決を必要とするメンテナンスの負担など、いくつかの課題を提起する。
これらの課題を克服するため,本研究では,トップダウン舗装画像から直接pciを予測する統合マルチタスクモデルを開発した。
提案手法は,特徴抽出のための1つのエンコーダと,2つの検出ヘッド,1つのセグメンテーションヘッド,1つのpci推定ヘッドの4つのデコーダからなるマルチタスクモデルである。
マルチタスクにより、画像から直接PCIを推定するための検出およびセグメント化ヘッドから特徴を抽出することができる。
このモデルは、マルチタスク学習(この種の最初のもの)用にアノテートされた、ベンチマークとオープン舗装の苦難データセットで非常にうまく機能します。
我々の知る限り、これは、画像から直接PCIをリアルタイムに推定できる最初の仕事であり、クラック検出とセグメンテーションのすべての関連タスクにおいて優れた精度を維持しながら、優れた精度を維持している。
関連論文リスト
- DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - A Multi-task Framework for Infrared Small Target Detection and
Segmentation [9.033048310220346]
赤外線小ターゲット検出とセグメンテーションのための新しいエンドツーエンドフレームワークを提案する。
UNetをバックボーンとして、解像度とセマンティック情報を維持するために使用しています。
我々は、赤外線小ターゲット検出とセグメンテーションのためのマルチタスクフレームワークを開発した。
論文 参考訳(メタデータ) (2022-06-14T15:43:34Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。