論文の概要: Car Damage Detection and Patch-to-Patch Self-supervised Image Alignment
- arxiv url: http://arxiv.org/abs/2403.06674v1
- Date: Mon, 11 Mar 2024 12:46:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 19:01:55.111896
- Title: Car Damage Detection and Patch-to-Patch Self-supervised Image Alignment
- Title(参考訳): 自動車損傷検出とパッチ・ツー・パッチ自己監視画像アライメント
- Authors: Hanxiao Chen
- Abstract要約: 我々は、カスタム画像上の自動車の損傷を検出するために、Mask R-CNNモデルを実装した。
また,自動制御型Patch-to-Patch SimCLRに基づくアライメント手法を提案する。
- 参考スコア(独自算出の注目度): 11.893324664457548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most computer vision applications aim to identify pixels in a scene and use
them for diverse purposes. One intriguing application is car damage detection
for insurance carriers which tends to detect all car damages by comparing both
pre-trip and post-trip images, even requiring two components: (i) car damage
detection; (ii) image alignment. Firstly, we implemented a Mask R-CNN model to
detect car damages on custom images. Whereas for the image alignment section,
we especially propose a novel self-supervised Patch-to-Patch SimCLR inspired
alignment approach to find perspective transformations between custom pre/post
car rental images except for traditional computer vision methods.
- Abstract(参考訳): ほとんどのコンピュータビジョンアプリケーションは、シーン内のピクセルを識別し、様々な目的のためにそれらを使用する。
興味深い応用の1つは、旅行前の画像とポストトリップ画像を比較して自動車の損傷を検知する保険会社の自動車損傷検出である。
(i)自動車の損傷検出
(ii)画像アライメント。
まず,カスタム画像の車両損傷を検出するマスクr-cnnモデルを実装した。
画像アライメントセクションでは,従来のコンピュータビジョン法を除いて,車前・後レンタカー画像間の視点変換を求めるために,パッチ・パッチ・パッチ・シムclrをインスパイアした新しい自己教師付きアライメント手法を提案する。
関連論文リスト
- Cut-and-Paste with Precision: a Content and Perspective-aware Data Augmentation for Road Damage Detection [5.939858158928473]
道路の損傷は、道路インフラの完全性、安全性、耐久性に重大な課題をもたらす可能性がある。
近年、道路監視アプリケーションにおいて、画像に基づく損傷検出のための様々なデータ駆動手法が研究されている。
本稿では、コンテンツ認識(すなわち、画像中の道路の真の位置を考える)と視点認識(すなわち、注入された損傷と対象画像との視点の差を考慮する)の両面から改善されたカット・アンド・ペースト増強手法を提案する。
論文 参考訳(メタデータ) (2024-06-06T09:06:42Z) - TPatch: A Triggered Physical Adversarial Patch [19.768494127237393]
音響信号によって引き起こされる物理的対向パッチであるTPatchを提案する。
運転者の疑念を避けるため,コンテンツベースカモフラージュ法と攻撃強化法を提案する。
論文 参考訳(メタデータ) (2023-12-30T06:06:01Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - Threatening Patch Attacks on Object Detection in Optical Remote Sensing
Images [55.09446477517365]
自然画像における物体検出における高度なパッチアタック(PA)は、ディープニューラルネットワークに基づく手法における大きな安全性の脆弱性を指摘した。
我々は,TPAと呼ばれる視覚的品質の低下を伴わない,より危険度の高いPAを提案する。
我々の知る限りでは、これがO-RSIにおけるオブジェクト検出におけるPAの研究の最初の試みであり、この研究が読者にこのトピックの研究に興味を持たせることを願っている。
論文 参考訳(メタデータ) (2023-02-13T02:35:49Z) - Cognitive Accident Prediction in Driving Scenes: A Multimodality
Benchmark [77.54411007883962]
本研究では,視覚的観察と運転者の注意に対する人為的な文章記述の認識を効果的に活用し,モデルトレーニングを容易にする認知事故予測手法を提案する。
CAPは、注意テキスト〜ビジョンシフト融合モジュール、注意シーンコンテキスト転送モジュール、運転注意誘導事故予測モジュールによって構成される。
我々は,1,727件の事故ビデオと219万フレーム以上の大規模ベンチマークを構築した。
論文 参考訳(メタデータ) (2022-12-19T11:43:02Z) - CarDD: A New Dataset for Vision-based Car Damage Detection [13.284578516117804]
カー損傷検出(CarDD)は,視覚に基づく車両損傷検出とセグメンテーションのために設計された,最初の大規模データセットである。
我々のCarDDは、4000以上の高解像度の自動車損傷画像と6つの損傷カテゴリの9000以上のよく注釈された事例を含んでいる。
本稿では,画像の収集,選択,アノテーションのプロセスについて詳述し,統計的データセット解析について述べる。
論文 参考訳(メタデータ) (2022-11-02T08:09:03Z) - You Cannot Easily Catch Me: A Low-Detectable Adversarial Patch for
Object Detectors [12.946967210071032]
敵対的パッチは、顔認識システム、監視システム、自動運転車を騙すことができる。
既存のほとんどの敵パッチは、敵パッチ検出器によって外され、無効化され、拒否される。
本稿では,テクスチャに一貫性のある対向パッチで物体検出器を攻撃する新しい手法,低検出可能な対向パッチを提案する。
論文 参考訳(メタデータ) (2021-09-30T14:47:29Z) - Self-Supervised Steering Angle Prediction for Vehicle Control Using
Visual Odometry [55.11913183006984]
視覚オドメトリー法を用いて推定したカメラポーズを用いて,車両の軌道制御をモデルに訓練する方法を示す。
車両の前方にカメラを設置することにより,複数の異なる走行経路からの軌跡情報を活用するスケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-20T16:29:01Z) - Orientation-aware Vehicle Re-identification with Semantics-guided Part
Attention Network [33.712450134663236]
本研究では,車両の視界の異なる部分注意マスクを頑健に予測するための,セマンティックス誘導部品注意ネットワーク(SPAN)を提案する。
パーシャルアテンションマスクの助けを借りて、各部分の識別的特徴を別々に抽出できる。
次に、共起車部品に重点を置くCPDM(Co-occurrence Part-attentive Distance Metric)を紹介する。
論文 参考訳(メタデータ) (2020-08-26T07:33:09Z) - Parsing-based View-aware Embedding Network for Vehicle Re-Identification [138.11983486734576]
本稿では,車載ReIDのビューアウェア機能アライメントと拡張を実現するために,解析に基づくPVEN(View-Aware Embedding Network)を提案する。
3つのデータセットで行った実験により、我々のモデルは最先端の手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2020-04-10T13:06:09Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。