論文の概要: Bent & Broken Bicycles: Leveraging synthetic data for damaged object
re-identification
- arxiv url: http://arxiv.org/abs/2304.07883v1
- Date: Sun, 16 Apr 2023 20:23:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 16:50:38.023833
- Title: Bent & Broken Bicycles: Leveraging synthetic data for damaged object
re-identification
- Title(参考訳): Bent & Broken Bicycles: 損傷対象再同定のための合成データを活用する
- Authors: Luca Piano, Filippo Gabriele Prattic\`o, Alessandro Sebastian Russo,
Lorenzo Lanari, Lia Morra, Fabrizio Lamberti
- Abstract要約: 変形や欠落による視覚的外観の変化と微妙なクラス内変化を区別することを目的とした,損傷対象の再識別の新たな課題を提案する。
我々は、コンピュータ生成画像のパワーを活用して、半自動で、損傷前後に同じ自転車の高品質な合成画像を作成する。
このタスクのベースラインとして,マルチタスクでトランスフォーマーをベースとしたディープネットワークであるTransReI3Dを提案する。
- 参考スコア(独自算出の注目度): 59.80753896200009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Instance-level object re-identification is a fundamental computer vision
task, with applications from image retrieval to intelligent monitoring and
fraud detection. In this work, we propose the novel task of damaged object
re-identification, which aims at distinguishing changes in visual appearance
due to deformations or missing parts from subtle intra-class variations. To
explore this task, we leverage the power of computer-generated imagery to
create, in a semi-automatic fashion, high-quality synthetic images of the same
bike before and after a damage occurs. The resulting dataset, Bent & Broken
Bicycles (BBBicycles), contains 39,200 images and 2,800 unique bike instances
spanning 20 different bike models. As a baseline for this task, we propose
TransReI3D, a multi-task, transformer-based deep network unifying damage
detection (framed as a multi-label classification task) with object
re-identification. The BBBicycles dataset is available at
https://huggingface.co/datasets/GrainsPolito/BBBicycles
- Abstract(参考訳): インスタンスレベルのオブジェクト再識別は、画像検索からインテリジェントな監視と不正検出まで、基本的なコンピュータビジョンタスクである。
本研究では、変形や欠落による視覚的外観の変化を微妙なクラス内変動から識別することを目的とした、損傷対象再識別の新しい課題を提案する。
この課題を探求するため,我々はコンピュータ生成画像のパワーを利用して,損傷発生前後に同じ自転車の高品質合成画像を半自動的に生成する。
その結果得られたデータセット、bend & broken bicycles(bbbicycles)には、39,200の画像と20の異なる自転車モデルにまたがる2,800のユニークな自転車インスタンスが含まれている。
本課題のベースラインとして,マルチタスクでトランスフォーマーをベースとしたディープネットワークであるTransReI3Dを提案する。
bbbicyclesデータセットはhttps://huggingface.co/datasets/grainspolito/bbbicyclesで利用可能である。
関連論文リスト
- Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - CrashCar101: Procedural Generation for Damage Assessment [6.172653479848284]
3Dカーモデルに損傷を与えるプロシージャ生成パイプラインを提案する。
本研究では, 損傷車両の2次元画像と画素精度アノテーションを組み合わせて, 部分的・損傷的カテゴリの合成画像を得る。
パートセグメンテーションでは、実データと合成データの組み合わせで訓練されたセグメンテーションモデルが、実データのみで訓練されたすべてのモデルより優れていることを示す。
論文 参考訳(メタデータ) (2023-11-11T11:12:28Z) - Towards Viewpoint Robustness in Bird's Eye View Segmentation [85.99907496019972]
AV知覚モデルがカメラ視点の変化にどのように影響するかを考察する。
投機時のピッチ、ヨー、深さ、高さへの小さな変化は、大きな性能低下につながる。
本稿では,新しいビュー合成技術を導入し,収集したデータをターゲットリグの視点に変換する手法を提案する。
論文 参考訳(メタデータ) (2023-09-11T02:10:07Z) - OSRE: Object-to-Spot Rotation Estimation for Bike Parking Assessment [10.489021696058632]
本稿では、カメラに依存しない、よく注釈付けされた合成自転車回転データセットを構築する。
次に、物体検出タスクを拡張して2つの軸における自転車の回転をさらに後退させることにより、物体間回転推定器(OSRE)を提案する。
提案したOSREは、将来性のある結果を提供する合成および実世界のデータに基づいて評価される。
論文 参考訳(メタデータ) (2023-03-01T18:34:10Z) - A Fine-Grained Vehicle Detection (FGVD) Dataset for Unconstrained Roads [29.09167268252761]
本研究では,自動車に搭載された移動カメラから捉えた,野生におけるファイングラインド車両検出データセットについて紹介する。
シーンイメージは5502枚あり、3レベル階層に整理された複数の車両の210個の細粒度ラベルがある。
以前の分類データセットには、さまざまな種類の車も含まれていたが、FGVDデータセットでは、二輪車、オートリックショー、トラックを分類するための新しいクラスラベルが導入されている。
論文 参考訳(メタデータ) (2022-12-30T06:50:15Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - CrossTransformers: spatially-aware few-shot transfer [92.33252608837947]
非常に少ないデータを持つ新しいタスクを考えると、現代の視覚システムは驚くほど急速に低下する。
現代の視覚システムを支えるニューラルネットワーク表現が、どのようにして監督の崩壊にさらされているかを示す。
そこで我々は,伝達を良くする汎用的な機能を促進するために,自己指導型学習を提案する。
論文 参考訳(メタデータ) (2020-07-22T15:37:08Z) - Towards Accurate Vehicle Behaviour Classification With Multi-Relational
Graph Convolutional Networks [22.022759283770377]
モノクロ画像やビデオから車両の挙動を理解するパイプラインを提案する。
このような符号化の時間シーケンスをリカレントネットワークに供給し、車両の挙動をラベル付けする。
提案するフレームワークは,多様なデータセットに対して,さまざまな車両動作を高い忠実度に分類することができる。
論文 参考訳(メタデータ) (2020-02-03T14:34:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。