Fugu-MT 論文翻訳(概要): Revisiting Vehicle Color Recognition in Long-Tailed Surveillance Scenarios

論文の概要: Revisiting Vehicle Color Recognition in Long-Tailed Surveillance Scenarios

arxiv url: http://arxiv.org/abs/2606.13625v1
Date: Thu, 11 Jun 2026 17:39:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-12 15:55:27.957267
Title: Revisiting Vehicle Color Recognition in Long-Tailed Surveillance Scenarios
Title（参考訳）: 長距離サーベイランスシナリオにおける車両色認識の再検討
Authors: Vinícius Orrú, Bruno H. Foggiatto, Gabriel E. Lima, David Menotti, Rayson Laroca,
Abstract要約: 本稿では,厳しいクラス不均衡下での車両色認識の包括的研究を,挑戦的な実環境監視データセットを用いて提案する。最良のアプローチは94.6%のマイクロパフォーマンス精度と79.7%のマクロ精度を実現し、最近の文献に比べてマクロ精度が8.2ポイント向上した。手動によるエラー解析は、人間のアノテーションでさえ、残りの多くの失敗は視覚的に曖昧であることを示している。
参考スコア（独自算出の注目度）: 2.0215972783560745
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Vehicle color recognition is an important cue for vehicle identification in surveillance systems, especially when license plates are illegible due to low resolution, occlusion, motion blur, or poor illumination. However, real-world vehicle color distributions are highly imbalanced, making overall accuracy insufficient to assess performance on rare but operationally relevant colors. This paper presents a comprehensive study of vehicle color recognition under severe class imbalance using UFPR-VeSV, a challenging real-world surveillance dataset. We investigate synthetic minority-class augmentation through two off-the-shelf generative strategies: text-conditioned image generation with RunDiffusion/JuggernautXL and image-conditioned color editing with Gemini 2.0 Flash. The curated synthetic data are combined with modern visual representations, loss reweighting, learning-rate scheduling, color-safe augmentation, foreground-aware preprocessing, and ensemble fusion. The bestperforming approach achieves 94.6% micro accuracy and 79.7% macro accuracy, improving macro accuracy by 8.2 percentage points over recent literature. A manual error analysis further shows that many remaining failures are visually ambiguous even for human annotators, highlighting the practical limits of color-based vehicle identification in unconstrained surveillance imagery. The generated images and source code are publicly available at https://github.com/viniciusorru/vcr-synthetic
Abstract（参考訳）: 車両の色認識は、特に低解像度、閉塞、動きのぼやけ、照明不足などにより、車両の識別に重要な手がかりとなる。しかし、実世界の車両の色分布は極めて不均衡であり、全体の精度が低いため、稀だが運用上関連する色の性能を評価するには不十分である。本稿では,UFPR-VeSVを用いた車両色認識の高度不均衡下での総合的研究について述べる。本稿では,RunDiffusion/JuggernautXLによるテキスト条件付き画像生成とGemini 2.0 Flashによる画像条件付きカラー編集の2つのオフザシェルフ生成戦略を用いて,合成マイノリティクラスの拡張について検討する。キュレートされた合成データは、現代の視覚表現、損失再重み付け、学習率スケジューリング、色安全性向上、前景認識前処理、アンサンブル融合と組み合わせられる。優れた性能のアプローチは94.6%のマイクロ精度と79.7%のマクロ精度を実現し、最近の文献ではマクロ精度を8.2%向上させた。手動によるエラー解析により、人間のアノテーションに対してさえ、残っていた多くの失敗が視覚的に不明瞭であることが示され、制約のない監視画像における色に基づく車両識別の実用的限界が強調された。生成された画像とソースコードはhttps://github.com/viniciusorru/vcr-syntheticで公開されている。

関連論文リスト

Too Vivid to Be Real? Benchmarking and Calibrating Generative Color Fidelity [55.22847424233036]
現実的な世代における色忠実度を客観的に評価するために、色忠実度データセット(CFD)と色忠実度メトリック(CFM)を提案する。 CFDには1,3M以上の実画像と合成画像が含まれており、CFMは知覚色忠実度を学習するためにマルチモーダルエンコーダを使用している。本研究では,空間的時間的誘導尺度を適応的に調整し,色信頼性を向上させる訓練不要なカラーフィデリティ精細化(CFR)を提案する。
論文参考訳（メタデータ） (2026-03-11T17:18:12Z)
AIDOVECL: AI-generated Dataset of Outpainted Vehicles for Eye-level Classification and Localization [0.0]
この研究は、注釈付きデータ不足の問題に対処するために、アウトペイントを活用する新しいアプローチを導入している。この技術は、自動運転、都市計画、環境モニタリングにおいて特に困難な課題に応用する。塗装された車両による増強は、全体のパフォーマンス指標を最大8%改善し、未表現クラスの予測を最大20%向上させる。
論文参考訳（メタデータ） (2024-10-31T16:46:23Z)
Toward Enhancing Vehicle Color Recognition in Adverse Conditions: A Dataset and Benchmark [2.326743352134195]
車両色認識(VCR)は、視覚的に区別可能な車両の属性であるため、重要な研究の関心を集めている。このタスクの既存の手法の成功にもかかわらず、文献で使用されるデータセットの比較的低い複雑さは、ほとんど見過ごされてきている。この研究は、より困難なVCRシナリオを表す新しいデータセットをコンパイルすることで、このギャップに対処する。
論文参考訳（メタデータ） (2024-08-21T12:54:41Z)
Breaking Modality Disparity: Harmonized Representation for Infrared and Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文参考訳（メタデータ） (2023-04-12T06:49:56Z)
Detecting Recolored Image by Spatial Correlation [60.08643417333974]
画像のリカラー化は、画像の色値を操作して新しいスタイルを与える、新たな編集技術である。本稿では,空間相関の観点から,従来型と深層学習による再色検出の汎用的検出能力を示す解を探索する。提案手法は,複数のベンチマークデータセット上での最先端検出精度を実現し,未知の種類の再色法を適切に一般化する。
論文参考訳（メタデータ） (2022-04-23T01:54:06Z)
Beyond the Spectrum: Detecting Deepfakes via Re-Synthesis [69.09526348527203]
ディープフェイク(Deepfakes)として知られる非常に現実的なメディアは、現実の目から人間の目まで区別できない。本研究では,テスト画像を再合成し,検出のための視覚的手がかりを抽出する,新しい偽検出手法を提案する。種々の検出シナリオにおいて,提案手法の摂動に対する有効性の向上,GANの一般化,堅牢性を示す。
論文参考訳（メタデータ） (2021-05-29T21:22:24Z)
Drone-based RGB-Infrared Cross-Modality Vehicle Detection via Uncertainty-Aware Learning [59.19469551774703]
ドローンによる車両検出は、空中画像中の車両の位置とカテゴリーを見つけることを目的としている。我々はDroneVehicleと呼ばれる大規模ドローンベースのRGB赤外線車両検出データセットを構築した。私たちのDroneVehicleは28,439RGBの赤外線画像を収集し、都市道路、住宅地、駐車場、その他のシナリオを昼から夜までカバーしています。
論文参考訳（メタデータ） (2020-03-05T05:29:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。