論文の概要: Expanding Accurate Person Recognition to New Altitudes and Ranges: The
BRIAR Dataset
- arxiv url: http://arxiv.org/abs/2211.01917v1
- Date: Thu, 3 Nov 2022 15:51:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 12:04:47.573687
- Title: Expanding Accurate Person Recognition to New Altitudes and Ranges: The
BRIAR Dataset
- Title(参考訳): 正確な人物認識を新しい高度と範囲に拡張する:BRIARデータセット
- Authors: David Cornett III and Joel Brogan and Nell Barber and Deniz Aykac and
Seth Baird and Nick Burchfield and Carl Dukes and Andrew Duncan and Regina
Ferrell and Jim Goddard and Gavin Jager and Matt Larson and Bart Murphy and
Christi Johnson and Ian Shelley and Nisha Srinivas and Brandon Stockwell and
Leanne Thompson and Matt Yohe and Robert Zhang and Scott Dolvin and Hector J.
Santos-Villalobos and David S. Bolme
- Abstract要約: 近年、顔認識技術は、ディープラーニングモデルで使用する大規模で複雑なトレーニングデータセットが利用可能であることから、大幅に進歩している。
しかしこれらのデータセットは、より高度なセキュリティ、法医学、軍事的応用において、限られた実用性を持っている。
本稿では,データセットの収集とキュレートに使用される手法と,現在のデータセットの特徴について述べる。
- 参考スコア(独自算出の注目度): 1.965868228519436
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Face recognition technology has advanced significantly in recent years due
largely to the availability of large and increasingly complex training datasets
for use in deep learning models. These datasets, however, typically comprise
images scraped from news sites or social media platforms and, therefore, have
limited utility in more advanced security, forensics, and military
applications. These applications require lower resolution, longer ranges, and
elevated viewpoints. To meet these critical needs, we collected and curated the
first and second subsets of a large multi-modal biometric dataset designed for
use in the research and development (R&D) of biometric recognition technologies
under extremely challenging conditions. Thus far, the dataset includes more
than 350,000 still images and over 1,300 hours of video footage of
approximately 1,000 subjects. To collect this data, we used Nikon DSLR cameras,
a variety of commercial surveillance cameras, specialized long-rage R&D
cameras, and Group 1 and Group 2 UAV platforms. The goal is to support the
development of algorithms capable of accurately recognizing people at ranges up
to 1,000 m and from high angles of elevation. These advances will include
improvements to the state of the art in face recognition and will support new
research in the area of whole-body recognition using methods based on gait and
anthropometry. This paper describes methods used to collect and curate the
dataset, and the dataset's characteristics at the current stage.
- Abstract(参考訳): 顔認識技術は、ディープラーニングモデルで使用する大規模で複雑なトレーニングデータセットが利用できるため、近年大きく進歩している。
しかしこれらのデータセットは、通常、ニュースサイトやソーシャルメディアプラットフォームから取り除かれた画像で構成されているため、より高度なセキュリティ、法医学、軍事的応用において限られた用途がある。
これらの応用には低い解像度、長い範囲、高い視点が必要である。
これらの重要なニーズを満たすために,我々は,生体認証技術の研究開発(r&d)において極めて困難な条件下で使用されるように設計された,大規模マルチモーダルバイオメトリックデータセットの第1および第2サブセットを収集し,収集した。
これまでにデータセットには35万枚以上の静止画と約1000人の被験者の1300時間分の映像が含まれている。
このデータを収集するために、Nikon DSLRカメラ、さまざまな商用監視カメラ、特殊な長距離R&Dカメラ、Group 1とGroup 2 UAVプラットフォームを使用しました。
目標は、高度1000mまでの人物を正確に認識し、高度の高い角度から認識できるアルゴリズムの開発を支援することである。
これらの進歩は、顔認識技術の改善を含み、歩行と人体計測に基づく方法を用いた全身認識の分野での新しい研究をサポートする。
本稿では,データセットの収集とキュレーションに使用する手法と,データセットの特性について述べる。
関連論文リスト
- DailyDVS-200: A Comprehensive Benchmark Dataset for Event-Based Action Recognition [51.96660522869841]
DailyDVS-200は、イベントベースのアクション認識コミュニティに適したベンチマークデータセットである。
実世界のシナリオで200のアクションカテゴリをカバーし、47人の参加者によって記録され、22,000以上のイベントシーケンスで構成されている。
DailyDVS-200には14の属性がアノテートされており、記録されたアクションの詳細なキャラクタリゼーションが保証されている。
論文 参考訳(メタデータ) (2024-07-06T15:25:10Z) - Deepfake Generation and Detection: A Benchmark and Survey [134.19054491600832]
Deepfakeは、特定の条件下で非常にリアルな顔画像やビデオを作成するための技術だ。
この調査は、ディープフェイクの発生と検出の最新の展開を包括的にレビューする。
本研究では, 顔交換, 顔再現, 話し顔生成, 顔属性編集の4つの代表的なディープフェイク分野の研究に焦点をあてる。
論文 参考訳(メタデータ) (2024-03-26T17:12:34Z) - AG-ReID.v2: Bridging Aerial and Ground Views for Person Re-identification [39.58286453178339]
空中人物再識別(Re-ID)は、コンピュータビジョンにおいて固有の課題を提示する。
AG-ReID.v2は、空中および地上の混合シナリオにおいて、人物Re-ID用に特別に設計されたデータセットである。
このデータセットは、1,615人のユニークな個人の100,502枚の画像で構成され、それぞれに一致するIDと15のソフト属性ラベルが付加されている。
論文 参考訳(メタデータ) (2024-01-05T04:53:33Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - SynDrone -- Multi-modal UAV Dataset for Urban Scenarios [11.338399194998933]
ピクセルレベルのアノテーションを持つ大規模な実際のデータセットの不足は、研究者にとって大きな課題となっている。
本研究では,複数の飛行高度で撮影された画像と3次元データを含むマルチモーダル合成データセットを提案する。
データセットは、UAVアプリケーションをターゲットにした新しいコンピュータビジョンメソッドの開発をサポートするために公開されます。
論文 参考訳(メタデータ) (2023-08-21T06:22:10Z) - FarSight: A Physics-Driven Whole-Body Biometric System at Large Distance
and Altitude [67.55994773068191]
本稿ではFarSightの設計・開発・評価について述べる。
FarSightは、全身(顔、歩行、身体形状の融合)の生体認証のために設計された革新的なソフトウェアシステムである。
我々は、新たに取得したIARPAバイオメトリック認識とAltitude and Rangeデータセットによる同定を用いて、FarSightの有効性を検証した。
論文 参考訳(メタデータ) (2023-06-29T16:14:27Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Urban feature analysis from aerial remote sensing imagery using
self-supervised and semi-supervised computer vision [8.124947412639704]
コンピュータビジョンを用いたオーバーヘッド画像の解析は学術文献で注目されている問題である。
これらの問題は、表現学習の進歩を取り入れた、より汎用的なフレームワークの開発を通じて解決される。
6千万枚の未表示画像から10年間の都市インフラ進化の低レベル検出に成功したことは, 定量的都市研究を推し進めるための我々のアプローチの有意義な可能性を実証している。
論文 参考訳(メタデータ) (2022-08-17T03:41:56Z) - 3D Object Detection from Images for Autonomous Driving: A Survey [68.33502122185813]
画像から3Dオブジェクトを検出することは、自動運転の基本的かつ困難な問題の一つだ。
この問題を2015年から2021年にかけて200以上の研究が行われ、理論、アルゴリズム、応用の幅広い範囲で研究されている。
我々は,この新奇で継続的な研究分野を包括的に調査し,画像に基づく3D検出に最もよく使用されるパイプラインを要約する。
論文 参考訳(メタデータ) (2022-02-07T07:12:24Z) - BWCFace: Open-set Face Recognition using Body-worn Camera [0.8594140167290097]
本稿では,ボディウーンカメラ(BWC)を用いた最先端顔認識のギャップを埋めることを目的とする。
本研究のコントリビューションは,1)ボディウーンカメラを用いて撮影した132人の被験者の合計178Kの顔画像からなるBWCFaceと呼ばれるデータセットの収集と,2)最新のディープラーニングベースの畳み込みニューラルネットワーク(CNN)アーキテクチャのオープンセット評価と,5種類の顔識別機能を組み合わせた。
論文 参考訳(メタデータ) (2020-09-24T02:45:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。