論文の概要: Which country is this picture from? New data and methods for DNN-based
country recognition
- arxiv url: http://arxiv.org/abs/2209.02429v1
- Date: Fri, 2 Sep 2022 10:56:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 12:28:25.614104
- Title: Which country is this picture from? New data and methods for DNN-based
country recognition
- Title(参考訳): この写真はどの国からですか。
DNNに基づく国認識のための新しいデータと方法
- Authors: Omran Alamayreh, Giovanna Maria Dimitri, Jun Wang, Benedetta Tondi,
Mauro Barni
- Abstract要約: これまでの研究は主に、写真が撮影された場所のジオコーディネートの推定に焦点が当てられていた。
約400万枚の画像を含む新しいデータセットであるVIPPGeoデータセットを導入する。
このデータセットを用いて、国別認識問題を分類問題とするディープラーニングアーキテクチャを訓練する。
- 参考スコア(独自算出の注目度): 33.73817899937691
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Predicting the country where a picture has been taken from has many potential
applications, like detection of false claims, impostors identification,
prevention of disinformation campaigns, identification of fake news and so on.
Previous works have focused mostly on the estimation of the geo-coordinates
where a picture has been taken. Yet, recognizing the country where an image has
been taken could potentially be more important, from a semantic and forensic
point of view, than identifying its spatial coordinates. So far only a few
works have addressed this task, mostly by relying on images containing
characteristic landmarks, like iconic monuments. In the above framework, this
paper provides two main contributions. First, we introduce a new dataset, the
VIPPGeo dataset, containing almost 4 million images, that can be used to train
DL models for country classification. The dataset contains only urban images
given the relevance of this kind of image for country recognition, and it has
been built by paying attention to removing non-significant images, like images
portraying faces or specific, non-relevant objects, like airplanes or ships.
Secondly, we used the dataset to train a deep learning architecture casting the
country recognition problem as a classification problem. The experiments, we
performed, show that our network provides significantly better results than
current state of the art. In particular, we found that asking the network to
directly identify the country provides better results than estimating the
geo-coordinates first and then using them to trace back to the country where
the picture was taken.
- Abstract(参考訳): 写真が撮られた国を予測するには、虚偽のクレームの検出、インポスタの識別、偽情報キャンペーンの防止、偽ニュースの識別など、多くの潜在的な応用がある。
これまでの研究は、写真が撮られた場所の座標の推定に重点を置いてきた。
しかし、画像が撮影された国を認識することは、その空間座標を識別するよりも、意味的かつ法医学的な観点からより重要である可能性がある。
これまでのところ、この課題に対処した作品はごくわずかであり、ほとんどが象徴的な記念碑のような特徴的なランドマークを含む画像に依存している。
上記のフレームワークでは,2つの大きな貢献がある。
まず、国別分類のためのdlモデルのトレーニングに使用できる、約400万の画像を含む新しいデータセットであるvippgeoデータセットを紹介します。
このデータセットには、この種の画像が国認識に関連づけられている都市画像のみが含まれており、航空機や船舶のような、顔や特定の無関係な物体を描写する画像のような、重要でない画像を削除することに注意を払っている。
次に,本データセットを用いて,国別認識問題を分類問題とするディープラーニングアーキテクチャを訓練した。
実験の結果、我々のネットワークは現在の技術よりもはるかに優れた結果をもたらすことがわかった。
特に,まずジオコーディネートを推定し,その後に写真が撮られた国まで遡るよりも,ネットワークに国を直接識別するよう求めれば,よりよい結果が得られることがわかった。
関連論文リスト
- AddressCLIP: Empowering Vision-Language Models for City-wide Image Address Localization [57.34659640776723]
そこで我々は,より意味論的に問題を解決するために,AddressCLIPというエンドツーエンドのフレームワークを提案する。
われわれはピッツバーグとサンフランシスコに3つのデータセットを構築した。
論文 参考訳(メタデータ) (2024-07-11T03:18:53Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - PIGEON: Predicting Image Geolocations [44.99833362998488]
本稿では, セマンティックジオセル生成, マルチタスクコントラスト事前学習, 新たな損失関数を組み合わせた新しいジオローカライズシステムを提案する。
PIGEOTTOは、目に見えない場所に効果的に一般化する最初の画像ジオローカライズモデルである。
論文 参考訳(メタデータ) (2023-07-11T23:36:49Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - 3DoF Localization from a Single Image and an Object Map: the Flatlandia
Problem and Dataset [20.986848597435728]
本稿では,新しい視覚的ローカライゼーション課題であるFlatlandiaを提案する。
地図内の対象の既知の空間的レイアウトに対して検出された共通オブジェクトのレイアウトを比較することで、視覚的クエリーをローカライズできるかどうかを検討する。
それぞれに対して,初期ベースラインモデルを提案し,最先端の6DoF法と3DoF法と比較する。
論文 参考訳(メタデータ) (2023-04-13T09:53:09Z) - Where We Are and What We're Looking At: Query Based Worldwide Image
Geo-localization Using Hierarchies and Scenes [53.53712888703834]
地理的レベルの異なる関係を利用して、エンドツーエンドのトランスフォーマーベースのアーキテクチャを導入する。
4つの標準ジオローカライゼーションデータセット上で,アートストリートレベルの精度を実現する。
論文 参考訳(メタデータ) (2023-03-07T21:47:58Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - City-Scale Visual Place Recognition with Deep Local Features Based on
Multi-Scale Ordered VLAD Pooling [5.274399407597545]
本稿では,コンテンツに基づく画像検索に基づいて,都市規模で位置認識を行うシステムを提案する。
まず,視覚的位置認識の包括的分析を行い,その課題を概観する。
次に,画像表現ベクトルに空間情報を埋め込むために,畳み込み型ニューラルネットワークアクティベーションを用いた単純なプーリング手法を提案する。
論文 参考訳(メタデータ) (2020-09-19T15:21:59Z) - Google Landmarks Dataset v2 -- A Large-Scale Benchmark for
Instance-Level Recognition and Retrieval [9.922132565411664]
大規模できめ細かいインスタンス認識と画像検索のための新しいベンチマークであるGoogle Landmarks dataset v2(GLDv2)を紹介した。
GLDv2は、500万以上の画像と200万のインスタンスラベルを含む、これまでで最大のデータセットである。
ウィキメディア・コモンズ(Wikimedia Commons)は、世界最大のクラウドソースによるランドマーク写真コレクションである。
論文 参考訳(メタデータ) (2020-04-03T22:52:17Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z) - Automatic Signboard Detection and Localization in Densely Populated
Developing Cities [0.0]
自然シーン画像における看板検出は, エラーのない情報検索における最優先課題である。
本稿では,看板を自動的に検出し,そのような都市に適した新しい物体検出手法を提案する。
提案手法では,符号板を正確に検出できる(背景の形状や色が多様であっても平均精度は0.90 mAP)。
論文 参考訳(メタデータ) (2020-03-04T08:04:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。