論文の概要: Flickr Africa: Examining Geo-Diversity in Large-Scale, Human-Centric
Visual Data
- arxiv url: http://arxiv.org/abs/2308.08656v1
- Date: Wed, 16 Aug 2023 20:12:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 18:44:25.179907
- Title: Flickr Africa: Examining Geo-Diversity in Large-Scale, Human-Centric
Visual Data
- Title(参考訳): Flickr Africa:大規模で人間中心のビジュアルデータでジオ多様性を調べる
- Authors: Keziah Naggita, Julienne LaChance, Alice Xiang
- Abstract要約: アフリカの各国に関連付けられた地理タグ付きFlickr画像を用いて、大規模な人中心画像の地理的多様性を解析した。
欧州の人口適合国と比較して,利用可能なデータの量と内容について報告する。
我々は、アフリカからのかなりの数の画像が、非地元の写真家によって撮影されている証拠として、他者現象の発見を提示する。
- 参考スコア(独自算出の注目度): 3.4022338837261525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biases in large-scale image datasets are known to influence the performance
of computer vision models as a function of geographic context. To investigate
the limitations of standard Internet data collection methods in low- and
middle-income countries, we analyze human-centric image geo-diversity on a
massive scale using geotagged Flickr images associated with each nation in
Africa. We report the quantity and content of available data with comparisons
to population-matched nations in Europe as well as the distribution of data
according to fine-grained intra-national wealth estimates. Temporal analyses
are performed at two-year intervals to expose emerging data trends.
Furthermore, we present findings for an ``othering'' phenomenon as evidenced by
a substantial number of images from Africa being taken by non-local
photographers. The results of our study suggest that further work is required
to capture image data representative of African people and their environments
and, ultimately, to improve the applicability of computer vision models in a
global context.
- Abstract(参考訳): 大規模画像データセットのバイアスは、地理的文脈の関数としてのコンピュータビジョンモデルの性能に影響を与えることが知られている。
低所得国と中所得国における標準インターネットデータ収集手法の限界を調査するために,アフリカの各国に関連付けられた地理タグ付きflickr画像を用いて,人間中心の地理多様性を大規模に解析した。
我々は、欧州の人口マッチング国と比較したデータ量と内容、および国内富裕層推計によるデータ分布について報告する。
時間的分析は2年間隔で行われ、新しいデータトレンドを暴露する。
さらに,アフリカからの大量の画像が非地元写真家によって撮影されていることを裏付ける「他者」現象の発見を示す。
本研究の結果から,アフリカ人とその環境を代表する画像データを取得し,最終的にはグローバルコンテキストにおけるコンピュータビジョンモデルの適用性を向上させるために,さらなる作業が必要であることが示唆された。
関連論文リスト
- Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Granularity at Scale: Estimating Neighborhood Socioeconomic Indicators
from High-Resolution Orthographic Imagery and Hybrid Learning [1.8369448205408005]
オーバーヘッド画像は、コミュニティ情報が不足しているギャップを埋めるのに役立つ。
機械学習とコンピュータビジョンの最近の進歩により、画像データのパターンから素早く特徴を抽出し、検出することが可能になった。
本研究では, 人口密度, 中央値世帯所得, 教育達成率の2つのアプローチ, 教師付き畳み込みニューラルネットワークと半教師付きクラスタリングについて検討する。
論文 参考訳(メタデータ) (2023-09-28T19:30:26Z) - DIG In: Evaluating Disparities in Image Generations with Indicators for
Geographic Diversity [26.13557628293311]
本稿では,テキスト・ツー・イメージ生成システムの現実性,多様性,迅速な生成一貫性を評価するための3つの指標を提案する。
モデルがヨーロッパよりもアフリカや西アジアを推し進める場合には、現実主義や世代ごとの多様性が低いことが分かりました。
おそらく最も興味深いのは、画像生成品質の進歩は、現実世界の地理的表現のコストがかかることを示唆している。
論文 参考訳(メタデータ) (2023-08-11T15:43:37Z) - Inspecting the Geographical Representativeness of Images from
Text-to-Image Models [52.80961012689933]
本研究では,27カ国540人の参加者からなるクラウドソーシング調査を用いて,生成された画像の地理的代表性を測定した。
国名のない故意に特定されていない入力に対して、生成された画像は、主にアメリカの周囲を反映しており、その後インドが続く。
多くの国でのスコアは依然として低いままで、将来のモデルがより地理的に包括的である必要性を強調している。
論文 参考訳(メタデータ) (2023-05-18T16:08:11Z) - GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.23141626803287]
地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。
まず,地理的適応のための大規模データセットGeoNetを紹介する。
第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。
第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文 参考訳(メタデータ) (2023-03-27T17:59:34Z) - Studying Bias in GANs through the Lens of Race [91.95264864405493]
本研究では, 画像生成モデルの性能と評価が, 学習データセットの人種構成にどのように影響するかを検討する。
その結果, 生成した画像の人種構成は, トレーニングデータの保存に成功していることがわかった。
しかし、推論中に高品質な画像を生成する手法であるトランケーションは、データの人種的不均衡を悪化させる。
論文 参考訳(メタデータ) (2022-09-06T22:25:56Z) - Learning Economic Indicators by Aggregating Multi-Level Geospatial
Information [20.0397537179667]
本研究は,複数レベルの地理的単位から観測される特徴を集約することで,経済指標を予測するための深層学習モデルを提案する。
我々の新しいマルチレベル学習モデルは、人口、購買力、エネルギー消費などの重要な指標を予測する上で、強いベースラインを著しく上回ります。
我々は、不平等と貧困に関する政策・社会科学研究において不可欠な第一歩である不平等を測定するためのマルチレベルモデルについて論じる。
論文 参考訳(メタデータ) (2022-05-03T13:05:39Z) - There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。
我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。
我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文 参考訳(メタデータ) (2022-03-01T21:52:08Z) - Predicting Livelihood Indicators from Community-Generated Street-Level
Imagery [70.5081240396352]
本稿では,クラウドソースによるストリートレベルの画像から重要な生活指標を予測するための,安価でスケーラブルで解釈可能なアプローチを提案する。
全国的に代表される世帯調査で収集した地上データと比較することにより,貧困,人口,健康の指標を正確に予測する上でのアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2020-06-15T18:12:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。