論文の概要: Assessing the Geographic Diversity of AI's Platial Representations in Image Generation
- arxiv url: http://arxiv.org/abs/2606.05188v1
- Date: Tue, 28 Apr 2026 11:57:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.645988
- Title: Assessing the Geographic Diversity of AI's Platial Representations in Image Generation
- Title(参考訳): 画像生成におけるAIのプラチアル表現の地理的多様性の評価
- Authors: Zilong Liu, Krzysztof Janowicz, Mina Karimi,
- Abstract要約: ケーススタディにより,画像生成における地理的多様性を評価する方法について述べる。
例えば、古いモデルは、低画質の画像を生成するにもかかわらず、より大きな地理的多様性を示すことができる。
地理的多様性の欠如の根底にある明らかなモデル同質性を観察する。
- 参考スコア(独自算出の注目度): 7.106770983243944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: (Gen)AI diversity is not merely an ethical issue. From the perspective of geographic information science (GIScience), it could be interpreted as a function of uncertainty and as a form of cognitive bias, embedded in AI outputs. Recent work has sought to develop information-theoretic diversity measures and apply them to evaluate AI-chatbot outputs in a geographic context. As the AI ecosystem to which we are exposed on a daily basis becomes rapidly multimodal, we believe it is important to examine geographic diversity across various modalities. Focusing on images, this paper aims to fill this research gap. First, we select the GPT and DALL-E models as state-of-the-art examples and point out how assessing their geographic diversity involves various stages, including prompt revision and image generation. Then, taking inspiration from species diversity measures in ecological research, we incorporate similarity weighting into the measurement of geographic diversity. Next, we demonstrate how to evaluate geographic diversity in image generation through a case study. Our analysis reveals several counterintuitive findings. For instance, older models can exhibit greater geographic diversity despite producing lower-quality images, and prompt revision yields greater geographic diversity than image generation. At the same time, we observe explicit model homogeneity underlying the lack of geographic diversity, as the selected models consistently depict the same prototypical geo-specific feature or similar features. This is concerning, as it risks producing stereotypical representations of places.
- Abstract(参考訳): (元)AIの多様性は単なる倫理問題ではない。
地理情報科学(GIScience)の観点からは、不確実性の関数として、そしてAI出力に埋め込まれた認知バイアスの一形態として解釈できる。
最近の研究は、情報理論の多様性尺度を開発し、それらを地理的文脈におけるAI-チャットボット出力の評価に適用することを目指している。
日常的に露出するAIエコシステムが急速にマルチモーダル化するにつれ、さまざまなモダリティの地理的多様性を調べることが重要であると私たちは考えています。
本稿では,画像に着目し,この研究ギャップを埋めることを目的とする。
まず、GPTモデルとDALL-Eモデルを最先端の例として選択し、その地理的多様性を評価するには、即時修正や画像生成など、様々な段階が伴うことを指摘する。
そして,生態学研究における種多様性尺度からインスピレーションを得て,地理的多様性の測定に類似度重み付けを取り入れた。
次に、ケーススタディにより、画像生成における地理的多様性の評価方法を示す。
分析の結果,いくつかの逆直観的所見がみられた。
例えば、より古いモデルは、低品質の画像を生成するにもかかわらず、より地理的に多様性を示すことができ、即ち、画像生成よりも地理的に多様性を持つ。
同時に,地理的多様性の欠如の根底にある明らかなモデル同質性も観察し,選択されたモデルが常に同じ原型的地理的特有な特徴や類似した特徴を表現している。
これは、場所のステレオタイプ表現を発生させるリスクがあるためである。
関連論文リスト
- Geographic Bias and Diversity in AI Evaluation [13.861735837455626]
この章は、(生成的)AIにおけるバイアスの地理的性質を調査する。
トレーニングデータの表現バイアスから,言語モデルの事実的リコールにおける地域差まで,さまざまな地理的バイアスを識別する。
近年の研究では、生成AIの出力の地理的多様性を評価することで、後者のバイアスにどのように対処するかを示す。
論文 参考訳(メタデータ) (2026-04-28T11:32:32Z) - GeoDiv: Framework For Measuring Geographical Diversity In Text-To-Image Models [42.84755778627983]
テキスト・ツー・イメージ(T2I)モデルは急速に普及しているが、その出力には地理的多様性が欠如し、ステレオタイプが強化され、表示が間違っていた。
大規模言語と視覚言語モデルを活用した2つの相補的軸に沿った地理的多様性の評価フレームワークであるGeoDivを紹介する。
GeoDivは、多様性の一貫性の欠如を明らかにし、モデルがバイアスのある表現をデフォルトとする、きめ細かい属性を特定する。
論文 参考訳(メタデータ) (2026-02-25T17:08:43Z) - The Factuality Tax of Diversity-Intervened Text-to-Image Generation: Benchmark and Fact-Augmented Intervention [61.80236015147771]
我々は多様性の介入とT2Iモデルにおける人口統計学的事実性とのトレードオフを定量化する。
DoFaiRの実験では、多様性指向の指示によって、性別や人種の異なる集団の数が増加することが明らかになった。
本研究では,歴史における世代ごとのジェンダーや人種構成について,言語化された事実情報を反映したFact-Augmented Intervention (FAI)を提案する。
論文 参考訳(メタデータ) (2024-06-29T09:09:42Z) - Improving Geo-diversity of Generated Images with Contextualized Vendi Score Guidance [12.33170407159189]
最先端のテキスト・トゥ・イメージ生成モデルでは、日常の物体を現実世界の真の多様性で描写するのに苦労する。
本稿では, 遅延拡散モデルの後方ステップを導出し, サンプルの多様性を高めるための推論時間介入, 文脈化されたVendi Score Guidance(c-VSG)を導入する。
c-VSGは、画像の品質と一貫性を同時に維持または改善しつつ、最もパフォーマンスの悪い領域と平均の両方において、生成画像の多様性を著しく向上させる。
論文 参考訳(メタデータ) (2024-06-06T23:35:51Z) - Towards Geographic Inclusion in the Evaluation of Text-to-Image Models [25.780536950323683]
我々は,アフリカ,ヨーロッパ,東南アジアにおけるアノテータの地理的表現,視覚的魅力,実画像および生成画像の一貫性に対する認識の程度について検討した。
例えば、異なる場所のアノテータは、地理的に代表的であると見なされる領域の誇張されたステレオタイプ的な描写について、しばしば意見が一致しない。
自動評価と人的評価を改善するためのステップを推奨する。
論文 参考訳(メタデータ) (2024-05-07T16:23:06Z) - GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.23141626803287]
地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。
まず,地理的適応のための大規模データセットGeoNetを紹介する。
第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。
第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文 参考訳(メタデータ) (2023-03-27T17:59:34Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - GIVL: Improving Geographical Inclusivity of Vision-Language Models with
Pre-Training Methods [62.076647211744564]
我々は地理包摂型視覚・言語事前学習モデルであるGIVLを提案する。
1) 類似のカテゴリにおける概念は独自の知識と視覚的特徴を持ち、2) 類似の視覚的特徴を持つ概念は、全く異なるカテゴリに該当する可能性がある。
GIVLは、同様のスケールのデータを事前訓練した類似サイズのモデルと比較して、最先端のSOTA(State-of-the-art)を達成し、ジオディバースなV&Lタスクにおけるよりバランスの取れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-01-05T03:43:45Z) - Random Network Distillation as a Diversity Metric for Both Image and
Text Generation [62.13444904851029]
我々は、どんな種類のデータにも、どんな種類のデータにも、自然にも適用できる新しい多様性指標を開発した。
私たちはこのメトリクスを画像とテキストの両方で検証し、デプロイします。
論文 参考訳(メタデータ) (2020-10-13T22:03:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。