論文の概要: Generative AI May Prefer to Present National-level Characteristics of
Cities Based on Stereotypical Geographic Impressions at the Continental Level
- arxiv url: http://arxiv.org/abs/2310.04897v1
- Date: Sat, 7 Oct 2023 19:11:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 14:35:07.984608
- Title: Generative AI May Prefer to Present National-level Characteristics of
Cities Based on Stereotypical Geographic Impressions at the Continental Level
- Title(参考訳): 生成aiは大陸レベルでの定型的地理的印象に基づく都市の全国的特性の提示を好むかもしれない
- Authors: Shan Ye
- Abstract要約: Wenxin Yigeから生成されたストリートビュー画像は、様々な国で見られる多様な都市景観を適切に表現していない。
これら生成されたイメージを地理教育やアウトリーチ・イニシアチブに利用すれば、自国に関する既存のステレオタイプ的見解が必然的に強化される可能性がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A simple experiment was conducted to test the ability of the Chinese-based
generative artificial intelligence (AI) platform, Wenxin Yige, to render images
of urban street views of different countries. The study found that images
generated by this AI platform may contain continental-level stereotypes in
terms of showing the level of economic development and modernization. Street
view images generated from Wenxin Yige do not adequately represent the diverse
range of urban landscapes found across different nations. Using these generated
images for geography education or outreach initiatives could inadvertently
strengthen people's existing stereotypical views about individual countries.
- Abstract(参考訳): 中国を拠点とする生成型人工知能(ai)プラットフォームであるwenxin yigeが、異なる国の都市の街並みの画像をレンダリングする能力をテストするために、簡単な実験が行われた。
この研究によると、このAIプラットフォームによって生成された画像は、経済発展と近代化のレベルを示す点で大陸レベルのステレオタイプを含む可能性がある。
wenxin yigeから生成されたストリートビュー画像は、異なる国にまたがる多様な都市景観を適切に表現していない。
これらの生成した画像を地理教育やアウトリーチのイニシアチブに利用することで、個々の国に関する人々の既存のステレオタイプな見解を不注意に強化することができる。
関連論文リスト
- StreetviewLLM: Extracting Geographic Information Using a Chain-of-Thought Multimodal Large Language Model [12.789465279993864]
地理空間予測は災害管理、都市計画、公衆衛生など様々な分野において重要である。
提案するStreetViewLLMは,大規模言語モデルと連鎖推論とマルチモーダルデータソースを統合した新しいフレームワークである。
このモデルは、香港、東京、シンガポール、ロサンゼルス、ニューヨーク、ロンドン、パリを含む7つの世界都市に適用されている。
論文 参考訳(メタデータ) (2024-11-19T05:15:19Z) - Vision-Language Models under Cultural and Inclusive Considerations [53.614528867159706]
視覚言語モデル(VLM)は、日常生活の画像を記述することで視覚障害者を支援する。
現在の評価データセットは、多様な文化的ユーザ背景や、このユースケースの状況を反映していない可能性がある。
我々は、字幕の好みを決定するための調査を作成し、視覚障害者によって撮影された画像を含む既存のデータセットであるVizWizをフィルタリングすることで、文化中心の評価ベンチマークを提案する。
次に,複数のVLMを評価し,その信頼性を文化的に多様な環境で視覚アシスタントとして検証した。
論文 参考訳(メタデータ) (2024-07-08T17:50:00Z) - Sat2Scene: 3D Urban Scene Generation from Satellite Images with Diffusion [77.34078223594686]
本稿では,3次元スパース表現に拡散モデルを導入し,それらをニューラルレンダリング技術と組み合わせることで,直接3次元シーン生成のための新しいアーキテクチャを提案する。
具体的には、まず3次元拡散モデルを用いて、所定の幾何学の点レベルのテクスチャ色を生成し、次にフィードフォワード方式でシーン表現に変換する。
2つの都市規模データセットを用いた実験により,衛星画像から写真リアルなストリートビュー画像シーケンスとクロスビュー都市シーンを生成する能力を示した。
論文 参考訳(メタデータ) (2024-01-19T16:15:37Z) - DIG In: Evaluating Disparities in Image Generations with Indicators for Geographic Diversity [24.887571095245313]
本稿では,テキスト・ツー・イメージ生成システムの現実性,多様性,迅速な生成一貫性を評価するための3つの指標を提案する。
モデルがヨーロッパよりもアフリカや西アジアを推し進める場合には、現実主義や世代ごとの多様性が低いことが分かりました。
おそらく最も興味深いのは、画像生成品質の進歩は、現実世界の地理的表現のコストがかかることを示唆している。
論文 参考訳(メタデータ) (2023-08-11T15:43:37Z) - Understanding Place Identity with Generative AI [2.1441748927508506]
生成可能なAIモデルは、それらを識別可能な都市全体のイメージをキャプチャする可能性がある。
この研究は、構築された環境の人間の知覚を理解するために、生成的AIの能力を探求する最初の試みの一つである。
論文 参考訳(メタデータ) (2023-06-07T02:32:45Z) - Inspecting the Geographical Representativeness of Images from
Text-to-Image Models [52.80961012689933]
本研究では,27カ国540人の参加者からなるクラウドソーシング調査を用いて,生成された画像の地理的代表性を測定した。
国名のない故意に特定されていない入力に対して、生成された画像は、主にアメリカの周囲を反映しており、その後インドが続く。
多くの国でのスコアは依然として低いままで、将来のモデルがより地理的に包括的である必要性を強調している。
論文 参考訳(メタデータ) (2023-05-18T16:08:11Z) - Where We Are and What We're Looking At: Query Based Worldwide Image
Geo-localization Using Hierarchies and Scenes [53.53712888703834]
地理的レベルの異なる関係を利用して、エンドツーエンドのトランスフォーマーベースのアーキテクチャを導入する。
4つの標準ジオローカライゼーションデータセット上で,アートストリートレベルの精度を実現する。
論文 参考訳(メタデータ) (2023-03-07T21:47:58Z) - GIVL: Improving Geographical Inclusivity of Vision-Language Models with
Pre-Training Methods [62.076647211744564]
我々は地理包摂型視覚・言語事前学習モデルであるGIVLを提案する。
1) 類似のカテゴリにおける概念は独自の知識と視覚的特徴を持ち、2) 類似の視覚的特徴を持つ概念は、全く異なるカテゴリに該当する可能性がある。
GIVLは、同様のスケールのデータを事前訓練した類似サイズのモデルと比較して、最先端のSOTA(State-of-the-art)を達成し、ジオディバースなV&Lタスクにおけるよりバランスの取れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-01-05T03:43:45Z) - Mitigating Urban-Rural Disparities in Contrastive Representation Learning with Satellite Imagery [19.93324644519412]
土地被覆の特徴の特定における都市と農村の格差のリスクを考察する。
本稿では,畳み込みニューラルネットワークモデルの多レベル潜在空間を非バイアス化する手法として,コントラッシブラーニングを用いた高密度表現(FairDCL)を提案する。
得られた画像表現は、下流の都市と農村の予測格差を軽減し、現実の衛星画像の最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2022-11-16T04:59:46Z) - Methodological Foundation of a Numerical Taxonomy of Urban Form [62.997667081978825]
本稿では, 生物系統学から得られた都市形態の数値分類法を提案する。
我々は同質の都市組織タイプを導出し、それら間の全体形態的類似性を決定することにより、都市形態の階層的分類を生成する。
フレーミングとプレゼンを行った後、プラハとアムステルダムの2都市でテストを行った。
論文 参考訳(メタデータ) (2021-04-30T12:47:52Z) - Indexical Cities: Articulating Personal Models of Urban Preference with
Geotagged Data [0.0]
本研究は,都市空間における個人の嗜好を特徴付け,特定の観測者に対する未知の好ましくない場所のスペクトルを予測する。
多くの都市認識研究とは異なり、我々の意図は都市品質の客観的な尺度を提供する手段ではなく、都市や都市についての個人的な見解を表現することである。
論文 参考訳(メタデータ) (2020-01-23T11:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。