論文の概要: AI's Regimes of Representation: A Community-centered Study of
Text-to-Image Models in South Asia
- arxiv url: http://arxiv.org/abs/2305.11844v1
- Date: Fri, 19 May 2023 17:35:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 13:10:39.914097
- Title: AI's Regimes of Representation: A Community-centered Study of
Text-to-Image Models in South Asia
- Title(参考訳): AIの表現規則:南アジアにおけるコミュニティ中心のテキスト・画像モデルの研究
- Authors: Rida Qadri, Renee Shelby, Cynthia L. Bennett, Emily Denton
- Abstract要約: 我々は、生産的なAIが、世界の力や地域の力の不平等によって形作られた南アジアの文化を見るために、外部の人が目を向けてどのように再現できるかを示す。
我々は,T2Iモデルの開発に責任を負うための授業を蒸留し,具体的な経路を推奨する。
- 参考スコア(独自算出の注目度): 18.308417975842058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a community-centered study of cultural limitations of
text-to-image (T2I) models in the South Asian context. We theorize these
failures using scholarship on dominant media regimes of representations and
locate them within participants' reporting of their existing social
marginalizations. We thus show how generative AI can reproduce an outsiders
gaze for viewing South Asian cultures, shaped by global and regional power
inequities. By centering communities as experts and soliciting their
perspectives on T2I limitations, our study adds rich nuance into existing
evaluative frameworks and deepens our understanding of the culturally-specific
ways AI technologies can fail in non-Western and Global South settings. We
distill lessons for responsible development of T2I models, recommending
concrete pathways forward that can allow for recognition of structural
inequalities.
- Abstract(参考訳): 本稿では,南アジアにおけるテキスト・ツー・イメージ(t2i)モデルの文化的制限に関するコミュニティ中心の研究について述べる。
我々は、これらの失敗を、支配的なメディア体制の表現に奨学金を用いて理論化し、既存の社会的疎外化に関する参加者の報告の中に配置する。
本研究では,世界的・地域的パワーの不平等によって形成された南アジア文化を観察するために,外界の人々の視線を再現するaiを提示する。
専門家としてコミュニティを集中させ、t2iの制限に関する彼らの見解を暗示することで、この研究は既存の評価フレームワークに豊富なニュアンスを加え、非西洋およびグローバル南の環境でaiテクノロジーが失敗する文化特有の方法に対する理解を深めます。
我々はt2iモデルの責任ある開発のための教訓を蒸留し、構造的不等式を認識できる具体的な経路を推奨する。
関連論文リスト
- Exploring the Boundaries of Content Moderation in Text-to-Image Generation [9.476463361600828]
本稿では,5つのテキスト・ツー・イメージ(T2I)生成プラットフォームのコミュニティ安全ガイドラインを分析し,5つのT2Iモデルを監査する。
安全概念の定義と運用は困難であり, 公式の安全ガイドラインとT2Iモデルの実際の挙動の相違が反映されている。
論文 参考訳(メタデータ) (2024-09-09T18:37:08Z) - Do Generative AI Models Output Harm while Representing Non-Western Cultures: Evidence from A Community-Centered Approach [8.805524738976073]
本研究では,生成人工知能(GAI)モデル,特にテキスト・ツー・イメージ・ジェネレータ(T2Is)が非西洋文化の表現に与える影響について検討する。
論文 参考訳(メタデータ) (2024-07-20T07:01:37Z) - Beyond Aesthetics: Cultural Competence in Text-to-Image Models [34.98692829036475]
CUBEは、テキスト・ツー・イメージ・モデルの文化的能力を評価するための最初のベンチマークである。
CUBEは、異なる地理的文化圏の8か国に関連する文化的アーティファクトをカバーしている。
CUBE-CSpaceは、文化的多様性を評価する基盤となる文化的アーティファクトのより大きなデータセットである。
論文 参考訳(メタデータ) (2024-07-09T13:50:43Z) - Generative AI and Digital Neocolonialism in Global Education: Towards an Equitable Framework [0.5586073503694489]
本稿では、生成的人工知能(GenAI)が西洋以外の社会に西洋のイデオロギーをどう強制するかを批判的に論じる。
これは、地域の利害関係者や世界的な利害関係者がこれらの効果を緩和する戦略を示唆している。
論文 参考訳(メタデータ) (2024-06-05T05:43:55Z) - T-HITL Effectively Addresses Problematic Associations in Image
Generation and Maintains Overall Visual Quality [52.5529784801908]
我々は、人口集団と意味概念の間の問題的関連性の生成に焦点をあてる。
本稿では,問題のある関連の低減と視覚的品質の維持を両立させるため,T-HITL(two- Human-in-the-loop)を用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-27T00:29:33Z) - Language Models: A Guide for the Perplexed [51.88841610098437]
このチュートリアルは、言語モデルを学ぶ人と、興味を持ち、もっと学びたいと思う人とのギャップを狭めることを目的としています。
実験を通して学ぶことができる質問に焦点を当てた科学的視点を提供する。
言語モデルは、現在、その開発に繋がる研究の文脈に置かれています。
論文 参考訳(メタデータ) (2023-11-29T01:19:02Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z) - R&B: Region and Boundary Aware Zero-shot Grounded Text-to-image
Generation [74.5598315066249]
拡散モデルを用いてゼロショット接地T2I生成を探索する。
本稿では,地域境界(R&B)を意識したクロスアテンションガイダンス手法を提案する。
論文 参考訳(メタデータ) (2023-10-13T05:48:42Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - On the Cultural Gap in Text-to-Image Generation [75.69755281031951]
テキスト・トゥ・イメージ(T2I)生成における課題のひとつは、トレーニングデータに存在する文化ギャップの意図しない反映である。
クロスカルチャー画像を生成するT2Iモデルの能力を体系的に評価するベンチマークは存在しない。
本稿では,モデルが対象文化にどの程度適しているかを評価するため,包括的評価基準付きChallenging Cross-Cultural (C3)ベンチマークを提案する。
論文 参考訳(メタデータ) (2023-07-06T13:17:55Z) - Critical pedagogy in the implementation of educational technologies [0.0]
本稿では,発展途上国における学習技術導入の課題について概観する。
研究課題は、教育が学習者に社会民主主義社会へのフル参加をどの程度与えているかである。
論文 参考訳(メタデータ) (2020-05-30T12:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。