論文の概要: ArtELingo: A Million Emotion Annotations of WikiArt with Emphasis on
Diversity over Language and Culture
- arxiv url: http://arxiv.org/abs/2211.10780v1
- Date: Sat, 19 Nov 2022 19:34:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 17:06:50.960763
- Title: ArtELingo: A Million Emotion Annotations of WikiArt with Emphasis on
Diversity over Language and Culture
- Title(参考訳): ArtELingo: 言語と文化に対する多様性を重視したWikiArtの100万の感情アノテーション
- Authors: Youssef Mohamed, Mohamed Abdelfattah, Shyma Alhuwaider, Feifan Li,
Xiangliang Zhang, Kenneth Ward Church, Mohamed Elhoseiny
- Abstract要約: ArtELingoは新しいベンチマークとデータセットで、言語や文化の多様性に関する作業を促進するように設計されている。
ArtEmisに続いて、ArtELingoは、アラビア語と中国語でさらに0.79万のアノテーションを追加し、スペイン語で4.8Kの“文化的な”パフォーマンスを評価する。
この多様性は、言語や文化の類似点や相違点を研究することを可能にする。
- 参考スコア(独自算出の注目度): 33.055579812262785
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper introduces ArtELingo, a new benchmark and dataset, designed to
encourage work on diversity across languages and cultures. Following ArtEmis, a
collection of 80k artworks from WikiArt with 0.45M emotion labels and
English-only captions, ArtELingo adds another 0.79M annotations in Arabic and
Chinese, plus 4.8K in Spanish to evaluate "cultural-transfer" performance. More
than 51K artworks have 5 annotations or more in 3 languages. This diversity
makes it possible to study similarities and differences across languages and
cultures. Further, we investigate captioning tasks, and find diversity improves
the performance of baseline models. ArtELingo is publicly available at
https://www.artelingo.org/ with standard splits and baseline models. We hope
our work will help ease future research on multilinguality and culturally-aware
AI.
- Abstract(参考訳): 本稿では,言語や文化の多様性に取り組むための新しいベンチマークとデータセットであるartelingoを紹介する。
WikiArtの80kアートのコレクションであるArtEmisに続いて、ArtELingoは、アラビア語と中国語でさらに0.79Mアノテーションと、スペイン語で4.8Kの「文化的伝達」のパフォーマンスを評価する。
51k以上の美術品は3言語で5以上の注釈を持っている。
この多様性により、言語や文化間の類似性と相違を研究することができる。
さらに,キャプションタスクを調査し,ベースラインモデルの性能を多様性が向上することを示す。
ArtELingoはhttps://www.artelingo.org/で公開されている。
われわれの研究が、多言語と文化的に認識されたAIに関する将来の研究を容易にしてくれることを期待している。
関連論文リスト
- Multi3Hate: Multimodal, Multilingual, and Multicultural Hate Speech Detection with Vision-Language Models [11.82100047858478]
マルチモーダルおよびマルチ言語並列ヘイトスピーチデータセットを作成し、マルチ3Hateと呼ばれるマルチカルチャーアノテータセットで注釈付けする。
5つの言語(英語、ドイツ語、スペイン語、ヒンディー語、マンダリン)にまたがる300のミームサンプルを含んでいる。
文化的背景がデータセットにおけるマルチモーダルヘイトスピーチのアノテーションに大きく影響することを示し、各国間の平均的なペアワイド合意は、ランダムに選択されたアノテータグループよりもわずか74%低い。
論文 参考訳(メタデータ) (2024-11-06T13:06:43Z) - No Culture Left Behind: ArtELingo-28, a Benchmark of WikiArt with Captions in 28 Languages [31.214915292513258]
ArtELingo-28は、textbf28$言語にまたがるビジョン言語ベンチマークである。
課題は、イメージに感情的なキャプションを割り当てる機械学習システムを構築することだ。
言語間移動は、文化的に関連のある言語でより成功していることがわかった。
論文 参考訳(メタデータ) (2024-11-06T09:05:17Z) - CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark [68.21939124278065]
言語と文化の豊富なセットをカバーするために設計された、文化的に多言語なビジュアル質問回答ベンチマーク。
CVQAには文化的に駆動されたイメージと、4大陸30カ国の質問が含まれ、31の言語と13のスクリプトをカバーし、合計10万の質問を提供する。
CVQA上で複数のマルチモーダル大言語モデル (MLLM) をベンチマークし、現在の最先端モデルではデータセットが困難であることを示す。
論文 参考訳(メタデータ) (2024-06-10T01:59:00Z) - How Culturally Aware are Vision-Language Models? [0.8437187555622164]
神話、民俗舞踊、文化記号、シンボルなどの民俗ジャンルからのイメージは、あらゆる文化にとって不可欠である。
本研究は、これらの画像中の文化的特定情報を特定するために、4つの一般的な視覚言語モデルの性能を比較した。
画像キャプションにおける文化意識の度合いを計測する新しい評価指標であるCAS(Cultural Awareness Score)を提案する。
論文 参考訳(メタデータ) (2024-05-24T04:45:14Z) - CulturePark: Boosting Cross-cultural Understanding in Large Language Models [63.452948673344395]
本稿では,LLMを利用した文化データ収集のためのマルチエージェント通信フレームワークであるCultureParkを紹介する。
人間の信念、規範、習慣をカプセル化した高品質な異文化対話を生成する。
我々はこれらのモデルを,コンテンツモデレーション,文化的アライメント,文化教育という3つの下流課題にまたがって評価する。
論文 参考訳(メタデータ) (2024-05-24T01:49:02Z) - The Echoes of Multilinguality: Tracing Cultural Value Shifts during LM Fine-tuning [23.418656688405605]
本研究では, 異なるテスト言語で符号化された文化的価値に言語がどのように影響するかを, 微調整時にどのように修正されるかを検討する。
最後に、トレーニングデータ属性法を用いて、微調整の例やそれらが生み出す言語にパターンを見つける。
論文 参考訳(メタデータ) (2024-05-21T12:55:15Z) - An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance [53.974497865647336]
われわれは、画像の翻訳を文化的に意味のあるものにするための第一歩を踏み出した。
タスクを行うために、最先端の生成モデルからなる3つのパイプラインを構築します。
我々は,翻訳画像の人間による評価を行い,文化的意義と保存の意味を評価する。
論文 参考訳(メタデータ) (2024-04-01T17:08:50Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。