論文の概要: Characterising User Content on a Multi-lingual Social Network
- arxiv url: http://arxiv.org/abs/2004.11480v1
- Date: Thu, 23 Apr 2020 22:25:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 10:06:01.966540
- Title: Characterising User Content on a Multi-lingual Social Network
- Title(参考訳): マルチ言語ソーシャルネットワークにおけるユーザコンテンツの特徴付け
- Authors: Pushkal Agarwal, Kiran Garimella, Sagar Joglekar, Nishanth Sastry,
Gareth Tyson
- Abstract要約: インドにおけるShareChatと呼ばれる多言語ソーシャルネットワークの特性について紹介する。
私たちは、2019年のインド総選挙の前と14の言語で72週間にわたって、網羅的なデータセットを収集しました。
テルグ語、マラヤラム語、タミル語、カナダ語は政治的イメージの誘惑に支配的であることが判明した。
- 参考スコア(独自算出の注目度): 9.13241181020543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media has been on the vanguard of political information diffusion in
the 21st century. Most studies that look into disinformation, political
influence and fake-news focus on mainstream social media platforms. This has
inevitably made English an important factor in our current understanding of
political activity on social media. As a result, there has only been a limited
number of studies into a large portion of the world, including the largest,
multilingual and multi-cultural democracy: India. In this paper we present our
characterisation of a multilingual social network in India called ShareChat. We
collect an exhaustive dataset across 72 weeks before and during the Indian
general elections of 2019, across 14 languages. We investigate the cross
lingual dynamics by clustering visually similar images together, and exploring
how they move across language barriers. We find that Telugu, Malayalam, Tamil
and Kannada languages tend to be dominant in soliciting political images (often
referred to as memes), and posts from Hindi have the largest cross-lingual
diffusion across ShareChat (as well as images containing text in English). In
the case of images containing text that cross language barriers, we see that
language translation is used to widen the accessibility. That said, we find
cases where the same image is associated with very different text (and
therefore meanings). This initial characterisation paves the way for more
advanced pipelines to understand the dynamics of fake and political content in
a multi-lingual and non-textual setting.
- Abstract(参考訳): ソーシャルメディアは21世紀の政治的情報拡散の先駆者となっている。
偽情報、政治的影響、偽ニュースを扱うほとんどの研究は、主流のソーシャルメディアプラットフォームに焦点を当てている。
これは必然的に、私たちのソーシャルメディアにおける政治活動に対する理解において、英語が重要な要素となった。
その結果、世界最大の多言語多文化民主主義(インド)を含む、世界の大部分での限られた研究しか行われていない。
本稿ではインドにおけるShareChatと呼ばれる多言語ソーシャルネットワークの特徴について述べる。
私たちは、2019年のインド総選挙前の72週間にわたって、14の言語で包括的なデータセットを収集しました。
視覚的に類似した画像をクラスタリングすることで言語間動態を解析し、言語障壁を越えてどのように移動するかを探る。
テルグ語、マラヤラム語、タミル語、カナダ語は政治的イメージの勧誘(しばしばミームと呼ばれる)において支配的な傾向にあり、ヒンディー語からの投稿は共有チャット(英語のテキストを含む画像)で最大の言語間拡散を持つ。
言語の壁を越えるテキストを含む画像の場合、言語翻訳はアクセシビリティを広げるために使われることがわかります。
そうは言っても、同じイメージがまったく異なるテキスト(つまり意味)に関連付けられている場合を見つけます。
この初期の特徴付けは、より高度なパイプラインが、多言語および非テキスト環境での偽および政治的コンテンツのダイナミクスを理解するための道を開く。
関連論文リスト
- CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark [68.21939124278065]
言語と文化の豊富なセットをカバーするために設計された、文化的に多言語なビジュアル質問回答ベンチマーク。
CVQAには文化的に駆動されたイメージと、4大陸30カ国の質問が含まれ、31の言語と13のスクリプトをカバーし、合計10万の質問を提供する。
CVQA上で複数のマルチモーダル大言語モデル (MLLM) をベンチマークし、現在の最先端モデルではデータセットが困難であることを示す。
論文 参考訳(メタデータ) (2024-06-10T01:59:00Z) - Multilingual Diversity Improves Vision-Language Representations [66.41030381363244]
このデータセットの事前トレーニングは、ImageNet上で英語のみまたは英語が支配するデータセットを使用してパフォーマンスが向上する。
GeoDEのような地理的に多様なタスクでは、アフリカから得られる最大の利益とともに、すべての地域における改善も観察します。
論文 参考訳(メタデータ) (2024-05-27T08:08:51Z) - An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance [53.974497865647336]
われわれは、画像の翻訳を文化的に意味のあるものにするための第一歩を踏み出した。
タスクを行うために、最先端の生成モデルからなる3つのパイプラインを構築します。
我々は,翻訳画像の人間による評価を行い,文化的意義と保存の意味を評価する。
論文 参考訳(メタデータ) (2024-04-01T17:08:50Z) - Evolving linguistic divergence on polarizing social media [0.0]
会話や単語の頻度、メッセージの感情、単語や絵文字の語彙的意味論といったトピックのばらつきを定量化する。
アメリカの英語は、大きな言語コミュニティの中ではほとんど理解できないが、私たちの発見は、コミュニケーションの誤りが生じる可能性のある領域を指し示している。
論文 参考訳(メタデータ) (2023-09-04T15:21:55Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Bridging Nations: Quantifying the Role of Multilinguals in Communication
on Social Media [14.646734380673648]
言語間情報交換における多言語ユーザの構造的役割とコミュニケーションの影響を定量化する。
多言語ネットワークの隣人を持つと、他の言語 16 倍と 4 倍のハッシュタグをそれぞれ共有するモノリンガルの確率が増加する。
国境を越えての情報交換を強調することで、この研究は、情報やアイデアが世界中でどのように広まるかという重要な要素を浮き彫りにする。
論文 参考訳(メタデータ) (2023-04-07T18:01:25Z) - BERTuit: Understanding Spanish language in Twitter through a native
transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。
私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文 参考訳(メタデータ) (2022-04-07T14:28:51Z) - Multilingual Abusiveness Identification on Code-Mixed Social Media Text [1.8275108630751844]
Indic 言語からなる多言語 Moj データセット上での悪用性同定手法を提案する。
我々のアプローチは、非英語のソーシャルメディアコンテンツにおける共通の課題に取り組み、他の言語にも拡張できる。
論文 参考訳(メタデータ) (2022-03-01T12:23:25Z) - M2H2: A Multimodal Multiparty Hindi Dataset For Humor Recognition in
Conversations [72.81164101048181]
テレビシリーズ『Shrimaan Shrimati Phir Se』の13話から6,191発の発声を含む会話におけるマルチモーダル・マルチパーティ・ヒンディー・ヒューム(M2H2)認識のためのデータセットを提案する。
それぞれの発話はユーモア/非感情ラベルでアノテートされ、音響、視覚、テキストのモダリティを含む。
M2H2データセットにおける実験結果から,マルチモーダル情報はユーモア認識のための単調な情報を補完することが示された。
論文 参考訳(メタデータ) (2021-08-03T02:54:09Z) - Sentiment Analysis for Roman Urdu Text over Social Media, a Comparative
Study [0.0]
ローマ・ウルドゥー語は、パキスタンとインドのソーシャルネットワークにおいて最も支配的な言語である。
本稿では,ロマン・ウルドゥ語文の感情を調べるために用いられた先行概念と戦略について述べる。
論文 参考訳(メタデータ) (2020-10-05T16:19:00Z) - Images and Misinformation in Political Groups: Evidence from WhatsApp in
India [6.421670116083633]
われわれは、2019年のインド国民選挙に至る期間に焦点を当てて、インドにおける政治的指向のWhatsAppグループを多数調査している。
ランダム画像や人気画像のサンプルをラベル付けすることで,共有画像の約13%が誤情報であることが判明した。
機械学習手法は、バイラル画像が誤情報であるかどうかを予測するのに使えるが、時間の経過とともにコンテンツの変化に弱い。
論文 参考訳(メタデータ) (2020-05-19T23:00:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。