論文の概要: We Don't Speak the Same Language: Interpreting Polarization through
Machine Translation
- arxiv url: http://arxiv.org/abs/2010.02339v2
- Date: Sun, 18 Oct 2020 07:34:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 22:08:34.144934
- Title: We Don't Speak the Same Language: Interpreting Polarization through
Machine Translation
- Title(参考訳): 私たちは同じ言語を話さない:機械翻訳による分極の解釈
- Authors: Ashiqur R. KhudaBukhsh, Rupak Sarkar, Mark S. Kamlet, Tom M. Mitchell
- Abstract要約: 機械翻訳のレンズを通して偏光を解釈する新しい手法を提案する。
現代の機械翻訳手法は、シンプルだが強力で解釈可能なフレームワークを提供することができることを実証する。
著名な4つのニュースネットワークのYouTubeチャンネルがホストする20万本以上のニュースビデオに対して、650万人のユーザーが8660万件のコメントを寄せた。
- 参考スコア(独自算出の注目度): 31.470324365247016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polarization among US political parties, media and elites is a widely studied
topic. Prominent lines of prior research across multiple disciplines have
observed and analyzed growing polarization in social media. In this paper, we
present a new methodology that offers a fresh perspective on interpreting
polarization through the lens of machine translation. With a novel proposition
that two sub-communities are speaking in two different \emph{languages}, we
demonstrate that modern machine translation methods can provide a simple yet
powerful and interpretable framework to understand the differences between two
(or more) large-scale social media discussion data sets at the granularity of
words. Via a substantial corpus of 86.6 million comments by 6.5 million users
on over 200,000 news videos hosted by YouTube channels of four prominent US
news networks, we demonstrate that simple word-level and phrase-level
translation pairs can reveal deep insights into the current political divide --
what is \emph{black lives matter} to one can be \emph{all lives matter} to the
other.
- Abstract(参考訳): 米国の政党、メディア、エリートの間での分極は広く研究されているトピックである。
複数の分野にわたる先行研究の著名なラインは、ソーシャルメディアにおける分極の増大を観察し分析している。
本稿では,機械翻訳のレンズを通して偏光を解釈する新しい手法を提案する。
2つのサブコミュニティが2つの異なる \emph{languages} で話しているという斬新な提案により、現代の機械翻訳手法は、単語の粒度で2つ以上の大規模なソーシャルメディア議論データセットの違いを理解するための、シンプルで強力で解釈可能なフレームワークを提供できることを実証する。
有名な4つのニュースネットワークのYouTubeチャンネルがホストする20万本以上のニュースビデオに対して、650万人のユーザーが8660万件のコメントを寄せた。我々は、単純な単語レベルとフレーズレベルの翻訳ペアが、現在の政治的分裂に対する深い洞察を明らかにすることができることを実証した。
関連論文リスト
- Narratives at Conflict: Computational Analysis of News Framing in Multilingual Disinformation Campaigns [22.05782818652258]
我々は、同じ問題の多言語フレーミングが体系的にどう異なるかを考察する。
ロシアが支援する偽情報キャンペーンの8年間を、15カ国をターゲットとする4つの言語で8万件のニュース記事に費やしています。
参加者のターゲット言語によっては, 意図的かつ一貫して, 特定のフレーミングを好んでいることが分かる。
論文 参考訳(メタデータ) (2024-08-24T18:51:47Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Seamless: Multilingual Expressive and Streaming Speech Translation [71.12826355107889]
本稿では,エンドツーエンドの表現型および多言語翻訳をストリーミング形式で実現するモデル群を紹介する。
まず,多言語およびマルチモーダルのSeamlessM4Tモデル-SeamlessM4T v2の改良版をコントリビュートする。
SeamlessExpressiveとSeamlessStreamingの主なコンポーネントをまとめてSeamlessを作ります。
論文 参考訳(メタデータ) (2023-12-08T17:18:42Z) - Evolving linguistic divergence on polarizing social media [0.0]
会話や単語の頻度、メッセージの感情、単語や絵文字の語彙的意味論といったトピックのばらつきを定量化する。
アメリカの英語は、大きな言語コミュニティの中ではほとんど理解できないが、私たちの発見は、コミュニケーションの誤りが生じる可能性のある領域を指し示している。
論文 参考訳(メタデータ) (2023-09-04T15:21:55Z) - Automated multilingual detection of Pro-Kremlin propaganda in newspapers
and Telegram posts [5.886782001771578]
ロシア連邦とウクライナの大規模な紛争は、前例のない量のニュース記事やソーシャルメディアデータを生み出した。
本研究は、ウクライナ語、ロシア語、ルーマニア語、英語のニュース記事やテレグラムのニュースチャンネルを用いて、戦初月にメディアが世論にどう影響し、どのように反映したかを分析した。
我々はトランスフォーマーと言語特徴に基づく多言語自動プロパガンダ識別の2つの手法を提案し,比較する。
論文 参考訳(メタデータ) (2023-01-25T14:25:37Z) - Same Words, Different Meanings: Interpretable Predictions of
Polarization Trends in Broadcast Media Language and Granger Causal Effects on
Public Discourse [7.0525662747824365]
本稿では,放送メディア言語とソーシャルメディアの談話の関係について検討する。
CNNとFox Newsの10年分のクローズドキャプションとTwitterの話題を分析して、これらのアウトレット間のセマンティックポラリゼーションがどのように進化したかを示します。
以上の結果から,2つのチャネル間において,特に2016年以降において重要なキーワードが議論され,2020年にピークが全盛期を迎えたことが示唆された。
論文 参考訳(メタデータ) (2023-01-20T23:59:26Z) - Computational Assessment of Hyperpartisanship in News Titles [55.92100606666497]
われわれはまず、超党派ニュースタイトル検出のための新しいデータセットを開発するために、人間の誘導する機械学習フレームワークを採用する。
全体的に右派メディアは比例的に超党派的なタイトルを使う傾向にある。
我々は、外国問題、政治システム、ニュースタイトルにおける過党主義を示唆する社会問題を含む3つの主要なトピックを識別する。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - Exploring Polarization of Users Behavior on Twitter During the 2019
South American Protests [15.065938163384235]
われわれは、2019年に南アメリカのいくつかの国を麻痺させた抗議活動について、異なる文脈でTwitter上で偏極を探っている。
政治家のツイートやハッシュタグキャンペーンに対するユーザの支持を(反対かにかかわらず)抗議に対する明確なスタンスで活用することにより、何百万人ものユーザーによる弱いラベル付きスタンスデータセットを構築します。
イベント中の「フィルターバブル」現象の実証的証拠は、ユーザベースがスタンスの観点から均質であるだけでなく、異なるクラスタのメディアからユーザが移行する確率も低いことを示すものである。
論文 参考訳(メタデータ) (2021-04-05T07:13:18Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。