論文の概要: Challenges in Translation of Emotions in Multilingual User-Generated
Content: Twitter as a Case Study
- arxiv url: http://arxiv.org/abs/2106.10719v1
- Date: Sun, 20 Jun 2021 16:12:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 08:22:56.528550
- Title: Challenges in Translation of Emotions in Multilingual User-Generated
Content: Twitter as a Case Study
- Title(参考訳): 多言語ユーザ生成コンテンツにおける感情翻訳の課題:Twitterを事例として
- Authors: Hadeel Saadany, Constantin Orasan, Rocio Caro Quintana, Felix do
Carmo, Leonardo Zilio
- Abstract要約: 異なる言語における感情の翻訳において,Twitterデータに特有の言語現象が存在することを示す。
また、テキスト中の感情の保存に関して、MTシステムの性能を評価するためによく使われる手法の能力を評価する。
- 参考スコア(独自算出の注目度): 1.3999481573773072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although emotions are universal concepts, transferring the different shades
of emotion from one language to another may not always be straightforward for
human translators, let alone for machine translation systems. Moreover, the
cognitive states are established by verbal explanations of experience which is
shaped by both the verbal and cultural contexts. There are a number of verbal
contexts where expression of emotions constitutes the pivotal component of the
message. This is particularly true for User-Generated Content (UGC) which can
be in the form of a review of a product or a service, a tweet, or a social
media post. Recently, it has become common practice for multilingual websites
such as Twitter to provide an automatic translation of UGC to reach out to
their linguistically diverse users. In such scenarios, the process of
translating the user's emotion is entirely automatic with no human
intervention, neither for post-editing nor for accuracy checking. In this
research, we assess whether automatic translation tools can be a successful
real-life utility in transferring emotion in user-generated multilingual data
such as tweets. We show that there are linguistic phenomena specific of Twitter
data that pose a challenge in translation of emotions in different languages.
We summarise these challenges in a list of linguistic features and show how
frequent these features are in different language pairs. We also assess the
capacity of commonly used methods for evaluating the performance of an MT
system with respect to the preservation of emotion in the source text.
- Abstract(参考訳): 感情は普遍的な概念であるが、感情の異なる色合いをある言語から別の言語に移すことは、機械翻訳システムだけでなく、人間の翻訳者にとって必ずしも単純ではない。
さらに、認知状態は、言語と文化の両方の文脈によって形成される経験の言葉による説明によって確立される。
感情の表現がメッセージの重要な構成要素となる、多くの言葉の文脈が存在する。
ユーザ生成コンテンツ(UGC)には特に当てはまります。製品やサービス、ツイート、ソーシャルメディアポストのレビューという形でもよいのです。
近年,Twitter などの多言語 Web サイトが UGC の自動翻訳を提供し,言語的に多様な利用者にリーチすることが一般的になっている。
このようなシナリオでは、ユーザーの感情を翻訳するプロセスは完全に自動化され、人間の介入なしに、ポスト編集や正確性チェックも行わない。
本研究では,自動翻訳ツールが,つぶやきなどの多言語データにおける感情伝達に有効であるかどうかを評価する。
異なる言語における感情の翻訳において課題となるtwitterデータに特有の言語現象が存在することを示す。
我々はこれらの課題を言語的特徴の一覧にまとめ、これらの特徴が異なる言語対でどれだけ頻度が高いかを示す。
また、ソーステキストにおける感情の保存に関して、mtシステムの性能を評価するための一般的な手法の能力を評価する。
関連論文リスト
- Recognizing Emotion Regulation Strategies from Human Behavior with Large Language Models [44.015651538470856]
人間の感情は直接表現されないことが多いが、内部のプロセスや社会的表示規則に従って制御される。
ユーザ間のシナリオで異なる感情制御戦略を自動的に分類する方法は存在しない。
我々は最近導入されたtextscDeepコーパスを利用して、感情の恥の社会的表示をモデル化する。
微調整されたLlama2-7Bモデルは、利用した感情制御戦略を高精度に分類することができる。
論文 参考訳(メタデータ) (2024-08-08T12:47:10Z) - MASIVE: Open-Ended Affective State Identification in English and Spanish [10.41502827362741]
本研究は,人間が感情経験を説明するために使用する言葉を含む,事実上拘束力のないテクスタフェクティブな状態にまで範囲を広げる。
私たちは、英語とスペイン語でReddit投稿のデータセットであるMASIVEを収集し、公開しています。
このタスクでは、より小さな微調整された多言語モデルの方が、地域固有のスペイン感情状態においても、ずっと大きなLLMより優れていることが分かる。
論文 参考訳(メタデータ) (2024-07-16T21:43:47Z) - Usefulness of Emotional Prosody in Neural Machine Translation [1.0205541448656992]
本稿では,音声中の感情を自動的に認識する外部ソースを追加することで,翻訳品質を向上させることを提案する。
この研究は、各感情が感情の重なり合う特定の語彙と関連しているという仮定によって動機付けられている。
NMTシステムに感情情報、特に覚醒情報を統合することで、より良い翻訳が可能になることを示す。
論文 参考訳(メタデータ) (2024-04-27T18:04:28Z) - Sociolinguistically Informed Interpretability: A Case Study on Hinglish
Emotion Classification [8.010713141364752]
ヒングリッシュ感情分類データセットにおける3つのPLM間の感情予測に対する言語の影響について検討した。
モデルが言語選択と感情表現の関連を学習していることが分かりました。
事前トレーニングにコードミキシングされたデータが存在することで、タスク固有のデータが不足している場合の学習が増大する可能性がある。
論文 参考訳(メタデータ) (2024-02-05T16:05:32Z) - BERTuit: Understanding Spanish language in Twitter through a native
transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。
私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文 参考訳(メタデータ) (2022-04-07T14:28:51Z) - Textless Speech Emotion Conversion using Decomposed and Discrete
Representations [49.55101900501656]
我々は、音声を、コンテンツ単位、F0、話者、感情からなる離散的、非絡み合いの学習表現に分解する。
まず、内容単位を対象の感情に翻訳し、その単位に基づいて韻律的特徴を予測することによって、音声内容を変更する。
最後に、予測された表現をニューラルボコーダに入力して音声波形を生成する。
論文 参考訳(メタデータ) (2021-11-14T18:16:42Z) - Seen and Unseen emotional style transfer for voice conversion with a new
emotional speech dataset [84.53659233967225]
感情的音声変換は、言語内容と話者のアイデンティティを保ちながら、音声中の感情的韻律を変換することを目的としている。
可変自動符号化ワッサーシュタイン生成対向ネットワーク(VAW-GAN)に基づく新しいフレームワークを提案する。
提案するフレームワークは,ベースラインフレームワークを一貫して上回り,優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-10-28T07:16:18Z) - Curious Case of Language Generation Evaluation Metrics: A Cautionary
Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。
これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。
本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文 参考訳(メタデータ) (2020-10-26T13:57:20Z) - Improving Sentiment Analysis over non-English Tweets using Multilingual
Transformers and Automatic Translation for Data-Augmentation [77.69102711230248]
我々は、英語のつぶやきを事前学習し、自動翻訳を用いてデータ拡張を適用して非英語の言語に適応する多言語トランスフォーマーモデルを提案する。
我々のフランス語、スペイン語、ドイツ語、イタリア語での実験は、この手法が非英語のツイートの小さなコーパスよりも、トランスフォーマーの結果を改善する効果的な方法であることを示唆している。
論文 参考訳(メタデータ) (2020-10-07T15:44:55Z) - Annotation of Emotion Carriers in Personal Narratives [69.07034604580214]
我々は、個人的物語(PN) - 話されたり書かれたり - 事実、出来事、思考の記憶 - を理解する問題に興味を持っている。
PNでは、感情担体(英: emotion carriers)は、ユーザの感情状態を最もよく説明する音声またはテキストセグメントである。
本研究は,音声対話における感情担持者を特定するためのアノテーションモデルを提案し,評価する。
論文 参考訳(メタデータ) (2020-02-27T15:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。