Fugu-MT 論文翻訳(概要): Challenges in Translation of Emotions in Multilingual User-Generated Content: Twitter as a Case Study

論文の概要: Challenges in Translation of Emotions in Multilingual User-Generated Content: Twitter as a Case Study

arxiv url: http://arxiv.org/abs/2106.10719v1
Date: Sun, 20 Jun 2021 16:12:48 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-23 08:22:56.528550
Title: Challenges in Translation of Emotions in Multilingual User-Generated Content: Twitter as a Case Study
Title（参考訳）: 多言語ユーザ生成コンテンツにおける感情翻訳の課題:Twitterを事例として
Authors: Hadeel Saadany, Constantin Orasan, Rocio Caro Quintana, Felix do Carmo, Leonardo Zilio
Abstract要約: 異なる言語における感情の翻訳において,Twitterデータに特有の言語現象が存在することを示す。また、テキスト中の感情の保存に関して、MTシステムの性能を評価するためによく使われる手法の能力を評価する。
参考スコア（独自算出の注目度）: 1.3999481573773072
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Although emotions are universal concepts, transferring the different shades of emotion from one language to another may not always be straightforward for human translators, let alone for machine translation systems. Moreover, the cognitive states are established by verbal explanations of experience which is shaped by both the verbal and cultural contexts. There are a number of verbal contexts where expression of emotions constitutes the pivotal component of the message. This is particularly true for User-Generated Content (UGC) which can be in the form of a review of a product or a service, a tweet, or a social media post. Recently, it has become common practice for multilingual websites such as Twitter to provide an automatic translation of UGC to reach out to their linguistically diverse users. In such scenarios, the process of translating the user's emotion is entirely automatic with no human intervention, neither for post-editing nor for accuracy checking. In this research, we assess whether automatic translation tools can be a successful real-life utility in transferring emotion in user-generated multilingual data such as tweets. We show that there are linguistic phenomena specific of Twitter data that pose a challenge in translation of emotions in different languages. We summarise these challenges in a list of linguistic features and show how frequent these features are in different language pairs. We also assess the capacity of commonly used methods for evaluating the performance of an MT system with respect to the preservation of emotion in the source text.
Abstract（参考訳）: 感情は普遍的な概念であるが、感情の異なる色合いをある言語から別の言語に移すことは、機械翻訳システムだけでなく、人間の翻訳者にとって必ずしも単純ではない。さらに、認知状態は、言語と文化の両方の文脈によって形成される経験の言葉による説明によって確立される。感情の表現がメッセージの重要な構成要素となる、多くの言葉の文脈が存在する。ユーザ生成コンテンツ(UGC)には特に当てはまります。製品やサービス、ツイート、ソーシャルメディアポストのレビューという形でもよいのです。近年,Twitter などの多言語 Web サイトが UGC の自動翻訳を提供し,言語的に多様な利用者にリーチすることが一般的になっている。このようなシナリオでは、ユーザーの感情を翻訳するプロセスは完全に自動化され、人間の介入なしに、ポスト編集や正確性チェックも行わない。本研究では,自動翻訳ツールが,つぶやきなどの多言語データにおける感情伝達に有効であるかどうかを評価する。異なる言語における感情の翻訳において課題となるtwitterデータに特有の言語現象が存在することを示す。我々はこれらの課題を言語的特徴の一覧にまとめ、これらの特徴が異なる言語対でどれだけ頻度が高いかを示す。また、ソーステキストにおける感情の保存に関して、mtシステムの性能を評価するための一般的な手法の能力を評価する。

関連論文リスト

Liaozhai through the Looking-Glass: On Paratextual Explicitation of Culture-Bound Terms in Machine Translation [70.43884512651668]
我々は、文学・翻訳研究からジェネットのパラテキスト論(1987年)を定式化し、機械翻訳におけるパラテキスト明示の課題を紹介した。古典中国語の短編集集Liaozhaiの4つの英訳から560の専門家対応パラテキストのデータセットを構築した。本研究は,言語的等価性を超えた機械翻訳におけるパラテクスト的明示の可能性を示すものである。
論文参考訳（メタデータ） (2025-09-27T16:27:36Z)
UDDETTS: Unifying Discrete and Dimensional Emotions for Controllable Emotional Text-to-Speech [61.989360995528905]
制御可能な感情的TTSのための離散的感情と次元的感情を統一する普遍的なフレームワークであるUDDETTSを提案する。このモデルは、次元的感情記述のための解釈可能なArousal-Dominance-Valence(ADV)空間を導入し、離散的な感情ラベルまたは非線形に定量化されたADV値によって駆動される感情制御をサポートする。実験の結果, UDDETTSは3次元の線形感情制御を実現し, エンドツーエンドの感情音声合成能力に優れていた。
論文参考訳（メタデータ） (2025-05-15T12:57:19Z)
Recognizing Emotion Regulation Strategies from Human Behavior with Large Language Models [44.015651538470856]
人間の感情は直接表現されないことが多いが、内部のプロセスや社会的表示規則に従って制御される。ユーザ間のシナリオで異なる感情制御戦略を自動的に分類する方法は存在しない。我々は最近導入されたtextscDeepコーパスを利用して、感情の恥の社会的表示をモデル化する。微調整されたLlama2-7Bモデルは、利用した感情制御戦略を高精度に分類することができる。
論文参考訳（メタデータ） (2024-08-08T12:47:10Z)
MASIVE: Open-Ended Affective State Identification in English and Spanish [10.41502827362741]
本研究は,人間が感情経験を説明するために使用する言葉を含む,事実上拘束力のないテクスタフェクティブな状態にまで範囲を広げる。私たちは、英語とスペイン語でReddit投稿のデータセットであるMASIVEを収集し、公開しています。このタスクでは、より小さな微調整された多言語モデルの方が、地域固有のスペイン感情状態においても、ずっと大きなLLMより優れていることが分かる。
論文参考訳（メタデータ） (2024-07-16T21:43:47Z)
Usefulness of Emotional Prosody in Neural Machine Translation [1.0205541448656992]
本稿では,音声中の感情を自動的に認識する外部ソースを追加することで,翻訳品質を向上させることを提案する。この研究は、各感情が感情の重なり合う特定の語彙と関連しているという仮定によって動機付けられている。 NMTシステムに感情情報、特に覚醒情報を統合することで、より良い翻訳が可能になることを示す。
論文参考訳（メタデータ） (2024-04-27T18:04:28Z)
Sociolinguistically Informed Interpretability: A Case Study on Hinglish Emotion Classification [8.010713141364752]
ヒングリッシュ感情分類データセットにおける3つのPLM間の感情予測に対する言語の影響について検討した。モデルが言語選択と感情表現の関連を学習していることが分かりました。事前トレーニングにコードミキシングされたデータが存在することで、タスク固有のデータが不足している場合の学習が増大する可能性がある。
論文参考訳（メタデータ） (2024-02-05T16:05:32Z)
Enhancing expressivity transfer in textless speech-to-speech translation [0.0]
既存の最先端システムは、様々な言語で正確に表現力の取得と転送に関して不足している。本研究では,個別音声単位レベルで動作し,多言語感情の埋め込みを利用する新しい手法を提案する。対象言語における音声単位のピッチと持続時間を効果的に予測するために,これらの埋め込みがどのように使用できるかを示す。
論文参考訳（メタデータ） (2023-10-11T08:07:22Z)
BERTuit: Understanding Spanish language in Twitter through a native transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文参考訳（メタデータ） (2022-04-07T14:28:51Z)
Textless Speech Emotion Conversion using Decomposed and Discrete Representations [49.55101900501656]
我々は、音声を、コンテンツ単位、F0、話者、感情からなる離散的、非絡み合いの学習表現に分解する。まず、内容単位を対象の感情に翻訳し、その単位に基づいて韻律的特徴を予測することによって、音声内容を変更する。最後に、予測された表現をニューラルボコーダに入力して音声波形を生成する。
論文参考訳（メタデータ） (2021-11-14T18:16:42Z)
Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset [84.53659233967225]
感情的音声変換は、言語内容と話者のアイデンティティを保ちながら、音声中の感情的韻律を変換することを目的としている。可変自動符号化ワッサーシュタイン生成対向ネットワーク(VAW-GAN)に基づく新しいフレームワークを提案する。提案するフレームワークは,ベースラインフレームワークを一貫して上回り,優れた性能を発揮することを示す。
論文参考訳（メタデータ） (2020-10-28T07:16:18Z)
Curious Case of Language Generation Evaluation Metrics: A Cautionary Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文参考訳（メタデータ） (2020-10-26T13:57:20Z)
Improving Sentiment Analysis over non-English Tweets using Multilingual Transformers and Automatic Translation for Data-Augmentation [77.69102711230248]
我々は、英語のつぶやきを事前学習し、自動翻訳を用いてデータ拡張を適用して非英語の言語に適応する多言語トランスフォーマーモデルを提案する。我々のフランス語、スペイン語、ドイツ語、イタリア語での実験は、この手法が非英語のツイートの小さなコーパスよりも、トランスフォーマーの結果を改善する効果的な方法であることを示唆している。
論文参考訳（メタデータ） (2020-10-07T15:44:55Z)
Annotation of Emotion Carriers in Personal Narratives [69.07034604580214]
我々は、個人的物語(PN) - 話されたり書かれたり - 事実、出来事、思考の記憶 - を理解する問題に興味を持っている。 PNでは、感情担体(英: emotion carriers)は、ユーザの感情状態を最もよく説明する音声またはテキストセグメントである。本研究は,音声対話における感情担持者を特定するためのアノテーションモデルを提案し,評価する。
論文参考訳（メタデータ） (2020-02-27T15:42:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。