論文の概要: Linguistic Uncertainty and Engagement in Arabic-Language X (formerly Twitter) Discourse
- arxiv url: http://arxiv.org/abs/2603.00082v1
- Date: Sat, 14 Feb 2026 08:37:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.034096
- Title: Linguistic Uncertainty and Engagement in Arabic-Language X (formerly Twitter) Discourse
- Title(参考訳): アラビア語-Language X(旧Twitter)談話における言語的不確かさとエンゲージメント
- Authors: Mohamed Soufan,
- Abstract要約: 言語的不確実性はソーシャルメディアの一般的な特徴であるが、ユーザエンゲージメントとの関係は未解明のままである。
35日間にわたって投稿されたレバノンに関する16,695のアラビア語ツイートのデータセットを用いて、言語的不確実性を表すツイートが、異なるレベルのエンゲージメントを受けるかどうかを検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Linguistic uncertainty is a common feature of social media discourse, yet its relationship with user engagement remains underexplored, particularly in non-English contexts. Using a dataset of 16,695 Arabic-language tweets about Lebanon posted over a 35-day period, we examine whether tweets expressing linguistic uncertainty receive different levels and forms of engagement compared to certainty-marked tweets. We develop a lexicon-based, context-sensitive classifier to identify uncertainty markers and classify 29.9% of tweets as uncertain. Descriptive analyses indicate that uncertain tweets exhibit 51.5% higher mean total engagement (likes, retweets, and replies). Regression models controlling for tweet length, URL presence, and account verification status confirm a positive association between uncertainty and engagement (\b{eta} = 0.221, SE = 0.044, p < 0.001), corresponding to approximately 25% higher expected engagement. The association is strongest for replies, followed by retweets and likes, suggesting a shift toward more conversational forms of engagement. Results are robust to alternative model specifications and adjustments for within-account correlation. These findings suggest that linguistic uncertainty may function as an interactional cue that encourages participatory engagement in Arabic-language social media discourse. The study contributes computational approaches for modeling linguistic features in large-scale, non-English digital communication.
- Abstract(参考訳): 言語的不確実性はソーシャルメディアの一般的な特徴であるが、そのユーザエンゲージメントとの関係は、特に非英語の文脈において未解明のままである。
35日間に投稿されたレバノンに関する16,695のアラビア語ツイートのデータセットを用いて、言語的不確実性を表すツイートが、確実なマーク付きツイートと比較して異なるレベルとエンゲージメントの形式を持つかどうかを検討する。
我々は、不確実性マーカーを識別し、29.9%のツイートを不確実性として分類する辞書ベースのコンテキストセンシティブ分類器を開発した。
記述的分析によると、不確実なツイートは51.5%高いエンゲージメント(いいね!
ツイートの長さ、URLの存在、アカウントの確認状況を制御する回帰モデルでは、約25%高いエンゲージメントに対応する不確実性とエンゲージメント(\b{eta} = 0.221, SE = 0.044, p < 0.001)の正の相関が確認される。
この協会は返信に最強で、その後リツイートやお気に入りが続き、会話的なエンゲージメントの形式へのシフトを示唆している。
結果は、代替モデル仕様や、アカウント内相関の調整に対して堅牢である。
これらの結果から, 言語不確実性は, アラビア語によるソーシャルメディアの会話への参加を促す相互作用の手がかりとして機能する可能性が示唆された。
本研究は,大規模非英語デジタル通信における言語特徴のモデル化のための計算的アプローチに寄与する。
関連論文リスト
- Signals in the Noise: Decoding Unexpected Engagement Patterns on Twitter [3.222797320629009]
特定のツイートが、他のツイートと比較して、予期しないほど高いエンゲージメントを受け取っている理由について検討する。
60万以上のツイートを分析した結果、コンテンツ特性が予期せぬエンゲージメントにどのように影響するかが明らかになりました。
論文 参考訳(メタデータ) (2025-09-09T20:10:17Z) - Context Matters: Incorporating Target Awareness in Conversational Abusive Language Detection [7.323895449517353]
ソーシャルメディアにおけるこのような有害なコンテンツに対処する手段として、乱用言語検出がますます重要になっている。
本研究では,会話交換について検討し,相手の投稿に対して相手の投稿に返信する(親のつぶやき)。
親ツイートからコンテキストを活用することで、返信投稿が悪用されているかどうかを判断できますか?
論文 参考訳(メタデータ) (2025-08-18T11:12:21Z) - Detecting Effects of AI-Mediated Communication on Language Complexity and Sentiment [0.36832029288386137]
われわれは2020年の970,919件のツイート(前ChatGPT)と2024年の2万件のツイートを比較した。
Flesch-Kincaidの可読性と極性スコアの組み合わせを用いて,テキストの複雑さと感情の変化を分析した。
論文 参考訳(メタデータ) (2025-04-28T08:01:38Z) - Ensemble of pre-trained language models and data augmentation for hate speech detection from Arabic tweets [0.27309692684728604]
本研究では,従来手作業でラベル付けされていたアンサンブル学習と半教師付き学習を活用する新しい手法を提案する。
我々は、アラビア語のツイートを、非憎悪、一般憎悪、人種、宗教、セクシズムの5つのクラスに分類して、ベンチマークデータセットで実験を行った。
論文 参考訳(メタデータ) (2024-07-02T17:26:26Z) - Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue [71.15186328127409]
パラリンGPT(Paralin GPT)
モデルは、シリアライズされたマルチタスクフレームワーク内の入力プロンプトとして、テキスト、音声埋め込み、およびパラ言語属性の会話コンテキストを取る。
音声対話データセットとして,感情ラベルをパラ言語属性として含むSwitchboard-1コーパスを利用する。
論文 参考訳(メタデータ) (2023-12-23T18:14:56Z) - LLM generated responses to mitigate the impact of hate speech [1.774563970628096]
本稿では,自動モデレーションシステムの設計について概説し,ユーザエンゲージメントを測定するための簡易な指標を提案する。
談話モデレーションのための生成AIの展開における倫理的考察と課題について論じる。
論文 参考訳(メタデータ) (2023-11-28T16:08:42Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Unsupervised Cross-lingual Representation Learning for Speech
Recognition [63.85924123692923]
XLSRは、複数の言語における音声の生波形から1つのモデルを事前学習することで、言語間音声表現を学習する。
我々は、マスク付き潜在音声表現よりも対照的なタスクを解くことで訓練されたwav2vec 2.0を構築した。
実験により、言語間事前学習はモノリンガル事前訓練よりも著しく優れていることが示された。
論文 参考訳(メタデータ) (2020-06-24T18:25:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。