論文の概要: Is AI Catching Up to Human Expression? Exploring Emotion, Personality, Authorship, and Linguistic Style in English and Arabic with Six Large Language Models
- arxiv url: http://arxiv.org/abs/2603.23251v1
- Date: Tue, 24 Mar 2026 14:17:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.528005
- Title: Is AI Catching Up to Human Expression? Exploring Emotion, Personality, Authorship, and Linguistic Style in English and Arabic with Six Large Language Models
- Title(参考訳): AIは人間の表現をキャッチアップしているか?六大言語モデルによる英語とアラビア語の感情、人格、著者、言語スタイルの探索
- Authors: Nasser A Alsadhan,
- Abstract要約: 私たちはJais、Mistral、LLaMA、GPT-4o、Gemini、DeepSeekの6つのモデルで2つのタスクを実行します。
機械分類器が、人間が書いたテキストとAI生成したテキストとを確実に区別できるかどうかを評価する。
これらの結果から,AI生成したテキストは,パラフレーズ標本の分類性能は低下するものの,人間によるテキストと区別可能であることが示された(F1>0.95)。
AI生成データによるトレーニングの強化は、アラビア人格分類タスクのパフォーマンスを高め、アンダーリソース言語における課題に対処する合成データの可能性を強調している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advancing fluency of LLMs raises important questions about their ability to emulate complex human traits, including emotional expression and personality, across diverse linguistic and cultural contexts. This study investigates whether LLMs can convincingly mimic emotional nuance in English and personality markers in Arabic, a critical under-resourced language with unique linguistic and cultural characteristics. We conduct two tasks across six models:Jais, Mistral, LLaMA, GPT-4o, Gemini, and DeepSeek. First, we evaluate whether machine classifiers can reliably distinguish between human-authored and AI-generated texts. Second, we assess the extent to which LLM-generated texts exhibit emotional or personality traits comparable to those of humans. Our results demonstrate that AI-generated texts are distinguishable from human-authored ones (F1>0.95), though classification performance deteriorates on paraphrased samples, indicating a reliance on superficial stylistic cues. Emotion and personality classification experiments reveal significant generalization gaps: classifiers trained on human data perform poorly on AI-generated texts and vice versa, suggesting LLMs encode affective signals differently from humans. Importantly, augmenting training with AI-generated data enhances performance in the Arabic personality classification task, highlighting the potential of synthetic data to address challenges in under-resourced languages. Model-specific analyses show that GPT-4o and Gemini exhibit superior affective coherence. Linguistic and psycholinguistic analyses reveal measurable divergences in tone, authenticity, and textual complexity between human and AI texts. These findings have implications for affective computing, authorship attribution, and responsible AI deployment, particularly within underresourced language contexts where generative AI detection and alignment pose unique challenges.
- Abstract(参考訳): LLMの流行は、様々な言語的・文化的文脈において、感情的な表現や性格を含む複雑な人間の特性をエミュレートする能力について重要な疑問を提起する。
本研究では,LLMが英語の感情的ニュアンスとアラビア語のパーソナリティマーカーを効果的に模倣できるかどうかを考察する。
私たちはJais、Mistral、LLaMA、GPT-4o、Gemini、DeepSeekの6つのモデルで2つのタスクを実行します。
まず、機械分類器が、人間が書いたテキストとAI生成したテキストとを確実に区別できるかどうかを評価する。
第2に,LLM生成テキストが人間に匹敵する感情的・人格的特徴を示す程度を評価する。
以上の結果から,AI生成テキストは人為的なテキストと区別可能であることが明らかとなった(F1>0.95)。
感情と人格の分類実験は、人間のデータに基づいて訓練された分類器は、AI生成したテキストで不十分に動作し、その逆は、LLMが人間と異なる感情信号をエンコードしていることを示唆している。
重要なのは、AI生成データによるトレーニングを強化することで、アラビア人格分類タスクのパフォーマンスが向上し、アンダーリソース言語における課題に対処する合成データの可能性を強調していることだ。
モデル特異的解析により, GPT-4o と Gemini は良好な感情的コヒーレンスを示した。
言語学的および精神言語学的分析は、人間のテキストとAIテキストの間のトーン、真正性、テキストの複雑さにおける測定可能な相違を明らかにしている。
これらの発見は、感情コンピューティング、著者帰属、責任あるAIデプロイメントに影響を及ぼす。
関連論文リスト
- Beyond Profile: From Surface-Level Facts to Deep Persona Simulation in LLMs [50.0874045899661]
本稿では,文字のテキストワークに現れる言語パターンと独特の思考パターンの両方を再現するモデルである characterBot を紹介する。
著名な中国の作家ル・ジュンをケーススタディとして、17冊のエッセイ集から派生した4つの訓練課題を提案する。
これには、外部の言語構造と知識を習得することに焦点を当てた事前訓練タスクと、3つの微調整タスクが含まれる。
言語的正確性と意見理解の3つのタスクにおいて、キャラクタボットを評価し、適応されたメトリクスのベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-02-18T16:11:54Z) - MEMO-Bench: A Multiple Benchmark for Text-to-Image and Multimodal Large Language Models on Human Emotion Analysis [53.012111671763776]
そこで本研究では、7,145枚の肖像画からなる総合的なベンチマークであるMEMO-Benchを紹介した。
以上の結果から,既存のT2Iモデルは負のモデルよりも肯定的な感情を生成するのに効果的であることが示唆された。
MLLMは人間の感情の識別と認識に一定の効果を示すが、人間のレベルの正確さには欠ける。
論文 参考訳(メタデータ) (2024-11-18T02:09:48Z) - Decoding AI and Human Authorship: Nuances Revealed Through NLP and Statistical Analysis [0.0]
本研究では,AIが生成したテキストと人間が作成したテキストの微妙な相違について検討する。
本研究は,人文・AI生成テキストに固有の言語特性,創造性パターン,潜在的なバイアスについて検討した。
論文 参考訳(メタデータ) (2024-07-15T18:09:03Z) - Differentiating between human-written and AI-generated texts using linguistic features automatically extracted from an online computational tool [0.0]
本研究の目的は,AIが人間の文章をエミュレートする能力を評価することにある。
人間の発話を模倣したAI生成テキストが現れるにもかかわらず、結果は複数の言語的特徴に有意な差が認められた。
論文 参考訳(メタデータ) (2024-07-04T05:37:09Z) - Language Model Alignment in Multilingual Trolley Problems [138.5684081822807]
Moral Machine 実験に基づいて,MultiTP と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。
分析では、19の異なるLLMと人間の判断を一致させ、6つのモラル次元をまたいだ嗜好を捉えた。
我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文 参考訳(メタデータ) (2024-07-02T14:02:53Z) - The Imitation Game: Detecting Human and AI-Generated Texts in the Era of
ChatGPT and BARD [3.2228025627337864]
異なるジャンルの人文・AI生成テキストのデータセットを新たに導入する。
テキストを分類するために、いくつかの機械学習モデルを使用します。
結果は、人間とAIが生成したテキストを識別する上で、これらのモデルの有効性を示す。
論文 参考訳(メタデータ) (2023-07-22T21:00:14Z) - Human Heuristics for AI-Generated Language Are Flawed [8.465228064780744]
我々は,最も個人的かつ連続的な言語である動詞の自己表現が,AIによって生成されたかを検討した。
我々は,これらの単語がAI生成言語の人間の判断を予測可能で操作可能であることを実験的に実証した。
我々は、AIアクセントのようなソリューションについて議論し、AIによって生成された言語の誤認の可能性を減らす。
論文 参考訳(メタデータ) (2022-06-15T03:18:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。