論文の概要: Investigating the Influence of Language on Sycophantic Behavior of Multilingual LLMs
- arxiv url: http://arxiv.org/abs/2603.27664v1
- Date: Sun, 29 Mar 2026 12:31:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.061171
- Title: Investigating the Influence of Language on Sycophantic Behavior of Multilingual LLMs
- Title(参考訳): 多言語LLMの発声行動に及ぼす言語の影響の検討
- Authors: Bayan Abdullah Aldahlawi, A. B. M. Ashikur Rahman, Irfan Ahmad,
- Abstract要約: 大規模言語モデル(LLM)は、幅広いタスクで高いパフォーマンスを達成しているが、梅毒の傾向もある。
以前の研究は、ChatGPT-3.5やDavinciといった初期のモデルにおいて、梅毒の程度と根本原因の両方を概説している。
本研究は、この言語が梅毒の反応にどのように影響するかを考察する。
- 参考スコア(独自算出の注目度): 1.7778609937758327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have achieved strong performance across a wide range of tasks, but they are also prone to sycophancy, the tendency to agree with user statements regardless of validity. Previous research has outlined both the extent and the underlying causes of sycophancy in earlier models, such as ChatGPT-3.5 and Davinci. Newer models have since undergone multiple mitigation strategies, yet there remains a critical need to systematically test their behavior. In particular, the effect of language on sycophancy has not been explored. In this work, we investigate how the language influences sycophantic responses. We evaluate three state-of-the-art models, GPT-4o mini, Gemini 1.5 Flash, and Claude 3.5 Haiku, using a set of tweet-like opinion prompts translated into five additional languages: Arabic, Chinese, French, Spanish, and Portuguese. Our results show that although newer models exhibit significantly less sycophancy overall compared to earlier generations, the extent of sycophancy is still influenced by the language. We further provide a granular analysis of how language shapes model agreeableness across sensitive topics, revealing systematic cultural and linguistic patterns. These findings highlight both the progress of mitigation efforts and the need for broader multilingual audits to ensure trustworthy and bias-aware deployment of LLMs.
- Abstract(参考訳): 大規模言語モデル(LLM)は,幅広いタスクにおいて高いパフォーマンスを達成しているが,妥当性に関わらず,ユーザステートメントに同意する傾向にある。
以前の研究は、ChatGPT-3.5やDavinciといった初期のモデルにおいて、梅毒の程度と根本原因の両方を概説している。
新しいモデルはその後、複数の緩和戦略を実行しているが、その振る舞いを体系的にテストする必要がある。
特に、言語が梅毒に及ぼす影響は研究されていない。
本研究では,この言語が梅毒の反応に与える影響について検討する。
GPT-4o mini, Gemini 1.5 Flash, Claude 3.5 Haikuの3つの最先端モデルを評価する。
以上の結果から, より新しいモデルでは, 旧世代に比べ, 全体としての梅毒症は著しく少ないが, 今でもその程度は言語の影響を受けていることが示唆された。
さらに、センシティブなトピック間で言語形状がどのように一致するかをモデル化し、体系的な文化的・言語的パターンを明らかにする。
これらの結果は、緩和努力の進展と、LLMの信頼性とバイアスを意識した展開を保証するためのより広範な多言語監査の必要性の両方を浮き彫りにした。
関連論文リスト
- Scaling Self-Supervised Speech Models Uncovers Deep Linguistic Relationships: Evidence from the Pacific Cluster [23.057593480189652]
自己監督音声モデル(S3Ms)から導かれる言語表現の類似性は,近年の拡大や接触によって引き起こされる地理的近接性や表面の類型的類似性を主に反映することが観察されている。
本研究では,S3Mに基づく言語識別システムの言語範囲を126言語から4,017言語に拡大することが,このトポロジにどのように影響するかを検討する。
論文 参考訳(メタデータ) (2026-03-07T14:48:48Z) - Evaluating Modern Large Language Models on Low-Resource and Morphologically Rich Languages:A Cross-Lingual Benchmark Across Cantonese, Japanese, and Turkish [12.286855282078305]
GPT-4o, GPT-4, Claude3.5Sonnet, LLaMA3.1, MistralLarge2, LLaMA-2Chat13B, Mistral7B Instructを評価した。
我々のベンチマークは、オープンドメイン質問応答、文書要約、英語からXへの翻訳、文化的根拠のある対話の4つのタスクにまたがっている。
論文 参考訳(メタデータ) (2025-11-05T22:09:53Z) - From Monolingual to Bilingual: Investigating Language Conditioning in Large Language Models for Psycholinguistic Tasks [9.837135712999471]
大規模言語モデル(LLM)は強力な言語能力を示すが、言語間の心理言語学的な知識のエンコード方法についてはほとんど分かっていない。
本研究では,LLMが言語的アイデンティティの異なる人間的な心理言語学的反応を示すかどうかについて検討する。
Llama-3.3-70B-Instruct と Qwen2.5-72B-Instruct の2つのモデルを評価する。
論文 参考訳(メタデータ) (2025-08-04T15:10:44Z) - Adapting Language Models to Indonesian Local Languages: An Empirical Study of Language Transferability on Zero-Shot Settings [1.1556013985948772]
インドネシアの低リソース言語への事前学習言語モデルの転送性を評価する。
私たちはターゲット言語を、見る、見る、見る、見る、見えない3つのカテゴリに分類します。
マルチ言語モデルは、目に見える言語で、部分的に見られる言語では適度に、目に見えない言語では劣る。
対象言語にラベル付きデータを必要としないため,MAD-Xは性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2025-07-02T12:17:55Z) - Language Mixing in Reasoning Language Models: Patterns, Impact, and Internal Causes [54.96891982093408]
RLM(Reasoning Language Model)は、チェーン・オブ・シント・プロセスを利用して構造化中間ステップを生成することで、複雑なタスクに優れる。
言語混合、すなわちプロンプト以外の言語からのトークンを含む推論ステップがアウトプットで観測され、性能に影響することが示されている。
本研究では, RLMにおける言語混合に関する最初の体系的研究を行い, そのパターン, 影響, 内部要因を15言語にわたって検討した。
論文 参考訳(メタデータ) (2025-05-20T18:26:53Z) - Pragmatic Inference Chain (PIC) Improving LLMs' Reasoning of Authentic Implicit Toxic Language [10.295731340480417]
PIC (Pragmatic Inference Chain) は認知科学と言語学に新たなプロンプト手法である。
GPT-4o、Llama-3.1-70B-Instruct、DeepSeek-v2.5、DeepSeek-v3の成功率を大幅に向上させる。
論文 参考訳(メタデータ) (2025-03-03T13:51:05Z) - Holmes: A Benchmark to Assess the Linguistic Competence of Language Models [59.627729608055006]
言語モデル(LM)の言語能力を評価するための新しいベンチマークであるHolmesを紹介する。
我々は、計算に基づく探索を用いて、異なる言語現象に関するLMの内部表現を調べる。
その結果,近年,他の認知能力からLMの言語能力を引き離す声が上がっている。
論文 参考訳(メタデータ) (2024-04-29T17:58:36Z) - Analyzing the Mono- and Cross-Lingual Pretraining Dynamics of
Multilingual Language Models [73.11488464916668]
本研究では,多言語事前学習プロセスのダイナミクスについて検討する。
我々は,XLM-Rプレトレーニング全体から抽出したチェックポイントを,一連の言語的タスクを用いて探索する。
分析の結果,より複雑なものよりも低レベルな言語スキルが得られ,早期に高い言語性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-05-24T03:35:00Z) - On Negative Interference in Multilingual Models: Findings and A
Meta-Learning Treatment [59.995385574274785]
従来の信念に反して、負の干渉は低リソース言語にも影響を及ぼすことを示す。
メタ学習アルゴリズムは、より優れた言語間変換性を得、負の干渉を軽減する。
論文 参考訳(メタデータ) (2020-10-06T20:48:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。