論文の概要: Stylistic Evolution and LLM Neutrality in Singlish Language
- arxiv url: http://arxiv.org/abs/2601.06580v1
- Date: Sat, 10 Jan 2026 14:34:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.887121
- Title: Stylistic Evolution and LLM Neutrality in Singlish Language
- Title(参考訳): シングリッシュ言語におけるスティリスティック進化とLLM中立性
- Authors: Linus Tze En Foo, Weihan Angela Ng, Wenkai Li, Lynnette Hui Xian Ng,
- Abstract要約: シングリッシュはシンガポールの多言語環境に根ざしたクレオールである。
本研究では,10年間の非公式なデジタルテキストメッセージにおけるSinglishの進化について検討する。
- 参考スコア(独自算出の注目度): 3.7154999543834184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Singlish is a creole rooted in Singapore's multilingual environment and continues to evolve alongside social and technological change. This study investigates the evolution of Singlish over a decade of informal digital text messages. We propose a stylistic similarity framework that compares lexico-structural, pragmatic, psycholinguistic, and encoder-derived features across years to quantify temporal variation. Our analysis reveals notable diachronic changes in tone, expressivity and sentence construction over the years. Conversely, while some LLMs were able to generate superficially realistic Singlish messages, they do not produce temporally neutral outputs, and residual temporal signals remain detectable despite prompting and fine-tuning. Our findings highlight the dynamic evolution of Singlish, as well as the capabilities and limitations of current LLMs in modeling sociolectal and temporal variations in the colloquial language.
- Abstract(参考訳): シングリッシュはシンガポールの多言語環境に根ざしたクレオールであり、社会や技術の変化と共に進化を続けている。
本研究では,10年間の非公式なデジタルテキストメッセージにおけるSinglishの進化について検討する。
時間的変動を定量化するために, 語彙構造, プラグマティック, 心理言語, エンコーダから派生した特徴を年々比較するスタイル的類似性フレームワークを提案する。
分析の結果, 音色, 表現性, 文構成の経年変化が顕著であった。
逆に、一部のLLMは超現実的なシングリッシュメッセージを生成することができたが、時間的に中立な出力は生成せず、信号の残余は検出可能である。
本研究は,Singlish の動的進化と,言語言語における社会的・時間的変動のモデル化における現在の LLM の機能と限界を強調した。
関連論文リスト
- Model Misalignment and Language Change: Traces of AI-Associated Language in Unscripted Spoken English [0.0]
近年では、特に科学や教育において、文章言語は言葉の使用に顕著な変化を経験している。
モデルアウトプットと対象のオーディエンスノルムの相違は、ミスアライメントの一形態と見なすことができる。
我々は、会話科学と技術ポッドキャストから引き出された、未記述の音声言語から2210万語のデータセットを構築した。
論文 参考訳(メタデータ) (2025-08-01T00:47:33Z) - Losing our Tail -- Again: On (Un)Natural Selection And Multilingual Large Language Models [0.8702432681310399]
言語分布の尾は消えつつあるし、それらとともに、彼らが持っている物語やアイデンティティも消えつつある、と私は主張する。
これは言語的平坦化に抵抗し、NLPを多言語的・言語的多様性と創造性を表現的に促進し、価値を与え、保護する分野として再想像することである。
論文 参考訳(メタデータ) (2025-07-05T07:36:49Z) - IMPACT: Inflectional Morphology Probes Across Complex Typologies [0.0]
IMPACTは、屈折形態学に焦点を当てた、合成的に生成された評価フレームワークである。
アラビア語、ロシア語、フィンランド語、トルコ語、ヘブライ語という5つの形態学的に豊かな言語のパフォーマンスを評価するように設計されている。
英語のパフォーマンスが強いにもかかわらず、他の言語と競合する8つの多言語LLMと、一般的でない形態素パターンを評価した。
論文 参考訳(メタデータ) (2025-06-30T14:58:23Z) - The Emergence of Abstract Thought in Large Language Models Beyond Any Language [95.50197866832772]
大規模言語モデル(LLM)は様々な言語で効果的に機能する。
予備的研究では、LLMの隠れた活性化は、英語以外のプロンプトに反応してもしばしば英語に類似している。
近年の結果は多言語のパフォーマンスが強く、他の言語での特定のタスクにおける英語のパフォーマンスを超えている。
論文 参考訳(メタデータ) (2025-06-11T16:00:54Z) - Mechanistic Understanding and Mitigation of Language Confusion in English-Centric Large Language Models [56.61984030508691]
言語混乱に関する最初の機械論的解釈可能性研究について述べる。
混乱点(CP)がこの現象の中心であることを示す。
比較分析によって同定された少数の臨界ニューロンを多言語で調整したニューロンで編集すると、混乱が著しく軽減されることがわかった。
論文 参考訳(メタデータ) (2025-05-22T11:29:17Z) - Disparities in LLM Reasoning Accuracy and Explanations: A Case Study on African American English [66.97110551643722]
本研究では,Large Language Models (LLMs) 推論タスクにおける方言の相違について検討する。
LLMは、AAE入力に対するより正確な応答とより単純な推論チェーンと説明を生成する。
これらの知見は、LLMの処理方法と異なる言語品種の理由の体系的差異を浮き彫りにした。
論文 参考訳(メタデータ) (2025-03-06T05:15:34Z) - Converging to a Lingua Franca: Evolution of Linguistic Regions and Semantics Alignment in Multilingual Large Language Models [11.423589362950812]
大規模言語モデル(LLM)は、特に多言語文脈において顕著な性能を示した。
近年の研究では、LLMは、ある言語で学んだスキルを他の言語に伝達することができることが示唆されているが、この能力の背後にある内部メカニズムはいまだ不明である。
本稿では,LLMの内部動作に関する知見を提供し,言語間能力の向上のための基盤を提供する。
論文 参考訳(メタデータ) (2024-10-15T15:49:15Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。