論文の概要: Language Ideologies in a Multilingual Society: An LLM-based Analysis of Luxembourgish News Comments
- arxiv url: http://arxiv.org/abs/2604.27661v1
- Date: Thu, 30 Apr 2026 09:55:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.031104
- Title: Language Ideologies in a Multilingual Society: An LLM-based Analysis of Luxembourgish News Comments
- Title(参考訳): 多言語社会における言語イデオロギー:ルクセンブルク語ニュースコメントのLLMに基づく分析
- Authors: Emilia Milano, Alistair Plum, Yves Scherrer, Christoph Purschke,
- Abstract要約: 本稿では,言語イデオロギーの検出を支援するため,大規模言語モデルの可能性について検討する。
我々は、Luxembourgishのユーザーコメントのコーパスを事前に定義されたイデオロギーカテゴリで手動で注釈付けする。
また,これらのアノテーションを再現する能力を評価するために,様々な素早い条件下での大規模言語モデルの性能を評価する。
- 参考スコア(独自算出の注目度): 5.187863439550787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting language ideologies is a valuable yet complex task for understanding how identities are constructed through discourse. In Luxembourg's multicultural and multilingual society, language ideologies reflect more than simple preferences: they carry deep cultural and social meanings, shaping identities and social belonging. Following recent developments in applying Natural Language Processing tools to linguistics and social science, this paper explores the potential of large language models to assist in the detection of language ideologies. We manually annotate a corpus of user comments in Luxembourgish with predefined ideological categories and then evaluate the performance of large language models under varying prompt conditions to assess their ability to replicate these human annotations. Since Luxembourgish is a small language and poorly represented in the LLMs' training data, we also investigate whether machine-translating the data to high-resource languages increases performance on the ideology detection task. Our findings suggest that, while LLMs are not yet fully optimized for a multi-class ideological annotation task, they are practical tools to identify language ideological content.
- Abstract(参考訳): 言語イデオロギーを検出することは、談話を通じてアイデンティティがどのように構築されているかを理解する上で、価値がありながら複雑な作業である。
ルクセンブルクの多文化・多言語社会では、言語イデオロギーは、深い文化的・社会的意味を持ち、アイデンティティを形成し、社会的帰属を形作るという、単なる好み以上のことを反映している。
自然言語処理ツールを言語学や社会科学に適用する最近の発展に続き、言語イデオロギーの検出を支援するための大規模言語モデルの可能性を探る。
我々は,Luxembourgishのユーザコメントのコーパスを事前に定義されたイデオロギーカテゴリで手動で注釈付けし,異なるプロンプト条件下での大規模言語モデルの性能を評価し,それらのアノテーションを再現する能力を評価する。
また,Luxembourgishは小型言語であり,LLMのトレーニングデータに乏しいため,マシンによる高リソース言語への変換がイデオロギー検出タスクの性能を向上させるかどうかについても検討する。
以上の結果から,LLMはまだ多クラスイデオロギーアノテーションタスクに完全に最適化されていないものの,言語イデオロギーの内容を特定するための実用的なツールであることが示唆された。
関連論文リスト
- On the Same Wavelength? Evaluating Pragmatic Reasoning in Language Models across Broad Concepts [69.69818198773244]
本研究では,言語理解と言語生産の両面で,多種多様なLMについて検討する。
最先端のLMは小さくはないが,言語理解において高い性能を発揮する。
論文 参考訳(メタデータ) (2025-09-08T17:59:32Z) - XToM: Exploring the Multilingual Theory of Mind for Large Language Models [57.9821865189077]
LLMにおける既存の心の理論の評価は英語に限られている。
XToMは5言語にまたがってToMを評価する,厳格に検証された多言語ベンチマークである。
以上の結果から,LLMが言語的文脈にまたがって人間的なメンタライゼーションを再現する能力に限界があることが判明した。
論文 参考訳(メタデータ) (2025-06-03T05:23:25Z) - When Less Language is More: Language-Reasoning Disentanglement Makes LLMs Better Multilingual Reasoners [111.50503126693444]
言語固有のアブレーションは多言語推論性能を継続的に向上させることを示す。
トレーニング後のアブレーションと比較して、トレーニング不要のアブレーションは、計算オーバーヘッドを最小限に抑えながら、同等または優れた結果が得られる。
論文 参考訳(メタデータ) (2025-05-21T08:35:05Z) - LinguaLens: Towards Interpreting Linguistic Mechanisms of Large Language Models via Sparse Auto-Encoder [47.81850176849213]
スパースオートエンコーダ(SAE)に基づく大規模言語モデルの言語メカニズム解析のためのフレームワークを提案する。
我々は4次元(形態学、構文学、意味論、プラグマティクス)にわたる中国語と英語の言語的特徴を幅広く抽出する。
本研究は, LLMにおける言語知識の内在的表現, 層間および言語間分布のパターンを明らかにし, モデル出力の制御の可能性を示した。
論文 参考訳(メタデータ) (2025-02-27T18:16:47Z) - How does a Multilingual LM Handle Multiple Languages? [0.0]
本研究では,多言語理解,意味表現,言語間知識伝達の能力について批判的に検討する。
コサイン類似性を用いた一貫性のための多言語単語埋め込みの分析により意味的類似性を評価する。
BLOOM-1.7B と Qwen2 を Named Entity Recognition と文類似性タスクを通して調べ、それらの言語構造を理解する。
論文 参考訳(メタデータ) (2025-02-06T18:08:14Z) - Standard Language Ideology in AI-Generated Language [1.2815904071470705]
標準言語イデオロギーは、大言語モデル(LLM)によって生成された言語に反映され、強化される
我々は、AI生成言語における標準言語イデオロギーがどのように現れるかを示す、オープンな問題の表層分類を提示する。
論文 参考訳(メタデータ) (2024-06-13T01:08:40Z) - Measurement in the Age of LLMs: An Application to Ideological Scaling [1.9413548770753526]
本稿では,大規模言語モデル(LLM)を用いて,社会科学的測定タスクに固有の概念的乱雑を探索する。
我々は、議員とテキストの両方のイデオロギー的尺度を引き出すために、LLMの顕著な言語的流布に依存している。
論文 参考訳(メタデータ) (2023-12-14T18:34:06Z) - Dissociating language and thought in large language models [52.39241645471213]
大規模言語モデル(LLM)は、人間の言語を習得する上で、今までに最も近いモデルである。
我々は、この区別を人間の神経科学に根ざし、形式的、機能的な能力は異なる神経機構に依存していることを示した。
LLMは形式的能力は驚くほど優れているが、機能的能力のタスクにおける性能はいまだに不明瞭である。
論文 参考訳(メタデータ) (2023-01-16T22:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。