論文の概要: Understanding or Memorizing? A Case Study of German Definite Articles in Language Models
- arxiv url: http://arxiv.org/abs/2601.09313v1
- Date: Wed, 14 Jan 2026 09:31:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.350368
- Title: Understanding or Memorizing? A Case Study of German Definite Articles in Language Models
- Title(参考訳): 理解・記憶 : 言語モデルにおけるドイツ語定説の事例研究
- Authors: Jonathan Drechsel, Erisa Bytyqi, Steffen Herbold,
- Abstract要約: 我々は、性別やケースによって異なる独特な記事に対する質問について研究する。
勾配に基づく解法であるGRADIENDを用いて,ジェンダーケース固有の記事遷移のパラメータ更新方向を学習する。
- 参考スコア(独自算出の注目度): 3.205247598097648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Language models perform well on grammatical agreement, but it is unclear whether this reflects rule-based generalization or memorization. We study this question for German definite singular articles, whose forms depend on gender and case. Using GRADIEND, a gradient-based interpretability method, we learn parameter update directions for gender-case specific article transitions. We find that updates learned for a specific gender-case article transition frequently affect unrelated gender-case settings, with substantial overlap among the most affected neurons across settings. These results argue against a strictly rule-based encoding of German definite articles, indicating that models at least partly rely on memorized associations rather than abstract grammatical rules.
- Abstract(参考訳): 言語モデルは文法的によく機能するが、それが規則に基づく一般化や暗記を反映しているかどうかは不明である。
我々は、この疑問を、性別やケースによって異なる独特な記事に対して研究する。
勾配に基づく解法であるGRADIENDを用いて,ジェンダーケース固有の記事遷移のパラメータ更新方向を学習する。
特定のジェンダーケースの項目の遷移で得られた更新は、無関係なジェンダーケースの設定に頻繁に影響し、設定全体にわたって最も影響の大きいニューロン間にかなりの重複があることがわかった。
これらの結果は、厳密な規則に基づくドイツ語定冠詞の符号化に反対し、少なくとも部分的には抽象文法規則よりも記憶された協会に依存していることを示している。
関連論文リスト
- Voice, Bias, and Coreference: An Interpretability Study of Gender in Speech Translation [25.126933196101703]
本稿では,STモデルを用いて3つの言語対にまたがる話者参照語に性別を割り当てるメカニズムについて検討する。
モデルは、訓練データから用語固有の性関係を再現するだけでなく、男性における有病率のより広範なパターンを学習する。
コントラスト的特徴属性をスペクトログラムに用いて, 性別の精度が高いモデルは, 以前は未知のメカニズムに依存していたことが明らかとなった。
論文 参考訳(メタデータ) (2025-11-26T15:48:04Z) - False Friends Are Not Foes: Investigating Vocabulary Overlap in Multilingual Language Models [53.01170039144264]
多言語コーパスで訓練されたサブワードトークンライザは、言語間で重複するトークンを自然に生成する。
トークンの重複は言語間転送を促進するのか、それとも言語間の干渉を導入するのか?
相反する語彙を持つモデルでは、重なり合う結果が得られます。
論文 参考訳(メタデータ) (2025-09-23T07:47:54Z) - The Lou Dataset -- Exploring the Impact of Gender-Fair Language in German Text Classification [57.06913662622832]
ジェンダーフェア言語は、すべての性別に対処したり、中立形を使用することによって包摂性を促進する。
ジェンダーフェア言語はラベルを反転させ、確実性を減らし、注意パターンを変化させることで予測に大きな影響を及ぼす。
ドイツ語のテキスト分類への影響について最初の知見を提供する一方で、他の言語にもその知見が当てはまる可能性が高い。
論文 参考訳(メタデータ) (2024-09-26T15:08:17Z) - What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Building Bridges: A Dataset for Evaluating Gender-Fair Machine Translation into German [17.924716793621627]
英独機械翻訳(MT)におけるジェンダーフェア言語の研究
2つの商用システムと6つのニューラルMTモデルを含む最初のベンチマーク研究を行う。
以上の結果から,ほとんどのシステムでは男性型が主流であり,性別ニュートラル変種は稀である。
論文 参考訳(メタデータ) (2024-06-10T09:39:19Z) - Investigating grammatical abstraction in language models using few-shot learning of novel noun gender [0.0]
我々は,LSTMとデコーダのみのトランスフォーマーが,フランス語の文法的ジェンダーを人間のように抽象化できるかどうかを評価するために名詞学習実験を行った。
両言語モデルが一対二の学習例から新約名詞のジェンダーを効果的に一般化し,合意文脈にまたがって学習したジェンダーを適用した。
モデルの一般化行動は、それらが人間のように文法的な性別を抽象的なカテゴリーとして表現していることを示しているが、詳細を探求するにはさらなる作業が必要である。
論文 参考訳(メタデータ) (2024-03-15T14:25:59Z) - Target-Agnostic Gender-Aware Contrastive Learning for Mitigating Bias in
Multilingual Machine Translation [28.471506840241602]
ジェンダーバイアスは機械翻訳において重要な問題であり、バイアス軽減技術の研究が進行中である。
本稿では,新しいアプローチに基づくバイアス緩和手法を提案する。
Gender-Aware Contrastive Learning, GACLは、文脈性情報を非明示性単語の表現にエンコードする。
論文 参考訳(メタデータ) (2023-05-23T12:53:39Z) - Don't Forget About Pronouns: Removing Gender Bias in Language Models
Without Losing Factual Gender Information [4.391102490444539]
英語のテキストでは、ジェンダー情報とジェンダーバイアスの2つのタイプに焦点を当てている。
ジェンダーシグナルを保存しながら表現のステレオタイプバイアスを小さくすることを目的としている。
論文 参考訳(メタデータ) (2022-06-21T21:38:25Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。