論文の概要: Generics are puzzling. Can language models find the missing piece?
- arxiv url: http://arxiv.org/abs/2412.11318v1
- Date: Sun, 15 Dec 2024 21:30:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 14:01:43.027442
- Title: Generics are puzzling. Can language models find the missing piece?
- Title(参考訳): ジェネリックは困っている。言語モデルは欠落点を見つけることができるのか?
- Authors: Gustavo Cilleruelo Calderón, Emily Allaway, Barry Haddow, Alexandra Birch,
- Abstract要約: 本稿では,言語モデルとして言語モデルを活用することで,ジェネリクスの暗黙的定量化と文脈感度について検討する。
ConGenは2873の自然発生文と、文脈における定量化文のデータセットです。
実験の結果, ジェネリックは決定器の量化器よりも文脈に敏感であり, 自然発生ジェネリックの約20%は弱い一般化を表現していることがわかった。
- 参考スコア(独自算出の注目度): 70.14604603488178
- License:
- Abstract: Generic sentences express generalisations about the world without explicit quantification. Although generics are central to everyday communication, building a precise semantic framework has proven difficult, in part because speakers use generics to generalise properties with widely different statistical prevalence. In this work, we study the implicit quantification and context-sensitivity of generics by leveraging language models as models of language. We create ConGen, a dataset of 2873 naturally occurring generic and quantified sentences in context, and define p-acceptability, a metric based on surprisal that is sensitive to quantification. Our experiments show generics are more context-sensitive than determiner quantifiers and about 20% of naturally occurring generics we analyze express weak generalisations. We also explore how human biases in stereotypes can be observed in language models.
- Abstract(参考訳): ジェネリック文は、明示的な定量化なしに世界に関する一般化を表現する。
ジェネリクスは日常的なコミュニケーションの中心であるが、正確なセマンティック・フレームワークの構築は困難であることが証明されている。
本研究では,言語モデルとして言語モデルを活用することで,ジェネリクスの暗黙的定量化と文脈感受性について検討する。
ConGenは、自然に発生する2873の汎用文と定量化文のデータセットを作成し、量子化に敏感な仮定に基づく計量であるp-アクセプティビリティを定義する。
実験の結果, ジェネリックは決定器の量化器よりも文脈に敏感であり, 自然発生ジェネリックの約20%は弱い一般化を表現していることがわかった。
また、ステレオタイプにおける人間のバイアスが言語モデルでどのように観察できるかについても検討する。
関連論文リスト
- Evaluating Structural Generalization in Neural Machine Translation [13.880151307013318]
SGETは,単語や文構造を制御して,様々な種類の合成一般化を包含するデータセットである。
ニューラルネットワーク翻訳モデルは、語彙的一般化よりも構造的一般化に苦慮していることを示す。
また、セマンティック解析と機械翻訳において、様々なタスクにおける評価の重要性を示す様々なパフォーマンストレンドを見出した。
論文 参考訳(メタデータ) (2024-06-19T09:09:11Z) - GeniL: A Multilingual Dataset on Generalizing Language [19.43611224855484]
生成言語におけるステレオタイプの存在を評価するための現在の手法は、単純なテンプレートや共起に基づく尺度に依存している。
意味的文脈を理解することは一般化の事例を検出するために重要であると論じる。
我々は、一般化の例に注釈を付けた9言語から50K以上の文からなる多言語データセットGeniLを構築した。
論文 参考訳(メタデータ) (2024-04-08T20:58:06Z) - SLOG: A Structural Generalization Benchmark for Semantic Parsing [68.19511282584304]
合成一般化ベンチマークの目的は、モデルがいかにして新しい複雑な言語表現に一般化するかを評価することである。
既存のベンチマークは、しばしば語彙一般化に焦点を当て、訓練に精通した構文構造における新しい語彙項目の解釈は、しばしば不足している。
SLOGは,COGSを拡張したセマンティック解析データセットである。
論文 参考訳(メタデータ) (2023-10-23T15:39:09Z) - How Do In-Context Examples Affect Compositional Generalization? [86.57079616209474]
本稿では,コンテクスト内構成一般化を検証するためのテストスイートであるCoFeを提案する。
構成一般化性能は、文脈内例の選択によって容易に影響を受けることが判明した。
我々の系統実験は、文脈内サンプルは、テストケースと構造的に似ており、互いに異なっており、個別に単純であることを示します。
論文 参考訳(メタデータ) (2023-05-08T16:32:18Z) - Penguins Don't Fly: Reasoning about Generics through Instantiations and
Exceptions [73.56753518339247]
本稿では, 言語理論から先例を生成するための新しい枠組みを提案する。
我々は650のジェネリックに対して19kの例を作成し、我々のフレームワークは12.8の精度で強力なGPT-3ベースラインを上回ります。
論文 参考訳(メタデータ) (2022-05-23T22:45:53Z) - Mitigating Biases in Toxic Language Detection through Invariant
Rationalization [70.36701068616367]
性別、人種、方言などの属性に対するバイアスは、毒性検出のためのほとんどのトレーニングデータセットに存在する。
本稿では,論理生成器と予測器から構成されるゲーム理論フレームワークである不変合理化(InvRat)を用いて,特定の構文パターンの素早い相関を除外することを提案する。
本手法は, 語彙属性と方言属性の両方において, 従来のデバイアス法よりも低い偽陽性率を示す。
論文 参考訳(メタデータ) (2021-06-14T08:49:52Z) - Compositional Generalization and Natural Language Variation: Can a
Semantic Parsing Approach Handle Both? [27.590858384414567]
私たちは、自然言語のバリエーションと合成の一般化の両方を扱う意味解析アプローチを開発できますか?
我々は、この能力をよりよく評価するために、非合成データセットの新しいトレインとテスト分割を提案する。
また、NQG-T5は、高精度文法に基づくアプローチと事前学習されたシーケンス・ツー・シーケンスモデルを組み合わせたハイブリッドモデルである。
論文 参考訳(メタデータ) (2020-10-24T00:38:27Z) - Detecting and Understanding Generalization Barriers for Neural Machine
Translation [53.23463279153577]
本稿では,未知の入力文内での一般化バリアワードの同定と理解を試みる。
本稿では,一般化バリアワードの原理的定義と,計算において抽出可能な修正版を提案する。
次に、Zh$Leftrightarrow$En NISTベンチマークで検出された一般化障壁ワードについて広範な解析を行う。
論文 参考訳(メタデータ) (2020-04-05T12:33:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。