論文の概要: Quirk or Palmer: A Comparative Study of Modal Verb Frameworks with
Annotated Datasets
- arxiv url: http://arxiv.org/abs/2212.10152v1
- Date: Tue, 20 Dec 2022 10:44:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 15:20:49.518468
- Title: Quirk or Palmer: A Comparative Study of Modal Verb Frameworks with
Annotated Datasets
- Title(参考訳): quirk または palmer: 注釈付きデータセットを用いたモーダル動詞フレームワークの比較研究
- Authors: Risako Owan, Maria Gini, Dongyeop Kang
- Abstract要約: 言語学者はまだ、モーダル動詞感覚の分類のための単一の枠組みについて合意していない。
この研究は、4,540発以上のモーダル動詞感覚の27,240のアノテーションからなるMoverbデータセットを提示する。
- 参考スコア(独自算出の注目度): 8.09076910034882
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modal verbs, such as "can", "may", and "must", are commonly used in daily
communication to convey the speaker's perspective related to the likelihood
and/or mode of the proposition. They can differ greatly in meaning depending on
how they're used and the context of a sentence (e.g. "They 'must' help each
other out." vs. "They 'must' have helped each other out.") Despite their
practical importance in natural language understanding, linguists have yet to
agree on a single, prominent framework for the categorization of modal verb
senses. This lack of agreement stems from high degrees of flexibility and
polysemy from the modal verbs, making it more difficult for researchers to
incorporate insights from this family of words into their work. This work
presents Moverb dataset, which consists of 27,240 annotations of modal verb
senses over 4,540 utterances containing one or more sentences from social
conversations. Each utterance is annotated by three annotators using two
different theoretical frameworks (i.e., Quirk and Palmer) of modal verb senses.
We observe that both frameworks have similar inter-annotator agreements,
despite having different numbers of sense types (8 for Quirk and 3 for Palmer).
With the RoBERTa-based classifiers fine-tuned on \dataset, we achieve F1 scores
of 82.2 and 78.3 on Quirk and Palmer, respectively, showing that modal verb
sense disambiguation is not a trivial task. Our dataset will be publicly
available with our final version.
- Abstract(参考訳): 日常コミュニケーションでは、"can"、"may"、"must"などのモーダル動詞が、提案の可能性と/またはモードに関連する話者の視点を伝えるために一般的に使用される。
文脈や用法によって意味が大きく異なる場合がある(例えば、"must"は互いに助け合い、"must"は互いに助け合い、"must"は自然言語理解において実際的に重要であるにもかかわらず、言語学者はモーダル動詞の感覚を分類するための単一の顕著な枠組みについて合意していない)。
この合意の欠如は、モーダル動詞からの高い柔軟性と多節性から来ており、研究者がこの語族からの洞察を研究に組み込むのが難しくなっている。
本研究は,社会会話から1文以上の文を含む4,540発話以上のモーダル動詞感覚の27,240のアノテーションからなるmoverbデータセットを提案する。
それぞれの発話は、モーダル動詞感覚の2つの異なる理論的枠組み(すなわち、QuirkとPalmer)を用いて、3つのアノテータによって注釈付けされる。
我々は、両フレームワークが類似のアノテーション間合意を持っていることを観察する(quirkでは8、palmerでは3)。
roberta ベースの分類器は \dataset 上で微調整されており、quirk と palmer でそれぞれ 82.2 と 78.3 の f1 スコアを達成している。
私たちのデータセットは最終バージョンで公開される予定だ。
関連論文リスト
- Contextualized word senses: from attention to compositionality [0.10878040851637999]
本稿では,文脈感覚を符号化する透過的,解釈可能,言語的に動機づけられた戦略を提案する。
特に依存関係や選択選好やパラダイムクラスといった意味概念に注意が向けられる。
論文 参考訳(メタデータ) (2023-12-01T16:04:00Z) - Distributed Marker Representation for Ambiguous Discourse Markers and
Entangled Relations [50.31129784616845]
我々は、無制限の談話マーカーデータと潜在談話感覚を利用して分散マーカ表現(DMR)を学習する。
提案手法は,対話マーカー間の複雑なあいまいさや絡み合いや,手動で定義した談話関係を理解する上でも有用である。
論文 参考訳(メタデータ) (2023-06-19T00:49:51Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Not wacky vs. definitely wacky: A study of scalar adverbs in pretrained
language models [0.0]
BERT、RoBERTa、GPT-3といった現代の事前訓練された言語モデルは、古典的な静的単語の埋め込みよりも論理的なタスクでより良いパフォーマンスを期待している。
本稿では,BERT,RoBERTa,GPT-2,GPT-3が,これらの共通語に対する一般人的な知識を示す範囲について検討する。
論理的な意味のいくつかの側面を捉えているにもかかわらず、モデルは人間のパフォーマンスにかなり劣っていることが分かりました。
論文 参考訳(メタデータ) (2023-05-25T18:56:26Z) - We're Afraid Language Models Aren't Modeling Ambiguity [136.8068419824318]
あいまいさの管理は人間の言語理解の重要な部分です。
文中のあいまいさは,他の文との係り受け関係に与える影響によって特徴付けられる。
我々は,多ラベルNLIモデルが曖昧さによって誤解を招く野生の政治的主張にフラグを付けることができることを示す。
論文 参考訳(メタデータ) (2023-04-27T17:57:58Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - RAW-C: Relatedness of Ambiguous Words--in Context (A New Lexical
Resource for English) [2.792030485253753]
文脈的埋め込みが単語の意味の連続的、動的性質にどの程度適合しているかを評価する。
我々は、コサイン距離が、人間が同じ単語の感覚をいかに利用しているかを体系的に過小評価していることを示す。
本稿では,精神語彙の心理言語学理論と語彙意味論の計算モデルとの合成を提案する。
論文 参考訳(メタデータ) (2021-05-27T16:07:13Z) - "I'd rather just go to bed": Understanding Indirect Answers [61.234722570671686]
我々は,質問に対する間接的応答の理解という,現実的な推論問題をダイアログで再検討する。
最初の大規模英語コーパス「Circa」を34,268対(極性質問,間接回答)で作成・リリースする。
本稿では,質問応答対のカテゴリを予測するためにBERTに基づくニューラルモデルを提案する。
論文 参考訳(メタデータ) (2020-10-07T14:41:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。