論文の概要: Dancing with Deer: A Constructional Perspective on MWEs in the Era of LLMs
- arxiv url: http://arxiv.org/abs/2508.15977v1
- Date: Thu, 21 Aug 2025 21:42:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.194355
- Title: Dancing with Deer: A Constructional Perspective on MWEs in the Era of LLMs
- Title(参考訳): 鹿とのダンス:LLM時代におけるMWEの構築的展望
- Authors: Claire Bonial, Julia Bonn, Harish Tayyar Madabushi,
- Abstract要約: 我々は、使用法に基づく構成文法的アプローチの観点から、マルチワード表現を理解する利点を論じる。
本稿では,英語PropBankにおける多語表現のための構築テンプレートを活用したケーススタディについて述べる。
構成的テンプレートを応用した2つ目のケーススタディを、一様意味表現におけるこれらの多形表現に適用する。
- 参考スコア(独自算出の注目度): 6.449214426814449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this chapter, we argue for the benefits of understanding multiword expressions from the perspective of usage-based, construction grammar approaches. We begin with a historical overview of how construction grammar was developed in order to account for idiomatic expressions using the same grammatical machinery as the non-idiomatic structures of language. We cover a comprehensive description of constructions, which are pairings of meaning with form of any size (morpheme, word, phrase), as well as how constructional approaches treat the acquisition and generalization of constructions. We describe a successful case study leveraging constructional templates for representing multiword expressions in English PropBank. Because constructions can be at any level or unit of form, we then illustrate the benefit of a constructional representation of multi-meaningful morphosyntactic unit constructions in Arapaho, a highly polysynthetic and agglutinating language. We include a second case study leveraging constructional templates for representing these multi-morphemic expressions in Uniform Meaning Representation. Finally, we demonstrate the similarities and differences between a usage-based explanation of a speaker learning a novel multiword expression, such as "dancing with deer," and that of a large language model. We present experiments showing that both models and speakers can generalize the meaning of novel multiword expressions based on a single exposure of usage. However, only speakers can reason over the combination of two such expressions, as this requires comparison of the novel forms to a speaker's lifetime of stored constructional exemplars, which are rich with cross-modal details.
- Abstract(参考訳): この章では、使用法に基づく構成文法的アプローチの観点から、マルチワード表現を理解する利点について論じる。
本研究は, 言語の非慣用構造と同一の文法機械を用いた慣用表現を考慮し, 構築文法がどのように開発されたかの歴史的概要から始める。
構成の包括的記述は, どのような大きさ(形態, 語, 句)でも意味の対であり, 構造的アプローチが構成の獲得と一般化をどのように扱うのかを包括的に記述する。
本稿では,英語PropBankにおける多語表現のための構築テンプレートを活用したケーススタディについて述べる。
構成は任意のレベルまたは単位の形式を持つことができるので、高度に合成され凝集する言語であるアラパホにおける多目的モルフォシンタクティックな単位構成の構成的表現の利点を説明する。
構成的テンプレートを応用した2つ目のケーススタディを、一様意味表現におけるこれらの多形表現に適用する。
最後に, 話者が「鹿との踊り」のような新しい多語表現を学習するのと, 大規模言語モデルとの類似点と相違点を示す。
本稿では, モデルと話者の両方が, 使用感の単一露光に基づいて, 新規なマルチワード表現の意味を一般化できることを示す。
しかし、これら2つの表現の組み合わせは話者のみが推論できるが、これは、新しい形式と、クロスモーダルな詳細に富む話者の存命期間の比較を必要とするためである。
関連論文リスト
- Finding Structure in Language Models [3.882018118763685]
この論文は、言語モデルが人間のものと似た文法構造を深く理解しているかどうかに関するものである。
我々は,大規模言語モデルの複雑な性質の理解を深める新しい解釈可能性技術を開発する。
論文 参考訳(メタデータ) (2024-11-25T14:37:24Z) - Investigating Idiomaticity in Word Representations [9.208145117062339]
我々は2つの言語(英語とポルトガル語)における様々な水準の慣用性を持つ名詞に焦点をあてる。
そこで本研究では,各名詞の音韻性判定を含む最小対のデータセットについて,タイプレベルとトークンレベルの両方で示す。
AffinityとScaled similarityの詳細なメトリクスセットを定義し、モデルが慣用性の変化につながる可能性のある摂動に対してどれほど敏感であるかを判断する。
論文 参考訳(メタデータ) (2024-11-04T21:05:01Z) - Exploring syntactic information in sentence embeddings through multilingual subject-verb agreement [1.4335183427838039]
我々は,特定の特性を持つ大規模でキュレートされた合成データを開発するためのアプローチを採っている。
我々は、ブラックバード言語行列(Blackbird Language Matrices)と呼ばれる新しい複数選択タスクとデータセットを使用して、特定の文法構造現象に焦点を当てる。
多言語テキストを一貫した方法で訓練したにもかかわらず、多言語事前学習言語モデルには言語固有の違いがあることが示される。
論文 参考訳(メタデータ) (2024-09-10T14:58:55Z) - A Method for Studying Semantic Construal in Grammatical Constructions
with Interpretable Contextual Embedding Spaces [11.564029462243631]
本研究では,大言語モデルを用いた文法構成における意味論的コンストラクトについて検討する。
対象位置にある単語は、対象位置にある単語と全く同じ単語よりも、より有効なものとして解釈されることを示す。
本手法は, 特定のレキセムから抽象化された, テンポラティクスレベルでの構文構成の分布的意味を探索することができる。
論文 参考訳(メタデータ) (2023-05-29T20:30:38Z) - Testing the Ability of Language Models to Interpret Figurative Language [69.59943454934799]
比喩的・比喩的な言語は言論において一般的である。
現代の言語モデルが非リテラルなフレーズをどの程度解釈できるかについては、未解決の疑問が残る。
ウィノグラードスタイルの非文字言語理解タスクであるFig-QAを紹介する。
論文 参考訳(メタデータ) (2022-04-26T23:42:22Z) - Understanding Synonymous Referring Expressions via Contrastive Features [105.36814858748285]
画像とオブジェクトインスタンスレベルでのコントラスト機能を学ぶためのエンドツーエンドのトレーニング可能なフレームワークを開発しています。
提案アルゴリズムをいくつかのベンチマークデータセットで評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-04-20T17:56:24Z) - Accurate Word Representations with Universal Visual Guidance [55.71425503859685]
本稿では,視覚指導から従来の単語埋め込みを視覚的に強調する視覚的表現法を提案する。
各単語が多様な関連画像に対応するマルチモーダルシードデータセットから,小型の単語画像辞書を構築する。
12の自然言語理解および機械翻訳タスクの実験により,提案手法の有効性と一般化能力がさらに検証された。
論文 参考訳(メタデータ) (2020-12-30T09:11:50Z) - Unsupervised Distillation of Syntactic Information from Contextualized
Word Representations [62.230491683411536]
我々は,ニューラルネットワーク表現における意味論と構造学の非教師なしの絡み合いの課題に取り組む。
この目的のために、構造的に類似しているが意味的に異なる文群を自動的に生成する。
我々は、我々の変換クラスタベクトルが、語彙的意味論ではなく構造的特性によって空間に現れることを実証する。
論文 参考訳(メタデータ) (2020-10-11T15:13:18Z) - SPLAT: Speech-Language Joint Pre-Training for Spoken Language
Understanding [61.02342238771685]
音声理解には、入力音響信号を解析してその言語内容を理解し、予測するモデルが必要である。
大規模無注釈音声やテキストからリッチな表現を学習するために,様々な事前学習手法が提案されている。
音声と言語モジュールを協調的に事前学習するための,新しい半教師付き学習フレームワークであるSPLATを提案する。
論文 参考訳(メタデータ) (2020-10-05T19:29:49Z) - BURT: BERT-inspired Universal Representation from Twin Structure [89.82415322763475]
BURT (BERT inspired Universal Representation from Twin Structure) は任意の粒度の入力シーケンスに対して普遍的で固定サイズの表現を生成することができる。
提案するBURTは,Siameseネットワークを採用し,自然言語推論データセットから文レベル表現を学習し,パラフレーズ化データセットから単語/フレーズレベル表現を学習する。
我々は,STSタスク,SemEval2013 Task 5(a) など,テキスト類似性タスクの粒度によってBURTを評価する。
論文 参考訳(メタデータ) (2020-04-29T04:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。