論文の概要: A Computational Framework for Slang Generation
- arxiv url: http://arxiv.org/abs/2102.01826v1
- Date: Wed, 3 Feb 2021 01:19:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 17:34:14.484195
- Title: A Computational Framework for Slang Generation
- Title(参考訳): Slang生成のための計算フレームワーク
- Authors: Zhewei Sun, Richard Zemel, Yang Xu
- Abstract要約: 我々は、スラングコンテキストにおける話者の単語選択をモデル化するフレームワークを開発することにより、スラングの機械生成に向けた最初の一歩を踏み出した。
本フレームワークは,従来の単語のスラング感覚とスラング感覚を関連付けることで,新しいスラングの意味を符号化する。
我々は3つのスラング辞書に対して厳密な評価を行い、我々のアプローチが最先端の言語モデルより優れていることを示す。
- 参考スコア(独自算出の注目度): 2.1813490315521773
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Slang is a common type of informal language, but its flexible nature and
paucity of data resources present challenges for existing natural language
systems. We take an initial step toward machine generation of slang by
developing a framework that models the speaker's word choice in slang context.
Our framework encodes novel slang meaning by relating the conventional and
slang senses of a word while incorporating syntactic and contextual knowledge
in slang usage. We construct the framework using a combination of probabilistic
inference and neural contrastive learning. We perform rigorous evaluations on
three slang dictionaries and show that our approach not only outperforms
state-of-the-art language models, but also better predicts the historical
emergence of slang word usages from 1960s to 2000s. We interpret the proposed
models and find that the contrastively learned semantic space is sensitive to
the similarities between slang and conventional senses of words. Our work
creates opportunities for the automated generation and interpretation of
informal language.
- Abstract(参考訳): Slangは一般的な非公式言語であるが、その柔軟性とデータ資源の質は、既存の自然言語システムに課題をもたらす。
slangコンテキストにおける話者の単語選択をモデル化するフレームワークを開発することにより、slangのマシン生成に向けて最初の一歩を踏み出します。
本フレームワークは,構文的および文脈的知識をスラングの用法に取り入れつつ,単語の従来のスラング感覚とスラング感覚を関連付けることで,新しいスラング意味を符号化する。
確率的推論とニューラルネットワークのコントラスト学習を組み合わせたフレームワークを構築した。
3つのスラング辞書で厳密な評価を行い、私たちのアプローチは最先端の言語モデルを上回るだけでなく、1960年代から2000年代までのスラング語の使用法の歴史的出現をより良く予測することを示しています。
提案したモデルを解釈し,比較学習されたセマンティック空間は,スラングと従来の単語感覚の類似性に敏感であることを示す。
私たちの仕事は、非公式言語の自動生成と解釈の機会を生み出します。
関連論文リスト
- A Study of Slang Representation Methods [3.511369967593153]
我々は,スラング理解に依存した様々な下流タスクに対して,表現学習モデルと知識資源の異なる組み合わせについて検討する。
誤り解析では、語彙外単語、多意味性、分散性、アノテーションの不一致など、スラング表現学習における中核的な課題を識別する。
論文 参考訳(メタデータ) (2022-12-11T21:56:44Z) - Tracing Semantic Variation in Slang [3.437479039185694]
スラングの意味的変異は、スラングの自然言語処理においてよく理解されておらず、解明されていない。
既存の見解では、スラングの意味の変化は文化に依存したコミュニケーションの必要性によって引き起こされるという。
別の見解はスラングの社会的機能に焦点を当て、意味的区別を育むという欲求が、コミュニティ固有のスラング感覚の歴史的出現に繋がった可能性を示唆している。
論文 参考訳(メタデータ) (2022-10-16T20:51:14Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z) - The Whole Truth and Nothing But the Truth: Faithful and Controllable
Dialogue Response Generation with Dataflow Transduction and Constrained
Decoding [65.34601470417967]
本稿では,ニューラルネットワークモデリングとルールベース生成の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。
本実験により, 本システムは, 流布性, 妥当性, 真理性の評価において, ルールベースおよび学習的アプローチの両方に優れることがわかった。
論文 参考訳(メタデータ) (2022-09-16T09:00:49Z) - Noun2Verb: Probabilistic frame semantics for word class conversion [8.939269057094661]
本稿では,新規な名詞用動詞の生成と理解をシミュレートする形式的枠組みを提案する。
話者とリスナーが協調して意味的フレーム要素上の結合分布を学習するモデルは、経験的名詞使用法をよりよく説明できることを示す。
論文 参考訳(メタデータ) (2022-05-12T19:16:12Z) - Semantically Informed Slang Interpretation [2.9097456604613745]
本稿では,クエリスラングに対する候補解釈の文脈的,意味的適切性を考慮した意味情報付きスラング解釈(SSI)フレームワークを提案する。
我々は、スラングの機械翻訳を英語から他の言語に拡張するために、同じフレームワークをいかに適用できるかを示す。
論文 参考訳(メタデータ) (2022-05-02T01:51:49Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - Knowledge Injection into Dialogue Generation via Language Models [85.65843021510521]
InjKは対話生成モデルに知識を注入するための2段階のアプローチである。
まず、大規模言語モデルをトレーニングし、テキスト知識としてクエリする。
次に、対話生成モデルを作成し、テキスト知識と対応する応答を逐次生成する。
論文 参考訳(メタデータ) (2020-04-30T07:31:24Z) - Word Sense Disambiguation for 158 Languages using Word Embeddings Only [80.79437083582643]
文脈における単語感覚の曖昧さは人間にとって容易であるが、自動的アプローチでは大きな課題である。
本稿では,学習前の標準単語埋め込みモデルを入力として,完全に学習した単語認識のインベントリを誘導する手法を提案する。
この手法を用いて、158の言語に対して、事前訓練されたfastText単語の埋め込みに基づいて、センスインベントリのコレクションを誘導する。
論文 参考訳(メタデータ) (2020-03-14T14:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。