論文の概要: Semantically Informed Slang Interpretation
- arxiv url: http://arxiv.org/abs/2205.00616v1
- Date: Mon, 2 May 2022 01:51:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 13:26:06.566613
- Title: Semantically Informed Slang Interpretation
- Title(参考訳): 意味的インフォームドスラング解釈
- Authors: Zhewei Sun, Richard Zemel, Yang Xu
- Abstract要約: 本稿では,クエリスラングに対する候補解釈の文脈的,意味的適切性を考慮した意味情報付きスラング解釈(SSI)フレームワークを提案する。
我々は、スラングの機械翻訳を英語から他の言語に拡張するために、同じフレームワークをいかに適用できるかを示す。
- 参考スコア(独自算出の注目度): 2.9097456604613745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Slang is a predominant form of informal language making flexible and extended
use of words that is notoriously hard for natural language processing systems
to interpret. Existing approaches to slang interpretation tend to rely on
context but ignore semantic extensions common in slang word usage. We propose a
semantically informed slang interpretation (SSI) framework that considers
jointly the contextual and semantic appropriateness of a candidate
interpretation for a query slang. We perform rigorous evaluation on two
large-scale online slang dictionaries and show that our approach not only
achieves state-of-the-art accuracy for slang interpretation in English, but
also does so in zero-shot and few-shot scenarios where training data is sparse.
Furthermore, we show how the same framework can be applied to enhancing machine
translation of slang from English to other languages. Our work creates
opportunities for the automated interpretation and translation of informal
language.
- Abstract(参考訳): スラング(英語: Slang)は、自然言語処理システムでは解釈が難しい言葉を柔軟かつ拡張した非公式言語の一形態である。
既存のスラング解釈へのアプローチは文脈に依存する傾向があるが、スラング語の使用に共通する意味拡張を無視している。
本稿では,クエリスラングの候補解釈の文脈的・意味的適合性を考慮したssi(semantically informed slang interpretation)フレームワークを提案する。
我々は,2つの大規模オンラインスラング辞書について厳密な評価を行い,本手法がスラング解釈の最先端の精度を英語で達成するだけでなく,訓練データ不足のゼロショットと少数ショットのシナリオでも実現可能であることを示す。
さらに,スラングの機械翻訳を英語から他言語に拡張するために,同じ枠組みが適用可能であることを示す。
私たちの仕事は、非公式言語の自動解釈と翻訳の機会を生み出します。
関連論文リスト
- That was the last straw, we need more: Are Translation Systems Sensitive
to Disambiguating Context? [64.38544995251642]
我々は、源泉に存在している意味的あいまいさ(本研究における英語)について研究する。
我々は、リテラルと図形の両方にオープンなイディオムに焦点を当てている。
現在のMTモデルは、たとえ文脈が比喩的解釈を示しているとしても、英語のイディオムを文字通りに翻訳する。
論文 参考訳(メタデータ) (2023-10-23T06:38:49Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - A Study of Slang Representation Methods [3.511369967593153]
我々は,スラング理解に依存した様々な下流タスクに対して,表現学習モデルと知識資源の異なる組み合わせについて検討する。
誤り解析では、語彙外単語、多意味性、分散性、アノテーションの不一致など、スラング表現学習における中核的な課題を識別する。
論文 参考訳(メタデータ) (2022-12-11T21:56:44Z) - Tracing Semantic Variation in Slang [3.437479039185694]
スラングの意味的変異は、スラングの自然言語処理においてよく理解されておらず、解明されていない。
既存の見解では、スラングの意味の変化は文化に依存したコミュニケーションの必要性によって引き起こされるという。
別の見解はスラングの社会的機能に焦点を当て、意味的区別を育むという欲求が、コミュニティ固有のスラング感覚の歴史的出現に繋がった可能性を示唆している。
論文 参考訳(メタデータ) (2022-10-16T20:51:14Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z) - UAlberta at SemEval 2022 Task 2: Leveraging Glosses and Translations for
Multilingual Idiomaticity Detection [4.66831886752751]
本稿では,SemEval-2022タスク2における多言語的慣用性検出のためのアルバータ大学システムについて述べる。
慣用的表現が非合成的という仮定の下では,表現の個々の単語の意味に関する情報を二項分類器に統合する。
2つ目の方法は文脈で表現を翻訳し、語彙知識ベースを用いて翻訳がリテラルであるかどうかを判定する。
論文 参考訳(メタデータ) (2022-05-27T16:35:00Z) - Testing the Ability of Language Models to Interpret Figurative Language [69.59943454934799]
比喩的・比喩的な言語は言論において一般的である。
現代の言語モデルが非リテラルなフレーズをどの程度解釈できるかについては、未解決の疑問が残る。
ウィノグラードスタイルの非文字言語理解タスクであるFig-QAを紹介する。
論文 参考訳(メタデータ) (2022-04-26T23:42:22Z) - Provable Limitations of Acquiring Meaning from Ungrounded Form: What
will Future Language Models Understand? [87.20342701232869]
未知のシステムが意味を習得する能力について検討する。
アサーションによってシステムが等価性のような意味関係を保存する表現をエミュレートできるかどうか検討する。
言語内のすべての表現が参照的に透明であれば,アサーションによってセマンティックエミュレーションが可能になる。
しかし、言語が変数バインディングのような非透過的なパターンを使用する場合、エミュレーションは計算不能な問題になる可能性がある。
論文 参考訳(メタデータ) (2021-04-22T01:00:17Z) - A Computational Framework for Slang Generation [2.1813490315521773]
我々は、スラングコンテキストにおける話者の単語選択をモデル化するフレームワークを開発することにより、スラングの機械生成に向けた最初の一歩を踏み出した。
本フレームワークは,従来の単語のスラング感覚とスラング感覚を関連付けることで,新しいスラングの意味を符号化する。
我々は3つのスラング辞書に対して厳密な評価を行い、我々のアプローチが最先端の言語モデルより優れていることを示す。
論文 参考訳(メタデータ) (2021-02-03T01:19:07Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。