論文の概要: FLUTE: Figurative Language Understanding and Textual Explanations
- arxiv url: http://arxiv.org/abs/2205.12404v1
- Date: Tue, 24 May 2022 23:25:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-29 00:40:49.758149
- Title: FLUTE: Figurative Language Understanding and Textual Explanations
- Title(参考訳): FLUTE: 図形言語理解とテキスト説明
- Authors: Tuhin Chakrabarty, Arkadiy Saakyan, Debanjan Ghosh and Smaranda
Muresan
- Abstract要約: FLUTEは8000の図式NLIインスタンスのデータセットで、説明とともにリリースします。
我々は、GPT-3を人間の専門家と組み合わせることで、データセットの作成をスケールアップできることを示す。
- 参考スコア(独自算出の注目度): 37.83909874945428
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In spite of the prevalence of figurative language, transformer-based models
struggle to demonstrate an understanding of it. Meanwhile, even classical
natural language inference (NLI) tasks have been plagued by spurious
correlations and annotation artifacts. Datasets like eSNLI have been released,
allowing to probe whether language models are right for the right reasons. Yet
no such data exists for figurative language, making it harder to asses genuine
understanding of such expressions. In light of the above, we release FLUTE, a
dataset of 8,000 figurative NLI instances with explanations, spanning three
categories: Sarcasm, Simile, and Metaphor. We collect the data through the
Human-AI collaboration framework based on GPT-3, crowdworkers, and expert
annotation. We show how utilizing GPT-3 in conjunction with human experts can
aid in scaling up the creation of datasets even for such complex linguistic
phenomena as figurative language. Baseline performance of the T5 model shows
our dataset is a challenging testbed for figurative language understanding.
- Abstract(参考訳): 図形言語の普及にもかかわらず、トランスフォーマーベースのモデルは、その理解を実証するのに苦労している。
一方、古典的な自然言語推論(NLI)タスクでさえ、素早い相関やアノテーションのアーティファクトに悩まされている。
eSNLIのようなデータセットがリリースされ、適切な理由で言語モデルが正しいかどうかを調査できるようになった。
しかし、そのようなデータはフィギュラティブ言語には存在せず、そのような表現を真に理解することは困難である。
上記の点を踏まえて、Sarcasm、Simile、Metaphorの3つのカテゴリにまたがる、8,000の図式NLIインスタンスのデータセットであるFLUTEをリリースする。
我々は,GPT-3,クラウドワーカー,エキスパートアノテーションに基づくHuman-AIコラボレーションフレームワークを通じてデータを収集する。
GPT-3を人間の専門家と組み合わせることで、図形言語のような複雑な言語現象であってもデータセットの作成を拡大できることを示す。
T5モデルのベースライン性能は、我々のデータセットが図形言語を理解する上で困難なテストベッドであることを示している。
関連論文リスト
- Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Retrieval-based Disentangled Representation Learning with Natural
Language Supervision [61.75109410513864]
本稿では,VDR(Vocabulary Disentangled Retrieval)を提案する。
提案手法では,両エンコーダモデルを用いて語彙空間におけるデータと自然言語の両方を表現する。
論文 参考訳(メタデータ) (2022-12-15T10:20:42Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z) - Testing the Ability of Language Models to Interpret Figurative Language [69.59943454934799]
比喩的・比喩的な言語は言論において一般的である。
現代の言語モデルが非リテラルなフレーズをどの程度解釈できるかについては、未解決の疑問が残る。
ウィノグラードスタイルの非文字言語理解タスクであるFig-QAを紹介する。
論文 参考訳(メタデータ) (2022-04-26T23:42:22Z) - It's not Rocket Science : Interpreting Figurative Language in Narratives [48.84507467131819]
我々は2つの非構成的図形言語(イディオムとシミュラ)の解釈を研究する。
実験の結果、事前学習された言語モデルのみに基づくモデルは、これらのタスクにおいて人間よりもはるかにひどい性能を示すことがわかった。
また, 知識強化モデルを提案し, 具体的言語を解釈するための人的戦略を採用した。
論文 参考訳(メタデータ) (2021-08-31T21:46:35Z) - A Robust Deep Ensemble Classifier for Figurative Language Detection [1.3124513975412255]
自然言語処理(NLP)の幅広い分野における感性分析のオープンな問題である言語認識(FL)
本論文では,高度なDeep Learning (DL) 技術に対処する,皮肉,皮肉,メタファの3つの相互関連FL認識タスクについて述べる。
Deep Soft Ensemble (DESC) モデルは、FL認識の挑戦的な分野において、関連する方法論や最先端技術と比較すると、非常に優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-07-09T11:26:37Z) - Figurative Language in Recognizing Textual Entailment [17.970569365665156]
既存の5つのデータセットをさまざまな図形言語に活用しています。
我々は、人気のあるRTEデータセットでトレーニングされた最先端のモデルが、比喩言語の異なる側面をいかに捉えているかを評価する。
論文 参考訳(メタデータ) (2021-06-02T14:37:32Z) - A Visuospatial Dataset for Naturalistic Verb Learning [18.654373173232205]
基礎言語モデルのトレーニングと評価のための新しいデータセットを導入する。
我々のデータはバーチャルリアリティー環境で収集され、言語データの品質をエミュレートするように設計されている。
収集したデータを用いて、動詞学習のための複数の分布意味論モデルを比較する。
論文 参考訳(メタデータ) (2020-10-28T20:47:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。