論文の概要: Construction Artifacts in Metaphor Identification Datasets
- arxiv url: http://arxiv.org/abs/2311.00790v1
- Date: Wed, 1 Nov 2023 19:21:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 15:54:18.443625
- Title: Construction Artifacts in Metaphor Identification Datasets
- Title(参考訳): メタファー同定データセットにおける構築アーチファクト
- Authors: Joanne Boisson, Luis Espinosa-Anke, Jose Camacho-Collados
- Abstract要約: 既存のメタファ識別データセットは、潜在的なメタファ的表現やその発生状況を完全に無視することで、どのようにゲーム化できるかを示す。
完全な情報を持たない言語モデルに基づくメタファ識別システムは,完全な文脈を用いたシステムと競合しうることを示す。
- 参考スコア(独自算出の注目度): 16.938987272921196
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Metaphor identification aims at understanding whether a given expression is
used figuratively in context. However, in this paper we show how existing
metaphor identification datasets can be gamed by fully ignoring the potential
metaphorical expression or the context in which it occurs. We test this
hypothesis in a variety of datasets and settings, and show that metaphor
identification systems based on language models without complete information
can be competitive with those using the full context. This is due to the
construction procedures to build such datasets, which introduce unwanted biases
for positive and negative classes. Finally, we test the same hypothesis on
datasets that are carefully sampled from natural corpora and where this bias is
not present, making these datasets more challenging and reliable.
- Abstract(参考訳): メタファー識別は、与えられた表現が文脈において比喩的に使用されるかどうかを理解することを目的としている。
しかし,本稿では,メタファ表現やその発生状況を完全に無視することで,既存のメタファ識別データセットをゲーム化することができることを示す。
我々は,この仮説を様々なデータセットや設定で検証し,完全な情報を持たない言語モデルに基づくメタファ識別システムが,完全なコンテキストを使用するものと競合することを示す。
これは、正と負のクラスに対して望ましくないバイアスをもたらすようなデータセットの構築手順が原因である。
最後に、自然コーパスから注意深くサンプリングされ、バイアスが存在しないデータセットで同じ仮説をテストし、これらのデータセットをより困難で信頼性の高いものにします。
関連論文リスト
- Meta4XNLI: A Crosslingual Parallel Corpus for Metaphor Detection and Interpretation [6.0158981171030685]
本稿ではスペイン語と英語の両方でメタファアノテーションを含むメタファ検出と解釈のタスクのための新しい並列データセットを提案する。
言語モデルのメタファ識別と理解能力について,一言語間実験と言語間実験による検討を行った。
論文 参考訳(メタデータ) (2024-04-10T14:44:48Z) - Enhancing Metaphor Detection through Soft Labels and Target Word Prediction [3.7676096626244986]
メタファ検出に特化して設計された即時学習フレームワークを開発した。
また,有意義なソフトラベルを生成する教師モデルも導入する。
実験により,本モデルが最先端の性能を達成したことを示す。
論文 参考訳(メタデータ) (2024-03-27T04:51:42Z) - Are Representations Built from the Ground Up? An Empirical Examination
of Local Composition in Language Models [91.3755431537592]
構成的・非構成的句を表現することは言語理解にとって重要である。
まず,より長いフレーズのLM-内部表現を,その構成成分から予測する問題を定式化する。
意味的構成性の人間の判断と相関する予測精度を期待するが、大部分はそうではない。
論文 参考訳(メタデータ) (2022-10-07T14:21:30Z) - FLUTE: Figurative Language Understanding and Textual Explanations [37.83909874945428]
FLUTEは8000の図式NLIインスタンスのデータセットで、説明とともにリリースします。
我々は、GPT-3を人間の専門家と組み合わせることで、データセットの作成をスケールアップできることを示す。
論文 参考訳(メタデータ) (2022-05-24T23:25:02Z) - Context vs Target Word: Quantifying Biases in Lexical Semantic Datasets [18.754562380068815]
BERTのような最先端のコンテキスト化モデルは、WiCやWSDのようなタスクを使用して、ワード・イン・コンテクストの表現を評価する。
本研究は,主要な文脈的語彙意味タスクにおいて,文脈-単語間相互作用を検証した最初の定量的分析(探索ベースラインを用いた)を提案する。
論文 参考訳(メタデータ) (2021-12-13T15:37:05Z) - On the Impact of Temporal Representations on Metaphor Detection [1.6959319157216468]
メタファー検出のための最先端のアプローチは、ニューラルネットワークに基づくシーケンシャルなメタファー分類器を使用して、リテラル(リテラル、またはコア)の意味と文脈的意味を比較する。
本研究では, 時間的, 静的な単語の埋め込みを, 意味の表現に用い, 詳細な探索分析によるメタファ検出課題について検討する。
その結果,異なる単語の埋め込みがメタファー検出タスクや時間的単語の埋め込みに影響を及ぼすことが示唆された。
論文 参考訳(メタデータ) (2021-11-05T08:43:21Z) - It's not Rocket Science : Interpreting Figurative Language in Narratives [48.84507467131819]
我々は2つの非構成的図形言語(イディオムとシミュラ)の解釈を研究する。
実験の結果、事前学習された言語モデルのみに基づくモデルは、これらのタスクにおいて人間よりもはるかにひどい性能を示すことがわかった。
また, 知識強化モデルを提案し, 具体的言語を解釈するための人的戦略を採用した。
論文 参考訳(メタデータ) (2021-08-31T21:46:35Z) - Understanding Synonymous Referring Expressions via Contrastive Features [105.36814858748285]
画像とオブジェクトインスタンスレベルでのコントラスト機能を学ぶためのエンドツーエンドのトレーニング可能なフレームワークを開発しています。
提案アルゴリズムをいくつかのベンチマークデータセットで評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-04-20T17:56:24Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Grounded and Controllable Image Completion by Incorporating Lexical
Semantics [111.47374576372813]
Lexical Semantic Image Completion (LSIC)は、芸術、デザイン、遺産保護に潜在的な応用をもたらす可能性がある。
視覚的文脈と語彙的文脈の両方に忠実な結果を生成することを提唱する。
LSICの大きな課題の1つは、ビジュアル・セマンティック・コンテキストの構造をモデル化し整合させることである。
論文 参考訳(メタデータ) (2020-02-29T16:54:21Z) - Metaphoric Paraphrase Generation [58.592750281138265]
クラウドソーシングを用いてその結果を評価し,メタファー的パラフレーズを評価するための自動指標を開発する。
語彙置換ベースラインは正確なパラフレーズを生成できるが、比喩的でないことが多い。
メタファーマスキングモデルでは,メタファー文の生成に優れ,流布やパラフレーズの品質に関してはほぼ同等に機能する。
論文 参考訳(メタデータ) (2020-02-28T16:30:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。