論文の概要: EUREKA: EUphemism Recognition Enhanced through Knn-based methods and
Augmentation
- arxiv url: http://arxiv.org/abs/2210.12846v1
- Date: Sun, 23 Oct 2022 20:35:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 16:34:15.839737
- Title: EUREKA: EUphemism Recognition Enhanced through Knn-based methods and
Augmentation
- Title(参考訳): EUREKA:Knnに基づく手法と拡張によるEUフェミズム認識の強化
- Authors: Sedrick Scott Keh, Rohit K. Bharadwaj, Emmy Liu, Simone Tedeschi,
Varun Gangal and Roberto Navigli
- Abstract要約: 本稿では,EUREKAというアンサンブルに基づく自動エフェミズム検出手法を紹介する。
データセット内の潜在的に不正な行を特定し、修正する。
我々は,PETのモデル表現を活用し,意味論的クローズドな文を用いて分類を補助する。
- 参考スコア(独自算出の注目度): 35.71585491294843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce EUREKA, an ensemble-based approach for performing automatic
euphemism detection. We (1) identify and correct potentially mislabelled rows
in the dataset, (2) curate an expanded corpus called EuphAug, (3) leverage
model representations of Potentially Euphemistic Terms (PETs), and (4) explore
using representations of semantically close sentences to aid in classification.
Using our augmented dataset and kNN-based methods, EUREKA was able to achieve
state-of-the-art results on the public leaderboard of the Euphemism Detection
Shared Task, ranking first with a macro F1 score of 0.881. Our code is
available at https://github.com/sedrickkeh/EUREKA.
- Abstract(参考訳): 本稿では,EUREKAというアンサンブルに基づく自動エウヘミズム検出手法を紹介する。
本研究は,(1)データセット中の潜在的に誤りのある行を特定し,訂正すること,(2)EuphAugと呼ばれる拡張コーパスをキュレートすること,(3)PETのモデル表現を活用すること,(4)セマンティッククローズド文の表現を用いて分類を支援すること,である。
当社のデータセットとkNNベースの手法を使用して、EUREKAは、Euphemism Detection Shared Taskの公開リーダボード上で最先端の結果を達成し、マクロF1スコア0.881でランク付けしました。
私たちのコードはhttps://github.com/sedrickkeh/EUREKAで公開されています。
関連論文リスト
- LEAF: Unveiling Two Sides of the Same Coin in Semi-supervised Facial Expression Recognition [56.22672276092373]
半教師付き学習は、表情認識におけるラベル不足の課題に取り組むための有望なアプローチとして現れてきた。
半教師付きFERのための表現関連表現と擬似ラベルを協調する統合フレームワークであるhierarchicaL dEcoupling And Fusing (LEAF)を提案する。
論文 参考訳(メタデータ) (2024-04-23T13:43:33Z) - EPIC-KITCHENS-100 Unsupervised Domain Adaptation Challenge: Mixed
Sequences Prediction [16.92053939360415]
本報告では,EPIC-Kitchens-100 Unsupervised Domain Adaptation (UDA) Challenge in Action Recognitionの技術的詳細について述べる。
我々のアプローチは、アクションが実行される順序がソースドメインとターゲットドメインに類似しているという考え方に基づいている。
我々は、ソースドメインとターゲットドメインからのアクションをランダムに組み合わせて修正シーケンスを生成する。
論文 参考訳(メタデータ) (2023-07-24T14:35:46Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - InfoCSE: Information-aggregated Contrastive Learning of Sentence
Embeddings [61.77760317554826]
本稿では,教師なし文の埋め込みを学習するための情報型コントラスト学習フレームワーク InfoCSE を提案する。
提案したInfoCSEを,セマンティックテキスト類似性(STS)タスクを用いて,いくつかのベンチマークデータセット上で評価する。
実験の結果, InfoCSE は BERT ベースでは2.60%, BERT 大規模では1.77% でSimCSE より優れていた。
論文 参考訳(メタデータ) (2022-10-08T15:53:19Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Exploiting Global Contextual Information for Document-level Named Entity
Recognition [46.99922251839363]
我々は、GCDoc(Global Context enhanced Document-level NER)と呼ばれるモデルを提案する。
単語レベルでは、文書グラフは単語間のより広範な依存関係をモデル化するために構築される。
文レベルでは、単一文を超えてより広い文脈を適切にモデル化するために、横断文モジュールを用いる。
我々のモデルは、CoNLL 2003データセットで92.22(BERTで93.40)、Ontonotes 5.0データセットで88.32(BERTで90.49)のスコアに達した。
論文 参考訳(メタデータ) (2021-06-02T01:52:07Z) - Extending Neural Keyword Extraction with TF-IDF tagset matching [4.014524824655106]
キーワード抽出は、与えられた文書を最もよく記述し、同様のトピックの記事をリンクするニュースポータルで機能する単語を識別するタスクである。
本研究では, ヨーロッパのニュースメディア産業において, 表現の少ない, 形態的に豊かな言語を対象とする4つの新しいデータセットの手法を開発し, 評価する。
論文 参考訳(メタデータ) (2021-01-31T15:39:17Z) - Detecting Hostile Posts using Relational Graph Convolutional Network [1.8734449181723827]
この研究は、ソーシャルメディアプラットフォーム上でヒンディー語で敵対的な投稿を検出するためにAAAI@2021が実施したコンテストへの提出に基づいている。
ここでは,畳み込みネットワークを用いた敵対的ポスト分類のためのモデルを提案する。
提案されたモデルは、与えられたデータセット上のGoogleのXLM-RoBERTaと同等に実行されている。
XLMRobertaを用いた分類システムでは, 細粒度分類では2位であった。
論文 参考訳(メタデータ) (2021-01-10T06:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。