論文の概要: TA-DA: Topic-Aware Domain Adaptation for Scientific Keyphrase
Identification and Classification (Student Abstract)
- arxiv url: http://arxiv.org/abs/2301.06902v1
- Date: Fri, 30 Dec 2022 15:07:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-29 14:18:11.900482
- Title: TA-DA: Topic-Aware Domain Adaptation for Scientific Keyphrase
Identification and Classification (Student Abstract)
- Title(参考訳): ta-da: 科学的キーフレーズ識別と分類のためのトピックアウェアドメイン適応(学生抽象)
- Authors: R\u{a}zvan-Alexandru Sm\u{a}du, George-Eduard Zaharia, Andrei-Marius
Avram, Dumitru-Clementin Cercel, Mihai Dascalu, Florin Pop
- Abstract要約: 本稿では,キーフレーズ抽出のためのトピック対応ドメイン適応フレームワークTA-DAを紹介する。
提案手法は,F1スコアの正確な一致で,ベースラインモデルの性能を最大5%向上させる。
- 参考スコア(独自算出の注目度): 0.36944296923226316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Keyphrase identification and classification is a Natural Language Processing
and Information Retrieval task that involves extracting relevant groups of
words from a given text related to the main topic. In this work, we focus on
extracting keyphrases from scientific documents. We introduce TA-DA, a
Topic-Aware Domain Adaptation framework for keyphrase extraction that
integrates Multi-Task Learning with Adversarial Training and Domain Adaptation.
Our approach improves performance over baseline models by up to 5% in the exact
match of the F1-score.
- Abstract(参考訳): キーワードの識別と分類は自然言語処理と情報検索のタスクであり、メイントピックに関連する与えられたテキストから関連する単語のグループを抽出する。
本研究は,科学文書からキーフレーズを抽出することに焦点を当てる。
本稿では,キーワード抽出のためのトピック対応ドメイン適応フレームワークであるTA-DAを紹介した。
提案手法は,F1スコアの正確な一致で,ベースラインモデルの性能を最大5%向上させる。
関連論文リスト
- Cross-lingual Contextualized Phrase Retrieval [63.80154430930898]
そこで本研究では,言語間関係の単語検索を多義的に行うタスクの定式化を提案する。
我々は、コントラスト学習を用いて、言語間コンテクスト対応句検索(CCPR)を訓練する。
フレーズ検索タスクでは、CCPRはベースラインをかなり上回り、少なくとも13ポイント高いトップ1の精度を達成する。
論文 参考訳(メタデータ) (2024-03-25T14:46:51Z) - Cross-domain Chinese Sentence Pattern Parsing [67.1381983012038]
文パターン構造解析(SPS)は、主に言語教育に使用される構文解析法である。
既存のSPSは教科書のコーパスに大きく依存しており、クロスドメイン機能に欠ける。
本稿では,大規模言語モデル(LLM)を自己学習フレームワーク内で活用する革新的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T05:30:48Z) - W2KPE: Keyphrase Extraction with Word-Word Relation [4.759934907814052]
我々は、課題を単一クラスの名前付きエンティティ認識タスクとしてモデル化する。
データ前処理では,単語分割後の分割キーフレーズを符号化する。
我々は、キーフレーズのスパース性に対処するため、損失関数をマルチクラス焦点損失に置き換える。
論文 参考訳(メタデータ) (2023-03-22T15:32:40Z) - PatternRank: Leveraging Pretrained Language Models and Part of Speech
for Unsupervised Keyphrase Extraction [0.6767885381740952]
本稿では,1つの文書から教師なしキーフレーズを抽出するために,事前訓練された言語モデルとパート・オブ・音声を提供するPatternRankを提案する。
実験の結果,PatternRankは従来の最先端手法よりも高精度,リコール,F1スコアを実現していることがわかった。
論文 参考訳(メタデータ) (2022-10-11T08:23:54Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Graph Adaptive Semantic Transfer for Cross-domain Sentiment
Classification [68.06496970320595]
クロスドメイン感情分類(CDSC)は、ソースドメインから学んだ伝達可能なセマンティクスを使用して、ラベルなしのターゲットドメインにおけるレビューの感情を予測することを目的としている。
本稿では、単語列と構文グラフの両方からドメイン不変セマンティクスを学習できる適応型構文グラフ埋め込み法であるグラフ適応意味伝達(GAST)モデルを提案する。
論文 参考訳(メタデータ) (2022-05-18T07:47:01Z) - Improving Multi-task Generalization Ability for Neural Text Matching via
Prompt Learning [54.66399120084227]
最近の最先端のニューラルテキストマッチングモデル(PLM)は、様々なタスクに一般化することが難しい。
我々は、特殊化一般化訓練戦略を採用し、それをMatch-Promptと呼ぶ。
特殊化段階では、異なるマッチングタスクの記述はいくつかのプロンプトトークンにマッピングされる。
一般化段階において、テキストマッチングモデルは、多種多様なマッチングタスクを訓練することにより、本質的なマッチング信号を探索する。
論文 参考訳(メタデータ) (2022-04-06T11:01:08Z) - Learning Rich Representation of Keyphrases from Text [12.698835743464313]
テキスト文書からキーフレーズの表現を豊かに学習することを目的としたタスク固有言語モデルの学習方法を示す。
差別的設定では、新しい事前学習目標である、KBIR(Keyphrase boundary Infilling with Replacement)を導入する。
生成設定では、入力テキストに関連するキーフレーズをCatSeqフォーマットで再現する、BART-KeyBARTの新しい事前学習設定を導入する。
論文 参考訳(メタデータ) (2021-12-16T01:09:51Z) - Phraseformer: Multimodal Key-phrase Extraction using Transformer and
Graph Embedding [3.7110020502717616]
我々は,変換器とグラフ埋め込み技術を用いて,多モーダルなキーフレーズ抽出手法であるPhraseformerを開発した。
Phraseformerでは、各キーワード候補は、テキストと構造学習表現の連結であるベクトルによって提示される。
Inspec、SemEval2010、SemEval 2017の3つのデータセット上でのPhraseformerの性能をF1スコアで解析する。
論文 参考訳(メタデータ) (2021-06-09T09:32:17Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - TNT-KID: Transformer-based Neural Tagger for Keyword Identification [7.91883337742071]
本稿では,キーワード識別のための Transformer-based Neural Tagger (TNT-KID) というキーワード識別アルゴリズムを提案する。
特定のタスクにトランスフォーマーアーキテクチャを適用し、ドメイン固有のコーパスで事前学習する言語モデルを活用することにより、キーワード抽出に対する教師なしと教師なしの両方のアプローチの欠陥を克服することができる。
論文 参考訳(メタデータ) (2020-03-20T09:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。