論文の概要: Cross-Domain Keyword Extraction with Keyness Patterns
- arxiv url: http://arxiv.org/abs/2409.18724v1
- Date: Fri, 27 Sep 2024 13:19:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-01 15:09:41.734739
- Title: Cross-Domain Keyword Extraction with Keyness Patterns
- Title(参考訳): キーワードパターンを用いたクロスドメインキーワード抽出
- Authors: Dongmei Zhou, Xuri Tang,
- Abstract要約: ドメイン依存とアノテーションの主観性は、教師付きキーワード抽出の課題を提起する。
本稿では,キーワード抽出における教師付きランキング手法を提案し,キーワードをキーネスパターンでランク付けする。
このアプローチでは、2つの畳み込みニューラルネットワークベースのモデルを使用して、キーワードデータセットからキーネスパターンを学習する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Domain dependence and annotation subjectivity pose challenges for supervised keyword extraction. Based on the premises that second-order keyness patterns are existent at the community level and learnable from annotated keyword extraction datasets, this paper proposes a supervised ranking approach to keyword extraction that ranks keywords with keyness patterns consisting of independent features (such as sublanguage domain and term length) and three categories of dependent features -- heuristic features, specificity features, and representavity features. The approach uses two convolutional-neural-network based models to learn keyness patterns from keyword datasets and overcomes annotation subjectivity by training the two models with bootstrap sampling strategy. Experiments demonstrate that the approach not only achieves state-of-the-art performance on ten keyword datasets in general supervised keyword extraction with an average top-10-F-measure of 0.316 , but also robust cross-domain performance with an average top-10-F-measure of 0.346 on four datasets that are excluded in the training process. Such cross-domain robustness is attributed to the fact that community-level keyness patterns are limited in number and temperately independent of language domains, the distinction between independent features and dependent features, and the sampling training strategy that balances excess risk and lack of negative training data.
- Abstract(参考訳): ドメイン依存とアノテーションの主観性は、教師付きキーワード抽出の課題を提起する。
本稿では,コミュニティレベルでの2次キーネスパターンの存在を前提として,注釈付きキーワード抽出データセットから学習可能なキーワード抽出手法を提案する。
このアプローチでは、2つの畳み込みニューラルネットワークベースのモデルを使用して、キーワードデータセットからキーネスパターンを学習し、ブートストラップサンプリング戦略を用いて2つのモデルをトレーニングすることで、アノテーションの主観性を克服する。
実験により,提案手法は,平均トップ10-F尺度0.316の一般教師付きキーワード抽出における10のキーワードデータセットに対して,最先端のパフォーマンスを達成するだけでなく,トレーニングプロセスで除外された4つのデータセットに対して平均トップ10-F尺度0.346の堅牢なクロスドメイン性能を実現することを示した。
このようなドメイン間のロバスト性は、コミュニティレベルのキーネスパターンが言語ドメインに限定され、時間的に独立しているという事実、独立した特徴と依存する特徴の区別、過剰なリスクと負のトレーニングデータの欠如のバランスをとるサンプリングトレーニング戦略に起因する。
関連論文リスト
- An efficient domain-independent approach for supervised keyphrase extraction and ranking [0.03626013617212666]
単一文書からキーフレーズを自動抽出するための教師付き学習手法を提案する。
我々の解は、候補句の統計的特徴と位置的特徴を簡易に計算する。
評価の結果,提案手法はいくつかの最先端ベースラインモデルよりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2024-03-24T08:33:27Z) - KOPPA: Improving Prompt-based Continual Learning with Key-Query Orthogonal Projection and Prototype-based One-Versus-All [24.50129285997307]
本稿では,新しいキークエリ学習戦略を導入し,マッチング効率を向上し,機能変更の課題に対処する。
提案手法は,現在の最先端手法を最大20%の差で超えた結果を達成するためのモデルである。
論文 参考訳(メタデータ) (2023-11-26T20:35:19Z) - Unsupervised 3D registration through optimization-guided cyclical
self-training [71.75057371518093]
最先端のディープラーニングベースの登録方法は、3つの異なる学習戦略を採用している。
本稿では,教師なし登録のための自己指導型学習パラダイムを提案する。
腹部, 肺の登録方法の評価を行い, 測定基準に基づく監督を一貫して上回り, 最先端の競争相手よりも優れていた。
論文 参考訳(メタデータ) (2023-06-29T14:54:10Z) - DORIC : Domain Robust Fine-Tuning for Open Intent Clustering through
Dependency Parsing [14.709084509818474]
DSTC11-Track2は、ゼロショット、クロスドメイン、インテントセットインジェクションのためのベンチマークを提供することを目的としている。
複数ドメインの対話データセットを利用して言語モデルを微調整し,Verb-Objectペアの抽出を提案する。
提案手法は精度スコアにおいて3位となり,ベースラインモデルよりも精度が向上し,相互情報(NMI)スコアが正常化した。
論文 参考訳(メタデータ) (2023-03-17T08:12:36Z) - Learning Decoupling Features Through Orthogonality Regularization [55.79910376189138]
音声認識におけるキースポッティング(KWS)と話者検証(SV)は2つの重要なタスクである。
我々は,同じネットワーク構造を持つ2分岐のディープネットワーク(KWSブランチとSVブランチ)を開発する。
KWS と SV のパフォーマンスを同時に向上させるために,新しいデカップリング特徴学習法を提案する。
論文 参考訳(メタデータ) (2022-03-31T03:18:13Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Multimodal Clustering Networks for Self-supervised Learning from
Unlabeled Videos [69.61522804742427]
本稿では,共通のマルチモーダル埋め込み空間を学習する自己監督型トレーニングフレームワークを提案する。
インスタンスレベルのコントラスト学習の概念をマルチモーダルクラスタリングステップで拡張し,モダリティ間の意味的類似性を捉える。
結果として得られる埋め込みスペースは、見えないデータセットや異なるドメインからでも、すべてのモダリティにわたるサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2021-04-26T15:55:01Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z) - Contradictory Structure Learning for Semi-supervised Domain Adaptation [67.89665267469053]
現在の逆順応法は、クロスドメインの特徴を整列させようとする。
1)条件分布ミスマッチ、2)決定境界のソース領域へのバイアス。
本稿では,対向構造の学習を統一することで,半教師付きドメイン適応のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-06T22:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。