論文の概要: FRAKE: Fusional Real-time Automatic Keyword Extraction
- arxiv url: http://arxiv.org/abs/2104.04830v1
- Date: Sat, 10 Apr 2021 18:30:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:40:51.367598
- Title: FRAKE: Fusional Real-time Automatic Keyword Extraction
- Title(参考訳): FRAKE: 統合リアルタイム自動キーワード抽出
- Authors: Aidin Zehtab-Salmasi, Mohammad-Reza Feizi-Derakhshi, Mohamad-Ali
Balafar
- Abstract要約: キーワード抽出は、テキストの主要な概念を最もよく表す単語やフレーズを識別する。
グラフ中心性特徴とテキスト特徴の2つのモデルを組み合わせたアプローチを採用している。
- 参考スコア(独自算出の注目度): 1.332091725929965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Keyword extraction is called identifying words or phrases that express the
main concepts of texts in best. There is a huge amount of texts that are
created every day and at all times through electronic infrastructure. So, it is
practically impossible for humans to study and manage this volume of documents.
However, the need for efficient and effective access to these documents is
evident in various purposes. Weblogs, News, and technical notes are almost long
texts, while the reader seeks to understand the concepts by topics or keywords
to decide for reading the full text. To this aim, we use a combined approach
that consists of two models of graph centrality features and textural features.
In the following, graph centralities, such as degree, betweenness, eigenvector,
and closeness centrality, have been used to optimally combine them to extract
the best keyword among the candidate keywords extracted by the proposed method.
Also, another approach has been introduced to distinguishing keywords among
candidate phrases and considering them as a separate keyword. To evaluate the
proposed method, seven datasets named, Semeval2010, SemEval2017, Inspec, fao30,
Thesis100, pak2018 and WikiNews have been used, and results reported Precision,
Recall, and F- measure.
- Abstract(参考訳): キーワード抽出は、テキストの主要な概念を最もよく表す単語やフレーズを識別する。
毎日、そしていつでも、電子インフラを通じて、大量のテキストが作成されています。
したがって、人間がこの大量の文書を研究し管理することは事実上不可能である。
しかし、これらの文書への効率的かつ効果的なアクセスの必要性は、様々な目的において明らかである。
Weblogs、News、およびTechnical Notesはほぼ長いテキストであり、読者は全文を読むためのトピックやキーワードによる概念を理解しようとしている。
この目的のために、グラフ中心性特徴とテクスチャ特徴の2つのモデルからなる組み合わせアプローチを用いる。
提案手法により抽出された候補キーワードの中から最適なキーワードを抽出するために,次に掲げるグラフ中心性(度数,差分,固有ベクトル,近接度中心性)を用いて最適に組み合わせた。
また、キーワードを候補句と区別し、別のキーワードとして考えるアプローチも導入されている。
提案手法を評価するために,semeval2010,semeval2017,inspec,fao30,thesis100,pak2018,wikinewsの7つのデータセットが用いられ,精度,リコール,f-測度が報告されている。
関連論文リスト
- ROUGE-K: Do Your Summaries Have Keywords? [11.393728547335217]
要約における内容関連単語は,効率的な情報伝達において重要な役割を担っている。
極端な要約モデルの既存の評価指標は、要約のキーワードに明確な注意を払わない。
変換器モデルに単語の重要度を組み込むための4つの手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:54:56Z) - Unsupervised extraction of local and global keywords from a single text [0.0]
テキストからキーワードを抽出する非教師付きコーパス非依存手法を提案する。
それは、単語の空間分布と、単語のランダムな置換に対するこの分布の応答に基づいている。
論文 参考訳(メタデータ) (2023-07-26T07:36:25Z) - Efficient Image-Text Retrieval via Keyword-Guided Pre-Screening [53.1711708318581]
現在の画像テキスト検索法は、N$関連時間複雑さに悩まされている。
本稿では,画像テキスト検索のための簡易かつ効果的なキーワード誘導事前スクリーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-14T09:36:42Z) - DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for
Open-world Detection [118.36746273425354]
本稿では,デザインされた概念辞書から知識の豊かさを生かして,オープンワールド検出のための並列視覚概念事前学習手法を提案する。
概念をそれらの記述で豊かにすることにより、オープンドメイン学習を促進するために、さまざまな概念間の関係を明確に構築する。
提案フレームワークは、例えばLVISデータセット上で、強力なゼロショット検出性能を示し、私たちのDetCLIP-TはGLIP-Tを9.9%向上させ、レアカテゴリで13.5%改善した。
論文 参考訳(メタデータ) (2022-09-20T02:01:01Z) - TRIE++: Towards End-to-End Information Extraction from Visually Rich
Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。
テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。
フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文 参考訳(メタデータ) (2022-07-14T08:52:07Z) - LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.84086818702328]
テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文 参考訳(メタデータ) (2022-03-29T08:44:57Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Phraseformer: Multimodal Key-phrase Extraction using Transformer and
Graph Embedding [3.7110020502717616]
我々は,変換器とグラフ埋め込み技術を用いて,多モーダルなキーフレーズ抽出手法であるPhraseformerを開発した。
Phraseformerでは、各キーワード候補は、テキストと構造学習表現の連結であるベクトルによって提示される。
Inspec、SemEval2010、SemEval 2017の3つのデータセット上でのPhraseformerの性能をF1スコアで解析する。
論文 参考訳(メタデータ) (2021-06-09T09:32:17Z) - A Joint Learning Approach based on Self-Distillation for Keyphrase
Extraction from Scientific Documents [29.479331909227998]
キーフレーズ抽出(英: Keyphrase extract)は、文書を最もよく記述するフレーズの小さなセットを抽出するタスクである。
タスクの既存のベンチマークデータセットは、通常、注釈付きドキュメントの数に制限がある。
本稿では, 自己蒸留の考え方に基づく, シンプルで効率的な共同学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-22T18:36:31Z) - Keywords lie far from the mean of all words in local vector space [5.040463208115642]
本研究では,文書の単語の主分布を局所的な単語ベクトル表現を用いてモデル化することにより,テキスト文書からキーワードを検出する異なる経路に従う。
我々は,強いベースラインと最先端の教師なしキーワード抽出手法と比較して,提案手法の高性能性を確認した。
論文 参考訳(メタデータ) (2020-08-21T14:42:33Z) - TRIE: End-to-End Text Reading and Information Extraction for Document
Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。
テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。
提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-27T01:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。