論文の概要: From Statistical Methods to Deep Learning, Automatic Keyphrase
Prediction: A Survey
- arxiv url: http://arxiv.org/abs/2305.02579v1
- Date: Thu, 4 May 2023 06:22:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 16:48:36.610605
- Title: From Statistical Methods to Deep Learning, Automatic Keyphrase
Prediction: A Survey
- Title(参考訳): 統計的手法から深層学習へ -自動キーワード予測-
- Authors: Binbin Xie, Jia Song, Liangying Shao, Suhang Wu, Xiangpeng Wei,
Baosong Yang, Huan Lin, Jun Xie and Jinsong Su
- Abstract要約: キーワード予測は、与えられた文書を高度に要約したフレーズ(キーワード)を生成することを目的としている。
近年,様々な観点から詳細な研究が行われている。
我々の研究は、これまでの167件の作業を分析し、このタスクを以前の調査よりより広範囲にカバーしています。
- 参考スコア(独自算出の注目度): 44.83902003341381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Keyphrase prediction aims to generate phrases (keyphrases) that highly
summarizes a given document. Recently, researchers have conducted in-depth
studies on this task from various perspectives. In this paper, we
comprehensively summarize representative studies from the perspectives of
dominant models, datasets and evaluation metrics. Our work analyzes up to 167
previous works, achieving greater coverage of this task than previous surveys.
Particularly, we focus highly on deep learning-based keyphrase prediction,
which attracts increasing attention of this task in recent years. Afterwards,
we conduct several groups of experiments to carefully compare representative
models. To the best of our knowledge, our work is the first attempt to compare
these models using the identical commonly-used datasets and evaluation metric,
facilitating in-depth analyses of their disadvantages and advantages. Finally,
we discuss the possible research directions of this task in the future.
- Abstract(参考訳): keyphraseの予測は、指定されたドキュメントを高度に要約するフレーズ(keyphrases)を生成することを目的としている。
近年、研究者は様々な観点からこの課題を詳細に研究している。
本稿では,支配的モデル,データセット,評価指標の観点から,代表的研究を包括的に要約する。
我々の研究は、これまでの167件の作業を分析し、このタスクを以前の調査よりはるかに網羅している。
特に,近年,この課題に注目が集まる深層学習に基づくキーフレーズ予測に注目する。
その後、いくつかの実験グループで代表モデルを慎重に比較する。
私たちの知る限りでは、私たちの研究は、同じよく使われるデータセットと評価メトリクスを使ってこれらのモデルを比較する最初の試みです。
最後に,本課題の今後の研究方向性について論じる。
関連論文リスト
- Aggregation Artifacts in Subjective Tasks Collapse Large Language Models' Posteriors [74.04775677110179]
In-context Learning (ICL) は、Large Language Models (LLM) を用いた自然言語処理の主要な手法となっている。
本研究は,低アグリゲーション,異質なアノテーションを組み合わせたアグリゲーションの結果が,プロンプトに有害なノイズを生じさせるアノテーションのアーティファクトに繋がるかどうかを考察する。
この結果から,アグリゲーションは主観的タスクのモデル化において不明瞭な要因であり,代わりに個人をモデリングすることを重視することが示唆された。
論文 参考訳(メタデータ) (2024-10-17T17:16:00Z) - Toward Unified Practices in Trajectory Prediction Research on Drone Datasets [3.1406146587437904]
高品質なデータセットの可用性は、自動運転車の行動予測アルゴリズムの開発に不可欠である。
本稿では,動き予測研究における特定のデータセットの利用の標準化の必要性を強調した。
これを実現するためのツールとプラクティスのセットを提案します。
論文 参考訳(メタデータ) (2024-05-01T16:17:39Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - Evaluation of Faithfulness Using the Longest Supported Subsequence [52.27522262537075]
本稿では,文脈によって支持される請求項の最長不連続性を計算し,機械生成テキストの忠実さを評価する新しい手法を提案する。
新しい人間アノテーション付きデータセットを使用して、モデルを微調整してLongest Supported Subsequence(LSS)を生成する。
提案手法は,我々のデータセットの忠実度に対する最先端のメトリクスよりも18%向上していることを示す。
論文 参考訳(メタデータ) (2023-08-23T14:18:44Z) - Robust Visual Question Answering: Datasets, Methods, and Future
Challenges [23.59923999144776]
視覚的な質問応答には、画像と自然言語の質問に与えられた正確な自然言語の回答を提供するシステムが必要である。
従来の一般的なVQA手法は、答えを予測する前に画像のグラウンド化など適切な振る舞いを学ぶのではなく、トレーニングデータに存在するバイアスを記憶する傾向がある。
VQAのロバスト性を評価するために,様々なデータセットとデバイアス法が提案されている。
論文 参考訳(メタデータ) (2023-07-21T10:12:09Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - Quantitative Argument Summarization and Beyond: Cross-Domain Key Point
Analysis [17.875273745811775]
完全自動解析が可能なキーポイントの自動抽出法を開発した。
キーポイント解析の適用性は議論データを超えていることを実証する。
さらなる貢献は、引数対キーポイントマッチングモデルの詳細な評価である。
論文 参考訳(メタデータ) (2020-10-11T23:01:51Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。