論文の概要: Concept Extraction Using Pointer-Generator Networks
- arxiv url: http://arxiv.org/abs/2008.11295v1
- Date: Tue, 25 Aug 2020 22:28:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 03:52:54.332660
- Title: Concept Extraction Using Pointer-Generator Networks
- Title(参考訳): ポインタジェネレータネットワークを用いた概念抽出
- Authors: Alexander Shvets and Leo Wanner
- Abstract要約: 本稿では、ポインタジェネレータネットワークの遠隔監視に基づく、汎用的なオープンドメインOOV指向抽出モデルを提案する。
このモデルは250Kのウィキペディアページから特別にコンパイルされた大規模な注釈付きコーパスで訓練されている。
- 参考スコア(独自算出の注目度): 86.75999352383535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concept extraction is crucial for a number of downstream applications.
However, surprisingly enough, straightforward single token/nominal
chunk-concept alignment or dictionary lookup techniques such as DBpedia
Spotlight still prevail. We propose a generic open-domain OOV-oriented
extractive model that is based on distant supervision of a pointer-generator
network leveraging bidirectional LSTMs and a copy mechanism. The model has been
trained on a large annotated corpus compiled specifically for this task from
250K Wikipedia pages, and tested on regular pages, where the pointers to other
pages are considered as ground truth concepts. The outcome of the experiments
shows that our model significantly outperforms standard techniques and, when
used on top of DBpedia Spotlight, further improves its performance. The
experiments furthermore show that the model can be readily ported to other
datasets on which it equally achieves a state-of-the-art performance.
- Abstract(参考訳): 概念抽出は多くの下流アプリケーションにとって不可欠である。
しかし、驚くほど単純なシングルトークン/用語のチャンクコンセプタアライメントや、dbpediaspotlightのような辞書検索技術が普及している。
本稿では,双方向lstmとコピー機構を利用したポインタ生成ネットワークの遠隔監視に基づく,汎用的なoov指向抽出モデルを提案する。
このモデルは250万ページものwikipediaページから特別にコンパイルされた大きな注釈付きコーパスで訓練され、通常のページでテストされた。
実験の結果,本モデルは標準技術よりも優れており,DBpedia Spotlight上で使用すると,さらに性能が向上することがわかった。
さらに実験では、モデルが他のデータセットに容易に移植可能であることを示し、同程度に最先端のパフォーマンスを実現している。
関連論文リスト
- Efficient Document Ranking with Learnable Late Interactions [73.41976017860006]
クロスエンコーダ(CE)とデュアルエンコーダ(DE)モデルは,情報検索におけるクエリドキュメント関連性の2つの基本的なアプローチである。
関連性を予測するため、CEモデルは共同クエリドキュメントの埋め込みを使用し、DEモデルは分解クエリとドキュメントの埋め込みを維持している。
近年、DEM構造と軽量スコアラを用いて、より好ましいレイテンシ品質のトレードオフを実現するために、遅延相互作用モデルが提案されている。
論文 参考訳(メタデータ) (2024-06-25T22:50:48Z) - With a Little Help from your own Past: Prototypical Memory Networks for
Image Captioning [47.96387857237473]
我々は、他のトレーニングサンプルを処理しながら得られたアクティベーションに注意を向けるネットワークを考案した。
私たちのメモリは、プロトタイプベクトルの定義を通じて過去のキーと値の分布をモデル化します。
本研究では,エンコーダ・デコーダ変換器の性能を3.7 CIDErポイント向上できることを示す。
論文 参考訳(メタデータ) (2023-08-23T18:53:00Z) - Open-domain Visual Entity Recognition: Towards Recognizing Millions of
Wikipedia Entities [54.26896306906937]
我々はOVEN-Wikiを提示する。そこでは、テキストクエリに関して、モデルをウィキペディアのエンティティにリンクする必要がある。
私たちは、微調整中に見たことのないWikipediaのエンティティでも、PaLIベースの自動回帰視覚認識モデルが驚くほどうまく機能していることを示します。
PaLIベースのモデルでは全体的なパフォーマンスが向上するが、CLIPベースのモデルはテールエンティティを認識するのに優れている。
論文 参考訳(メタデータ) (2023-02-22T05:31:26Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Embarrassingly Simple Unsupervised Aspect Extraction [4.695687634290403]
本稿では,感情分析におけるアスペクト識別の簡易かつ効果的な方法を提案する。
提案手法は単語埋め込みとPOSタグのみを必要とする。
本稿では,新しいシングルヘッドアテンション機構であるContrastive Attention (CAt)を紹介する。
論文 参考訳(メタデータ) (2020-04-28T15:09:51Z) - A more abstractive summarization model [0.0]
ポインタ生成ネットワークがなぜ新しい単語を生成できないのかを検討する。
次に、アウト・オブ・ボキャブラリ(out-of-vocabulary)ペナルティを追加することで対処します。
また,R-1,R-2,R-Lスコアを用いて,ほとんどの要約モデルを評価した結果,モデルのルージュスコアも報告した。
論文 参考訳(メタデータ) (2020-02-25T15:22:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。