論文の概要: Semi-supervised URL Segmentation with Recurrent Neural Networks
Pre-trained on Knowledge Graph Entities
- arxiv url: http://arxiv.org/abs/2011.03138v1
- Date: Thu, 5 Nov 2020 23:31:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 11:21:22.595167
- Title: Semi-supervised URL Segmentation with Recurrent Neural Networks
Pre-trained on Knowledge Graph Entities
- Title(参考訳): 知識グラフを用いたリカレントニューラルネットワークを用いた半教師付きURLセグメンテーション
- Authors: Hao Zhang and Jae Ro and Richard Sproat
- Abstract要約: 本稿では,文字を入力として使用したリカレントニューラルネットワーク(RNN)に基づくタグ付けモデルの有効性を示す。
学習データ不足を補うため,大規模な知識データベースにおいて,合成エンティティ名の事前学習手法を提案する。
- 参考スコア(独自算出の注目度): 8.855143852360328
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Breaking domain names such as openresearch into component words open and
research is important for applications like Text-to-Speech synthesis and web
search. We link this problem to the classic problem of Chinese word
segmentation and show the effectiveness of a tagging model based on Recurrent
Neural Networks (RNNs) using characters as input. To compensate for the lack of
training data, we propose a pre-training method on concatenated entity names in
a large knowledge database. Pre-training improves the model by 33% and brings
the sequence accuracy to 85%.
- Abstract(参考訳): Openresearchのようなドメイン名をコンポーネント語に分割し、研究することは、テキスト音声合成やWeb検索といったアプリケーションにとって重要である。
この問題を中国語単語分割の古典的な問題にリンクし、文字を入力として使用したリカレントニューラルネットワーク(RNN)に基づくタグ付けモデルの有効性を示す。
トレーニングデータの欠如を補うため,大規模な知識データベースにおけるエンティティ名統合のための事前学習手法を提案する。
事前トレーニングによってモデルが33%改善され、シーケンス精度が85%に向上した。
関連論文リスト
- Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Language Semantics Interpretation with an Interaction-based Recurrent
Neural Networks [0.0]
本稿では,新しいインフルエンススコア (I-score) と,BDA (Backward Dropping Algorithm) と呼ばれるグリージー検索アルゴリズムと,"Dagger Technique" と呼ばれる特徴工学的手法を提案する。
提案手法は,他の人気ピアと比較して81%の誤差削減率で予測性能を向上させるために適用された。
論文 参考訳(メタデータ) (2021-11-02T00:39:21Z) - On Improving Deep Learning Trace Analysis with System Call Arguments [1.3299507495084417]
カーネルトレースは名前と複数の引数からなる低レベルのイベントのシーケンスである。
埋め込みとエンコーディングの両方を用いて、イベント名の表現と引数を学習するための一般的なアプローチを導入する。
論文 参考訳(メタデータ) (2021-03-11T19:26:34Z) - A Novel Deep Learning Method for Textual Sentiment Analysis [3.0711362702464675]
本稿では,階層的注意層を統合した畳み込みニューラルネットワークを提案する。
提案モデルでは,分類精度が高く,情報的単語を抽出できる。
インクリメンタル転送学習を適用すると、分類性能が大幅に向上します。
論文 参考訳(メタデータ) (2021-02-23T12:11:36Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - CMT in TREC-COVID Round 2: Mitigating the Generalization Gaps from Web
to Special Domain Search [89.48123965553098]
本稿では,特殊領域適応問題を緩和する探索システムを提案する。
このシステムは、ドメイン適応型事前学習と数発の学習技術を利用して、ニューラルネットワークがドメインの不一致を軽減するのに役立つ。
本システムでは,TREC-COVID タスクの第2ラウンドにおいて,非マニュアル実行において最善を尽くす。
論文 参考訳(メタデータ) (2020-11-03T09:10:48Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z) - Improving Joint Layer RNN based Keyphrase Extraction by Using
Syntactical Features [0.6724914680904501]
我々は,複数のキーワード列を抽出するために,JRNNの入力層を変更することを提案する。
精度は9597,F1は7691であった。
論文 参考訳(メタデータ) (2020-09-15T14:20:04Z) - Wake Word Detection with Alignment-Free Lattice-Free MMI [66.12175350462263]
音声言語インタフェース、例えばパーソナルデジタルアシスタントは、音声入力の処理を開始するためにウェイクワードに依存している。
本稿では,部分的にラベル付けされたトレーニングデータから,ハイブリッドDNN/HMM覚醒単語検出システムの学習方法を提案する。
提案手法を2つの実データ集合上で評価し, 前報よりも50%~90%の誤報率の減少率を示した。
論文 参考訳(メタデータ) (2020-05-17T19:22:25Z) - TNT-KID: Transformer-based Neural Tagger for Keyword Identification [7.91883337742071]
本稿では,キーワード識別のための Transformer-based Neural Tagger (TNT-KID) というキーワード識別アルゴリズムを提案する。
特定のタスクにトランスフォーマーアーキテクチャを適用し、ドメイン固有のコーパスで事前学習する言語モデルを活用することにより、キーワード抽出に対する教師なしと教師なしの両方のアプローチの欠陥を克服することができる。
論文 参考訳(メタデータ) (2020-03-20T09:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。