論文の概要: RetroGAN: A Cyclic Post-Specialization System for Improving
Out-of-Knowledge and Rare Word Representations
- arxiv url: http://arxiv.org/abs/2108.12941v1
- Date: Mon, 30 Aug 2021 00:34:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 23:19:48.852178
- Title: RetroGAN: A Cyclic Post-Specialization System for Improving
Out-of-Knowledge and Rare Word Representations
- Title(参考訳): レトロガン:知識不足と希少表現を改善する循環後専門化システム
- Authors: Pedro Colon-Hernandez, Yida Xin, Henry Lieberman, Catherine Havasi,
Cynthia Breazeal, and Peter Chin
- Abstract要約: RetroGANは、概念とその再適合した概念を1対1でマッピングすることを学ぶ。
元々の知識ベースにない概念を扱うためのマッピングが適用される。
3つの単語類似性ベンチマークと下流文単純化タスクで本システムをテストする。
- 参考スコア(独自算出の注目度): 9.260444813514948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrofitting is a technique used to move word vectors closer together or
further apart in their space to reflect their relationships in a Knowledge Base
(KB). However, retrofitting only works on concepts that are present in that KB.
RetroGAN uses a pair of Generative Adversarial Networks (GANs) to learn a
one-to-one mapping between concepts and their retrofitted counterparts. It
applies that mapping (post-specializes) to handle concepts that do not appear
in the original KB in a manner similar to how some natural language systems
handle out-of-vocabulary entries. We test our system on three word-similarity
benchmarks and a downstream sentence simplification task and achieve the state
of the art (CARD-660). Altogether, our results demonstrate our system's
effectiveness for out-of-knowledge and rare word generalization.
- Abstract(参考訳): レトロフィッティング(retrofitting)は、知識ベース(kb)におけるそれらの関係を反映するために、単語ベクトルをその空間内でより近く、あるいはさらに離れて移動させるテクニックである。
しかし、レトロフィッティングは、そのkbに存在する概念のみに作用する。
RetroGANは、GAN(Generative Adversarial Networks)のペアを使用して、概念とそれらの再適合した概念の1対1マッピングを学習する。
これは、ある自然言語システムが語彙外エントリを扱う方法と似た方法で、元のKBに現れない概念を扱うためにマッピング (post-specializes) を適用する。
我々は3つの単語類似性ベンチマークと下流文単純化タスクでテストを行い,その状態を達成した(CARD-660)。
以上から,本システムは知識不足や希少な単語の一般化に有効であることを示す。
関連論文リスト
- Efficient Induction of Language Models Via Probabilistic Concept
Formation [13.632454840363916]
コーパスから言語モデルを取得するための新しいアプローチを提案する。
このフレームワークは、確率論的概念の分類学的階層を構築するための初期のシステムであるCobweb上に構築されている。
Cobwebの3つの新しい拡張(Word、Leaf、Pathの亜種)について調べる。
論文 参考訳(メタデータ) (2022-12-22T18:16:58Z) - DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for
Open-world Detection [118.36746273425354]
本稿では,デザインされた概念辞書から知識の豊かさを生かして,オープンワールド検出のための並列視覚概念事前学習手法を提案する。
概念をそれらの記述で豊かにすることにより、オープンドメイン学習を促進するために、さまざまな概念間の関係を明確に構築する。
提案フレームワークは、例えばLVISデータセット上で、強力なゼロショット検出性能を示し、私たちのDetCLIP-TはGLIP-Tを9.9%向上させ、レアカテゴリで13.5%改善した。
論文 参考訳(メタデータ) (2022-09-20T02:01:01Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - Toward a Visual Concept Vocabulary for GAN Latent Space [74.12447538049537]
本稿では,GANの潜在空間で表現される原始視覚概念のオープンエンド語彙を構築するための新しい手法を提案する。
提案手法は, 層選択性に基づく知覚的正当方向の自動識別, 自由形, 構成的自然言語記述による人為的アノテーションの3つの要素から構成される。
実験により、我々のアプローチで学んだ概念は信頼性があり、構成可能であることが示され、クラス、コンテキスト、オブザーバをまたいで一般化される。
論文 参考訳(メタデータ) (2021-10-08T17:58:19Z) - Instant One-Shot Word-Learning for Context-Specific Neural
Sequence-to-Sequence Speech Recognition [62.997667081978825]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識する機構を備えたエンドツーエンドのASRシステムを提案する。
本稿では,この機構により,これまで認識できなかった単語の85%以上を認識できることを示す。
論文 参考訳(メタデータ) (2021-07-05T21:08:34Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - WSRNet: Joint Spotting and Recognition of Handwritten Words [38.212002652391]
提案するネットワークは、非リカレントCTCブランチとSeq2Seqブランチで構成されており、Autoencodingモジュールでさらに拡張されている。
本稿では、これらの表現をさらに2項化して処理する方法と、コンパクトで高効率な記述子を提供するリトレーニングスキームを示す。
論文 参考訳(メタデータ) (2020-08-17T06:22:05Z) - Enhancing Word Embeddings with Knowledge Extracted from Lexical
Resources [3.7814216736076434]
従来の単語埋め込みと特殊化手法を用いて、単語間の意味的関係をよりよく把握する。
提案手法では,BabelNetのようなリッチな語彙資源から外部知識を活用する。
論文 参考訳(メタデータ) (2020-05-20T13:45:49Z) - Common-Knowledge Concept Recognition for SEVA [15.124939896007472]
我々はシステムエンジニアの仮想アシスタント(SEVA)のための共通知識概念認識システムを構築した。
この問題は、名前付きエンティティ抽出と同様のトークン分類タスクとして定式化される。
システム工学の概念を認識するためにシーケンスモデルをトレーニングするためのラベル付けスキームを慎重に定義することにより、単語レベルで注釈付けされたデータセットを構築する。
論文 参考訳(メタデータ) (2020-03-26T00:30:36Z) - Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。
OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。
本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文 参考訳(メタデータ) (2020-03-19T21:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。