論文の概要: Adaptive Convolution for Semantic Role Labeling
- arxiv url: http://arxiv.org/abs/2012.13939v1
- Date: Sun, 27 Dec 2020 13:26:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-24 21:46:35.282094
- Title: Adaptive Convolution for Semantic Role Labeling
- Title(参考訳): 意味的役割ラベリングのための適応畳み込み
- Authors: Kashif Munir, Hai Zhao, Zuchao Li
- Abstract要約: セマンティックロールラベリング(SRL)は、述語-引数構造を形成することによって、文の意味を解明することを目的とする。
近年の研究では、構文の効果的な利用はSRLの性能を向上させることが示されている。
本研究は既存の畳み込みネットワークに強い柔軟性をもたらす適応畳み込みを用いた構文を効果的にエンコードする。
CoNLL-2009データセットの実験は、提案されたモデルが英語と中国語の両方の以前のSRLシステムを大幅に上回ることを確認した。
- 参考スコア(独自算出の注目度): 48.69930912510414
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Semantic role labeling (SRL) aims at elaborating the meaning of a sentence by
forming a predicate-argument structure. Recent researches depicted that the
effective use of syntax can improve SRL performance. However, syntax is a
complicated linguistic clue and is hard to be effectively applied in a
downstream task like SRL. This work effectively encodes syntax using adaptive
convolution which endows strong flexibility to existing convolutional networks.
The existing CNNs may help in encoding a complicated structure like syntax for
SRL, but it still has shortcomings. Contrary to traditional convolutional
networks that use same filters for different inputs, adaptive convolution uses
adaptively generated filters conditioned on syntactically informed inputs. We
achieve this with the integration of a filter generation network which
generates the input specific filters. This helps the model to focus on
important syntactic features present inside the input, thus enlarging the gap
between syntax-aware and syntax-agnostic SRL systems. We further study a
hashing technique to compress the size of the filter generation network for SRL
in terms of trainable parameters. Experiments on CoNLL-2009 dataset confirm
that the proposed model substantially outperforms most previous SRL systems for
both English and Chinese languages
- Abstract(参考訳): 意味的役割ラベリング(SRL)は、述語句構造を形成することによって文の意味を解明することを目的としている。
近年の研究では、構文の効果的な利用はSRLの性能を向上させることが示されている。
しかし、構文は複雑な言語的手がかりであり、SRLのような下流タスクに効果的に適用することは困難である。
本研究は既存の畳み込みネットワークに強い柔軟性をもたらす適応畳み込みを用いた構文を効果的にエンコードする。
既存のCNNはSRLの構文のような複雑な構造を符号化するのに役立ちますが、まだ欠点があります。
異なる入力に同じフィルタを使用する従来の畳み込みネットワークとは対照的に、適応畳み込みは、構文的に入力に条件付けられた適応的に生成されたフィルタを使用する。
我々は,入力特定フィルタを生成するフィルタ生成ネットワークの統合により,これを実現する。
これにより、モデルが入力内に存在する重要な構文的特徴に集中し、構文認識と構文認識のSRLシステム間のギャップを拡大する。
さらに、トレーニング可能なパラメータの観点から、SRLのフィルタ生成ネットワークのサイズを圧縮するハッシュ手法について検討する。
CoNLL-2009データセットの実験により、提案されたモデルは、英語と中国語の両方の以前のSRLシステムよりも大幅に優れていることを確認した。
関連論文リスト
- R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [83.77114091471822]
Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。
SFLの課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータが相手のジャミングに感受性を持つことである。
これは、言語理解に不可欠である大規模言語モデル(LLM)における単語埋め込みパラメータに対して特に顕著である。
無線ネットワーク上でのLLM(R-SFLLM)を用いたレジリエンスSFLのための物理層フレームワークを開発した。
論文 参考訳(メタデータ) (2024-07-16T12:21:29Z) - VQ-T: RNN Transducers using Vector-Quantized Prediction Network States [52.48566999668521]
本稿では,RNNトランスデューサの予測ネットワークにおけるベクトル量子化長短期記憶単位を提案する。
ASRネットワークと協調して離散表現を訓練することにより、格子生成のために仮説を積極的にマージすることができる。
提案するVQ RNNトランスデューサは,通常の予測ネットワークを持つトランスデューサよりもASR性能が向上することを示す。
論文 参考訳(メタデータ) (2022-08-03T02:45:52Z) - Transition-based Semantic Role Labeling with Pointer Networks [0.40611352512781856]
本稿では,1つの左から右へのパスで入力文を完全に処理できる,トランジッションベースのSRLアプローチを提案する。
Pointer Networksをベースとした実装のおかげで、完全なSRLは$O(n2)$で正確かつ効率的に実行できる。
論文 参考訳(メタデータ) (2022-05-20T08:38:44Z) - Contrastive String Representation Learning using Synthetic Data [0.0]
文字列表現学習(SRL)の目的は、文字列を符号化する密度と低次元のベクトルを学習することである。
合成データのみを用いてSRLモデルを学習するための新しい手法を提案する。
文字列類似性マッチングのタスクにおける学習された表現を評価することによって,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-10-08T16:06:54Z) - Confusion-based rank similarity filters for computationally-efficient
machine learning on high dimensional data [0.0]
我々は、ランク類似度フィルタ(RSF)と呼ばれる、計算効率の良い新しいタイプの人工知能ニューラルネットワーク(ANN)を導入する。
RSFは、多くのデータポイントと次元を持つ非線形分離可能なデータセットを変換し、分類するために使用することができる。
RST、RCC、RSPCのオープンソースコードは、人気のあるScikit-learnフレームワークを使用してPythonで書かれており、簡単にアクセスできる。
論文 参考訳(メタデータ) (2021-09-28T10:53:38Z) - Physics-Based Deep Learning for Fiber-Optic Communication Systems [10.630021520220653]
非線形シュリンガー方程式(NLSE)により制御される光ファイバー通信システムのための新しい機械学習手法を提案する。
本研究の主目的は,NLSEの数値解法として一般的なスプリットステップ法(SSM)が,深い多層ニューラルネットワークと同じ機能を有することである。
我々は、SSMをパラメータ化し、ニューラルネットワークの重み行列と同様、線形ステップを一般線形関数として見ることにより、この接続を利用する。
論文 参考訳(メタデータ) (2020-10-27T12:55:23Z) - Off-Policy Self-Critical Training for Transformer in Visual Paragraph
Generation [20.755764654229047]
Transformerは現在、言語生成における最先端のSeq-to-seqモデルである。
本稿では,GRUに代表される行動ポリシーがサンプリングを行う,非政治的RL学習アルゴリズムを提案する。
提案アルゴリズムは,視覚的段落生成における最先端性能を実現し,画像キャプションの結果を改善した。
論文 参考訳(メタデータ) (2020-06-21T05:10:17Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z) - Improve Variational Autoencoder for Text Generationwith Discrete Latent
Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。
VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。
よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-22T14:41:37Z) - Depth-Adaptive Graph Recurrent Network for Text Classification [71.20237659479703]
S-LSTM(Sentence-State LSTM)は、高効率なグラフリカレントネットワークである。
そこで本研究では,S-LSTMの深度適応機構を提案する。
論文 参考訳(メタデータ) (2020-02-29T03:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。