論文の概要: Template-based Question Answering using Recursive Neural Networks
- arxiv url: http://arxiv.org/abs/2004.13843v3
- Date: Tue, 9 Jun 2020 01:41:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 04:12:22.644010
- Title: Template-based Question Answering using Recursive Neural Networks
- Title(参考訳): 再帰的ニューラルネットワークを用いたテンプレートベース質問応答
- Authors: Ram G Athreya, Srividya Bansal, Axel-Cyrille Ngonga Ngomo, Ricardo
Usbeck
- Abstract要約: 自然言語の質問を自動的に学習し、分類するニューラルネットワークベースのアプローチを提案する。
入力質問はベクトル表現に符号化される。
モデルはLC-QuADデータセットでトレーニングされ、評価される。
- 参考スコア(独自算出の注目度): 1.466257400243079
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a neural network-based approach to automatically learn and
classify natural language questions into its corresponding template using
recursive neural networks. An obvious advantage of using neural networks is the
elimination of the need for laborious feature engineering that can be
cumbersome and error-prone. The input question is encoded into a vector
representation. The model is trained and evaluated on the LC-QuAD dataset
(Large-scale Complex Question Answering Dataset). The LC-QuAD queries are
annotated based on 38 unique templates that the model attempts to classify. The
resulting model is evaluated against both the LC-QuAD dataset and the 7th
Question Answering Over Linked Data (QALD-7) dataset. The recursive neural
network achieves template classification accuracy of 0.828 on the LC-QuAD
dataset and an accuracy of 0.618 on the QALD-7 dataset. When the top-2 most
likely templates were considered the model achieves an accuracy of 0.945 on the
LC-QuAD dataset and 0.786 on the QALD-7 dataset. After slot filling, the
overall system achieves a macro F-score 0.419 on the LC-QuAD dataset and a
macro F-score of 0.417 on the QALD-7 dataset.
- Abstract(参考訳): 本稿では,ニューラルネットワークを用いて自然言語質問を自動的に学習し,そのテンプレートに分類するニューラルネットワークアプローチを提案する。
ニューラルネットワークを使う明らかな利点は、面倒でエラーを起こしやすい、手間のかかる機能エンジニアリングの必要性をなくすことである。
入力質問はベクトル表現に符号化される。
このモデルはLC-QuADデータセット(大規模複雑質問回答データセット)でトレーニングされ評価される。
LC-QuADクエリは、モデルを分類しようとする38のユニークなテンプレートに基づいて注釈付けされている。
得られたモデルはLC-QuADデータセットと第7質問回答リンクデータ(QALD-7)データセットの両方に対して評価される。
再帰的ニューラルネットワークは、LC-QuADデータセットで0.828のテンプレート分類精度、QALD-7データセットで0.618の精度を達成する。
最も可能性の高いテンプレートが検討されると、LC-QuADデータセットでは0.945、QALD-7データセットでは0.786の精度が得られる。
スロットフィリング後、LC-QuADデータセットのマクロFスコア0.419、QALD-7データセットのマクロFスコア0.417を達成する。
関連論文リスト
- TarGEN: Targeted Data Generation with Large Language Models [51.87504111286201]
TarGENは、高品質な合成データセットを生成するための、多段階のプロンプト戦略である。
我々は,LLMが不正確なラベル付きインスタンスを修正できるようにする自己補正法により,TarGENを増強する。
合成データセットを元のデータセットと比較した包括的な分析により、データセットの複雑さと多様性の類似または高いレベルが明らかになる。
論文 参考訳(メタデータ) (2023-10-27T03:32:17Z) - Retrosynthesis Prediction with Local Template Retrieval [112.23386062396622]
特定の標的分子の反応を予測する再合成は、薬物発見に必須の課題である。
本稿では,局所的な反応テンプレート検索手法であるRetroKNNを紹介する。
我々は、広く使われている2つのベンチマーク、USPTO-50KとUSPTO-MITで包括的な実験を行う。
論文 参考訳(メタデータ) (2023-06-07T03:38:03Z) - Learning brain MRI quality control: a multi-factorial generalization
problem [0.0]
本研究の目的は,MRIQCパイプラインの性能評価である。
分析はMRIQCの前処理ステップに焦点を合わせ、パイプラインをそれなしでテストした。
我々は、CATIデータセットのような異種集団のデータで訓練されたモデルが、目に見えないデータの最良のスコアを提供すると結論付けた。
論文 参考訳(メタデータ) (2022-05-31T15:46:44Z) - Neuro-Symbolic Language Modeling with Automaton-augmented Retrieval [129.25914272977542]
RetoMatonはデータストア上に構築された重み付き有限オートマトンである。
LM推論と並行して、このオートマトンを推論時にトラバースすることは、その複雑さを減少させる。
論文 参考訳(メタデータ) (2022-01-28T21:38:56Z) - TNCR: Table Net Detection and Classification Dataset [62.997667081978825]
TNCRデータセットは、スキャンされた文書画像のテーブル検出と5つのクラスに分類される。
我々は、テーブル検出のための最先端のディープラーニングベースの手法を実装し、いくつかの強力なベースラインを構築した。
我々は、テーブルの検出、分類、構造認識に対するより深い学習アプローチを促進するために、TNCRをオープンソースにしました。
論文 参考訳(メタデータ) (2021-06-19T10:48:58Z) - Stacking Neural Network Models for Automatic Short Answer Scoring [0.0]
本稿では,ニューラルネットワークとXGBoostに基づく重ね合わせモデルを用いて文埋め込み機能を持つ分類プロセスを提案する。
ベストモデルではF1スコアの0.821が、同じデータセットで前の作業を上回った。
論文 参考訳(メタデータ) (2020-10-21T16:00:09Z) - Are Labels Always Necessary for Classifier Accuracy Evaluation? [28.110519483540482]
ラベルなしテストデータセットの分類精度を推定することを目的としている。
元の画像から生成されたデータセットからなるメタデータセットを構築する。
各サンプル(データセット)上のモデルの分類精度は、元のデータセットラベルから知られているので、回帰によってそのタスクを解くことができる。
論文 参考訳(メタデータ) (2020-07-06T17:45:39Z) - TACRED Revisited: A Thorough Evaluation of the TACRED Relation
Extraction Task [80.38130122127882]
TACREDはリレーショナル抽出(RE)において最も大きく、最も広く使われているクラウドソースデータセットの1つである
パフォーマンスの天井に到達したのか、改善の余地はあるのか?
ラベルエラーは絶対F1テストエラーの8%を占めており、例の50%以上を可逆化する必要がある。
論文 参考訳(メタデータ) (2020-04-30T15:07:37Z) - Cryptanalytic Extraction of Neural Network Models [56.738871473622865]
遠隔モデルのパラメータを浮動小数点精度まで効率的に盗むことができる差動攻撃を導入する。
我々の攻撃は、ReLUニューラルネットワークが一括線形関数であるという事実に依存している。
220倍の正確さと100倍のクエリを必要とするモデルを抽出する。
論文 参考訳(メタデータ) (2020-03-10T17:57:14Z) - Question Type Classification Methods Comparison [0.0]
本稿では、ロジスティック回帰、畳み込みニューラルネットワーク(CNN)、Long Short-Term Memory Network(LSTM)、Quasi-Recurrent Neural Networks(QRNN)といった問題分類タスクに対する最先端のアプローチの比較研究について述べる。
すべてのモデルは、事前訓練されたGLoVeワードの埋め込みを使用し、人間のラベル付きデータに基づいて訓練される。
最良の精度は5つの畳み込み層と、並列に積み重ねられたさまざまなカーネルサイズを持つCNNモデルを使用して達成され、その後に1つの完全に接続された層が続く。
論文 参考訳(メタデータ) (2020-01-03T00:16:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。