論文の概要: An Automated Question-Answering Framework Based on Evolution Algorithm
- arxiv url: http://arxiv.org/abs/2201.10797v1
- Date: Wed, 26 Jan 2022 08:13:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-27 13:29:04.734102
- Title: An Automated Question-Answering Framework Based on Evolution Algorithm
- Title(参考訳): 進化的アルゴリズムに基づく自動質問応答フレームワーク
- Authors: Sinan Tan, Hui Xue, Qiyu Ren, Huaping Liu and Jing Bai
- Abstract要約: 複数のデータセットに対してネットワークアーキテクチャを調整可能な自動質問応答フレームワークを提案する。
本フレームワークはSQuAD 1.1では78.9 EM,86.1 F1,SQuAD 2.0では69.9 EM,72.5 F1を実現している。
- 参考スコア(独自算出の注目度): 19.054115603616513
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Building a deep learning model for a Question-Answering (QA) task requires a
lot of human effort, it may need several months to carefully tune various model
architectures and find a best one. It's even harder to find different excellent
models for multiple datasets. Recent works show that the best model structure
is related to the dataset used, and one single model cannot adapt to all tasks.
In this paper, we propose an automated Question-Answering framework, which
could automatically adjust network architecture for multiple datasets. Our
framework is based on an innovative evolution algorithm, which is stable and
suitable for multiple dataset scenario. The evolution algorithm for search
combine prior knowledge into initial population and use a performance estimator
to avoid inefficient mutation by predicting the performance of candidate model
architecture. The prior knowledge used in initial population could improve the
final result of the evolution algorithm. The performance estimator could
quickly filter out models with bad performance in population as the number of
trials increases, to speed up the convergence. Our framework achieves 78.9 EM
and 86.1 F1 on SQuAD 1.1, 69.9 EM and 72.5 F1 on SQuAD 2.0. On NewsQA dataset,
the found model achieves 47.0 EM and 62.9 F1.
- Abstract(参考訳): QA(Deep Learning Model for a Question-Answering)タスクを構築するには、多くの人的努力が必要です。
複数のデータセットで異なる優れたモデルを見つけるのはさらに難しくなります。
最近の研究によると、最高のモデル構造は使用されるデータセットと関連しており、1つのモデルはすべてのタスクに適応できない。
本稿では,複数のデータセットに対してネットワークアーキテクチャを自動的に調整できる自動質問応答フレームワークを提案する。
我々のフレームワークは、安定して複数のデータセットシナリオに適した革新的な進化アルゴリズムに基づいている。
探索のための進化アルゴリズムは、先行知識を初期集団に組み合わせ、性能推定器を用いて、候補モデルアーキテクチャの性能を予測して非効率な突然変異を避ける。
初期個体群で使われる事前知識は進化アルゴリズムの最終結果を改善することができる。
性能推定器は、試行回数が増えるにつれて、人口の悪い性能のモデルを素早くフィルタリングし、収束を早めることができる。
本フレームワークはSQuAD 1.1では78.9 EM,86.1 F1,SQuAD 2.0では69.9 EM,72.5 F1を達成する。
NewsQAデータセットでは、見つかったモデルは47.0 EMと62.9 F1を達成する。
関連論文リスト
- A Pairwise Comparison Relation-assisted Multi-objective Evolutionary Neural Architecture Search Method with Multi-population Mechanism [58.855741970337675]
ニューラルアーキテクチャサーチ(NAS)により、リサーチ者は広大なサーチスペースを自動的に探索し、効率的なニューラルネットワークを見つけることができる。
NASは重要なボトルネックに悩まされており、探索プロセス中に多くのアーキテクチャを評価する必要がある。
SMEM-NASは,多集団構造に基づく多目的進化アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-22T12:46:22Z) - Generative Visual Question Answering [0.0]
本稿では、時間的一般化の成果を得られる高度な視覚質問回答(VQA)モデルを作成するための実行可能なアプローチについて論じる。
我々は,VQAv2およびMS-COCOデータセットの画像とキャプションを利用して,安定拡散による新しい画像を生成する新しいデータセットGenVQAを提案する。
パフォーマンス評価では、オリジナルのVQAv2データセットを反映した質問に焦点が当てられ、回答は新しいイメージに調整されている。
論文 参考訳(メタデータ) (2023-07-18T05:30:23Z) - Chain-of-Skills: A Configurable Model for Open-domain Question Answering [79.8644260578301]
検索モデルは、現実世界の知識集約的なタスクに欠かせない要素である。
最近の研究はカスタマイズされたメソッドに焦点を合わせ、モデルの転送可能性とスケーラビリティを制限している。
本稿では,各モジュールがデータセット間で再利用可能なキースキルに対応するモジュールレトリバーを提案する。
論文 参考訳(メタデータ) (2023-05-04T20:19:39Z) - Accuracy Prediction for NAS Acceleration using Feature Selection and
Extrapolation [1.2183405753834562]
候補となるニューラルネットワークの精度を予測することは、NASベースのソリューションの重要な能力である。
特徴選択により回帰精度を向上する一方で,回帰アルゴリズムの評価も行う。
この研究で使用された拡張データセットとコードはNAAP-440リポジトリで公開されている。
論文 参考訳(メタデータ) (2022-11-22T17:27:14Z) - ZooD: Exploiting Model Zoo for Out-of-Distribution Generalization [65.58562481279023]
PTMのランク付けと特徴選択によるアンサンブルのためのパラダイムであるZooDを提案する。
我々は,多様なアウト・オブ・ディストリビューション(OoD)タスクのための35のモデルからなる多様なモデル動物園において,我々のパラダイムを評価する。
論文 参考訳(メタデータ) (2022-10-17T16:31:57Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - A linearized framework and a new benchmark for model selection for
fine-tuning [112.20527122513668]
異なるドメインで事前訓練されたモデルの集合からの微調整は、低データ体制におけるテストの精度を向上させる技術として現れている。
モデル選択のための2つの新しいベースライン - Label-Gradient と Label-Feature correlation を導入する。
我々のベンチマークでは、微調整されたイメージネットモデルと比較して、モデル動物園での精度向上が強調されている。
論文 参考訳(メタデータ) (2021-01-29T21:57:15Z) - What do we expect from Multiple-choice QA Systems? [70.86513724662302]
複数のMultiple Choice Question Answering(MCQA)データセット上で,トップパフォーマンスモデルを検討する。
このようなモデルから得られる可能性のある一連の期待値に対して、モデル入力のゼロ情報摂動を用いて評価する。
論文 参考訳(メタデータ) (2020-11-20T21:27:10Z) - When in Doubt, Ask: Generating Answerable and Unanswerable Questions,
Unsupervised [0.0]
質問回答(QA)は、人と機械間の堅牢なコミュニケーションを可能にするための鍵である。
現代のQAで使用される言語モデルは、いくつかの重要なタスクにおいて人間のパフォーマンスを上回っている。
本稿では,この問題を克服する手段として,人工データを用いた人為的データセットの強化について検討する。
論文 参考訳(メタデータ) (2020-10-04T15:56:44Z) - NASE: Learning Knowledge Graph Embedding for Link Prediction via Neural
Architecture Search [9.634626241415916]
リンク予測は、知識グラフ(KG)におけるエンティティ間の欠落した接続を予測するタスクである
これまでの研究では、Automated Machine Learning(AutoML)を使用して、データセットに最適なモデルを探していた。
リンク予測タスクのための新しいニューラルネットワーク探索(NAS)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:34:09Z) - Gestalt: a Stacking Ensemble for SQuAD2.0 [0.0]
本稿では,文脈文中の質問に対する正しい回答を見つけ出し,提示する深層学習システムを提案する。
我々のゴールは、各アンサンブルで最高のモデルを上回る異種SQuAD2.0モデルのアンサンブルを学習することである。
論文 参考訳(メタデータ) (2020-04-02T08:09:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。