論文の概要: Accelerating Real-Time Question Answering via Question Generation
- arxiv url: http://arxiv.org/abs/2009.05167v2
- Date: Wed, 1 Sep 2021 23:01:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 03:26:57.920424
- Title: Accelerating Real-Time Question Answering via Question Generation
- Title(参考訳): 質問生成によるリアルタイム質問応答の高速化
- Authors: Yuwei Fang, Shuohang Wang, Zhe Gan, Siqi Sun, Jingjing Liu, Chenguang
Zhu
- Abstract要約: Ocean-Qは新しい質問生成(QG)モデルを導入し、大量のQAペアをオフラインで生成する。
入力された質問を候補QAプールとリアルタイムにマッチングし、質問エンコーディングなしで回答を予測する。
Ocean-Qは、既存の分散データベースシステムや検索エンジンに簡単にデプロイでき、大規模クエリを使用することができる。
- 参考スコア(独自算出の注目度): 98.43852668033595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although deep neural networks have achieved tremendous success for question
answering (QA), they are still suffering from heavy computational and energy
cost for real product deployment. Further, existing QA systems are bottlenecked
by the encoding time of real-time questions with neural networks, thus
suffering from detectable latency in deployment for large-volume traffic. To
reduce the computational cost and accelerate real-time question answering
(RTQA) for practical usage, we propose to remove all the neural networks from
online QA systems, and present Ocean-Q (an Ocean of Questions), which
introduces a new question generation (QG) model to generate a large pool of QA
pairs offline, then in real time matches an input question with the candidate
QA pool to predict the answer without question encoding. Ocean-Q can be readily
deployed in existing distributed database systems or search engine for
large-scale query usage, and much greener with no additional cost for
maintaining large neural networks. Experiments on SQuAD(-open) and HotpotQA
benchmarks demonstrate that Ocean-Q is able to accelerate the fastest
state-of-the-art RTQA system by 4X times, with only a 3+% accuracy drop.
- Abstract(参考訳): 深いニューラルネットワークは質問応答(QA)で大きな成功を収めていますが、実際の製品展開には計算量とエネルギーコストがかかります。
さらに、既存のQAシステムは、ニューラルネットワークによるリアルタイム質問のエンコーディング時間によってボトルネックになり、大規模なトラフィックに対するデプロイメントの遅延の検出に悩まされる。
計算コストの削減と実運用におけるリアルタイム質問応答(RTQA)の高速化を目的として,オンラインQAシステムからすべてのニューラルネットワークを取り除き,QAペアの大規模なプールを生成する新たな質問生成(QG)モデルを導入したOcean-Q(Acean of Questions)モデルを提案する。
ocean-qは、大規模クエリ使用のための既存の分散データベースシステムや検索エンジンに容易にデプロイでき、大規模なニューラルネットワークを維持するための追加コストなしで、はるかにグリーンにできる。
SQuAD(-open)とHotpotQAベンチマークの実験により、Ocean-Qは最先端のRTQAシステムを4倍の速度で高速化でき、精度はわずか3%低下した。
関連論文リスト
- Adaptive User-Centric Entanglement Routing in Quantum Data Networks [5.421492821020181]
分散量子コンピューティング(DQC)は、量子データネットワーク(QDN)を介して複数の小さな量子コンピュータ(QC)を相互接続することで、量子コンピューティングの可能性を活用するという大きな可能性を秘めている。
QDN内の量子テレポーテーションのための2つのQC間の長距離量子絡み合わせを確立することは重要な側面であり、絡み合わせルーティングを伴う。
既存のアプローチは主に、現在の絡み合い接続(EC)要求に対する絡み合い性能の最適化に重点を置いている。
本稿では,ユーザの予算制約に固執しながら,絡み合いの成功率を最大化するために,長期にわたるユーザ中心の絡み合いルーティング問題を提案する。
論文 参考訳(メタデータ) (2024-04-13T17:20:00Z) - Matching Game for Optimized Association in Quantum Communication
Networks [65.16483325184237]
本稿では,量子スイッチのためのスワップスタブルな要求-QSアソシエーションアルゴリズムを提案する。
サービスされた要求の割合で、ほぼ最適(5%)のパフォーマンスを達成する。
QCNのサイズが大きくなると、スケーラビリティが向上し、ほぼ最適性能を維持することが示されている。
論文 参考訳(メタデータ) (2023-05-22T03:39:18Z) - ResQNets: A Residual Approach for Mitigating Barren Plateaus in Quantum
Neural Networks [0.0]
量子ニューラルネットワーク(QNN)におけるバレンプラトー問題は、QNNの実践的な成功を妨げる重要な課題である。
本稿では、この問題に対処するための解として、残留量子ニューラルネットワーク(ResQNet)を導入する。
論文 参考訳(メタデータ) (2023-05-05T13:33:43Z) - QVIP: An ILP-based Formal Verification Approach for Quantized Neural
Networks [14.766917269393865]
量子化は、浮動小数点数に匹敵する精度でニューラルネットワークのサイズを減らすための有望な技術として登場した。
そこで本研究では,QNNに対する新しい,効率的な形式検証手法を提案する。
特に、QNNの検証問題を整数線形制約の解法に還元する符号化を初めて提案する。
論文 参考訳(メタデータ) (2022-12-10T03:00:29Z) - Accelerating the training of single-layer binary neural networks using
the HHL quantum algorithm [58.720142291102135]
Harrow-Hassidim-Lloyd (HHL) の量子力学的実装から有用な情報が抽出可能であることを示す。
しかし,本論文では,HHLの量子力学的実装から有用な情報を抽出し,古典的側面における解を見つける際の複雑性を低減することを目的としている。
論文 参考訳(メタデータ) (2022-10-23T11:58:05Z) - Improving Question Answering with Generation of NQ-like Questions [12.276281998447079]
QA ( Question Answering) システムは大量の注釈付きデータを必要とする。
本研究では,Quizbowl(QB)データセットの長いトリビア質問からNatural Questions(NQ)データセットにおいて,日々のコミュニケーションに似た短い質問を自動的に生成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-12T21:36:20Z) - Iterative Qubits Management for Quantum Index Searching in a Hybrid
System [56.39703478198019]
IQuCSは、量子古典ハイブリッドシステムにおけるインデックス検索とカウントを目的としている。
我々はQiskitでIQuCSを実装し、集中的な実験を行う。
その結果、量子ビットの消費を最大66.2%削減できることが示されている。
論文 参考訳(メタデータ) (2022-09-22T21:54:28Z) - Deep Reinforcement Learning with Spiking Q-learning [51.386945803485084]
スパイクニューラルネットワーク(SNN)は、少ないエネルギー消費で人工知能(AI)を実現することが期待されている。
SNNと深部強化学習(RL)を組み合わせることで、現実的な制御タスクに有望なエネルギー効率の方法を提供する。
論文 参考訳(メタデータ) (2022-01-21T16:42:11Z) - Will this Question be Answered? Question Filtering via Answer Model
Distillation for Efficient Question Answering [99.66470885217623]
本稿では,質問回答システム(QA)の効率向上に向けた新しいアプローチを提案する。
最新のQAシステムの回答信頼性スコアは、入力された質問テキストのみを使用してモデルによってうまく近似することができる。
論文 参考訳(メタデータ) (2021-09-14T23:07:49Z) - An Online Question Answering System based on Sub-graph Searching [1.240096657086732]
サブグラフインデックスを作成することで,この問題を解決するためのサブグラフ検索機構を設計し,各回答生成ステップをサブグラフレベルで制限する。
我々はこのメカニズムを実際のオンラインQAチャットシステムに利用し、エンティティベースの質問によく答えることで、質問カバレッジを明らかに改善することができる。
論文 参考訳(メタデータ) (2021-07-29T00:44:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。