論文の概要: Learning to Answer Multilingual and Code-Mixed Questions
- arxiv url: http://arxiv.org/abs/2211.07522v1
- Date: Mon, 14 Nov 2022 16:49:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 17:49:14.214871
- Title: Learning to Answer Multilingual and Code-Mixed Questions
- Title(参考訳): 多言語・コード混合質問に対する学習
- Authors: Deepak Gupta
- Abstract要約: 質問応答(QA)は、人間とコンピュータのシームレスな相互作用において重要な要素である。
もっとも古い研究分野の1つであるにもかかわらず、現在のQAシステムは多言語クエリを扱う上で重要な課題に直面している。
この論文は、多言語環境でエンドユーザクエリを扱うためのQA技術の進歩に焦点を当てている。
- 参考スコア(独自算出の注目度): 4.290420179006601
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Question-answering (QA) that comes naturally to humans is a critical
component in seamless human-computer interaction. It has emerged as one of the
most convenient and natural methods to interact with the web and is especially
desirable in voice-controlled environments. Despite being one of the oldest
research areas, the current QA system faces the critical challenge of handling
multilingual queries. To build an Artificial Intelligent (AI) agent that can
serve multilingual end users, a QA system is required to be language versatile
and tailored to suit the multilingual environment. Recent advances in QA models
have enabled surpassing human performance primarily due to the availability of
a sizable amount of high-quality datasets. However, the majority of such
annotated datasets are expensive to create and are only confined to the English
language, making it challenging to acknowledge progress in foreign languages.
Therefore, to measure a similar improvement in the multilingual QA system, it
is necessary to invest in high-quality multilingual evaluation benchmarks. In
this dissertation, we focus on advancing QA techniques for handling end-user
queries in multilingual environments. This dissertation consists of two parts.
In the first part, we explore multilingualism and a new dimension of
multilingualism referred to as code-mixing. Second, we propose a technique to
solve the task of multi-hop question generation by exploiting multiple
documents. Experiments show our models achieve state-of-the-art performance on
answer extraction, ranking, and generation tasks on multiple domains of MQA,
VQA, and language generation. The proposed techniques are generic and can be
widely used in various domains and languages to advance QA systems.
- Abstract(参考訳): 質問応答(QA)は、人間とコンピュータのシームレスな相互作用において重要な要素である。
ウェブと対話するための最も便利で自然な方法の1つとして現れており、特に音声制御環境では望ましい。
もっとも古い研究分野の1つであるにもかかわらず、現在のQAシステムは多言語クエリを扱う上で重要な課題に直面している。
マルチランガルエンドユーザーにサービスを提供する人工インテリジェント(AI)エージェントを構築するには,多言語環境に適した言語を多用するQAシステムが必要である。
近年のQAモデルの進歩は、主に大量の高品質データセットが利用可能であることから、人的パフォーマンスを上回ることが可能になっている。
しかし、これらの注釈付きデータセットの大部分は作成に費用がかかり、英語のみに限られており、外国語の進歩を認めることは困難である。
したがって、多言語QAシステムにおける同様の改善を測定するためには、高品質な多言語評価ベンチマークに投資する必要がある。
本稿では,多言語環境におけるエンドユーザクエリ処理におけるQA手法の進歩に着目した。
この論文は2部構成である。
第1部では、多言語主義と、コード混合と呼ばれる新しい多言語主義を探求する。
次に,複数の文書を活用し,マルチホップ質問生成の課題を解決する手法を提案する。
実験により, MQA, VQA, 言語生成の複数の領域において, 回答抽出, ランキング, 生成タスクにおける最先端のパフォーマンスが得られた。
提案手法は汎用的であり、様々なドメインや言語でQAシステムの進歩に広く利用することができる。
関連論文リスト
- Cross-lingual Transfer for Automatic Question Generation by Learning Interrogative Structures in Target Languages [6.635572580071933]
本稿では,モノリンガル,並列,ラベル付きデータを対象言語で必要とせずに動作可能な,単純かつ効率的なXLT-QG法を提案する。
提案手法は,GPT-3.5-turboに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2024-10-04T07:29:35Z) - MST5 -- Multilingual Question Answering over Knowledge Graphs [1.6470999044938401]
知識グラフ質問回答(KGQA)は、自然言語を用いたグラフベースモデルに格納された膨大な知識のクエリを単純化する。
既存の多言語KGQAシステムは、英語システムに匹敵する性能を達成するための課題に直面している。
本稿では,言語コンテキストとエンティティ情報を言語モデルの処理パイプラインに直接組み込むことで,多言語KGQAシステムを強化するための簡易なアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-08T15:37:51Z) - MTVQA: Benchmarking Multilingual Text-Centric Visual Question Answering [58.92057773071854]
MTVQAは、9つの異なる言語にまたがる高品質なヒューマンエキスパートアノテーションを特徴とする最初のベンチマークである。
MTVQAは9つの異なる言語にわたる高品質なヒューマンエキスパートアノテーションを特徴とする最初のベンチマークである。
論文 参考訳(メタデータ) (2024-05-20T12:35:01Z) - Can a Multichoice Dataset be Repurposed for Extractive Question Answering? [52.28197971066953]
我々は,Multiple-choice Question answering (MCQA)のために設計されたBandarkar et al.(Bandarkar et al., 2023)を再利用した。
本稿では,英語と現代標準アラビア語(MSA)のためのガイドラインと並列EQAデータセットを提案する。
私たちの目標は、ベレベレにおける120以上の言語変異に対して、他者が私たちのアプローチを適応できるようにすることです。
論文 参考訳(メタデータ) (2024-04-26T11:46:05Z) - SEMQA: Semi-Extractive Multi-Source Question Answering [94.04430035121136]
本稿では,複数ソースを半抽出的に要約することで,複数の質問に答える新しいQAタスクを提案する。
この種の最初のデータセットであるQuoteSumを作成し、自然および生成された質問に対する人間による半抽出的な回答を提示する。
論文 参考訳(メタデータ) (2023-11-08T18:46:32Z) - Bridging the Language Gap: Knowledge Injected Multilingual Question
Answering [19.768708263635176]
本稿では,異なる言語を理解するモデルの能力を高めるために,一般化された言語間移動フレームワークを提案する。
実世界のデータセット MLQA に対する実験結果から,提案手法は大きなマージンで性能を向上できることが示された。
論文 参考訳(メタデータ) (2023-04-06T15:41:25Z) - xGQA: Cross-Lingual Visual Question Answering [100.35229218735938]
xGQAは視覚的質問応答タスクのための新しい多言語評価ベンチマークである。
確立された英語GQAデータセットを7言語に拡張する。
本稿では,マルチモーダルトランスフォーマーモデルに適応するアダプタベースの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-13T15:58:21Z) - Towards More Equitable Question Answering Systems: How Much More Data Do
You Need? [15.401330338654203]
ステップバックして、既存のリソースを最大限に活用して、多くの言語でQAシステムを開発するためのアプローチを研究します。
具体的には、自動翻訳とコンテキスト-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せの順に拡張された数ショットアプローチの有効性を評価するために、広範囲に分析を行った。
我々は、QAデータセットやシステムの言語カバレッジを高めることを目的として、固定アノテーション予算をより活用するための将来のデータセット開発活動を提案する。
論文 参考訳(メタデータ) (2021-05-28T21:32:04Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z) - Multilingual Answer Sentence Reranking via Automatically Translated Data [97.98885151955467]
本稿では,現代の質問応答システム(QA)のコアコンポーネントである,多言語回答文選択(AS2)モデルの設計について述べる。
主なアイデアは、あるリソースリッチ言語(英語など)から、他の言語へのデータ転送であり、リソースの観点からはよりリッチである。
論文 参考訳(メタデータ) (2021-02-20T03:52:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。