論文の概要: Bridging the Language Gap: Knowledge Injected Multilingual Question
Answering
- arxiv url: http://arxiv.org/abs/2304.03159v1
- Date: Thu, 6 Apr 2023 15:41:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 13:42:35.443370
- Title: Bridging the Language Gap: Knowledge Injected Multilingual Question
Answering
- Title(参考訳): 言語ギャップのブリッジ:多言語質問に対する知識注入
- Authors: Zhichao Duan, Xiuxing Li, Zhengyan Zhang, Zhenyu Li, Ning Liu,
Jianyong Wang
- Abstract要約: 本稿では,異なる言語を理解するモデルの能力を高めるために,一般化された言語間移動フレームワークを提案する。
実世界のデータセット MLQA に対する実験結果から,提案手法は大きなマージンで性能を向上できることが示された。
- 参考スコア(独自算出の注目度): 19.768708263635176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Question Answering (QA) is the task of automatically answering questions
posed by humans in natural languages. There are different settings to answer a
question, such as abstractive, extractive, boolean, and multiple-choice QA. As
a popular topic in natural language processing tasks, extractive question
answering task (extractive QA) has gained extensive attention in the past few
years. With the continuous evolvement of the world, generalized cross-lingual
transfer (G-XLT), where question and answer context are in different languages,
poses some unique challenges over cross-lingual transfer (XLT), where question
and answer context are in the same language. With the boost of corresponding
development of related benchmarks, many works have been done to improve the
performance of various language QA tasks. However, only a few works are
dedicated to the G-XLT task. In this work, we propose a generalized
cross-lingual transfer framework to enhance the model's ability to understand
different languages. Specifically, we first assemble triples from different
languages to form multilingual knowledge. Since the lack of knowledge between
different languages greatly limits models' reasoning ability, we further design
a knowledge injection strategy via leveraging link prediction techniques to
enrich the model storage of multilingual knowledge. In this way, we can
profoundly exploit rich semantic knowledge. Experiment results on real-world
datasets MLQA demonstrate that the proposed method can improve the performance
by a large margin, outperforming the baseline method by 13.18%/12.00% F1/EM on
average.
- Abstract(参考訳): 質問回答 (QA) は、自然言語における人間による質問に自動的に答えるタスクである。
質問には、抽象的、抽出的、ブール的、複数選択QAなど、さまざまな設定がある。
自然言語処理タスクで一般的な話題として、抽出型質問応答タスク(extractive qa)がここ数年で注目を集めている。
世界の継続的な発展に伴い、一般的な言語間移動(G-XLT)では、問合せと解答のコンテキストが異なる言語で行われ、問合せと解答のコンテキストが同じ言語で存在するXLT(cross-lingual transfer)に対して固有の課題が生じる。
関連するベンチマークの開発が促進されると、様々な言語qaタスクのパフォーマンスを改善するために多くの作業がなされた。
しかしながら、G-XLTタスク専用の作品はごくわずかである。
本研究では,異なる言語を理解するモデルの能力を高めるための汎用的な言語間伝達フレームワークを提案する。
具体的には、まず異なる言語から三つ組を組み立て、多言語知識を形成する。
異なる言語間の知識の欠如はモデルの推論能力を大幅に制限するので、リンク予測技術を活用して多言語知識のモデル記憶を強化する知識注入戦略をさらに設計する。
このようにして、我々はリッチなセマンティック知識を深く活用することができる。
実世界のデータセット MLQA の実験結果から,提案手法は平均で13.18%/12.00% F1/EM を上回り,大きなマージンで性能を向上できることが示された。
関連論文リスト
- Can a Multichoice Dataset be Repurposed for Extractive Question Answering? [52.28197971066953]
我々は,Multiple-choice Question answering (MCQA)のために設計されたBandarkar et al.(Bandarkar et al., 2023)を再利用した。
本稿では,英語と現代標準アラビア語(MSA)のためのガイドラインと並列EQAデータセットを提案する。
私たちの目標は、ベレベレにおける120以上の言語変異に対して、他者が私たちのアプローチを適応できるようにすることです。
論文 参考訳(メタデータ) (2024-04-26T11:46:05Z) - Applying Multilingual Models to Question Answering (QA) [0.0]
本研究では,英語,フィンランド語,日本語の3言語を対象とした質問応答課題(QA)に基づいて,単言語および多言語言語モデルの性能について検討する。
我々は,(1)質問が応答可能かどうかを判断するタスクのモデルを開発し,(2)IOBタグを用いたコンテキスト内の回答テキストを識別する。
論文 参考訳(メタデータ) (2022-12-04T21:58:33Z) - Learning to Answer Multilingual and Code-Mixed Questions [4.290420179006601]
質問応答(QA)は、人間とコンピュータのシームレスな相互作用において重要な要素である。
もっとも古い研究分野の1つであるにもかかわらず、現在のQAシステムは多言語クエリを扱う上で重要な課題に直面している。
この論文は、多言語環境でエンドユーザクエリを扱うためのQA技術の進歩に焦点を当てている。
論文 参考訳(メタデータ) (2022-11-14T16:49:58Z) - Delving Deeper into Cross-lingual Visual Question Answering [115.16614806717341]
標準学習装置に簡単な修正を加えることで、モノリンガル英語のパフォーマンスへの移行ギャップを大幅に減らすことができることを示す。
多言語マルチモーダル変換器の多言語間VQAを多言語間VQAで解析する。
論文 参考訳(メタデータ) (2022-02-15T18:22:18Z) - Cross-Lingual GenQA: A Language-Agnostic Generative Question Answering
Approach for Open-Domain Question Answering [76.99585451345702]
オープン検索生成質問回答(GenQA)は、高品質で自然な回答を英語で提供することが証明されている。
我々は多言語環境に対するGenQAアプローチの最初の一般化について述べる。
論文 参考訳(メタデータ) (2021-10-14T04:36:29Z) - X-METRA-ADA: Cross-lingual Meta-Transfer Learning Adaptation to Natural
Language Understanding and Question Answering [55.57776147848929]
自然言語理解のための言語横断型メタトランシュファー学習アプローチX-METRA-ADAを提案する。
我々のアプローチは、最適化に基づくメタ学習アプローチであるMAMLに適応し、新しい言語に適応することを学ぶ。
提案手法は難易度の高い微調整に優れており,ほとんどの言語において両タスクの競合性能に到達していることを示す。
論文 参考訳(メタデータ) (2021-04-20T00:13:35Z) - Multilingual Answer Sentence Reranking via Automatically Translated Data [97.98885151955467]
本稿では,現代の質問応答システム(QA)のコアコンポーネントである,多言語回答文選択(AS2)モデルの設計について述べる。
主なアイデアは、あるリソースリッチ言語(英語など)から、他の言語へのデータ転送であり、リソースの観点からはよりリッチである。
論文 参考訳(メタデータ) (2021-02-20T03:52:08Z) - Multilingual Transfer Learning for QA Using Translation as Data
Augmentation [13.434957024596898]
我々は,多言語組込みを意味空間に近づけることで,言語間伝達を改善する戦略を検討する。
言語敵対的トレーニングと言語仲裁フレームワークという2つの新しい戦略を提案し、(ゼロリソースの)クロスリンガルトランスファーのパフォーマンスを大幅に改善します。
実験により,提案モデルは,最近導入された多言語MLQAデータセットとTyDiQAデータセットにおいて,以前のゼロショットベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-10T20:29:34Z) - XOR QA: Cross-lingual Open-Retrieval Question Answering [75.20578121267411]
この作業は、言語横断的な設定に応答するオープン検索の質問を拡張します。
我々は,同じ回答を欠いた質問に基づいて,大規模なデータセットを構築した。
論文 参考訳(メタデータ) (2020-10-22T16:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。