論文の概要: DEEPAG\'E: Answering Questions in Portuguese about the Brazilian
Environment
- arxiv url: http://arxiv.org/abs/2110.10015v1
- Date: Tue, 19 Oct 2021 14:35:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-10-20 13:15:30.733367
- Title: DEEPAG\'E: Answering Questions in Portuguese about the Brazilian
Environment
- Title(参考訳): DEEPAG\'E:ブラジルの環境に関するポルトガル語の質問に答える
- Authors: Fl\'avio Nakasato Ca\c{c}\~ao, Marcos Menon Jos\'e, Andr\'e Seidel
Oliveira, Stefano Spindola, Anna Helena Reali Costa, F\'abio Gagliardi Cozman
- Abstract要約: 本稿では,BM25アルゴリズムとスパース検索手法と,事前学習した最先端言語モデルであるPTT5を組み合わせた質問応答システムを提案する。
トレーニングデータとして、オープンドメインデータセットからの質問、ポルトガルのウィキペディアからのコンテンツ、報道からのニュースを収集しました。
したがって、私たちは革新的なアーキテクチャや新しいアプリケーションに貢献し、最高のモデルで36.2のF1スコアを獲得しました。
- 参考スコア(独自算出の注目度): 8.367620276482054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The challenge of climate change and biome conservation is one of the most
pressing issues of our time - particularly in Brazil, where key environmental
reserves are located. Given the availability of large textual databases on
ecological themes, it is natural to resort to question answering (QA) systems
to increase social awareness and understanding about these topics. In this
work, we introduce multiple QA systems that combine in novel ways the BM25
algorithm, a sparse retrieval technique, with PTT5, a pre-trained
state-of-the-art language model. Our QA systems focus on the Portuguese
language, thus offering resources not found elsewhere in the literature. As
training data, we collected questions from open-domain datasets, as well as
content from the Portuguese Wikipedia and news from the press. We thus
contribute with innovative architectures and novel applications, attaining an
F1-score of 36.2 with our best model.
- Abstract(参考訳): 気候変動とバイオマス保護の課題は、特に重要な環境保護区があるブラジルにおいて、我々の時代で最も差し迫った問題の一つである。
生態学的なテーマに大規模なテキストデータベースが利用できることを考えると、これらのトピックに対する社会的意識と理解を高めるために質問応答(QA)システムを利用するのが自然である。
本研究では,BM25アルゴリズム,スパース検索手法と,事前訓練された最先端言語モデルであるPTT5を組み合わせた複数のQAシステムを提案する。
当社のqaシステムはポルトガル語に重点を置いており、文献にはないリソースを提供しています。
トレーニングデータとして、オープンドメインデータセットからの質問、ポルトガルのウィキペディアからのコンテンツ、報道からのニュースを収集しました。
したがって、革新的なアーキテクチャや新しいアプリケーションに貢献し、最良のモデルで36.2のf1-scoreを達成します。
関連論文リスト
- Evaluating and Modeling Attribution for Cross-Lingual Question Answering [80.4807682093432]
この研究は、言語間質問応答の属性を初めて研究したものである。
我々は、5つの言語でデータを収集し、最先端の言語間QAシステムの属性レベルを評価する。
回答のかなりの部分は、検索されたどのパスにも帰属しないことがわかった。
論文 参考訳(メタデータ) (2023-05-23T17:57:46Z) - Semantic Web Enabled Geographic Question Answering Framework: GeoTR [0.0]
本研究では,トルコ語の自然言語入力を地理的領域のSPARQLクエリに変換する質問応答フレームワークを提案する。
空間合成トルコという10年生の地理授業を包括する新しいトルコオントロジーが、リンクデータプロバイダとして使用されるように開発されている。
また,自然言語処理技術とリンクデータ技術を組み合わせて回答を生成するハイブリッドシステムアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-01-11T23:20:43Z) - RealTime QA: What's the Answer Right Now? [137.04039209995932]
本稿では,動的質問応答(QA)プラットフォームであるREALTIME QAを紹介する。
GPT-3 や T5 など,大規模事前学習型言語モデルに基づく強力なベースラインモデルを構築した。
GPT-3は、検索された文書が答えを見つけるのに十分な情報を提供していない場合、時代遅れの回答を返す傾向がある。
論文 参考訳(メタデータ) (2022-07-27T07:26:01Z) - Modern Question Answering Datasets and Benchmarks: A Survey [5.026863544662493]
質問回答(QA)は、自然言語処理(NLP)の最も重要なタスクの一つである。
NLP技術を用いて、大量の非構造化コーパスに基づいて、与えられた質問に対する対応する回答を生成することを目的としている。
本稿では,ディープラーニングの時代にリリースされた,影響力あるQAデータセットについて検討する。
論文 参考訳(メタデータ) (2022-06-30T05:53:56Z) - Asking for Knowledge: Training RL Agents to Query External Knowledge
Using Language [121.56329458876655]
グリッドワールドベースのQ-BabyAIとテキストベースのQ-TextWorldの2つの新しい環境を紹介した。
本稿では,意味のある知識を問うための言語コマンドを生成する「知識の探索(AFK)」エージェントを提案する。
論文 参考訳(メタデータ) (2022-05-12T14:20:31Z) - XLMRQA: Open-Domain Question Answering on Vietnamese Wikipedia-based
Textual Knowledge Source [2.348805691644086]
本稿では,ウィキペディアベースのテキスト知識ソースに教師付きトランスフォーマーを用いたベトナム初のQAシステムであるXLMRQAを提案する。
3つのシステムで得られた結果から,質問タイプがQAシステムの性能に与える影響を解析した。
論文 参考訳(メタデータ) (2022-04-14T14:54:33Z) - Addressing Issues of Cross-Linguality in Open-Retrieval Question
Answering Systems For Emergent Domains [67.99403521976058]
新型コロナウイルスの緊急ドメインに対する言語横断的オープン検索型質問応答システムについて紹介する。
本システムでは,検索した文書の信頼性を確保するために,学術論文のコーパスを採用している。
深いセマンティック・レトリバーは、我々の英語からすべてのデータに対するトレーニングの恩恵が大きく、言語横断環境ではBM25ベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-01-26T19:27:32Z) - Recent Advances in Automated Question Answering In Biomedical Domain [0.06922389632860546]
過去数十年間、知識の獲得が急増しており、その結果、バイオメディシン分野における新しい科学論文が指数関数的に増加してきた。
ドメインの専門家であっても、ドメイン内のすべての情報を追跡することは困難になっています。
商用検索エンジンの改善により、ユーザーはクエリーを入力し、クエリーに最も関連性の高いドキュメントの小さなセットを得ることができる。
これにより、ユーザが提供する自然言語の質問に対して、正確かつ正確な答えを見つけることを目的とした効率的なQAシステムの開発が必要になった。
論文 参考訳(メタデータ) (2021-11-10T20:51:29Z) - Biomedical Question Answering: A Comprehensive Review [19.38459023509541]
Question Answering (QA) は自然言語処理(NLP)のベンチマークであり、関連する文書、画像、知識ベース、質問-回答ペアを用いてモデルが与えられた質問に対する回答を予測する。
バイオメディシンのような特定のドメインでは、QAシステムは実際の環境では使われない。
バイオメディカルQA(BQA)は、新しいQAタスクとして、革新的なアプリケーションが複雑なバイオメディカル知識を効果的に知覚し、アクセスし、理解することを可能にする。
論文 参考訳(メタデータ) (2021-02-10T06:16:35Z) - Retrieving and Reading: A Comprehensive Survey on Open-domain Question
Answering [62.88322725956294]
OpenQAの最近の研究動向を概観し、特にニューラルMSC技術を導入したシステムに注目した。
Retriever-Reader' と呼ばれる最新の OpenQA アーキテクチャを導入し、このアーキテクチャに従うさまざまなシステムを分析します。
次に、OpenQAシステムの開発における主要な課題について議論し、一般的に使用されるベンチマークの分析を提供する。
論文 参考訳(メタデータ) (2021-01-04T04:47:46Z) - A Survey on Complex Question Answering over Knowledge Base: Recent
Advances and Challenges [71.4531144086568]
知識ベース(KB)に対する質問回答(QA)は、自然言語の質問に自動的に答えることを目的としている。
研究者は、よりKBのトリプルと制約推論を必要とする単純な質問から複雑な質問へと注意を移した。
論文 参考訳(メタデータ) (2020-07-26T07:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。