論文の概要: Visual Question Answering: A Survey on Techniques and Common Trends in
Recent Literature
- arxiv url: http://arxiv.org/abs/2305.11033v1
- Date: Thu, 18 May 2023 15:20:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 14:26:30.037804
- Title: Visual Question Answering: A Survey on Techniques and Common Trends in
Recent Literature
- Title(参考訳): 視覚的質問応答:最近の文献における技術と共通動向に関する調査
- Authors: Ana Cl\'audia Akemi Matsuki de Faria, Felype de Castro Bastos, Jos\'e
Victor Nogueira Alves da Silva, Vitor Lopes Fabris, Valeska de Sousa Uchoa,
D\'ecio Gon\c{c}alves de Aguiar Neto, Claudio Filipi Goncalves dos Santos
- Abstract要約: VQA(Visual Question Answering)は、研究の新たな関心領域である。
本研究では,近年のいくつかの研究成果について考察し,その分析と比較を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual Question Answering (VQA) is an emerging area of interest for
researches, being a recent problem in natural language processing and image
prediction. In this area, an algorithm needs to answer questions about certain
images. As of the writing of this survey, 25 recent studies were analyzed.
Besides, 6 datasets were analyzed and provided their link to download. In this
work, several recent pieces of research in this area were investigated and a
deeper analysis and comparison among them were provided, including results, the
state-of-the-art, common errors, and possible points of improvement for future
researchers.
- Abstract(参考訳): 視覚質問応答(visual question answering, vqa)は、自然言語処理と画像予測における最近の問題である。
この領域では、アルゴリズムは特定の画像に関する質問に答える必要がある。
この調査の執筆時点で、25の最近の研究が分析された。
さらに、6つのデータセットが分析され、ダウンロードへのリンクが提供された。
本研究は,本分野における最近の研究成果を概説し,その結果,最先端の誤り,一般的な誤り,今後の研究者にとっての改善点など,より深い分析と比較を行った。
関連論文リスト
- A Survey Forest Diagram : Gain a Divergent Insight View on a Specific Research Topic [2.699900017799093]
情報検索や質問応答におけるジェネレーティブAIの利用は,研究調査の実施に人気がある。
本研究は,本研究を対象とする未成年研究者を対象とした詳細な調査林図を作成することを目的としている。
論文 参考訳(メタデータ) (2024-07-24T08:17:37Z) - A Survey on the Densest Subgraph Problem and Its Variants [11.7345654477305]
デンスト部分グラフ問題は、与えられたグラフにおいて、誘導された部分グラフが密度の測度を最大化する頂点の部分集合を見つける必要がある。
近年では、この問題に対する研究の関心が復活し、いくつかの重要な貢献がなされている。
本調査は,本文献で提案されている多くの変種について,基礎的な結果の概要と包括的報告を提供する。
論文 参考訳(メタデータ) (2023-03-25T13:28:30Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Chart Question Answering: State of the Art and Future Directions [0.0]
チャート質問回答 (Chart Question Answering, CQA) システムは、通常、チャートと自然言語の質問を入力として、回答を自動的に生成する。
本稿では,グラフ質問応答問題に着目した現状研究を体系的にレビューする。
論文 参考訳(メタデータ) (2022-05-08T22:54:28Z) - 3D Object Detection from Images for Autonomous Driving: A Survey [68.33502122185813]
画像から3Dオブジェクトを検出することは、自動運転の基本的かつ困難な問題の一つだ。
この問題を2015年から2021年にかけて200以上の研究が行われ、理論、アルゴリズム、応用の幅広い範囲で研究されている。
我々は,この新奇で継続的な研究分野を包括的に調査し,画像に基づく3D検出に最もよく使用されるパイプラインを要約する。
論文 参考訳(メタデータ) (2022-02-07T07:12:24Z) - Medical Visual Question Answering: A Survey [55.53205317089564]
VQA(Medicical Visual Question Answering)は、医療用人工知能と一般的なVQA課題の組み合わせである。
医療用VQAシステムは,医療用画像と自然言語による臨床的に関連性のある質問を前提として,妥当かつ説得力のある回答を予測することが期待されている。
論文 参考訳(メタデータ) (2021-11-19T05:55:15Z) - Language bias in Visual Question Answering: A Survey and Taxonomy [0.0]
われわれはこの分野の総合的なレビューと分析を初めて実施する。
既存の手法を視覚情報の改善を含む3つのカテゴリに分類する。
言語バイアスの原因は明らかにされ、分類される。
論文 参考訳(メタデータ) (2021-11-16T15:01:24Z) - Fine-Grained Image Analysis with Deep Learning: A Survey [146.22351342315233]
きめ細かい画像解析(FGIA)は、コンピュータビジョンとパターン認識における長年の根本的な問題である。
本稿では、FGIAの分野を再定義し、FGIAの2つの基礎研究領域、細粒度画像認識と細粒度画像検索を統合することで、FGIAの分野を広げようとしている。
論文 参考訳(メタデータ) (2021-11-11T09:43:56Z) - Domain Adaptation for Medical Image Analysis: A Survey [28.365579324731247]
医用画像解析で使用される機械学習技術は通常、ソース/参照データとターゲットデータの間の異なる分布に起因するドメインシフト問題に悩まされる。
有望なソリューションとして、ドメイン適応は近年大きな注目を集めています。
この調査により、研究者は現在の状況や課題をよりよく理解できるようになる。
論文 参考訳(メタデータ) (2021-02-18T17:49:08Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。