論文の概要: ReasonVQA: A Multi-hop Reasoning Benchmark with Structural Knowledge for Visual Question Answering
- arxiv url: http://arxiv.org/abs/2507.16403v2
- Date: Mon, 28 Jul 2025 13:05:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 14:15:47.051348
- Title: ReasonVQA: A Multi-hop Reasoning Benchmark with Structural Knowledge for Visual Question Answering
- Title(参考訳): ReasonVQA:視覚質問応答のための構造知識付きマルチホップ推論ベンチマーク
- Authors: Duong T. Tran, Trung-Kien Tran, Manfred Hauswirth, Danh Le Phuoc,
- Abstract要約: 本稿では,視覚質問応答(VQA)タスクのための新しいデータセットReasonVQAを提案する。
我々のデータセットは構造化百科事典の知識と自動的に統合され、低コストのフレームワークを用いて構築される。
- 参考スコア(独自算出の注目度): 2.6309739988261795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a new dataset, ReasonVQA, for the Visual Question Answering (VQA) task. Our dataset is automatically integrated with structured encyclopedic knowledge and constructed using a low-cost framework, which is capable of generating complex, multi-hop questions. We evaluated state-of-the-art VQA models on ReasonVQA, and the empirical results demonstrate that ReasonVQA poses significant challenges to these models, highlighting its potential for benchmarking and advancing the field of VQA. Additionally, our dataset can be easily scaled with respect to input images; the current version surpasses the largest existing datasets requiring external knowledge by more than an order of magnitude.
- Abstract(参考訳): 本稿では,視覚質問応答(VQA)タスクのための新しいデータセットReasonVQAを提案する。
我々のデータセットは構造化百科事典の知識と自動的に統合され、複雑なマルチホップ質問を生成するための低コストフレームワークを用いて構築される。
我々は、ReasonVQAの最先端VQAモデルを評価し、実験結果から、ReasonVQAがこれらのモデルに重大な課題をもたらし、VQAのベンチマークと進歩の可能性を強調した。
さらに、我々のデータセットは入力画像に対して容易にスケールできる。現在のバージョンは、外部知識を必要とする最大規模のデータセットを1桁以上超えている。
関連論文リスト
- UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.22048505787125]
本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文 参考訳(メタデータ) (2023-10-17T02:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。