論文の概要: Rephrasing visual questions by specifying the entropy of the answer
distribution
- arxiv url: http://arxiv.org/abs/2004.04963v1
- Date: Fri, 10 Apr 2020 09:32:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 21:13:05.575148
- Title: Rephrasing visual questions by specifying the entropy of the answer
distribution
- Title(参考訳): 回答分布のエントロピーの特定による視覚的質問の再現
- Authors: Kento Terao, Toru Tamaki, Bisser Raytchev, Kazufumi Kaneda, Shun'ichi
Satoh
- Abstract要約: 本稿では,質問のあいまいさを制御し,新しい課題を提案する。
視覚的質問のあいまいさは、VQAモデルによって予測される回答分布のエントロピーを用いて定義される。
我々は,質問のあいまいさを制御できるアプローチの利点を実証し,あいまいさを減らすことよりも増大が難しいという興味深い観察を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual question answering (VQA) is a task of answering a visual question that
is a pair of question and image. Some visual questions are ambiguous and some
are clear, and it may be appropriate to change the ambiguity of questions from
situation to situation. However, this issue has not been addressed by any prior
work. We propose a novel task, rephrasing the questions by controlling the
ambiguity of the questions. The ambiguity of a visual question is defined by
the use of the entropy of the answer distribution predicted by a VQA model. The
proposed model rephrases a source question given with an image so that the
rephrased question has the ambiguity (or entropy) specified by users. We
propose two learning strategies to train the proposed model with the VQA v2
dataset, which has no ambiguity information. We demonstrate the advantage of
our approach that can control the ambiguity of the rephrased questions, and an
interesting observation that it is harder to increase than to reduce ambiguity.
- Abstract(参考訳): 視覚的質問応答(VQA)とは、質問と画像のペアである視覚的質問に答えるタスクである。
視覚的な質問はあいまいで明確であり、質問のあいまいさを状況から状況へと変えるのが適切かもしれない。
しかし、この問題は以前の作業では解決されていない。
我々は,質問のあいまいさを制御して質問を再現する新しい課題を提案する。
視覚的質問のあいまいさは、VQAモデルによって予測される回答分布のエントロピーを用いて定義される。
提案モデルは,ユーザが指定した曖昧性(またはエントロピー)を有するように,画像で与えられた情報源質問を再現する。
あいまいな情報を持たないVQA v2データセットを用いて,提案モデルを訓練するための2つの学習戦略を提案する。
我々は,再現された質問の曖昧さを制御できる手法の利点と,曖昧さを減らすよりも増加が難しいという興味深い観察を示す。
関連論文リスト
- Answering Ambiguous Questions with a Database of Questions, Answers, and
Revisions [95.92276099234344]
ウィキペディアから生成される曖昧な質問のデータベースを利用して、あいまいな質問に答えるための新しい最先端技術を提案する。
提案手法は,リコール対策で15%,予測出力から不明瞭な質問を評価する尺度で10%向上する。
論文 参考訳(メタデータ) (2023-08-16T20:23:16Z) - Selectively Answering Ambiguous Questions [38.83930394700588]
我々は, サンプルモデル出力における繰り返しの定量化が, 退避時期を決定する最も信頼性の高い手法であることが判明した。
その結果,サンプリングに基づく信頼度スコアは,比較的あいまいな質問に対する回答のキャリブレーションに有効であることが示唆された。
論文 参考訳(メタデータ) (2023-05-24T01:25:38Z) - Keeping the Questions Conversational: Using Structured Representations
to Resolve Dependency in Conversational Question Answering [26.997542897342164]
本稿では,中間表現を会話の手がかりとして捉え,生成するための新しいフレームワークCONVSR(CONVQA using Structured Representations)を提案する。
我々はQuACとCANARDのデータセット上でモデルをテストし、提案するフレームワークが標準的な質問書き直しモデルよりも優れたF1スコアを達成できることを実験結果により示す。
論文 参考訳(メタデータ) (2023-04-14T13:42:32Z) - CREPE: Open-Domain Question Answering with False Presuppositions [92.20501870319765]
オンライン情報検索フォーラムからの予測失敗の自然な分布を含むQAデータセットであるCREPEを紹介する。
25%の質問が偽の前提命題を含み、これらの前提命題とその修正のための注釈を提供する。
既存のオープンドメインQAモデルの適応は適度に予測できるが、仮定が実際に正しいかどうかを予測するのに苦労する。
論文 参考訳(メタデータ) (2022-11-30T18:54:49Z) - Why Did the Chicken Cross the Road? Rephrasing and Analyzing Ambiguous
Questions in VQA [33.11688014628816]
あいまいな質問を解決することが、彼らに答える上で鍵となる。
あいまいな例のデータセットを作成し、それらが対処する基礎的な質問によって回答をグループ化し、各グループに対する質問を言い換えてあいまいさを減らします。
そして、自動的および人的評価により、よりあいまいな質問を生成する英語の質問生成モデルを開発する。
論文 参考訳(メタデータ) (2022-11-14T16:45:42Z) - Knowledge-Routed Visual Question Reasoning: Challenges for Deep
Representation Embedding [140.5911760063681]
VQAモデル評価のためのナレッジルーティング視覚質問推論という新しいデータセットを提案する。
視覚ゲノムシーングラフと外部知識ベースの両方に基づいて,制御プログラムを用いて質問応答対を生成する。
論文 参考訳(メタデータ) (2020-12-14T00:33:44Z) - Answering Ambiguous Questions through Generative Evidence Fusion and
Round-Trip Prediction [46.38201136570501]
本稿では,複数の通路からの証拠を集約し,一つの回答や質問対の集合を適応的に予測するモデルを提案する。
我々のモデルはRefuelと呼ばれ、AmbigQAデータセット上で新しい最先端のパフォーマンスを実現し、NQ-OpenおよびTriviaQA上での競合性能を示す。
論文 参考訳(メタデータ) (2020-11-26T05:48:55Z) - Match$^2$: A Matching over Matching Model for Similar Question
Identification [74.7142127303489]
コミュニティ質問回答(Community Question Answering, CQA)は,質問や回答の提出を自由に行う,知識獲得のための主要な手段となっている。
類似した質問識別は、CQAの中核的なタスクとなり、新しい質問が尋ねられるたびに、アーカイブされたリポジトリから同様の質問を見つけることを目的としている。
自然言語の固有のバリエーション、すなわち、同じ質問をしたり、同じ表現を共有する異なる質問をする方法があるため、この2つの質問の類似性を適切に測定することは、長い間困難であった。
従来の手法では片側の使用が一般的であり、答えを拡張された表現として活用する。
論文 参考訳(メタデータ) (2020-06-21T05:59:34Z) - SQuINTing at VQA Models: Introspecting VQA Models with Sub-Questions [66.86887670416193]
現状のVQAモデルでは、知覚や推論の問題に答える上で同等の性能を持つが、一貫性の問題に悩まされていることを示す。
この欠点に対処するため、サブクエスト対応ネットワークチューニング(SQuINT)というアプローチを提案する。
我々は,SQuINTがモデル一貫性を5%向上し,VQAにおける推論問題の性能も改善し,注意マップも改善したことを示す。
論文 参考訳(メタデータ) (2020-01-20T01:02:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。