論文の概要: P $\approx$ NP, at least in Visual Question Answering
- arxiv url: http://arxiv.org/abs/2003.11844v2
- Date: Fri, 27 Mar 2020 08:27:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 21:49:21.985217
- Title: P $\approx$ NP, at least in Visual Question Answering
- Title(参考訳): P $\approx$ NP, 少なくともVisual Question Answeringでは
- Authors: Shailza Jolly, Sebastian Palacio, Joachim Folz, Federico Raue, Joern
Hees, Andreas Dengel
- Abstract要約: 回答の"yes"と"no"が38%を占め、残りの62%が3000以上の回答に分散していることがわかった。
この分野ではすでにいくつかのバイアス源が研究されているが、極性対非極性の問題の過剰表現の効果はいまだ不明である。
視覚テキスト埋め込みの中間的特徴空間を探索することにより、ポーラ問題の特徴空間が既に多くの非ポーラ問題に答える十分な構造を符号化していることが分かる。
- 参考スコア(独自算出の注目度): 5.662765468088746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, progress in the Visual Question Answering (VQA) field has
largely been driven by public challenges and large datasets. One of the most
widely-used of these is the VQA 2.0 dataset, consisting of polar ("yes/no") and
non-polar questions. Looking at the question distribution over all answers, we
find that the answers "yes" and "no" account for 38 % of the questions, while
the remaining 62% are spread over the more than 3000 remaining answers. While
several sources of biases have already been investigated in the field, the
effects of such an over-representation of polar vs. non-polar questions remain
unclear. In this paper, we measure the potential confounding factors when polar
and non-polar samples are used jointly to train a baseline VQA classifier, and
compare it to an upper bound where the over-representation of polar questions
is excluded from the training. Further, we perform cross-over experiments to
analyze how well the feature spaces align. Contrary to expectations, we find no
evidence of counterproductive effects in the joint training of unbalanced
classes. In fact, by exploring the intermediate feature space of visual-text
embeddings, we find that the feature space of polar questions already encodes
sufficient structure to answer many non-polar questions. Our results indicate
that the polar (P) and the non-polar (NP) feature spaces are strongly aligned,
hence the expression P $\approx$ NP
- Abstract(参考訳): 近年、VQA(Visual Question Answering)分野の進歩は、公開課題と大規模なデータセットによって大きく推進されている。
最も広く使われているのがVQA 2.0データセットで、極性(yes/no)と非極性質問からなる。
すべての回答に対する質問の分布を見てみると、回答の「イエス」と「ノー」は質問の38パーセントを占め、残りの62%は残りの3000以上の回答に分散していることがわかった。
この分野ではすでにいくつかのバイアス源が研究されているが、極性対非極性質問の過剰表現の効果は未だ不明である。
本稿では,ベースラインvqa分類器を訓練するために,非極性試料と極性試料が併用された場合の潜在的な共起要因を測定し,極性質問の過剰表現をトレーニングから除外した上界と比較する。
さらに,機能空間の適合度を分析するために,クロスオーバー実験を行った。
期待に反して,不均衡授業の合同研修において,非生産的効果の証拠は見いだされなかった。
実際、ビジュアルテキスト埋め込みの中間的特徴空間を探索することによって、極性問題の特徴空間が既に多くの非極性問題に答えるのに十分な構造を符号化していることが分かる。
我々の結果は、極性(P)および非極性(NP)特徴空間が強く整列していることを示し、従ってP$\approx$ NP という式が成立する。
関連論文リスト
- How many classifiers do we need? [50.69951049206484]
分類器間の不一致と偏極が、個々の分類器を集約することで得られる性能向上とどのように関連しているかを詳細に分析する。
分類器の個数で不一致の挙動を示す。
我々の理論と主張は、様々なタイプのニューラルネットワークを用いた画像分類タスクに関する経験的な結果によって裏付けられている。
論文 参考訳(メタデータ) (2024-11-01T02:59:56Z) - Which questions should I answer? Salience Prediction of Inquisitive Questions [118.097974193544]
非常に健全な質問は、同じ記事で経験的に答えられる可能性が高いことを示す。
質問に対する回答が,ニュースの要約品質の指標であることを示すことで,我々の知見をさらに検証する。
論文 参考訳(メタデータ) (2024-04-16T21:33:05Z) - Researchy Questions: A Dataset of Multi-Perspective, Decompositional
Questions for LLM Web Agents [22.023543164141504]
我々は,検索エンジンクエリのデータセットであるResearchy Questionsを紹介した。
クリックやセッションの長さといったシグナルによって,これらの質問に多くの労力が費やされていることを,私たちは示しています。
また、サブクエストへの分解のようなスロー思考の解答技術は、直接解答するよりも有益であることを示す。
論文 参考訳(メタデータ) (2024-02-27T21:27:16Z) - Controllable Decontextualization of Yes/No Question and Answers into
Factual Statements [28.02936811004903]
本稿では,極性質問に対する回答の制御可能な書き直しの問題に対処する。
本稿では,ソフト制約を利用して制御可能な書き換えを実現するトランスフォーマーシーケンス to シーケンスモデルを提案する。
論文 参考訳(メタデータ) (2024-01-18T07:52:12Z) - Answering Ambiguous Questions with a Database of Questions, Answers, and
Revisions [95.92276099234344]
ウィキペディアから生成される曖昧な質問のデータベースを利用して、あいまいな質問に答えるための新しい最先端技術を提案する。
提案手法は,リコール対策で15%,予測出力から不明瞭な質問を評価する尺度で10%向上する。
論文 参考訳(メタデータ) (2023-08-16T20:23:16Z) - On the Complexity of the Bipartite Polarization Problem: from Neutral to
Highly Polarized Discussions [1.5675763601034223]
双分極問題は、重み付きラベル付きグラフ上で最も高い偏極二分法を見つけることを目標とする最適化問題である。
単一パラメータがインスタンスの分極を制御するインスタンス生成モデルを導入する。
論文 参考訳(メタデータ) (2023-07-21T14:40:41Z) - CREPE: Open-Domain Question Answering with False Presuppositions [92.20501870319765]
オンライン情報検索フォーラムからの予測失敗の自然な分布を含むQAデータセットであるCREPEを紹介する。
25%の質問が偽の前提命題を含み、これらの前提命題とその修正のための注釈を提供する。
既存のオープンドメインQAモデルの適応は適度に予測できるが、仮定が実際に正しいかどうかを予測するのに苦労する。
論文 参考訳(メタデータ) (2022-11-30T18:54:49Z) - ConditionalQA: A Complex Reading Comprehension Dataset with Conditional
Answers [93.55268936974971]
条件付き回答を含む複雑な質問を含む質問回答データセットについて述べる。
このデータセットを ConditionalQA と呼びます。
本稿では,既存のQAモデルの多く,特に回答条件の選択において,ConditionalQAは困難であることを示す。
論文 参考訳(メタデータ) (2021-10-13T17:16:46Z) - GooAQ: Open Question Answering with Diverse Answer Types [63.06454855313667]
さまざまな回答型を持つ大規模データセットであるGooAQを紹介する。
このデータセットには500万の質問と300万の回答が含まれている。
論文 参考訳(メタデータ) (2021-04-18T05:40:39Z) - What Gives the Answer Away? Question Answering Bias Analysis on Video QA
Datasets [40.64071905569975]
ビデオQAデータセットの回答バイアスは、QAアーティファクトに過度に適合するように、マルチモーダルモデルを誤解させる可能性がある。
私たちの研究では、アノテータや質問の種類からバイアスが生まれます。
また,ビデオQAデータセットのQAバイアスを低減できることを示す。
論文 参考訳(メタデータ) (2020-07-07T17:00:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。