論文の概要: A Neuro-Symbolic ASP Pipeline for Visual Question Answering
- arxiv url: http://arxiv.org/abs/2205.07548v1
- Date: Mon, 16 May 2022 09:50:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 14:20:37.571049
- Title: A Neuro-Symbolic ASP Pipeline for Visual Question Answering
- Title(参考訳): 視覚質問応答のためのニューロシンボリックaspパイプライン
- Authors: Thomas Eiter, Nelson Higuera, Johannes Oetsch, and Michael Pritz
- Abstract要約: 本稿では,CLEVRの視覚的視覚的質問応答(VQA)パイプラインについて述べる。
このパイプラインでは、(i)CLEVRシーンのオブジェクト分類とバウンディングボックス予測のためのニューラルネットワークのトレーニング、(ii)予測値の分布に関する統計分析、(iii)CLEVR質問の翻訳、および(iii)信頼しきい値を論理プログラムに渡すネットワーク予測について取り上げている。
- 参考スコア(独自算出の注目度): 12.28454508098587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a neuro-symbolic visual question answering (VQA) pipeline for
CLEVR, which is a well-known dataset that consists of pictures showing scenes
with objects and questions related to them. Our pipeline covers (i) training
neural networks for object classification and bounding-box prediction of the
CLEVR scenes, (ii) statistical analysis on the distribution of prediction
values of the neural networks to determine a threshold for high-confidence
predictions, and (iii) a translation of CLEVR questions and network predictions
that pass confidence thresholds into logic programs so that we can compute the
answers using an ASP solver. By exploiting choice rules, we consider
deterministic and non-deterministic scene encodings. Our experiments show that
the non-deterministic scene encoding achieves good results even if the neural
networks are trained rather poorly in comparison with the deterministic
approach. This is important for building robust VQA systems if network
predictions are less-than perfect. Furthermore, we show that restricting
non-determinism to reasonable choices allows for more efficient implementations
in comparison with related neuro-symbolic approaches without loosing much
accuracy. This work is under consideration for acceptance in TPLP.
- Abstract(参考訳): 本稿では,神経シンボリック視覚質問応答(vqa)パイプラインを提案する。このパイプラインは,オブジェクトやそれに関連する質問のシーンを示す画像で構成された,よく知られたデータセットである。
私たちのパイプラインは
(i)オブジェクト分類とclevrシーンのバウンディングボックス予測のためのニューラルネットワークのトレーニング
(II)高信頼予測のしきい値を決定するニューラルネットワークの予測値の分布に関する統計的解析、及び
3)CLEVR質問とネットワーク予測を翻訳し,信頼度閾値を論理プログラムに渡すことで,ASPソルバを用いて回答を計算できるようにする。
選択規則を活用し,決定論的かつ非決定論的シーンエンコーディングを考える。
実験の結果,ニューラルネットワークが決定論的アプローチと比較してトレーニングが不十分であっても,非決定論的シーンの符号化は良好な結果が得られることがわかった。
これは、ネットワーク予測が完璧でない場合、堅牢なVQAシステムを構築する上で重要である。
さらに,非決定論を合理的な選択に制限することは,関連する神経象徴的アプローチと比較して,精度を損なうことなく,より効率的な実装を可能にすることを示す。
この研究はTPLPの受け入れを検討中である。
関連論文リスト
- From "What" to "When" -- a Spiking Neural Network Predicting Rare Events
and Time to their Occurrence [0.0]
本研究は, 漏洩型統合火災(LIF)ニューロンからなるSNNを用いて, 対応する予測モデルを学習するための新しいアプローチを提案する。
提案手法は, 特殊設計した局所シナプス塑性規則と新しいカラム層SNNアーキテクチャを利用する。
本論文で述べるSNNは,高精度な機械学習技術と比較して精度が高いことを示した。
論文 参考訳(メタデータ) (2023-11-09T08:47:23Z) - Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - An Estimator for the Sensitivity to Perturbations of Deep Neural
Networks [0.31498833540989407]
本稿では,入力の摂動に対して与えられたディープニューラルネットワークの感度を予測できる推定器を導出する。
推定器の近似は、ImageNetデータセットを使用して、AlexNetとVGG-19の2つの畳み込みニューラルネットワークでテストされる。
論文 参考訳(メタデータ) (2023-07-24T10:33:32Z) - Semantic Strengthening of Neuro-Symbolic Learning [85.6195120593625]
ニューロシンボリックアプローチは一般に確率論的目的のファジィ近似を利用する。
トラクタブル回路において,これを効率的に計算する方法を示す。
我々は,Warcraftにおける最小コストパスの予測,最小コスト完全マッチングの予測,スドクパズルの解法という3つの課題に対して,アプローチを検証した。
論文 参考訳(メタデータ) (2023-02-28T00:04:22Z) - Interpretable Self-Aware Neural Networks for Robust Trajectory
Prediction [50.79827516897913]
本稿では,意味概念間で不確実性を分散する軌道予測のための解釈可能なパラダイムを提案する。
実世界の自動運転データに対する我々のアプローチを検証し、最先端のベースラインよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-16T06:28:20Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - Look beyond labels: Incorporating functional summary information in
Bayesian neural networks [11.874130244353253]
予測確率に関する要約情報を組み込むための簡単な手法を提案する。
利用可能な要約情報は、拡張データとして組み込まれ、ディリクレプロセスでモデル化される。
本稿では,タスクの難易度やクラス不均衡をモデルに示す方法について述べる。
論文 参考訳(メタデータ) (2022-07-04T07:06:45Z) - Bayesian Convolutional Neural Networks for Limited Data Hyperspectral
Remote Sensing Image Classification [14.464344312441582]
我々は、HSRS画像の分類に、ベイズニューラルネットワークと呼ばれる、ディープニューラルネットワークの特別なクラスを使用します。
ベイズニューラルネットワークは、不確実性を測定するための固有のツールを提供する。
ベイジアンネットワークは、同様に構築された非ベイジアン畳み込みニューラルネットワーク(CNN)と、既成のランダムフォレスト(RF)より優れていることを示す。
論文 参考訳(メタデータ) (2022-05-19T00:02:16Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - FF-NSL: Feed-Forward Neural-Symbolic Learner [70.978007919101]
本稿では,Feed-Forward Neural-Symbolic Learner (FF-NSL) と呼ばれるニューラルシンボリック学習フレームワークを紹介する。
FF-NSLは、ラベル付き非構造化データから解釈可能な仮説を学習するために、Answer Setセマンティクスに基づく最先端のICPシステムとニューラルネットワークを統合する。
論文 参考訳(メタデータ) (2021-06-24T15:38:34Z) - Improving Video Instance Segmentation by Light-weight Temporal
Uncertainty Estimates [11.580916951856256]
本稿では,インスタンスセグメンテーションネットワークの不確かさをモデル化するための時間動的手法を提案する。
本稿では,偽陽性の検出と予測品質の推定に本手法を適用した。
提案手法は、容易に訓練されたニューラルネットワークとビデオシーケンス入力のみを必要とする。
論文 参考訳(メタデータ) (2020-12-14T13:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。