論文の概要: End-to-End Neuro-Symbolic Architecture for Image-to-Image Reasoning
Tasks
- arxiv url: http://arxiv.org/abs/2106.03121v1
- Date: Sun, 6 Jun 2021 13:27:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-13 16:27:19.038197
- Title: End-to-End Neuro-Symbolic Architecture for Image-to-Image Reasoning
Tasks
- Title(参考訳): 画像から画像への推論作業のためのエンド・ツー・エンドニューロシンボリックアーキテクチャ
- Authors: Ananye Agarwal, Pradeep Shenoy, Mausam
- Abstract要約: 画像入力から画像出力への変換を必要とするタスクを推論するためのニューラル・シンボリック・ニューラルモデルについて検討する。
画像再構成損失と新たな出力エンコーダを組み合わせてスーパーバイザ信号を生成するアーキテクチャであるNSNnetを提案する。
- 参考スコア(独自算出の注目度): 15.649929244635269
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural models and symbolic algorithms have recently been combined for tasks
requiring both perception and reasoning. Neural models ground perceptual input
into a conceptual vocabulary, on which a classical reasoning algorithm is
applied to generate output. A key limitation is that such neural-to-symbolic
models can only be trained end-to-end for tasks where the output space is
symbolic. In this paper, we study neural-symbolic-neural models for reasoning
tasks that require a conversion from an image input (e.g., a partially filled
sudoku) to an image output (e.g., the image of the completed sudoku). While
designing such a three-step hybrid architecture may be straightforward, the key
technical challenge is end-to-end training -- how to backpropagate without
intermediate supervision through the symbolic component. We propose NSNnet, an
architecture that combines an image reconstruction loss with a novel output
encoder to generate a supervisory signal, develops update algorithms that
leverage policy gradient methods for supervision, and optimizes loss using a
novel subsampling heuristic. We experiment on problem settings where symbolic
algorithms are easily specified: a visual maze solving task and a visual Sudoku
solver where the supervision is in image form. Experiments show high accuracy
with significantly less data compared to purely neural approaches.
- Abstract(参考訳): ニューラルモデルとシンボリックアルゴリズムは、認識と推論の両方を必要とするタスクに最近組み合わせられている。
ニューラルネットワークは、古典的推論アルゴリズムを適用して出力を生成する概念語彙への知覚入力を基礎とする。
鍵となる制限は、そのようなニューラル・トゥ・シンボリックモデルは、出力空間がシンボリックであるタスクに対してエンドツーエンドでしか訓練できないことである。
本稿では,画像入力(例えば部分充填した数独)から画像出力(例えば完成した数独の画像)への変換を必要とするタスクを推論するためのニューラルシンボリックニューラルモデルについて検討する。
このような3段階のハイブリッドアーキテクチャを設計するのは簡単かも知れませんが、重要な技術的課題はエンドツーエンドのトレーニングです。
画像再構成損失を新しい出力エンコーダと組み合わせてオーバシリ信号を生成するアーキテクチャであるNSNnetを提案し、監視のためのポリシー勾配手法を活用する更新アルゴリズムを開発し、新しいサブサンプリングヒューリスティックを用いて損失を最適化する。
本稿では,視覚的迷路解決タスクと視覚的スドゥーク解決タスクという,記号的アルゴリズムの特定が容易な問題設定を実験的に検討する。
実験では、純粋に神経的なアプローチに比べて、データの精度が著しく低い。
関連論文リスト
- Simple and Effective Transfer Learning for Neuro-Symbolic Integration [50.592338727912946]
この問題の潜在的な解決策はNeuro-Symbolic Integration (NeSy)であり、ニューラルアプローチとシンボリック推論を組み合わせる。
これらの手法のほとんどは、認識をシンボルにマッピングするニューラルネットワークと、下流タスクの出力を予測する論理的論理的推論を利用する。
それらは、緩やかな収束、複雑な知覚タスクの学習困難、局所的なミニマへの収束など、いくつかの問題に悩まされている。
本稿では,これらの問題を改善するための簡易かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-02-21T15:51:01Z) - The Role of Foundation Models in Neuro-Symbolic Learning and Reasoning [54.56905063752427]
Neuro-Symbolic AI(NeSy)は、AIシステムの安全なデプロイを保証することを約束している。
ニューラルネットワークとシンボリックコンポーネントを順次トレーニングする既存のパイプラインは、広範なラベリングを必要とする。
新しいアーキテクチャであるNeSyGPTは、生データから象徴的特徴を抽出する視覚言語基盤モデルを微調整する。
論文 参考訳(メタデータ) (2024-02-02T20:33:14Z) - Bridging Logic and Learning: A Neural-Symbolic Approach for Enhanced
Reasoning in Neural Models (ASPER) [0.13053649021965597]
本稿では,学習推論タスクにおけるニューラルモデルの性能向上を目的としたアプローチを提案する。
これを実現するために、Answer Set Programmingソルバとドメイン固有の専門知識を統合する。
モデルは、トレーニングとテストのためにたった12のパズルを使用して、スドゥークパズルの解法を大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-12-18T19:06:00Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - Neural Knitworks: Patched Neural Implicit Representation Networks [1.0470286407954037]
画像合成を実現する自然画像の暗黙的表現学習のためのアーキテクチャであるKnitworkを提案する。
私たちの知る限りでは、画像のインペインティング、超解像化、デノイングといった合成作業に適した座標ベースのパッチの実装は、これが初めてである。
その結果, ピクセルではなくパッチを用いた自然な画像のモデリングにより, 忠実度が高い結果が得られた。
論文 参考訳(メタデータ) (2021-09-29T13:10:46Z) - Fast Training of Neural Lumigraph Representations using Meta Learning [109.92233234681319]
我々は、リアルタイムにレンダリングできる高品質な表現を素早く学習することを目的として、新しいニューラルレンダリングアプローチを開発した。
われわれのアプローチであるMetaNLR++は、ニューラル形状表現と2次元CNNに基づく画像特徴抽出、集約、再投影のユニークな組み合わせを用いてこれを実現する。
そこで本研究では,MetaNLR++が類似あるいはより優れたフォトリアリスティックなノベルビュー合成を実現し,競合する手法が要求される時間のほんの少しの時間で実現可能であることを示す。
論文 参考訳(メタデータ) (2021-06-28T18:55:50Z) - Neural Sparse Representation for Image Restoration [116.72107034624344]
スパース符号化に基づく画像復元モデルの堅牢性と効率に触発され,深部ネットワークにおけるニューロンの空間性について検討した。
本手法は,隠れたニューロンに対する空間的制約を構造的に強制する。
実験により、複数の画像復元タスクのためのディープニューラルネットワークではスパース表現が不可欠であることが示されている。
論文 参考訳(メタデータ) (2020-06-08T05:15:17Z) - Pyramid Attention Networks for Image Restoration [124.34970277136061]
自己相似性(Self-similarity)とは、画像復元アルゴリズムで広く使われる画像を指す。
近年の深層畳み込みニューラルネットワークによる画像復元手法は, 自己相似性を十分に活用していない。
画像復元のための新しいピラミッドアテンションモジュールを提案し,マルチスケール特徴ピラミッドから長距離特徴対応をキャプチャする。
論文 参考訳(メタデータ) (2020-04-28T21:12:36Z) - Efficient Neural Architecture for Text-to-Image Synthesis [6.166295570030645]
本研究では,1つのジェネレータと1つの判別器を用いた1段階の訓練により,効果的なニューラルネットワークが最先端の性能を達成することを示す。
本研究は,近年,新しいニューラルアーキテクチャの実験を行っていないテキスト・ツー・イメージ研究の新たな方向性を指摘する。
論文 参考訳(メタデータ) (2020-04-23T19:33:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。