論文の概要: A Competence-aware Curriculum for Visual Concepts Learning via Question
Answering
- arxiv url: http://arxiv.org/abs/2007.01499v2
- Date: Mon, 27 Jul 2020 21:57:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 05:39:57.783975
- Title: A Competence-aware Curriculum for Visual Concepts Learning via Question
Answering
- Title(参考訳): 質問応答による視覚概念学習のためのコンピテンス対応カリキュラム
- Authors: Qing Li, Siyuan Huang, Yining Hong, Song-Chun Zhu
- Abstract要約: 本稿では,視覚概念学習のための質問応答型カリキュラムを提案する。
視覚概念を学習するためのニューラルシンボリックな概念学習者と学習プロセスを導くための多次元項目応答理論(mIRT)モデルを設計する。
CLEVRの実験結果から,コンピテンスを意識したカリキュラムにより,提案手法は最先端のパフォーマンスを実現することが示された。
- 参考スコア(独自算出の注目度): 95.35905804211698
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans can progressively learn visual concepts from easy to hard questions.
To mimic this efficient learning ability, we propose a competence-aware
curriculum for visual concept learning in a question-answering manner.
Specifically, we design a neural-symbolic concept learner for learning the
visual concepts and a multi-dimensional Item Response Theory (mIRT) model for
guiding the learning process with an adaptive curriculum. The mIRT effectively
estimates the concept difficulty and the model competence at each learning step
from accumulated model responses. The estimated concept difficulty and model
competence are further utilized to select the most profitable training samples.
Experimental results on CLEVR show that with a competence-aware curriculum, the
proposed method achieves state-of-the-art performances with superior data
efficiency and convergence speed. Specifically, the proposed model only uses
40% of training data and converges three times faster compared with other
state-of-the-art methods.
- Abstract(参考訳): 人間は難しい質問から視覚概念を徐々に学習することができる。
この効率的な学習能力を模倣するために,視覚概念学習の能力認識カリキュラムを提案する。
具体的には、視覚概念を学習するためのニューラルシンボリックな概念学習者と、学習過程を適応的なカリキュラムで導くための多次元項目応答理論(mIRT)モデルを設計する。
mIRTは、蓄積されたモデル応答から各学習ステップにおける概念難易度とモデル能力を効果的に推定する。
推定概念難易度とモデル能力を利用して、最も収益性の高いトレーニングサンプルを選択する。
CLEVRによる実験結果から,提案手法は,データ効率と収束速度の優れた最先端性能を実現する。
具体的には、提案モデルはトレーニングデータの40%しか使用せず、他の最先端手法に比べて3倍高速に収束する。
関連論文リスト
- Curriculum Learning for Graph Neural Networks: A Multiview
Competence-based Approach [12.335698325757491]
本稿では,グラフ複雑性形式に基づく新しいアプローチを導入することで,カリキュラム学習の新しい視点を提案する。
提案手法は,グラフの難易度基準のきめ細かいスペクトルを組み込んだグラフニューラルネットワークのカリキュラム学習において,既存の研究を推し進めるものである。
論文 参考訳(メタデータ) (2023-07-17T21:33:35Z) - See, Think, Confirm: Interactive Prompting Between Vision and Language
Models for Knowledge-based Visual Reasoning [60.43585179885355]
本稿では,知識に基づく視覚推論のための新しいフレームワークであるInteractive Prompting Visual Reasoner(IPVR)を提案する。
IPVRには3つのステージがある。
我々は,知識に基づく視覚的推論データセットについて実験を行った。
論文 参考訳(メタデータ) (2023-01-12T18:59:50Z) - Collaboration of Pre-trained Models Makes Better Few-shot Learner [49.89134194181042]
少ないショット分類では、限られた訓練画像からのみ、一般化された表現を学習するために、ディープニューラルネットワークが必要である。
最近、CLIPベースの手法は、対照的な言語イメージ事前トレーニングの恩恵を受け、有望な数ショットのパフォーマンスを示している。
我々は,様々な事前学習パラダイムから様々な事前知識を取り入れた事前学習モデルのコラボレーションであるCoMoを提案する。
論文 参考訳(メタデータ) (2022-09-25T16:23:12Z) - Anti-Retroactive Interference for Lifelong Learning [65.50683752919089]
我々は脳のメタラーニングと連想機構に基づく生涯学習のパラダイムを設計する。
知識の抽出と知識の記憶という2つの側面から問題に取り組む。
提案した学習パラダイムが,異なるタスクのモデルを同じ最適に収束させることができることを理論的に分析した。
論文 参考訳(メタデータ) (2022-08-27T09:27:36Z) - RLTutor: Reinforcement Learning Based Adaptive Tutoring System by
Modeling Virtual Student with Fewer Interactions [10.34673089426247]
本稿では,学生の仮想モデルを構築し,指導戦略を最適化する枠組みを提案する。
この結果は,eラーニングシステムにおける理論的指導最適化と実践的応用のバッファとして機能する。
論文 参考訳(メタデータ) (2021-07-31T15:42:03Z) - Separating Skills and Concepts for Novel Visual Question Answering [66.46070380927372]
アウト・オブ・ディストリビューションデータへの一般化は、VQA(Visual Question Answering)モデルにおいて問題となっている。
「スキル」とは、数え方や属性認識などの視覚的なタスクであり、その疑問に言及された「概念」に適用される。
モデル内でこれらの2つの要因を暗黙的に分離するスキルと概念を学習するための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-07-19T18:55:10Z) - Dynamic Data Selection for Curriculum Learning via Ability Estimation [6.255759848576057]
難易度を学習難易度パラメータで置き換えることを提案する。
また,能力推定によるカリキュラム学習のための動的選択を提案する。
GLUE分類タスクにおいて、学習難易度および/または能力を用いたモデルは、データに基づくカリキュラム学習モデルより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-30T20:01:56Z) - Concept Learners for Few-Shot Learning [76.08585517480807]
本研究では,人間の解釈可能な概念次元に沿って学習することで,一般化能力を向上させるメタ学習手法であるCOMETを提案する。
我々は,細粒度画像分類,文書分類,セルタイプアノテーションなど,さまざまな領域からの少数ショットタスクによるモデルの評価を行った。
論文 参考訳(メタデータ) (2020-07-14T22:04:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。