論文の概要: Few-Shot Learning of Visual Compositional Concepts through Probabilistic Schema Induction
- arxiv url: http://arxiv.org/abs/2505.09859v1
- Date: Wed, 14 May 2025 23:43:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.13951
- Title: Few-Shot Learning of Visual Compositional Concepts through Probabilistic Schema Induction
- Title(参考訳): 確率的スキーマ誘導による視覚構成概念のFew-Shot学習
- Authors: Andrew Jun Lee, Taylor Webb, Trevor Bihl, Keith Holyoak, Hongjing Lu,
- Abstract要約: 確率的帰納法 (PSI) は、深層学習を用いて構造化表現のアナログマッピングを行うプロトタイプモデルである。
PSIは人間的な学習性能を生み出し、2つの制御を上回ります。
- 参考スコア(独自算出の注目度): 2.411720129813123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ability to learn new visual concepts from limited examples is a hallmark of human cognition. While traditional category learning models represent each example as an unstructured feature vector, compositional concept learning is thought to depend on (1) structured representations of examples (e.g., directed graphs consisting of objects and their relations) and (2) the identification of shared relational structure across examples through analogical mapping. Here, we introduce Probabilistic Schema Induction (PSI), a prototype model that employs deep learning to perform analogical mapping over structured representations of only a handful of examples, forming a compositional concept called a schema. In doing so, PSI relies on a novel conception of similarity that weighs object-level similarity and relational similarity, as well as a mechanism for amplifying relations relevant to classification, analogous to selective attention parameters in traditional models. We show that PSI produces human-like learning performance and outperforms two controls: a prototype model that uses unstructured feature vectors extracted from a deep learning model, and a variant of PSI with weaker structured representations. Notably, we find that PSI's human-like performance is driven by an adaptive strategy that increases relational similarity over object-level similarity and upweights the contribution of relations that distinguish classes. These findings suggest that structured representations and analogical mapping are critical to modeling rapid human-like learning of compositional visual concepts, and demonstrate how deep learning can be leveraged to create psychological models.
- Abstract(参考訳): 限られた例から新しい視覚概念を学ぶ能力は、人間の認知の目印である。
従来のカテゴリー学習モデルは各例を非構造的特徴ベクトルとして表現するが、構成的概念学習は(1)例の構造化された表現(例:オブジェクトとその関係からなる有向グラフ)と(2)類似写像による例間の共有関係構造の同定に依存していると考えられる。
本稿では,確率的スキーマ誘導(PSI)について紹介する。このモデルでは,一握りの例の構造化表現に対する類似写像を深層学習を用いて実現し,スキーマと呼ばれる構成概念を形成する。
PSIは、オブジェクトレベルの類似性と関係性の類似性を重み付けする新しい類似性の概念と、従来のモデルにおける選択的な注意パラメータに類似した分類に関連する関係を増幅するメカニズムに依存している。
深層学習モデルから抽出された非構造化特徴ベクトルを用いたプロトタイプモデルと、より弱い構造化表現を持つPSIの変種である。
特に、PSIの人間的なパフォーマンスは、オブジェクトレベルの類似性よりも関係性の類似性を高め、クラスを区別する関係の寄与をアップウェイトする適応戦略によって駆動される。
これらの結果は、構造化表現とアナログマッピングが、構成的視覚概念の素早い人間の様の学習をモデル化し、深層学習をどのように活用して心理的モデルを作成するかを示すために重要であることを示唆している。
関連論文リスト
- The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a Reasoning Model will Think [81.38614558541772]
本稿では,モデル推論の分析とステアリングのためのフレームワークであるCoT Encyclopediaを紹介する。
本手法はモデル生成CoTから多種多様な推論基準を自動的に抽出する。
このフレームワークは既存の手法よりも解釈可能で包括的分析が可能であることを示す。
論文 参考訳(メタデータ) (2025-05-15T11:31:02Z) - Towards Compositional Interpretability for XAI [3.3768167170511587]
本稿では,カテゴリ理論に基づくAIモデルとその解釈可能性の定義手法を提案する。
我々は、幅広いAIモデルを構成モデルと比較する。
標準の'本質的に解釈可能な'モデルを作るものは、最も明確に図式化されます。
論文 参考訳(メタデータ) (2024-06-25T14:27:03Z) - Learning Discrete Concepts in Latent Hierarchical Models [73.01229236386148]
自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。
我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。
我々は、理論的な主張を合成データ実験で裏付ける。
論文 参考訳(メタデータ) (2024-06-01T18:01:03Z) - A Recursive Bateson-Inspired Model for the Generation of Semantic Formal
Concepts from Spatial Sensory Data [77.34726150561087]
本稿では,複雑な感覚データから階層構造を生成するための記号のみの手法を提案する。
このアプローチは、概念や概念の創始の鍵としてのバテソンの差異の概念に基づいている。
このモデルは、トレーニングなしでかなりリッチだが人間に読まれる概念表現を生成することができる。
論文 参考訳(メタデータ) (2023-07-16T15:59:13Z) - Probabilistic Analogical Mapping with Semantic Relation Networks [2.084078990567849]
本稿では,意味関係ネットワークに基づくアナログマッピングの新しい計算モデルを提案する。
モデルが大人と子供の両方の類似写像を含む現象の広い範囲を占めていることを示します。
論文 参考訳(メタデータ) (2021-03-30T22:14:13Z) - Few-shot Visual Reasoning with Meta-analogical Contrastive Learning [141.2562447971]
本稿では,類似推論に頼って,数ショット(または低ショット)の視覚推論問題を解くことを提案する。
両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
論文 参考訳(メタデータ) (2020-07-23T14:00:34Z) - Building and Interpreting Deep Similarity Models [0.0]
そこで本稿では,入力機能の観点から説明することで類似性を解釈する手法を提案する。
我々は,2組の入力特徴に対して類似度スコアを系統的に分解する,スケーラブルで理論的に確立された手法であるBiLRPを開発した。
論文 参考訳(メタデータ) (2020-03-11T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。