論文の概要: Zero-shot Compositional Action Recognition with Neural Logic Constraints
- arxiv url: http://arxiv.org/abs/2508.02320v1
- Date: Mon, 04 Aug 2025 11:40:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.313955
- Title: Zero-shot Compositional Action Recognition with Neural Logic Constraints
- Title(参考訳): ニューラル論理制約を用いたゼロショット合成行動認識
- Authors: Gefan Ye, Lin Li, Kexin Li, Jun Xiao, Long chen,
- Abstract要約: ZS-CARは、訓練中に学習した動詞とオブジェクトプリミティブの知識を活用することで、ビデオ中の未確認動詞の合成を識別することを目的としている。
構成的学習の進展にもかかわらず,(1)構成的構造的制約の欠如,(2)意味的階層的制約の無視,意味的曖昧さと訓練過程の障害という2つの重要な課題が続いている。
我々は、人間のような象徴的推論が、構成的および階層的構造的抽象を明示的にモデル化することによって、これらの課題に対する原則的な解決策を提供すると主張する。
- 参考スコア(独自算出の注目度): 15.451848952659343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-shot compositional action recognition (ZS-CAR) aims to identify unseen verb-object compositions in the videos by exploiting the learned knowledge of verb and object primitives during training. Despite compositional learning's progress in ZS-CAR, two critical challenges persist: 1) Missing compositional structure constraint, leading to spurious correlations between primitives; 2) Neglecting semantic hierarchy constraint, leading to semantic ambiguity and impairing the training process. In this paper, we argue that human-like symbolic reasoning offers a principled solution to these challenges by explicitly modeling compositional and hierarchical structured abstraction. To this end, we propose a logic-driven ZS-CAR framework LogicCAR that integrates dual symbolic constraints: Explicit Compositional Logic and Hierarchical Primitive Logic. Specifically, the former models the restrictions within the compositions, enhancing the compositional reasoning ability of our model. The latter investigates the semantical dependencies among different primitives, empowering the models with fine-to-coarse reasoning capacity. By formalizing these constraints in first-order logic and embedding them into neural network architectures, LogicCAR systematically bridges the gap between symbolic abstraction and existing models. Extensive experiments on the Sth-com dataset demonstrate that our LogicCAR outperforms existing baseline methods, proving the effectiveness of our logic-driven constraints.
- Abstract(参考訳): Zero-shot compositional action recognition (ZS-CAR) は、訓練中に学習した動詞とオブジェクトのプリミティブの知識を活用することで、ビデオ中の未確認動詞の合成を識別することを目的としている。
ZS-CARにおける作曲学習の進歩にもかかわらず、2つの重要な課題が続いている。
1) 構成構造制約の欠如, プリミティブ間の急激な相関
2)意味的階層的制約を無視し,意味的曖昧さと訓練プロセスの障害につながる。
本稿では,構成的および階層的構造的抽象化を明示的にモデル化することで,人間のような記号的推論がこれらの課題に原則的解決をもたらすことを論じる。
この目的のために,論理駆動型ZS-CARフレームワークLogicCARを提案する。
具体的には, 前者は構成の制約をモデル化し, モデルの構成的推論能力を向上させる。
後者は、異なるプリミティブ間の意味的依存関係を調査し、詳細な推論能力を持つモデルに権限を与える。
これらの制約を一階述語論理で形式化し、ニューラルネットワークアーキテクチャに組み込むことで、LogicCARは象徴的な抽象化と既存のモデルのギャップを体系的に埋める。
Sth-comデータセットの大規模な実験により、LogicCARは既存のベースラインメソッドよりも優れており、ロジック駆動制約の有効性が証明されている。
関連論文リスト
- Improving Chain-of-Thought Reasoning via Quasi-Symbolic Abstractions [45.950841507164064]
CoT(Chain-of-Though)は、大規模言語モデルにおける推論のための一般的な戦略である。
準シンボリックな説明を通じて,LLMを高レベルの抽象化で動作させる,CoTのバリエーションであるQuaSARを提案する。
実験の結果,準記号的抽象化はCoT法を最大8%精度で改善できることがわかった。
論文 参考訳(メタデータ) (2025-02-18T07:58:48Z) - Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning [89.89857766491475]
カリキュラムベースの論理認識型チューニングフレームワークであるLACTを提案する。
具体的には、任意の一階論理クエリをバイナリツリー分解によって拡張する。
広く使われているデータセットに対する実験では、LATは高度な手法よりも大幅に改善(平均+5.5% MRRスコア)し、新しい最先端技術を実現している。
論文 参考訳(メタデータ) (2024-05-02T18:12:08Z) - Learning with Logical Constraints but without Shortcut Satisfaction [23.219364371311084]
論理的制約による学習のための新しいフレームワークを提案する。
具体的には、論理接続のための双対変数を導入することで、ショートカット満足度問題に対処する。
本稿では,符号化された論理制約を分布損失として表現する変分フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-01T07:17:20Z) - LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and
Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。
ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。
これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文 参考訳(メタデータ) (2023-09-24T05:43:19Z) - Modeling Hierarchical Reasoning Chains by Linking Discourse Units and
Key Phrases for Reading Comprehension [80.99865844249106]
本稿では,論理的推論の基盤として,対話レベルと単語レベルの両方の文脈を扱う総合グラフネットワーク(HGN)を提案する。
具体的には、ノードレベルの関係とタイプレベルの関係は、推論過程におけるブリッジと解釈できるが、階層的な相互作用機構によってモデル化される。
論文 参考訳(メタデータ) (2023-06-21T07:34:27Z) - Query Structure Modeling for Inductive Logical Reasoning Over Knowledge
Graphs [67.043747188954]
KGに対する帰納的論理的推論のための構造モデル付きテキスト符号化フレームワークを提案する。
線形化されたクエリ構造とエンティティを、事前訓練された言語モデルを使ってエンコードして、回答を見つける。
2つの帰納的論理推論データセットと3つの帰納的推論データセットについて実験を行った。
論文 参考訳(メタデータ) (2023-05-23T01:25:29Z) - Do Deep Neural Networks Capture Compositionality in Arithmetic
Reasoning? [31.692400722222278]
算術的シンボリック推論において、構成性に関するスキルツリーを導入し、階層的な複雑性レベルと3つの構成性次元(体系性、生産性、置換性)を定義する。
実験の結果, 3種類の構成のうち, モデルが最も体系性に苦慮し, 比較的単純な構成でも性能が劣っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-02-15T18:59:04Z) - Discourse-Aware Graph Networks for Textual Logical Reasoning [142.0097357999134]
パッセージレベルの論理関係は命題単位間の係り合いまたは矛盾を表す(例、結論文)
論理的推論QAを解くための論理構造制約モデリングを提案し、談話対応グラフネットワーク(DAGN)を導入する。
ネットワークはまず、インラインの談話接続とジェネリック論理理論を利用した論理グラフを構築し、その後、エッジ推論機構を用いて論理関係を進化させ、グラフ機能を更新することで論理表現を学習する。
論文 参考訳(メタデータ) (2022-07-04T14:38:49Z) - MERIt: Meta-Path Guided Contrastive Learning for Logical Reasoning [63.50909998372667]
テキストの論理的ReasonIngに対して,Metaパスを用いたコントラスト学習手法であるMERItを提案する。
2つの新しい戦略が我々の手法の必須要素である。
論文 参考訳(メタデータ) (2022-03-01T11:13:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。