論文の概要: Adaptive Interaction Modeling via Graph Operations Search
- arxiv url: http://arxiv.org/abs/2005.02113v1
- Date: Tue, 5 May 2020 13:01:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 14:17:44.932103
- Title: Adaptive Interaction Modeling via Graph Operations Search
- Title(参考訳): グラフ操作探索による適応的相互作用モデリング
- Authors: Haoxin Li, Wei-Shi Zheng, Yu Tao, Haifeng Hu, Jian-Huang Lai
- Abstract要約: 相互作用モデリングのための適応型構造を学習するために,構造設計のプロセスを自動化する。
アーキテクチャ探索フレームワークが適応的な相互作用モデリング構造を構築することを実験的に実証した。
本手法は最先端技術との競合性能を実現する。
- 参考スコア(独自算出の注目度): 109.45125932109454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interaction modeling is important for video action analysis. Recently,
several works design specific structures to model interactions in videos.
However, their structures are manually designed and non-adaptive, which require
structures design efforts and more importantly could not model interactions
adaptively. In this paper, we automate the process of structures design to
learn adaptive structures for interaction modeling. We propose to search the
network structures with differentiable architecture search mechanism, which
learns to construct adaptive structures for different videos to facilitate
adaptive interaction modeling. To this end, we first design the search space
with several basic graph operations that explicitly capture different relations
in videos. We experimentally demonstrate that our architecture search framework
learns to construct adaptive interaction modeling structures, which provides
more understanding about the relations between the structures and some
interaction characteristics, and also releases the requirement of structures
design efforts. Additionally, we show that the designed basic graph operations
in the search space are able to model different interactions in videos. The
experiments on two interaction datasets show that our method achieves
competitive performance with state-of-the-arts.
- Abstract(参考訳): インタラクションモデリングはビデオアクション分析において重要である。
近年、ビデオ内の相互作用をモデル化するための特定の構造を設計する作品がいくつかある。
しかし、それらの構造は手動で設計され、非適応的であり、構造設計の努力を必要とする。
本稿では,相互作用モデリングのための適応構造を学習するための構造設計プロセスを自動化する。
本稿では,異なるビデオに対して適応的構造を構築し,適応的相互作用モデリングを容易にするネットワーク構造を識別可能なアーキテクチャ探索機構で探索することを提案する。
この目的のために,我々はまず,ビデオの異なる関係を明示的にキャプチャするいくつかの基本的なグラフ操作で検索空間を設計する。
アーキテクチャ探索フレームワークが適応的相互作用モデリング構造の構築を学んでいることを実験的に実証し、構造といくつかの相互作用特性との関係をより理解し、構造設計の取り組みの必要性を解放する。
さらに,検索空間における基本的なグラフ操作は,ビデオ内の異なる相互作用をモデル化できることを示す。
2つの相互作用データセットを用いた実験により,本手法が最先端技術との競合性能を実現することを示す。
関連論文リスト
- Learning Correlation Structures for Vision Transformers [93.22434535223587]
構造自己注意(StructSA)と呼ばれる新しい注意機構を導入する。
我々は、畳み込みによるキー-クエリ相関の時空間構造を認識して注意マップを生成する。
これは、シーンレイアウト、オブジェクトの動き、オブジェクト間の関係など、画像やビデオのリッチな構造パターンを効果的に活用する。
論文 参考訳(メタデータ) (2024-04-05T07:13:28Z) - Learning Hierarchical Relational Representations through Relational Convolutions [2.5322020135765464]
本稿では、より複雑な関係性の特徴を捉える計算機構を備えたニューラルネットワークである「リレーショナル畳み込みネットワーク」を紹介する。
このフレームワークの重要なコンポーネントは、グラフレットフィルタを畳み込み、オブジェクトのグループ内の関係パターンをキャプチャする新しい操作である。
アーキテクチャのモチベーションと詳細、およびリレーショナル畳み込みネットワークが階層構造を持つリレーショナルタスクをモデル化するための効果的なフレームワークを提供するための一連の実験を示す。
論文 参考訳(メタデータ) (2023-10-05T01:22:50Z) - Inferring Local Structure from Pairwise Correlations [0.0]
相関関係が局所関係を回復するのに十分な情報を提供することを示す。
これは、我々のデータに高次相互作用構造が存在するにもかかわらず、成功することを証明している。
論文 参考訳(メタデータ) (2023-05-07T22:38:29Z) - Triple-level Model Inferred Collaborative Network Architecture for Video
Deraining [43.06607185181434]
我々は,協調最適化と自動探索機構を用いてネットワークアーキテクチャを推定するモデル誘導三段階最適化フレームワークを開発した。
我々のモデルは、最先端の作業よりも忠実度と時間的一貫性が著しく向上したことを示している。
論文 参考訳(メタデータ) (2021-11-08T13:09:00Z) - Dynamic Modeling of Hand-Object Interactions via Tactile Sensing [133.52375730875696]
本研究では,高分解能な触覚グローブを用いて,多種多様な物体に対して4種類のインタラクティブな動作を行う。
我々は,クロスモーダル学習フレームワーク上にモデルを構築し,視覚処理パイプラインを用いてラベルを生成し,触覚モデルを監督する。
この研究は、高密度触覚センシングによる手動物体相互作用における動的モデリングの一歩を踏み出す。
論文 参考訳(メタデータ) (2021-09-09T16:04:14Z) - Unified Graph Structured Models for Video Understanding [93.72081456202672]
リレーショナル・テンポラル関係を明示的にモデル化するメッセージパッシンググラフニューラルネットワークを提案する。
本手法は,シーン内の関連エンティティ間の関係をより効果的にモデル化できることを示す。
論文 参考訳(メタデータ) (2021-03-29T14:37:35Z) - Coordination Among Neural Modules Through a Shared Global Workspace [78.08062292790109]
認知科学において、機能的に特殊なコンポーネントが情報を共有するグローバルなワークスペースアーキテクチャが提案されている。
キャパシティ制限は、特殊化と構成性を奨励する合理的な基礎を持つことを示す。
論文 参考訳(メタデータ) (2021-03-01T18:43:48Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。