論文の概要: Beyond Euclidean: Dual-Space Representation Learning for Weakly Supervised Video Violence Detection
- arxiv url: http://arxiv.org/abs/2409.19252v1
- Date: Sat, 28 Sep 2024 05:54:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 00:18:22.579744
- Title: Beyond Euclidean: Dual-Space Representation Learning for Weakly Supervised Video Violence Detection
- Title(参考訳): Beyond Euclidean: 弱監視ビデオビオレンス検出のためのデュアルスペース表現学習
- Authors: Jiaxu Leng, Zhanjie Wu, Mingpi Tan, Yiran Liu, Ji Gan, Haosheng Chen, Xinbo Gao,
- Abstract要約: 我々は、弱教師付きビデオビオレンス検出(VVD)のための新しいデュアルスペース表現学習法(DSRL)を開発した。
本手法は,事象の視覚的特徴を捉えるとともに,事象間の内在的関係を探究し,特徴の識別能力を高める。
- 参考スコア(独自算出の注目度): 41.37736889402566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While numerous Video Violence Detection (VVD) methods have focused on representation learning in Euclidean space, they struggle to learn sufficiently discriminative features, leading to weaknesses in recognizing normal events that are visually similar to violent events (\emph{i.e.}, ambiguous violence). In contrast, hyperbolic representation learning, renowned for its ability to model hierarchical and complex relationships between events, has the potential to amplify the discrimination between visually similar events. Inspired by these, we develop a novel Dual-Space Representation Learning (DSRL) method for weakly supervised VVD to utilize the strength of both Euclidean and hyperbolic geometries, capturing the visual features of events while also exploring the intrinsic relations between events, thereby enhancing the discriminative capacity of the features. DSRL employs a novel information aggregation strategy to progressively learn event context in hyperbolic spaces, which selects aggregation nodes through layer-sensitive hyperbolic association degrees constrained by hyperbolic Dirichlet energy. Furthermore, DSRL attempts to break the cyber-balkanization of different spaces, utilizing cross-space attention to facilitate information interactions between Euclidean and hyperbolic space to capture better discriminative features for final violence detection. Comprehensive experiments demonstrate the effectiveness of our proposed DSRL.
- Abstract(参考訳): 多くのビデオ暴力検出(VVD)法はユークリッド空間での表現学習に重点を置いているが、十分な識別的特徴の習得に苦慮しており、視覚的に暴力的な出来事と類似した正常な出来事を認識するのに弱点がある("\emph{i.}, amambiuous violence")。
対照的に、双曲表現学習は、イベント間の階層的および複雑な関係をモデル化する能力で有名であり、視覚的に類似したイベント間の識別を増幅する可能性がある。
これらに触発されて、弱教師付きVVDのための新しいDual-Space Representation Learning(DSRL)法を開発し、ユークリッドと双曲の両ジオメトリーの強度を活用し、イベントの視覚的特徴を捉えながら、イベント間の本質的な関係を探求し、特徴の識別能力を高める。
DSRLは、双曲空間における事象コンテキストを漸進的に学習するために、新しい情報集約戦略を採用している。
さらに、DSRLは異なる空間のサイバーバルカン化を破り、ユークリッド空間と双曲空間の間の情報相互作用を促進し、最終的な暴力検出のためのより良い差別的特徴を捉えようと試みている。
総合実験により提案したDSRLの有効性が実証された。
関連論文リスト
- CODEX: A Cluster-Based Method for Explainable Reinforcement Learning [0.0]
本稿では,状態-作用空間におけるRLエージェントの挙動を効果的に要約できる意味的クラスタリングを取り入れた手法を提案する。
MiniGridとStarCraft IIのゲーム環境での実験では、セマンティッククラスタは時間的およびエンティティ情報を保持する。
論文 参考訳(メタデータ) (2023-12-07T11:04:37Z) - Hyperbolic vs Euclidean Embeddings in Few-Shot Learning: Two Sides of
the Same Coin [49.12496652756007]
この結果から, 共通の双曲半径での双曲埋め込みが達成できることが示唆された。
従来のベンチマーク結果とは対照的に、ユークリッド計量を備えた固定半径エンコーダにより、より良い性能が得られることを示す。
論文 参考訳(メタデータ) (2023-09-18T14:51:46Z) - Hyperbolic Face Anti-Spoofing [21.981129022417306]
双曲空間におけるよりリッチな階層的および差別的なスプーフィングキューを学習することを提案する。
単調なFAS学習では、特徴埋め込みはポアンカーボールに投影され、双対対対数回帰層は分類のためにカスケードされる。
双曲空間における消失勾配問題を緩和するために,双曲モデルのトレーニング安定性を高めるために,新しい特徴クリッピング法を提案する。
論文 参考訳(メタデータ) (2023-08-17T17:18:21Z) - Learning Weakly Supervised Audio-Visual Violence Detection in Hyperbolic
Space [17.30264225835736]
HyperVDは、モデル識別を改善するために、双曲空間にスニペットの埋め込みを学ぶ新しいフレームワークである。
我々のフレームワークはマルチモーダル核融合のためのデトゥール核融合モジュールで構成されている。
この空間でスニペット表現を学習することで、このフレームワークは暴力的な出来事と通常の出来事のセマンティックな差異を効果的に学習する。
論文 参考訳(メタデータ) (2023-05-30T07:18:56Z) - Hyperbolic Contrastive Learning [12.170564544949308]
本稿では,双曲空間における意味的関係を学習するための新しいコントラスト学習フレームワークを提案する。
提案手法は, 自己教師付き事前学習, 教師付き分類, ベースライン法よりも頑健な精度において, より良い結果が得られることを示す。
論文 参考訳(メタデータ) (2023-02-02T20:47:45Z) - Enhancing Hyperbolic Graph Embeddings via Contrastive Learning [7.901082408569372]
複数の双曲空間を通してノード表現を学習する新しいハイパーボリックグラフコントラスト学習(HGCL)フレームワークを提案する。
複数の実世界のデータセットに対する実験結果は、提案したHGCLの優位性を示している。
論文 参考訳(メタデータ) (2022-01-21T06:10:05Z) - Dual Contrastive Learning for General Face Forgery Detection [64.41970626226221]
本稿では,正と負のペアデータを構成するDCL (Dual Contrastive Learning) という新しい顔偽造検出フレームワークを提案する。
本研究は, 事例内コントラスト学習(Intra-ICL)において, 偽造顔における局所的内容の不整合に焦点をあてる。
論文 参考訳(メタデータ) (2021-12-27T05:44:40Z) - Deep Clustering by Semantic Contrastive Learning [67.28140787010447]
Semantic Contrastive Learning (SCL) と呼ばれる新しい変種を紹介します。
従来のコントラスト学習とディープクラスタリングの両方の特徴を探求する。
コントラスト学習と深層クラスタリングの強みを統一的なアプローチで増幅することができる。
論文 参考訳(メタデータ) (2021-03-03T20:20:48Z) - Heterogeneous Contrastive Learning: Encoding Spatial Information for
Compact Visual Representations [183.03278932562438]
本稿では,エンコーディング段階に空間情報を加えることで,対照的な目的と強いデータ拡張操作の間の学習の不整合を緩和する効果的な手法を提案する。
提案手法は,視覚表現の効率を向上し,自己指導型視覚表現学習の今後の研究を刺激する鍵となるメッセージを提供する。
論文 参考訳(メタデータ) (2020-11-19T16:26:25Z) - Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person
Re-Identification [208.1227090864602]
Visible-infrared person re-identification (VI-ReID) は、歩行者検索の課題である。
既存のVI-ReID法は、識別可能性に制限があり、ノイズの多い画像に対して弱いロバスト性を持つグローバル表現を学習する傾向にある。
そこで我々は,VI-ReIDのための動的二段階集合(DDAG)学習法を提案する。
論文 参考訳(メタデータ) (2020-07-18T03:08:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。