論文の概要: Appearance-Invariant Detection of Suggestive Motion via Laban Movement Descriptors on SMPL Skeletons
- arxiv url: http://arxiv.org/abs/2605.24488v1
- Date: Sat, 23 May 2026 09:22:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.082302
- Title: Appearance-Invariant Detection of Suggestive Motion via Laban Movement Descriptors on SMPL Skeletons
- Title(参考訳): SMPL骨格上のラベル移動記述子による示唆運動の出現-不変検出
- Authors: Jaehoon Ahn, Jeonghan Kong, Moon-Ryul Jung,
- Abstract要約: SMPL骨格軌跡からの示唆的および明示的な移動を検出する動きのみの分類パイプラインを提案する。
20,514の運動断片では、110 LMAを超えるロジスティック回帰は57.3%の4方向精度(2.3倍の確率)、72.1%の3方向、78.7%のバイナリSFW/NSFWが特徴である。
分類を駆動する特徴はひとつもなく、四層構造が真に異なる運動様式を反映していることを示唆している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Content moderation in online multiplayer 3D virtual environments has recently been relegated to automated, AI-based pipelines. However, the field has mainly been involved in detection of illicit content in images, video, and audio, leaving blind spots in detection techniques for suggestive motion. We present a motion-only classification pipeline that detects suggestive and explicit movement from SMPL skeleton trajectories using Laban Movement Analysis (LMA) descriptors. On 20,514 motion fragments (17+ hours) spanning four ordinal tiers -- everyday, artistic, suggestive, explicit -- logistic regression over 110 LMA features achieves 57.3% four-way accuracy (2.3x chance), 72.1% three-way, and 78.7% binary SFW/NSFW. Confusion concentrates on adjacent tiers, confirming that classification errors are concentrated between adjacent tiers over non-adjacent ones. Moreover, different movement qualities dominate at each level of the taxonomy -- no single feature drives the classification, suggesting that the four-tier structure reflects genuinely distinct motion regimes.
- Abstract(参考訳): オンラインマルチプレイヤー3D仮想環境におけるコンテンツモデレーションは、最近、自動化されたAIベースのパイプラインに還元された。
しかし、この分野は画像、ビデオ、音声の不正な内容の検出に主に関わっており、提案運動の検出技術に盲点を残している。
本稿では,ラベル移動解析(LMA)記述子を用いて,SMPL骨格軌道からの示唆的および明示的な動きを検出する動きのみの分類パイプラインを提案する。
毎日、芸術的、示唆的、明示的な、110のLMA特徴に対するロジスティック回帰は、20,514の運動断片(17時間以上)で、57.3%の4方向精度(2.3倍の確率)、72.1%の3方向、78.7%の2進SFW/NSFWを達成している。
融合は隣接層に集中し、非隣接層よりも隣接層の間で分類誤差が集中していることを確認する。
さらに、分類のレベルごとに異なる運動特性が支配されており、単一の特徴が分類を駆動するわけではなく、4つの階層構造が真に異なる運動レジームを反映していることが示唆されている。
関連論文リスト
- Hierarchical Flow Decomposition for Turning Movement Prediction at Signalized Intersections [4.885966337065846]
本研究では,階層型ディープラーニングフレームワークであるHFD-TMを提案する。
旋回運動を初めて予測し、その予測を個々の旋回ストリームに拡張することで、旋回運動を予測する。
テネシー州ナッシュビルの6つの交差点回廊から15分間隔のLiDARデータを6ヵ月間評価し、HFD-TMは1インターバルあたり平均2.49台の絶対誤差を達成している。
論文 参考訳(メタデータ) (2026-04-10T14:03:29Z) - COVTrack++: Learning Open-Vocabulary Multi-Object Tracking from Continuous Videos via a Synergistic Paradigm [59.26203051651017]
C-TAOはOpen-Vocabulary Multi-Object Tracking (OVMOT)のための最初の連続アノテーション付きトレーニングセットである
フレームワークボトルネックに対するCOVTrack++は,3つのモジュールによる検出とアソシエーションの双方向相互機構を実現するための相乗的フレームワークである。
TAOの実験では、新しいTAAは検証とテストセットで35.4%、30.5%に達し、新しいAssocAは4.8%、新しいLocAは5.8%向上した。
論文 参考訳(メタデータ) (2026-03-25T07:20:27Z) - Inst4DGS: Instance-Decomposed 4D Gaussian Splatting with Multi-Video Label Permutation Learning [52.867634524554795]
Inst4DGS (Inst4DGS) は4DGS (4D Gaussian Splatting) で、ガウス単位の長い軌道を持つ。
ビデオごとのラベル置換ラテントを導入し、異なるSinkhorn層を通してビデオ間の一致を学習する。
この明示的なラベルアライメントは、シャープな決定境界と時間的に安定したアイデンティティをアイデンティティドリフトなしで生成する。
論文 参考訳(メタデータ) (2026-03-19T01:49:20Z) - Facial Movement Dynamics Reveal Workload During Complex Multitasking [2.613650913343188]
リアルタイム認知作業負荷モニタリングは、安全クリティカルな環境において不可欠である。
われわれは、標準的なウェブカメラの顔の動きのダイナミクスが低コストな代替手段になるかどうかを検証した。
論文 参考訳(メタデータ) (2026-03-18T14:28:16Z) - 4D Synchronized Fields: Motion-Language Gaussian Splatting for Temporal Scene Understanding [2.2872162489048966]
現在の4D表現は、幾何学、運動、意味を分離する。
本研究では、4Dシンクロナイズド・フィールズを提案する。
HyperNeRFでは、4Dシンクロナイズド・フィールズが28.52dBのPSNRを達成している。
論文 参考訳(メタデータ) (2026-03-15T09:32:58Z) - MI-DETR: A Strong Baseline for Moving Infrared Small Target Detection with Bio-Inspired Motion Integration [63.87179575890912]
我々は、赤外線小ターゲット検出のためのバイオインスパイアされたデュアルパス検出装置であるモーション統合DETR(MI-DETR)を提案する。
まず、網膜にインスパイアされたセルオートマトン(RCA)は、生フレーム配列を外観画像と同じピクセルグリッド上に定義されたモーションマップに変換する。
第二に、PMI(Parvocellular-Magnocellular Interconnection)ブロックは2つの経路間の双方向の特徴的相互作用を促進する。
論文 参考訳(メタデータ) (2026-03-05T11:39:31Z) - Semantic-Guided 3D Gaussian Splatting for Transient Object Removal [0.39287497907611874]
視覚言語モデルを用いたカテゴリー認識過渡的除去のためのセマンティックフィルタリングフレームワークを提案した。
RobustNeRFベンチマークの実験では、バニラ3DGSよりも復元品質が一貫した改善が見られた。
論文 参考訳(メタデータ) (2026-02-17T11:44:16Z) - Lang2Motion: Bridging Language and Motion through Joint Embedding Spaces [6.358055069130984]
Lang2Motionは、ポイントトラッキングを通じて現実世界のビデオから抽出された動きを用いて、任意のオブジェクトに対する明示的な軌跡を生成する。
Lang2Motionはスタイル転送、セマンティック編集、CLIP対応の軌道表現による潜在空間編集をサポートする。
論文 参考訳(メタデータ) (2025-12-11T13:14:18Z) - Exploring Optical-Flow-Guided Motion and Detection-Based Appearance for
Temporal Sentence Grounding [61.57847727651068]
テンポラルな文グラウンドディングは、与えられた文クエリに従って、意図しないビデオのターゲットセグメントをセマンティックにローカライズすることを目的としている。
これまでのほとんどの研究は、ビデオ全体のフレーム全体のフレームレベルの特徴を学習することに集中しており、それらをテキスト情報と直接一致させる。
我々は,光フロー誘導型モーションアウェア,検出ベース外観アウェア,3D認識オブジェクトレベル機能を備えた,動き誘導型3Dセマンティック推論ネットワーク(MA3SRN)を提案する。
論文 参考訳(メタデータ) (2022-03-06T13:57:09Z) - Unsupervised Motion Representation Learning with Capsule Autoencoders [54.81628825371412]
Motion Capsule Autoencoder (MCAE) は、2レベル階層のモーションをモデル化する。
MCAEは、新しいTrajectory20モーションデータセットと、様々な現実世界の骨格に基づく人間のアクションデータセットで評価されている。
論文 参考訳(メタデータ) (2021-10-01T16:52:03Z) - Learning to Segment Rigid Motions from Two Frames [72.14906744113125]
本研究では, 運動場から独立物体の動きを復元する幾何学的解析により, モジュラーネットワークを提案する。
2つの連続フレームを入力とし、背景のセグメンテーションマスクと複数の剛体移動オブジェクトを予測し、3次元の剛体変換によってパラメータ化する。
本手法はkittiおよびsintelにおける剛体運動セグメンテーションの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-11T04:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。