論文の概要: Live or Lie: Action-Aware Capsule Multiple Instance Learning for Risk Assessment in Live Streaming Platforms
- arxiv url: http://arxiv.org/abs/2602.03520v1
- Date: Tue, 03 Feb 2026 13:36:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.472446
- Title: Live or Lie: Action-Aware Capsule Multiple Instance Learning for Risk Assessment in Live Streaming Platforms
- Title(参考訳): Live or Lie: ライブストリーミングプラットフォームにおけるリスクアセスメントのためのマルチインスタンス学習
- Authors: Yiran Qiao, Jing Chen, Xiang Ao, Qiwei Zhong, Yang Liu, Qing He,
- Abstract要約: ライブストリーミングは、今日のインターネットの基盤となり、大規模なリアルタイムソーシャルインタラクションを可能にしている。
複数の参加者の間で、まばらで調整された悪意のある行動によって引き起こされる深刻なリスクに直面します。
本稿では,ライブストリーミングルームにおけるリスクアセスメントの先駆的研究について述べる。
本稿では,個人行動とグループレベルの協調パターンの両方をモデル化するアクション対応カプセルMILフレームワークであるAC-MILを提案する。
- 参考スコア(独自算出の注目度): 16.891954001508736
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Live streaming has become a cornerstone of today's internet, enabling massive real-time social interactions. However, it faces severe risks arising from sparse, coordinated malicious behaviors among multiple participants, which are often concealed within normal activities and challenging to detect timely and accurately. In this work, we provide a pioneering study on risk assessment in live streaming rooms, characterized by weak supervision where only room-level labels are available. We formulate the task as a Multiple Instance Learning (MIL) problem, treating each room as a bag and defining structured user-timeslot capsules as instances. These capsules represent subsequences of user actions within specific time windows, encapsulating localized behavioral patterns. Based on this formulation, we propose AC-MIL, an Action-aware Capsule MIL framework that models both individual behaviors and group-level coordination patterns. AC-MIL captures multi-granular semantics and behavioral cues through a serial and parallel architecture that jointly encodes temporal dynamics and cross-user dependencies. These signals are integrated for robust room-level risk prediction, while also offering interpretable evidence at the behavior segment level. Extensive experiments on large-scale industrial datasets from Douyin demonstrate that AC-MIL significantly outperforms MIL and sequential baselines, establishing new state-of-the-art performance in room-level risk assessment for live streaming. Moreover, AC-MIL provides capsule-level interpretability, enabling identification of risky behavior segments as actionable evidence for intervention. The project page is available at: https://qiaoyran.github.io/AC-MIL/.
- Abstract(参考訳): ライブストリーミングは、今日のインターネットの基盤となり、大規模なリアルタイムソーシャルインタラクションを可能にしている。
しかし、通常活動中に隠蔽され、時間的・正確な検出が難しい複数の参加者の間で、疎外、協調した悪意のある行動によって引き起こされる深刻なリスクに直面している。
本研究では,ライブ・ストリーミング・ルームにおけるリスクアセスメントの先駆的な研究について述べる。
タスクをマルチインスタンス学習(MIL)問題として定式化し、各部屋をバッグとして扱い、構造化されたユーザタイムスロットカプセルをインスタンスとして定義する。
これらのカプセルは、特定の時間窓内でのユーザー行動のサブシーケンスを表し、局所的な行動パターンをカプセル化している。
この定式化に基づいて、個別の動作とグループレベルの協調パターンの両方をモデル化するアクション対応カプセルMILフレームワークであるAC-MILを提案する。
AC-MILは、時間的ダイナミックスとユーザ間の依存関係を共同でエンコードするシリアルおよび並列アーキテクチャを通じて、複数の粒度のセマンティクスと振舞いのキューをキャプチャする。
これらの信号は、ロバストルームレベルのリスク予測と、行動セグメントレベルでの解釈可能な証拠を提供するために統合される。
Douyin氏の大規模産業データセットに関する大規模な実験は、AC-MILがMILとシーケンシャルベースラインを著しく上回り、ルームレベルのリスクアセスメントにおいて新しい最先端のパフォーマンスを確立することを実証している。
さらに、AC-MILはカプセルレベルの解釈可能性を提供し、リスクのある行動セグメントを介入の実行可能な証拠として識別することができる。
プロジェクトページは、https://qiaoyran.github.io/AC-MIL/.com/で公開されている。
関連論文リスト
- Deja Vu in Plots: Leveraging Cross-Session Evidence with Retrieval-Augmented LLMs for Live Streaming Risk Assessment [16.891954001508736]
ライブストリーミングはオンラインインタラクションを変革し、大規模なリアルタイムエンゲージメントを可能にした。
ライブストリーミングはまた、詐欺や不正行為の調整といった複雑なリスクに対してプラットフォームを公開している。
ライブストリーミングリスク評価のためのCS-VAR(Cross-Session Evidence-Aware Retrieval-Augmented Detector)を提案する。
論文 参考訳(メタデータ) (2026-01-22T14:55:51Z) - FAIM: Frequency-Aware Interactive Mamba for Time Series Classification [87.84511960413715]
時系列分類(TSC)は、環境モニタリング、診断、姿勢認識など、多くの実世界の応用において重要である。
本稿では,周波数対応対話型マンバモデルであるFAIMを提案する。
FAIMは既存の最先端(SOTA)手法を一貫して上回り、精度と効率のトレードオフが優れていることを示す。
論文 参考訳(メタデータ) (2025-11-26T08:36:33Z) - HyMAD: A Hybrid Multi-Activity Detection Approach for Border Surveillance and Monitoring [0.5328562411561214]
地震探査は、国境の監視と監視のための有望な解決策として浮上している。
時間-時間融合に基づく深層ニューラルネットワークHybrid Multi-Activity Detectionを提案する。
本研究では,国境監視・監視の文脈で収集した実世界のフィールド記録から構築したデータセットに対するアプローチを評価する。
論文 参考訳(メタデータ) (2025-11-18T17:37:38Z) - MA-CBP: A Criminal Behavior Prediction Framework Based on Multi-Agent Asynchronous Collaboration [3.795361290679821]
公共の場での犯罪行為は、社会保障にとってますます深刻な脅威となる。
リアルタイムビデオストリームをフレームレベルのセマンティック記述に変換するフレームワークであるMA-CBPを提案する。
結果として生じる行動決定には、事象の主題、場所、原因などの重要な要素が含まれ、潜在的な犯罪行為の早期警告を可能にする。
論文 参考訳(メタデータ) (2025-08-08T10:12:00Z) - CTR-Sink: Attention Sink for Language Models in Click-Through Rate Prediction [42.92011330807996]
$textitCTR-Sink$は、レコメンデーションシナリオに適した振る舞いレベルの注意シンクを導入した、新しいフレームワークである。
注意シンク理論にヒントを得て、注意集中シンクを構築し、外部情報を介して注意集約を動的に制御する。
論文 参考訳(メタデータ) (2025-08-05T17:30:34Z) - Offline Action-Free Learning of Ex-BMDPs by Comparing Diverse Datasets [87.62730694973696]
本稿では,エージェント間の制御可能な特徴ダイナミクスの違いを利用して表現を学習する,サンプル効率のよいアルゴリズムCRAFTを紹介する。
我々はCRAFTの性能を理論的に保証し、おもちゃの例でその実現可能性を示す。
論文 参考訳(メタデータ) (2025-03-26T22:05:57Z) - Robust Multi-View Learning via Representation Fusion of Sample-Level Attention and Alignment of Simulated Perturbation [61.64052577026623]
実世界のマルチビューデータセットは、しばしば不均一で不完全である。
本稿では,表現融合とアライメントを同時に行う新しいロバストMVL法(RML)を提案する。
我々のRMLは自己教師型であり、正規化として下流のタスクにも適用できます。
論文 参考訳(メタデータ) (2025-03-06T07:01:08Z) - Latent Exploration for Reinforcement Learning [87.42776741119653]
強化学習では、エージェントは環境を探索し、相互作用することでポリシーを学ぶ。
LATent TIme-Correlated Exploration (Lattice)を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:40:43Z) - Learning Self-Modulating Attention in Continuous Time Space with
Applications to Sequential Recommendation [102.24108167002252]
本稿では,複雑で非線形に進化する動的ユーザの嗜好をモデル化する,自己変調型注意ネットワークを提案する。
提案手法がトップNシーケンシャルなレコメンデーションタスクに与える影響を実証的に示すとともに,3つの大規模実世界のデータセットによる結果から,我々のモデルが最先端のパフォーマンスを達成できることを示す。
論文 参考訳(メタデータ) (2022-03-30T03:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。