論文の概要: Unsupervised Audio-Visual Subspace Alignment for High-Stakes Deception
Detection
- arxiv url: http://arxiv.org/abs/2102.03673v1
- Date: Sat, 6 Feb 2021 21:53:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:48:52.750365
- Title: Unsupervised Audio-Visual Subspace Alignment for High-Stakes Deception
Detection
- Title(参考訳): 教師なしオーディオビジュアルサブスペースアライメントによる高ステーク検出
- Authors: Leena Mathur and Maja J Matari\'c
- Abstract要約: 高い状況下で詐欺を検知する自動システムは、医療、社会労働、法的領域における社会的幸福を高めることができる。
ビデオにおける高い盗難を検出する既存のモデルが監視されているが、ラベル付きデータセットを使用してモデルをトレーニングすることは、ほとんどの現実世界のアプリケーションで収集されることは滅多にない。
本稿では,ハイテイクラベルを使わずに,実世界のハイテイクな虚偽を検知する,最初のマルチモーダルな非教師ありトランスファー学習手法を提案する。
- 参考スコア(独自算出の注目度): 3.04585143845864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated systems that detect deception in high-stakes situations can enhance
societal well-being across medical, social work, and legal domains. Existing
models for detecting high-stakes deception in videos have been supervised, but
labeled datasets to train models can rarely be collected for most real-world
applications. To address this problem, we propose the first multimodal
unsupervised transfer learning approach that detects real-world, high-stakes
deception in videos without using high-stakes labels. Our subspace-alignment
(SA) approach adapts audio-visual representations of deception in
lab-controlled low-stakes scenarios to detect deception in real-world,
high-stakes situations. Our best unsupervised SA models outperform models
without SA, outperform human ability, and perform comparably to a number of
existing supervised models. Our research demonstrates the potential for
introducing subspace-based transfer learning to model high-stakes deception and
other social behaviors in real-world contexts with a scarcity of labeled
behavioral data.
- Abstract(参考訳): ハイステークな状況で偽装を検出する自動システムは、医療、ソーシャルワーク、法的なドメイン間の社会的な幸福感を高めることができる。
ビデオ中のハイステイク・デセプションを検出する既存のモデルは監視されているが、モデルトレーニング用のラベル付きデータセットは、ほとんどの実世界のアプリケーションで収集されることはまれである。
そこで,本研究では,高ステークラベルを使わずに,映像の現実世界,高ステーク誤認を検出する,最初のマルチモーダル非監視転送学習手法を提案する。
当社のサブスペースアライメント(SA)アプローチは、ラボ制御の低ステークシナリオにおける偽装のオーディオビジュアル表現を適応させ、現実のハイステーク状況における偽装を検出する。
当社の最高の教師なしSAモデルは、SAなしでモデルを上回り、人間の能力を上回り、既存の監督モデルに匹敵するパフォーマンスを発揮します。
本研究は,ラベル付き行動データに乏しい現実の文脈において,ハイステイク・デセプションや他の社会的行動のモデル化にサブスペースに基づくトランスファー・ラーニングを導入する可能性を示す。
関連論文リスト
- Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - Generalizable Implicit Neural Representation As a Universal Spatiotemporal Traffic Data Learner [46.866240648471894]
時空間交通データ(STTD)は、マルチスケール交通システムの複雑な動的挙動を測定する。
本稿では,STTDを暗黙的ニューラル表現としてパラメータ化することで,STTD学習問題に対処する新しいパラダイムを提案する。
実世界のシナリオにおける広範な実験を通じて,その有効性を検証し,廊下からネットワークスケールへの応用を示す。
論文 参考訳(メタデータ) (2024-06-13T02:03:22Z) - Video Anomaly Detection using GAN [0.0]
この論文は、このユースケースに対する解決策を提供することを目的としており、監視システム記録の異常な活動に目を通すために人的資源が不要になるようにする。
我々は,新しいGANに基づく異常検出モデルを開発した。
論文 参考訳(メタデータ) (2023-11-23T16:41:30Z) - Visual Affordance Prediction for Guiding Robot Exploration [56.17795036091848]
我々は,ロボット探索を導くための視覚能力の学習手法を開発した。
VQ-VAEの潜伏埋め込み空間における条件分布の学習にはTransformerベースのモデルを用いる。
本稿では,ロボット操作における視覚的目標条件付きポリシー学習において,目標サンプリング分布として機能することで探索を導くために,トレーニングされた余裕モデルをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2023-05-28T17:53:09Z) - Model Monitoring and Robustness of In-Use Machine Learning Models:
Quantifying Data Distribution Shifts Using Population Stability Index [2.578242050187029]
我々は、自律運転に関連するコンピュータビジョンの例に注目し、画像にノイズを加えることによって発生するシフトを検出することを目的としている。
人口安定指数 (PSI) を, シフトの有無, および実験結果の指標として用いた。
論文 参考訳(メタデータ) (2023-02-01T22:06:31Z) - Interpretable Self-Aware Neural Networks for Robust Trajectory
Prediction [50.79827516897913]
本稿では,意味概念間で不確実性を分散する軌道予測のための解釈可能なパラダイムを提案する。
実世界の自動運転データに対する我々のアプローチを検証し、最先端のベースラインよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-16T06:28:20Z) - ProcTHOR: Large-Scale Embodied AI Using Procedural Generation [55.485985317538194]
ProcTHORは、Embodied AI環境の手続き的生成のためのフレームワークである。
ナビゲーション、アレンジメント、アーム操作のための6つの具体化されたAIベンチマークに対して、最先端の結果を実証する。
論文 参考訳(メタデータ) (2022-06-14T17:09:35Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Affect-Aware Deep Belief Network Representations for Multimodal
Unsupervised Deception Detection [3.04585143845864]
ラベルを必要とせず、ビデオの現実世界、高い盗難を検出するための教師なしのアプローチ。
本稿では,感情を意識しないDeep Belief Networks (DBN) の新たなアプローチを提案する。
また、DBNモデルを訓練する機能として顔の感情を使用するだけでなく、音声・視覚表現の整列器として顔の感情を利用するDBN訓練手順も導入する。
論文 参考訳(メタデータ) (2021-08-17T22:07:26Z) - Multi-Modal Anomaly Detection for Unstructured and Uncertain
Environments [5.677685109155077]
現代のロボットは、最小限の人間の監督で異常や故障を検出して回復する能力を必要とします。
本稿では,非構造的かつ不確実な環境での障害識別のための教師付き変分オートエンコーダ(SVAE)を提案する。
実地ロボットデータを用いた実験では,ベースライン法よりも障害同定性能が優れており,解釈可能な表現を学習できる。
論文 参考訳(メタデータ) (2020-12-15T21:59:58Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。