論文の概要: Personality Analysis from Online Short Video Platforms with Multi-domain Adaptation
- arxiv url: http://arxiv.org/abs/2411.00813v1
- Date: Sat, 26 Oct 2024 03:29:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 12:02:12.457705
- Title: Personality Analysis from Online Short Video Platforms with Multi-domain Adaptation
- Title(参考訳): マルチドメイン適応型オンラインショートビデオプラットフォームからのパーソナリティ分析
- Authors: Sixu An, Xiangguo Sun, Yicong Li, Yu Yang, Guandong Xu,
- Abstract要約: オンラインショートビデオのパーソナリティ分析は、パーソナライズされたレコメンデーションシステム、感情分析、人間とコンピュータのインタラクションに応用されているため、注目を集めている。
ビッグファイブ・パーソナリティ・フレームワークに基づくアンケートのような従来の評価手法は、自己報告バイアスによって制限されており、大規模な分析やリアルタイム分析では実用的ではない。
マルチモーダル・パーソナリティ分析フレームワークを提案し,複数のモーダルから特徴を同期・統合することで課題に対処する。
- 参考スコア(独自算出の注目度): 16.555668668581237
- License:
- Abstract: Personality analysis from online short videos has gained prominence due to its applications in personalized recommendation systems, sentiment analysis, and human-computer interaction. Traditional assessment methods, such as questionnaires based on the Big Five Personality Framework, are limited by self-report biases and are impractical for large-scale or real-time analysis. Leveraging the rich, multi-modal data present in short videos offers a promising alternative for more accurate personality inference. However, integrating these diverse and asynchronous modalities poses significant challenges, particularly in aligning time-varying data and ensuring models generalize well to new domains with limited labeled data. In this paper, we propose a novel multi-modal personality analysis framework that addresses these challenges by synchronizing and integrating features from multiple modalities and enhancing model generalization through domain adaptation. We introduce a timestamp-based modality alignment mechanism that synchronizes data based on spoken word timestamps, ensuring accurate correspondence across modalities and facilitating effective feature integration. To capture temporal dependencies and inter-modal interactions, we employ Bidirectional Long Short-Term Memory networks and self-attention mechanisms, allowing the model to focus on the most informative features for personality prediction. Furthermore, we develop a gradient-based domain adaptation method that transfers knowledge from multiple source domains to improve performance in target domains with scarce labeled data. Extensive experiments on real-world datasets demonstrate that our framework significantly outperforms existing methods in personality prediction tasks, highlighting its effectiveness in capturing complex behavioral cues and robustness in adapting to new domains.
- Abstract(参考訳): オンラインショートビデオのパーソナリティ分析は、パーソナライズされたレコメンデーションシステム、感情分析、人間とコンピュータのインタラクションに応用されているため、注目を集めている。
ビッグファイブ・パーソナリティ・フレームワークに基づくアンケートのような従来の評価手法は、自己報告バイアスによって制限されており、大規模な分析やリアルタイム分析では実用的ではない。
ショートビデオに表示されるリッチでマルチモーダルなデータを活用することは、より正確なパーソナリティ推論のための有望な代替手段となる。
しかし、これらの多様で非同期なモダリティを統合することは、特に時間変化のあるデータの整列と、ラベル付きデータに制限のある新しいドメインへのモデルの一般化を確実にする上で、大きな課題となる。
本稿では,複数のモダリティの特徴を同期・統合し,ドメイン適応によるモデル一般化を強化することで,これらの課題に対処する新しいマルチモーダルパーソナリティ分析フレームワークを提案する。
音声単語のタイムスタンプに基づいてデータを同期するタイムスタンプに基づくモーダルアライメント機構を導入し,モダリティ間の正確な対応を確保するとともに,効果的な機能統合を実現する。
時間的依存関係とモーダル間相互作用を捉えるために、双方向長短期記憶ネットワークと自己注意機構を用い、モデルがパーソナリティ予測の最も有意義な特徴にフォーカスできるようにする。
さらに、複数のソースドメインから知識を伝達し、ラベル付きデータが少ないターゲットドメインの性能を向上させる勾配に基づくドメイン適応手法を開発した。
実世界のデータセットに対する大規模な実験により、我々のフレームワークはパーソナリティ予測タスクにおける既存の手法を著しく上回り、複雑な振る舞いの手がかりを捉え、新しいドメインに適応する堅牢性を明らかにする。
関連論文リスト
- MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Reprogramming Foundational Large Language Models(LLMs) for Enterprise Adoption for Spatio-Temporal Forecasting Applications: Unveiling a New Era in Copilot-Guided Cross-Modal Time Series Representation Learning [0.0]
パティオ時間予測は、輸送システム、物流、サプライチェーン管理など、様々な分野において重要な役割を担っている。
本稿では,オープンソースの大規模・小規模言語モデル(LLM,LM)と従来の予測手法を組み合わせたハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2024-08-26T16:11:53Z) - DeepInteraction++: Multi-Modality Interaction for Autonomous Driving [80.8837864849534]
我々は,モダリティごとの個別表現を学習し,維持することのできる,新しいモダリティインタラクション戦略を導入する。
DeepInteraction++はマルチモーダルなインタラクション・フレームワークであり、マルチモーダルな表現型インタラクション・エンコーダとマルチモーダルな予測型インタラクション・デコーダを特徴とする。
実験では,3次元物体検出とエンドツーエンドの自律走行の両方において,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-09T14:04:21Z) - Combating Missing Modalities in Egocentric Videos at Test Time [92.38662956154256]
現実のアプリケーションは、プライバシの懸念、効率性の必要性、ハードウェアの問題により、不完全なモダリティを伴う問題に直面することが多い。
再トレーニングを必要とせずに,テスト時にこの問題に対処する新しい手法を提案する。
MiDlは、欠落したモダリティをテスト時にのみ扱う、自己管理型のオンラインソリューションとしては初めてのものだ。
論文 参考訳(メタデータ) (2024-04-23T16:01:33Z) - UniTime: A Language-Empowered Unified Model for Cross-Domain Time Series
Forecasting [59.11817101030137]
この研究はドメイン境界を超越する統一モデルパラダイムを提唱する。
効果的なクロスドメインモデルを学ぶことは、以下の課題を提示します。
効果的なドメイン間時系列学習のためのUniTimeを提案する。
論文 参考訳(メタデータ) (2023-10-15T06:30:22Z) - Modality-aware Transformer for Financial Time series Forecasting [3.401797102198429]
我々は,textitModality-aware Transformer という,新しいマルチモーダルトランスモデルを提案する。
本モデルでは,対象とする時系列を効果的に予測するために,分類的テキストと数値的時系列の両方のパワーを探索することに長けている。
財務データセットに関する我々の実験は、Modality-aware Transformerが既存の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-10-02T14:22:41Z) - Learning Sequential Latent Variable Models from Multimodal Time Series
Data [6.107812768939553]
マルチモーダルデータの確率的潜在状態表現を協調的に学習するための自己教師付き生成モデリングフレームワークを提案する。
提案手法が予測品質と表現品質を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2022-04-21T21:59:24Z) - Dyadformer: A Multi-modal Transformer for Long-Range Modeling of Dyadic
Interactions [33.67477398036821]
そこで我々はDyadformerを提案する。Dyadformerは、動的相互作用における個人的および対人的特徴をモデル化する、新しいマルチモーダルマルチオブジェクトトランスフォーマーアーキテクチャである。
提案するクロスオブジェクト層は,対象者間のインタラクションを注意的操作により明示的にモデル化することを可能にする。
この概念実証アプローチは、双方の相互作用の複数モーダリティと結合モデリングが、より長い時間にわたって、個々の属性を予測するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2021-09-20T12:45:04Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Towards Handling Uncertainty-at-Source in AI -- A Review and Next Steps
for Interval Regression [6.166295570030645]
本稿では,近年の成長領域である区間値データの線形回帰に着目した。
我々は,最先端手法の詳細な分析を行い,特性の異なるデータセットに適用した場合の動作,利点,落とし穴を明らかにする。
論文 参考訳(メタデータ) (2021-04-15T05:31:10Z) - Multi-Domain Adversarial Feature Generalization for Person
Re-Identification [52.835955258959785]
マルチデータセット特徴一般化ネットワーク(MMFA-AAE)を提案する。
複数のラベル付きデータセットから普遍的なドメイン不変の特徴表現を学習し、それを見えないカメラシステムに一般化することができる。
また、最先端の教師付き手法や教師なしのドメイン適応手法を大きなマージンで超えている。
論文 参考訳(メタデータ) (2020-11-25T08:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。