論文の概要: CDER-SME: A Cross-Device Event-RGB Micro-Expression Dataset under Multi-Level Stress Induction
- arxiv url: http://arxiv.org/abs/2606.20715v1
- Date: Tue, 16 Jun 2026 14:07:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 13:36:09.33645
- Title: CDER-SME: A Cross-Device Event-RGB Micro-Expression Dataset under Multi-Level Stress Induction
- Title(参考訳): CDER-SME:マルチレベル応力誘導によるクロスデバイスイベント-RGBマイクロ圧縮データセット
- Authors: Jingting Li, Hui Sha, Su-Jing Wang,
- Abstract要約: CDER-SMEは、多レベルストレス誘導フレームワークで収集されたクロスデバイスイベント-RGBデータセットである。
時間同期とランドマーク誘導空間登録のためのハードウェアに依存しないアライメントパイプラインを提供する。
- 参考スコア(独自算出の注目度): 4.861934473961241
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Micro-expression recognition (MER) in realistic scenarios demands high temporal sensitivity and ecological validity, yet existing benchmarks are largely constrained to laboratory-controlled settings and rigid hardware-coupled sensing. We introduce CDER-SME, a cross-device Event-RGB dataset collected under a multi-level stress induction framework (cognitive and social) to elicit spontaneous emotional leakage. To enable reproducible acquisition with independent, decoupled sensors, we provide a hardware-agnostic alignment pipeline for temporal synchronization and landmark-guided spatial registration. CDER-SME adopts a three-tier structure with 92 subjects and 1,963 expert-annotated samples (Action Units and emotions), including 790 Event-RGB pairs and 210 high-fidelity aligned pairs. We further report a reproducible multimodal baseline, where cross-modal fusion improves performance over single-modality counterparts, supporting the complementarity of event dynamics and RGB cues. By removing the need for coaxial calibration, CDER-SME offers a practical benchmark for cross-device alignment and deployable Event-RGB MER in real-world affective intelligence.
- Abstract(参考訳): 現実的なシナリオにおけるマイクロ圧縮認識(MER)は、時間的感度と生態学的妥当性を高く要求するが、既存のベンチマークは、実験室が制御する設定とハードウエア結合型センシングに大きく制約されている。
CDER-SMEは、多レベルストレス誘導フレームワーク(認知と社会的)に基づいて収集されたクロスデバイスイベント-RGBデータセットで、自発的な感情的漏洩を誘発する。
独立して分離されたセンサで再現可能な取得を可能にするため、時間同期とランドマーク誘導空間登録のためのハードウェアに依存しないアライメントパイプラインを提供する。
CDER-SMEは92人の被験者と1,963人の専門家による注釈付きサンプル(アクションユニットと感情)を持つ3層構造を採用しており、790のイベント-RGBペアと210の高忠実なペアを含んでいる。
さらに、再現可能なマルチモーダルベースラインを報告し、クロスモーダル融合は単一モダリティよりも性能を改善し、イベントダイナミクスとRGBキューの相補性をサポートする。
同軸校正の必要性を取り除くことで、CDER-SMEはクロスデバイスアライメントと実世界の情緒的インテリジェンスにおけるデプロイ可能なEvent-RGB MERの実用的なベンチマークを提供する。
関連論文リスト
- Modality-Agnostic Prompt Learning for Multi-Modal Camouflaged Object Detection [61.36976558603528]
本稿では,Segment Anything Model(SAM)のためのモダリティに依存しないマルチモーダルプロンプトを生成する新しいフレームワークを提案する。
具体的には,データ駆動型コンテンツドメインと知識駆動型プロンプトドメインとのインタラクションを通じて,マルチモーダル学習をモデル化する。
さらに,微粒なプロンプトキューを組み込むことで,粗い予測をキャリブレーションする軽量マスクリファインモジュールを導入する。
論文 参考訳(メタデータ) (2026-04-14T07:13:28Z) - Bridging the RGB-IR Gap: Consensus and Discrepancy Modeling for Text-Guided Multispectral Detection [45.62297680190076]
マルチスペクトルオブジェクト検出のためのバイサポートモデリングを用いたセマンティックブリッジ融合フレームワークを提案する。
具体的には、テキストを共有セマンティックブリッジとして使用して、RGBおよびIR応答を統一されたカテゴリ条件下で整列させる。
RGB-IR相互作用の証拠を正規のコンセンサス支援と相補的な相補的な相補性支援に定式化する。
論文 参考訳(メタデータ) (2026-04-13T09:41:01Z) - Complementarity-Supervised Spectral-Band Routing for Multimodal Emotion Recognition [60.20529806857076]
マルチモーダル感情認識は、テキスト、ビデオ、音声などの手がかりを融合させ、個人の感情状態を理解する。
従来の手法では、機械的に独立な単調なパフォーマンスに依存することと、感情タスクで要求されるきめ細かい表現と相反する粗粒の融合という2つの主な制限に直面していた。
我々は,マルチスケールバンド分解とエキスパートコラボレーションを通じて,微細な相補的特徴をモデル化するために,Atsukoという名前のComplementarity-Supervised Multi-Band Expert Networkを提案する。
論文 参考訳(メタデータ) (2026-03-07T03:58:48Z) - Towards Dexterous Embodied Manipulation via Deep Multi-Sensory Fusion and Sparse Expert Scaling [6.026400295270904]
DeMUSEは、RGB、深さ、および6軸の力を統一されたシリアライズストリームに統合するフレームワークである。
AdaMNは、モダリティを意識した特徴の再検討、表現の不均衡の緩和に使用される。
統合認知目的は、物理的整合性を確保するために、環境進化とアクションシーケンスを同期的に合成する。
論文 参考訳(メタデータ) (2026-02-23T12:12:51Z) - CREPES-X: Hierarchical Bearing-Distance-Inertial Direct Cooperative Relative Pose Estimation System [16.41727725659712]
相対的局所化は自律型マルチロボットシステムにおける協調に重要である。
本稿では,階層的な相対的局所化フレームワークCREPES-Xを提案する。
これは、挑戦的な条件下での速度、精度、堅牢性を高める。
論文 参考訳(メタデータ) (2025-12-31T07:47:24Z) - HyPSAM: Hybrid Prompt-driven Segment Anything Model for RGB-Thermal Salient Object Detection [75.406055413928]
RGB-T SODのための新しいプロンプト駆動セグメントモデル(HyPSAM)を提案する。
DFNetは動的畳み込みとマルチブランチデコーディングを使用して、適応的な相互モダリティ相互作用を促進する。
3つの公開データセットの実験により,本手法が最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2025-09-23T07:32:11Z) - Cross-modal State Space Modeling for Real-time RGB-thermal Wild Scene Semantic Segmentation [31.147154902692748]
RGBと熱データの統合により、フィールドロボットの野生環境におけるセマンティックセグメンテーション性能が大幅に向上する。
本稿では,SSM(クロスモーダル状態空間モデリング)アプローチを利用した効率的なRGB-熱的セマンティックセマンティックセグメンテーションアーキテクチャであるCM-SSMを紹介する。
CM-SSMは、より少ないパラメータと少ない計算コストでCARTデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-06-22T01:53:11Z) - Segment Any RGB-Thermal Model with Language-aided Distillation [17.837670087342456]
RGB-Tセマンティックセグメンテーションのための強力なSAMをカスタマイズする新しいフレームワークSARTMを提案する。
我々のキーとなるアイデアはSAMの可能性を解き放ちつつ、RGB-Tデータペアのセマンティック理解モジュールを導入することです。
定量的および定性的な結果は、提案したSARTMが最先端のアプローチを著しく上回っていることを一貫して示している。
論文 参考訳(メタデータ) (2025-05-04T00:24:17Z) - Multi-modal Multi-platform Person Re-Identification: Benchmark and Method [58.59888754340054]
MP-ReIDは、マルチモダリティとマルチプラットフォームReIDに特化した新しいデータセットである。
このベンチマークは、RGB、赤外線、サーマルイメージングなど、さまざまなモードで1,930のIDからデータをコンパイルする。
クロスモダリティとクロスプラットフォームシナリオに適した,特定設計のプロンプトを備えたフレームワークであるUni-Prompt ReIDを紹介する。
論文 参考訳(メタデータ) (2025-03-21T12:27:49Z) - CIR-Net: Cross-modality Interaction and Refinement for RGB-D Salient
Object Detection [144.66411561224507]
本稿では,CIR-Netと呼ばれる畳み込みニューラルネットワーク(CNN)モデルを提案する。
我々のネットワークは、定性的かつ定量的に最先端の塩分濃度検出器より優れています。
論文 参考訳(メタデータ) (2022-10-06T11:59:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。