論文の概要: Turn Your Face Into An Attack Surface: Screen Attack Using Facial Reflections in Video Conferencing
- arxiv url: http://arxiv.org/abs/2604.06729v1
- Date: Wed, 08 Apr 2026 06:51:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.374154
- Title: Turn Your Face Into An Attack Surface: Screen Attack Using Facial Reflections in Video Conferencing
- Title(参考訳): 顔の顔が攻撃面になる: ビデオ会議で顔の反射を利用した画面攻撃
- Authors: Yong Huang, Yanzhao Lu, Mingyang Chen, En Zhang, Jiazi Li, Wanqing Tu,
- Abstract要約: FaceTellは、ビデオ会議中に広まるが微妙な顔の反射から、きめ細かなアプリケーションアクティビティを盗み出す。
私たちはFaceTellを、3つの異なるブランドのラップトップと4つのメインストリームのビデオ会議プラットフォームを備えた現実世界のテストベッドで実装しています。
12時間以上のビデオデータで、FaceTellは、28の人気のあるアプリケーションで盗聴を行う場合、99.32%の精度を達成している。
- 参考スコア(独自算出の注目度): 9.87560513414145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In video conferencing, human faces serve as the primary visual focal points, playing multifaceted roles that enhance visual communication and emotional connection. However, we argue that a human face is also a side channel, which can unwittingly leak on-screen information through online video feeds. To demonstrate this, we conduct feasibility studies, which reveal that, illuminated by both ambient light and light emitted from displays, the human face can reflect optical variations of different on-screen content. The paper then proposes FaceTell, a novel side-channel attack system that eavesdrops on fine-grained application activities from pervasive yet subtle facial reflections during video conferencing. We implement FaceTell in a real-world testbed with three different brands of laptops and four mainstream video conferencing platforms. FaceTell is then evaluated with 24 human subjects across 13 unique indoor environments. With more than 12 hours of video data, FaceTell achieves a high accuracy of 99.32% for eavesdropping on 28 popular applications and is resilient to many practical impact factors. Finally, potential countermeasures are proposed to mitigate this new attack.
- Abstract(参考訳): ビデオ会議では、人間の顔が主要な視覚焦点として機能し、視覚コミュニケーションと感情的なつながりを高める多面的な役割を演じる。
しかし、私たちは人間の顔もサイドチャネルであり、オンラインビデオフィードを通じてスクリーン上の情報を無意識に漏洩させることができると論じている。
これを示すために、我々は、ディスプレイから放射される環境光と光の両方で照らされた人間の顔が、異なるスクリーン上のコンテンツの光学的変化を反映できることを明らかにする、実現可能性の研究を行う。
そして、ビデオ会議中に広範に広がる微妙な顔の反射から、きめ細かなアプリケーションアクティビティを盗む新しいサイドチャネルアタックシステムFaceTellを提案する。
私たちはFaceTellを、3つの異なるブランドのラップトップと4つのメインストリームのビデオ会議プラットフォームを備えた現実世界のテストベッドで実装しています。
FaceTellは13の屋内環境にまたがって24人の被験者で評価される。
12時間以上のビデオデータで、FaceTellは28の人気のあるアプリケーションで盗聴を行うのに99.32%の精度を達成し、多くの実用的な影響要因に耐性がある。
最後に、この新たな攻撃を緩和する潜在的な対策が提案されている。
関連論文リスト
- Hiding Faces in Plain Sight: Defending DeepFakes by Disrupting Face Detection [56.289631511616975]
本稿では,プロアクティブなディープフェイク防衛フレームワークであるエム・フェイスポージョンの有効性について検討し,個人がディープフェイクビデオの被害者にならないようにした。
FacePoisonをベースとしたEm VideoFacePoisonは、各フレームに個別に適用するのではなく、ビデオフレーム間でFacePoisonを伝搬する戦略である。
本手法は5つの顔検出器で検証され,11種類のDeepFakeモデルに対する広範な実験により,顔検出器を破壊してDeepFakeの発生を妨げる効果が示された。
論文 参考訳(メタデータ) (2024-12-02T04:17:48Z) - Audio-Driven Talking Face Generation with Diverse yet Realistic Facial
Animations [61.65012981435094]
DIRFAは、異なるが現実的な顔のアニメーションを同一の駆動音声から生成できる新しい方法である。
同一音声に対して妥当な顔のアニメーションの変動に対応するため,トランスフォーマーに基づく確率的マッピングネットワークを設計する。
DIRFAは現実的な顔のアニメーションを効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-04-18T12:36:15Z) - Emotionally Enhanced Talking Face Generation [52.07451348895041]
我々は、適切な表現でビデオを生成するために、カテゴリー的感情に基づく話し顔生成フレームワークを構築した。
モデルが任意のアイデンティティ、感情、言語に適応できることを示します。
提案するフレームワークはユーザフレンドリーなWebインターフェースを備えており,感情を伴う顔生成をリアルタイムに行うことができる。
論文 参考訳(メタデータ) (2023-03-21T02:33:27Z) - Learning Dynamic Facial Radiance Fields for Few-Shot Talking Head
Synthesis [90.43371339871105]
音声音声音声合成のための動的顔放射場(DFRF)を提案する。
DFRF条件は2次元外観画像上の放射界を呈示し、先行した顔の学習を行う。
実験により、DFRFは40kの反復しか持たない新しいアイデンティティのために、自然で高品質な音声駆動音声ヘッドビデオを合成できることが示された。
論文 参考訳(メタデータ) (2022-07-24T16:46:03Z) - Private Eye: On the Limits of Textual Screen Peeking via Eyeglass
Reflections in Video Conferencing [18.84055230013228]
ビデオは参加者の画面上の情報をリークする。
本研究は, 数学的モデリングと人体実験を用いて, 出現するウェブカメラが認識可能なテキスト情報を漏洩する程度について検討する。
本研究は,多フレーム超解像技術を用いて,映像フレームのシーケンス上での光学的攻撃に基づく脅威モデルの検討と特徴付けを行う。
論文 参考訳(メタデータ) (2022-05-08T23:29:13Z) - An Audio-Visual Attention Based Multimodal Network for Fake Talking Face
Videos Detection [45.210105822471256]
FTFDNetは、音声と視覚表現を取り入れて、より正確なフェイク・トーキング・フェイス・ビデオ検出を実現する。
提案手法の評価は,97%以上の精度で検出できる偽の通話顔映像の検出に優れた性能を示した。
論文 参考訳(メタデータ) (2022-03-10T06:16:11Z) - Learning to Predict Salient Faces: A Novel Visual-Audio Saliency Model [96.24038430433885]
本稿では,視覚,音声,顔の3つの分枝からなるマルチモーダルビデオサリエンシーモデルを提案する。
実験結果から,提案手法は,11の最先端サリエンシ予測作業より優れていた。
論文 参考訳(メタデータ) (2021-03-29T09:09:39Z) - Audio- and Gaze-driven Facial Animation of Codec Avatars [149.0094713268313]
音声および/またはアイトラッキングを用いて,コーデックアバターをリアルタイムにアニメーション化するための最初のアプローチについて述べる。
私たちのゴールは、重要な社会的シグナルを示す個人間の表現力のある会話を表示することです。
論文 参考訳(メタデータ) (2020-08-11T22:28:48Z) - APB2Face: Audio-guided face reenactment with auxiliary pose and blink
signals [15.89326520522585]
音声誘導型顔再現は、実際の人物に話しかける時と同じ顔の動きを維持しながら、音声情報を用いて写実的な顔を生成することを目的としている。
既存の方法では、鮮やかな顔画像を生成したり、低解像度の顔だけを再現できないため、アプリケーションの価値は制限される。
本稿では,Geometry Predictor と FaceReenactor モジュールからなる新しいディープニューラルネットワーク APB2Face を提案する。
論文 参考訳(メタデータ) (2020-04-30T03:44:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。