論文の概要: Modelling Direct Messaging Networks with Multiple Recipients for Cyber
Deception
- arxiv url: http://arxiv.org/abs/2111.11932v1
- Date: Sun, 21 Nov 2021 10:18:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-24 17:22:14.446513
- Title: Modelling Direct Messaging Networks with Multiple Recipients for Cyber
Deception
- Title(参考訳): 複数の受信者によるダイレクトメッセージネットワークのモデリング
- Authors: Kristen Moore, Cody J. Christopher, David Liebowitz, Surya Nepal,
Renee Selvey
- Abstract要約: 本稿では,電子メールとインスタントメッセージ形式のグループ通信を大規模に自動生成するフレームワークを提案する。
我々は,このタイプのシステムをシミュレーションする2つの重要な側面に対処する: 参加者がいつ,誰と通信するかをモデル化し,また,話題の多人数のテキストを生成して,シミュレートされた会話スレッドをポップアップさせる。
我々は,マルチパーティ会話スレッドを生成するために,微調整,事前訓練された言語モデルを用いることを実証する。
- 参考スコア(独自算出の注目度): 13.447335354083666
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cyber deception is emerging as a promising approach to defending networks and
systems against attackers and data thieves. However, despite being relatively
cheap to deploy, the generation of realistic content at scale is very costly,
due to the fact that rich, interactive deceptive technologies are largely
hand-crafted. With recent improvements in Machine Learning, we now have the
opportunity to bring scale and automation to the creation of realistic and
enticing simulated content. In this work, we propose a framework to automate
the generation of email and instant messaging-style group communications at
scale. Such messaging platforms within organisations contain a lot of valuable
information inside private communications and document attachments, making them
an enticing target for an adversary. We address two key aspects of simulating
this type of system: modelling when and with whom participants communicate, and
generating topical, multi-party text to populate simulated conversation
threads. We present the LogNormMix-Net Temporal Point Process as an approach to
the first of these, building upon the intensity-free modeling approach of
Shchur et al.~\cite{shchur2019intensity} to create a generative model for
unicast and multi-cast communications. We demonstrate the use of fine-tuned,
pre-trained language models to generate convincing multi-party conversation
threads. A live email server is simulated by uniting our LogNormMix-Net TPP (to
generate the communication timestamp, sender and recipients) with the language
model, which generates the contents of the multi-party email threads. We
evaluate the generated content with respect to a number of realism-based
properties, that encourage a model to learn to generate content that will
engage the attention of an adversary to achieve a deception outcome.
- Abstract(参考訳): サイバー詐欺は、ネットワークやシステムを攻撃者やデータ泥棒から守るための有望なアプローチとして浮上している。
しかし、デプロイが比較的安価であるにもかかわらず、リッチでインタラクティブな偽装技術が主に手作りであるという事実から、大規模な現実的なコンテンツの生成は非常にコストがかかる。
最近の機械学習の改善により、リアルで魅惑的なシミュレートコンテンツの作成にスケールと自動化をもたらす機会が得られました。
本研究では,電子メールとインスタントメッセージ形式のグループ通信を大規模に自動生成するフレームワークを提案する。
組織内のこのようなメッセージングプラットフォームには、プライベートなコミュニケーションやドキュメント添付ファイルの中に多くの貴重な情報が含まれており、敵を魅了するターゲットとなっている。
このタイプのシステムをシミュレートする2つの重要な側面に対処します。参加者がいつ誰とコミュニケーションするかをモデル化し、シミュレートされた会話スレッドを投入するためにトピック付きマルチパーティテキストを生成します。
本稿では,lognormmix-netの時間的点過程を,shchurらによるインテンシティフリーモデリングアプローチに基づいて,その最初のアプローチとして提示する。
~\cite{shchur2019intensity} ユニキャストおよびマルチキャスト通信のための生成モデルを作成する。
我々は,マルチパーティ会話スレッドを生成するために,微調整,事前訓練された言語モデルを用いることを実証する。
ライブメールサーバは、LogNormMix-Net TPP(通信タイムスタンプ、送信者および受信者を生成する)を言語モデルと結合し、マルチパーティの電子メールスレッドの内容を生成することでシミュレートされる。
本研究では,多くの現実主義的特性に対して生成されたコンテンツを評価し,モデルが相手の注意を惹きつけるコンテンツを生成することを奨励し,騙しの結果を得る。
関連論文リスト
- Intent-Aware Dialogue Generation and Multi-Task Contrastive Learning for Multi-Turn Intent Classification [6.459396785817196]
Chain-of-Intentは、セルフプレイを通じて意図駆動の会話を生成する。
MINT-CLはマルチタスクコントラスト学習を用いたマルチターンインテント分類のためのフレームワークである。
MINT-Eは多言語対応のマルチターンeコマース対話コーパスである。
論文 参考訳(メタデータ) (2024-11-21T15:59:29Z) - Large Generative Model-assisted Talking-face Semantic Communication System [55.42631520122753]
本研究では,LGM-TSC(Large Generative Model-assisted Talking-face Semantic Communication)システムを提案する。
送信機のジェネレーティブセマンティック・エクストラクタ(GSE)は、意味的にスパースな音声映像を高情報密度のテキストに変換する。
意味的曖昧さと修正のためのLarge Language Model (LLM)に基づくPrivate Knowledge Base (KB)。
BERT-VITS2とSadTalkerモデルを用いた生成意味再構成(GSR)により、テキストを高QoE音声ビデオに変換する。
論文 参考訳(メタデータ) (2024-11-06T12:45:46Z) - Generating Data with Text-to-Speech and Large-Language Models for Conversational Speech Recognition [48.527630771422935]
複数話者対話型ASRのための合成データ生成パイプラインを提案する。
我々は、電話と遠隔会話音声設定のためのWhisper ASRモデルを微調整して評価を行う。
論文 参考訳(メタデータ) (2024-08-17T14:47:05Z) - Towards Realistic Synthetic User-Generated Content: A Scaffolding Approach to Generating Online Discussions [17.96479268328824]
ユーザ生成コンテンツの現実的で大規模な合成データセット作成の実現可能性について検討する。
本稿では,議論スレッドのコンパクトな表現のアイデアに基づく多段階生成プロセスを提案する。
論文 参考訳(メタデータ) (2024-08-15T18:43:50Z) - Modeling Real-Time Interactive Conversations as Timed Diarized Transcripts [11.067252960486272]
本稿では,事前学習した言語モデルを用いて,リアルタイム対話型会話をシミュレートする簡易かつ汎用的な手法を提案する。
本稿では,インスタントメッセージ対話と音声会話の2つのケーススタディを用いて,この手法の可能性を実証する。
論文 参考訳(メタデータ) (2024-05-21T21:14:31Z) - TextBind: Multi-turn Interleaved Multimodal Instruction-following in the Wild [102.93338424976959]
マルチターンインターリーブ型インストラクションフォロー機能を備えた,より大規模な言語モデルを実現するための,ほとんどアノテーションのないフレームワークであるTextBindを紹介する。
提案手法では,画像キャプチャペアのみが必要であり,言語モデルからマルチターンマルチモーダル・インストラクション・レスポンス・会話を生成する。
そこで我々は,画像エンコーダとデコーダモデルをシームレスに統合する言語モデル中心アーキテクチャであるMIMを考案した。
論文 参考訳(メタデータ) (2023-09-14T15:34:01Z) - Generating Images with Multimodal Language Models [78.6660334861137]
本稿では,凍結したテキストのみの大規模言語モデルを,事前学習した画像エンコーダとデコーダモデルで融合する手法を提案する。
本モデルでは,画像検索,新しい画像生成,マルチモーダル対話など,多モーダルな機能群を示す。
論文 参考訳(メタデータ) (2023-05-26T19:22:03Z) - Grounding Language Models to Images for Multimodal Inputs and Outputs [89.30027812161686]
本稿では,事前学習したテキストのみの言語モデルを視覚領域に最適化する効率的な手法を提案する。
任意にインターリーブされた画像とテキストデータを処理し、検索した画像とインターリーブされたテキストを生成する。
論文 参考訳(メタデータ) (2023-01-31T18:33:44Z) - Building Goal-Oriented Dialogue Systems with Situated Visual Context [12.014793558784955]
スクリーン付きバーチャルアシスタントの急増に伴い、次世代のエージェントはスクリーンコンテキストを理解する必要がある。
本稿では,対話エージェントの次の行動とその議論を対話と視覚の両方で協調的に条件付けする,新しい多モーダル対話フレームワークを提案する。
我々のモデルは、色や形状などの視覚的特徴と、視覚的実体に関連する価格や星のレーティングといったメタデータに基づく特徴を認識できる。
論文 参考訳(メタデータ) (2021-11-22T23:30:52Z) - Dialog Simulation with Realistic Variations for Training Goal-Oriented
Conversational Systems [14.206866126142002]
ゴール指向のダイアログシステムにより、ユーザーは映画に関する情報をリクエストしたり、チケットを予約したりといった特定の目標を達成することができる。
本稿では,注釈付きダイアログとダイアログスキーマから,注釈付きダイアログの大規模なコーパスを自動生成する手法を提案する。
ベースラインダイアログ生成手法と比較して,ホールドアウトテストセットの50%の相対精度を実現した。
論文 参考訳(メタデータ) (2020-11-16T19:39:15Z) - Plug-and-Play Conversational Models [62.77150879036442]
我々はデコード時にさらなる計算を必要としないアプローチを導入し、また大きな言語モデルの微調整も必要としない。
我々は、広範囲な自動的・人的評価を通じて、複数の望ましい属性について、生成した会話応答に対する高い制御を実証する。
論文 参考訳(メタデータ) (2020-10-09T03:17:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。