論文の概要: Modelling Direct Messaging Networks with Multiple Recipients for Cyber
Deception
- arxiv url: http://arxiv.org/abs/2111.11932v1
- Date: Sun, 21 Nov 2021 10:18:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-24 17:22:14.446513
- Title: Modelling Direct Messaging Networks with Multiple Recipients for Cyber
Deception
- Title(参考訳): 複数の受信者によるダイレクトメッセージネットワークのモデリング
- Authors: Kristen Moore, Cody J. Christopher, David Liebowitz, Surya Nepal,
Renee Selvey
- Abstract要約: 本稿では,電子メールとインスタントメッセージ形式のグループ通信を大規模に自動生成するフレームワークを提案する。
我々は,このタイプのシステムをシミュレーションする2つの重要な側面に対処する: 参加者がいつ,誰と通信するかをモデル化し,また,話題の多人数のテキストを生成して,シミュレートされた会話スレッドをポップアップさせる。
我々は,マルチパーティ会話スレッドを生成するために,微調整,事前訓練された言語モデルを用いることを実証する。
- 参考スコア(独自算出の注目度): 13.447335354083666
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cyber deception is emerging as a promising approach to defending networks and
systems against attackers and data thieves. However, despite being relatively
cheap to deploy, the generation of realistic content at scale is very costly,
due to the fact that rich, interactive deceptive technologies are largely
hand-crafted. With recent improvements in Machine Learning, we now have the
opportunity to bring scale and automation to the creation of realistic and
enticing simulated content. In this work, we propose a framework to automate
the generation of email and instant messaging-style group communications at
scale. Such messaging platforms within organisations contain a lot of valuable
information inside private communications and document attachments, making them
an enticing target for an adversary. We address two key aspects of simulating
this type of system: modelling when and with whom participants communicate, and
generating topical, multi-party text to populate simulated conversation
threads. We present the LogNormMix-Net Temporal Point Process as an approach to
the first of these, building upon the intensity-free modeling approach of
Shchur et al.~\cite{shchur2019intensity} to create a generative model for
unicast and multi-cast communications. We demonstrate the use of fine-tuned,
pre-trained language models to generate convincing multi-party conversation
threads. A live email server is simulated by uniting our LogNormMix-Net TPP (to
generate the communication timestamp, sender and recipients) with the language
model, which generates the contents of the multi-party email threads. We
evaluate the generated content with respect to a number of realism-based
properties, that encourage a model to learn to generate content that will
engage the attention of an adversary to achieve a deception outcome.
- Abstract(参考訳): サイバー詐欺は、ネットワークやシステムを攻撃者やデータ泥棒から守るための有望なアプローチとして浮上している。
しかし、デプロイが比較的安価であるにもかかわらず、リッチでインタラクティブな偽装技術が主に手作りであるという事実から、大規模な現実的なコンテンツの生成は非常にコストがかかる。
最近の機械学習の改善により、リアルで魅惑的なシミュレートコンテンツの作成にスケールと自動化をもたらす機会が得られました。
本研究では,電子メールとインスタントメッセージ形式のグループ通信を大規模に自動生成するフレームワークを提案する。
組織内のこのようなメッセージングプラットフォームには、プライベートなコミュニケーションやドキュメント添付ファイルの中に多くの貴重な情報が含まれており、敵を魅了するターゲットとなっている。
このタイプのシステムをシミュレートする2つの重要な側面に対処します。参加者がいつ誰とコミュニケーションするかをモデル化し、シミュレートされた会話スレッドを投入するためにトピック付きマルチパーティテキストを生成します。
本稿では,lognormmix-netの時間的点過程を,shchurらによるインテンシティフリーモデリングアプローチに基づいて,その最初のアプローチとして提示する。
~\cite{shchur2019intensity} ユニキャストおよびマルチキャスト通信のための生成モデルを作成する。
我々は,マルチパーティ会話スレッドを生成するために,微調整,事前訓練された言語モデルを用いることを実証する。
ライブメールサーバは、LogNormMix-Net TPP(通信タイムスタンプ、送信者および受信者を生成する)を言語モデルと結合し、マルチパーティの電子メールスレッドの内容を生成することでシミュレートされる。
本研究では,多くの現実主義的特性に対して生成されたコンテンツを評価し,モデルが相手の注意を惹きつけるコンテンツを生成することを奨励し,騙しの結果を得る。
関連論文リスト
- Modeling Real-Time Interactive Conversations as Timed Diarized Transcripts [11.067252960486272]
本稿では,事前学習した言語モデルを用いて,リアルタイム対話型会話をシミュレートする簡易かつ汎用的な手法を提案する。
本稿では,インスタントメッセージ対話と音声会話の2つのケーススタディを用いて,この手法の可能性を実証する。
論文 参考訳(メタデータ) (2024-05-21T21:14:31Z) - Rethinking Multi-User Semantic Communications with Deep Generative Models [30.745379375963157]
マルチユーザシナリオに適した新しい生成セマンティック・コミュニケーション・フレームワークを開発した。
この革新的な視点の下では、OFDMAシステムは情報の最大の部分を送信することを意図してはならない。
実験により,新しい拡散モデルの有効性と提案フレームワークの有効性が示された。
論文 参考訳(メタデータ) (2024-05-16T07:43:15Z) - TextBind: Multi-turn Interleaved Multimodal Instruction-following in the Wild [102.93338424976959]
マルチターンインターリーブ型インストラクションフォロー機能を備えた,より大規模な言語モデルを実現するための,ほとんどアノテーションのないフレームワークであるTextBindを紹介する。
提案手法では,画像キャプチャペアのみが必要であり,言語モデルからマルチターンマルチモーダル・インストラクション・レスポンス・会話を生成する。
そこで我々は,画像エンコーダとデコーダモデルをシームレスに統合する言語モデル中心アーキテクチャであるMIMを考案した。
論文 参考訳(メタデータ) (2023-09-14T15:34:01Z) - Generating Images with Multimodal Language Models [78.6660334861137]
本稿では,凍結したテキストのみの大規模言語モデルを,事前学習した画像エンコーダとデコーダモデルで融合する手法を提案する。
本モデルでは,画像検索,新しい画像生成,マルチモーダル対話など,多モーダルな機能群を示す。
論文 参考訳(メタデータ) (2023-05-26T19:22:03Z) - Grounding Language Models to Images for Multimodal Inputs and Outputs [89.30027812161686]
本稿では,事前学習したテキストのみの言語モデルを視覚領域に最適化する効率的な手法を提案する。
任意にインターリーブされた画像とテキストデータを処理し、検索した画像とインターリーブされたテキストを生成する。
論文 参考訳(メタデータ) (2023-01-31T18:33:44Z) - Representation Learning for Conversational Data using Discourse Mutual
Information Maximization [9.017156603976915]
構造を意識しない単語・バイ・ワード生成は効果的な会話モデリングには適さないと我々は主張する。
対話表現モデルの学習のための構造認識型相互情報に基づく損失関数DMIを提案する。
本モデルでは,対話評価タスクであるDailyDialog++において,ランダムな負のシナリオと逆のシナリオの両方において,最も有望な性能を示す。
論文 参考訳(メタデータ) (2021-12-04T13:17:07Z) - Building Goal-Oriented Dialogue Systems with Situated Visual Context [12.014793558784955]
スクリーン付きバーチャルアシスタントの急増に伴い、次世代のエージェントはスクリーンコンテキストを理解する必要がある。
本稿では,対話エージェントの次の行動とその議論を対話と視覚の両方で協調的に条件付けする,新しい多モーダル対話フレームワークを提案する。
我々のモデルは、色や形状などの視覚的特徴と、視覚的実体に関連する価格や星のレーティングといったメタデータに基づく特徴を認識できる。
論文 参考訳(メタデータ) (2021-11-22T23:30:52Z) - Dialog Simulation with Realistic Variations for Training Goal-Oriented
Conversational Systems [14.206866126142002]
ゴール指向のダイアログシステムにより、ユーザーは映画に関する情報をリクエストしたり、チケットを予約したりといった特定の目標を達成することができる。
本稿では,注釈付きダイアログとダイアログスキーマから,注釈付きダイアログの大規模なコーパスを自動生成する手法を提案する。
ベースラインダイアログ生成手法と比較して,ホールドアウトテストセットの50%の相対精度を実現した。
論文 参考訳(メタデータ) (2020-11-16T19:39:15Z) - Plug-and-Play Conversational Models [62.77150879036442]
我々はデコード時にさらなる計算を必要としないアプローチを導入し、また大きな言語モデルの微調整も必要としない。
我々は、広範囲な自動的・人的評価を通じて、複数の望ましい属性について、生成した会話応答に対する高い制御を実証する。
論文 参考訳(メタデータ) (2020-10-09T03:17:51Z) - Improve Variational Autoencoder for Text Generationwith Discrete Latent
Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。
VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。
よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2020-04-22T14:41:37Z) - PALM: Pre-training an Autoencoding&Autoregressive Language Model for
Context-conditioned Generation [92.7366819044397]
自己指導型事前学習は、自然言語の理解と生成のための強力な技術として登場した。
本研究は,大規模未ラベルコーパス上で自己エンコーディングと自己回帰言語モデルを共同で事前学習する新しいスキームをPALMに提示する。
広範な実験により、PALMは様々な言語生成ベンチマークにおいて、新しい最先端の結果を達成することが示されている。
論文 参考訳(メタデータ) (2020-04-14T06:25:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。