論文の概要: Constructing Flow Graphs from Procedural Cybersecurity Texts
- arxiv url: http://arxiv.org/abs/2105.14357v1
- Date: Sat, 29 May 2021 19:06:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 17:42:19.328287
- Title: Constructing Flow Graphs from Procedural Cybersecurity Texts
- Title(参考訳): 手続き型サイバーセキュリティテキストからのフローグラフの構築
- Authors: Kuntal Kumar Pal, Kazuaki Kashihara, Pratyay Banerjee, Swaroop Mishra,
Ruoyu Wang, Chitta Baral
- Abstract要約: 我々はサイバーセキュリティドメイン(3154文書)に大規模な注釈付き手続き型テキストデータセット(CTFW)を構築した。
本稿では,このようなテキストから関連情報を識別し,文間の情報フローを生成することを提案する。
実験の結果,BERT文を埋め込んだグラフ畳み込みネットワークは,3つの領域すべてでBERTよりも優れていた。
- 参考スコア(独自算出の注目度): 16.09313316086535
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Following procedural texts written in natural languages is challenging. We
must read the whole text to identify the relevant information or identify the
instruction flows to complete a task, which is prone to failures. If such texts
are structured, we can readily visualize instruction-flows, reason or infer a
particular step, or even build automated systems to help novice agents achieve
a goal. However, this structure recovery task is a challenge because of such
texts' diverse nature. This paper proposes to identify relevant information
from such texts and generate information flows between sentences. We built a
large annotated procedural text dataset (CTFW) in the cybersecurity domain
(3154 documents). This dataset contains valuable instructions regarding
software vulnerability analysis experiences. We performed extensive experiments
on CTFW with our LM-GNN model variants in multiple settings. To show the
generalizability of both this task and our method, we also experimented with
procedural texts from two other domains (Maintenance Manual and Cooking), which
are substantially different from cybersecurity. Our experiments show that Graph
Convolution Network with BERT sentence embeddings outperforms BERT in all three
domains
- Abstract(参考訳): 自然言語で書かれた手続きテキストに従うことは困難である。
関連する情報を識別するためにテキスト全体を読み、タスクを完了するための命令フローを識別する必要があります。
このようなテキストが構造化されている場合、命令フローを視覚化したり、特定のステップを推論したり、初心者エージェントが目標を達成するのを助ける自動化システムを構築することも簡単にできます。
しかし, この構造回復作業は, テキストの性質が多様であるため課題である。
本稿では,このようなテキストから関連情報を識別し,文間の情報フローを生成することを提案する。
我々はサイバーセキュリティドメイン(3154文書)に大規模な注釈付き手続きテキストデータセット(CTFW)を構築した。
このデータセットには、ソフトウェア脆弱性分析経験に関する貴重な説明が含まれている。
複数の設定でLM-GNNモデルを用いたCTFW実験を行った。
この課題と手法の両方の汎用性を示すために,サイバーセキュリティとは大きく異なる2つのドメイン(メンテナンスマニュアルと調理)の手続きテキストを実験した。
実験により, BERT文埋め込みを用いたグラフ畳み込みネットワークは, BERTを3つの領域すべてで上回っていることがわかった。
関連論文リスト
- Text-Tuple-Table: Towards Information Integration in Text-to-Table Generation via Global Tuple Extraction [36.915250638481986]
リアルタイムのコメンタリーテキストに基づいたコンペの要約表を生成するためのベンチマークデータセットであるLiveSumを紹介する。
我々は,このタスクにおける最先端の大規模言語モデルの性能を,微調整とゼロショットの両方で評価する。
さらに、パフォーマンスを改善するために、$T3$(Text-Tuple-Table)と呼ばれる新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-04-22T14:31:28Z) - OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition [79.852642726105]
多様なシナリオにまたがって視覚的なテキストを解析するための統一パラダイムを提案する。
具体的には,3つの視覚的なテキスト解析タスクを同時に処理できるOmniというユニバーサルモデルを提案する。
オムニでは、全てのタスクが統一エンコーダ・デコーダアーキテクチャ、統一目的点条件テキスト生成、統一入力表現を共有している。
論文 参考訳(メタデータ) (2024-03-28T03:51:14Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - One Embedder, Any Task: Instruction-Finetuned Text Embeddings [105.82772523968961]
INSTRUCTORはタスク命令のテキスト埋め込みを計算するための新しい方法である。
すべてのテキスト入力はユースケースを説明する指示と共に埋め込まれる。
InSTRUCTORを70の埋め込み評価タスクで評価する。
論文 参考訳(メタデータ) (2022-12-19T18:57:05Z) - Informative Text Generation from Knowledge Triples [56.939571343797304]
本稿では,トレーニング中に学習した有用な知識を記憶するために,メモリネットワークを利用した新しいメモリ拡張ジェネレータを提案する。
我々は、新しい設定のためのWebNLGからデータセットを導き、我々のモデルの有効性を調べるための広範な実験を行う。
論文 参考訳(メタデータ) (2022-09-26T14:35:57Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - StrucTexT: Structured Text Understanding with Multi-Modal Transformers [29.540122964399046]
Visually Rich Documents (VRD)における構造化テキスト理解は、ドキュメントインテリジェンスの重要な部分である。
本稿では,SrucTexTという統合フレームワークを提案する。
セグメントレベルおよびトークンレベルで構造化されたテキスト理解の手法を評価し,その手法が最先端のテキスト理解よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-06T02:57:07Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。