論文の概要: Combining Knowledge Graphs and NLP to Analyze Instant Messaging Data in Criminal Investigations
- arxiv url: http://arxiv.org/abs/2509.26487v1
- Date: Tue, 30 Sep 2025 16:32:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.205077
- Title: Combining Knowledge Graphs and NLP to Analyze Instant Messaging Data in Criminal Investigations
- Title(参考訳): 犯罪調査における知識グラフとNLPの組み合わせによるインスタントメッセージデータの解析
- Authors: Riccardo Pozzi, Valentina Barbera, Renzo Alva Principe, Davide Giardini, Riccardo Rubini, Matteo Palmonari,
- Abstract要約: 犯罪捜査は、WhatsAppのようなインスタントメッセージングアプリを通じて交換されたメッセージの分析に関係していることが多い。
本手法は,被疑者の携帯電話から収集したデータを意味的に豊かにすることで,知識グラフとNLPモデルを統合し,この分析を支援する。
私たちは、ユーザがデータに対する洞察を得るのに役立つ2つの異なるソリューションを採用しています。
- 参考スコア(独自算出の注目度): 0.2893969925652728
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Criminal investigations often involve the analysis of messages exchanged through instant messaging apps such as WhatsApp, which can be an extremely effort-consuming task. Our approach integrates knowledge graphs and NLP models to support this analysis by semantically enriching data collected from suspects' mobile phones, and help prosecutors and investigators search into the data and get valuable insights. Our semantic enrichment process involves extracting message data and modeling it using a knowledge graph, generating transcriptions of voice messages, and annotating the data using an end-to-end entity extraction approach. We adopt two different solutions to help users get insights into the data, one based on querying and visualizing the graph, and one based on semantic search. The proposed approach ensures that users can verify the information by accessing the original data. While we report about early results and prototypes developed in the context of an ongoing project, our proposal has undergone practical applications with real investigation data. As a consequence, we had the chance to interact closely with prosecutors, collecting positive feedback but also identifying interesting opportunities as well as promising research directions to share with the research community.
- Abstract(参考訳): 犯罪捜査には、WhatsAppのようなインスタントメッセージングアプリを通じてやりとりされるメッセージの分析も含まれる。
提案手法はナレッジグラフとNLPモデルを統合し,容疑者の携帯電話から収集したデータを意味的に豊かにすることで,この分析を支援する。
我々のセマンティックエンリッチメントプロセスは、メッセージデータを抽出し、知識グラフを用いてモデル化し、音声メッセージの書き起こしを生成し、エンドツーエンドのエンティティ抽出アプローチを用いてデータを注釈する。
私たちは、ユーザがデータに対する洞察を得るのに役立つ2つの異なるソリューションを採用しています。
提案手法により,ユーザが元のデータにアクセスして情報を検証することができる。
本稿では,現在進行中のプロジェクトにおける早期成果とプロトタイプについて報告するが,本提案は実際の調査データを用いて実用化されている。
その結果,検事との密接な交流,肯定的なフィードバックの収集,興味深い機会の特定,研究コミュニティと共有する有望な研究方向の特定が可能となった。
関連論文リスト
- From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents [96.65646344634524]
推論とエージェント能力を備えた大規模言語モデル(LLM)は、エージェントディープリサーチ(Agenic Deep Research)と呼ばれる新しいパラダイムを取り入れている。
静的なWeb検索から,計画,探索,学習を行う対話型エージェントベースのシステムへの進化を辿ります。
我々はエージェントディープリサーチが既存のアプローチを著しく上回るだけでなく、将来の情報探索において支配的なパラダイムになることを実証する。
論文 参考訳(メタデータ) (2025-06-23T17:27:19Z) - "Show Me What's Wrong!": Combining Charts and Text to Guide Data Analysis [4.016592757754338]
金融詐欺検出の文脈では、アナリストは取引データの中で不審な活動を素早く特定する必要がある。
これは、パターンの認識、グループ化、比較といった複雑な探索的なタスクからなる反復的なプロセスである。
これらのステップに固有の情報の過負荷を軽減するため、自動化された情報ハイライト、大規模言語モデルが生成するテキストインサイト、視覚分析を組み合わせたツールを提案する。
論文 参考訳(メタデータ) (2024-10-01T14:16:10Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - A Unified Comparison of User Modeling Techniques for Predicting Data
Interaction and Detecting Exploration Bias [17.518601254380275]
我々は,4つのユーザスタディデータセットの多種多様なセットにおいて,その性能に基づいて8つのユーザモデリングアルゴリズムを比較し,ランク付けする。
本研究は,ユーザインタラクションの分析と可視化のためのオープンな課題と新たな方向性を強調した。
論文 参考訳(メタデータ) (2022-08-09T19:51:10Z) - Generative Conversational Networks [67.13144697969501]
本稿では,対話エージェントが独自のラベル付き学習データを生成することを学習する,生成会話ネットワーク(Generative Conversational Networks)というフレームワークを提案する。
そこで本研究では,シードデータから学習したベースラインモデルに対して,意図検出が平均35%,スロットタグが平均21%向上したことを示す。
論文 参考訳(メタデータ) (2021-06-15T23:19:37Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。