論文の概要: The Enron Corpus: Where the Email Bodies are Buried?
- arxiv url: http://arxiv.org/abs/2001.10374v1
- Date: Fri, 24 Jan 2020 13:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 05:38:02.680119
- Title: The Enron Corpus: Where the Email Bodies are Buried?
- Title(参考訳): The Enron Corpus:Eメールの死体はどこに埋もれているか?
- Authors: David Noever
- Abstract要約: 我々は、金融記録と電子メールを用いて、関心のある人物(POI)を特定し、ピーク精度は95.7%である。
第2に、公開されている個人識別情報(PII)を見つけ、以前に報告されていない5万件のインスタンスを発見する。
第三に、カリフォルニアの電気ブラックアウト訴訟で人間の専門家が集めた、法的に応答するメールを自動的にフラグ付けし、最高99%の正確性を見つけます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: To probe the largest public-domain email database for indicators of fraud, we
apply machine learning and accomplish four investigative tasks. First, we
identify persons of interest (POI), using financial records and email, and
report a peak accuracy of 95.7%. Secondly, we find any publicly exposed
personally identifiable information (PII) and discover 50,000 previously
unreported instances. Thirdly, we automatically flag legally responsive emails
as scored by human experts in the California electricity blackout lawsuit, and
find a peak 99% accuracy. Finally, we track three years of primary topics and
sentiment across over 10,000 unique people before, during and after the onset
of the corporate crisis. Where possible, we compare accuracy against execution
times for 51 algorithms and report human-interpretable business rules that can
scale to vast datasets.
- Abstract(参考訳): 詐欺の指標として最大規模の公開ドメイン電子メールデータベースを探索するため,機械学習を適用し,4つの調査課題を遂行する。
まず、金融記録と電子メールを用いて関心のある人物(POI)を特定し、ピーク精度は95.7%である。
第2に、公開されている個人識別情報(PII)を見つけ、5万件の未報告事例を発見。
第3に、カリフォルニアの停電訴訟で人間の専門家が得点した法的応答性のあるメールを自動的に警告し、最大99%の正確性を見出す。
最後に、企業危機の開始前後の3年間に1万人以上のユニークな人々に対して、主要なトピックと感情を追跡しています。
可能な場合、51のアルゴリズムの実行時間と比較し、巨大なデータセットにスケール可能なヒューマン解釈可能なビジネスルールを報告します。
関連論文リスト
- Deep Semi-Supervised Anomaly Detection for Finding Fraud in the Futures
Market [0.0]
本稿では,高頻度金融データにおける不正検出のための深部半教師付き異常検出技術であるDeep SADの有効性を評価することを目的とする。
我々は、モンローのTMX交換所からの独占的なリミットオーダーの帳簿データと、偽造の小さなラベル付き事例を用いて、Deep SADを評価する。
本研究では,少数のラベル付きデータを教師なし異常検出フレームワークに組み込むことで,その精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2023-08-31T19:07:50Z) - TeD-SPAD: Temporal Distinctiveness for Self-supervised
Privacy-preservation for video Anomaly Detection [59.04634695294402]
人間の監視のないビデオ異常検出(VAD)は複雑なコンピュータビジョンタスクである。
VADのプライバシー漏洩により、モデルは人々の個人情報に関連する不必要なバイアスを拾い上げ、増幅することができる。
本稿では,視覚的プライベート情報を自己管理的に破壊する,プライバシーに配慮したビデオ異常検出フレームワークTeD-SPADを提案する。
論文 参考訳(メタデータ) (2023-08-21T22:42:55Z) - Analyzing Bank Account Information of Nominees and Scammers [1.433758865948252]
この研究は、学者や警察官が設計・開発したウェブサイトChaladOhnのデータを活用した。
その結果、トータルの損失は3億7千万を超え、各ケースの損失は1000万未満であることが判明した。
調査の結果、市場のトップ2の銀行KB**とBB*が詐欺に関与していることが判明した。
論文 参考訳(メタデータ) (2023-08-03T07:45:15Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - ClassActionPrediction: A Challenging Benchmark for Legal Judgment
Prediction of Class Action Cases in the US [0.0]
米国におけるクラスアクションケースに焦点を当てた、挑戦的なLJPデータセットを初めてリリースしました。
これは、裁判所がしばしば使用する事実の要約ではなく、苦情を入力として含む、より難しくより現実的なタスクに焦点を当てた、共通の法体系における最初のデータセットである。
我々のLongformerモデルは、最初の2,048トークンしか考慮していないにもかかわらず、明らかに人間のベースライン(63%)を上回っている。さらに、詳細なエラー解析を行い、Longformerモデルが人間の専門家よりも格付けがかなり優れていることを発見した。
論文 参考訳(メタデータ) (2022-11-01T16:57:59Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Fraud Detection using Data-Driven approach [0.0]
最初のオンラインバンキングは1980年に始まった。
インターネットバンキングの利用が絶え間なく増加し、多くのオンライン取引も不正行為を増やした。
本研究では,顧客行動に適応した効率的な不正検出モデルの構築を目的とする。
論文 参考訳(メタデータ) (2020-09-08T20:58:51Z) - Towards practical differentially private causal graph discovery [74.7791110594082]
因果グラフ発見は、純粋な観測データから因果関係グラフを発見する過程を指す。
そこで本稿では,Priv-PCによる個人用因果グラフ探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-15T18:30:41Z) - Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。
メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-05-26T23:41:05Z) - Keystroke Biometrics in Response to Fake News Propagation in a Global
Pandemic [77.79066811371978]
本研究では,キーストロークバイオメトリックスを用いたコンテンツ匿名化手法の提案と解析を行う。
フェイクニュースは、特に主要なイベントにおいて、世論を操作する強力なツールとなっている。
論文 参考訳(メタデータ) (2020-05-15T17:56:11Z) - A Semi-supervised Graph Attentive Network for Financial Fraud Detection [30.645390612737266]
本稿では,多視点ラベル付きおよびラベルなしデータを不正検出に用いる半教師付き減衰型グラフニューラルネットワークSemiSemiGNNを提案する。
ソーシャルリレーションとユーザ属性を利用することで,2つのタスクにおける最先端手法と比較して精度が向上する。
論文 参考訳(メタデータ) (2020-02-28T10:35:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。