論文の概要: Named Entity Recognition for Payment Data Using NLP
- arxiv url: http://arxiv.org/abs/2602.14009v1
- Date: Sun, 15 Feb 2026 06:28:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.597023
- Title: Named Entity Recognition for Payment Data Using NLP
- Title(参考訳): NLPを用いた支払データに対する名前付きエンティティ認識
- Authors: Srikumar Nayak,
- Abstract要約: Named Entity Recognition (NER) は、金融トランザクション処理を自動化する重要なコンポーネントとして登場した。
本稿では,支払いデータ抽出に特化して設計された最先端NERアルゴリズムの包括的解析を行う。
我々は、複数の支払いフォーマットにまたがる5万のアノテート支払いトランザクションのデータセットで実験を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Named Entity Recognition (NER) has emerged as a critical component in automating financial transaction processing, particularly in extracting structured information from unstructured payment data. This paper presents a comprehensive analysis of state-of-the-art NER algorithms specifically designed for payment data extraction, including Conditional Random Fields (CRF), Bidirectional Long Short-Term Memory with CRF (BiLSTM-CRF), and transformer-based models such as BERT and FinBERT. We conduct extensive experiments on a dataset of 50,000 annotated payment transactions across multiple payment formats including SWIFT MT103, ISO 20022, and domestic payment systems. Our experimental results demonstrate that fine-tuned BERT models achieve an F1-score of 94.2% for entity extraction, outperforming traditional CRF-based approaches by 12.8 percentage points. Furthermore, we introduce PaymentBERT, a novel hybrid architecture combining domain-specific financial embeddings with contextual representations, achieving state-of-the-art performance with 95.7% F1-score while maintaining real-time processing capabilities. We provide detailed analysis of cross-format generalization, ablation studies, and deployment considerations. This research provides practical insights for financial institutions implementing automated sanctions screening, anti-money laundering (AML) compliance, and payment processing systems.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、金融取引処理の自動化、特に構造化されていない支払いデータから構造化された情報を抽出する上で重要な要素として浮上している。
本稿では,条件付きランダムフィールド (CRF) や双方向長短期メモリ (BiLSTM-CRF) ,BERT や FinBERT などのトランスフォーマモデルなど,支払いデータ抽出に特化した最先端の NER アルゴリズムを包括的に分析する。
我々は、SWIFT MT103、ISO 20022、国内決済システムなど、複数の支払い形式にまたがる5万件のアノテート決済トランザクションのデータセットに関する広範な実験を行った。
実験の結果、細調整されたBERTモデルは、エンティティ抽出のF1スコア94.2%を達成し、従来のCRFベースのアプローチを12.8ポイント上回った。
さらに、ドメイン固有のファイナンシャル埋め込みとコンテキスト表現を組み合わせた新しいハイブリッドアーキテクチャであるPaymentBERTを導入し、リアルタイム処理能力を維持しつつ、95.7%のF1スコアで最先端のパフォーマンスを実現する。
本稿では,クロスフォーマットの一般化,アブレーション研究,展開の考察について詳細に分析する。
本研究は、自動制裁スクリーニング、アンチマネーロンダリング(AML)コンプライアンス、決済処理システムを実装する金融機関に対して、実践的な洞察を提供する。
関連論文リスト
- Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving [65.02106674311908]
本稿では,マルチラウンド階層的推論を行う長期水平数学エージェントであるIntern-S1-MOを紹介する。
コンパクトメモリをレムマの形で維持することにより、Intern-S1-MOはレムマリッチ推論空間をより自由に探索することができる。
実験の結果、インターンS1-MOはIMO2025の非幾何学的問題で35点中26点を得ることができ、銀メダリストのパフォーマンスに匹敵することがわかった。
論文 参考訳(メタデータ) (2025-12-11T15:26:28Z) - FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [57.18367828883773]
FinAgentBenchは、ファイナンスにおける多段階推論によるエージェント検索を評価するためのベンチマークである。
このベンチマークは、S&P-500上場企業に関する26Kのエキスパートアノテート例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-08-07T22:15:22Z) - Probabilistically Tightened Linear Relaxation-based Perturbation Analysis for Neural Network Verification [83.25968588249776]
本稿では,LiRPAに基づく手法とサンプリングに基づく手法を組み合わせることで,厳密な中間到達性集合を計算できる新しいフレームワークを提案する。
無視可能な計算オーバーヘッドでは、$textttPT-LiRPA$は推定された到達可能な集合を利用し、ニューラルネットワークの出力の上下線形境界を著しく締め付ける。
論文 参考訳(メタデータ) (2025-07-07T18:45:53Z) - FinAI-BERT: A Transformer-Based Model for Sentence-Level Detection of AI Disclosures in Financial Reports [6.324803752309524]
本研究では,FinAI-BERTについて紹介する。FinAI-BERTはドメイン適応トランスフォーマーに基づく言語モデルで,文レベルでのAI関連コンテンツを財務テキストに分類する。
このモデルは、米国の銀行の年間報告669件から抽出された1,586文の、手動でキュレートされバランスの取れたデータセットに基づいて微調整された。
論文 参考訳(メタデータ) (2025-06-29T09:33:29Z) - FlowSeries: Anomaly Detection in Financial Transaction Flows [0.49419751845543053]
WeirdFlowsは、不正なトランザクションや非コンプライアンスエージェントを検出するためのトップダウン検索パイプラインである。
Intesa Sanpaolo(ISP)銀行のデータセットからWerdFlowsを評価する。
論文 参考訳(メタデータ) (2025-03-20T06:49:33Z) - FinTSB: A Comprehensive and Practical Benchmark for Financial Time Series Forecasting [58.70072722290475]
ファイナンシャル・タイム・シリーズ(FinTS)は、人間の脳を増強した意思決定の行動を記録する。
FinTSBは金融時系列予測のための総合的で実用的なベンチマークである。
論文 参考訳(メタデータ) (2025-02-26T05:19:16Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Conversational Factor Information Retrieval Model (ConFIRM) [2.855224352436985]
ConFIRM(Conversational Factor Information Retrieval Method)は、ドメイン固有の検索タスクのための大規模言語モデル(LLM)を微調整する新しい手法である。
本研究では、金融セクターにおけるケーススタディを通じて、パーソナライズされたデータを用いてLlama-2-7bモデルを微調整し、ConFIRMの有効性を実証する。
結果のモデルでは、ファイナンシャルクエリの分類において91%の精度が達成され、NVIDIA A100 GPU上での平均推論時間は0.61秒であった。
論文 参考訳(メタデータ) (2023-10-06T12:31:05Z) - Gaussian process imputation of multiple financial series [71.08576457371433]
金融指標、株価、為替レートなどの複数の時系列は、市場が潜んでいる状態に依存しているため、強く結びついている。
金融時系列間の関係を多出力ガウスプロセスでモデル化することで学習することに注力する。
論文 参考訳(メタデータ) (2020-02-11T19:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。