論文の概要: Specialized text classification: an approach to classifying Open Banking transactions
- arxiv url: http://arxiv.org/abs/2504.12319v1
- Date: Thu, 10 Apr 2025 17:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-20 05:05:39.527250
- Title: Specialized text classification: an approach to classifying Open Banking transactions
- Title(参考訳): 専門テキスト分類:オープンバンキング取引の分類へのアプローチ
- Authors: Duc Tuyen TA, Wajdi Ben Saad, Ji Young Oh,
- Abstract要約: 本稿では,フランス語市場とフランス語テキストに着目した,言語ベースのオープンバンキングトランザクション分類システムを提案する。
言語固有の技術とドメイン知識を取り入れることで,性能と効率性の向上を実証する。
- 参考スコア(独自算出の注目度): 0.13108652488669734
- License:
- Abstract: With the introduction of the PSD2 regulation in the EU which established the Open Banking framework, a new window of opportunities has opened for banks and fintechs to explore and enrich Bank transaction descriptions with the aim of building a better understanding of customer behavior, while using this understanding to prevent fraud, reduce risks and offer more competitive and tailored services. And although the usage of natural language processing models and techniques has seen an incredible progress in various applications and domains over the past few years, custom applications based on domain-specific text corpus remain unaddressed especially in the banking sector. In this paper, we introduce a language-based Open Banking transaction classification system with a focus on the french market and french language text. The system encompasses data collection, labeling, preprocessing, modeling, and evaluation stages. Unlike previous studies that focus on general classification approaches, this system is specifically tailored to address the challenges posed by training a language model with a specialized text corpus (Banking data in the French context). By incorporating language-specific techniques and domain knowledge, the proposed system demonstrates enhanced performance and efficiency compared to generic approaches.
- Abstract(参考訳): オープンバンキングフレームワークを確立したEUにおけるPSD2規制の導入により、銀行やフィンテックが顧客の行動をよりよく理解することを目的として、銀行取引記述を探求し、強化する新たな機会の窓口が開かれた。
自然言語処理モデルやテクニックの使用は、ここ数年、様々なアプリケーションやドメインで驚くほどの進歩を遂げてきたが、特に銀行業界では、ドメイン固有のテキストコーパスに基づくカスタムアプリケーションはまだ使われていない。
本稿では,フランス語市場とフランス語テキストに着目した,言語ベースのオープンバンキングトランザクション分類システムを提案する。
このシステムは、データ収集、ラベル付け、前処理、モデリング、評価段階を含む。
一般的な分類アプローチに焦点をあてた従来の研究とは異なり、このシステムは専門的なテキストコーパス(フランス語の文脈におけるバンキングデータ)を用いて言語モデルを訓練することによって生じる課題に特に対処するように調整されている。
言語固有の手法とドメイン知識を取り入れることで,汎用手法と比較して性能と効率が向上することを示す。
関連論文リスト
- Interpretable Face Anti-Spoofing: Enhancing Generalization with Multimodal Large Language Models [58.936893810674896]
顔認識システムのセキュリティと信頼性を確保するためには,FAS(Face Anti-Spoofing)が不可欠である。
I-FAS(Interpretable Face Anti-Spoofing)と呼ばれるFASのためのマルチモーダルな大規模言語モデルフレームワークを提案する。
本稿では,FAS画像の高品質なキャプションを生成するために,Spof-Aware Captioning and Filtering(SCF)戦略を提案する。
論文 参考訳(メタデータ) (2025-01-03T09:25:04Z) - Modular Conversational Agents for Surveys and Interviews [6.019313905775819]
本稿では,AIエージェントを設計するためのモジュラーアプローチとそのパラメータ化プロセスを紹介する。
3つの実証的な研究を通して、モジュラーアプローチの適応性、一般化性、有効性を示す。
その結果,AIエージェントは完成率と応答品質を高めることが示唆された。
論文 参考訳(メタデータ) (2024-12-22T15:00:16Z) - DarijaBanking: A New Resource for Overcoming Language Barriers in Banking Intent Detection for Moroccan Arabic Speakers [5.274804664403783]
言語多様性の複雑さをナビゲートすることは、堅牢な自然言語処理システムの開発における中心的な課題である。
本稿では,銀行分野における意図分類の強化を目的とした新しいDarijaデータセットであるtextbfDarijaBankingを紹介する。
DarijaBankingは、Darija、Modern Standard Arabic (MSA)、英語、フランス語で1,800以上の並列な高品質なクエリで構成されており、24のインテントクラスで構成されている。
論文 参考訳(メタデータ) (2024-05-26T08:33:28Z) - LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - Identifying Banking Transaction Descriptions via Support Vector Machine Short-Text Classification Based on a Specialized Labelled Corpus [7.046417074932257]
本稿では,自然言語処理技術と機械学習アルゴリズムを組み合わせて,銀行取引記述を分類する新しいシステムについて述べる。
また,スパム検出における既存のソリューションに触発されて,ジャカード距離に基づくトレーニングセットサイズの削減を目的とした,短いテキスト類似度検出手法を提案する。
Google PlayとApp Storeで利用可能なパーソナルファイナンスアプリケーションCoinScrapのユースケースを提示する。
論文 参考訳(メタデータ) (2024-03-29T13:15:46Z) - Cross-Lingual NER for Financial Transaction Data in Low-Resource
Languages [70.25418443146435]
半構造化テキストデータにおける言語間名前認識のための効率的なモデリングフレームワークを提案する。
我々は2つの独立したSMSデータセットを英語とアラビア語で使用し、それぞれが半構造化された銀行取引情報を持っている。
わずか30のラベル付きサンプルにアクセスすることで、我々のモデルは、英語からアラビア語までの商人、金額、その他の分野の認識を一般化することができる。
論文 参考訳(メタデータ) (2023-07-16T00:45:42Z) - Scalable and Weakly Supervised Bank Transaction Classification [0.0]
本稿では,弱い監督,自然言語処理,深層ニューラルネットワークトレーニングを用いて,銀行取引を分類することを目的とする。
データ前処理、トランザクションテキストの埋め込み、アンカー化、ラベル生成、識別ニューラルネットワークトレーニングを含む、効果的でスケーラブルなエンドツーエンドデータパイプラインを提案する。
論文 参考訳(メタデータ) (2023-05-28T23:12:12Z) - Detection of Abuse in Financial Transaction Descriptions Using Machine
Learning [4.04516535783148]
本稿では,銀行業務の文脈における技術支援的虐待の問題点について述べる。
開発モデルとそのパフォーマンス、および運用フレームワークについて概説する。
論文 参考訳(メタデータ) (2023-03-10T06:10:53Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - How Context Affects Language Models' Factual Predictions [134.29166998377187]
検索システムからの情報を学習済みの言語モデルと純粋に教師なしの方法で統合する。
この方法で事前学習された言語モデルを拡張することで、性能が劇的に向上し、教師なしにもかかわらず、結果として得られるシステムは、教師なしの機械読解ベースラインと競合する、と報告する。
論文 参考訳(メタデータ) (2020-05-10T09:28:12Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。