論文の概要: On-Device Information Extraction from SMS using Hybrid Hierarchical
Classification
- arxiv url: http://arxiv.org/abs/2002.02755v1
- Date: Mon, 3 Feb 2020 09:24:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 08:29:29.705982
- Title: On-Device Information Extraction from SMS using Hybrid Hierarchical
Classification
- Title(参考訳): ハイブリッド階層分類を用いたSMSからのオンデバイス情報抽出
- Authors: Shubham Vatsal, Naresh Purre, Sukumar Moharana, Gopi Ramena, Debi
Prasanna Mohanty
- Abstract要約: SMSから適切な情報を整理して抽出し,さらに直感的なテンプレートで表示する,ユニークなアーキテクチャを提案する。
提案アーキテクチャでは,Hybrid Hierarchical Long Short Term Memory (LSTM) Neural Network (CNN) を用いて,SMS を複数のクラスに分類し,関連する情報を抽出するエンティティのセットを用いる。
プリプロセッシング技術を用いたアーキテクチャは、SMSデータに見られる膨大な変動を考慮しつつ、推論タイミングとサイズの観点からデバイス上の機能(携帯電話)を効率化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cluttering of SMS inbox is one of the serious problems that users today face
in the digital world where every online login, transaction, along with
promotions generate multiple SMS. This problem not only prevents users from
searching and navigating messages efficiently but often results in users
missing out the relevant information associated with the corresponding SMS like
offer codes, payment reminders etc. In this paper, we propose a unique
architecture to organize and extract the appropriate information from SMS and
further display it in an intuitive template. In the proposed architecture, we
use a Hybrid Hierarchical Long Short Term Memory (LSTM)-Convolutional Neural
Network (CNN) to categorize SMS into multiple classes followed by a set of
entity parsers used to extract the relevant information from the classified
message. The architecture using its preprocessing techniques not only takes
into account the enormous variations observed in SMS data but also makes it
efficient for its on-device (mobile phone) functionalities in terms of
inference timing and size.
- Abstract(参考訳): SMSの受信箱の切断は、オンラインログイン、トランザクション、プロモーションが複数のSMSを生成するデジタル世界で現在ユーザーが直面している深刻な問題の1つだ。
この問題は、ユーザーがメッセージの検索やナビゲートを効率的に行うのを防ぐだけでなく、提供コードや支払いリマインダーなど、対応するsmsに関連する情報を失うことが多い。
本稿では,SMSから適切な情報を整理して抽出し,さらに直感的なテンプレートで表示する,ユニークなアーキテクチャを提案する。
提案アーキテクチャでは,Hybrid Hierarchical Long Short Term Memory (LSTM)-Convolutional Neural Network (CNN) を用いてSMSを複数のクラスに分類し,その後に分類されたメッセージから関連情報を抽出するエンティティパーサのセットを用いる。
そのプリプロセッシング技術を用いたアーキテクチャは、smsデータで観測される膨大なバリエーションを考慮に入れるだけでなく、推測のタイミングとサイズの観点から、デバイス上の機能(携帯電話)の効率性も考慮に入れている。
関連論文リスト
- ExplainableDetector: Exploring Transformer-based Language Modeling Approach for SMS Spam Detection with Explainability Analysis [2.849988619791745]
近年、SMSスパムの数は大幅に増加している。
SMSデータの非構造化フォーマットは、SMSスパム検出に重大な課題をもたらす。
我々は、スパムメッセージ検出の問題を解決するために、最適化および微調整された変換器ベース大規模言語モデル(LLM)を用いる。
論文 参考訳(メタデータ) (2024-05-12T11:42:05Z) - Identifying Banking Transaction Descriptions via Support Vector Machine Short-Text Classification Based on a Specialized Labelled Corpus [7.046417074932257]
本稿では,自然言語処理技術と機械学習アルゴリズムを組み合わせて,銀行取引記述を分類する新しいシステムについて述べる。
また,スパム検出における既存のソリューションに触発されて,ジャカード距離に基づくトレーニングセットサイズの削減を目的とした,短いテキスト類似度検出手法を提案する。
Google PlayとApp Storeで利用可能なパーソナルファイナンスアプリケーションCoinScrapのユースケースを提示する。
論文 参考訳(メタデータ) (2024-03-29T13:15:46Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Enhancing Large Language Model with Self-Controlled Memory Framework [56.38025154501917]
大きな言語モデル(LLM)は、長い入力を処理できないため、重要な歴史的情報が失われる。
本稿では,LLMが長期記憶を維持し,関連する情報をリコールする能力を高めるための自己制御メモリ(SCM)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-26T07:25:31Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - SCROLLS: Standardized CompaRison Over Long Language Sequences [62.574959194373264]
SCROLLSは長いテキストに対する推論を必要とするタスクのスイートである。
SCROLLSには要約、質問応答、自然言語推論タスクが含まれる。
すべてのデータセットを統一されたテキスト・ツー・テキスト形式で利用可能にし、モデルアーキテクチャと事前学習方法の研究を容易にするために、ライブのリーダーボードをホストします。
論文 参考訳(メタデータ) (2022-01-10T18:47:15Z) - Adaptive Beam Search to Enhance On-device Abstractive Summarization [2.4763587045241553]
デバイス上での抽象的な要約の質を向上させるために,新しい適応ビーム探索を提案する。
メモリフットプリントが97.6%少ないこのモデルでは、BERTと比較すると、同じまたはそれ以上のキー情報を抽出する。
論文 参考訳(メタデータ) (2021-12-22T16:54:06Z) - Disentangling Online Chats with DAG-Structured LSTMs [55.33014148383343]
DAG-LSTMはTree-LSTMの一般化であり、間接的な非循環的依存関係を処理できる。
提案する新モデルでは,リプライ・トゥ・リレーション(Repend-to-Relation)を回復する作業において,アート・ステータスの状態を達成できることが示される。
論文 参考訳(メタデータ) (2021-06-16T18:00:00Z) - On-Device Tag Generation for Unstructured Text [0.0]
本稿では,非構造化テキストに存在するキーワードや概念に基づいて,世界知識を用いてタグの集合を生成する新しいパイプラインを提案する。
アーキテクチャはまた、任意のテキストからトップnタグを抽出する新しいランキングアルゴリズムも提示する。
論文 参考訳(メタデータ) (2020-12-05T09:18:43Z) - On-Device Sentence Similarity for SMS Dataset [0.0]
検索やナビゲーションの強化など,さまざまなアプリケーションにおいて,SMSデータの類似性を評価する必要がある。
SMSテキスト間のテキスト類似性を評価するためのユニークなパイプラインを提案する。
論文 参考訳(メタデータ) (2020-12-04T19:51:24Z) - Deep Graph Matching and Searching for Semantic Code Retrieval [76.51445515611469]
本稿では,グラフニューラルネットワークに基づくエンドツーエンドのディープグラフマッチングと探索モデルを提案する。
まず、自然言語クエリテキストとプログラミング言語のコードスニペットをグラフ構造化データで表現する。
特に、DGMSは、個々のクエリテキストやコードスニペットのより構造的な情報をキャプチャするだけでなく、それらの微妙な類似性も学習する。
論文 参考訳(メタデータ) (2020-10-24T14:16:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。