論文の概要: Improving Address Matching using Siamese Transformer Networks
- arxiv url: http://arxiv.org/abs/2307.02300v1
- Date: Wed, 5 Jul 2023 13:58:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 13:36:43.677298
- Title: Improving Address Matching using Siamese Transformer Networks
- Title(参考訳): siamese transformer networkを用いたアドレスマッチングの改善
- Authors: Andr\'e V. Duarte and Arlindo L. Oliveira
- Abstract要約: 本研究では,ポルトガル語アドレスに対するアドレスマッチングの効率向上を目的としたディープラーニングモデルを提案する。
このモデルはポルトガルのアドレスの実際のシナリオでテストされ、高い精度を示し、ドアレベルで95%を超えている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Matching addresses is a critical task for companies and post offices involved
in the processing and delivery of packages. The ramifications of incorrectly
delivering a package to the wrong recipient are numerous, ranging from harm to
the company's reputation to economic and environmental costs. This research
introduces a deep learning-based model designed to increase the efficiency of
address matching for Portuguese addresses. The model comprises two parts: (i) a
bi-encoder, which is fine-tuned to create meaningful embeddings of Portuguese
postal addresses, utilized to retrieve the top 10 likely matches of the
un-normalized target address from a normalized database, and (ii) a
cross-encoder, which is fine-tuned to accurately rerank the 10 addresses
obtained by the bi-encoder. The model has been tested on a real-case scenario
of Portuguese addresses and exhibits a high degree of accuracy, exceeding 95%
at the door level. When utilized with GPU computations, the inference speed is
about 4.5 times quicker than other traditional approaches such as BM25. An
implementation of this system in a real-world scenario would substantially
increase the effectiveness of the distribution process. Such an implementation
is currently under investigation.
- Abstract(参考訳): アドレスのマッチングは、パッケージの処理と配送に関わる企業や郵便局にとって重要なタスクである。
間違った受取人にパッケージを誤って届けるという影響は、会社の評判から経済的・環境的なコストまで多岐にわたる。
本研究は、ポルトガル語アドレスのアドレスマッチングの効率を高めるために設計された深層学習に基づくモデルを提案する。
モデルは2つの部分からなる。
i) ポルトガルの郵便アドレスの有意義な埋め込みを作成するために微調整されたバイエンコーダで、正規化データベースから正規化されていないターゲットアドレスのトップ10を検索するために使用される。
(ii)クロスエンコーダを微調整して、バイエンコーダが取得した10個のアドレスを正確にリランクする。
このモデルはポルトガルのアドレスの実際のシナリオでテストされており、ドアレベルでは95%を超える高い精度を示している。
GPU計算で使用する場合、推論速度はBM25のような従来の手法の約4.5倍高速である。
現実シナリオにおける本システムの実装は,配信プロセスの有効性を大幅に向上させる。
その実施は現在調査中である。
関連論文リスト
- AddrLLM: Address Rewriting via Large Language Model on Nationwide Logistics Data [15.64626282181379]
本稿では,検索拡張大言語モデル上に構築されたアドレス書き換えのための革新的なフレームワークであるAddrLLMを紹介する。
これは、厳密に設計されたSupervised Fine-Tuningモジュール、アドレス中心のRetrieval Augmented Generationモジュール、バイアスフリーのObjective Alignmentモジュールによって、上記の制限を克服する。
パーセルの再ローティングの速度を約43%削減し、現実の応用では例外的な効果を誇示している。
論文 参考訳(メタデータ) (2024-11-17T07:32:46Z) - Improvement in Semantic Address Matching using Natural Language Processing [16.09672533759915]
アドレスマッチングは多くの企業にとって,特にデリバリや企業の取り出しにおいて重要なタスクです。
既存のソリューションでは文字列の類似性を使用し、距離アルゴリズムを編集して、アドレスデータベースから類似したアドレスを見つける。
本稿では,可能なアドレスのリストから特定のアドレスを検索できるセマンティックアドレスマッチング手法について論じる。
論文 参考訳(メタデータ) (2024-04-17T18:42:36Z) - Global Point Cloud Registration Network for Large Transformations [46.7301374772952]
ローカルトランスフォーメーションの優れたパフォーマンスを維持しつつ,大規模なトランスフォーメーションが発生するケースに直面するアーキテクチャであるReLaToを提案する。
本稿では,ソフトマックスプーリング層を用いて2つの点集合間の相互一致関係を抽出し,最も確実な一致を抽出する。
そして、得られた一致と潜伏特徴の両方に目標誘導復調ステップを適用し、最終的な微妙な登録を推定する。
論文 参考訳(メタデータ) (2024-03-26T18:52:48Z) - Efficient k-NN Search with Cross-Encoders using Adaptive Multi-Round CUR
Decomposition [77.4863142882136]
クロスエンコーダモデルは、直接k-nearest neighbor(k-NN)サーチには不当に高価である。
本稿では,現実的に重要なトップk近傍の近似誤差を適応的に,反復的に,効率的に最小化するADACURを提案する。
論文 参考訳(メタデータ) (2023-05-04T17:01:17Z) - GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting [121.42898228997538]
精度や一般化を犠牲にすることなく、全てのエージェントとマップに対して効率的な共有符号化を提案する。
不均一空間グラフにおけるエージェントとマップ要素間の幾何学的関係を表現するために、ペアワイズ相対的な位置符号化を利用する。
我々のデコーダは視点非依存であり、レーングラフ上でエージェント目標を予測し、多様かつコンテキスト対応のマルチモーダル予測を可能にする。
論文 参考訳(メタデータ) (2022-11-04T16:10:50Z) - Efficient Nearest Neighbor Search for Cross-Encoder Models using Matrix
Factorization [60.91600465922932]
本稿では,クロスエンコーダのみに頼って,二重エンコーダによる検索を回避する手法を提案する。
我々のアプローチは、現在の広く使われている方法よりも優れたテスト時間リコール-vs計算コストトレードオフを提供する。
論文 参考訳(メタデータ) (2022-10-23T00:32:04Z) - ECO-TR: Efficient Correspondences Finding Via Coarse-to-Fine Refinement [80.94378602238432]
粗大な処理で対応性を見出すことにより、ECO-TR(Correspondence Efficient Transformer)と呼ばれる効率的な構造を提案する。
これを実現するために、複数の変圧器ブロックは段階的に連結され、予測された座標を徐々に洗練する。
種々のスパースタスクと密マッチングタスクの実験は、既存の最先端技術に対する効率性と有効性の両方において、我々の手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-09-25T13:05:33Z) - Should All Proposals be Treated Equally in Object Detection? [110.27485090952385]
オブジェクト検出器の複雑さと精度のトレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。
検出効率の改善には、提案の不平等な処理に向けて、パラダイムシフトが必要であると仮定されている。
これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
論文 参考訳(メタデータ) (2022-07-07T18:26:32Z) - Multinational Address Parsing: A Zero-Shot Evaluation [0.3211619859724084]
アドレス解析は、通り名や郵便番号などのアドレスを構成するセグメントを識別する。
ニューラルネットワークに関するこれまでの研究は、単一のソース国からのアドレスを解析することだけに重点を置いていた。
本稿では,ある国の住所における深層学習モデルの訓練によって得られたアドレス解析知識を他国に移管する可能性について考察する。
論文 参考訳(メタデータ) (2021-12-07T21:40:43Z) - Deep Contextual Embeddings for Address Classification in E-commerce [0.03222802562733786]
インドのような発展途上国のEコマース顧客は、発送先を入力している間、固定フォーマットに従わない傾向にある。
アドレスの言語を理解することは必須であり、出荷を遅延なくルーティングできる。
自然言語処理(NLP)の最近の進歩からモチベーションを導き,顧客アドレスを理解するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-06T19:06:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。