論文の概要: Multinational Address Parsing: A Zero-Shot Evaluation
- arxiv url: http://arxiv.org/abs/2112.04008v1
- Date: Tue, 7 Dec 2021 21:40:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 03:15:37.687937
- Title: Multinational Address Parsing: A Zero-Shot Evaluation
- Title(参考訳): 多国間アドレス解析:ゼロショット評価
- Authors: Marouane Yassine and David Beauchemin and Fran\c{c}ois Laviolette and
Luc Lamontagne
- Abstract要約: アドレス解析は、通り名や郵便番号などのアドレスを構成するセグメントを識別する。
ニューラルネットワークに関するこれまでの研究は、単一のソース国からのアドレスを解析することだけに重点を置いていた。
本稿では,ある国の住所における深層学習モデルの訓練によって得られたアドレス解析知識を他国に移管する可能性について考察する。
- 参考スコア(独自算出の注目度): 0.3211619859724084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Address parsing consists of identifying the segments that make up an address,
such as a street name or a postal code. Because of its importance for tasks
like record linkage, address parsing has been approached with many techniques,
the latest relying on neural networks. While these models yield notable
results, previous work on neural networks has only focused on parsing addresses
from a single source country. This paper explores the possibility of
transferring the address parsing knowledge acquired by training deep learning
models on some countries' addresses to others with no further training in a
zero-shot transfer learning setting. We also experiment using an attention
mechanism and a domain adversarial training algorithm in the same zero-shot
transfer setting to improve performance. Both methods yield state-of-the-art
performance for most of the tested countries while giving good results to the
remaining countries. We also explore the effect of incomplete addresses on our
best model, and we evaluate the impact of using incomplete addresses during
training. In addition, we propose an open-source Python implementation of some
of our trained models.
- Abstract(参考訳): アドレス解析は、住所(街路名や郵便番号など)を構成するセグメントを識別することから成り立っている。
レコードリンクのようなタスクで重要であるため、アドレス解析は多くのテクニックでアプローチされており、最新のものはニューラルネットワークに依存している。
これらのモデルは顕著な結果をもたらすが、ニューラルネットワークに関するこれまでの研究は、単一のソース国からのアドレスを解析することのみに焦点を当てていた。
本稿では,ゼロショット転校学習環境において,深層学習モデルの学習によって得られたアドレス解析知識を,ゼロショット転校学習環境での訓練を行わずに他国に伝達する可能性について検討する。
また、同じゼロショット転送設定において、注意機構とドメイン敵訓練アルゴリズムを用いて、パフォーマンスを向上させる実験を行った。
どちらの方法も、テストされたほとんどの国で最先端のパフォーマンスをもたらし、残りの国に良い結果を与える。
また,最善のモデルに対する不完全アドレスの影響についても検討し,トレーニング中の不完全アドレスの使用による影響を評価した。
さらに、いくつかのトレーニングされたモデルのオープンソースpython実装も提案します。
関連論文リスト
- AddressCLIP: Empowering Vision-Language Models for City-wide Image Address Localization [57.34659640776723]
そこで我々は,より意味論的に問題を解決するために,AddressCLIPというエンドツーエンドのフレームワークを提案する。
われわれはピッツバーグとサンフランシスコに3つのデータセットを構築した。
論文 参考訳(メタデータ) (2024-07-11T03:18:53Z) - Methods for Matching English Language Addresses [1.2930673139458417]
我々は、英語のアドレス対のマッチングとミスマッチを生成するためのフレームワークを形式化する。
アドレスマッチングを自動的に行うための様々な手法を評価する。
論文 参考訳(メタデータ) (2024-03-14T10:39:14Z) - Deepparse : An Extendable, and Fine-Tunable State-Of-The-Art Library for
Parsing Multinational Street Addresses [0.0]
本稿では、LGPL-3.0ライセンス下でPythonのオープンソースで拡張可能で、微調整可能なアドレス解析ソリューションであるDeepparseについて述べる。
任意の言語で書かれたアドレスを解析し、任意のアドレス標準を使用することができる。
ライブラリは、カスタムアドレスを生成するために、新しいデータによる微調整をサポートする。
論文 参考訳(メタデータ) (2023-11-20T15:37:33Z) - CDFSL-V: Cross-Domain Few-Shot Learning for Videos [58.37446811360741]
ビデオのアクション認識は、いくつかのラベル付き例でのみ、新しいカテゴリを認識するための効果的なアプローチである。
既存のビデオアクション認識の方法は、同じドメインからの大きなラベル付きデータセットに依存している。
本稿では,自己教師付き学習とカリキュラム学習を活用した,クロスドメインな数ショットビデオ行動認識手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T19:44:27Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Learning from Language Description: Low-shot Named Entity Recognition
via Decomposed Framework [23.501276952950366]
本研究では,自然言語の監視から学習し,目に見えないエンティティクラスの識別を可能にする新しいNERフレームワークであるSpanNERを提案する。
筆者らは5つのベンチマークデータセットについて広範な実験を行い、提案手法を数ショットの学習、ドメイン転送、ゼロショットの学習設定で評価した。
実験結果から,提案手法は, 最良ベースラインの10%, 23%, 26%を, 最良ベースライン, ドメイン転送, ゼロショット学習設定でそれぞれ改善できることがわかった。
論文 参考訳(メタデータ) (2021-09-11T19:52:09Z) - Unsupervised Paraphrasing with Pretrained Language Models [85.03373221588707]
教師なし環境で,事前学習した言語モデルを用いて高品質なパラフレーズを生成する訓練パイプラインを提案する。
提案手法は,タスク適応,自己スーパービジョン,動的ブロッキング(Dynamic Blocking)という新しい復号アルゴリズムから構成される。
提案手法は,Quora Question PairとParaNMTの両方のデータセット上で,最先端の性能を達成できることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:55:28Z) - Deep Contextual Embeddings for Address Classification in E-commerce [0.03222802562733786]
インドのような発展途上国のEコマース顧客は、発送先を入力している間、固定フォーマットに従わない傾向にある。
アドレスの言語を理解することは必須であり、出荷を遅延なくルーティングできる。
自然言語処理(NLP)の最近の進歩からモチベーションを導き,顧客アドレスを理解するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-06T19:06:34Z) - Leveraging Subword Embeddings for Multinational Address Parsing [0.0764671395172401]
我々は、複数の国のアドレスを同時に解析できる単一のモデルを構築します。
我々は,事前処理や後処理を必要とせず,訓練に使用する国で約99%のアキュラティを達成している。
ゼロショット・トランスファー・ラーニング・セッティングにおいて、一部の国のアドレスのトレーニングによって得られたアドレス解析知識を、それ以上の訓練を受けずに他国に転送する可能性について検討する。
論文 参考訳(メタデータ) (2020-06-29T16:14:27Z) - Pre-training Text Representations as Meta Learning [113.3361289756749]
本稿では,下流タスクを効果的に学習するために,モデルがテキスト表現を学習する能力を直接最適化する学習アルゴリズムを提案する。
マルチタスク事前学習とモデル非依存型メタラーニングの間には,一連のメタトレインステップによる本質的な関係があることが示されている。
論文 参考訳(メタデータ) (2020-04-12T09:05:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。