論文の概要: GEDIT: Geographic-Enhanced and Dependency-Guided Tagging for Joint POI
and Accessibility Extraction at Baidu Maps
- arxiv url: http://arxiv.org/abs/2108.09104v1
- Date: Fri, 20 Aug 2021 10:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-23 13:31:27.564642
- Title: GEDIT: Geographic-Enhanced and Dependency-Guided Tagging for Joint POI
and Accessibility Extraction at Baidu Maps
- Title(参考訳): GEDIT: Baidu Mapsにおける共同POIとアクセシビリティ抽出のための地理的拡張および依存性誘導タグ
- Authors: Yibo Sun, Jizhou Huang, Chunyuan Yuan, Miao Fan, Haifeng Wang, Ming
Liu, Bing Qin
- Abstract要約: ビジネス変更の動的な性質のため、POIデータベースを現実世界のデータベースと同期させることは困難です。
構造化されていないテキストからPOIの言及を共同で抽出し、それらが結合したアクセシビリティラベルを識別する実用的なソリューションを定式化し、提示する。
- 参考スコア(独自算出の注目度): 33.24379911783158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Providing timely accessibility reminders of a point-of-interest (POI) plays a
vital role in improving user satisfaction of finding places and making visiting
decisions. However, it is difficult to keep the POI database in sync with the
real-world counterparts due to the dynamic nature of business changes. To
alleviate this problem, we formulate and present a practical solution that
jointly extracts POI mentions and identifies their coupled accessibility labels
from unstructured text. We approach this task as a sequence tagging problem,
where the goal is to produce <POI name, accessibility label> pairs from
unstructured text. This task is challenging because of two main issues: (1) POI
names are often newly-coined words so as to successfully register new entities
or brands and (2) there may exist multiple pairs in the text, which
necessitates dealing with one-to-many or many-to-one mapping to make each POI
coupled with its accessibility label. To this end, we propose a
Geographic-Enhanced and Dependency-guIded sequence Tagging (GEDIT) model to
concurrently address the two challenges. First, to alleviate challenge #1, we
develop a geographic-enhanced pre-trained model to learn the text
representations. Second, to mitigate challenge #2, we apply a relational graph
convolutional network to learn the tree node representations from the parsed
dependency tree. Finally, we construct a neural sequence tagging model by
integrating and feeding the previously pre-learned representations into a CRF
layer. Extensive experiments conducted on a real-world dataset demonstrate the
superiority and effectiveness of GEDIT. In addition, it has already been
deployed in production at Baidu Maps. Statistics show that the proposed
solution can save significant human effort and labor costs to deal with the
same amount of documents, which confirms that it is a practical way for POI
accessibility maintenance.
- Abstract(参考訳): poi(point-of-interest)のタイムリーなアクセシビリティリマインダーの提供は、場所の発見や訪問判断に対するユーザの満足度向上に重要な役割を果たします。
しかし、ビジネスの変化の動的な性質のため、POIデータベースを現実世界のデータベースと同期させることは困難です。
この問題を軽減するために,非構造化テキストからPOIの言及を共同で抽出し,それらが結合したアクセシビリティラベルを識別する実用的なソリューションを定式化し提示する。
非構造化テキストから<poi名,アクセシビリティラベル>ペアを生成することを目的として,シーケンスタグ問題としてこのタスクにアプローチする。
この課題は,(1)POI の名称が新しいエンティティやブランドの登録に成功するためにしばしば新しくコピーされた単語であり,(2) テキスト内に複数のペアが存在し,各POI をアクセシビリティラベルと組み合わせるために1対のマッピングや複数対のマッピングを必要とする,という2つの問題のために難しい。
そこで本稿では,GEDIT(Geographic-Enhanced and Dependency-GuIded sequence Tagging)モデルを提案する。
まず、チャレンジ#1を緩和するために、テキスト表現を学ぶために、地理エンハンスド事前学習モデルを開発した。
第2の課題を緩和するために,関係グラフ畳み込みネットワークを適用し,解析された依存木から木ノード表現を学習する。
最後に、事前に学習した表現をCRF層に統合し、入力することで、ニューラルシーケンスタグ付けモデルを構築する。
実世界のデータセット上で行われた大規模な実験は、GEDITの優位性と有効性を示している。
さらに、すでにBaidu Mapsで本番環境にデプロイされている。
統計によれば、提案されたソリューションは、同じ量の文書を扱うためにかなりの人的労力と労働コストを節約でき、poiアクセシビリティ維持のための実用的な方法であることが示されている。
関連論文リスト
- HGAMN: Heterogeneous Graph Attention Matching Network for Multilingual POI Retrieval at Baidu Maps [35.38790886774177]
本稿ではヘテロジニアスグラフ注意マッチングネットワーク(HGAMN)を提案する。
Baidu Mapsの大規模実世界のデータセットで実施された大規模な実験は、HGAMNの優位性と有効性を示している。
HGAMNはすでにBaidu Mapsで本番環境にデプロイされており、毎日何億ものリクエストを処理しています。
論文 参考訳(メタデータ) (2024-09-05T13:18:01Z) - Unleashing the Potential of Text-attributed Graphs: Automatic Relation Decomposition via Large Language Models [31.443478448031886]
RoSE (Relation-oriented Semantic Edge-Decomposition) は、生のテキスト属性を分析してグラフ構造を分解する新しいフレームワークである。
我々のフレームワークは、さまざまなデータセットのノード分類性能を大幅に向上させ、ウィスコンシンデータセットでは最大16%の改善を実現した。
論文 参考訳(メタデータ) (2024-05-28T20:54:47Z) - CorpusLM: Towards a Unified Language Model on Corpus for Knowledge-Intensive Tasks [20.390672895839757]
Retrieval-augmented Generation (RAG) は、事実精度を高めるための一般的なソリューションとして登場した。
従来の検索モジュールは、大きなドキュメントインデックスと生成タスクとの切り離しに依存していることが多い。
生成検索,クローズドブック生成,RAGを統合した統一言語モデルである textbfCorpusLM を提案する。
論文 参考訳(メタデータ) (2024-02-02T06:44:22Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - Pushing the Limits of ChatGPT on NLP Tasks [79.17291002710517]
ChatGPTの成功にもかかわらず、ほとんどのNLPタスクのパフォーマンスは教師付きベースラインよりかなり低い。
そこで本研究では,原因を調べた結果,以下の要因が原因であることが判明した。
NLPタスクにおけるChatGPTの限界を押し上げるために,これらの問題に対処する汎用モジュールの集合を提案する。
論文 参考訳(メタデータ) (2023-06-16T09:40:05Z) - One-shot Key Information Extraction from Document with Deep Partial
Graph Matching [60.48651298832829]
ドキュメントからキー情報抽出(KIE)は、多くの産業シナリオにおいて効率、生産性、セキュリティを改善する。
KIEタスクのための既存の教師付き学習手法は、多数のラベル付きサンプルを供給し、異なる種類の文書の別々のモデルを学ぶ必要がある。
部分グラフマッチングを用いたワンショットKIEのためのディープエンド・ツー・エンド・トレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-09-26T07:45:53Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - DBTagger: Multi-Task Learning for Keyword Mapping in NLIDBs Using
Bi-Directional Recurrent Neural Networks [0.2578242050187029]
NLQのPOSタグを利用した新しいディープラーニングに基づく教師付きアプローチを提案する。
8つの異なるデータセットに対するアプローチを評価し、最新の精度結果、平均92.4%$を報告します。
論文 参考訳(メタデータ) (2021-01-11T22:54:39Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。