論文の概要: A Deep Learning Approach to Geographical Candidate Selection through
Toponym Matching
- arxiv url: http://arxiv.org/abs/2009.08114v2
- Date: Tue, 22 Sep 2020 14:24:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 12:06:52.817461
- Title: A Deep Learning Approach to Geographical Candidate Selection through
Toponym Matching
- Title(参考訳): 地名マッチングによる地理的候補選択への深層学習アプローチ
- Authors: Mariona Coll Ardanuy, Kasra Hosseini, Katherine McDonough, Amrey
Krause, Daniel van Strien and Federico Nanni
- Abstract要約: トポニムマッチングによる候補選択のためのフレキシブルな深層学習手法を提案する。
いくつかの新しい現実的データセットに基づいた固有トポニムマッチング評価を行う。
本報告では, 対数分解能のダウンストリームタスクの文脈における候補選択の性能について報告する。
- 参考スコア(独自算出の注目度): 4.456206353869195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognizing toponyms and resolving them to their real-world referents is
required for providing advanced semantic access to textual data. This process
is often hindered by the high degree of variation in toponyms. Candidate
selection is the task of identifying the potential entities that can be
referred to by a toponym previously recognized. While it has traditionally
received little attention in the research community, it has been shown that
candidate selection has a significant impact on downstream tasks (i.e. entity
resolution), especially in noisy or non-standard text. In this paper, we
introduce a flexible deep learning method for candidate selection through
toponym matching, using state-of-the-art neural network architectures. We
perform an intrinsic toponym matching evaluation based on several new realistic
datasets, which cover various challenging scenarios (cross-lingual and regional
variations, as well as OCR errors). We report its performance on candidate
selection in the context of the downstream task of toponym resolution, both on
existing datasets and on a new manually-annotated resource of
nineteenth-century English OCR'd text.
- Abstract(参考訳): テキストデータに高度なセマンティックアクセスを提供するには、トポニムを認識して現実のレファレントに解決する必要がある。
このプロセスは、しばしば頭字語における高い変化によって妨げられる。
候補選択(英: candidate selection)は、以前に認識された頭字語によって参照される可能性のある実体を識別するタスクである。
伝統的に研究コミュニティではほとんど注目されていないが、特にノイズや非標準テキストにおいて、候補選択が下流のタスク(すなわちエンティティの解決)に大きな影響を与えることが示されている。
本稿では,最新のニューラルネットワークアーキテクチャを用いて,トポニムマッチングによる候補選択のための柔軟なディープラーニング手法を提案する。
我々は,様々な難解なシナリオ(言語と地域の違い,OCRの誤り)をカバーする,いくつかの新しい現実的データセットに基づく固有トポニムマッチング評価を行う。
既存のデータセットと、19世紀の英語OCRのテキストを手動で注釈付けした新たなリソースを用いて、トポニム解像度の下流タスクにおける候補選択の性能を報告する。
関連論文リスト
- Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文 参考訳(メタデータ) (2024-03-26T09:25:57Z) - Light Coreference Resolution for Russian with Hierarchical Discourse
Features [0.0]
ニューラルコア参照解決モデルに修辞情報を組み込んだ新しいアプローチを提案する。
部分的に微調整された多言語エンティティ認識言語モデルLUKEを用いて、エンドツーエンドのスパンベースコア参照リゾルバを実装した。
言及間の修辞的距離を用いた最良のモデルでは、開発セット(74.6% F1)で1位、共有タスク(73.3% F1)で2位にランクされている。
論文 参考訳(メタデータ) (2023-06-02T11:41:24Z) - Vocabulary-free Image Classification [75.38039557783414]
VIC(Vocabulary-free Image Classification)と呼ばれる新しいタスクを定式化する。
VICは、既知の語彙を必要とせずに、制約のない言語によって引き起こされる意味空間に存在するクラスを入力画像に割り当てることを目的としている。
CaSEDは、事前訓練された視覚言語モデルと外部視覚言語データベースを利用して、VICをトレーニング不要に対処する手法である。
論文 参考訳(メタデータ) (2023-06-01T17:19:43Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - Global-Local Context Network for Person Search [125.51080862575326]
パーソンサーチは、自然に切り刻まれた画像からクエリーを共同でローカライズし、識別することを目的としている。
我々は,対象人物を取り巻く環境情報を多様かつ局所的に利用し,それぞれがシーンとグループコンテキストを参照する。
本稿では,機能強化を目的としたグローバル・ローカル・コンテキスト・ネットワーク(GLCNet)を提案する。
論文 参考訳(メタデータ) (2021-12-05T07:38:53Z) - UniCon: Unified Context Network for Robust Active Speaker Detection [111.90529347692723]
我々は、堅牢なアクティブ話者検出(ASD)のための新しい効率的なフレームワークUnified Context Network(UniCon)を導入する。
私たちのソリューションは、複数の種類のコンテキスト情報を共同でモデリングすることに焦点を当てた、新しく統合されたフレームワークです。
異なる設定下で、いくつかの挑戦的なASDベンチマークで徹底的なアブレーション研究が実施されている。
論文 参考訳(メタデータ) (2021-08-05T13:25:44Z) - Preliminary Steps Towards Federated Sentiment Classification [17.520351189577]
我々は、コーパスを分散デバイスに格納しなければならないという制約の下で、複数のドメイン感情分類のための連合学習を利用する。
まず,フェデレートされた感情分類におけるモデルアグリゲーションとパーソナライゼーションを改善するための知識伝達強化型私的共有フレームワークを提案する。
第二に、単語ベクトルのリッチな意味と巨大な埋め込みサイズ特性を考慮したKTEPS$star$を提案する。
論文 参考訳(メタデータ) (2021-07-26T04:57:49Z) - Seed Words Based Data Selection for Language Model Adaptation [11.59717828860318]
本稿では,テキストコーパスから文を自動的に選択する手法を提案する。
ベースラインモデルの語彙は拡張・調整され、OOVレートが低下する。
異なる測定値(OOVレート, WER, 精度, リコール)を用いて, 提案手法の有効性を示す。
論文 参考訳(メタデータ) (2021-07-20T12:08:27Z) - Learning to Select Context in a Hierarchical and Global Perspective for
Open-domain Dialogue Generation [15.01710843286394]
階層的自己保持機構と遠隔監視を備えた新しいモデルを提案し、関連する単語と発話を短距離および長距離で検出する。
私たちのモデルは、流速、コヒーレンス、および情報性の観点から他のベースラインを大幅に上回ります。
論文 参考訳(メタデータ) (2021-02-18T11:56:42Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Deep learning models for representing out-of-vocabulary words [1.4502611532302039]
本稿では,語彙外(OOV)単語を表現するためのディープラーニングモデルの性能評価を行う。
OOV単語を扱うための最善のテクニックはタスクごとに異なるが、OV単語のコンテキストと形態構造に基づいて埋め込みを推論する深層学習手法であるComickは、有望な結果を得た。
論文 参考訳(メタデータ) (2020-07-14T19:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。