論文の概要: A Modular Approach for Multilingual Timex Detection and Normalization
using Deep Learning and Grammar-based methods
- arxiv url: http://arxiv.org/abs/2304.14221v1
- Date: Thu, 27 Apr 2023 14:32:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-28 13:09:48.275702
- Title: A Modular Approach for Multilingual Timex Detection and Normalization
using Deep Learning and Grammar-based methods
- Title(参考訳): 深層学習と文法に基づく多言語時間検出と正規化のためのモジュール手法
- Authors: Nayla Escribano, German Rigau, Rodrigo Agerri
- Abstract要約: 本稿では,細調整されたマスケッド言語モデルと文法ベース正規化器を組み合わせたモジュール型多言語時間処理システムを提案する。
金の時空正規化, 時間差検出, 型認識, およびTempEval-3緩和値測定器の競合性能を比較検討した。
- 参考スコア(独自算出の注目度): 10.871587311621974
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting and normalizing temporal expressions is an essential step for many
NLP tasks. While a variety of methods have been proposed for detection, best
normalization approaches rely on hand-crafted rules. Furthermore, most of them
have been designed only for English. In this paper we present a modular
multilingual temporal processing system combining a fine-tuned Masked Language
Model for detection, and a grammar-based normalizer. We experiment in Spanish
and English and compare with HeidelTime, the state-of-the-art in multilingual
temporal processing. We obtain best results in gold timex normalization, timex
detection and type recognition, and competitive performance in the combined
TempEval-3 relaxed value metric. A detailed error analysis shows that detecting
only those timexes for which it is feasible to provide a normalization is
highly beneficial in this last metric. This raises the question of which is the
best strategy for timex processing, namely, leaving undetected those timexes
for which is not easy to provide normalization rules or aiming for high
coverage.
- Abstract(参考訳): 時間的表現の検出と正規化は多くのNLPタスクにとって重要なステップである。
検出には様々な方法が提案されているが、最良の正規化手法は手作りの規則に依存している。
さらに、そのほとんどは英語専用にデザインされている。
本稿では,細調整されたマスケッド言語モデルと文法ベース正規化器を組み合わせたモジュール型多言語時間処理システムを提案する。
我々はスペイン語と英語で実験を行い、多言語時間処理における最先端技術であるHeidelTimeと比較した。
金の時空正規化, 時間差検出, 型認識, およびTempEval-3緩和値測定器の競合性能を比較検討した。
詳細な誤差解析は、この最後の計量において正規化を提供することが可能な時間軸のみを検出することが非常に有益であることを示している。
これは timex 処理における最善の戦略である、すなわち正規化ルールの提供が容易でない、あるいは高いカバレッジを目指すような、検出されていない timex を残している、という疑問を提起する。
関連論文リスト
- MAGNET: Improving the Multilingual Fairness of Language Models with Adaptive Gradient-Based Tokenization [81.83460411131931]
マルチ言語設定では、非ラテン語スクリプトと低リソース言語は通常、言語モデルの実用性、効率、コストの点で不利である。
適応的勾配に基づくサブワードトークン化による過分割を低減するために,多言語適応型勾配ベーストークン化を提案する。
論文 参考訳(メタデータ) (2024-07-11T18:59:21Z) - Discourse-Aware In-Context Learning for Temporal Expression Normalization [7.621550020607368]
本研究では、TE正規化のためのプロプライエタリおよびオープンソースの大規模言語モデル(LLM)の実現可能性について検討する。
ウィンドウベースのプロンプト設計アプローチを用いることで、モデルを訓練することなくLLM知識を活用しながら、文間でTE正規化を行うことができる。
この課題のために設計されたモデルに対する競争結果を示す実験を行った。
論文 参考訳(メタデータ) (2024-04-11T14:13:44Z) - Hard Nominal Example-aware Template Mutual Matching for Industrial
Anomaly Detection [74.9262846410559]
textbfHard Nominal textbfExample-aware textbfTemplate textbfMutual textbfMatching (HETMM)
textitHETMMは、厳密なプロトタイプベースの決定境界を構築することを目的としており、ハードノミナルな例と異常を正確に区別することができる。
論文 参考訳(メタデータ) (2023-03-28T17:54:56Z) - Modeling Sequential Sentence Relation to Improve Cross-lingual Dense
Retrieval [87.11836738011007]
マスク付き文モデル(MSM)と呼ばれる多言語多言語言語モデルを提案する。
MSMは、文表現を生成する文エンコーダと、文書から文ベクトルのシーケンスに適用される文書エンコーダとから構成される。
モデルをトレーニングするために,サンプル負の階層的コントラスト損失によって文ベクトルをマスクし,予測するマスク付き文予測タスクを提案する。
論文 参考訳(メタデータ) (2023-02-03T09:54:27Z) - Spatio-temporal predictive tasks for abnormal event detection in videos [60.02503434201552]
オブジェクトレベルの正規化パターンを学習するための制約付きプレテキストタスクを提案する。
我々のアプローチは、ダウンスケールの視覚的クエリとそれに対応する正常な外観と運動特性のマッピングを学習することである。
いくつかのベンチマークデータセットの実験では、異常の局所化と追跡のためのアプローチの有効性が示されている。
論文 参考訳(メタデータ) (2022-10-27T19:45:12Z) - A Template-based Method for Constrained Neural Machine Translation [100.02590022551718]
本稿では,デコード速度を維持しつつ,高い翻訳品質と精度で結果が得られるテンプレートベースの手法を提案する。
テンプレートの生成と導出は、1つのシーケンスからシーケンスまでのトレーニングフレームワークを通じて学習することができる。
実験結果から,提案手法は語彙的,構造的に制約された翻訳タスクにおいて,いくつかの代表的ベースラインを上回り得ることが示された。
論文 参考訳(メタデータ) (2022-05-23T12:24:34Z) - Multilingual Normalization of Temporal Expressions with Masked Language
Models [26.473014733177475]
マスク付き言語モデルに基づく時間表現の正規化のための新しいニューラル手法を提案する。
提案手法は,多くの言語,特に性能が35 F1まで向上した低リソース言語において,従来のルールベースシステムよりも優れている。
論文 参考訳(メタデータ) (2022-05-20T18:34:23Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Automatic Rule Generation for Time Expression Normalization [9.7662192009858]
本稿では,専門家の介入なしにトレーニングデータから正規化ルールを自動生成するARTimeという新しい手法を提案する。
具体的には、ARTimeは注釈付きデータから可能な操作シーケンスを自動的にキャプチャし、共通表面形式を持つ時間式上で正規化ルールを生成する。
実験の結果, ARTime は Tweets ベンチマークの SOTA メソッドをはるかに上回り,TempEval-3 ベンチマークの既存の専門家によるルール手法と競合する結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-08-31T07:44:38Z) - Ensemble Grammar Induction For Detecting Anomalies in Time Series [6.161998499946999]
アンサンブル学習を利用した文法推論に基づく異常検出手法を提案する。
提案手法は既存の文法推論に基づく手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-01-29T21:33:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。