Fugu-MT 論文翻訳(概要): Comparative Analysis of Extrinsic Factors for NER in French

論文の概要: Comparative Analysis of Extrinsic Factors for NER in French

arxiv url: http://arxiv.org/abs/2410.12750v1
Date: Wed, 16 Oct 2024 17:12:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:36.428439
Title: Comparative Analysis of Extrinsic Factors for NER in French
Title（参考訳）: フランス語におけるNERの外部要因の比較分析
Authors: Grace Yang, Zhiyi Li, Yandong Liu, Jungyeul Park,
Abstract要約: 名前付きエンティティ認識(NER)は構造化情報の識別を目的とした重要なタスクである。本稿では,NERモデルの性能向上のために,モデル構造,コーパスアノテーション,データ拡張手法などの諸要因について検討する。
参考スコア（独自算出の注目度）: 4.495136742990196
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Named entity recognition (NER) is a crucial task that aims to identify structured information, which is often replete with complex, technical terms and a high degree of variability. Accurate and reliable NER can facilitate the extraction and analysis of important information. However, NER for other than English is challenging due to limited data availability, as the high expertise, time, and expenses are required to annotate its data. In this paper, by using the limited data, we explore various factors including model structure, corpus annotation scheme and data augmentation techniques to improve the performance of a NER model for French. Our experiments demonstrate that these approaches can significantly improve the model's F1 score from original CRF score of 62.41 to 79.39. Our findings suggest that considering different extrinsic factors and combining these techniques is a promising approach for improving NER performance where the size of data is limited.
Abstract（参考訳）: 名前付きエンティティ認識(NER)は構造化情報を特定することを目的とした重要なタスクである。正確で信頼性の高いNERは、重要な情報の抽出と分析を容易にする。しかし、NERは、データのアノテートに高い専門性、時間、費用を必要とするため、データの可用性が限られているため、英語以外の分野では困難である。本稿では, 限定データを用いて, モデル構造, コーパスアノテーション, データ拡張手法などの諸要因を探索し, フランス語NERモデルの性能向上を図る。実験により,これらの手法はモデルのF1スコアを62.41から79.39に向上させることができることが示された。以上の結果から,データサイズが制限されたNERの性能向上には,異なる外部要因を考慮し,これらの手法を組み合わせることが有望なアプローチであることが示唆された。

関連論文リスト

AI Generated Text Detection [0.0]
本稿では,従来の機械学習モデルとトランスフォーマーベースアーキテクチャの両方を含む,AIテキスト検出手法の評価を行う。我々は、HC3とDAIGT v2という2つのデータセットを使用して、統一されたベンチマークを構築し、情報漏洩を防止するためにトピックベースのデータ分割を適用する。その結果、文脈モデリングは語彙的特徴よりもはるかに優れていることが示され、話題記憶の緩和の重要性が強調された。
論文参考訳（メタデータ） (2026-01-07T11:18:10Z)
ProtoTSNet: Interpretable Multivariate Time Series Classification With Prototypical Parts [6.99674326582747]
ProtoTSNetは時系列データの解釈可能な分類のための新しいアプローチである。我々のイノベーションの中心は、グループ畳み込みを利用した畳み込みエンコーダであり、オートエンコーダの一部として事前訓練可能である。
論文参考訳（メタデータ） (2025-11-04T00:42:42Z)
FactorLLM: Factorizing Knowledge via Mixture of Experts for Large Language Models [50.331708897857574]
本稿では,高度に訓練された高密度FFNを余分なサブネットワークに分解する新しいアプローチであるFacterLLMを紹介する。 FactorLLMは、最大85%のモデル性能を確保しながら、推論速度を30%以上増加させながら、ソースモデルに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-08-15T16:45:16Z)
Conformalised data synthesis [0.0]
コンフォーマル予測フレームワークに基づく高信頼特徴空間領域からデータを生成する合成アルゴリズムを提案する。ユビキタスな現実世界の課題に対する我々のアプローチの汎用性を示すため、データセットは様々な困難な特徴に対して慎重に選択された。すべての試験において、自信ある合成データによって拡張されたトレーニングセットは、少なくとも元のセットと同様に実行され、最大61パーセントのF1スコアでDeep Learningのパフォーマンスが大幅に向上した。
論文参考訳（メタデータ） (2023-12-14T14:44:08Z)
Extrinsic Factors Affecting the Accuracy of Biomedical NER [0.1529342790344802]
バイオメディカル・ネーム・エンティティ・認識(NER)は、臨床テキスト中の構造化情報を特定することを目的とした批判的タスクである。バイオメディカル領域のNERは、限られたデータ可用性のために困難である。
論文参考訳（メタデータ） (2023-05-29T15:29:49Z)
Review of coreference resolution in English and Persian [8.604145658574689]
参照解決(CR)は、同じ現実世界の実体を参照する表現を識別する。本稿では、コア参照とアナフォラ分解能にまたがるCRの最近の進歩について考察する。ペルシャのCRの独特な課題を認識し、このアンダーリソース言語に焦点をあてる。
論文参考訳（メタデータ） (2022-11-08T18:14:09Z)
MINER: Improving Out-of-Vocabulary Named Entity Recognition from an Information Theoretic Perspective [57.19660234992812]
NERモデルは標準のNERベンチマークで有望な性能を達成した。近年の研究では、従来のアプローチはエンティティ参照情報に過度に依存し、OoV(out-of-vocabulary)エンティティ認識の性能が劣っていることが示されている。我々は、情報理論の観点からこの問題を改善するための新しいNER学習フレームワークであるMINERを提案する。
論文参考訳（メタデータ） (2022-04-09T05:18:20Z)
SAIS: Supervising and Augmenting Intermediate Steps for Document-Level Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文参考訳（メタデータ） (2021-09-24T17:37:35Z)
A Comprehensive Review on Summarizing Financial News Using Deep Learning [8.401473551081747]
自然言語処理技術は通常、そのような大量のデータを扱うために使われ、そこから貴重な情報を得るのに使用される。本研究では,BoW,TF-IDF,Word2Vec,BERT,GloVe,FastTextなどの埋め込み技術を用いて,RNNやLSTMなどのディープラーニングモデルに入力する。ディープリーミングは、望まれる結果を得るか、最先端技術よりも高い精度を達成するために適用されることが期待された。
論文参考訳（メタデータ） (2021-09-21T12:00:31Z)
Counterfactual Explanations as Interventions in Latent Space [62.997667081978825]
反現実的な説明は、望ましい結果を達成するために変更が必要な機能のセットをエンドユーザに提供することを目的としています。現在のアプローチでは、提案された説明を達成するために必要な行動の実現可能性を考慮することはめったにない。本稿では,非現実的説明を生成する手法として,潜時空間における干渉としての対実的説明(CEILS)を提案する。
論文参考訳（メタデータ） (2021-06-14T20:48:48Z)
Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文参考訳（メタデータ） (2020-11-13T10:53:27Z)
Improving Named Entity Recognition with Attentive Ensemble of Syntactic Information [36.03316058182617]
名前付きエンティティ認識(NER)は、セマンティック・セマンティック・セマンティック・プロパティに非常に敏感である。本稿では,暗黙のアンサンブルによって異なるタイプの構文情報を活用することにより,NERを改善する。 6つの英語と中国語のベンチマークデータセットの実験結果から,提案手法の有効性が示唆された。
論文参考訳（メタデータ） (2020-10-29T10:25:17Z)
Rethinking Generalization of Neural Models: A Named Entity Recognition Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文参考訳（メタデータ） (2020-01-12T04:33:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。