論文の概要: Novel Benchmark for NER in the Wastewater and Stormwater Domain
- arxiv url: http://arxiv.org/abs/2506.01938v1
- Date: Mon, 02 Jun 2025 17:54:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.693471
- Title: Novel Benchmark for NER in the Wastewater and Stormwater Domain
- Title(参考訳): 排水・雨水分野におけるNERの新たな評価基準
- Authors: Franco Alberto Cardillo, Franca Debole, Francesca Frontini, Mitra Aelami, Nanée Chahinian, Serge Conrad,
- Abstract要約: 本研究では, 排水管理のためのドメイン固有テキストコーパスを開発した。
LLMベースのアプローチを含む最先端のNER手法を評価し、将来の戦略の信頼性の高いベースラインを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective wastewater and stormwater management is essential for urban sustainability and environmental protection. Extracting structured knowledge from reports and regulations is challenging due to domainspecific terminology and multilingual contexts. This work focuses on domain-specific Named Entity Recognition (NER) as a first step towards effective relation and information extraction to support decision making. A multilingual benchmark is crucial for evaluating these methods. This study develops a French-Italian domain-specific text corpus for wastewater management. It evaluates state-of-the-art NER methods, including LLM-based approaches, to provide a reliable baseline for future strategies and explores automated annotation projection in view of an extension of the corpus to new languages.
- Abstract(参考訳): 都市の持続可能性や環境保護には, 効果的な排水・雨水管理が不可欠である。
レポートや規則から構造化された知識を抽出することは、ドメイン固有の用語と多言語コンテキストのために困難である。
この研究は、意思決定を支援するための効果的な関係と情報抽出への第一歩として、ドメイン固有の名前付きエンティティ認識(NER)に焦点を当てている。
これらの手法を評価するには多言語ベンチマークが不可欠である。
本研究では, 排水管理のためのドメイン固有テキストコーパスを開発した。
LLMベースのアプローチを含む最先端のNER手法を評価し、将来の戦略のための信頼性の高いベースラインを提供し、コーパスの新たな言語への拡張の観点から、自動アノテーションプロジェクションを探索する。
関連論文リスト
- Foundations and Evaluations in NLP [1.0619039878979954]
この回顧録では,自然言語処理(NLP)の基本的側面として,言語資源の作成とNLPシステムの性能評価について考察する。
私の研究は、形態学から意味論まで言語特性をキャプチャする、韓国語のための形態素ベースのアノテーションスキームの開発に重点を置いてきた。
I have proposed a novel evaluation framework, the jp-algorithm, which is introduced a alignment-based method to address challenges in preprocessing task。
論文 参考訳(メタデータ) (2025-04-02T04:14:03Z) - Unsupervised Named Entity Disambiguation for Low Resource Domains [0.4297070083645049]
GST(Group Steiner Trees)の概念を利用した教師なしアプローチを提案する。
GSTは、候補エンティティ間のコンテキスト的類似性を用いて、最も関連性の高いエンティティの曖昧さの候補を特定することができる。
我々は、さまざまなドメイン固有のデータセットでPrecision@1の観点で、最先端の教師なしメソッドを40%以上(例では)上回っています。
論文 参考訳(メタデータ) (2024-12-13T11:35:00Z) - Long Range Named Entity Recognition for Marathi Documents [0.3958317527488535]
本稿では,Marathi 文書用に設計されている現在の NER 技術について包括的に分析する。
BERTトランスフォーマーモデルによる長距離マラソンNERの可能性を調査し、現在のプラクティスを掘り下げる。
本稿は,NERがNLPにおいて重要な役割を担っていることを認めつつ,マラティの特定の言語的特徴と文脈的微妙さによって引き起こされる困難について論じる。
論文 参考訳(メタデータ) (2024-10-11T18:48:20Z) - FecTek: Enhancing Term Weight in Lexicon-Based Retrieval with Feature Context and Term-level Knowledge [54.61068946420894]
FEature Context と TErm レベルの知識モジュールを導入して,革新的な手法を提案する。
項重みの特徴コンテキスト表現を効果的に強化するために、FCM(Feature Context Module)が導入された。
また,用語レベルの知識を効果的に活用し,用語重みのモデル化プロセスをインテリジェントに導くための用語レベルの知識誘導モジュール(TKGM)を開発した。
論文 参考訳(メタデータ) (2024-04-18T12:58:36Z) - Specifying Genericity through Inclusiveness and Abstractness Continuous Scales [1.024113475677323]
本稿では,自然言語における名詞句(NP)の詳細なモデリングのための新しいアノテーションフレームワークを提案する。
このフレームワークはシンプルで直感的に設計されており、専門家でないアノテータにもアクセスでき、クラウドソースのタスクに適している。
論文 参考訳(メタデータ) (2024-03-22T15:21:07Z) - Cross-domain Chinese Sentence Pattern Parsing [67.1381983012038]
文パターン構造解析(SPS)は、主に言語教育に使用される構文解析法である。
既存のSPSは教科書のコーパスに大きく依存しており、クロスドメイン機能に欠ける。
本稿では,大規模言語モデル(LLM)を自己学習フレームワーク内で活用する革新的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T05:30:48Z) - Leveraging Large Language Models for NLG Evaluation: Advances and Challenges [57.88520765782177]
大規模言語モデル(LLM)は、コヒーレンス、クリエイティビティ、コンテキスト関連など、生成されたコンテンツ品質を評価するための新たな道を開いた。
既存のLCMに基づく評価指標を整理し、これらの手法を理解し比較するための構造化された枠組みを提供する。
本稿では, 偏見, 堅牢性, ドメイン固有性, 統一評価などの未解決課題を議論することによって, 研究者に洞察を提供し, より公平で高度なNLG評価手法を提唱することを目的とする。
論文 参考訳(メタデータ) (2024-01-13T15:59:09Z) - DomBERT: Domain-oriented Language Model for Aspect-based Sentiment
Analysis [71.40586258509394]
本研究では、ドメイン内コーパスと関連するドメインコーパスの両方から学習するためのBERTの拡張であるDomBERTを提案する。
アスペクトベース感情分析における課題の整理実験を行い、有望な結果を示す。
論文 参考訳(メタデータ) (2020-04-28T21:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。