論文の概要: Novel Benchmark for NER in the Wastewater and Stormwater Domain
- arxiv url: http://arxiv.org/abs/2506.01938v1
- Date: Mon, 02 Jun 2025 17:54:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.693471
- Title: Novel Benchmark for NER in the Wastewater and Stormwater Domain
- Title(参考訳): 排水・雨水分野におけるNERの新たな評価基準
- Authors: Franco Alberto Cardillo, Franca Debole, Francesca Frontini, Mitra Aelami, Nanée Chahinian, Serge Conrad,
- Abstract要約: 本研究では, 排水管理のためのドメイン固有テキストコーパスを開発した。
LLMベースのアプローチを含む最先端のNER手法を評価し、将来の戦略の信頼性の高いベースラインを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective wastewater and stormwater management is essential for urban sustainability and environmental protection. Extracting structured knowledge from reports and regulations is challenging due to domainspecific terminology and multilingual contexts. This work focuses on domain-specific Named Entity Recognition (NER) as a first step towards effective relation and information extraction to support decision making. A multilingual benchmark is crucial for evaluating these methods. This study develops a French-Italian domain-specific text corpus for wastewater management. It evaluates state-of-the-art NER methods, including LLM-based approaches, to provide a reliable baseline for future strategies and explores automated annotation projection in view of an extension of the corpus to new languages.
- Abstract(参考訳): 都市の持続可能性や環境保護には, 効果的な排水・雨水管理が不可欠である。
レポートや規則から構造化された知識を抽出することは、ドメイン固有の用語と多言語コンテキストのために困難である。
この研究は、意思決定を支援するための効果的な関係と情報抽出への第一歩として、ドメイン固有の名前付きエンティティ認識(NER)に焦点を当てている。
これらの手法を評価するには多言語ベンチマークが不可欠である。
本研究では, 排水管理のためのドメイン固有テキストコーパスを開発した。
LLMベースのアプローチを含む最先端のNER手法を評価し、将来の戦略のための信頼性の高いベースラインを提供し、コーパスの新たな言語への拡張の観点から、自動アノテーションプロジェクションを探索する。
関連論文リスト
- Large Language Models in Argument Mining: A Survey [15.041650203089057]
Argument Mining (AM) はテキストから議論的構造を抽出することに焦点を当てている。
LLM(Large Language Models)の出現は、AMを大きく変化させ、高度な文脈内学習を可能にした。
本研究は, LLM駆動型AMの最近の進歩を体系的に合成する。
論文 参考訳(メタデータ) (2025-06-19T15:12:58Z) - Beyond Benchmarks: A Novel Framework for Domain-Specific LLM Evaluation and Knowledge Mapping [0.7555681642774916]
本稿では,言語モデル(LM)評価における2つの重要な課題として,信頼性の高いドメイン固有ベンチマークの作成と,ドメイン適応時の知識表現の理解について論じる。
本稿では,LMや人為的なキュレーションに頼らずに,生のドメインコーパスを補完型ベンチマークに変換する決定論的パイプラインを提案する。
提案手法は,TFとTF-IDFを用いたドメイン固有キーワードと関連する単語リストを生成し,プロンプトとターゲットのペアを構築する。
我々は,これらのプロンプトを適切なドメイン固有ターゲットで完了させる能力を測定し,計算コストの低いドメイン知識を直接評価することによって,モデルを評価する。
論文 参考訳(メタデータ) (2025-06-09T11:30:12Z) - Foundations and Evaluations in NLP [1.0619039878979954]
この回顧録では,自然言語処理(NLP)の基本的側面として,言語資源の作成とNLPシステムの性能評価について考察する。
私の研究は、形態学から意味論まで言語特性をキャプチャする、韓国語のための形態素ベースのアノテーションスキームの開発に重点を置いてきた。
I have proposed a novel evaluation framework, the jp-algorithm, which is introduced a alignment-based method to address challenges in preprocessing task。
論文 参考訳(メタデータ) (2025-04-02T04:14:03Z) - Unsupervised Named Entity Disambiguation for Low Resource Domains [0.4297070083645049]
GST(Group Steiner Trees)の概念を利用した教師なしアプローチを提案する。
GSTは、候補エンティティ間のコンテキスト的類似性を用いて、最も関連性の高いエンティティの曖昧さの候補を特定することができる。
我々は、さまざまなドメイン固有のデータセットでPrecision@1の観点で、最先端の教師なしメソッドを40%以上(例では)上回っています。
論文 参考訳(メタデータ) (2024-12-13T11:35:00Z) - Long Range Named Entity Recognition for Marathi Documents [0.3958317527488535]
本稿では,Marathi 文書用に設計されている現在の NER 技術について包括的に分析する。
BERTトランスフォーマーモデルによる長距離マラソンNERの可能性を調査し、現在のプラクティスを掘り下げる。
本稿は,NERがNLPにおいて重要な役割を担っていることを認めつつ,マラティの特定の言語的特徴と文脈的微妙さによって引き起こされる困難について論じる。
論文 参考訳(メタデータ) (2024-10-11T18:48:20Z) - FecTek: Enhancing Term Weight in Lexicon-Based Retrieval with Feature Context and Term-level Knowledge [54.61068946420894]
FEature Context と TErm レベルの知識モジュールを導入して,革新的な手法を提案する。
項重みの特徴コンテキスト表現を効果的に強化するために、FCM(Feature Context Module)が導入された。
また,用語レベルの知識を効果的に活用し,用語重みのモデル化プロセスをインテリジェントに導くための用語レベルの知識誘導モジュール(TKGM)を開発した。
論文 参考訳(メタデータ) (2024-04-18T12:58:36Z) - Specifying Genericity through Inclusiveness and Abstractness Continuous Scales [1.024113475677323]
本稿では,自然言語における名詞句(NP)の詳細なモデリングのための新しいアノテーションフレームワークを提案する。
このフレームワークはシンプルで直感的に設計されており、専門家でないアノテータにもアクセスでき、クラウドソースのタスクに適している。
論文 参考訳(メタデータ) (2024-03-22T15:21:07Z) - AutoGuide: Automated Generation and Selection of Context-Aware Guidelines for Large Language Model Agents [74.17623527375241]
オフライン体験からコンテキスト認識ガイドラインを自動的に生成する,AutoGuideという新しいフレームワークを導入する。
その結果,本ガイドラインはエージェントの現在の意思決定プロセスに関連性のある知識の提供を促進する。
評価の結果, AutoGuide は複雑なベンチマーク領域において, 競争ベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-03-13T22:06:03Z) - Cross-domain Chinese Sentence Pattern Parsing [67.1381983012038]
文パターン構造解析(SPS)は、主に言語教育に使用される構文解析法である。
既存のSPSは教科書のコーパスに大きく依存しており、クロスドメイン機能に欠ける。
本稿では,大規模言語モデル(LLM)を自己学習フレームワーク内で活用する革新的な手法を提案する。
論文 参考訳(メタデータ) (2024-02-26T05:30:48Z) - Leveraging Large Language Models for NLG Evaluation: Advances and Challenges [57.88520765782177]
大規模言語モデル(LLM)は、コヒーレンス、クリエイティビティ、コンテキスト関連など、生成されたコンテンツ品質を評価するための新たな道を開いた。
既存のLCMに基づく評価指標を整理し、これらの手法を理解し比較するための構造化された枠組みを提供する。
本稿では, 偏見, 堅牢性, ドメイン固有性, 統一評価などの未解決課題を議論することによって, 研究者に洞察を提供し, より公平で高度なNLG評価手法を提唱することを目的とする。
論文 参考訳(メタデータ) (2024-01-13T15:59:09Z) - Learning Domain-Specialised Representations for Cross-Lingual Biomedical
Entity Linking [66.76141128555099]
言語横断型バイオメディカルエンティティリンクタスク(XL-BEL)を提案する。
まず、標準単言語英語BELタスクを超えて、標準単言語および多言語LMと同様に、標準的な知識に依存しない能力について検討する。
次に、リソースに富んだ言語からリソースに乏しい言語にドメイン固有の知識を移すことの課題に対処する。
論文 参考訳(メタデータ) (2021-05-30T00:50:00Z) - DomBERT: Domain-oriented Language Model for Aspect-based Sentiment
Analysis [71.40586258509394]
本研究では、ドメイン内コーパスと関連するドメインコーパスの両方から学習するためのBERTの拡張であるDomBERTを提案する。
アスペクトベース感情分析における課題の整理実験を行い、有望な結果を示す。
論文 参考訳(メタデータ) (2020-04-28T21:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。