論文の概要: Nested Named Entity Recognition in Plasma Physics Research Articles
- arxiv url: http://arxiv.org/abs/2602.11163v1
- Date: Sat, 17 Jan 2026 08:59:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-15 14:54:53.713385
- Title: Nested Named Entity Recognition in Plasma Physics Research Articles
- Title(参考訳): プラズマ物理研究論文におけるNested Named Entity Recognition
- Authors: Muhammad Haris, Hans Höft, Markus M. Becker, Markus Stocker,
- Abstract要約: 本稿では,プラズマ物理研究論文から名前付きエンティティを抽出するための軽量なアプローチを提案する。
まず、ネストされたNERタスク用に設計された16のクラスで、プラズマ物理コーパスに注釈を付ける。
第2に,独立したBERT-CRFモデルをプラズマ物理テキスト中の個々のエンティティタイプを認識するために訓練する,エンティティ固有モデル特殊化手法を評価する。
- 参考スコア(独自算出の注目度): 1.6507722022407412
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named Entity Recognition (NER) is an important task in natural language processing that aims to identify and extract key entities from unstructured text. We present a novel application of NER in plasma physics research articles and address the challenges of extracting specialized entities from scientific text in this domain. Research articles in plasma physics often contain highly complex and context-rich content that must be extracted to enable, e.g., advanced search. We propose a lightweight approach based on encoder-transformers and conditional random fields to extract (nested) named entities from plasma physics research articles. First, we annotate a plasma physics corpus with 16 classes specifically designed for the nested NER task. Second, we evaluate an entity-specific model specialization approach, where independent BERT-CRF models are trained to recognize individual entity types in plasma physics text. Third, we integrate an optimization process to systematically fine-tune hyperparameters and enhance model performance. Our work contributes to the advancement of entity recognition in plasma physics and also provides a foundation to support researchers in navigating and analyzing scientific literature.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、構造化されていないテキストからキーエンティティを識別し抽出することを目的とした自然言語処理において重要なタスクである。
本稿では,プラズマ物理研究論文におけるNERの新たな応用について述べるとともに,この領域における科学文献から専門エンティティを抽出する際の課題に対処する。
プラズマ物理学の研究論文は、しばしば高度な探索を可能にするために抽出される、非常に複雑で文脈に富んだ内容を含んでいる。
本稿では,エンコーダ変換器と条件付きランダム場に基づくプラズマ物理研究論文から名前付きエンティティを抽出する軽量なアプローチを提案する。
まず、ネストされたNERタスク用に設計された16のクラスで、プラズマ物理コーパスに注釈を付ける。
第2に,独立したBERT-CRFモデルをプラズマ物理テキスト中の個々のエンティティタイプを認識するために訓練する,エンティティ固有モデル特殊化手法を評価する。
第3に,過度パラメータを体系的に微調整し,モデル性能を向上させる最適化プロセスを統合する。
我々の研究は、プラズマ物理学における実体認識の進歩に寄与し、科学文献のナビゲートと分析の研究者を支援する基盤を提供する。
関連論文リスト
- Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects [59.51185639557874]
本稿では,任意のRGB画像やテキスト記述から直接音声オブジェクトを合成するフレームワークであるKinematifyを紹介する。
提案手法は, 高DoFオブジェクトに対する運動的トポロジの推測と静的幾何からの関節パラメータの推定という2つの課題に対処する。
論文 参考訳(メタデータ) (2025-11-03T07:21:42Z) - Probing the Critical Point (CritPt) of AI Reasoning: a Frontier Physics Research Benchmark [49.42250115889234]
本研究では,研究レベルの推論タスクにおいて,大規模言語モデル(LLM)をテストするために設計された最初のベンチマークを示す。
CritPtは71の複合研究課題からなる。
現在最先端のLCMは、孤立したチェックポイントを早期に保証しているが、完全な研究スケールの課題を確実に解決できるには程遠い。
論文 参考訳(メタデータ) (2025-09-30T17:34:03Z) - PhysGaia: A Physics-Aware Dataset of Multi-Body Interactions for Dynamic Novel View Synthesis [62.283499219361595]
PhysGaiaは動的ノベルビュー合成(DyNVS)のために設計された物理対応のデータセットである。
私たちのデータセットは、複数のオブジェクト間のリッチな相互作用を伴う複雑な動的シナリオを提供します。
PhysGaiaは、動的ビュー合成、物理に基づくシーン理解、および物理シミュレーションと統合されたディープラーニングモデルの研究を著しく前進させる。
論文 参考訳(メタデータ) (2025-06-03T12:19:18Z) - Physics-based AI methodology for Material Parameter Extraction from Optical Data [0.0]
提案モデルでは,従来の最適化フレームワークとマルチスケールオブジェクト検出フレームワークを統合した。
テラヘルツおよび赤外周波数におけるシミュレーション伝送スペクトルの性能評価と解析を行った。
論文 参考訳(メタデータ) (2025-03-11T08:49:45Z) - Large Physics Models: Towards a collaborative approach with Large Language Models and Foundation Models [8.320153035338418]
本稿では、物理固有の大規模AIモデルの開発と評価のためのアイデアを探求し、潜在的ロードマップを提供する。
これらのモデルは、Large Language Models (LLMs) のような基礎モデルに基づいており、物理学研究の要求に対応するように調整されている。
論文 参考訳(メタデータ) (2025-01-09T17:11:22Z) - PhysBERT: A Text Embedding Model for Physics Scientific Literature [0.0]
本稿では,最初の物理固有テキスト埋め込みモデルであるPhysBERTを紹介する。
120万のarXiv物理論文のキュレートされたコーパスで事前訓練され、教師付きデータで微調整されたPhysBERTは、物理学固有のタスクに関する一般的なモデルよりも優れています。
論文 参考訳(メタデータ) (2024-08-18T19:18:12Z) - INDUS: Effective and Efficient Language Models for Scientific Applications [8.653859684720231]
言語モデル(LLM)は、自然言語処理(NLP)タスクにおいて顕著な結果を示した。
我々は、地球科学、生物学、物理学、生物物理学、惑星科学、天体物理学の密接に関連する分野に合わせた総合的なLLMスイートであるINDUSを開発した。
本稿では,RoBERTa(汎用)とSCIBERT(ドメイン固有)の両方のエンコーダにおいて,新たなタスクや関心領域における既存のタスクよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-05-17T12:15:07Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Nested Named Entity Recognition as Holistic Structure Parsing [92.8397338250383]
本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2022-04-17T12:48:20Z) - Method and Dataset Entity Mining in Scientific Literature: A CNN +
Bi-LSTM Model with Self-attention [21.93889297841459]
MDERと呼ばれる新しいエンティティ認識モデルを提案し、科学的論文から効果的にメソッドとデータセットを抽出することができる。
我々は,NLP,CV,データマイニング,AIの4つの研究分野の論文から構築したデータセットのモデルを評価する。
論文 参考訳(メタデータ) (2020-10-26T13:38:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。