論文の概要: Peacemaker at ATE-IT: Automatic term extraction from Italian text for waste management data using encoder model
- arxiv url: http://arxiv.org/abs/2606.01469v1
- Date: Sun, 31 May 2026 22:06:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.71901
- Title: Peacemaker at ATE-IT: Automatic term extraction from Italian text for waste management data using encoder model
- Title(参考訳): ATE-ITのピースメーカー:エンコーダモデルを用いた廃棄物管理データのためのイタリア語テキストの自動抽出
- Authors: Mahdi Bakhtiyarzadeh, Hadi Bayrami Asl Tekanlou, Jafar Razmara,
- Abstract要約: ATE共有タスクのタスクAに対して,低コストかつ解釈可能な自動用語抽出手法を提案する。
本手法は,少量の計算資源上で動作可能な微調整抽出戦略を利用する。
- 参考スコア(独自算出の注目度): 0.6882042556551609
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The development of automatic term extraction has become increasingly important in modern technology. Automatic term extraction can be found in virtually every search engine that is currently available to users. Recent advancements have provided promising results for the extraction of automatic terms; however, accurate labeling is difficult because of several factors, such as the limited number of annotated documents available for training and the complexity of extracting multi-word expressions due to shifts in the domain. In this paper, we will present a low-cost and interpretable method of automatic term extraction, developed specifically for Task A of the ATE Shared Task. This new method utilizes fine-tuning extraction strategies that can run on a small amount of computational resources. We evaluated our automated system using both type-level and micro-level measures of precision, recall, and F1-score to measure both complementary aspects of the extraction performance. According to the experimental results, our proposed approach achieves consistent and balanced performance compared to other teams. Even though the technique itself is relatively straightforward, it serves as a good starting point for low-resource models. Overall, the findings point toward the possibility of significant future advancements (in model expansion) with higher-level performance still able to retain their ability to be interpreted.
- Abstract(参考訳): 自動用語抽出の開発は、現代技術においてますます重要になっている。
自動用語抽出は、現在ユーザーが利用できるほぼすべての検索エンジンで見ることができる。
近年, 自動用語の抽出に有望な成果が得られたが, 注記文書の数が限られていること, ドメインの変化による多語表現の抽出が複雑であるなど, 正確なラベル付けは困難である。
本稿では,ATE共有タスクのタスクAに特化して開発された,低コストかつ解釈可能な自動項抽出手法を提案する。
本手法は,少量の計算資源上で動作可能な微調整抽出戦略を利用する。
抽出性能の相補的両面を測定するために, 精度, リコール, F1スコアの両値を用いて自動システムの評価を行った。
実験結果によると,提案手法は,他のチームと比較して一貫した,バランスの取れたパフォーマンスを実現する。
テクニック自体は比較的単純ですが、低リソースモデルの出発点として役立ちます。
全体としては、高いレベルのパフォーマンスで解釈能力を維持することができるような、大幅な将来的な進歩(モデル拡張)の可能性を示している。
関連論文リスト
- Evaluating LLM-Based Goal Extraction in Requirements Engineering: Prompting Strategies and Their Limitations [4.451267761568192]
本稿では,Goal-Oriented Requirements Engineering(GORE)プロセスを自動化するための,ソフトウェアドキュメントから機能目標を抽出するアプローチについて議論する。
これらの機能を実装するために,工学的なプロンプトを組み込んだ大規模言語モデルの連鎖を提案する。
パイプラインは最終段階である低レベルゴール識別において61%の精度を達成したが、これらの結果は手動抽出を高速化するツールとして最適であることを示している。
論文 参考訳(メタデータ) (2026-04-24T04:22:17Z) - Semantically Labelled Automata for Multi-Task Reinforcement Learning with LTL Instructions [61.479946958462754]
エージェントが単一のユニバーサルポリシーを学習する環境であるマルチタスク強化学習(RL)について検討する。
本稿では,新世代の意味翻訳を利用したタスク埋め込み手法を提案する。
論文 参考訳(メタデータ) (2026-02-06T14:46:27Z) - Knowledge-Informed Automatic Feature Extraction via Collaborative Large Language Model Agents [3.913122709822389]
Rogue Oneは知識インフォームド自動特徴抽出のための新しいマルチエージェントフレームワークである。
Rogue Oneは、19の分類と9の回帰データセットからなる総合的なスイートにおいて、最先端の手法を大幅に上回っていることを実証した。
論文 参考訳(メタデータ) (2025-11-19T03:27:14Z) - Leveraging Vision Capabilities of Multimodal LLMs for Automated Data Extraction from Plots [0.0]
現在の大規模言語モデルでは,プロットから正確にデータを抽出することが可能であることを示す。
この能力は事前訓練されたモデルに固有のものであり、ゼロショットのプロンプトのチェーン・オブ・シークエンスで達成できる。
論文 参考訳(メタデータ) (2025-03-16T02:41:43Z) - A Universal Prompting Strategy for Extracting Process Model Information from Natural Language Text using Large Language Models [0.8899670429041453]
生成型大規模言語モデル(LLM)は,広範囲なデータを必要とすることなく,非常に高品質なNLPタスクを解くことができることを示す。
新たなプロンプト戦略に基づいて,LLMが最先端の機械学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-07-26T06:39:35Z) - Learning Task Automata for Reinforcement Learning using Hidden Markov
Models [37.69303106863453]
本稿では,非マルコフ型タスク仕様を簡潔な有限状態タスクオートマトンとして学習するための新しいパイプラインを提案する。
我々は,その製品 MDP を部分的に観測可能な MDP として扱い,よく知られた Baum-Welch アルゴリズムを用いて隠れマルコフモデルを学習することで,仕様のオートマトンと環境の MDP からなるモデルである製品 MDP を学習する。
我々の学習タスクオートマトンはタスクをその構成サブタスクに分解し、RLエージェントが後に最適なポリシーを合成できる速度を改善する。
論文 参考訳(メタデータ) (2022-08-25T02:58:23Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z) - Scaling Systematic Literature Reviews with Machine Learning Pipelines [57.82662094602138]
体系的なレビューは、科学的文書からデータを抽出する。
これらの側面をそれぞれ自動化するパイプラインを構築し、多くの人間時間対システム品質トレードオフを実験します。
人間の専門的アノテーションの2週間だけで、パイプラインシステム全体の驚くほどの精度と一般性が得られることが分かりました。
論文 参考訳(メタデータ) (2020-10-09T16:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。