論文の概要: ReXCL: A Tool for Requirement Document Extraction and Classification
- arxiv url: http://arxiv.org/abs/2504.07562v1
- Date: Thu, 10 Apr 2025 08:46:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:23:34.559142
- Title: ReXCL: A Tool for Requirement Document Extraction and Classification
- Title(参考訳): ReXCL: ドキュメントの抽出と分類に必要なツール
- Authors: Paheli Bhattacharya, Manojit Chakraborty, Santhosh Kumar Arumugam, Rishabh Gupta,
- Abstract要約: ReXCLツールは、要求工学における抽出と分類プロセスを自動化する。
性能評価は、ReXCLが要求管理の効率と正確性を大幅に改善することを示している。
- 参考スコア(独自算出の注目度): 3.888266374580385
- License:
- Abstract: This paper presents the ReXCL tool, which automates the extraction and classification processes in requirement engineering, enhancing the software development lifecycle. The tool features two main modules: Extraction, which processes raw requirement documents into a predefined schema using heuristics and predictive modeling, and Classification, which assigns class labels to requirements using adaptive fine-tuning of encoder-based models. The final output can be exported to external requirement engineering tools. Performance evaluations indicate that ReXCL significantly improves efficiency and accuracy in managing requirements, marking a novel approach to automating the schematization of semi-structured requirement documents.
- Abstract(参考訳): 本稿では,要求工学における抽出・分類プロセスを自動化するReXCLツールについて述べる。
このツールは、ヒューリスティックスと予測モデリングを使って生の要求文書を事前定義されたスキーマに処理する抽出と、エンコーダベースのモデルの適応的な微調整を使用してクラスラベルを要求に割り当てる分類という2つの主要なモジュールを備えている。
最終的な出力は、外部要求エンジニアリングツールにエクスポートできる。
性能評価は、ReXCLが要求管理の効率と正確性を大幅に改善し、半構造化要求文書のスキーマ化を自動化する新しいアプローチを示すことを示している。
関連論文リスト
- Self-Refinement Strategies for LLM-based Product Attribute Value Extraction [51.45146101802871]
本稿では,製品属性値抽出タスクに2つの自己補充手法を適用した。
実験の結果, 2つの自己補充技術は, 処理コストを大幅に増大させながら, 抽出性能を著しく向上させることができないことがわかった。
開発データを持つシナリオでは、ファインチューニングが最もパフォーマンスが高いのに対して、ファインチューニングの上昇コストは製品記述の量が増加するにつれてバランスがとれる。
論文 参考訳(メタデータ) (2025-01-02T12:55:27Z) - Adaptable Embeddings Network (AEN) [49.1574468325115]
我々はカーネル密度推定(KDE)を用いた新しいデュアルエンコーダアーキテクチャであるAdaptable Embeddings Networks (AEN)を紹介する。
AENは、再トレーニングせずに分類基準のランタイム適応を可能にし、非自己回帰的である。
アーキテクチャのプリプロセスとキャッシュ条件の埋め込み能力は、エッジコンピューティングアプリケーションやリアルタイム監視システムに最適である。
論文 参考訳(メタデータ) (2024-11-21T02:15:52Z) - Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.23571456538149]
本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。
Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。
実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文 参考訳(メタデータ) (2024-10-31T16:34:03Z) - Digital requirements engineering with an INCOSE-derived SysML meta-model [0.0]
我々は、モデルベース構造化要求SysMLプロファイルを拡張して、要求書作成のためのINCOSEガイドに準拠します。
結果のSysMLプロファイルはNASAジェット推進研究所の2つのシステムアーキテクチャモデルに適用された。
論文 参考訳(メタデータ) (2024-10-12T03:06:13Z) - CRAFT Your Dataset: Task-Specific Synthetic Dataset Generation Through Corpus Retrieval and Augmentation [51.2289822267563]
合成データセットを生成するCRAFT(Corpus Retrieval and Augmentation for Fine-Tuning)を提案する。
我々は、大規模な公開ウェブクローラコーパスと類似性に基づく文書検索を用いて、他の関連する人文文書を検索する。
我々は,CRAFTが4つのタスクに対して,大規模タスク固有のトレーニングデータセットを効率的に生成できることを実証した。
論文 参考訳(メタデータ) (2024-09-03T17:54:40Z) - Automated Configuration Synthesis for Machine Learning Models: A git-Based Requirement and Architecture Management System [5.095988654970361]
この作業では、ソフトウェアコードとともにgitリポジトリ(T-Reqs)にアーティファクトとして格納されたテキスト要求からランタイム設定を自動的に生成するツールを導入している。
このツールは、T-Reqsでモデル化されたアーキテクチャ記述を利用して、人工知能(AI)対応ソフトウェアシステムのデプロイに必要な構成特性を特定する。
論文 参考訳(メタデータ) (2024-04-26T08:35:02Z) - Retrieval as Attention: End-to-end Learning of Retrieval and Reading
within a Single Transformer [80.50327229467993]
学習した1つのモデルが競合検索とQA性能の両方を達成可能であることを示す。
エンドツーエンド適応は、教師なし設定と教師なし設定の両方において、ドメイン外のデータセットのパフォーマンスを大幅に向上させることを示す。
論文 参考訳(メタデータ) (2022-12-05T04:51:21Z) - Natural Language Processing for Systems Engineering: Automatic
Generation of Systems Modelling Language Diagrams [0.10312968200748115]
構造化されていない自然言語テキストからシステム図の自動生成を支援する手法が提案されている。
目的は、より標準化され、包括的で自動化されたスタートポイントをユーザに提供することです。
論文 参考訳(メタデータ) (2022-08-09T19:20:33Z) - Document-level Entity-based Extraction as Template Generation [13.110360825201044]
本稿では2つの文書レベルEEタスクのための生成フレームワークを提案する: 役割充足者エンティティ抽出(REE)と関係抽出(RE)である。
まず、テンプレート生成問題として定式化し、モデルが依存性を効率的にキャプチャできるようにする。
キー情報の識別能力を高めるために、新しいクロスアテンションガイド付きコピー機構であるTopK Copyを事前訓練されたシーケンス・ツー・シーケンスモデルに組み込む。
論文 参考訳(メタデータ) (2021-09-10T14:18:22Z) - GRIT: Generative Role-filler Transformers for Document-level Event
Entity Extraction [134.5580003327839]
本稿では、文書レベルでコンテキストをモデル化するための生成トランスフォーマーベースのエンコーダデコーダフレームワーク(GRIT)を紹介する。
我々は,MUC-4データセットに対する我々のアプローチを評価し,我々のモデルが先行作業よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-08-21T01:07:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。