論文の概要: IDEA2: Expert-in-the-loop competency question elicitation for collaborative ontology engineering
- arxiv url: http://arxiv.org/abs/2604.01344v1
- Date: Wed, 01 Apr 2026 19:54:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:09.865798
- Title: IDEA2: Expert-in-the-loop competency question elicitation for collaborative ontology engineering
- Title(参考訳): IDEA2:コラボレーティブオントロジー工学のためのエキスパート・イン・ザ・ループ能力問題
- Authors: Elliott Watkiss-Leek, Reham Alharbi, Harry Rostron, Andrew Ng, Ewan Johnson, Andrew Mitchell, Terry R. Payne, Valentina Tamma, Jacopo de Berardinis,
- Abstract要約: 本稿では,この課題に対処するために,Large Language Models (LLMs) を協調的かつエキスパート・ザ・ループプロセスに統合した,新しい半自動化ワークフロー IDEA2 を紹介する。
各CQのライフサイクル全体は、編集、匿名化されたフィードバック、生成パラメータの全行をキャプチャするプロファイランスモデルを使用して追跡される。
- 参考スコア(独自算出の注目度): 0.25649622173185915
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Competency question (CQ) elicitation represents a critical but resource-intensive bottleneck in ontology engineering. This foundational phase is often hampered by the communication gap between domain experts, who possess the necessary knowledge, and ontology engineers, who formalise it. This paper introduces IDEA2, a novel, semi-automated workflow that integrates Large Language Models (LLMs) within a collaborative, expert-in-the-loop process to address this challenge. The methodology is characterised by a core iterative loop: an initial LLM-based extraction of CQs from requirement documents, a co-creational review and feedback phase by domain experts on an accessible collaborative platform, and an iterative, feedback-driven reformulation of rejected CQs by an LLM until consensus is achieved. To ensure transparency and reproducibility, the entire lifecycle of each CQ is tracked using a provenance model that captures the full lineage of edits, anonymised feedback, and generation parameters. The workflow was validated in 2 real-world scenarios (scientific data, cultural heritage), demonstrating that IDEA2 can accelerate the requirements engineering process, improve the acceptance and relevance of the resulting CQs, and exhibit high usability and effectiveness among domain experts. We release all code and experiments at https://github.com/KE-UniLiv/IDEA2
- Abstract(参考訳): コンピテンシー質問 (CQ) は、オントロジー工学において重要ながリソース集約的なボトルネックである。
この基礎的なフェーズは、必要な知識を持つドメインの専門家とそれを形式化するオントロジーエンジニアとのコミュニケーションギャップによって、しばしば妨げられます。
本稿では,この課題に対処するために,Large Language Models (LLMs) を協調的かつエキスパート・ザ・ループプロセスに統合した,新しい半自動化ワークフロー IDEA2 を紹介する。
この手法は,要求文書からCQを抽出する最初のLCMに基づく反復的ループ,アクセス可能な協調プラットフォーム上でのドメイン専門家による共同作成レビューとフィードバックフェーズ,LCMが合意に達するまで拒否されたCQを反復的かつフィードバック駆動的に再構成すること,などによって特徴付けられる。
透明性と再現性を確保するため、各CQのライフサイクル全体は、編集、匿名化されたフィードバック、生成パラメータの全行をキャプチャする証明モデルを使用して追跡される。
このワークフローは、2つの現実シナリオ(科学データ、文化遺産)で検証され、IDEA2が要求エンジニアリングプロセスを加速し、結果のCQの受け入れと関連性を改善し、ドメインの専門家の間で高いユーザビリティと有効性を示すことを示した。
すべてのコードと実験はhttps://github.com/KE-UniLiv/IDEA2で公開しています。
関連論文リスト
- SWE-QA-Pro: A Representative Benchmark and Scalable Training Recipe for Repository-Level Code Understanding [41.98672557723593]
SWEQA-Proは,多種多様な長期リポジトリと実行可能な環境から構築されたベンチマークである。
さらに,2段階のトレーニングレシピであるSupervised Fine-Tuning(SFT)とReinforcement Learning from AI Feedback(RLAIF)という,スケーラブルな合成データパイプラインを提案する。
SWE-QA-ProのGPT-4oを2.3ポイント超え、最先端モデルとのギャップを大幅に狭める。
論文 参考訳(メタデータ) (2026-03-17T05:12:48Z) - Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows [0.0]
大規模言語モデル(LLM)は、研究者の平易な言語目標を実行可能計算に変換するが、科学的な要求決定論、証明、ガバナンスに変換することができる。
我々は、スキーマゲートオーケストレーションを解決原則として提案するので、完全なアクション(ステップ間の依存関係を含む)がマシンチェック可能な仕様に対して検証されない限り、何も実行されない。
論文 参考訳(メタデータ) (2026-03-06T15:40:39Z) - Orchestrating LLM Agents for Scientific Research: A Pilot Study of Multiple Choice Question (MCQ) Generation and Evaluation [0.0]
大規模言語モデル (LLMs) は急速に科学的研究を変容させているが、これらのシステムが研究活動を再形成する方法に関する実証的な証拠は依然として限られている。
人間の研究者が複数のLSMエージェントを協調してデータ抽出、コーパス構築、アーティファクト生成、アーティファクト評価を行うAIオーケストレーション研究ワークフローの混合手法によるパイロット評価を報告する。
論文 参考訳(メタデータ) (2026-02-21T16:20:07Z) - WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents [72.28593628378991]
WebResearcherは、マルコフ決定プロセスとしてディープリサーチを再構築する反復的なディープリサーチパラダイムである。
WebResearcherは最先端のパフォーマンスを実現し、フロンティアのプロプライエタリシステムを超えています。
論文 参考訳(メタデータ) (2025-09-16T17:57:17Z) - Toward Generalizable Evaluation in the LLM Era: A Survey Beyond Benchmarks [229.73714829399802]
この調査は、大規模言語モデルの台頭が評価に役立っている中核的な課題を調査する。
i) タスク固有のものから能力に基づく評価へと、知識、推論、指示に従うこと、マルチモーダル理解、安全性といったコア能力に関するベンチマークを再編成する。
この問題と、上記の2つのトランジションの中核的な課題を、メソッド、データセット、評価器、メトリクスの観点から検討する。
論文 参考訳(メタデータ) (2025-04-26T07:48:52Z) - A Survey of Frontiers in LLM Reasoning: Inference Scaling, Learning to Reason, and Agentic Systems [93.8285345915925]
推論(Reasoning)は、論理的推論、問題解決、意思決定を可能にする基本的な認知プロセスである。
大規模言語モデル(LLM)の急速な進歩により、推論は高度なAIシステムを区別する重要な能力として浮上した。
我々は,(1)推論が達成される段階を定義するレジーム,(2)推論プロセスに関与するコンポーネントを決定するアーキテクチャの2つの側面に沿って既存の手法を分類する。
論文 参考訳(メタデータ) (2025-04-12T01:27:49Z) - A RAG Approach for Generating Competency Questions in Ontology Engineering [1.0044270899550196]
LLM(Large Language Models)の出現により、このプロセスの自動化と強化が可能になった。
本稿では,LLMを用いてCQの自動生成を行うRAG(Research-augmented Generation)手法を提案する。
2つのドメインエンジニアリングタスクで GPT-4 を用いて実験を行い、ドメインの専門家が構築した地味な CQ と比較する。
論文 参考訳(メタデータ) (2024-09-13T13:34:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。