論文の概要: From Subsumption to Satisfiability: LLM-Assisted Active Learning for OWL Ontologies
- arxiv url: http://arxiv.org/abs/2604.16672v1
- Date: Fri, 17 Apr 2026 20:05:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 14:04:47.800786
- Title: From Subsumption to Satisfiability: LLM-Assisted Active Learning for OWL Ontologies
- Title(参考訳): 仮定から満足度へ:OWLオントロジーのためのLCM支援アクティブラーニング
- Authors: Haoruo Zhao, Wenshuo Tang, Duncan Guthrie, Michele Sevegnani, David Flynn, Paul Harvey,
- Abstract要約: アクティブな学習では、メンバシップクエリ(MQ)によって、学習者が教師に質問をすることができる。
我々は、各候補公理を対応する対概念に再構成し、制御された自然言語で言語化する。
対概念のインスタンスを近似する実世界の例を提供する第3のコンポーネントとして、Large Language Models (LLMs)を紹介します。
- 参考スコア(独自算出の注目度): 1.1351175212666613
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In active learning, membership queries (MQs) allow a learner to pose questions to a teacher, such as ''Is every apple a fruit?'', to which the teacher responds correctly with yes or no. These MQs can be viewed as subsumption tests with respect to the target ontology. Inspired by the standard reduction of subsumption to satisfiability in description logics, we reformulate each candidate axiom into its corresponding counter-concept and verbalise it in controlled natural language before presenting it to Large Language Models (LLMs). We introduce LLMs as a third component that provides real-world examples approximating an instance of the counter-concept. This design property ensures that only Type II errors may occur in ontology modelling; in the worst case, these errors merely delay the construction process without introducing inconsistencies. Experimental results on 13 commercial LLMs show that recall, corresponding to Type II errors in our framework, remains stable across several well-established ontologies.
- Abstract(参考訳): アクティブな学習では、メンバシップクエリ(MQ)は、学習者が「すべてのリンゴは果物なのか?」といった質問を、教師がイエスまたはノーで正しく答えることを可能にする。
これらのMQは、ターゲットオントロジーに関して、仮定テストと見なすことができる。
記述論理学における仮定の標準化と満足度の向上に刺激されて、各候補公理を対応する対概念に再構成し、制御された自然言語で言語化し、大言語モデル(LLM)に提示する。
LLMを実世界の実例を提供する第3のコンポーネントとして紹介する。
この設計特性は、オントロジーモデリングにおいてタイプIIエラーのみが発生することを保証する。
13の商用LCM実験の結果,本フレームワークのタイプIIエラーに対応するリコールが,確立したオントロジーにおいて安定であることが確認された。
関連論文リスト
- Beyond Memorization: Testing LLM Reasoning on Unseen Theory of Computation Tasks [8.210112631285666]
大規模言語モデル(LLM)は、形式的な言語タスクにおいて強力なパフォーマンスを示している。
正規言語を用いた決定論的有限オートマトン (DFA) 構築のためのベンチマークを導入する。
モデルが実際の質問に対して完璧に精度を達成し、タスクに対して84-90%を達成できることを示すが、その精度は目に見えない問題に対して急激に低下する。
論文 参考訳(メタデータ) (2026-01-19T21:00:31Z) - WakenLLM: Evaluating Reasoning Potential and Stability in LLMs via Fine-Grained Benchmarking [34.350505059394536]
大規模言語モデル(LLM)は、推論タスクにおいて未知のラベルを頻繁に出力する。
我々は、モデル非能力に起因する未知の出力の一部を定量化するフレームワーク、WakenLLMを紹介した。
論文 参考訳(メタデータ) (2025-07-22T03:21:48Z) - NeuralNexus at BEA 2025 Shared Task: Retrieval-Augmented Prompting for Mistake Identification in AI Tutors [0.12499537119440242]
本稿では, BEA 2025共有タスクにおけるトラック1のミステイク同定システムについて述べる。
この課題は、教師の反応が学生の推論における誤りを正しく識別するかどうかを評価することである。
我々のシステムは意味的に類似した例を検索し、構造化されたプロンプトを構築し、生成可能な予測をスキーマ誘導解析する。
論文 参考訳(メタデータ) (2025-06-12T12:11:56Z) - What Makes In-context Learning Effective for Mathematical Reasoning: A Theoretical Analysis [81.15503859645149]
本稿では,大規模言語モデルの推論性能に及ぼす文脈内実演の影響を理論的に解析することを目的とする。
本稿では, LMS3 という, 単純で一般化可能な, 低複雑さな実演選択法を提案する。
論文 参考訳(メタデータ) (2024-12-11T11:38:11Z) - What Do Language Models Learn in Context? The Structured Task Hypothesis [89.65045443150889]
大規模言語モデル(LLM)は、インコンテキスト学習(ICL)と呼ばれるデモで提示されたインコンテキストの例から新しいタスクを学習する
一般的な仮説の一つは、タスク選択によるICLの説明である。
もう一つの一般的な仮説は、ICLはメタ学習の一形態である、すなわち、モデルが事前学習時に学習アルゴリズムを学習し、それを実演に適用する、というものである。
論文 参考訳(メタデータ) (2024-06-06T16:15:34Z) - Uncertainty Quantification for In-Context Learning of Large Language Models [52.891205009620364]
大規模言語モデル(LLM)の画期的な能力として、文脈内学習が登場している。
両タイプの不確かさを定量化するための新しい定式化法とそれに対応する推定法を提案する。
提案手法は、プラグイン・アンド・プレイ方式でコンテキスト内学習の予測を理解するための教師なしの方法を提供する。
論文 参考訳(メタデータ) (2024-02-15T18:46:24Z) - CLOMO: Counterfactual Logical Modification with Large Language Models [109.60793869938534]
本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。
このタスクでは、LLMは所定の論理的関係を維持するために、与えられた議論的テキストを順応的に変更しなければなりません。
LLMの自然言語出力を直接評価する革新的な評価指標である自己評価スコア(SES)を提案する。
論文 参考訳(メタデータ) (2023-11-29T08:29:54Z) - Large Language Models are Better Reasoners with Self-Verification [48.534270563880845]
大規模言語モデル(LLM)は、いくつかの自然言語処理タスクにおいて強力な推論能力を示している。
思考の連鎖(CoT)を促進させるLLMは、個別のミスに非常に敏感な、多段階のプロンプトと多段階の予測を必要とする。
また,LLMにも同様な自己検証能力があることを示す。
論文 参考訳(メタデータ) (2022-12-19T15:51:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。