論文の概要: Domain-Specific Fine-Tuning and Prompt-Based Learning: A Comparative Study for developing Natural Language-Based BIM Information Retrieval Systems
- arxiv url: http://arxiv.org/abs/2508.05676v1
- Date: Tue, 05 Aug 2025 08:51:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:05.922423
- Title: Domain-Specific Fine-Tuning and Prompt-Based Learning: A Comparative Study for developing Natural Language-Based BIM Information Retrieval Systems
- Title(参考訳): ドメイン特化ファインチューニングとプロンプトベース学習:自然言語に基づくBIM情報検索システムの開発のための比較研究
- Authors: Han Gao, Timo Hartmann, Botao Zhong, Kai Lia, Hanbin Luo,
- Abstract要約: 自然言語インタフェース(NLI)システムは,建築情報モデリング環境において,情報検索のためのユーザフレンドリなツールとして研究されている。
その可能性にもかかわらず、自然言語クエリを通して正確にBIM関連のデータを抽出することは、依然として永続的な課題である。
本研究では,NLIに基づくBIM情報検索システムを構築するための2つの重要なアプローチの比較分析を行った。
- 参考スコア(独自算出の注目度): 2.686558478755501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building Information Modeling (BIM) is essential for managing building data across the entire lifecycle, supporting tasks from design to maintenance. Natural Language Interface (NLI) systems are increasingly explored as user-friendly tools for information retrieval in Building Information Modeling (BIM) environments. Despite their potential, accurately extracting BIM-related data through natural language queries remains a persistent challenge due to the complexity use queries and specificity of domain knowledge. This study presents a comparative analysis of two prominent approaches for developing NLI-based BIM information retrieval systems: domain-specific fine-tuning and prompt-based learning using large language models (LLMs). A two-stage framework consisting of intent recognition and table-based question answering is implemented to evaluate the effectiveness of both approaches. To support this evaluation, a BIM-specific dataset of 1,740 annotated queries of varying types across 69 models is constructed. Experimental results show that domain-specific fine-tuning delivers superior performance in intent recognition tasks, while prompt-based learning, particularly with GPT-4o, shows strength in table-based question answering. Based on these findings, this study identify a hybrid configuration that combines fine-tuning for intent recognition with prompt-based learning for question answering, achieving more balanced and robust performance across tasks. This integrated approach is further tested through case studies involving BIM models of varying complexity. This study provides a systematic analysis of the strengths and limitations of each approach and discusses the applicability of the NLI to real-world BIM scenarios. The findings offer insights for researchers and practitioners in designing intelligent, language-driven BIM systems.
- Abstract(参考訳): 情報モデリング(BIM)の構築は、ライフサイクル全体にわたってデータの構築を管理し、設計からメンテナンスまでのタスクをサポートするために不可欠です。
自然言語インタフェース(NLI)システムは、ビルディング情報モデリング(BIM)環境において、情報検索のためのユーザフレンドリーなツールとして研究されている。
その可能性にもかかわらず、自然言語クエリを通して正確にBIM関連のデータを抽出することは、複雑なクエリの使用とドメイン知識の特異性のために、依然として永続的な課題である。
本研究では,大規模言語モデル(LLM)を用いたドメイン固有微調整と即時学習という,NLIに基づくBIM情報検索システムを構築するための2つの重要なアプローチの比較分析を行った。
両手法の有効性を評価するために,意図認識と表に基づく質問応答からなる2段階のフレームワークを実装した。
この評価を支援するために、69モデルにまたがる様々なタイプの1,740の注釈付きクエリからなるBIM固有のデータセットを構築した。
実験結果から、ドメイン固有の微調整は意図認識タスクにおいて優れた性能を示し、特にGPT-4oでは、テーブルベースの質問応答の強さを示すことがわかった。
これらの知見に基づき,本研究では,意図認識のための微調整と質問応答のための素早い学習を組み合わせるハイブリッド構成を同定し,タスク間のバランスと堅牢性を実現する。
この統合されたアプローチは、様々な複雑さのBIMモデルを含むケーススタディを通じてさらに検証される。
本研究は,それぞれのアプローチの強みと限界を体系的に分析し,実世界のBIMシナリオへのNLIの適用性について考察する。
この発見は、インテリジェントで言語駆動のBIMシステムを設計する研究者や実践者に洞察を与える。
関連論文リスト
- Evaluating Multi-Hop Reasoning in Large Language Models: A Chemistry-Centric Case Study [0.9424565541639368]
化学領域における大規模言語モデルの構成的推論能力を評価するために,キュレートされたデータセットと定義された評価プロセスからなる新しいベンチマークを導入する。
我々の手法はOpenAI推論モデルと名前付きエンティティ認識(NER)システムを統合し、最近の文献から化学物質を抽出し、外部知識ベースで拡張して知識グラフを形成する。
実験により, 最先端モデルでさえ, マルチホップ構成推論において重要な課題に直面していることが明らかとなった。
論文 参考訳(メタデータ) (2025-04-23T04:36:19Z) - LLM-based Bi-level Multi-interest Learning Framework for Sequential Recommendation [54.396000434574454]
本稿では,暗黙的行動と明示的意味論的視点を組み合わせた新しい多目的SRフレームワークを提案する。
Implicit Behavioral Interest ModuleとExplicit Semantic Interest Moduleの2つのモジュールが含まれている。
4つの実世界のデータセットの実験は、フレームワークの有効性と実用性を検証する。
論文 参考訳(メタデータ) (2024-11-14T13:00:23Z) - Aggregated Knowledge Model: Enhancing Domain-Specific QA with Fine-Tuned and Retrieval-Augmented Generation Models [0.0]
本稿では,クローズドドメイン質問応答システム(QA)の新たなアプローチを提案する。
ローレンス・バークレー国立研究所(LBL)科学情報技術(ScienceIT)ドメインの特定のニーズに焦点を当てている。
論文 参考訳(メタデータ) (2024-10-24T00:49:46Z) - BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.936320820180875]
大規模言語モデル(LLM)は、様々な領域でますます重要になっている。
BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。
BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文 参考訳(メタデータ) (2024-10-01T15:11:24Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - On Evaluating the Integration of Reasoning and Action in LLM Agents with
Database Question Answering [25.57202500348071]
本研究では、大規模言語モデルがデータベースとどのように相互作用するかを評価するために設計された、新しい長文データベース質問応答データセットを提案する。
このタスクでは、LLMが戦略的に複数のクエリを生成し、データベースから十分なデータを取得し、取得したコンテキストを推論し、それらを総合的な分析的な物語に合成する必要がある。
本稿では2つのインタラクション戦略を提案し評価し、インタラクション内の個々のステージを詳細に分析する。
論文 参考訳(メタデータ) (2023-11-16T09:55:07Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - An ontology-aided, natural language-based approach for multi-constraint
BIM model querying [0.0]
本稿では,異なる制約を含む自然言語クエリ(NLQ)を,複雑なBIMモデルを問合せするためのコンピュータ可読コードに自動的にマッピングする,新しいオントロジー支援セマンティクスを提案する。
実世界の住宅ビルの設計チェックに関する事例研究は,建設業における提案手法の実践的価値を実証している。
論文 参考訳(メタデータ) (2023-03-27T11:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。