論文の概要: LLM-based Question-Answer Framework for Sensor-driven HVAC System Interaction
- arxiv url: http://arxiv.org/abs/2507.04748v1
- Date: Mon, 07 Jul 2025 08:19:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.325522
- Title: LLM-based Question-Answer Framework for Sensor-driven HVAC System Interaction
- Title(参考訳): センサ駆動型HVACシステムインタラクションのためのLCMに基づく質問応答フレームワーク
- Authors: Sungmin Lee, Minju Kang, Joonhee Lee, Seungyong Lee, Dongju Kim, Jingi Hong, Jun Shin, Pei Zhang, JeongGil Ko,
- Abstract要約: JARVISは、センサーデータ駆動型HVACシステムインタラクションに適した2段階のLLMベースのQAフレームワークである。
高レベルのユーザクエリを構造化実行命令に変換するのに、Expert-LLMと、データ検索、統計処理、レスポンス生成を行うエージェントを使用している。
JARVISは, 自動評価とユーザ中心評価の両方において, ベースラインとアブレーションの変種を一貫して上回っている。
- 参考スコア(独自算出の注目度): 9.02332546861083
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Question-answering (QA) interfaces powered by large language models (LLMs) present a promising direction for improving interactivity with HVAC system insights, particularly for non-expert users. However, enabling accurate, real-time, and context-aware interactions with HVAC systems introduces unique challenges, including the integration of frequently updated sensor data, domain-specific knowledge grounding, and coherent multi-stage reasoning. In this paper, we present JARVIS, a two-stage LLM-based QA framework tailored for sensor data-driven HVAC system interaction. JARVIS employs an Expert-LLM to translate high-level user queries into structured execution instructions, and an Agent that performs SQL-based data retrieval, statistical processing, and final response generation. To address HVAC-specific challenges, JARVIS integrates (1) an adaptive context injection strategy for efficient HVAC and deployment-specific information integration, (2) a parameterized SQL builder and executor to improve data access reliability, and (3) a bottom-up planning scheme to ensure consistency across multi-stage response generation. We evaluate JARVIS using real-world data collected from a commercial HVAC system and a ground truth QA dataset curated by HVAC experts to demonstrate its effectiveness in delivering accurate and interpretable responses across diverse queries. Results show that JARVIS consistently outperforms baseline and ablation variants in both automated and user-centered assessments, achieving high response quality and accuracy.
- Abstract(参考訳): 大規模言語モデル(LLM)を利用した質問応答(QA)インタフェースは,HVACシステムインテリジェンス,特に非専門家ユーザとの対話性を向上するための有望な方向性を示す。
しかし、HVACシステムとの正確、リアルタイム、コンテキスト対応のインタラクションを可能にするには、頻繁に更新されるセンサーデータの統合、ドメイン固有の知識基盤、一貫性のある多段階推論など、ユニークな課題が伴う。
本稿では,センサデータ駆動型HVACシステムインタラクションに適した2段階LLMベースのQAフレームワークであるJARVISを提案する。
JARVISは、高レベルのユーザクエリを構造化された実行命令に変換するためのExpert-LLMと、SQLベースのデータ検索、統計処理、最終応答生成を実行するエージェントを使用する。
HVAC固有の課題に対処するため、(1)効率的なHVACとデプロイメント固有の情報統合のための適応型コンテキストインジェクション戦略、(2)データアクセス信頼性を改善するためのパラメータ化SQLビルダーとエグゼキュータ、(3)マルチステージレスポンス生成間の一貫性を保証するボトムアップ計画スキームを統合する。
我々は,商用のHVACシステムから収集した実世界データと,HVACの専門家がキュレートした地上真実QAデータセットを用いてJARVISを評価し,多様なクエリに対して正確かつ解釈可能な応答を提供することの有効性を実証した。
その結果、JARVISは、自動評価とユーザ中心評価の両方において、ベースラインとアブレーションの変種を一貫して上回り、高い応答品質と精度を実現していることがわかった。
関連論文リスト
- Divide-Then-Align: Honest Alignment based on the Knowledge Boundary of RAG [51.120170062795566]
本稿では,問合せが知識境界外にある場合の"I don't know"で応答する機能を備えたRAGシステムを実現するためのDTAを提案する。
DTAは適切な棄権と精度のバランスをとり、検索強化システムの信頼性と信頼性を高める。
論文 参考訳(メタデータ) (2025-05-27T08:21:21Z) - ReGUIDE: Data Efficient GUI Grounding via Spatial Reasoning and Search [53.40810298627443]
ReGUIDEは、MLLMが自己生成的推論と空間認識的批判を通じてデータを効率的に学習することを可能にするWebグラウンドのためのフレームワークである。
実験により、ReGUIDEは複数のベンチマークでWebグラウンド性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-05-21T08:36:18Z) - JIR-Arena: The First Benchmark Dataset for Just-in-time Information Recommendation [29.732827510828496]
ジャスト・イン・タイム情報推薦(ジャスト・イン・タイム・イン・タイム・インフォメーション・レコメンデーション、英: Just-in-time Information Recommendation、JIR)は、ユーザが必要な時に最も関連性の高い情報を提供するように設計されたサービスである。
本稿では,JIRタスクと関連する評価指標の数学的定義について述べる。
JIR-Arenaは多種多様な情報要求集約シナリオを特徴とするマルチモーダルベンチマークデータセットである。
論文 参考訳(メタデータ) (2025-05-19T04:49:47Z) - MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文 参考訳(メタデータ) (2025-03-17T08:09:42Z) - HawkBench: Investigating Resilience of RAG Methods on Stratified Information-Seeking Tasks [50.871243190126826]
HawkBenchは、RAGのパフォーマンスを厳格に評価するために設計された、人間ラベル付きマルチドメインベンチマークである。
情報探索行動に基づくタスクの階層化により、HawkBenchはRAGシステムが多様なユーザニーズにどのように適応するかを体系的に評価する。
論文 参考訳(メタデータ) (2025-02-19T06:33:39Z) - Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [64.28420991770382]
Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがるデータ処理オペレーターがバックアップするデータ処理システムである。
データ分析、アノテーション、基礎モデルポストトレーニングなど、より重要なタスクをサポートする。
さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文 参考訳(メタデータ) (2024-12-23T08:29:57Z) - Unanswerability Evaluation for Retrieval Augmented Generation [74.3022365715597]
UAEval4RAGは、RAGシステムが解答不能なクエリを効果的に処理できるかどうかを評価するために設計されたフレームワークである。
我々は、6つの未解決カテゴリを持つ分類を定義し、UAEval4RAGは、多様で挑戦的なクエリを自動的に合成する。
論文 参考訳(メタデータ) (2024-12-16T19:11:55Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - MAG-V: A Multi-Agent Framework for Synthetic Data Generation and Verification [5.666070277424383]
MAG-Vは、顧客のクエリを模倣する質問のデータセットを生成するフレームワークである。
我々の合成データは、実際の顧客クエリにおけるエージェントのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2024-11-28T19:36:11Z) - VERA: Validation and Enhancement for Retrieval Augmented systems [0.0]
textbfValidation and textbfEnhancement for textbfRetrieval textbfAugmented system を提案する。
VERAは、外部検索が必要なかどうかを最初にチェックし、検索したコンテキストの関連性と冗長性を評価し、非必要情報の除去のために精査する評価器-既存のLCMを使用している。
論文 参考訳(メタデータ) (2024-09-18T16:10:47Z) - RAG based Question-Answering for Contextual Response Prediction System [0.4660328753262075]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて汎用性を示している。
Retrieval Augmented Generation (RAG)は、この課題に対処するための有望な技術として登場した。
本稿では,産業用ユースケースにRAG機能を備えたLCMを用いたエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-05T17:14:23Z) - Towards a RAG-based Summarization Agent for the Electron-Ion Collider [0.5504260452953508]
A Retrieval Augmented Generation (RAG)ベースのEIC用要約AI(RAGS4EIC)が開発中である。
このAIエージェントは情報を凝縮するだけでなく、関連する応答を効果的に参照する。
まず、関連するすべての実験情報を含む包括的ベクトルデータベースを問合せし、次に、Large Language Model(LLM)を用いて、ユーザクエリと検索データに基づく引用に富んだ簡潔な要約を生成する。
論文 参考訳(メタデータ) (2024-03-23T05:32:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。