論文の概要: Optimizing RAG Techniques for Automotive Industry PDF Chatbots: A Case Study with Locally Deployed Ollama Models
- arxiv url: http://arxiv.org/abs/2408.05933v1
- Date: Mon, 12 Aug 2024 06:16:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 14:45:05.042985
- Title: Optimizing RAG Techniques for Automotive Industry PDF Chatbots: A Case Study with Locally Deployed Ollama Models
- Title(参考訳): 自動車用PDFチャットボットにおけるRAG手法の最適化 : 局所展開オラマモデルを用いた事例研究
- Authors: Fei Liu, Zejun Kang, Xing Han,
- Abstract要約: 本研究は,複雑な自動車産業文書の検索・更新技術の向上に焦点をあてる。
Langchainフレームワークに基づいて,OllamaのローカルRAG実装のための多次元最適化手法を提案する。
本稿では,自動車産業用文書の特色に合わせて,PDF処理,検索機構,コンテキスト圧縮の改善を導入する。
- 参考スコア(独自算出の注目度): 5.901170609862885
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the growing demand for offline PDF chatbots in automotive industrial production environments, optimizing the deployment of large language models (LLMs) in local, low-performance settings has become increasingly important. This study focuses on enhancing Retrieval-Augmented Generation (RAG) techniques for processing complex automotive industry documents using locally deployed Ollama models. Based on the Langchain framework, we propose a multi-dimensional optimization approach for Ollama's local RAG implementation. Our method addresses key challenges in automotive document processing, including multi-column layouts and technical specifications. We introduce improvements in PDF processing, retrieval mechanisms, and context compression, tailored to the unique characteristics of automotive industry documents. Additionally, we design custom classes supporting embedding pipelines and an agent supporting self-RAG based on LangGraph best practices. To evaluate our approach, we constructed a proprietary dataset comprising typical automotive industry documents, including technical reports and corporate regulations. We compared our optimized RAG model and self-RAG agent against a naive RAG baseline across three datasets: our automotive industry dataset, QReCC, and CoQA. Results demonstrate significant improvements in context precision, context recall, answer relevancy, and faithfulness, with particularly notable performance on the automotive industry dataset. Our optimization scheme provides an effective solution for deploying local RAG systems in the automotive sector, addressing the specific needs of PDF chatbots in industrial production environments. This research has important implications for advancing information processing and intelligent production in the automotive industry.
- Abstract(参考訳): 工業生産環境におけるオフラインのPDFチャットボットの需要が高まり、局所的な低パフォーマンス環境における大規模言語モデル(LLM)の展開を最適化することがますます重要になっている。
本研究では,ローカルにデプロイされたオラマモデルを用いて,複雑な自動車産業用文書の検索・集約生成(RAG)技術の向上に焦点をあてる。
Langchainフレームワークに基づいて,OllamaのローカルRAG実装のための多次元最適化手法を提案する。
本手法は,マルチカラムレイアウトや技術仕様など,自動文書処理における重要な課題に対処する。
本稿では,自動車産業用文書の特色に合わせて,PDF処理,検索機構,コンテキスト圧縮の改善を導入する。
さらに、組み込みパイプラインをサポートするカスタムクラスと、LangGraphベストプラクティスに基づいたセルフRAGをサポートするエージェントを設計する。
提案手法を評価するため,技術報告や企業規制など,典型的な自動車産業文書からなる独自のデータセットを構築した。
我々は、最適化されたRAGモデルと自己RAGエージェントを、自動車産業データセット、QReCC、およびCoQAの3つのデータセットにまたがる単純なRAGベースラインと比較した。
その結果、特に自動車産業のデータセットにおいて、文脈精度、コンテキストリコール、回答関連性、忠実性において顕著な改善が見られた。
本手法は,産業生産環境におけるPDFチャットボットの特定のニーズに対応するため,自動車部門におけるローカルRAGシステムの展開に有効なソリューションを提供する。
本研究は,自動車産業における情報処理と知的生産の促進に重要な意味を持つ。
関連論文リスト
- Inference Optimization of Foundation Models on AI Accelerators [68.24450520773688]
トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。
モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。
このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文 参考訳(メタデータ) (2024-07-12T09:24:34Z) - ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling [15.673219028826173]
本稿では,OR-Instruct という,最適化モデル問題のための半自動データ合成フレームワークを提案する。
我々は、70億のパラメータ(ORLM)を持つ様々なオープンソースのLDMを訓練する。
結果として得られたモデルは、NL4OPT、MAMO、IndustrialORベンチマークにまたがって最先端のパフォーマンスを達成し、大幅な最適化モデリング能力を示す。
論文 参考訳(メタデータ) (2024-05-28T01:55:35Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - Towards Single-System Illusion in Software-Defined Vehicles -- Automated, AI-Powered Workflow [3.2821049498759094]
本稿では,車載ソフトウェアシステムの開発における,新しいモデルと特徴に基づくアプローチを提案する。
提案されたアプローチの重要なポイントの1つは、近代的な生成AI、特にLarge Language Models(LLM)の導入である。
その結果、パイプラインは広範囲に自動化され、各ステップでフィードバックが生成される。
論文 参考訳(メタデータ) (2024-03-21T15:07:57Z) - Control and Automation for Industrial Production Storage Zone: Generation of Optimal Route Using Image Processing [49.1574468325115]
本稿では,DIPを用いた生産ラインモデルのゾーンに対する産業自動化手法の開発に焦点をあてる。
新カスケード法は、それぞれの段階を適切な方法で定義し、関連する手法を開発に含めることを可能にした。
システムはOpenCVライブラリをベースとしており、Java言語に基づいたオブジェクト指向プログラミング(OOP)プラットフォーム上に実装された人工視覚に焦点を当てたツールである。
論文 参考訳(メタデータ) (2024-03-15T06:50:19Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - TranDRL: A Transformer-Driven Deep Reinforcement Learning Enabled Prescriptive Maintenance Framework [58.474610046294856]
産業システムは、運用効率を高め、ダウンタイムを減らすための信頼性の高い予測保守戦略を要求する。
本稿では,Transformerモデルに基づくニューラルネットワークと深部強化学習(DRL)アルゴリズムの機能を活用し,システムの保守動作を最適化する統合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T02:27:54Z) - AutoML-GPT: Large Language Model for AutoML [5.9145212342776805]
包括的なツールとライブラリを統合するAutoML-GPTというフレームワークを確立しました。
会話インターフェースを通じて、ユーザーは要求、制約、評価メトリクスを指定できる。
我々は、AutoML-GPTが機械学習タスクに必要な時間と労力を大幅に削減することを示した。
論文 参考訳(メタデータ) (2023-09-03T09:39:49Z) - ARLO: A Framework for Automated Reinforcement Learning [36.91138310444942]
本稿では,AutoRLの自動パイプライン構築のためのフレームワーク,すなわちARLO: Automated Reinforcement Learningを提案する。
我々はそのようなパイプラインのPython実装を提供し、オープンソースライブラリとしてリリースしています。
我々の実装は、実証的なLQGドメインと古典的な MuJoCo 環境でテストされている。
論文 参考訳(メタデータ) (2022-05-20T19:16:04Z) - Resource-Aware Pareto-Optimal Automated Machine Learning Platform [1.6746303554275583]
新プラットフォーム Resource-Aware AutoML (RA-AutoML)
RA-AutoMLは、フレキシブルで一般化されたアルゴリズムで、複数の目的に合わせた機械学習モデルを構築することができる。
論文 参考訳(メタデータ) (2020-10-30T19:37:48Z) - Auto-PyTorch Tabular: Multi-Fidelity MetaLearning for Efficient and
Robust AutoDL [53.40030379661183]
Auto-PyTorchは、完全に自動化されたディープラーニング(AutoDL)を実現するフレームワーク
ディープニューラルネットワーク(DNN)のウォームスタートとアンサンブルのためのマルチフィデリティ最適化とポートフォリオ構築を組み合わせる。
Auto-PyTorchは、いくつかの最先端の競合製品よりもパフォーマンスが良いことを示す。
論文 参考訳(メタデータ) (2020-06-24T15:15:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。