論文の概要: Smart Audit System Empowered by LLM
- arxiv url: http://arxiv.org/abs/2410.07677v1
- Date: Thu, 10 Oct 2024 07:36:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 15:36:27.063374
- Title: Smart Audit System Empowered by LLM
- Title(参考訳): LLMを利用したスマート監査システム
- Authors: Xu Yao, Xiaoxu Wu, Xi Li, Huan Xu, Chenlei Li, Ping Huang, Si Li, Xiaoning Ma, Jiulong Shan,
- Abstract要約: 大規模言語モデル(LLM)を利用したスマート監査システムを提案する。
提案手法では,監査手順を効率化する動的リスクアセスメントモデル,データ処理,検索,評価を強化する製造コンプライアンスコミッション,リアルタイムにカスタマイズされた分析を提供するRe-actフレームワークの共通性分析エージェントの3つの革新を紹介した。
これらの改善により、監査効率と効率が向上し、テストシナリオでは24%以上の改善が示されている。
- 参考スコア(独自算出の注目度): 25.2545519709246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manufacturing quality audits are pivotal for ensuring high product standards in mass production environments. Traditional auditing processes, however, are labor-intensive and reliant on human expertise, posing challenges in maintaining transparency, accountability, and continuous improvement across complex global supply chains. To address these challenges, we propose a smart audit system empowered by large language models (LLMs). Our approach introduces three innovations: a dynamic risk assessment model that streamlines audit procedures and optimizes resource allocation; a manufacturing compliance copilot that enhances data processing, retrieval, and evaluation for a self-evolving manufacturing knowledge base; and a Re-act framework commonality analysis agent that provides real-time, customized analysis to empower engineers with insights for supplier improvement. These enhancements elevate audit efficiency and effectiveness, with testing scenarios demonstrating an improvement of over 24%.
- Abstract(参考訳): 製造品質監査は大量生産環境における高い製品基準の確保に不可欠である。
しかし、従来の監査プロセスは労働集約的で、人間の専門知識に依存しており、透明性、説明責任、複雑なグローバルサプライチェーン全体の継続的な改善を維持する上での課題を提起している。
これらの課題に対処するために,大規模言語モデル(LLM)によって強化されたスマート監査システムを提案する。
提案手法では, 監査手順の合理化と資源配分の最適化を行う動的リスク評価モデル, 自己進化型製造知識ベースのためのデータ処理, 検索, 評価を強化する製造コンプライアンスコミッション, リアルタイムでカスタマイズされた分析を提供するRe-actフレームワーク共通性分析エージェントの3つのイノベーションを紹介する。
これらの改善により、監査効率と効率が向上し、テストシナリオでは24%以上の改善が示されている。
関連論文リスト
- The Dual-use Dilemma in LLMs: Do Empowering Ethical Capacities Make a Degraded Utility? [54.18519360412294]
大きな言語モデル(LLM)は、安全のための有害な要求を拒否することと、ユーティリティのための正当な要求を収容することのバランスをとる必要がある。
本稿では,DPO(Direct Preference Optimization)に基づくアライメントフレームワークを提案する。
得られたモデルLibraChemは,Claude-3,GPT-4o,LLaMA-3などのLLMをそれぞれ13.44%,7.16%,7.10%で上回った。
論文 参考訳(メタデータ) (2025-01-20T06:35:01Z) - Addressing Quality Challenges in Deep Learning: The Role of MLOps and Domain Knowledge [5.190998244098203]
ディープラーニング(DL)システムは、特に正確性やリソース効率といった品質特性に関して、ソフトウェア工学においてユニークな課題を提示します。
本稿では,透過的で再現可能な実験環境を構築する上で,MLOpsの実践が果たす役割について述べる。
本稿では,DLモデルの設計にドメイン知識を組み込むことによる品質問題に対処する経験について報告する。
論文 参考訳(メタデータ) (2025-01-14T19:37:08Z) - The Lessons of Developing Process Reward Models in Mathematical Reasoning [62.165534879284735]
Process Reward Models (PRM) は、推論プロセスにおける中間エラーを特定し、緩和することを目的としている。
我々は,モンテカルロ (MC) 推定とLarge Language Models (LLM) を効果的に統合するコンセンサスフィルタリング機構を開発した。
私たちは、既存のオープンソース代替品よりも優れた、最先端のPRMを新たにリリースしています。
論文 参考訳(メタデータ) (2025-01-13T13:10:16Z) - Powering LLM Regulation through Data: Bridging the Gap from Compute Thresholds to Customer Experiences [0.0]
本稿では,計算レベルのしきい値と一般化モデル評価に着目した現在の規制手法は,特定のLCMベースのユーザエクスペリエンスの安全性と有効性を保証するには不十分である,と論じる。
本稿では,ユーザによる実際の体験と評価のための高品質データセットのキュレーションを中心とした認定プロセスへの移行を提案する。
論文 参考訳(メタデータ) (2025-01-12T16:20:40Z) - On the Adversarial Robustness of Instruction-Tuned Large Language Models for Code [4.286327408435937]
厳密なメトリクスと確立されたベンチマークを用いて、多様な入力課題が生成されたコードの機能と正確性に与える影響を評価する。
オープンソースモデルは入力摂動に対する感受性が増大し、機能的正しさは12%から34%にまで低下した。
対照的に、商用モデルは比較的高いレジリエンスを示し、性能劣化は3%から24%である。
論文 参考訳(メタデータ) (2024-11-29T07:00:47Z) - Large Language Models for Manufacturing [41.12098478080648]
大規模言語モデル(LLM)は製造業を変革する可能性があり、プロセスを最適化し、効率を改善し、革新を促進する新しい機会を提供する。
本稿では,LLMを製造分野に統合し,製造のさまざまな側面を自動化・拡張する可能性に焦点を当てる。
論文 参考訳(メタデータ) (2024-10-28T18:13:47Z) - Trustworthiness in Retrieval-Augmented Generation Systems: A Survey [59.26328612791924]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の開発において、急速に重要なパラダイムへと成長してきた。
本稿では,RAGシステムの信頼性を,事実性,堅牢性,公正性,透明性,説明責任,プライバシの6つの面で評価する統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-16T09:06:44Z) - Agent-Driven Automatic Software Improvement [55.2480439325792]
本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。
継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。
我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文 参考訳(メタデータ) (2024-06-24T15:45:22Z) - AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents [74.16170899755281]
本稿では,LLMエージェントの分析的評価に適したオープンソース評価フレームワークであるAgentBoardを紹介する。
AgentBoardは、インクリメンタルな進歩と包括的な評価ツールキットをキャプチャする、きめ細かい進捗率のメトリクスを提供する。
これはLLMエージェントの能力と限界に光を当てるだけでなく、その性能の解釈可能性も最前線に広める。
論文 参考訳(メタデータ) (2024-01-24T01:51:00Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Trustworthy Artificial Intelligence and Process Mining: Challenges and
Opportunities [0.8602553195689513]
プロセスマイニングは、AIコンプライアンスプロセスの実行に事実に基づく可視性を得るために有用なフレームワークを提供することができることを示す。
AI規制コンプライアンスプロセスの不確実性を分析し、修正し、監視する自動化アプローチを提供する。
論文 参考訳(メタデータ) (2021-10-06T12:50:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。