論文の概要: Enhancing Large Language Models for End-to-End Circuit Analysis Problem Solving
- arxiv url: http://arxiv.org/abs/2512.10159v1
- Date: Wed, 10 Dec 2025 23:38:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.120332
- Title: Enhancing Large Language Models for End-to-End Circuit Analysis Problem Solving
- Title(参考訳): エンド・ツー・エンド回路解析問題の解法における大規模言語モデルの強化
- Authors: Liangliang Chen, Weiyu Sun, Ying Zhang,
- Abstract要約: 本稿では,Gemini 2.5 Pro上に構築した拡張型エンドツーエンド回路問題の解法を提案する。
回路認識幻覚に対処するために、細調整されたYOLO検出器とOpenCV処理を統合し、電圧と電流源を分離する。
83の問題について、提案されたパイプラインは97.59%の成功率(81の正しい解)を達成した。
- 参考スコア(独自算出の注目度): 9.838140931803922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have shown strong performance in data-rich domains such as programming, but their reliability in engineering tasks remains limited. Circuit analysis -- requiring multimodal understanding and precise mathematical reasoning -- highlights these challenges. Although Gemini 2.5 Pro improves diagram interpretation and analog-circuit reasoning, it still struggles to consistently produce correct solutions when given both text and circuit diagrams. At the same time, engineering education needs scalable AI tools capable of generating accurate solutions for tasks such as automated homework feedback and question-answering. This paper presents an enhanced, end-to-end circuit problem solver built on Gemini 2.5 Pro. We first benchmark Gemini on a representative set of undergraduate circuit problems and identify two major failure modes: 1) circuit-recognition hallucinations, particularly incorrect source polarity detection, and 2) reasoning-process hallucinations, such as incorrect current directions. To address recognition errors, we integrate a fine-tuned YOLO detector and OpenCV processing to isolate voltage and current sources, enabling Gemini to re-identify source polarities from cropped images with near-perfect accuracy. To reduce reasoning errors, we introduce an ngspice-based verification loop in which Gemini generates a .cir file, ngspice simulates the circuit, and discrepancies trigger iterative regeneration with optional human-in-the-loop review. Across 83 problems, the proposed pipeline achieves a 97.59% success rate (81 correct solutions), substantially outperforming Gemini 2.5 Pro's original 79.52% accuracy. This system extends LLM capabilities for multimodal engineering problem-solving and supports the creation of high-quality educational datasets and AI-powered instructional tools.
- Abstract(参考訳): 大規模言語モデル(LLM)は、プログラミングのようなデータリッチな領域では高い性能を示しているが、エンジニアリングタスクにおける信頼性は依然として限られている。
回路解析 -- マルチモーダルな理解と正確な数学的推論を必要とする -- は、これらの課題を強調している。
Gemini 2.5 Proはダイアグラムの解釈とアナログ回路推論を改善しているが、テキストと回路図の両方を与えられたとき、常に正しい解を生成するのに苦労している。
同時に、エンジニアリング教育は、自動化された宿題のフィードバックや質問応答といったタスクの正確なソリューションを生成することができるスケーラブルなAIツールを必要とします。
本稿では,Gemini 2.5 Pro上に構築した拡張型エンドツーエンド回路問題の解法を提案する。
我々はGeminiをまず、学部の回路問題の代表セットでベンチマークし、2つの主要な障害モードを特定した。
1)回路認識幻覚、特に不正確なソース極性検出、及び
2) 誤った電流方向等の推論過程の幻覚。
認識誤差に対処するため、細調整されたYOLO検出器とOpenCV処理を統合し、電圧と電流源を分離し、Geminiが収穫画像からソース極性をほぼ完全精度で再同定できるようにする。
推論エラーを低減するため、Germiniが.NETファイルを生成するngspiceベースの検証ループを導入する。
cirファイル、ngspiceは回路をシミュレートし、不一致はオプションのヒューマン・イン・ザ・ループ・レビューで反復再生を誘導する。
83の問題を解決するため、提案されたパイプラインは97.59%の成功率(81の正解)を達成し、ゲミニ2.5 Proの本来の79.52%の精度を大幅に上回った。
このシステムは、マルチモーダルエンジニアリング問題解決のためのLLM機能を拡張し、高品質な教育データセットとAIによる教育ツールの作成をサポートする。
関連論文リスト
- Learning to Pose Problems: Reasoning-Driven and Solver-Adaptive Data Synthesis for Large Reasoning Models [54.29243291958429]
本研究は, 生成前に問題方向を明示的に計画する問題生成装置の開発である。
我々は,合成問題に対する解法者のフィードバックを報奨信号として扱い,生成元が難易度を調整できるようにする。
本手法は平均2.5%の改善を実現し,言語モデルと視覚言語モデルの両方に一般化する。
論文 参考訳(メタデータ) (2025-11-13T03:08:51Z) - WACA-UNet: Weakness-Aware Channel Attention for Static IR Drop Prediction in Integrated Circuit Design [22.68767218144094]
従来のシミュレーションベースの解法は計算コストが高く、スケールが難しい。
我々は、不均一な多チャンネル物理地図上での画素単位の回帰タスクとしてIRドロップ推定を再構成することで、この問題に対処する。
論文 参考訳(メタデータ) (2025-07-25T12:07:16Z) - Drift-resilient mid-circuit measurement and state preparation error mitigation for dynamic circuits [0.0]
動的回路は純粋に単体回路よりも大幅に優れる。
現在のソリューションは、時相ノイズドリフトに弱い読み出しノイズの特性に依存している。
繰り返し測定においてパリティに基づく雑音増幅を導入する。
そこで我々は, ドリフト抵抗性プロトコルを実験的に実証し, 準備, 中間回路, 測定誤差の低減について検討した。
論文 参考訳(メタデータ) (2025-06-12T20:22:09Z) - Subtle Errors in Reasoning: Preference Learning via Error-injected Self-editing [59.405145971637204]
eRror-Injected Self-Editing (RISE) と呼ばれる新しい好み学習フレームワークを提案する。
RISEは、事前定義された微妙なエラーをピボットトークンに注入する。
RISEの有効性を検証する実験では、Qwen2-7B-Instructでの優先学習により、GSM8Kでは3.0%、MATHでは7.9%が顕著に改善され、トレーニングサンプルは4.5Kに留まった。
論文 参考訳(メタデータ) (2024-10-09T07:43:38Z) - Finding Transformer Circuits with Edge Pruning [71.12127707678961]
自動回路発見の効率的かつスケーラブルなソリューションとしてエッジプルーニングを提案する。
本手法は,従来の手法に比べてエッジ数の半分未満のGPT-2の回路を探索する。
その効率のおかげで、Edge PruningをCodeLlama-13Bにスケールしました。
論文 参考訳(メタデータ) (2024-06-24T16:40:54Z) - Adaptive Planning Search Algorithm for Analog Circuit Verification [53.97809573610992]
シミュレーションの少ない機械学習(ML)アプローチを提案する。
提案手法により,OCCを全回路の仕様に近づけることができることを示す。
論文 参考訳(メタデータ) (2023-06-23T12:57:46Z) - GPU-Accelerated Verification of Machine Learning Models for Power
Systems [0.0]
近年,大規模機械学習(ML)モデルの性能を厳格に検証するための計算ツールが著しく進歩している。
しかし、彼らの成功にもかかわらず、これらのルーチンがシステム問題へのアウト・オブ・ボックス適用を妨げている。
本稿では,この問題を2つの重要な方法で解決する。
私たちは、$alpha,beta$-CROWNソルバを使って、最初の一連のイノベーションを構築し、テストします。
論文 参考訳(メタデータ) (2023-06-18T18:46:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。