論文の概要: Advanced Chain-of-Thought Reasoning for Parameter Extraction from Documents Using Large Language Models
- arxiv url: http://arxiv.org/abs/2502.16540v1
- Date: Sun, 23 Feb 2025 11:19:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:59:16.539663
- Title: Advanced Chain-of-Thought Reasoning for Parameter Extraction from Documents Using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた文書からのパラメータ抽出のための高度なチェーン・オブ・ソート推論
- Authors: Hong Cai Chen, Yi Pin Xu, Yang Zhang,
- Abstract要約: 現在の手法は、高次元の設計データを処理し、リアルタイム処理の要求を満たすのに苦労している。
パラメータの抽出とPySpiceモデルの生成を自動化する革新的なフレームワークを提案する。
実験の結果, 3つの手法を併用することにより, 検索精度が47.69%向上し, 処理遅延が37.84%減少した。
- 参考スコア(独自算出の注目度): 3.7324910012003656
- License:
- Abstract: Extracting parameters from technical documentation is crucial for ensuring design precision and simulation reliability in electronic design. However, current methods struggle to handle high-dimensional design data and meet the demands of real-time processing. In electronic design automation (EDA), engineers often manually search through extensive documents to retrieve component parameters required for constructing PySpice models, a process that is both labor-intensive and time-consuming. To address this challenge, we propose an innovative framework that leverages large language models (LLMs) to automate the extraction of parameters and the generation of PySpice models directly from datasheets. Our framework introduces three Chain-of-Thought (CoT) based techniques: (1) Targeted Document Retrieval (TDR), which enables the rapid identification of relevant technical sections; (2) Iterative Retrieval Optimization (IRO), which refines the parameter search through iterative improvements; and (3) Preference Optimization (PO), which dynamically prioritizes key document sections based on relevance. Experimental results show that applying all three methods together improves retrieval precision by 47.69% and reduces processing latency by 37.84%. Furthermore, effect size analysis using Cohen's d reveals that PO significantly reduces latency, while IRO contributes most to precision enhancement. These findings underscore the potential of our framework to streamline EDA processes, enhance design accuracy, and shorten development timelines. Additionally, our algorithm has model-agnostic generalization, meaning it can improve parameter search performance across different LLMs.
- Abstract(参考訳): 電子設計における設計精度とシミュレーション信頼性を確保するためには、技術資料からパラメータを抽出することが不可欠である。
しかし、現在の手法は、高次元の設計データを処理し、リアルタイム処理の要求を満たすのに苦労している。
電子設計自動化(EDA)において、エンジニアは、労働集約的かつ時間を要するプロセスであるPySpiceモデルを構築するのに必要なコンポーネントパラメータを取得するために、広範囲なドキュメントを手動で検索することが多い。
この課題に対処するために,大規模言語モデル(LLM)を活用してパラメータの抽出とデータシートから直接PySpiceモデルを生成する,革新的なフレームワークを提案する。
本フレームワークでは,(1)関連技術セクションの迅速識別を可能にするターゲットドキュメンテーション検索(TDR),(2)反復的改善によりパラメータ検索を洗練する反復検索最適化(IRO),(3)関連性に基づいて鍵文書セクションを動的に優先順位付けする優先度最適化(PO)の3つの手法を紹介する。
実験の結果, 3つの手法を併用することにより, 検索精度が47.69%向上し, 処理遅延が37.84%減少した。
さらに、Cohenのdを用いた効果サイズ解析により、POは遅延を著しく低減し、IROは精度の向上に最も寄与していることが明らかとなった。
これらの結果は,EDAプロセスの合理化,設計精度の向上,開発タイムラインの短縮など,私たちのフレームワークの可能性を浮き彫りにしている。
さらに,本アルゴリズムはモデルに依存しない一般化を実現しており,パラメータ探索性能を異なるLLMで向上させることができる。
関連論文リスト
- TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation [50.23504065567638]
本稿では,メタラーニングフレームワークにおける textbfDataset textbfDistillation 手法である textbfTD3 を紹介する。
TD3は、オリジナルのデータから完全に表現力のある合成配列の要約を蒸留する。
拡張技術により、学習者は合成要約を忠実に適合させ、アンプループでの正確な更新を確実にすることができる。
論文 参考訳(メタデータ) (2025-02-05T03:13:25Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - DELIFT: Data Efficient Language model Instruction Fine Tuning [13.538140114667772]
本稿では,3段階の微調整におけるデータ選択を体系的に最適化する新しいアルゴリズムであるDELIFTを紹介する。
さまざまなタスクやモデルスケールにわたる実験により、DELIFTはパフォーマンスを損なうことなく、微調整データサイズを最大70%削減できることが示された。
論文 参考訳(メタデータ) (2024-11-07T04:38:29Z) - Refining Joint Text and Source Code Embeddings for Retrieval Task with Parameter-Efficient Fine-Tuning [0.0]
そこで本研究では,それを利用した微調整フレームワークを提案する。
PEFT(Efficient Fine-Tuning)技術。
提案する微調整フレームワークは,最大で0.4%のパラメータをチューニングすることで,コードテキスト検索性能を向上させる可能性を実証した。
論文 参考訳(メタデータ) (2024-05-07T08:50:25Z) - Low-Rank Representations Meets Deep Unfolding: A Generalized and
Interpretable Network for Hyperspectral Anomaly Detection [41.50904949744355]
現在のハイパースペクトル異常検出(HAD)ベンチマークデータセットは、低解像度、単純なバックグラウンド、検出データの小さなサイズに悩まされている。
これらの要因は、ロバスト性の観点からよく知られた低ランク表現(LRR)モデルの性能も制限する。
我々は、複雑なシナリオにおけるHADアルゴリズムの堅牢性を改善するために、新しいHADベンチマークデータセットであるAIR-HADを構築した。
論文 参考訳(メタデータ) (2024-02-23T14:15:58Z) - Towards General and Efficient Online Tuning for Spark [55.30868031221838]
本稿では,3つの問題を同時に処理できる汎用的で効率的なSparkチューニングフレームワークを提案する。
我々は、このフレームワークを独立したクラウドサービスとして実装し、Tencentのデータプラットフォームに適用しました。
論文 参考訳(メタデータ) (2023-09-05T02:16:45Z) - E^2VPT: An Effective and Efficient Approach for Visual Prompt Tuning [55.50908600818483]
新しいタスクのための微調整された大規模な事前学習型ビジョンモデルは、パラメーター集約化が進んでいる。
本稿では,大規模なトランスフォーマーモデル適応のための効果的かつ効率的なビジュアルプロンプトチューニング(E2VPT)手法を提案する。
提案手法は2つのベンチマークにおいて,最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2023-07-25T19:03:21Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Evaluating natural language processing models with generalization
metrics that do not need access to any training or testing data [66.11139091362078]
本稿では,Hugingface から事前学習した大規模トランスフォーマーに対して,一般化指標を用いた最初のモデル選択結果を提案する。
ニッチな状況にもかかわらず、ヘビーテール(HT)の観点から派生したメトリクスは、特にNLPタスクにおいて有用である。
論文 参考訳(メタデータ) (2022-02-06T20:07:35Z) - Surrogate Modelling for Injection Molding Processes using Machine
Learning [0.23090185577016442]
射出成形は、複雑なプラスチックオブジェクトをモデル化するための最も一般的な製造方法の1つである。
モルドフローシミュレーションプロジェクトからのデータの抽出を含むデータ処理パイプラインのベースラインを提案する。
我々は,時間と偏向分布予測のための機械学習モデルを評価し,MSEおよびRMSEメトリクスのベースライン値を提供する。
論文 参考訳(メタデータ) (2021-07-30T12:13:52Z) - FIST: A Feature-Importance Sampling and Tree-Based Method for Automatic
Design Flow Parameter Tuning [27.08970520268831]
限られた試行数で最高の設計品質を見つけることを目的とした,機械学習に基づく自動パラメータチューニング手法を提案する。
我々は最先端のXGBoostモデルを活用し、オーバーフィッティングを克服する新しい動的ツリー手法を提案する。
ベンチマーク回路の実験結果から,本手法は設計品質の25%向上やサンプリングコストの低減を実現していることがわかった。
論文 参考訳(メタデータ) (2020-11-26T23:13:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。