Fugu-MT 論文翻訳(概要): ChipLingo: A Systematic Training Framework for Large Language Models in EDA

論文の概要: ChipLingo: A Systematic Training Framework for Large Language Models in EDA

arxiv url: http://arxiv.org/abs/2604.27415v1
Date: Thu, 30 Apr 2026 04:35:43 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-01 16:31:53.925634
Title: ChipLingo: A Systematic Training Framework for Large Language Models in EDA
Title（参考訳）: ChipLingo: EDAにおける大規模言語モデルの体系的なトレーニングフレームワーク
Authors: Lei Li, Xingwen Yu, Jianguo Ni, Junxuan Zhu, Jieqiong Zhang, Jian Zhao, Zhi Liu,
Abstract要約: ChipLingoは、EDAシナリオに適したドメイン適応LLMのための、体系的なトレーニングパイプラインである。実験の結果、ChipLingo-8BはEDA-Benchで59.7%の精度を達成し、同じスケールのベースモデルとより大きな汎用モデルを上回る結果となった。その結果,知識集約型EDAタスクにおける体系的ドメイントレーニングの実践的価値が示された。
参考スコア（独自算出の注目度）: 13.577660745324033
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the rapid advancement of semiconductor technology, Electronic Design Automation (EDA) has become an increasingly knowledge-intensive and document-driven engineering domain. Although large language models (LLMs) have shown strong general capabilities, applying them directly to EDA remains challenging due to limited domain expertise, cross-tool knowledge confusion, and degraded retrieval-augmented generation (RAG) performance after domain training. To address these issues, this paper presents ChipLingo, a systematic training pipeline for domain-adapted LLMs tailored to EDA scenarios. ChipLingo consists of three stages: domain corpus construction with multi-source data curation and QA augmentation, domain-adaptive pretraining with comparisons of different parameter training strategies, and instruction alignment with RAG scenario training under diverse retrieval conditions. We also curate an internal benchmark, EDA-Bench, covering representative EDA tool scenarios, with plans for public release. Experiments show that ChipLingo-8B achieves 59.7% accuracy on EDA-Bench, outperforming the same-scale base model and some larger general-purpose models. ChipLingo-32B reaches 70.02%, approaching leading closed-source commercial models. Further analysis shows that QA augmentation improves domain performance, Partial FT offers a better balance between adaptation and general capability retention than LoRA, and explicit RAG scenario training mitigates the decline in retrieval utilization after domain training. These results demonstrate the practical value of systematic domain training for knowledge-intensive EDA tasks and provide a foundation for future EDA agents and external-knowledge-driven systems.
Abstract（参考訳）: 半導体技術の急速な進歩により、電子設計自動化(EDA)はますます知識集約化され、文書駆動の工学領域となっている。大規模言語モデル(LLM)は、強力な汎用能力を示しているが、ドメイン知識の制限、クロスツール知識の混乱、ドメイントレーニング後の検索強化世代(RAG)の性能低下などにより、EDAに直接適用することは依然として困難である。これらの問題に対処するために,本論文では,EDAシナリオに適したドメイン適応型LLMのための体系的トレーニングパイプラインであるChipLingoを提案する。 ChipLingoは、マルチソースデータキュレーションとQA拡張によるドメインコーパス構築、異なるパラメータトレーニング戦略の比較によるドメイン適応事前トレーニング、さまざまな検索条件下でのRAGシナリオトレーニングとの命令アライメントの3段階で構成されている。内部ベンチマークであるEDA-Benchもキュレートし、EDAツールのシナリオをカバーし、パブリックリリースの計画を立てています。実験の結果、ChipLingo-8BはEDA-Benchで59.7%の精度を達成し、同じスケールのベースモデルとより大きな汎用モデルを上回った。 ChipLingo-32Bは70.02%に達し、主要なクローズドソース商用モデルに近づいた。さらに分析した結果,QA強化によりドメイン性能が向上し,部分FTはLoRAよりも適応性と一般能力維持のバランスが良くなり,RAGシナリオの明示的なトレーニングにより,ドメイントレーニング後の利用率の低下が軽減された。これらの結果は、知識集約型EDAタスクのための体系的ドメイントレーニングの実践的価値を示し、将来のEDAエージェントと外部知識駆動システムの基礎を提供する。

関連論文リスト

Reinforced Curriculum Pre-Alignment for Domain-Adaptive VLMs [21.190823331753464]
VLM(Vision-Language Models)は、優れた汎用能力を示すが、専門領域では不足することが多い。本稿では,カリキュラム対応のプログレッシブ・変調機構を導入したポストトレーニングパラダイムであるReinforced Curriculum Pre-Alignment (RCPA)を提案する。
論文参考訳（メタデータ） (2026-02-11T11:04:37Z)
ORPR: An OR-Guided Pretrain-then-Reinforce Learning Model for Inventory Management [9.138155308817215]
プレトレイン-Then-Reinforce」アプローチは、AIの適応的認識をオペレーションリサーチの構造的厳密さと調和させる。構造化OR論理で導かれる場合、軽量でドメインインフォームドモデルにより最先端の性能とロバストな転送性が得られることを示す。
論文参考訳（メタデータ） (2025-12-22T03:39:43Z)
Bridging VLMs and Embodied Intelligence with Deliberate Practice Policy Optimization [72.20212909644017]
Deliberate Practice Policy Optimization (DPPO) はメタ認知型メタループのトレーニングフレームワークである。 DPPOは教師付き微調整(能力拡張)と強化学習(技能向上)の交互に行う実証的には、DPPO(Pelican-VL 1.0)で視覚言語を具現化したモデルをトレーニングすると、ベースモデルよりも20.3%パフォーマンスが向上する。私たちはモデルとコードをオープンソースにして、データとリソースのボトルネックを軽減する最初の体系的なフレームワークを提供しています。
論文参考訳（メタデータ） (2025-11-20T17:58:04Z)
Statistical Inference for Autoencoder-based Anomaly Detection after Representation Learning-based Domain Adaptation [7.10052009802944]
異常検出は、幅広い領域で重要な役割を果たすが、限られたデータを持つ対象領域に適用した場合、その性能は低下する可能性がある。我々は,Representation Learning-based DA の後,統計的に厳格な Autoencoder-based AD のための新しいフレームワーク STAND-DA を提案する。
論文参考訳（メタデータ） (2025-08-09T17:24:02Z)
ForgeHLS: A Large-Scale, Open-Source Dataset for High-Level Synthesis [13.87691887333415]
本稿では,機械学習(ML)駆動型HLS研究用に明示的に設計された大規模オープンソースデータセットであるForgeHLSを紹介する。 ForgeHLSは、広範囲のアプリケーションドメインをカバーする846のカーネルから生成される400万以上の多様な設計で構成されている。既存のデータセットと比較して、ForgeHLSはスケール、多様性、設計カバレッジを大幅に向上する。
論文参考訳（メタデータ） (2025-07-04T02:23:46Z)
OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation [65.15955645757705]
専門的な実行から戦略的計画を切り離す階層的なマルチエージェントフレームワークであるWorkforceを紹介します。推論中、Workforceはワーカーエージェントの追加や修正によって新しいドメインにシームレスに適応する。トレーニングには、ドメイン間の一般化を改善する最適化されたワークフォース学習(OWL)を導入する。
論文参考訳（メタデータ） (2025-05-29T17:51:58Z)
Unveiling the Superior Paradigm: A Comparative Study of Source-Free Domain Adaptation and Unsupervised Domain Adaptation [52.36436121884317]
Source-Free Domain Adaptation (SFDA) は、現実のシナリオにおいて、Unsupervised Domain Adaptation (UDA) よりも一般的に優れていることを示す。 SFDAは、時間効率、ストレージ要件、対象とする学習目標、負の移動リスクの低減、過度な適合に対する堅牢性の向上といった利点を提供している。利用可能なソースデータをマルチSFDA手法に効果的に統合する新しい重み推定法を提案する。
論文参考訳（メタデータ） (2024-11-24T13:49:29Z)
DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文参考訳（メタデータ） (2024-02-27T12:26:07Z)
Open-Set Domain Adaptation with Visual-Language Foundation Models [51.49854335102149]
非教師なしドメイン適応(UDA)は、ソースドメインからラベルのないデータを持つターゲットドメインへの知識の転送に非常に効果的であることが証明されている。オープンセットドメイン適応(ODA)は、トレーニングフェーズ中にこれらのクラスを識別する潜在的なソリューションとして登場した。
論文参考訳（メタデータ） (2023-07-30T11:38:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。