Fugu-MT 論文翻訳(概要): See it to Place it: Evolving Macro Placements with Vision-Language Models

論文の概要: See it to Place it: Evolving Macro Placements with Vision-Language Models

arxiv url: http://arxiv.org/abs/2603.28733v1
Date: Mon, 30 Mar 2026 17:47:34 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-31 23:18:45.546414
Title: See it to Place it: Evolving Macro Placements with Vision-Language Models
Title（参考訳）: 視覚ランゲージモデルでマクロ配置を進化させる
Authors: Ikechukwu Uchendu, Swati Goel, Karly Hou, Ebrahim Songhori, Kuang-Huei Lee, Joe Wenjie Jiang, Vijay Janapa Reddi, Vincent Zhuang,
Abstract要約: チップフロアプランニングにおけるマクロ配置のための視覚言語モデル(VLM)を提案する。 VeoPlaceは、VLMを使用してベースプレーヤの動作をチップキャンバスのサブリージョンに制限することでガイドする新しいフレームワークである。 VeoPlaceは、ピークのワイヤ長が32%を超える10のベンチマークのうち、最も優れた事前学習ベースのアプローチである。
参考スコア（独自算出の注目度）: 12.502496976970177
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose using Vision-Language Models (VLMs) for macro placement in chip floorplanning, a complex optimization task that has recently shown promising advancements through machine learning methods. Because human designers rely heavily on spatial reasoning to arrange components on the chip canvas, we hypothesize that VLMs with strong visual reasoning abilities can effectively complement existing learning-based approaches. We introduce VeoPlace (Visual Evolutionary Optimization Placement), a novel framework that uses a VLM, without any fine-tuning, to guide the actions of a base placer by constraining them to subregions of the chip canvas. The VLM proposals are iteratively optimized through an evolutionary search strategy with respect to resulting placement quality. On open-source benchmarks, VeoPlace outperforms the best prior learning-based approach on 9 of 10 benchmarks with peak wirelength reductions exceeding 32%. We further demonstrate that VeoPlace generalizes to analytical placers, improving DREAMPlace performance on all 8 evaluated benchmarks with gains up to 4.3%. Our approach opens new possibilities for electronic design automation tools that leverage foundation models to solve complex physical design problems.
Abstract（参考訳）: 複雑な最適化タスクであるチップフロアプランニングにおけるマクロ配置に視覚言語モデル(VLM)を用いることを提案する。人間の設計者は、チップキャンバス上にコンポーネントを配置するために空間的推論に大きく依存するため、強力な視覚的推論能力を持つVLMは、既存の学習ベースのアプローチを効果的に補完できると仮定する。本稿では,VeoPlace(Visual Evolutionary Optimization Placement)について紹介する。VLMを微調整せずに使用し,チップキャンバスのサブリージョンに制限することで,ベースプレーサの動作を誘導する新しいフレームワークである。 VLMの提案は、結果の配置品質に関して進化的探索戦略を通じて反復的に最適化される。オープンソースのベンチマークでは、VeoPlaceは、最大で32%を超えるワイヤ長削減の10ベンチマーク中9ベンチマークにおいて、学習ベースのアプローチで最高のパフォーマンスを発揮している。さらに、VeoPlaceは解析的なプレーサーに一般化し、最大4.3%のゲインで評価された8つのベンチマークでDREAMPlaceのパフォーマンスを改善することを実証した。我々のアプローチは、基礎モデルを利用して複雑な物理設計問題を解決する電子設計自動化ツールの新たな可能性を開く。

関連論文リスト

Empirical Recipes for Efficient and Compact Vision-Language Models [54.92440500651415]
リソース制約のある設定における視覚言語モデル(VLM)は低レイテンシと高スループットを必要とする。実験的なエンドツーエンドの効率分析と系統的なプロファイル推論を行い、主要なボトルネックを特定します。精度を保ちながらレイテンシを大幅に低減する,コンパクトなVLMに適した最適化レシピを開発した。
論文参考訳（メタデータ） (2026-03-17T17:17:40Z)
Vision Language Models for Optimization-Driven Intent Processing in Autonomous Networks [6.377294874945291]
Intent-Based Networking (IBN)は、オペレーターが低レベルの設定ではなく、高レベルのネットワーク目標を指定することを可能にする。現在のシステムはテキストベースの意図表現を前提としており、オペレーターは散文のトポロジやパラメータを列挙する必要がある。我々は、VLM(Vision-Language Models)が、注釈付きネットワークスケッチを正しい最適化コードに処理できることを示します。
論文参考訳（メタデータ） (2026-01-19T05:57:58Z)
Actial: Activate Spatial Reasoning Ability of Multimodal Large Language Models [75.45940282834327]
本稿では,MLLMの空間的推論能力の評価と改善を目的とした視点学習を紹介する。多様な視点とそれに対応する質問応答対を持つ100Kオブジェクト中心のイメージペアからなるViewpoint-100Kデータセットを提案する。このアプローチでは2段階の微調整戦略を採用し,複数のタスクにまたがる大幅な改善を実現している。
論文参考訳（メタデータ） (2025-11-03T14:27:00Z)
Learning Active Perception via Self-Evolving Preference Optimization for GUI Grounding [31.57375084036447]
視覚言語モデル(VLM)は近年,視覚知覚と言語推論の橋渡しにおいて大きな進歩を遂げている。マルチステップ認識機能を持つVLMを段階的に支援する自己進化型フレームワークであるLASERを提案する。提案手法はモンテカルロの品質評価とインターセクション・オーバー・ユニオン(IoU)に基づく地域品質評価を統合し,高品質な嗜好データ構築における精度と多様性を両立させる。
論文参考訳（メタデータ） (2025-09-04T14:17:01Z)
Elevating Visual Perception in Multimodal LLMs with Visual Embedding Distillation [109.5893580175657]
近年,MLLMの開発における標準的な実践は,視覚エンコーダの機能をLLMに供給し,自然言語による指導を施すことである。このアプローチは、しばしばモデルが言語理解に傾き、データに存在するリッチな視覚知覚信号を損なう。本稿では,視覚知識をエキスパートビジョンエンコーダからLLMの隠れ表現に注入する最初のアプローチであるVisPer-LMを提案する。
論文参考訳（メタデータ） (2024-12-12T18:55:18Z)
Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models [73.40350756742231]
視覚条件付き言語モデル(VLM)は、視覚対話、シーン理解、ロボットタスク計画などのアプリケーションに採用されている。新しいリリースの量は多いが、イメージ前処理、アーキテクチャ、最適化に関する重要な設計決定は未調査である。
論文参考訳（メタデータ） (2024-02-12T18:21:14Z)
ChipNeMo: Domain-Adapted LLMs for Chip Design [19.43613652552849]
ChipNeMoは、産業用チップ設計のための大規模言語モデル(LLM)の応用を探求することを目的としている。ドメイン適応型トークン化、ドメイン適応型継続事前トレーニング、ドメイン固有命令とのモデルアライメント、ドメイン適応型検索モデルを採用する。
論文参考訳（メタデータ） (2023-10-31T22:35:58Z)
On Joint Learning for Solving Placement and Routing in Chip Design [70.30640973026415]
本稿では,マクロや標準セルの配置に関するDeepPlaceによる共同学習手法を提案する。また,DeepPRと呼ばれるマクロ配置とルーティングの両方を満たすための強化学習による共同学習手法も開発している。本手法は,経験から効果的に学習し,数時間のトレーニングで標準細胞配置の中間配置を提供する。
論文参考訳（メタデータ） (2021-10-30T11:41:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。