論文の概要: WebRenderBench: Enhancing Web Interface Generation through Layout-Style Consistency and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2510.04097v1
- Date: Sun, 05 Oct 2025 08:47:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.456358
- Title: WebRenderBench: Enhancing Web Interface Generation through Layout-Style Consistency and Reinforcement Learning
- Title(参考訳): WebRenderBench: レイアウトスタイルの一貫性と強化学習によるWebインターフェース生成の強化
- Authors: Peichao Lai, Jinhui Zhuang, Kexuan Zhang, Ningchang Xiong, Shengjie Wang, Yanwei Xu, Chong Chen, Yilei Wang, Bin Cui,
- Abstract要約: WebRenderBenchは、現実世界のポータルサイトから収集された22.5万のWebページの大規模なベンチマークである。
また、最終レンダリングページからレイアウトとスタイルの整合性を測定する新しい評価指標を提案する。
- 参考スコア(独自算出の注目度): 24.178675410636135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automating the conversion of UI images into web code is a critical task for front-end development and rapid prototyping. Advances in multimodal large language models (MLLMs) have made WebUI-to-Code increasingly feasible, yet existing benchmarks remain limited in data diversity and evaluation reliability. To address these issues, we present WebRenderBench, a large-scale benchmark of 22.5k webpages collected from real-world portal sites, offering greater diversity, complexity, and realism than prior benchmarks. We further propose a novel evaluation metric that measures layout and style consistency from the final rendered pages. Unlike vision-based methods that rely on costly LLM reasoning or structure-based comparisons vulnerable to noise and asymmetry, our approach enables more efficient, objective, and reliable UI quality assessment. Finally, we introduce the Automated Layout and Style Inspection Agent (ALISA), which integrates this metric into reinforcement learning as a reward signal to enhance training on crawled asymmetric webpages. Experiments show that ALISA significantly boosts generation performance, achieving state-of-the-art results across multiple metrics.
- Abstract(参考訳): UIイメージのWebコードへの変換を自動化することは、フロントエンド開発と迅速なプロトタイピングにとって重要なタスクである。
マルチモーダルな大規模言語モデル(MLLM)の進歩により、WebUI-to-Codeはますます実現可能になったが、既存のベンチマークはデータの多様性と信頼性に制限されている。
これらの問題に対処するために、WebRenderBenchという、現実世界のポータルサイトから収集された22.5万のWebページの大規模なベンチマークを紹介します。
さらに、最終レンダリングページからレイアウトとスタイルの整合性を測定する新しい評価指標を提案する。
コストのかかるLCM推論や、ノイズや非対称性に弱い構造に基づく比較に依存する視覚ベースの手法とは異なり、我々の手法はより効率的で客観的で信頼性の高いUI品質評価を可能にする。
最後に,自動レイアウト・スタイル検査エージェント(ALISA, Automated Layout and Style Inspection Agent)を紹介した。
実験の結果、ALISAは生成性能を大幅に向上し、複数のメトリクスで最先端の結果が得られた。
関連論文リスト
- ArtifactsBench: Bridging the Visual-Interactive Gap in LLM Code Generation Evaluation [51.297873393639456]
ArtifactsBenchは自動ビジュアルコード生成評価のためのフレームワークである。
我々のフレームワークは、生成した各アーティファクトをレンダリングし、時間的スクリーンショットを通してその動的な振る舞いをキャプチャする。
我々は1,825の多様なタスクの新しいベンチマークを構築し、30以上の主要な大規模言語モデルを評価する。
論文 参考訳(メタデータ) (2025-07-07T12:53:00Z) - Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining [67.87810796668981]
インフォメーション・インフォメーション・インフォメーション・クロッピング(ISC)と自己精製デュアルラーニング(SRDL)
Irisは850KのGUIアノテーションだけで、複数のベンチマークで最先端のパフォーマンスを実現している。
これらの改善は、WebとOSエージェントの両方の下流タスクで大幅に向上した。
論文 参考訳(メタデータ) (2024-12-13T18:40:10Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。