論文の概要: BikeBench: A Bicycle Design Benchmark for Generative Models with Objectives and Constraints
- arxiv url: http://arxiv.org/abs/2508.00830v2
- Date: Fri, 24 Oct 2025 17:02:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 19:54:32.409512
- Title: BikeBench: A Bicycle Design Benchmark for Generative Models with Objectives and Constraints
- Title(参考訳): BikeBench: 目的と制約のある生成モデルのための自転車設計ベンチマーク
- Authors: Lyle Regenwetter, Yazan Abu Obaideh, Fabien Chiotti, Ioanna Lykourentzou, Faez Ahmed,
- Abstract要約: BikeBenchは、実世界の目的と制約の問題に関する生成モデルを評価するためのエンジニアリング設計ベンチマークである。
これは、空気力学、構造力学、人間の評価されたユーザビリティ、テキストや画像プロンプトとの類似性など、様々な人間中心および多物理学のパフォーマンス特性を定量化する。
BikeBenchは、生成モデル、大規模言語モデル(LLM)、設計最適化、ハイブリッドアルゴリズムを並べて評価するように一意に構成されている。
- 参考スコア(独自算出の注目度): 4.1514726348364475
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce BikeBench, an engineering design benchmark for evaluating generative models on problems with multiple real-world objectives and constraints. As generative AI's reach continues to grow, evaluating its capability to understand physical laws, human guidelines, and hard constraints grows increasingly important. Engineering product design lies at the intersection of these difficult tasks, providing new challenges for AI capabilities. BikeBench evaluates AI models' capabilities to generate bicycle designs that not only resemble the dataset, but meet specific performance objectives and constraints. To do so, BikeBench quantifies a variety of human-centered and multiphysics performance characteristics, such as aerodynamics, ergonomics, structural mechanics, human-rated usability, and similarity to subjective text or image prompts. Supporting the benchmark are several datasets of simulation results, a dataset of 10,000 human-rated bicycle assessments, and a synthetically generated dataset of 1.6M designs, each with a parametric, CAD/XML, SVG, and PNG representation. BikeBench is uniquely configured to evaluate tabular generative models, large language models (LLMs), design optimization, and hybrid algorithms side-by-side. Our experiments indicate that LLMs and tabular generative models fall short of hybrid GenAI+optimization algorithms in design quality, constraint satisfaction, and similarity scores, suggesting significant room for improvement. We hope that BikeBench, a first-of-its-kind benchmark, will help catalyze progress in generative AI for constrained multi-objective engineering design problems. We provide code, data, an interactive leaderboard, and other resources at https://github.com/Lyleregenwetter/BikeBench.
- Abstract(参考訳): 実世界の複数の目的と制約のある問題に対して生成モデルを評価するためのエンジニアリング設計ベンチマークであるBikeBenchを紹介する。
生成的AIの到達範囲が拡大し続け、物理法則、人間のガイドライン、厳しい制約を理解する能力を評価することがますます重要になっている。
エンジニアリングプロダクトデザインは、これらの困難なタスクの交差点にあり、AI機能に新たな課題を提供する。
BikeBenchは、データセットに似ているだけでなく、特定のパフォーマンス目標と制約を満たす自転車設計を生成するAIモデルの能力を評価する。
そのため、BikeBenchは、空気力学、エルゴノミクス、構造力学、人格的ユーザビリティ、主観的テキストや画像プロンプトとの類似性など、様々な人間中心および多分野のパフォーマンス特性を定量化する。
ベンチマークをサポートするのは、シミュレーション結果のデータセット、10,000人の評価された自転車アセスメントのデータセット、および、パラメトリック、CAD/XML、SVG、PNG表現を備えた1.6Mデザインの合成データセットである。
BikeBenchは、表生成モデル、大きな言語モデル(LLM)、設計最適化、ハイブリッドアルゴリズムを並べて評価するように一意に構成されている。
実験の結果, LLMと表生成モデルは, 設計品質, 制約満足度, 類似度スコアのハイブリッドGenAI+最適化アルゴリズムに欠けており, 改善の余地があることが示唆された。
第一級ベンチマークであるBikeBenchが、制約付き多目的エンジニアリング設計問題に対する生成AIの進歩を触媒することを期待しています。
コード、データ、インタラクティブなリーダーボード、その他のリソースはhttps://github.com/Lyleregenwetter/BikeBench.comで提供しています。
関連論文リスト
- EngiBench: A Framework for Data-Driven Engineering Design Research [0.0]
EngiBenchは最初のオープンソースライブラリで、データ駆動エンジニアリング設計のためのさまざまなドメインにまたがる。
EngiOptは、EngiBenchインターフェースと互換性のあるアルゴリズムのコレクションを提供するコンパニオンライブラリである。
これらの問題は、高感度で制約のある設計データセットにより、標準的な機械学習手法に重大な課題をもたらすことが示されている。
論文 参考訳(メタデータ) (2025-06-02T08:53:02Z) - STAR: Synthesis of Tailored Architectures [61.080157488857516]
本稿では, 適合型アーキテクチャ (STAR) の新規な合成手法を提案する。
提案手法は線形入力可変系の理論に基づく新しい探索空間を結合し,階層的な数値エンコーディングをアーキテクチャゲノムに支持する。STARゲノムは,複数のモデル品質と効率の指標に最適化するために,勾配のない進化的アルゴリズムで自動的に精製・組換えされる。
STARを用いて、多種多様な計算単位と相互接続パターンを活用し、品質、パラメータサイズ、および自動回帰言語モデリングのための推論キャッシュのフロンティアにおける高度に最適化されたトランスフォーマーとストライプハイブリッドモデルを改善する。
論文 参考訳(メタデータ) (2024-11-26T18:42:42Z) - Deep Generative Model for Mechanical System Configuration Design [3.2194137462952126]
本稿では,設計問題に対するコンポーネントとインターフェースの最適な組み合わせを予測するための,深い生成モデルを提案する。
次に、GearFormerというデータセットを使ってTransformerをトレーニングします。
GearFormerは、特定の設計要件を満たすという点で、独自の検索方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-09-09T19:15:45Z) - Generative Design through Quality-Diversity Data Synthesis and Language Models [5.196236145367301]
エンジニアリングアプリケーションにおける2つの基本的な課題は、ハイパフォーマンスで多様なデータセットの取得と、生成された設計における正確な制約への固執である。
アーキテクチャ設計におけるこれらの課題に取り組むために,最適化,制約満足度,言語モデルを組み合わせた新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-16T11:30:08Z) - Mechanistic Design and Scaling of Hybrid Architectures [114.3129802943915]
我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。
本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。
我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文 参考訳(メタデータ) (2024-03-26T16:33:12Z) - ProcTHOR: Large-Scale Embodied AI Using Procedural Generation [55.485985317538194]
ProcTHORは、Embodied AI環境の手続き的生成のためのフレームワークである。
ナビゲーション、アレンジメント、アーム操作のための6つの具体化されたAIベンチマークに対して、最先端の結果を実証する。
論文 参考訳(メタデータ) (2022-06-14T17:09:35Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Vision-driven Robotic
Grasping via Physics-based Metaverse Synthesis [78.26022688167133]
本稿では,物理に基づくメタバース合成による視覚駆動型ロボットグルーピングのための大規模ベンチマークデータセットを提案する。
提案するデータセットには,10万の画像と25種類のオブジェクトが含まれている。
また,オブジェクト検出とセグメンテーション性能を評価するためのデータセットとともに,新しいレイアウト重み付け性能指標を提案する。
論文 参考訳(メタデータ) (2021-12-29T17:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。