論文の概要: OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps
- arxiv url: http://arxiv.org/abs/2509.19282v1
- Date: Tue, 23 Sep 2025 17:50:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.9851
- Title: OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps
- Title(参考訳): OverLayBench: センスオーバーラップによるレイアウト・ツー・イメージ生成のベンチマーク
- Authors: Bingnan Li, Chen-Yu Wang, Haiyang Xu, Xiang Zhang, Ethan Armand, Divyansh Srivastava, Xiaojun Shan, Zeyuan Chen, Jianwen Xie, Zhuowen Tu,
- Abstract要約: 大きな重複する領域と、最小限の意味的区別を持つ重複するインスタンスの2つの主要な課題を特定します。
オーバーレイスコア(OverLayScore)は、重なり合うバウンディングボックスの複雑さを定量化する新しい計量である。
高品質なアノテーションと、OverLayScoreのさまざまなレベルのバランスの取れた分布を特徴とするベンチマークであるCreative-AMを提示する。
- 参考スコア(独自算出の注目度): 43.782757481408076
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite steady progress in layout-to-image generation, current methods still struggle with layouts containing significant overlap between bounding boxes. We identify two primary challenges: (1) large overlapping regions and (2) overlapping instances with minimal semantic distinction. Through both qualitative examples and quantitative analysis, we demonstrate how these factors degrade generation quality. To systematically assess this issue, we introduce OverLayScore, a novel metric that quantifies the complexity of overlapping bounding boxes. Our analysis reveals that existing benchmarks are biased toward simpler cases with low OverLayScore values, limiting their effectiveness in evaluating model performance under more challenging conditions. To bridge this gap, we present OverLayBench, a new benchmark featuring high-quality annotations and a balanced distribution across different levels of OverLayScore. As an initial step toward improving performance on complex overlaps, we also propose CreatiLayout-AM, a model fine-tuned on a curated amodal mask dataset. Together, our contributions lay the groundwork for more robust layout-to-image generation under realistic and challenging scenarios. Project link: https://mlpc-ucsd.github.io/OverLayBench.
- Abstract(参考訳): レイアウト・ツー・イメージ生成の着実に進歩したにもかかわらず、現在の手法はバウンディングボックス間の大きな重複を含むレイアウトに苦慮している。
1)大きな重複する領域と(2)最小のセマンティックな区別を持つ重複するインスタンスの2つの主要な課題を識別する。
定性的な例と定量的分析の両方を通して、これらの要因が生成品質を低下させる様子を実証する。
この問題を体系的に評価するために,オーバーレイスコア(OverLayScore)を導入する。
分析の結果,既存のベンチマークはOverLayScore値が低い単純なケースに偏りがあり,より困難な条件下でのモデル性能評価の有効性が制限されていることがわかった。
このギャップを埋めるために、私たちはOverLayBenchという、高品質なアノテーションと、OverLayScoreのさまざまなレベルにまたがるバランスの取れた分布を特徴とする新しいベンチマークを紹介します。
複雑なオーバーラップにおけるパフォーマンス向上に向けた最初のステップとして、キュレートされたアモーダルマスクデータセットに微調整されたモデルであるCreniLayout-AMを提案する。
私たちのコントリビューションは、現実的で挑戦的なシナリオの下で、より堅牢なレイアウト・ツー・イメージ生成の土台となったのです。
プロジェクトリンク:https://mlpc-ucsd.github.io/OverLayBench
関連論文リスト
- 7Bench: a Comprehensive Benchmark for Layout-guided Text-to-image Models [3.8123588214292745]
レイアウト誘導型テキスト・画像生成における意味的アライメントと空間的アライメントの両方を評価する最初のベンチマークである7Benchを紹介する。
本稿では,空間的精度を評価するためにレイアウトアライメントスコアを組み込んで,既存のフレームワーク上に構築した評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-08-18T13:37:51Z) - CountLoop: Training-Free High-Instance Image Generation via Iterative Agent Guidance [47.59187786346473]
我々は、正確なインスタンス制御を備えた拡散モデルを提供するトレーニング不要のフレームワークであるCountLoopを提案する。
COCO Count、T2I CompBench、および2つの新しいハイインスタンスベンチマークの実験は、CountLoopが最大98%のカウント精度を達成したことを示している。
論文 参考訳(メタデータ) (2025-08-18T11:28:02Z) - DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation [0.0]
近年,拡散駆動型テキスト・ツー・イメージ(T2I)生成は顕著な進歩を遂げている。
レイアウトは、大きな言語モデルとレイアウトベースの拡散モデルを橋渡しするためのインターメジウムとして使用される。
本稿では,生成タスクを複数のサブタスクに分割する分割・コンカレント手法を提案する。
論文 参考訳(メタデータ) (2024-03-11T03:24:44Z) - Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation [147.81509219686419]
本研究では,空間制御の4つの分野(数,位置,サイズ,形状)について,レイアウト誘導画像生成のための診断ベンチマークを提案する。
次に,新しいベースラインであるIterInpaintを提案する。
本研究はIterInpaintに関する総合的アブレーション研究である。
論文 参考訳(メタデータ) (2023-04-13T16:58:33Z) - Look Closer to Segment Better: Boundary Patch Refinement for Instance
Segmentation [51.59290734837372]
境界品質を改善するために,概念的にシンプルで効果的な後処理改善フレームワークを提案する。
提案されたBPRフレームワークは、CityscapesベンチマークのMask R-CNNベースラインを大幅に改善する。
BPRフレームワークをPolyTransform + SegFixベースラインに適用することで、Cityscapesのリーダーボードで1位に到達しました。
論文 参考訳(メタデータ) (2021-04-12T07:10:48Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。