論文の概要: GlazyBench: A Benchmark for Ceramic Glaze Property Prediction and Image Generation
- arxiv url: http://arxiv.org/abs/2605.06641v1
- Date: Thu, 07 May 2026 17:51:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:12.06249
- Title: GlazyBench: A Benchmark for Ceramic Glaze Property Prediction and Image Generation
- Title(参考訳): GlazyBench: セラミックスの結晶特性予測と画像生成のためのベンチマーク
- Authors: Ziyu Zhai, Siyou Li, Juexi Shao, Juntao Yu,
- Abstract要約: GlazyBenchはAIによるグラズデザインのための最初のデータセットである。
原材料から、色や透明といった後処理後の表面特性を予測し、これらの特性に基づいて、グリースの正確な視覚的表現を生成するという2つの主要なタスクをサポートする。
我々の実験は有望だが挑戦的な結果を示している。
- 参考スコア(独自算出の注目度): 1.7737804675341045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing ceramic glazes is a costly, time-consuming process of trial and error due to complex chemistry, placing a significant burden on independent artists. While recent advances in multimodal AI offer a modern solution, the field lacks the large-scale datasets required to train these models. We propose GlazyBench, the first dataset for AI-assisted glaze design. Comprising 23,148 real glaze formulations, GlazyBench supports two primary tasks: predicting post-firing surface properties, such as color and transparency, from raw materials, and generating accurate visual representations of the glaze based on these properties. We establish comprehensive baselines for property prediction using traditional machine learning and large language models, alongside image generation benchmarks using deep generative and large multimodal models. Our experiments demonstrate promising yet challenging results. GlazyBench pioneers a new research direction in AI-assisted material design, providing a standardized benchmark for systematic evaluation.
- Abstract(参考訳): セラミックグレーズの開発は、複雑な化学による試行錯誤の費用がかかり、独立した芸術家に多大な負担をかける。
マルチモーダルAIの最近の進歩は、現代的なソリューションを提供するが、この分野にはこれらのモデルをトレーニングするために必要な大規模なデータセットがない。
我々は,AI支援グラズデザインのための最初のデータセットであるGlazyBenchを提案する。
23,148個のリアルグレーズを合成したGlazyBenchは、2つの主要なタスクをサポートしている。
従来の機械学習モデルと大規模言語モデルを用いた属性予測のための包括的ベースラインと、深層生成モデルと大規模マルチモーダルモデルを用いた画像生成ベンチマークを確立する。
我々の実験は有望だが挑戦的な結果を示している。
GlazyBenchは、AI支援材料設計の新しい研究方向性を開拓し、体系的評価のための標準化されたベンチマークを提供する。
関連論文リスト
- Insight-V++: Towards Advanced Long-Chain Visual Reasoning with Multimodal Large Language Models [65.4947731385794]
基礎画像中心モデルであるInsight-Vから進化した統合多エージェント視覚推論フレームワークを提案する。
空間的時間的推論を強化し、評価ロバスト性を向上させる2つの新しいアルゴリズムST-GRPOとJ-GRPOを導入する。
LLaVA-NeXTやQwen2.5-VLといったベースモデルの実験は、挑戦的な画像とビデオの推論ベンチマーク間で大きなパフォーマンス向上を示している。
論文 参考訳(メタデータ) (2026-03-18T15:28:07Z) - Harnessing the Power of Foundation Models for Accurate Material Classification [0.22940141855172033]
物質分類はコンピュータビジョンとグラフィックスにおいて重要な課題として浮上している。
ビジョン言語基盤モデルの最近の進歩は、これらの問題に対処するための有望な道を提供する。
本稿では,データ制限を克服し,分類精度を高めるために基礎モデルを効果的に活用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-18T06:14:00Z) - Data-Efficient Brushstroke Generation with Diffusion Models for Oil Painting [60.15416769662556]
そこで本研究では,手書きサンプルの小さなセットから人型ブラシストローク生成を学習する問題について検討する。
Smooth Regularization (SmR) を用いた拡散型フレームワーク StrokeDiff を提案する。
学習したプリミティブをBézierベースの条件付けモジュールで制御可能であることを示す。
論文 参考訳(メタデータ) (2026-03-01T13:42:35Z) - Simplicity Prevails: The Emergence of Generalizable AIGI Detection in Visual Foundation Models [15.709482146201283]
現代のビジョン・ファンデーション・モデル(Vision Foundation Models)の凍結した特徴に基づいて訓練された単純な線形分類器は、新しい最先端技術を確立している。
この基準線は標準ベンチマーク上の特別な検出器と一致し、また、ウィジェット内のデータセット上では決定的に優れていることを示す。
我々は、AIの法医学におけるパラダイムシフトを提唱し、静的ベンチマークの過度な適合から、ファンデーションモデルの進化する世界の知識を現実の信頼性に活用することへと移行した。
論文 参考訳(メタデータ) (2026-02-02T07:20:02Z) - Q-REAL: Towards Realism and Plausibility Evaluation for AI-Generated Content [71.46991494014382]
本稿では,AI生成画像におけるリアリズムと妥当性の詳細な評価のための新しいデータセットであるQ-Realを紹介する。
Q-Realは、人気のあるテキスト・ツー・イメージ・モデルによって生成される3,088のイメージで構成されている。
そこで本研究では,Q-Real Benchを2つの課題,すなわち判断と推論による根拠付けに基づいて評価する。
論文 参考訳(メタデータ) (2025-11-21T02:43:17Z) - DIFFUMA: High-Fidelity Spatio-Temporal Video Prediction via Dual-Path Mamba and Diffusion Enhancement [5.333662480077316]
我々は,半導体ウェハダイシングプロセスに特化した最初の公開時空間画像データセットであるChip Dicing Laneデータセット(CHDL)をリリースする。
このような微細なダイナミクスに特化して設計された、革新的なデュアルパス予測アーキテクチャであるDIFFUMAを提案する。
実験の結果、DIFFUMAは既存の手法よりも優れており、平均二乗誤差(MSE)を39%削減し、類似性(SSIM)を0.926から0.988に改善した。
論文 参考訳(メタデータ) (2025-07-09T10:51:54Z) - AiSciVision: A Framework for Specializing Large Multimodal Models in Scientific Image Classification [2.4515373478215343]
対話型研究パートナーにLMM(Large Multimodal Models)を専門とするフレームワークであるAiSciVisionを紹介する。
私たちのフレームワークでは、Visual Retrieval-Augmented Generation (VisRAG) と、エージェントワークフローで使用されるドメイン固有のツールの2つの重要なコンポーネントを使用します。
AiSciVisionを3つの実世界の科学的画像分類データセット(養殖池、ウナギ、ソーラーパネル)で評価した。
論文 参考訳(メタデータ) (2024-10-28T19:35:47Z) - Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文 参考訳(メタデータ) (2023-12-19T15:56:19Z) - Predicting Oxide Glass Properties with Low Complexity Neural Network and
Physical and Chemical Descriptors [1.8734449181723827]
酸化物ガラスの特性予測性能を向上させる低複雑性ニューラルネットワーク(LCNN)を提案する。
ガラス部品の大規模なデータセット(50000)をトレーニングすることにより、LCNNはXGBoostのような最先端のアルゴリズムより優れていることを示す。
LCNNモデルの普遍性を,オリジナルトレーニングセットに存在しない新しいコンポーネントを持つ眼鏡の特性を予測して示す。
論文 参考訳(メタデータ) (2022-10-19T12:23:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。