論文の概要: G-FOCUS: Towards a Robust Method for Assessing UI Design Persuasiveness
- arxiv url: http://arxiv.org/abs/2505.05026v2
- Date: Fri, 09 May 2025 04:56:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 12:48:54.001262
- Title: G-FOCUS: Towards a Robust Method for Assessing UI Design Persuasiveness
- Title(参考訳): G-FOCUS:UI設計の説得性を評価するロバストな方法を目指して
- Authors: Jaehyun Jeon, Jang Han Yoon, Min Soo Kim, Sumin Shim, Yejin Choi, Hanbin Kim, Youngjae Yu,
- Abstract要約: A/Bテストは、UIのバリエーションがユーザーエンゲージメントを高めるかを決定する主要な方法である。
WeserUI-Benchは、Pairwise UI Design Persuasiveness Assessmentタスク用に設計されたベンチマークである。
また,VLMに基づく説得力評価を強化する新しい推論時間推論戦略であるG-FOCUSを提案する。
- 参考スコア(独自算出の注目度): 45.81445929920235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluating user interface (UI) design effectiveness extends beyond aesthetics to influencing user behavior, a principle central to Design Persuasiveness. A/B testing is the predominant method for determining which UI variations drive higher user engagement, but it is costly and time-consuming. While recent Vision-Language Models (VLMs) can process automated UI analysis, current approaches focus on isolated design attributes rather than comparative persuasiveness-the key factor in optimizing user interactions. To address this, we introduce WiserUI-Bench, a benchmark designed for Pairwise UI Design Persuasiveness Assessment task, featuring 300 real-world UI image pairs labeled with A/B test results and expert rationales. Additionally, we propose G-FOCUS, a novel inference-time reasoning strategy that enhances VLM-based persuasiveness assessment by reducing position bias and improving evaluation accuracy. Experimental results show that G-FOCUS surpasses existing inference strategies in consistency and accuracy for pairwise UI evaluation. Through promoting VLM-driven evaluation of UI persuasiveness, our work offers an approach to complement A/B testing, propelling progress in scalable UI preference modeling and design optimization. Code and data will be released publicly.
- Abstract(参考訳): ユーザインターフェース(UI)設計の有効性を評価することは、美学を超えてユーザ行動に影響を与える。
A/Bテストは、UIのバリエーションがユーザーエンゲージメントを向上させるかを決定する主要な方法であるが、コストと時間を要する。
最近のVision-Language Models(VLM)は自動UI分析を処理できるが、現在のアプローチでは、ユーザインタラクションを最適化する上で重要な要素である説得力よりも、独立した設計属性に重点を置いている。
そこで我々は,Pairwise UI Design Persuasiveness Assessmentタスク用に設計されたベンチマークであるWiserUI-Benchを紹介した。
さらに、位置バイアスを低減し、評価精度を向上させることで、VLMに基づく説得力評価を強化する新しい推論時間推論戦略であるG-FOCUSを提案する。
実験結果から,G-FOCUSはUI評価の整合性と精度において既存の推論手法を超越していることがわかった。
VLMによるUI説得性の評価を促進することで、我々の研究はA/Bテストを補完するアプローチを提供し、スケーラブルなUI嗜好モデリングと設計最適化の進歩を推進します。
コードとデータは公開されます。
関連論文リスト
- Interactive Visualization Recommendation with Hier-SUCB [52.11209329270573]
本稿では,従来のインタラクションからユーザフィードバックを学習する対話型パーソナライズドビジュアライゼーションレコメンデーション(PVisRec)システムを提案する。
よりインタラクティブで正確なレコメンデーションのために、PVisRec設定における文脈的半帯域であるHier-SUCBを提案する。
論文 参考訳(メタデータ) (2025-02-05T17:14:45Z) - Identifying User Goals from UI Trajectories [19.492331502146886]
観測されたUI軌道からタスク目標を識別する手法を提案する。
また,2つの意図記述をパラフレーズとみなすことができるかどうかを評価するための新しい評価手法を提案する。
このタスクをベンチマークするために、人間と最先端モデル、特にGPT-4とGemini-1.5 Proのパフォーマンスを比較した。
論文 参考訳(メタデータ) (2024-06-20T13:46:10Z) - UIClip: A Data-driven Model for Assessing User Interface Design [20.66914084220734]
ユーザインタフェースの設計品質と視覚的関連性を評価するための機械学習モデルUIClipを開発した。
UIClipがUI設計品質の即時評価に依存するダウンストリームアプリケーションをどのように促進するかを示す。
論文 参考訳(メタデータ) (2024-04-18T20:43:08Z) - Rules Of Engagement: Levelling Up To Combat Unethical CUI Design [23.01296770233131]
いわゆる暗黒パターンの先行研究から得られた5次元のインタフェースを簡易に評価する手法を提案する。
提案手法はユーザに対して,評価されたインタフェースの操作性を表す数値スコアを提供する。
論文 参考訳(メタデータ) (2022-07-19T14:02:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。