論文の概要: Usability Analysis of Configurator User Interfaces with Multimodal Large Language Models
- arxiv url: http://arxiv.org/abs/2605.29456v2
- Date: Wed, 03 Jun 2026 12:35:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-06 06:55:34.590652
- Title: Usability Analysis of Configurator User Interfaces with Multimodal Large Language Models
- Title(参考訳): マルチモーダル大言語モデルを用いた構成言語インタフェースのユーザビリティ解析
- Authors: Sebastian Lubos, Alexander Felfernig, Damian Garber, Adnan Kraljić, Tarik Kraljić, Viet-Man Le, Thi Ngoc Trang Tran, Gerhard Leitner, Julian Schwazer, Doris Suppan, Reinhard Willfort, Ivan Dukic, Jeremias Fuchs, Manuel Henrich,
- Abstract要約: 本稿では,ユーザインタフェース(UI)のスケーラブルかつ半自動解析におけるMLLMの利用について検討する。
文献から18種類のユーザビリティ基準を適用し、16の実世界のMLLM分析にこれらの基準を適用した。
各基準は個別に評価され、ユーザビリティ問題や実行可能な改善提案に対する深刻度評価を生成する。
- 参考スコア(独自算出の注目度): 31.75269130539834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Configuration is a key technology for tailoring complex software systems, services, and products. A successful application of configurators not only depends on technical correctness, performance, and domain modeling but also on their usability. While general usability heuristics are widely used, configurator-specific criteria and tool support for systematic user interface (UI) analysis are limited. This paper explores the use of multimodal large language models (MLLMs) for scalable and semi-automated usability analysis of configurator UIs. We synthesize 18 configurator-specific usability criteria from the literature and apply these criteria in an MLLM-based analysis of 16 real-world configurators. Each criterion is assessed individually to generate severity ratings for usability issues and actionable improvement suggestions. A review of the results confirms that MLLMs can reliably identify configurator-specific usability issues and provide domain-aware improvement recommendations. Although human validation remains necessary, this approach has the potential to significantly reduce the required effort to analyze configurator usability.
- Abstract(参考訳): 構成は複雑なソフトウェアシステム、サービス、製品を調整するための重要な技術です。
コンフィグレータの成功した応用は、技術的な正確性、パフォーマンス、ドメインモデリングだけでなく、ユーザビリティにも依存する。
一般ユーザビリティヒューリスティックは広く使われているが、構成者固有の基準と、システムユーザインタフェース(UI)分析のためのツールサポートは限られている。
本稿では,マルチモーダル大規模言語モデル(MLLM)を用いて,構成UIのスケーラブルで半自動的なユーザビリティ解析を行う。
文献から18のコンフィグレータ固有のユーザビリティ基準を合成し,これらの基準を実世界の16のコンフィグレータのMLLMに基づく分析に適用する。
各基準は個別に評価され、ユーザビリティ問題や実行可能な改善提案に対する深刻度評価を生成する。
結果のレビューでは、MLLMがコンフィグレータ固有のユーザビリティ問題を確実に識別し、ドメイン認識改善のレコメンデーションを提供することを確認した。
人間の検証は依然として必要だが、このアプローチは構成者のユーザビリティを分析するために必要な労力を大幅に削減する可能性がある。
関連論文リスト
- TraceLLM: Leveraging Large Language Models with Prompt Engineering for Enhanced Requirements Traceability [4.517933493143603]
本稿では,要求トレーサビリティ向上のためのフレームワークであるTraceLLMを紹介する。
我々は,4つのベンチマークデータセット上で8つの最先端LCMを用いて,迅速な一般化とロバスト性を評価する。
論文 参考訳(メタデータ) (2026-02-01T14:29:13Z) - MAESTRO: Multi-Agent Evaluation Suite for Testing, Reliability, and Observability [37.727210168531364]
MAESTRO は LLM ベースの MAS のテスト,信頼性,可観測性の評価スイートである。
一般的なエージェント・フレームワークとインタラクション・パターンにまたがる12の代表的なMASを用いてMAESTROをインスタンス化する。
ケーススタディでは、MASの実行は構造的に安定するが、時間的に変動し、実行と実行のばらつきがかなり大きいことが示されている。
論文 参考訳(メタデータ) (2026-01-01T21:25:52Z) - Towards LLM-Based Usability Analysis for Recommender User Interfaces [41.966962052550656]
我々は,マルチモーダルな大規模言語モデルの可能性を探り,レコメンダシステムインタフェースのユーザビリティを評価する。
複数のレコメンデーションプラットフォームからユーザインターフェースのスクリーンショットを取り込み、好みの誘惑とレコメンデーションのプレゼンテーションシナリオの両方をカバーします。
論文 参考訳(メタデータ) (2025-11-18T11:05:13Z) - Towards Recommending Usability Improvements with Multimodal Large Language Models [40.77787659104315]
ユーザビリティテストや検査などの一般的な評価手法は、有効だがリソース集約であり、専門家の関与を必要とする。
マルチモーダルLCMの最近の進歩は、ユーザビリティ評価プロセスを自動化するための有望な機会を提供する。
以上の結果から,LCMがより高速で低コストなユーザビリティ評価を可能にする可能性が示唆された。
論文 参考訳(メタデータ) (2025-08-22T07:38:37Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - SCAN: Structured Capability Assessment and Navigation for LLMs [54.54085382131134]
textbfSCAN (Structured Capability Assessment and Navigation) は、大規模言語モデルの詳細な特徴付けを可能にする実用的なフレームワークである。
SCANには4つの重要なコンポーネントが含まれている。
TaxBuilder – クエリから機能表示タグを抽出して階層的な分類構造を構築する。
RealMixは、各機能タグに対する十分な評価データを保証するクエリ合成とフィルタリングのメカニズムである。
PC$2$ベースのLCM-as-a-Judge法は従来のLCM-as-a-Judge法と比較して大幅に精度が向上する
論文 参考訳(メタデータ) (2025-05-10T16:52:40Z) - FamilyTool: A Multi-hop Personalized Tool Use Benchmark [93.80355496575281]
FamilyToolは、パーソナライズされたマルチホップツールの使用シナリオをシミュレートする、家族ベースのナレッジグラフ(KG)に基盤を置くベンチマークである。
実験により、最先端の大規模言語モデル(LLM)における顕著な性能ギャップが明らかになった
FamilyToolは、複雑な動的環境において、LLMエージェントの推論、適応性、スケーラビリティを評価し、前進するための重要なリソースとなる。
論文 参考訳(メタデータ) (2025-04-09T10:42:36Z) - Automatic selection of the best neural architecture for time series forecasting via multi-objective optimization and Pareto optimality conditions [1.4843690728082002]
時系列予測は、天気予報、医療、構造的健康モニタリング、予測保守、エネルギーシステム、金融市場など、幅広い分野で重要な役割を果たしている。
LSTM、GRU、Transformers、State-Space Models (SSM) などのモデルがこの領域の標準ツールとなっているが、最適なアーキテクチャを選択することは依然として課題である。
本稿では,LSTM,GRU,マルチヘッドアテンション,SSMブロックを統合した時系列予測のためのフレキシブルな自動フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-21T15:33:55Z) - LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文 参考訳(メタデータ) (2024-06-18T09:29:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。