論文の概要: Towards Scalable Web Accessibility Audit with MLLMs as Copilots
- arxiv url: http://arxiv.org/abs/2511.03471v1
- Date: Wed, 05 Nov 2025 13:50:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.437263
- Title: Towards Scalable Web Accessibility Audit with MLLMs as Copilots
- Title(参考訳): MLLMをコパイロットとしたスケーラブルなWebアクセシビリティ監査に向けて
- Authors: Ming Gu, Ziwei Wang, Sicen Lai, Zirui Gao, Sheng Zhou, Jiajun Bu,
- Abstract要約: 我々は,人間とAIのパートナーシップモデルを通じて運用する監査フレームワークAAAを提案する。
AAAには、グラフベースのマルチモーダルサンプリング手法であるGRASPと、マルチモーダルな大規模言語モデルベースのパプリロットであるMaCの2つの重要な革新がある。
また、監査パイプラインのコアステージのベンチマーク用に設計された4つの新しいデータセットも提供します。
- 参考スコア(独自算出の注目度): 22.55078564137037
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ensuring web accessibility is crucial for advancing social welfare, justice, and equality in digital spaces, yet the vast majority of website user interfaces remain non-compliant, due in part to the resource-intensive and unscalable nature of current auditing practices. While WCAG-EM offers a structured methodology for site-wise conformance evaluation, it involves great human efforts and lacks practical support for execution at scale. In this work, we present an auditing framework, AAA, which operationalizes WCAG-EM through a human-AI partnership model. AAA is anchored by two key innovations: GRASP, a graph-based multimodal sampling method that ensures representative page coverage via learned embeddings of visual, textual, and relational cues; and MaC, a multimodal large language model-based copilot that supports auditors through cross-modal reasoning and intelligent assistance in high-effort tasks. Together, these components enable scalable, end-to-end web accessibility auditing, empowering human auditors with AI-enhanced assistance for real-world impact. We further contribute four novel datasets designed for benchmarking core stages of the audit pipeline. Extensive experiments demonstrate the effectiveness of our methods, providing insights that small-scale language models can serve as capable experts when fine-tuned.
- Abstract(参考訳): ウェブアクセシビリティの確保は、デジタル空間における社会的福祉、正義、平等の推進に不可欠であるが、Webサイトユーザインターフェースの大部分が、現在の監査実践の資源集約的かつ不可解な性質のために、いまだに準拠していない。
WCAG-EMは, 現場適合性評価のための構造化手法を提供するが, 優れた人的努力を伴い, 大規模実行の実践的サポートを欠いている。
本研究では,人間とAIのパートナーシップモデルを用いてWCAG-EMを運用する監査フレームワークAAAを提案する。
AAAには2つの重要なイノベーションがある。GRASPは、ビジュアル、テキスト、リレーショナルキューの学習した埋め込みを通じて、代表ページのカバレッジを保証するグラフベースのマルチモーダルサンプリング手法である。
これらのコンポーネントを組み合わせることで、スケーラブルでエンドツーエンドのWebアクセシビリティ監査が可能になり、現実のインパクトに対するAI強化された支援によって、人間の監査担当者に権限を与える。
さらに、監査パイプラインのコアステージのベンチマーク用に設計された4つの新しいデータセットをコントリビュートする。
大規模な実験により,本手法の有効性が実証され,小型言語モデルが微調整時に有能な専門家として機能する可能性が示唆された。
関連論文リスト
- How can we assess human-agent interactions? Case studies in software agent design [52.953425368394306]
我々は,人間とエージェントの相互作用の厳密な評価に向けて,二つの大きな一歩を踏み出した。
エージェント設計のより効率的な人間中心評価のためのフレームワークであるPULSEを提案する。
私たちは、オープンソースのソフトウェアエージェントOpenHandsを中心に構築された大規模なWebプラットフォームにフレームワークをデプロイします。
論文 参考訳(メタデータ) (2025-10-10T19:04:28Z) - Evaluations at Work: Measuring the Capabilities of GenAI in Use [28.124088786766965]
現在のAIベンチマークは、人間とAIのコラボレーションの混乱したマルチターンの性質を見逃している。
実世界のタスクを相互依存サブタスクに分解する評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-15T23:06:23Z) - CAML: Collaborative Auxiliary Modality Learning for Multi-Agent Systems [38.20651868834145]
我々は,新しいマルチモーダル・マルチエージェント・フレームワークである協調補助モダリティ学習(CAML)を提案する。
事故検出においてCAMLが最大で$bf 58.1%の改善を達成していることを示す。
また,コラボレーティブセマンティックセグメンテーションのための実世界の地上ロボットデータ上でCAMLを検証する。
論文 参考訳(メタデータ) (2025-02-25T03:59:40Z) - Towards Human-Guided, Data-Centric LLM Co-Pilots [53.35493881390917]
CliMB-DCは、機械学習コパイロットのための、ヒューマンガイド付き、データ中心のフレームワークである。
高度なデータ中心ツールとLLM駆動推論を組み合わせることで、堅牢でコンテキスト対応のデータ処理を可能にする。
CliMB-DCが未処理のデータセットをML対応フォーマットに変換する方法を示す。
論文 参考訳(メタデータ) (2025-01-17T17:51:22Z) - A Large-Scale Evaluation of Speech Foundation Models [110.95827399522204]
音声処理ユニバーサルパフォーマンスベンチマーク(SUPERB)を構築し,基礎モデルパラダイムの有効性について検討する。
凍結基盤モデルを用いてSUPERBにおける音声処理タスクに対処する統合マルチタスクフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-15T00:03:16Z) - Towards a RAG-based Summarization Agent for the Electron-Ion Collider [0.5504260452953508]
A Retrieval Augmented Generation (RAG)ベースのEIC用要約AI(RAGS4EIC)が開発中である。
このAIエージェントは情報を凝縮するだけでなく、関連する応答を効果的に参照する。
まず、関連するすべての実験情報を含む包括的ベクトルデータベースを問合せし、次に、Large Language Model(LLM)を用いて、ユーザクエリと検索データに基づく引用に富んだ簡潔な要約を生成する。
論文 参考訳(メタデータ) (2024-03-23T05:32:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。