論文の概要: AccessGuru: Leveraging LLMs to Detect and Correct Web Accessibility Violations in HTML Code
- arxiv url: http://arxiv.org/abs/2507.19549v1
- Date: Thu, 24 Jul 2025 17:59:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:55.58147
- Title: AccessGuru: Leveraging LLMs to Detect and Correct Web Accessibility Violations in HTML Code
- Title(参考訳): AccessGuru: HTMLコードのWebアクセシビリティ違反の検出と修正にLLMを活用する
- Authors: Nadeen Fathallah, Daniel Hernández, Steffen Staab,
- Abstract要約: 本稿では,Webアクセシビリティ違反をSyntactic,Semantic,Layoutの3つの重要なカテゴリに分類する新しい分類法を提案する。
本稿では,既存のアクセシビリティテストツールとLarge Language Models(LLM)を組み合わせた新しい手法であるAccessGuruを提案する。
本ベンチマークでは,構文およびレイアウトのコンプライアンスを定量化し,人間の専門家による補正との比較分析により意味的精度を判定する。
- 参考スコア(独自算出の注目度): 11.11923891120399
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The vast majority of Web pages fail to comply with established Web accessibility guidelines, excluding a range of users with diverse abilities from interacting with their content. Making Web pages accessible to all users requires dedicated expertise and additional manual efforts from Web page providers. To lower their efforts and promote inclusiveness, we aim to automatically detect and correct Web accessibility violations in HTML code. While previous work has made progress in detecting certain types of accessibility violations, the problem of automatically detecting and correcting accessibility violations remains an open challenge that we address. We introduce a novel taxonomy classifying Web accessibility violations into three key categories - Syntactic, Semantic, and Layout. This taxonomy provides a structured foundation for developing our detection and correction method and redefining evaluation metrics. We propose a novel method, AccessGuru, which combines existing accessibility testing tools and Large Language Models (LLMs) to detect violations and applies taxonomy-driven prompting strategies to correct all three categories. To evaluate these capabilities, we develop a benchmark of real-world Web accessibility violations. Our benchmark quantifies syntactic and layout compliance and judges semantic accuracy through comparative analysis with human expert corrections. Evaluation against our benchmark shows that AccessGuru achieves up to 84% average violation score decrease, significantly outperforming prior methods that achieve at most 50%.
- Abstract(参考訳): ウェブページの大半は、コンテンツとの対話から様々な能力を持つユーザーを除いて、確立されたウェブアクセシビリティガイドラインに従わない。
すべてのユーザがWebページにアクセスできるようにするには、専門知識とWebページプロバイダによる追加の手作業が必要である。
本研究の目的は,HTMLコードのアクセシビリティ違反を自動的に検出し,修正することである。
これまでは、アクセシビリティ違反の検出が進んできたが、アクセシビリティ違反を自動的に検出し、修正する問題は、私たちが対処するオープンな課題である。
本稿では,Webアクセシビリティ違反をSyntactic,Semantic,Layoutの3つの主要なカテゴリに分類する新しい分類法を提案する。
本分類法は, 検出・補正手法を開発し, 評価指標を再定義するための構造的基盤を提供する。
本稿では,既存のアクセシビリティテストツールとLarge Language Models(LLM)を組み合わせた新しい手法であるAccessGuruを提案する。
これらの機能を評価するために,実世界のWebアクセシビリティ違反のベンチマークを開発する。
本ベンチマークでは,構文およびレイアウトのコンプライアンスを定量化し,人間の専門家による補正との比較分析により意味的精度を判定する。
評価の結果,AccessGuruは平均違反スコアが最大84%減少し,50%以上の先行手法よりも有意に優れていた。
関連論文リスト
- Adapting Vision-Language Models Without Labels: A Comprehensive Survey [74.17944178027015]
VLM(Vision-Language Models)は、幅広いタスクにまたがる顕著な一般化機能を示す。
近年,ラベル付きデータに依存しない教師なし適応手法に注目が集まっている。
本稿では,未ラベルの視覚データの可用性と性質に基づく分類法を提案し,既存のアプローチを4つの重要なパラダイムに分類する。
論文 参考訳(メタデータ) (2025-08-07T16:27:37Z) - Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.16354555208417]
PADとFFDはそれぞれ物理メディアベースのプレゼンテーションアタックとデジタル編集ベースのDeepFakeから顔データを保護するために提案されている。
これら2つのカテゴリの攻撃を同時に処理する統一顔攻撃検出モデルがないことは、主に2つの要因に起因する。
本稿では,異なる意味空間から複数の分類基準を適応的に探索する,視覚言語モデルに基づく階層型プロンプトチューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T16:35:45Z) - From Code to Compliance: Assessing ChatGPT's Utility in Designing an Accessible Webpage -- A Case Study [1.999925939110439]
本研究では、Webコンテンツアクセシビリティガイドライン(WCAG)に基づき、ChatGPTによるWebページの生成と改善能力を評価する。
ChatGPTは、インシデント時にアクセシビリティの問題に効果的に対処できるが、デフォルトのコードはコンプライアンスを欠いていることが多い。
その結果,ChatGPTの性能は,簡潔さ,構造化されたフィードバックの提供,視覚支援の導入といった効果的なプロンプトエンジニアリングによって著しく向上することがわかった。
論文 参考訳(メタデータ) (2025-01-07T06:51:46Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - Generative Pre-trained Ranking Model with Over-parameterization at Web-Scale (Extended Abstract) [73.57710917145212]
ランク付け学習は、入力クエリに基づいて関連するWebページを優先順位付けするために、Web検索で広く使われている。
本稿では,これらの課題に対処するために,経験的 UlineSemi-uline Supervised ulinePre-trained (GS2P) モデルを提案する。
我々は,公開データセットと大規模検索エンジンから収集した実世界のデータセットの両方に対して,大規模なオフライン実験を行う。
論文 参考訳(メタデータ) (2024-09-25T03:39:14Z) - ACCESS: Prompt Engineering for Automated Web Accessibility Violation
Corrections [0.0]
本稿では,基盤モデルを用いて文書オブジェクトモデル(DOM)をリアルタイムで修正することにより,Web上のアクセシビリティ違反を修正する新しいアプローチを提案する。
新たなベンチマークであるACCESSの修正後のアクセシビリティ違反エラーを51%以上削減した。
論文 参考訳(メタデータ) (2024-01-28T22:49:33Z) - Integrity and Junkiness Failure Handling for Embedding-based Retrieval:
A Case Study in Social Network Search [26.705196461992845]
埋め込みベースの検索は、eコマースやソーシャルネットワーク検索など、さまざまな検索アプリケーションで使われている。
本稿では,2021年初頭に開始された埋め込み型検索をソーシャルネットワーク検索エンジン上で解析する。
私たちは、それによってもたらされた失敗の2つの主要なカテゴリ、完全性とジャンク性を定義します。
論文 参考訳(メタデータ) (2023-04-18T20:53:47Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Weakly Supervised Anomaly Detection: A Survey [75.26180038443462]
異常検出(AD)は、さまざまなアプリケーションによる機械学習において重要なタスクである。
弱教師付き異常検出法(WSAD)の総合的な調査を行った。
各設定に対して、正式な定義、鍵アルゴリズム、潜在的な将来の方向性を提供する。
論文 参考訳(メタデータ) (2023-02-09T10:27:21Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Towards Ethics by Design in Online Abusive Content Detection [7.163723138100273]
研究の成果は、ヘイトスピーチの検出、毒性、サイバーいじめなど、関連するいくつかのサブエリアに広がっている。
倫理的問題を先導し、2段階のプロセスとして統一されたフレームワークを提案する。
新たなフレームワークは、Ethics by Designの原則によってガイドされており、より正確で信頼性の高いモデルを構築するためのステップである。
論文 参考訳(メタデータ) (2020-10-28T13:10:24Z) - Mining Implicit Relevance Feedback from User Behavior for Web Question
Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。
提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。
実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文 参考訳(メタデータ) (2020-06-13T07:02:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。