論文の概要: Aura-CAPTCHA: A Reinforcement Learning and GAN-Enhanced Multi-Modal CAPTCHA System
- arxiv url: http://arxiv.org/abs/2508.14976v1
- Date: Wed, 20 Aug 2025 18:00:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.055004
- Title: Aura-CAPTCHA: A Reinforcement Learning and GAN-Enhanced Multi-Modal CAPTCHA System
- Title(参考訳): Aura-CAPTCHA:強化学習とGAN強化多モードCAPTCHAシステム
- Authors: Joydeep Chandra, Prabal Manhas, Ramanjot Kaur, Rashi Sahay,
- Abstract要約: Aura-CAPTCHAは、従来の手法の脆弱性に対処するマルチモーダルCAPTCHAシステムとして開発された。
この設計では、動的画像課題を生成するためのGAN(Generative Adrial Networks)、適応的難易度チューニングのための強化学習(RL)、テキストと音声のプロンプトを作成するための大規模言語モデル(LLM)を統合した。
- 参考スコア(独自算出の注目度): 1.4305544869388402
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aura-CAPTCHA was developed as a multi-modal CAPTCHA system to address vulnerabilities in traditional methods that are increasingly bypassed by AI technologies, such as Optical Character Recognition (OCR) and adversarial image processing. The design integrated Generative Adversarial Networks (GANs) for generating dynamic image challenges, Reinforcement Learning (RL) for adaptive difficulty tuning, and Large Language Models (LLMs) for creating text and audio prompts. Visual challenges included 3x3 grid selections with at least three correct images, while audio challenges combined randomized numbers and words into a single task. RL adjusted difficulty based on incorrect attempts, response time, and suspicious user behavior. Evaluations on real-world traffic demonstrated a 92% human success rate and a 10% bot bypass rate, significantly outperforming existing CAPTCHA systems. The system provided a robust and scalable approach for securing online applications while remaining accessible to users, addressing gaps highlighted in previous research.
- Abstract(参考訳): Aura-CAPTCHAは、光学文字認識(OCR)や逆画像処理といったAI技術によってますますバイパスされる従来の手法の脆弱性に対処するマルチモーダルCAPTCHAシステムとして開発された。
この設計は、動的画像課題を生成するためのGAN(Generative Adversarial Networks)、適応困難チューニングのための強化学習(RL)、テキストと音声のプロンプトを作成するための大規模言語モデル(LLM)を統合した。
視覚的な課題には、少なくとも3つの正しいイメージを持つ3x3グリッドの選択が含まれ、オーディオの課題はランダム化された数字と単語を1つのタスクに組み合わせたものだった。
RLは不正な試み、応答時間、不審なユーザの行動に基づいて難易度を調整した。
実世界のトラフィックの評価では、人間の成功率92%、ボットバイパス率10%が示され、既存のCAPTCHAシステムを大幅に上回った。
このシステムは、ユーザへのアクセスを保ちながら、オンラインアプリケーションを保護するための堅牢でスケーラブルなアプローチを提供し、以前の研究で強調されたギャップに対処した。
関連論文リスト
- Defensive Adversarial CAPTCHA: A Semantics-Driven Framework for Natural Adversarial Example Generation [48.60492738839292]
従来のCAPTCHAスキームは、ディープニューラルネットワーク(DNN)を利用した自動攻撃に対してますます脆弱になっている
本稿では,高度に特定された逆例を生成する新しいフレームワークである Unsourced Adversarial CAPTCHA (DAC) を提案する。
標的外攻撃、特にブラックボックスのシナリオでは、双方向非ソース対逆CAPTCHA(BP-DAC)を導入する。
論文 参考訳(メタデータ) (2025-06-12T13:30:01Z) - Open CaptchaWorld: A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents [23.715342148854006]
Open CaptchaWorldは、MLLMを使用したエージェントの視覚的推論とインタラクション能力を評価するために特別に設計された、Webベースのベンチマークとプラットフォームである。
その結果,Browser-Use Openai-o3 による成功率は 40.0% である。
これはOpen CaptchaWorldを、現在のマルチモーダルエージェントの限界を診断し、より堅牢なマルチモーダル推論システムの開発を導くための重要なベンチマークとして強調している。
論文 参考訳(メタデータ) (2025-05-30T17:59:55Z) - Oedipus: LLM-enchanced Reasoning CAPTCHA Solver [17.074422329618212]
OedipusはCAPTCHAの自動推論のための革新的なエンドツーエンドフレームワークである。
このフレームワークの中心は、複雑で人間に近いAIタスクを、シンプルでAIに近い一連のステップに分解する、新しい戦略である。
評価の結果,オエディプスはCAPTCHAを効果的に解決し,平均成功率は63.5%であった。
論文 参考訳(メタデータ) (2024-05-13T06:32:57Z) - A Survey of Adversarial CAPTCHAs on its History, Classification and
Generation [69.36242543069123]
本稿では, 逆CAPTCHAの定義を拡張し, 逆CAPTCHAの分類法を提案する。
また, 敵CAPTCHAの防御に使用可能な防御方法も分析し, 敵CAPTCHAに対する潜在的な脅威を示す。
論文 参考訳(メタデータ) (2023-11-22T08:44:58Z) - Diff-CAPTCHA: An Image-based CAPTCHA with Security Enhanced by Denoising
Diffusion Model [2.1551899143698328]
Diff-CAPTCHAは拡散モデルに基づく画像クリック型CAPTCHAスキームである。
本稿では,Faster R-CNNに基づくエンドツーエンドアタックや2段階アタックなど,いくつかの攻撃手法を開発する。
その結果, 拡散モデルによりCAPTCHAの安全性が向上し, 良好なユーザビリティが維持できることが示唆された。
論文 参考訳(メタデータ) (2023-08-16T13:41:29Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Feeling of Presence Maximization: mmWave-Enabled Virtual Reality Meets
Deep Reinforcement Learning [76.46530937296066]
本稿では,無線モバイルユーザに対して,超信頼性でエネルギー効率のよいバーチャルリアリティ(VR)体験を提供するという課題について検討する。
モバイルユーザへの信頼性の高い超高精細ビデオフレーム配信を実現するために,コーディネートマルチポイント(CoMP)伝送技術とミリ波(mmWave)通信を利用する。
論文 参考訳(メタデータ) (2021-06-03T08:35:10Z) - Robust Text CAPTCHAs Using Adversarial Examples [129.29523847765952]
Robust Text CAPTCHA (RTC) という,ユーザフレンドリーなテキストベースのCAPTCHA生成法を提案する。
第1段階では、前景と背景はランダムにサンプルされたフォントと背景画像で構成される。
第2段階では、CAPTCHAの解法をより妨害するために、高転送可能な逆攻撃をテキストCAPTCHAに適用する。
論文 参考訳(メタデータ) (2021-01-07T11:03:07Z) - Deep-CAPTCHA: a deep learning based CAPTCHA solver for vulnerability
assessment [1.027974860479791]
本研究では,CAPTCHAジェネレータシステムの弱点と脆弱性について検討する。
この目的を達成するために,Deep-CAPTCHAと呼ばれる畳み込みニューラルネットワークを開発した。
我々のネットワークのクラック精度は、数値およびアルファ数値テストデータセットの98.94%と98.31%のハイレートにつながる。
論文 参考訳(メタデータ) (2020-06-15T11:44:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。