論文の概要: LLM-Assisted Web Measurements
- arxiv url: http://arxiv.org/abs/2510.08101v1
- Date: Thu, 09 Oct 2025 11:38:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:15.044231
- Title: LLM-Assisted Web Measurements
- Title(参考訳): LLMを用いたWeb計測
- Authors: Simone Bozzolan, Stefano Calzavara, Lorenzo Cazzaro,
- Abstract要約: 本研究では,大規模言語モデル(LLM)を対象とするWeb計測研究の手段として利用することを検討した。
以上の結果から, LLMはWeb上のセキュリティとプライバシの傾向を分析するための実用的なツールとして機能することを示す。
- 参考スコア(独自算出の注目度): 5.090162587197617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Web measurements are a well-established methodology for assessing the security and privacy landscape of the Internet. However, existing top lists of popular websites commonly used as measurement targets are unlabeled and lack semantic information about the nature of the sites they include. This limitation makes targeted measurements challenging, as researchers often need to rely on ad-hoc techniques to bias their datasets toward specific categories of interest. In this paper, we investigate the use of Large Language Models (LLMs) as a means to enable targeted web measurement studies through their semantic understanding capabilities. Building on prior literature, we identify key website classification tasks relevant to web measurements and construct datasets to systematically evaluate the performance of different LLMs on these tasks. Our results demonstrate that LLMs may achieve strong performance across multiple classification scenarios. We then conduct LLM-assisted web measurement studies inspired by prior work and rigorously assess the validity of the resulting research inferences. Our results demonstrate that LLMs can serve as a practical tool for analyzing security and privacy trends on the Web.
- Abstract(参考訳): Web測定は、インターネットのセキュリティとプライバシの状況を評価するための、確立された方法論である。
しかし、測定対象としてよく使われる人気ウェブサイトの既存の上位リストにはラベルがなく、それらに含まれるサイトの性質に関する意味情報がない。
この制限により、研究者はデータセットを特定のカテゴリーの関心に偏らせるために、しばしばアドホックなテクニックに頼る必要があるため、ターゲットの計測が困難になる。
本稿では,Large Language Models (LLMs) のセマンティック理解機能によるWeb計測研究を実現する手段として,Large Language Models (LLMs) の利用について検討する。
従来の文献に基づいて,Web計測に関連する主要なWebサイト分類タスクを特定し,これらのタスクにおける異なるLLMの性能を体系的に評価するデータセットを構築した。
以上の結果から,LLMは複数の分類シナリオにおいて高い性能を発揮する可能性が示唆された。
次に、先行研究に触発されたLLM支援Web計測研究を行い、その結果の推測の有効性を厳格に評価する。
以上の結果から, LLMはWeb上のセキュリティとプライバシの傾向を分析するための実用的なツールとして機能することを示す。
関連論文リスト
- Web-Browsing LLMs Can Access Social Media Profiles and Infer User Demographics [7.849709311008473]
大規模言語モデル(LLM)は伝統的に静的トレーニングデータに依存しており、その知識を固定スナップショットに制限している。
近年のLLMはウェブ閲覧機能を備えており、リアルタイム情報検索やライブウェブコンテンツの多段階推論が可能になっている。
本稿では,ウェブブラウジング LLM がユーザ名のみを付与したソーシャルメディア利用者の人口統計特性を推測できるかどうかを評価する。
これらのモデルがソーシャルメディアのコンテンツにアクセスでき、適切な精度でユーザー人口を予測できることを示す。
論文 参考訳(メタデータ) (2025-07-16T16:21:01Z) - Beyond Binary: Towards Fine-Grained LLM-Generated Text Detection via Role Recognition and Involvement Measurement [51.601916604301685]
大規模言語モデル(LLM)は、オンライン談話における信頼を損なう可能性のあるコンテンツを生成する。
現在の手法はバイナリ分類に重点を置いており、人間とLLMのコラボレーションのような現実のシナリオの複雑さに対処できないことが多い。
バイナリ分類を超えてこれらの課題に対処するために,LLM生成コンテンツを検出するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2024-10-18T08:14:10Z) - AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文 参考訳(メタデータ) (2024-10-17T17:50:38Z) - LLM-PBE: Assessing Data Privacy in Large Language Models [111.58198436835036]
大規模言語モデル(LLM)は多くのドメインに不可欠なものとなり、データ管理、マイニング、分析におけるアプリケーションを大幅に進歩させた。
この問題の批判的な性質にもかかわらず、LLMにおけるデータプライバシのリスクを総合的に評価する文献は存在しない。
本稿では,LLMにおけるデータプライバシリスクの体系的評価を目的としたツールキットであるLLM-PBEを紹介する。
論文 参考訳(メタデータ) (2024-08-23T01:37:29Z) - Unveiling LLM Evaluation Focused on Metrics: Challenges and Solutions [2.5179515260542544]
大規模言語モデル (LLM) は、テキスト生成、質問応答、テキスト要約における汎用的な応用のために、学界や業界全体で大きな注目を集めている。
パフォーマンスを定量化するためには、既存のメトリクスを包括的に把握することが重要です。
本稿では,メトリクスの観点からLLM評価を包括的に調査し,現在使用されているメトリクスの選択と解釈について考察する。
論文 参考訳(メタデータ) (2024-04-14T03:54:00Z) - "What's important here?": Opportunities and Challenges of Using LLMs in
Retrieving Information from Web Interfaces [19.656406003275713]
本研究では,大規模言語モデル (LLM) を用いて,Web インターフェースにおいてユーザが与えられたクエリに対して重要な要素を検索し,発見する方法について検討する。
私たちの経験的な実験によると、LLMは重要なUI要素を取得する上で適切なレベルのパフォーマンスを示しますが、改善の余地は依然としてあります。
論文 参考訳(メタデータ) (2023-12-11T06:26:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。