論文の概要: Agentic LLMs as Powerful Deanonymizers: Re-identification of Participants in the Anthropic Interviewer Dataset
- arxiv url: http://arxiv.org/abs/2601.05918v1
- Date: Fri, 09 Jan 2026 16:32:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:50.039236
- Title: Agentic LLMs as Powerful Deanonymizers: Re-identification of Participants in the Anthropic Interviewer Dataset
- Title(参考訳): 強力なデアノニマイザとしてのエージェントLDM: 人物インタビュアーデータセットにおける参加者の再同定
- Authors: Tianshi Li,
- Abstract要約: Anthropicは2025年12月4日に、質的なインタビューを大規模に実行するAIツールであるAnthropic Interviewerをリリースした。
ウェブ検索とエージェント機能を備えた LLM が,24 件中6 件のインタビューを特定の科学的研究にリンク可能であることを示す。
私の貢献は、現代のLSMベースのエージェントがそのような再識別を容易かつ低努力で行うことを示すことです。
- 参考スコア(独自算出の注目度): 2.1923220176069407
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: On December 4, 2025, Anthropic released Anthropic Interviewer, an AI tool for running qualitative interviews at scale, along with a public dataset of 1,250 interviews with professionals, including 125 scientists, about their use of AI for research. Focusing on the scientist subset, I show that widely available LLMs with web search and agentic capabilities can link six out of twenty-four interviews to specific scientific works, recovering associated authors and, in some cases, uniquely identifying the interviewees. My contribution is to show that modern LLM-based agents make such re-identification attacks easy and low-effort: off-the-shelf tools can, with a few natural-language prompts, search the web, cross-reference details, and propose likely matches, effectively lowering the technical barrier. Existing safeguards can be bypassed by breaking down the re-identification into benign tasks. I outline the attack at a high level, discuss implications for releasing rich qualitative data in the age of LLM agents, and propose mitigation recommendations and open problems. I have notified Anthropic of my findings.
- Abstract(参考訳): 2025年12月4日、Anthropicは、大規模に質的なインタビューを実行するためのAIツールであるAnthropic Interviewerをリリースした。
科学者のサブセットに着目して、ウェブ検索とエージェント機能を備えたLLMが、24件中6件のインタビューを特定の科学的研究にリンクし、関連する著者を回収し、場合によってはインタビュアーを独自に特定できることを示した。
私の貢献は、現代のLLMベースのエージェントが、このような再識別を容易かつ低努力で行うことを示すことです。オフザシェルフツールは、いくつかの自然言語プロンプトを使って、Webを検索し、参照の詳細を検索し、マッチを提案することで、技術的障壁を効果的に減らすことができます。
既存のセーフガードは、再識別を良質なタスクに分解することでバイパスすることができる。
攻撃の概要を概説し、LLMエージェント時代の豊かな質的データを公開することの意味を論じ、緩和勧告とオープンな問題を提案する。
私は自分の発見を人文科学に知らせた。
関連論文リスト
- Evaluating LLM-Contaminated Crowdsourcing Data Without Ground Truth [18.069595635842557]
クラウドソーシングワーカーによる大規模言語モデル(LLM)は、人間の入力を反映するデータセットに挑戦する。
LLMの共謀を考慮に入れたクラウドソーシングモデルの下で,理論的保証付き学習自由スコアリング機構を提案する。
論文 参考訳(メタデータ) (2025-06-08T04:38:39Z) - On Path to Multimodal Historical Reasoning: HistBench and HistAgent [68.02249599465337]
HistBenchは、AIの歴史的推論能力を評価するために設計された、414の高品質な質問の新しいベンチマークである。
タスクは、一次資料に基づく事実検索から、原稿や画像の解釈分析まで、幅広い歴史的問題にまたがる。
我々は、OCR、翻訳、アーカイブ検索、ヒストリーにおける画像理解のための慎重に設計されたツールを備えたヒストアジェント(HistAgent)を提示する。
論文 参考訳(メタデータ) (2025-05-26T17:22:20Z) - NewsInterview: a Dataset and a Playground to Evaluate LLMs' Ground Gap via Informational Interviews [65.35458530702442]
我々はジャーナリストのインタビューに焦点をあて、コミュニケーションの基盤と豊富なデータに富んだドメインに焦点をあてる。
我々はNPRとCNNから4万人の2人によるインフォメーションインタビューのデータセットをキュレートする。
LLMは、人間のインタビュアーよりも、認識を使い、より高いレベルの質問に目を向ける可能性がはるかに低い。
論文 参考訳(メタデータ) (2024-11-21T01:37:38Z) - The LLM Effect: Are Humans Truly Using LLMs, or Are They Being Influenced By Them Instead? [60.01746782465275]
大規模言語モデル(LLM)は、様々な分析タスクにおいて、人間のパフォーマンスに近い能力を示している。
本稿では,Human-LLMパートナーシップに着目した構造化ユーザスタディにより,特殊作業におけるLLMの効率と精度について検討する。
論文 参考訳(メタデータ) (2024-10-07T02:30:18Z) - 'Simulacrum of Stories': Examining Large Language Models as Qualitative Research Participants [13.693069737188859]
生産モデルに関する最近の興奮は、研究開発における人間の参加と労働の置き換えを示唆する提案の波を引き起こしている。
我々は,このパラダイムシフトの視点を理解するために,19人の定性的な研究者にインタビューを行った。
論文 参考訳(メタデータ) (2024-09-28T18:28:47Z) - AI Conversational Interviewing: Transforming Surveys with LLMs as Adaptive Interviewers [40.80290002598963]
本研究では,人間のインタビュアーを大規模言語モデル (LLM) に置き換えて,スケーラブルな対話型インタビュアーを実現する可能性について検討する。
大学生を対象に,AIやヒューマンインタビュアーによる会話面接にランダムに割り当てられた,小規模かつ詳細な調査を行った。
様々な量的・質的な尺度は, インタビュアーのガイドライン, 応答品質, 参加者参加率, 総合的な面接効果に順応した。
論文 参考訳(メタデータ) (2024-09-16T16:03:08Z) - LLMs Assist NLP Researchers: Critique Paper (Meta-)Reviewing [106.45895712717612]
大規模言語モデル(LLM)は、様々な生成タスクにおいて顕著な汎用性を示している。
本研究は,NLP研究者を支援するLLMの話題に焦点を当てる。
私たちの知る限りでは、このような包括的な分析を提供するのはこれが初めてです。
論文 参考訳(メタデータ) (2024-06-24T01:30:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。