論文の概要: (De)-Indexing and the Right to be Forgotten
- arxiv url: http://arxiv.org/abs/2501.03989v1
- Date: Tue, 07 Jan 2025 18:46:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-08 15:50:40.376510
- Title: (De)-Indexing and the Right to be Forgotten
- Title(参考訳): (De)接頭と禁じられる権利
- Authors: Salvatore Vilella, Giancarlo Ruffo,
- Abstract要約: 忘れられる権利(RTBF)により、個人は、時代遅れまたは有害な情報を公共アクセスから削除するよう要求することができる。
本稿では,情報検索(IR)とデインデクシング(de-indexing)の概念を導入することを目的とする。
- 参考スコア(独自算出の注目度): 0.11049608786515838
- License:
- Abstract: In the digital age, the challenge of forgetfulness has emerged as a significant concern, particularly regarding the management of personal data and its accessibility online. The right to be forgotten (RTBF) allows individuals to request the removal of outdated or harmful information from public access, yet implementing this right poses substantial technical difficulties for search engines. This paper aims to introduce non-experts to the foundational concepts of information retrieval (IR) and de-indexing, which are critical for understanding how search engines can effectively "forget" certain content. We will explore various IR models, including boolean, probabilistic, vector space, and embedding-based approaches, as well as the role of Large Language Models (LLMs) in enhancing data processing capabilities. By providing this overview, we seek to highlight the complexities involved in balancing individual privacy rights with the operational challenges faced by search engines in managing information visibility.
- Abstract(参考訳): デジタル時代には、特に個人データの管理とオンラインでのアクセシビリティに関して、忘れることの難しさが重要な関心事となっている。
忘れられる権利(RTBF)により、個人は、時代遅れまたは有害な情報を公共アクセスから削除するよう要求できるが、この権利を実装することは、検索エンジンに重大な技術的困難をもたらす。
本稿では,情報検索(IR)とデインデクシング(de-indexing)の基本的な概念に非専門家を導入することを目的とする。
データ処理機能向上における大規模言語モデル(LLM)の役割だけでなく,ブール,確率,ベクトル空間,埋め込みベースのアプローチなど,さまざまなIRモデルについても検討する。
この概要を提供することで、個々のプライバシー権と、検索エンジンが直面している情報視認性管理の運用上の課題のバランスにかかわる複雑さを強調したい。
関連論文リスト
- Secure Visual Data Processing via Federated Learning [2.4374097382908477]
本稿では,大規模ビジュアルデータ処理におけるプライバシ保護ソリューションの必要性に対処する。
本稿では,オブジェクト検出,フェデレーション学習,匿名化を組み合わせた新しい手法を提案する。
私たちのソリューションは、従来の集中型モデルに対して評価されており、精度がわずかにトレードオフされている一方で、プライバシー上のメリットがかなり大きいことを示している。
論文 参考訳(メタデータ) (2025-02-09T09:44:18Z) - A Review of the Challenges with Massive Web-mined Corpora Used in Large Language Models Pre-Training [0.0]
このレビューでは、ノイズ(不適切な情報や誤解を招く情報)、コンテンツの重複、品質の低い情報や誤った情報の存在、バイアス、機密情報や個人情報をウェブマイニングコーパスに含めることなど、この分野における重要な課題を明らかにしている。
データクリーニング、前処理、バイアス検出、緩和のための現在の手法を検討することで、既存のアプローチのギャップを強調し、今後の研究の方向性を提案する。
論文 参考訳(メタデータ) (2024-07-10T13:09:23Z) - "Glue pizza and eat rocks" -- Exploiting Vulnerabilities in Retrieval-Augmented Generative Models [74.05368440735468]
Retrieval-Augmented Generative (RAG)モデルにより大規模言語モデル(LLM)が強化される
本稿では,これらの知識基盤の開放性を敵が活用できるセキュリティ上の脅威を示す。
論文 参考訳(メタデータ) (2024-06-26T05:36:23Z) - The Frontier of Data Erasure: Machine Unlearning for Large Language Models [56.26002631481726]
大規模言語モデル(LLM)はAIの進歩の基礎となっている。
LLMは機密情報、偏見情報、著作権情報を記憶し、広めることによってリスクを生じさせる。
機械学習は、これらの懸念を軽減するための最先端のソリューションとして現れます。
論文 参考訳(メタデータ) (2024-03-23T09:26:15Z) - Machine Unlearning: Taxonomy, Metrics, Applications, Challenges, and
Prospects [17.502158848870426]
データユーザには、データを忘れる権利が与えられている。
機械学習(ML)の過程で、忘れられた権利は、ユーザーデータを削除するためにモデルプロバイダを必要とする。
機械学習は、業界と学界の両方からますます注目を集めている。
論文 参考訳(メタデータ) (2024-03-13T05:11:24Z) - Learning Cross-modality Information Bottleneck Representation for
Heterogeneous Person Re-Identification [61.49219876388174]
Visible-Infrared person re-identification (VI-ReID)は、インテリジェントビデオ監視において重要かつ困難な課題である。
既存の手法は主に共有特徴空間の学習に重点を置いており、可視光と赤外光の相違を減らす。
本稿では,新しい相互情報・モダリティコンセンサスネットワーク,すなわちCMInfoNetを提案し,モダリティ不変な同一性の特徴を抽出する。
論文 参考訳(メタデータ) (2023-08-29T06:55:42Z) - A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。
MLモデルは古いデータをよく記憶します。
機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文 参考訳(メタデータ) (2022-09-06T08:51:53Z) - Retrieval-Enhanced Machine Learning [110.5237983180089]
本稿では,いくつかの既存モデルを含む汎用的な検索強化機械学習フレームワークについて述べる。
REMLは情報検索の慣例に挑戦し、最適化を含む中核領域における新たな進歩の機会を提示している。
REMLリサーチアジェンダは、情報アクセス研究の新しいスタイルの基礎を築き、機械学習と人工知能の進歩への道を開く。
論文 参考訳(メタデータ) (2022-05-02T21:42:45Z) - Privacy in Open Search: A Review of Challenges and Solutions [0.6445605125467572]
情報検索(IR)は、攻撃や意図しない文書や検索履歴の開示など、プライバシー上の脅威に晒されている。
この研究は、ユーザの生成したテキストデータを含むタスクに焦点を当て、最近のIR文学におけるプライバシーに関するオープンな課題を強調し、議論することを目的としている。
論文 参考訳(メタデータ) (2021-10-20T18:38:48Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。