論文の概要: Datasets for Navigating Sensitive Topics in Recommendation Systems
- arxiv url: http://arxiv.org/abs/2509.07269v1
- Date: Mon, 08 Sep 2025 22:58:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.137664
- Title: Datasets for Navigating Sensitive Topics in Recommendation Systems
- Title(参考訳): 推薦システムにおける感性トピックをナビゲートするためのデータセット
- Authors: Amelia Kovacs, Jerry Chee, Kimia Kazemian, Sarah Dean,
- Abstract要約: 感性ラベルの分類とユーザコンテンツ評価を含む2つの新しいデータセットを導入する。
MovieLensの評価データとDod the Dog Dieのコンテンツ警告を統合している。
もう1つは、ファン-フィクションのインタラクションデータとユーザー生成警告を、Archive of Our Ownから組み合わせたものです。
- 参考スコア(独自算出の注目度): 9.380485956902588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Personalized AI systems, from recommendation systems to chatbots, are a prevalent method for distributing content to users based on their learned preferences. However, there is growing concern about the adverse effects of these systems, including their potential tendency to expose users to sensitive or harmful material, negatively impacting overall well-being. To address this concern quantitatively, it is necessary to create datasets with relevant sensitivity labels for content, enabling researchers to evaluate personalized systems beyond mere engagement metrics. To this end, we introduce two novel datasets that include a taxonomy of sensitivity labels alongside user-content ratings: one that integrates MovieLens rating data with content warnings from the Does the Dog Die? community ratings website, and another that combines fan-fiction interaction data and user-generated warnings from Archive of Our Own.
- Abstract(参考訳): 推薦システムからチャットボットまで、パーソナライズされたAIシステムは、学習した好みに基づいてコンテンツをユーザーに配布する一般的な方法である。
しかし、これらのシステムによる有害な影響には懸念が高まり、ユーザを機密性や有害物質に晒す傾向があり、全体的な幸福感に悪影響を及ぼす可能性がある。
この懸念に定量的に対処するためには、コンテンツに対して関連する感度ラベルを持つデータセットを作成する必要がある。
この目的のために、我々は2つの新しいデータセットを導入し、センシティブラベルの分類とユーザコンテンツ評価を含む。
コミュニティのレーティングWebサイトと、ファンフィクションのインタラクションデータと、Archive of Our Ownのユーザ生成警告を組み合わせたもの。
関連論文リスト
- Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。
本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。
幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文 参考訳(メタデータ) (2025-05-02T04:01:31Z) - DISCOVER: Data-driven Identification of Sub-activities via Clustering and Visualization for Enhanced Activity Recognition in Smart Homes [52.09869569068291]
本研究では,未ラベルセンサデータから詳細な人間のサブアクティビティを検出する手法であるdiscoVERについて,事前のセグメンテーションに頼ることなく紹介する。
広範に使用されているHARデータセットに対する再注釈演習を通じて,その効果を実証する。
論文 参考訳(メタデータ) (2025-02-11T20:02:24Z) - Sensitive Content Classification in Social Media: A Holistic Resource and Evaluation [15.355814393928707]
6つのカテゴリにまたがるソーシャルメディアコンテンツモデレーションに適した統合データセットを提案しました。
これには、矛盾する言語、暴言、性的明示的な材料、薬物関連コンテンツ、自傷行為、スパムが含まれる。
この新たなデータセットを微調整した大規模言語モデルでは,市販のモデルに比べて検出性能が大幅に向上した。
論文 参考訳(メタデータ) (2024-11-29T16:44:02Z) - Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。
本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。
当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文 参考訳(メタデータ) (2024-08-07T16:35:10Z) - Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - Joint Multisided Exposure Fairness for Recommendation [76.75990595228666]
本稿では,消費者と生産者の両面から共同で問題をモデル化する,露出公正度尺度のファミリを定式化する。
具体的には、双方の利害関係者に対するグループ属性について、個別のユーザや項目を超えて、より体系的なバイアスを推奨するフェアネスの懸念を識別し緩和する。
論文 参考訳(メタデータ) (2022-04-29T19:13:23Z) - Causal Disentanglement with Network Information for Debiased
Recommendations [34.698181166037564]
近年の研究では、因果的観点からレコメンデーターシステムをモデル化することで、デビアスを提案する。
この設定における重要な課題は、隠れた共同設立者を説明することだ。
我々は,ネットワーク情報(すなわち,ユーザ・ソーシャルおよびユーザ・イテムネットワーク)を活用して,隠れた共同創設者をよりよく近似することを提案する。
論文 参考訳(メタデータ) (2022-04-14T20:55:11Z) - Enabling the Analysis of Personality Aspects in Recommender Systems [0.0]
既存のレコメンデーションシステムは、ユーザーからのフィードバック、例えば評価、類似したユーザーを検出するための一般的な項目に対するレビューの活用に重点を置いている。
我々はこの問題を,共通項目に対するフィードバックのないデータスパシティ (DSW-n-FCI) と呼んでいる。
ユーザの個性タイプを,ユーザの負担なく暗黙的に識別し,ユーザの個人的関心や知識レベルとともに取り入れる。
論文 参考訳(メタデータ) (2020-01-07T23:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。