論文の概要: Data Generation via Latent Factor Simulation for Fairness-aware Re-ranking
- arxiv url: http://arxiv.org/abs/2409.14078v1
- Date: Sat, 21 Sep 2024 09:13:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-10 15:26:56.309493
- Title: Data Generation via Latent Factor Simulation for Fairness-aware Re-ranking
- Title(参考訳): フェアネス・アウェア・リグレードのための潜在因子シミュレーションによるデータ生成
- Authors: Elena Stefancova, Cassidy All, Joshua Paup, Martin Homola, Nicholas Mattei, Robin Burke,
- Abstract要約: 合成データはアルゴリズム研究に有用な資源である。
フェアネスを意識したリコメンデーションのための新しいタイプのデータ: 合成レコメンデーションシステム出力を提案する。
- 参考スコア(独自算出の注目度): 11.133319460036082
- License:
- Abstract: Synthetic data is a useful resource for algorithmic research. It allows for the evaluation of systems under a range of conditions that might be difficult to achieve in real world settings. In recommender systems, the use of synthetic data is somewhat limited; some work has concentrated on building user-item interaction data at large scale. We believe that fairness-aware recommendation research can benefit from simulated data as it allows the study of protected groups and their interactions without depending on sensitive data that needs privacy protection. In this paper, we propose a novel type of data for fairness-aware recommendation: synthetic recommender system outputs that can be used to study re-ranking algorithms.
- Abstract(参考訳): 合成データはアルゴリズム研究に有用な資源である。
現実の環境では達成が難しいような,さまざまな条件下でのシステム評価を可能にする。
推奨システムでは、合成データの使用はある程度制限されており、大規模なユーザとイテムのインタラクションデータの構築に集中している研究もある。
我々は、プライバシ保護を必要とする機密データに依存することなく、保護されたグループとその相互作用の研究を可能にするため、公正を意識したレコメンデーションリサーチは、シミュレートされたデータの恩恵を受けることができると信じている。
本稿では,アルゴリズムの再評価に使用できる合成レコメンデータシステム出力という,公平性に配慮した新たなデータ形式を提案する。
関連論文リスト
- Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T22:53:09Z) - Permissioned Blockchain-based Framework for Ranking Synthetic Data Generators [0.5541644538483947]
我々は、Sawtoothと呼ばれる認可されたブロックチェーンフレームワーク内で、提案するランキングアルゴリズムをスマートコントラクトとして実装する、新しいアプローチを導入する。
本フレームワークは, 望ましくない特性と望ましくない特性の両方を考慮した, 微妙なランキングを提供することの有効性を実証する。
論文 参考訳(メタデータ) (2024-05-12T07:46:00Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Synthetic Data: Methods, Use Cases, and Risks [11.413309528464632]
研究コミュニティと業界の両方で勢いを増す可能性のある選択肢は、代わりに合成データを共有することだ。
我々は、合成データについて穏やかに紹介し、そのユースケース、未適応のプライバシー問題、そしてその固有の制限を効果的なプライバシー強化技術として論じます。
論文 参考訳(メタデータ) (2023-03-01T16:35:33Z) - Synthcity: facilitating innovative use cases of synthetic data in
different data modalities [86.52703093858631]
Synthcityは、MLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのための、オープンソースのソフトウェアパッケージである。
Synthcityは、実践者に対して、合成データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。
論文 参考訳(メタデータ) (2023-01-18T14:49:54Z) - Investigating Bias with a Synthetic Data Generator: Empirical Evidence
and Philosophical Interpretation [66.64736150040093]
機械学習の応用は、私たちの社会でますます広まりつつある。
リスクは、データに埋め込まれたバイアスを体系的に広めることである。
本稿では,特定の種類のバイアスとその組み合わせで合成データを生成するフレームワークを導入することにより,バイアスを分析することを提案する。
論文 参考訳(メタデータ) (2022-09-13T11:18:50Z) - Enabling Synthetic Data adoption in regulated domains [1.9512796489908306]
Model-CentricからData-Centricへの転換は、アルゴリズムよりもデータとその品質に重点を置いている。
特に、高度に規制されたシナリオにおける情報のセンシティブな性質を考慮する必要がある。
このようなコンウンドラムをバイパスする巧妙な方法は、生成プロセスから得られたデータであるSynthetic Dataに依存し、実際のデータプロパティを学習する。
論文 参考訳(メタデータ) (2022-04-13T10:53:54Z) - Synthetic Data and Simulators for Recommendation Systems: Current State
and Future Directions [0.0]
合成データとシミュレーターは、レコメンデーションシステムの性能と堅牢性を著しく改善する可能性がある。
我々は、過去の研究において、データ忠実性とプライバシとの間の重要なトレードオフを特定し、議論する。
論文 参考訳(メタデータ) (2021-12-21T07:29:09Z) - Synthetic Benchmarks for Scientific Research in Explainable Machine
Learning [14.172740234933215]
我々はXAI-Benchをリリースした。XAI-Benchは、合成データセットと、特徴属性アルゴリズムをベンチマークするためのライブラリである。
実世界のデータセットとは異なり、合成データセットは条件付き期待値の効率的な計算を可能にする。
いくつかの評価指標にまたがって一般的な説明可能性手法をベンチマークし、一般的な説明者にとっての障害モードを特定することで、ライブラリのパワーを実証する。
論文 参考訳(メタデータ) (2021-06-23T17:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。