Fugu-MT 論文翻訳(概要): Evaluating the Robustness of Conversational Recommender Systems by Adversarial Examples

論文の概要: Evaluating the Robustness of Conversational Recommender Systems by Adversarial Examples

arxiv url: http://arxiv.org/abs/2303.05575v1
Date: Thu, 9 Mar 2023 20:51:18 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-13 16:54:19.293521
Title: Evaluating the Robustness of Conversational Recommender Systems by Adversarial Examples
Title（参考訳）: 逆例による会話レコメンダシステムのロバスト性評価
Authors: Ali Montazeralghaem and James Allan
Abstract要約: 2つのカテゴリに4つのシナリオを含む逆評価手法を提案する。我々は、異なる入力データに直面して、これらのシステムのロバスト性を評価するために、逆例を生成する。以上の結果から, いずれのシステムも頑健であり, 敵の例に信頼性がないことが明らかとなった。
参考スコア（独自算出の注目度）: 16.49836195831763
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Conversational recommender systems (CRSs) are improving rapidly, according to the standard recommendation accuracy metrics. However, it is essential to make sure that these systems are robust in interacting with users including regular and malicious users who want to attack the system by feeding the system modified input data. In this paper, we propose an adversarial evaluation scheme including four scenarios in two categories and automatically generate adversarial examples to evaluate the robustness of these systems in the face of different input data. By executing these adversarial examples we can compare the ability of different conversational recommender systems to satisfy the user's preferences. We evaluate three CRSs by the proposed adversarial examples on two datasets. Our results show that none of these systems are robust and reliable to the adversarial examples.
Abstract（参考訳）: 標準推奨精度指標によれば、会話推薦システム(crss)は急速に改善されている。しかし,システム修正入力データの提供により,システム攻撃を希望する正規ユーザや悪意のあるユーザを含むユーザとのインタラクションが堅牢であることを確認することが不可欠である。本稿では,2つのカテゴリに4つのシナリオを含む対向評価手法を提案し,異なる入力データに対してシステムのロバスト性を評価するための対向例を自動的に生成する。これらの逆の例を実行することで、異なる会話型レコメンダシステムのユーザの好みを満たす能力を比較することができる。 2つのデータセット上で提案した逆例を用いて3つのCRSを評価する。その結果,いずれのシステムも,実例に対して堅牢で信頼性の高いものはないことがわかった。

関連論文リスト

Search-Based Interaction For Conversation Recommendation via Generative Reward Model Based Simulated User [117.82681846559909]
会話レコメンデーションシステム(CRS)は、マルチターンインタラクションを使用してユーザの好みを捉え、パーソナライズされたレコメンデーションを提供する。本稿では,CRSと自動インタラクションを行うための生成報酬モデルに基づくシミュレーションユーザGRSUを提案する。
論文参考訳（メタデータ） (2025-04-29T06:37:30Z)
Towards Robust Offline Evaluation: A Causal and Information Theoretic Framework for Debiasing Ranking Systems [6.540293515339111]
検索レベルシステムのオフライン評価は、高性能なモデルの開発に不可欠である。本稿では,検索グレードシステムのオフライン評価を行うための新しいフレームワークを提案する。本研究は,(1)オフライン評価バイアスに対処するための因果関係の定式化,(2)システムに依存しない脱バイアスフレームワーク,(3)有効性の実証的検証を含む。
論文参考訳（メタデータ） (2025-04-04T23:52:57Z)
An Efficient Multi-threaded Collaborative Filtering Approach in Recommendation System [0.0]
本研究は,多数のユーザを効率的に扱えるスケーラブルなレコメンデーションシステムの構築に焦点を当てる。これを実現するために、マルチスレッドの類似性アプローチが採用されている。この並列化は従来の手法に比べて計算時間を著しく短縮し、高速で効率的でスケーラブルなレコメンデーションシステムをもたらす。
論文参考訳（メタデータ） (2024-09-28T06:33:18Z)
A Unified Causal Framework for Auditing Recommender Systems for Ethical Concerns [40.793466500324904]
我々は、因果レンズからのレコメンデータシステム監査を見て、監査基準を定義するための一般的なレシピを提供する。この一般的な因果監査フレームワークでは、既存の監査指標を分類し、それらのギャップを識別する。本稿では,ユーザ自身やユーザの推奨に影響を及ぼす能力を計測する,未来と過去の評価可能性と安定性の2つのクラスを提案する。
論文参考訳（メタデータ） (2024-09-20T04:37:36Z)
Revisiting Reciprocal Recommender Systems: Metrics, Formulation, and Method [60.364834418531366]
RRSの性能を包括的かつ正確に評価する5つの新しい評価指標を提案する。因果的観点からRSを定式化し、二元的介入として勧告を定式化する。提案手法では,結果の一致を最大化する手法を提案する。
論文参考訳（メタデータ） (2024-08-19T07:21:02Z)
System-2 Recommenders: Disentangling Utility and Engagement in Recommendation Systems via Temporal Point-Processes [80.97898201876592]
本稿では,過去のコンテンツインタラクションが,自己興奮型ホークスプロセスに基づくユーザの到着率に影響を及ぼす生成モデルを提案する。そこで本研究では,システム1とシステム2のアンタングルを解消し,ユーザ利用によるコンテンツ最適化を可能にすることを解析的に示す。
論文参考訳（メタデータ） (2024-05-29T18:19:37Z)
User-Controllable Recommendation via Counterfactual Retrospective and Prospective Explanations [96.45414741693119]
本稿では,説明可能性と可制御性をシームレスに統合するユーザ制御型レコメンデータシステムを提案する。反ファクト推論を通じて、ふりかえりと予測的な説明の両方を提供することで、ユーザーはシステムに対する制御をカスタマイズできる。
論文参考訳（メタデータ） (2023-08-02T01:13:36Z)
Revealing User Familiarity Bias in Task-Oriented Dialogue via Interactive Evaluation [17.41434948048325]
我々は,現実的なシナリオに対して,TODシステムがいかに脆弱であるかを明らかにするために,インタラクティブなユーザスタディを実施している。我々の研究は、オープンゴール設定での会話がシステムの破滅的な失敗につながることを明らかにした。我々は,システムの能力を超えても,システムがユーザの要求を処理するふりをする,新たな“予測”行動を発見した。
論文参考訳（メタデータ） (2023-05-23T09:24:53Z)
Re-Examining System-Level Correlations of Automatic Summarization Evaluation Metrics [64.81682222169113]
システムレベルの相関により, 要約品質の人的判断を再現する自動要約評価指標を確実に定量化する。システムレベルの相関の定義が、実際にシステムを評価するためにメトリクスがどのように使われているかと矛盾する2つの方法を特定する。
論文参考訳（メタデータ） (2022-04-21T15:52:14Z)
Membership Inference Attacks Against Recommender Systems [33.66394989281801]
我々は,会員推論のレンズを用いて,レコメンデータシステムのプライバシー漏洩を定量化するための最初の試みを行う。私たちの攻撃はユーザレベルにありますが、データサンプルレベルではありません。シャドーレコメンデータは、ラベル付きトレーニングデータを導出し、攻撃モデルを訓練する。
論文参考訳（メタデータ） (2021-09-16T15:19:19Z)
Improving Conversational Question Answering Systems after Deployment using Feedback-Weighted Learning [69.42679922160684]
本稿では,二元的ユーザフィードバックを用いた初期教師付きシステムを改善するために,重要サンプリングに基づくフィードバック重み付き学習を提案する。当社の作業は,実際のユーザとのインタラクションを活用し,デプロイ後の会話システムを改善する可能性を開くものだ。
論文参考訳（メタデータ） (2020-11-01T19:50:34Z)
PONE: A Novel Automatic Evaluation Metric for Open-Domain Generative Dialogue Systems [48.99561874529323]
オープンドメイン生成対話システムの評価には3つの方法がある。体系的な比較が欠如しているため、どの指標がより効果的であるかは明らかでない。本稿では,人間の判断との相関性を大幅に改善できる,新しい,実現可能な学習基準を提案する。
論文参考訳（メタデータ） (2020-04-06T04:36:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。