論文の概要: Sparks of Artificial General Recommender (AGR): Early Experiments with
ChatGPT
- arxiv url: http://arxiv.org/abs/2305.04518v1
- Date: Mon, 8 May 2023 07:28:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 15:17:21.778531
- Title: Sparks of Artificial General Recommender (AGR): Early Experiments with
ChatGPT
- Title(参考訳): 人工ゼネラル・リコメンダー(AGR)の火花 : ChatGPTによる早期実験
- Authors: Guo Lin and Yongfeng Zhang
- Abstract要約: AGRは会話性と普遍性の両方からなり、自然対話に関わり、様々な領域にまたがってレコメンデーションを生成する。
我々は、AGRが従うべき基本原則を10つ提案し、それぞれに対応するテストプロトコルを提案する。
我々は,高度なLCMであるChatGPTが,モデルとのレコメンデーション指向の対話に係わるとともに,その振る舞いを観察することで,提案原則に従うことができるかどうかを評価する。
- 参考スコア(独自算出の注目度): 33.424692414746836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study investigates the feasibility of developing an Artificial General
Recommender (AGR), facilitated by recent advancements in Large Language Models
(LLMs). An AGR comprises both conversationality and universality to engage in
natural dialogues and generate recommendations across various domains. We
propose ten fundamental principles that an AGR should adhere to, each with its
corresponding testing protocols. We proceed to assess whether ChatGPT, a
sophisticated LLM, can comply with the proposed principles by engaging in
recommendation-oriented dialogues with the model while observing its behavior.
Our findings demonstrate the potential for ChatGPT to serve as an AGR, though
several limitations and areas for improvement are identified.
- Abstract(参考訳): 本研究では,近年のLarge Language Models (LLMs) の発展にともなう,AGR(Artificial General Recommender)の開発の可能性を検討する。
AGRは会話性と普遍性の両方からなり、自然対話に携わり、様々な領域にわたってレコメンデーションを生成する。
我々は、AGRが従うべき基本原則を10つ提案し、それぞれに対応するテストプロトコルを提案する。
我々は,高度なLCMであるChatGPTが,モデルとのレコメンデーション指向の対話に係わるとともに,その振る舞いを観察することで,提案した原則に従うことができるかどうかを評価する。
以上の結果から,ChatGPTがAGRとして機能する可能性が示唆された。
関連論文リスト
- Reinforcement of Explainability of ChatGPT Prompts by Embedding Breast Cancer Self-Screening Rules into AI Responses [0.7673339435080445]
この研究は、ChatGPTの推論能力を評価し、ルールを処理する可能性を強調し、レコメンデーションをスクリーニングするための説明を提供することを目的としている。
この方法論では、ChatGPTの推奨事項の詳細な説明を強制するために、教師付きプロンプトエンジニアリングアプローチを採用している。
発見は、エキスパートシステムシェルに匹敵する処理ルールにおけるChatGPTの有望な能力を強調している。
論文 参考訳(メタデータ) (2024-04-21T09:20:16Z) - GenRES: Rethinking Evaluation for Generative Relation Extraction in the
Era of Large Language Models [48.56814147033251]
我々は、GRE結果の類似性、特異性、粒度、事実性、完全性の観点から、多次元評価のためのGenRESを紹介する。
GenRESでは、精度/リコールがGREメソッドの性能を正当化できないことを実証的に確認した。
次に、GRE手法のヒト評価を行い、GenRESがRE品質に対するヒトの嗜好と一致していることを示す。
論文 参考訳(メタデータ) (2024-02-16T15:01:24Z) - Can GPT models Follow Human Summarization Guidelines? Evaluating ChatGPT
and GPT-4 for Dialogue Summarization [2.6321077922557192]
本研究は,対話要約のための人間のガイドラインに従う上で,ChatGPT や GPT-4 のようなプロンプト駆動型大規模言語モデル (LLM) の能力について検討する。
以上の結果から,GPTモデルは長大な要約を産出し,人間の要約ガイドラインから逸脱することが多いことが示唆された。
人間のガイドラインを中間的なステップとして使うと、約束が示され、いくつかのケースでは単語長の制約プロンプトよりも優れています。
論文 参考訳(メタデータ) (2023-10-25T17:39:07Z) - Large Language Models Meet Open-World Intent Discovery and Recognition:
An Evaluation of ChatGPT [37.27411474856601]
Out-of-domain(OOD)インテントディスカバリと一般化インテントディスカバリ(GID)は、オープンワールドインテントセットにクローズドインテントを拡張することを目的としている。
従来の手法は微調整の識別モデルによってそれらに対処する。
ChatGPTはゼロショット設定で一貫したアドバンテージを示すが、細調整されたモデルに比べて依然として不利である。
論文 参考訳(メタデータ) (2023-10-16T08:34:44Z) - GLoRE: Evaluating Logical Reasoning of Large Language Models [29.914546407784552]
GLoREは3種類のタスクにまたがる12のデータセットからなるベンチマークである。
ChatGPTとGPT-4は論理的推論の強い能力を示し、GPT-4はChatGPTをはるかに上回っている。
本稿では,ChatGPTの精度を高める自己整合性探索法と,オープンLLMの性能を向上させる微調整法を提案する。
論文 参考訳(メタデータ) (2023-10-13T13:52:15Z) - Development of the ChatGPT, Generative Artificial Intelligence and
Natural Large Language Models for Accountable Reporting and Use (CANGARU)
Guidelines [0.33249867230903685]
CANGARUは、学術におけるGAI/GPT/LLM技術の倫理的利用、開示、適切な報告に関する学際的グローバルコンセンサスを促進することを目的としている。
本プロトコルは, GAI/GPT/LLMアプリケーションについて, 学術研究における関連概念, 発見, 報告標準を理解し, その利用と開示に関するガイドラインを定式化するために, 進行中の体系的レビューから成り立っている。
論文 参考訳(メタデータ) (2023-07-18T05:12:52Z) - Rethinking the Evaluation for Conversational Recommendation in the Era
of Large Language Models [115.7508325840751]
近年の大規模言語モデル(LLM)の成功は、より強力な対話レコメンデーションシステム(CRS)を開発する大きな可能性を示している。
本稿では,ChatGPTの会話レコメンデーションへの活用について検討し,既存の評価プロトコルが不十分であることを明らかにする。
LLMをベースとしたユーザシミュレータを用いた対話型評価手法iEvaLMを提案する。
論文 参考訳(メタデータ) (2023-05-22T15:12:43Z) - Is ChatGPT a Good NLG Evaluator? A Preliminary Study [121.77986688862302]
NLG測定値として信頼性を示すため,ChatGPTのメタ評価を行った。
実験の結果,ChatGPTは従来の自動測定値と比較して,人間の判断と最先端あるいは競合的な相関を達成できた。
我々の予備研究は、汎用的な信頼性のあるNLGメトリックの出現を促すことを願っている。
論文 参考訳(メタデータ) (2023-03-07T16:57:20Z) - Graph Learning based Recommender Systems: A Review [111.43249652335555]
グラフ学習ベースのレコメンダーシステム(GLRS)は、高度なグラフ学習アプローチを使用して、ユーザーの好みと意図、および推奨項目の特性をモデル化します。
本稿では,グラフに基づく表現から重要な知識を抽出し,レコメンデーションの正確性,信頼性,説明性を向上する方法について論じることにより,GLRSの体系的なレビューを行う。
論文 参考訳(メタデータ) (2021-05-13T14:50:45Z) - Deep Conversational Recommender Systems: A New Frontier for
Goal-Oriented Dialogue Systems [54.06971074217952]
Conversational Recommender System (CRS)は対話型対話を通じてユーザの好みを学習し、モデル化する。
ディープラーニングアプローチはCRSに適用され、実りある結果を生み出した。
論文 参考訳(メタデータ) (2020-04-28T02:20:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。