論文の概要: Rakuten Data Release: A Large-Scale and Long-Term Reviews Corpus for Hotel Domain
- arxiv url: http://arxiv.org/abs/2512.15151v1
- Date: Wed, 17 Dec 2025 07:33:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.890005
- Title: Rakuten Data Release: A Large-Scale and Long-Term Reviews Corpus for Hotel Domain
- Title(参考訳): 楽天データ:ホテルドメイン向け大規模・長期レビューコーポレーション
- Authors: Yuki Nakayama, Koki Hikichi, Yun Ching Liu, Yu Hirate,
- Abstract要約: 私たちのコレクションには、2009年から2024年までの16年間の730万の顧客レビューが含まれています。
データセットの各レコードは、レビューテキスト、アコモテーションからの応答、匿名化されたレビュアーID、レビュー日、アコモテーション、プランID、プランタイトル、ルームタイプ、目的、付随するグループ、および全体的なスコアを含む。
- 参考スコア(独自算出の注目度): 2.839269856680852
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a large-scale corpus of Rakuten Travel Reviews. Our collection contains 7.3 million customer reviews for 16 years, ranging from 2009 to 2024. Each record in the dataset contains the review text, its response from an accommodation, an anonymized reviewer ID, review date, accommodation ID, plan ID, plan title, room type, room name, purpose, accompanying group, and user ratings from different aspect categories, as well as an overall score. We present statistical information about our corpus and provide insights into factors driving data drift between 2019 and 2024 using statistical approaches.
- Abstract(参考訳): 本稿では,楽天旅行レビューの大規模コーパスについて述べる。
私たちのコレクションには、2009年から2024年までの16年間の730万の顧客レビューが含まれています。
データセットの各レコードは、レビューテキスト、アコモテーションからの応答、匿名化されたレビュアーID、レビュー日、アコモテーションID、プランID、プランタイトル、ルームタイプ、ルーム名、目的、付随するグループ、および総合スコアを含む。
我々は,我々のコーパスに関する統計情報を提示し,統計的アプローチを用いて,2019年から2024年の間にデータドリフトを駆動する要因に関する洞察を提供する。
関連論文リスト
- What Matters in Evaluating Book-Length Stories? A Systematic Study of Long Story Evaluation [59.626962970198434]
最初の大規模ベンチマークであるLongStoryEvalを導入し,平均121Kトークン(最大397K)の600冊を新たに発行した。
ユーザによるすべての側面の分析により、評価基準構造を提案し、最も重要な側面を識別するための実験を行う。
評価手法として,アグリゲーションベース,インクリメンタル更新,要約ベースの評価の3つのタイプの有効性を比較した。
論文 参考訳(メタデータ) (2025-12-14T20:53:29Z) - The NetMob25 Dataset: A High-resolution Multi-layered View of Individual Mobility in Greater Paris Region [64.30214722988666]
本稿では,提案したデータセットのサーベイ設計,収集プロトコル,処理手法,特徴について述べる。
データセットには、人口統計、社会経済、家庭の特徴を記述した個人データベース(i)、タイムスタンプ、輸送モード、旅行目的を含む8,000以上の注釈付き変位を持つトリプスデータベース(ii)、約5億の高周波ポイントからなるRaw GPSトレースデータベース(iii)の3つのコンポーネントが含まれている。
論文 参考訳(メタデータ) (2025-06-06T09:22:21Z) - Enhancing Travel Decision-Making: A Contrastive Learning Approach for Personalized Review Rankings in Accommodations [2.1963463652873694]
我々は,著名なオンライン旅行プラットフォームから得られた,真のゲストレビューのデータセットを新たに提示する。
パーソナライズされたレビューランキングのための革新的なアプローチを提案する。
我々の研究の意味は旅行領域を超えて広がり、他の分野にも応用できる可能性がある。
論文 参考訳(メタデータ) (2024-06-30T18:04:16Z) - Towards Personalized Review Summarization by Modeling Historical Reviews
from Customer and Product Separately [59.61932899841944]
レビュー要約(review summarization)は、Eコマースのウェブサイトで製品レビューのメインの考え方を要約することを目的とした、簡単ではないタスクである。
Heterogeneous Historical Review aware Review Summarization Model (HHRRS)を提案する。
我々は、レビュー感情分類と要約を共同で行うマルチタスクフレームワークを採用している。
論文 参考訳(メタデータ) (2023-01-27T12:32:55Z) - Cross-Domain Consumer Review Analysis [0.0]
論文では、Amazon、Yelp、Steam、IMDbの4つの人気のあるレビューデータセットについて、ドメイン間のレビュー分析を行う。
この分析はHadoopとSparkを使って行われ、大規模なデータセットの効率的でスケーラブルな処理を可能にする。
論文 参考訳(メタデータ) (2022-12-23T18:16:09Z) - Amazon Product Recommender System [0.0]
Amazonで購入した顧客は、製品を1つから5つ星に評価し、製品の経験と意見のテキスト要約を共有することでレビューを提供します。
我々は、amazon上のデジタル音楽トラックのレコメンデーションモデルを構築するために、顧客が特定の製品(音楽トラック)にどんな評価スコアを与えるかを分析した。
Amazonのレビューデータセットには20万のデータサンプルが含まれている。データセットの70%でモデルをトレーニングし、残りの30%でモデルのパフォーマンスをテストする。
論文 参考訳(メタデータ) (2021-01-30T18:07:16Z) - Abstractive Opinion Tagging [65.47649273721679]
eコマースでは、意見タグは、アイテムのレビューの特徴を反映したEコマースプラットフォームが提供するタグのランクリストを指す。
意見タグを生成するための現在のメカニズムは、手作業またはラベル付け方法に依存します。
AOT-Net と呼ばれる抽象的な意見タグフレームワークを提案し、多数のレビューからランク付けされた意見タグのリストを生成します。
論文 参考訳(メタデータ) (2021-01-18T05:08:15Z) - ReviewRobot: Explainable Paper Review Generation based on Knowledge
Synthesis [62.76038841302741]
レビュースコアを自動的に割り当てて,新規性や意味のある比較など,複数のカテゴリのコメントを書くための,新しいReviewRobotを構築した。
実験の結果,レビュースコア予測器の精度は71.4%-100%であった。
ドメインの専門家による人間による評価は、ReviewRobotが生成したコメントの41.7%-70.5%が有効で建設的であり、その20%は人間が書いたものよりも優れていることを示している。
論文 参考訳(メタデータ) (2020-10-13T02:17:58Z) - The Multilingual Amazon Reviews Corpus [46.84980931183582]
我々は、多言語テキスト分類のための大規模なAmazonレビューコレクションであるMultilingual Amazon Reviews Corpus (MARC)を提示する。
MARCは2015年から2019年にかけて収集された英語、日本語、ドイツ語、フランス語、スペイン語、中国語のレビューを含んでいる。
コーパスは5つの星のレーティングでバランスが取れており、それぞれのレーティングは各言語のレビューの20%を占めている。
論文 参考訳(メタデータ) (2020-10-06T09:34:01Z) - HotelRec: a Novel Very Large-Scale Hotel Recommendation Dataset [39.38032088973816]
最先端のディープラーニングベースのモデルは、最高のパフォーマンスを達成するために、大量のデータを必要とします。
HotelRecは、5000万のレビューがあるホテルドメインで最大の公開データセットである。
論文 参考訳(メタデータ) (2020-02-17T09:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。