論文の概要: JourneyFormer: Encoding Airbnb Guest Journey with Sequence Modeling
- arxiv url: http://arxiv.org/abs/2606.19108v1
- Date: Wed, 17 Jun 2026 14:22:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.199681
- Title: JourneyFormer: Encoding Airbnb Guest Journey with Sequence Modeling
- Title(参考訳): JourneyFormer: シーケンスモデリングによるAirbnbゲストジャーニーのエンコード
- Authors: Daochen Zha, Chun How Tan, Xin Liu, Bin Xu, Han Zhao, Xiaowei Liu, Tracy Yu, Hui Gao, Huiji Gao, Liwei He, Stephanie Moyerman, Sanjeev Katariya,
- Abstract要約: Airbnbの検索ランキングのシーケンスモデリングソリューションであるJourneyFormerを紹介します。
ゲストイベントの選択、ID埋め込み、モデルアーキテクチャ、ラベル属性といった側面について、重要な設計上の考察を詳述する。
JourneyFormerは、その有効性と影響が証明されているAirbnbのプロダクション内で、うまくデプロイされている。
- 参考スコア(独自算出の注目度): 28.359585312679
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sequence modeling has become increasingly popular in recommendation and ranking algorithms, owing to its capacity to model users' historical behaviors and infer user intentions. Despite its theoretical simplicity, the practical deployment of a sequence model in production is non-trivial due to complexity of the sequence and sparse labels. For example, in Airbnb, guest sequences are often long, exploratory and complex, and we focus on booking labels, which are sparse. As such, we are often required to make various design decisions regarding data and modeling to strike a balance between effectiveness and scalability. This work delved into these production challenges and deployed JourneyFormer, a sequence modeling solution for search ranking at Airbnb. We detail crucial design considerations, covering aspects such as guest event selection, ID embeddings, model architecture, and label attribution. Additionally, we describe several tailored strategies to accelerate model training and inference. JourneyFormer has been successfully deployed within Airbnb's production, where its effectiveness and impact have been evidenced not only by improved offline ranking metrics but also by significant gains in key business metrics through online A/B testing across 2 production surfaces.
- Abstract(参考訳): シークエンス・モデリングは、ユーザの過去の振る舞いをモデル化し、ユーザの意図を推測する能力のため、推薦アルゴリズムやランキングアルゴリズムでますます人気が高まっている。
理論的な単純さにもかかわらず、シークエンスモデルの本番環境での展開は、シークエンスとスパースラベルの複雑さのため、非自明である。
例えばAirbnbでは、ゲストシーケンスは長く、探索的であり、複雑です。
そのため、我々は、有効性とスケーラビリティのバランスをとるために、データとモデリングに関する様々な設計決定をする必要があることが多い。
この作業は、これらの運用上の課題を掘り下げ、Airbnbの検索ランキングのためのシーケンスモデリングソリューションであるJourneyFormerをデプロイした。
ゲストイベントの選択、ID埋め込み、モデルアーキテクチャ、ラベル属性といった側面について、重要な設計上の考察を詳述する。
さらに、モデルトレーニングと推論を加速するためのいくつかの調整戦略について述べる。
JourneyFormerは、オフラインランキングメトリクスの改善だけでなく、2つのプロダクションサーフェスにわたるオンラインA/Bテストを通じて、主要なビジネスメトリクスの大幅な増加によって、その効果と影響が証明されたAirbnb製品内でのデプロイに成功している。
関連論文リスト
- Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - Intention-Conditioned Flow Occupancy Models [80.42634994902858]
大規模な事前学習は、今日の機械学習研究のやり方を根本的に変えた。
同じフレームワークを強化学習に適用することは、RLの中核的な課題に対処するための魅力的な方法を提供するので、魅力的です。
生成AIの最近の進歩は、高度に複雑な分布をモデリングするための新しいツールを提供している。
論文 参考訳(メタデータ) (2025-06-10T15:27:46Z) - Base Models Beat Aligned Models at Randomness and Creativity [37.51263520226411]
ランダム数生成や混合戦略ゲーム(岩紙シッセ、隠れて探す)、創造的な文章など、予測不可能な出力を必要とするタスクについて検討する。
それぞれの場合、アライメントモデルは、例えば他の一様乱数よりも「7」を生成することを好むなど、異なる不利益をもたらす狭い振舞いに傾向する。
テストされたモデル全体では、一般的なベンチマークのパフォーマンス向上は、タスクのパフォーマンス低下と相関する傾向にあり、必要な能力の効果的なトレードオフが示唆されます。
論文 参考訳(メタデータ) (2025-04-30T03:41:55Z) - Revisiting SMoE Language Models by Evaluating Inefficiencies with Task Specific Expert Pruning [78.72226641279863]
SMOE(Sparse Mixture of Expert)モデルは、言語モデリングにおける高密度モデルに代わるスケーラブルな代替品として登場した。
本研究は,SMoEアーキテクチャの設計に関する意思決定を行うために,タスク固有のモデルプルーニングについて検討する。
適応型タスク対応プルーニング手法 UNCURL を導入し,MoE 層当たりの専門家数をオフラインで学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T22:35:03Z) - An Interpretable Ensemble of Graph and Language Models for Improving
Search Relevance in E-Commerce [22.449320058423886]
プラグアンドプレイグラフLanguage Model (PP-GLAM) を提案する。
このアプローチでは、均一なデータ処理パイプラインを備えたモジュラーフレームワークを使用します。
PP-GLAMは,実世界のマルチリンガル,マルチリージョンのeコマースデータセット上で,最先端のベースラインとプロプライエタリなモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-01T19:08:25Z) - Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - Multi-Modal Experience Inspired AI Creation [33.34566822058209]
シーケンシャルなマルチモーダル情報に基づいてテキストを生成する方法について検討する。
まず,マルチモーダルアテンションネットワークを備えたマルチチャネルシーケンス・ツー・シーケンスアーキテクチャを設計する。
次に、逐次入力に適したカリキュラム負サンプリング戦略を提案する。
論文 参考訳(メタデータ) (2022-09-02T11:50:41Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。