論文の概要: FArMARe: a Furniture-Aware Multi-task methodology for Recommending
Apartments based on the user interests
- arxiv url: http://arxiv.org/abs/2309.03100v1
- Date: Wed, 6 Sep 2023 15:40:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 14:58:50.901220
- Title: FArMARe: a Furniture-Aware Multi-task methodology for Recommending
Apartments based on the user interests
- Title(参考訳): FArMARe: 利用者の関心に基づく集合住宅の推薦のための家具対応マルチタスク手法
- Authors: Ali Abdari, Alex Falcon, Giuseppe Serra
- Abstract要約: テキスト・ツー・アパートメント・レコメンデーション(text-to-apartment recommendation)と呼ばれる新しい問題は、テキストクエリとの関連性に基づいて、アパートのランク付けを要求する。
家具を意識したクロスモーダルコントラストトレーニングを支援するマルチタスクアプローチであるFArMAReを紹介する。
- 参考スコア(独自算出の注目度): 4.330065443215895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, many people frequently have to search for new accommodation
options. Searching for a suitable apartment is a time-consuming process,
especially because visiting them is often mandatory to assess the truthfulness
of the advertisements found on the Web. While this process could be alleviated
by visiting the apartments in the metaverse, the Web-based recommendation
platforms are not suitable for the task. To address this shortcoming, in this
paper, we define a new problem called text-to-apartment recommendation, which
requires ranking the apartments based on their relevance to a textual query
expressing the user's interests. To tackle this problem, we introduce FArMARe,
a multi-task approach that supports cross-modal contrastive training with a
furniture-aware objective. Since public datasets related to indoor scenes do
not contain detailed descriptions of the furniture, we collect and annotate a
dataset comprising more than 6000 apartments. A thorough experimentation with
three different methods and two raw feature extraction procedures reveals the
effectiveness of FArMARe in dealing with the problem at hand.
- Abstract(参考訳): 今日では、多くの人が新しい宿泊オプションを検索しなければならない。
適切なアパートを探すのは時間を要するプロセスであり、特に訪問はウェブで見られる広告の真偽を評価するのにしばしば必須である。
このプロセスはメタバースのアパートを訪れることで緩和できるが、Webベースのレコメンデーションプラットフォームはそのタスクには適さない。
この欠点に対処するため,本稿では,利用者の関心を表わすテキストクエリとの関連性に基づいて,アパートのランク付けを要求されるテキスト・ツー・アパートメント・レコメンデーションという新たな課題を定義した。
この問題を解決するために,家具を意識したクロスモーダルコントラストトレーニングを支援するマルチタスクアプローチであるFArMAReを導入する。
屋内シーンに関する公開データセットには家具の詳細な記述がないため,6000以上の集合住宅からなるデータセットを収集・注釈する。
3つの異なる方法と2つの生の特徴抽出法による徹底的な実験により、FArMAReが手前の問題に対処する効果が示された。
関連論文リスト
- Bundle Fragments into a Whole: Mining More Complete Clusters via Submodular Selection of Interesting webpages for Web Topic Detection [49.8035161337388]
最先端のソリューションは、まず、Webページを多数の粒度トピック候補にまとめることである。
ホットトピックは、その面白さを推定することによってさらに特定される。
本稿では,フラグメントからより完全なホットトピックを抽出するためのバンドル・リフィニング手法を提案する。
論文 参考訳(メタデータ) (2024-09-19T00:46:31Z) - Transforming Location Retrieval at Airbnb: A Journey from Heuristics to Reinforcement Learning [15.048068346096027]
本稿では,機械学習に基づく位置情報検索プロダクトをゼロから構築する手法,課題,およびその影響について述べる。
適切な機械学習ベースのアプローチが欠如しているにもかかわらず、コールドスタート、一般化、微分、アルゴリズムバイアスに取り組む。
論文 参考訳(メタデータ) (2024-08-23T22:51:14Z) - MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation [70.83668869857665]
MMTryonはマルチモーダルなマルチ参照VIrtual Try-ONフレームワークである。
テキスト命令と複数の衣料品画像を入力として、高品質な合成試行結果を生成することができる。
論文 参考訳(メタデータ) (2024-05-01T11:04:22Z) - Learning Multiple Representations with Inconsistency-Guided Detail Regularization for Mask-Guided Matting [20.55342666783899]
マスク誘導マットネットワークは近年,実用化に大きな可能性を秘めている。
これらのアプローチは、間違ったリージョンで低レベルの詳細をオーバーフィットする傾向があります。
マスク誘導マットモデルのための新しい補助学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-28T08:21:56Z) - Asking Multimodal Clarifying Questions in Mixed-Initiative
Conversational Search [89.1772985740272]
混合開始型会話検索システムでは、質問を明確にすることで、意図を単一のクエリで表現するのに苦労するユーザを支援する。
マルチモーダル情報が関係するシナリオでは、非テクスチャ情報を用いることで、明確化のプロセスを改善することができると仮定する。
質問を明確にする4k以上のマルチモーダルを含むMelonというデータセットを収集し、14k以上の画像で濃縮する。
クエリの明確化フェーズにおけるマルチモーダルコンテンツの重要性を理解するために,いくつかの解析を行った。
論文 参考訳(メタデータ) (2024-02-12T16:04:01Z) - A Language-based solution to enable Metaverse Retrieval [4.330065443215895]
本稿では,これらの側面をモデル化することを目的とした,テキスト・ツー・メタバース検索という新しいタスクを提案する。
また,マルチメディアコンテンツに富んだ3Dシーンで構成された33000個のメタバースのデータセットも収集する。
論文 参考訳(メタデータ) (2023-12-22T12:08:08Z) - A Survey of Open Source User Activity Traces with Applications to User Mobility Characterization and Modeling [4.936226952764696]
ユーザモビリティ研究の最先端は、オープンソースのモビリティトレースに大きく依存している。
これらのトレースのほとんどは機能豊かで多様であり、提供される情報だけでなく、どのように利用され、活用されるかにも当てはまります。
本調査では,移動モード,データソース,収集技術を含むオープンソースモビリティトレースを分類する分類法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:05:11Z) - Few-shot Partial Multi-view Learning [103.33865779721458]
本稿では,複数ショット部分的多視点学習という新しい課題を提案する。
それは、低データ体制におけるビューミス問題によるネガティブな影響を克服することに焦点を当てている。
提案手法を評価するため,広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-05-05T13:34:43Z) - Distant Supervision for E-commerce Query Segmentation via Attention
Network [22.946144345151605]
本稿では,外部のコンテキスト情報を自然に効果的に活用し,クエリセグメンテーションを支援するような,アテンションモジュールを備えたBiLSTM-CRFベースのモデルを提案する。
2つのデータセットの実験は、いくつかのベースラインと比較して、我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-09T03:00:52Z) - On the Social and Technical Challenges of Web Search Autosuggestion
Moderation [118.47867428272878]
自動提案は通常、検索ログと文書表現のコーパスに基づいてトレーニングされた機械学習(ML)システムによって生成される。
現在の検索エンジンは、このような問題のある提案を抑えるのに、ますます熟練している。
問題のある提案のいくつかの側面、パイプラインに沿った困難な問題、そしてWeb検索を超えたアプリケーションの増加になぜ私たちの議論が適用されるのかについて論じる。
論文 参考訳(メタデータ) (2020-07-09T19:22:00Z) - Weakly-Supervised Multi-Level Attentional Reconstruction Network for
Grounding Textual Queries in Videos [73.4504252917816]
ビデオ中のテキストクエリを時間的にグラウンド化するタスクは、与えられたクエリに意味的に対応する1つのビデオセグメントをローカライズすることである。
既存のアプローチのほとんどは、トレーニングのためのセグメント-セマンスペア(時間アノテーション)に依存しており、通常は現実のシナリオでは利用できない。
トレーニング段階では,映像文ペアのみに依存するマルチレベル注意再構築ネットワーク(MARN)と呼ばれる,効果的な弱教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-03-16T07:01:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。