論文の概要: Learning to Taste: A Multimodal Wine Dataset
- arxiv url: http://arxiv.org/abs/2308.16900v1
- Date: Thu, 31 Aug 2023 17:58:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-01 13:22:20.478573
- Title: Learning to Taste: A Multimodal Wine Dataset
- Title(参考訳): 味を学習する:マルチモーダルワインデータセット
- Authors: Thoranna Bender, Simon M{\o}e S{\o}rensen, Alireza Kashani, K. Eldjarn
Hjorleifsson, Grethe Hyldig, S{\o}ren Hauberg, Serge Belongie and Frederik
Warburg
- Abstract要約: We present WineSensed, a large multimodal wine data for study the relationship between visual perception, language, and flavor。
データセットには、ワインラベルの897kの画像と、ヴィヴィノ・プラットフォームからキュレートされたワインの824kのレビューが含まれている。
人間の経験と自動機械類似性カーネルを組み合わせた低次元概念埋め込みアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 5.119970053489524
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present WineSensed, a large multimodal wine dataset for studying the
relations between visual perception, language, and flavor. The dataset
encompasses 897k images of wine labels and 824k reviews of wines curated from
the Vivino platform. It has over 350k unique vintages, annotated with year,
region, rating, alcohol percentage, price, and grape composition. We obtained
fine-grained flavor annotations on a subset by conducting a wine-tasting
experiment with 256 participants who were asked to rank wines based on their
similarity in flavor, resulting in more than 5k pairwise flavor distances. We
propose a low-dimensional concept embedding algorithm that combines human
experience with automatic machine similarity kernels. We demonstrate that this
shared concept embedding space improves upon separate embedding spaces for
coarse flavor classification (alcohol percentage, country, grape, price,
rating) and aligns with the intricate human perception of flavor.
- Abstract(参考訳): 我々は,視覚知覚,言語,風味の関係を研究するための大規模マルチモーダルワインデータセットである winesensed を提案する。
データセットには、ワインラベルの897k画像と、ヴィヴィノプラットフォームから収集されたワインの824kレビューが含まれている。
年間、地域、格付け、アルコール度数、価格、ブドウの組成でアノテートされた350k以上のユニークなビンテージを持つ。
味覚の類似性に基づいてワインのランク付けを依頼された256人の被験者を対象に, ワイン味覚実験を行い, 5k以上の香味距離が得られた。
人間の経験と自動機械類似性カーネルを組み合わせた低次元概念埋め込みアルゴリズムを提案する。
この共有概念埋め込み空間は,粗いフレーバー分類(アルコールパーセンテージ,国,ブドウ,価格,レーティング)のための別個の埋め込み空間を改良し,複雑なフレーバーの人間知覚に適合することを示す。
関連論文リスト
- Unlocking Comics: The AI4VA Dataset for Visual Understanding [62.345344799258804]
本稿では,1950年代のフレンチ・ベルジアン漫画に,深度推定,セマンティックセグメンテーション,サリエンシ検出,キャラクタ識別などのタスクを注記した新しいデータセットを提案する。
2つの異なる一貫したスタイルで構成され、自然画像から得られたオブジェクトの概念とラベルを取り入れている。
このような多様な情報を含むことで、このデータセットは計算の創造性を約束するだけでなく、アートのデジタル化やストーリーテリングの革新のための道も提供します。
論文 参考訳(メタデータ) (2024-10-27T14:27:05Z) - WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines [74.25764182510295]
視覚言語モデル(VLM)は、特に英語以外の言語において、文化特有の知識に苦しむことが多い。
我々は多言語および多文化の視覚的理解のための大規模ベンチマークであるWorld Cuisinesを紹介した。
このベンチマークには、30の言語と方言にまたがるテキストイメージペアを備えた、視覚的質問応答(VQA)データセットが含まれている。
論文 参考訳(メタデータ) (2024-10-16T16:11:49Z) - DegustaBot: Zero-Shot Visual Preference Estimation for Personalized Multi-Object Rearrangement [53.86523017756224]
本稿では,視覚的嗜好学習のためのアルゴリズムであるDegustaBotを提案する。
我々は、シミュレーション表設定タスクにおいて、自然主義的個人的嗜好の大規模なデータセットを収集する。
私たちのモデルの予測の50%は、少なくとも20%の人々に受け入れられる可能性が高いことが分かりました。
論文 参考訳(メタデータ) (2024-07-11T21:28:02Z) - WineGraph: A Graph Representation For Food-Wine Pairing [0.0]
WineGraphはワインデータをその構造に組み込んだ異種グラフである。
この統合により、味覚とソムリエ定義規則に基づく食品とワインのペアリングが可能になる。
論文 参考訳(メタデータ) (2024-06-27T11:11:19Z) - Classification of grapevine varieties using UAV hyperspectral imaging [0.0]
ブドウ品種の分類は、精密ブドウ栽培において関連する表現型課題である。
無人航空機(UAV)は、ハイパースペクトルデータの収集に対して、より効率的で禁止的でないアプローチを提供する。
本研究では,17種類の赤と白のブドウ品種を分類するために,畳み込みニューラルネットワーク(CNN)を提案する。
論文 参考訳(メタデータ) (2024-01-23T15:35:50Z) - Assorted, Archetypal and Annotated Two Million (3A2M) Cooking Recipes
Dataset based on Active Learning [2.40907745415345]
それぞれのカテゴリにラベル付けされた200万の料理レシピのデータセットを新たに提示する。
データセットを構築するために、レシピをRecipeNLGデータセットから収集する。
私たちのデータセットには200万以上のレシピがあり、それぞれが分類され、信頼性スコアが関連付けられています。
論文 参考訳(メタデータ) (2023-03-27T07:53:18Z) - Seeking Subjectivity in Visual Emotion Distribution Learning [93.96205258496697]
視覚感情分析(VEA)は、人々の感情を異なる視覚刺激に向けて予測することを目的としている。
既存の手法では、集団投票プロセスにおいて固有の主観性を無視して、統合されたネットワークにおける視覚的感情分布を予測することが多い。
視覚的感情分布の主観性を調べるために,新しいテキストサブジェクティビティ評価ネットワーク(SAMNet)を提案する。
論文 参考訳(メタデータ) (2022-07-25T02:20:03Z) - Knowledge Distillation via the Target-aware Transformer [83.03578375615614]
本稿では,新しい一対一空間マッチング知識蒸留手法を提案する。
具体的には,教師の特徴のそれぞれのピクセルを,生徒の特徴の空間的位置すべてに蒸留する。
我々のアプローチは、様々なコンピュータビジョンベンチマークにおいて最先端の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2022-05-22T10:26:54Z) - Classification of Beer Bottles using Object Detection and Transfer
Learning [0.0]
本稿では,ビールボトルの画像を2段階のアプローチで分類する深層学習モデルを提案する。
挑戦が終わった後、100%の正確さを達成できた。
論文 参考訳(メタデータ) (2022-01-11T05:45:07Z) - Bombus Species Image Classification [0.2351364540155133]
昆虫学者や生態学者などは、フィールドワークや研究で遭遇したバンブルミツバチの種を迅速かつ正確に特定することに苦慮している。
本研究では,移動学習から派生した画像分類システムが,この課題に対処できるかどうかを検討した。
Google Inception、Oxford VGG16、VGG19、Microsoft ResNet 50を使いました。
論文 参考訳(メタデータ) (2020-06-09T21:28:32Z) - The EPIC-KITCHENS Dataset: Collection, Challenges and Baselines [88.47608066382267]
この大規模なデータセットが、32人の参加者によって、彼らのネイティブキッチン環境でどのようにキャプチャされたか、詳しく説明します。
録音は10カ国から4カ国で行われた。
私たちのデータセットは、11.5万フレームからなる55時間のビデオで構成されており、合計39.6Kアクションセグメントと454.2Kオブジェクトバウンディングボックスを密にラベル付けしています。
論文 参考訳(メタデータ) (2020-04-29T21:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。