Fugu-MT 論文翻訳(概要): Learning to Taste: A Multimodal Wine Dataset

論文の概要: Learning to Taste: A Multimodal Wine Dataset

arxiv url: http://arxiv.org/abs/2308.16900v4
Date: Mon, 15 Jan 2024 14:07:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-18 01:46:23.075870
Title: Learning to Taste: A Multimodal Wine Dataset
Title（参考訳）: 味を学習する:マルチモーダルワインデータセット
Authors: Thoranna Bender, Simon Moe S{\o}rensen, Alireza Kashani, K. Eldjarn Hjorleifsson, Grethe Hyldig, S{\o}ren Hauberg, Serge Belongie and Frederik Warburg
Abstract要約: We present WineSensed, a large multimodal wine data for study the relationship between visual perception, language, and flavor。データセットには、ワインラベルの897kの画像と、ヴィヴィノ・プラットフォームからキュレートされたワインの824kのレビューが含まれている。人間の経験と自動機械類似性カーネルを組み合わせた低次元概念埋め込みアルゴリズムを提案する。
参考スコア（独自算出の注目度）: 5.119970053489524
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We present WineSensed, a large multimodal wine dataset for studying the relations between visual perception, language, and flavor. The dataset encompasses 897k images of wine labels and 824k reviews of wines curated from the Vivino platform. It has over 350k unique bottlings, annotated with year, region, rating, alcohol percentage, price, and grape composition. We obtained fine-grained flavor annotations on a subset by conducting a wine-tasting experiment with 256 participants who were asked to rank wines based on their similarity in flavor, resulting in more than 5k pairwise flavor distances. We propose a low-dimensional concept embedding algorithm that combines human experience with automatic machine similarity kernels. We demonstrate that this shared concept embedding space improves upon separate embedding spaces for coarse flavor classification (alcohol percentage, country, grape, price, rating) and aligns with the intricate human perception of flavor.
Abstract（参考訳）: 我々は,視覚知覚,言語,風味の関係を研究するための大規模マルチモーダルワインデータセットである winesensed を提案する。データセットには、ワインラベルの897k画像と、ヴィヴィノプラットフォームから収集されたワインの824kレビューが含まれている。年間、地域、格付け、アルコール度数、価格、ブドウの組成でアノテートされた350k以上のユニークなボツリングがある。味覚の類似性に基づいてワインのランク付けを依頼された256人の被験者を対象に, ワイン味覚実験を行い, 5k以上の香味距離が得られた。人間の経験と自動機械類似性カーネルを組み合わせた低次元概念埋め込みアルゴリズムを提案する。この共有概念埋め込み空間は,粗いフレーバー分類(アルコールパーセンテージ,国,ブドウ,価格,レーティング)のための別個の埋め込み空間を改良し,複雑なフレーバーの人間知覚に適合することを示す。

関連論文リスト

Wine Characterisation with Spectral Information and Predictive Artificial Intelligence [10.661523361368962]
本稿では,2段階のワイン製造において,機械学習(ML)技術と分光法を組み合わせることで,比較的簡単な手法を提案する。 Support Vector Machine (SVM) は属性および起点予測タスクにおいて最も効率的で堅牢である。
論文参考訳（メタデータ） (2025-07-27T03:33:33Z)
A new classification system of beer categories and styles based on large-scale data mining and self-organizing maps of beer recipes [0.0]
6万2100個のビールレシピを分析した。 4つの主要なスーパークラスターは、独特のモルトとホップの使用パターン、スタイルの特徴、歴史的醸造の伝統を示した。
論文参考訳（メタデータ） (2025-05-13T00:05:23Z)
Video Individual Counting for Moving Drones [51.429771128144964]
ビデオ個別カウント(VIC)は、インテリジェントなビデオ監視の重要性から、近年注目を集めている。以前の群衆カウントデータセットは、比較的まばらな個人で固定された、または稀に動くカメラでキャプチャされる。本研究では,移動DroneCrowdデータセットに基づく密度マップに基づくVIC手法を提案する。
論文参考訳（メタデータ） (2025-03-12T07:09:33Z)
Unlocking Comics: The AI4VA Dataset for Visual Understanding [62.345344799258804]
本稿では,1950年代のフレンチ・ベルジアン漫画に,深度推定,セマンティックセグメンテーション,サリエンシ検出,キャラクタ識別などのタスクを注記した新しいデータセットを提案する。 2つの異なる一貫したスタイルで構成され、自然画像から得られたオブジェクトの概念とラベルを取り入れている。このような多様な情報を含むことで、このデータセットは計算の創造性を約束するだけでなく、アートのデジタル化やストーリーテリングの革新のための道も提供します。
論文参考訳（メタデータ） (2024-10-27T14:27:05Z)
WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines [74.25764182510295]
視覚言語モデル(VLM)は、特に英語以外の言語において、文化特有の知識に苦しむことが多い。我々は多言語および多文化の視覚的理解のための大規模ベンチマークであるWorld Cuisinesを紹介した。このベンチマークには、30の言語と方言にまたがるテキストイメージペアを備えた、視覚的質問応答(VQA)データセットが含まれている。
論文参考訳（メタデータ） (2024-10-16T16:11:49Z)
DegustaBot: Zero-Shot Visual Preference Estimation for Personalized Multi-Object Rearrangement [53.86523017756224]
本稿では,視覚的嗜好学習のためのアルゴリズムであるDegustaBotを提案する。我々は、シミュレーション表設定タスクにおいて、自然主義的個人的嗜好の大規模なデータセットを収集する。私たちのモデルの予測の50%は、少なくとも20%の人々に受け入れられる可能性が高いことが分かりました。
論文参考訳（メタデータ） (2024-07-11T21:28:02Z)
WineGraph: A Graph Representation For Food-Wine Pairing [0.0]
WineGraphはワインデータをその構造に組み込んだ異種グラフである。この統合により、味覚とソムリエ定義規則に基づく食品とワインのペアリングが可能になる。
論文参考訳（メタデータ） (2024-06-27T11:11:19Z)
Classification of grapevine varieties using UAV hyperspectral imaging [0.0]
ブドウ品種の分類は、精密ブドウ栽培において関連する表現型課題である。無人航空機(UAV)は、ハイパースペクトルデータの収集に対して、より効率的で禁止的でないアプローチを提供する。本研究では,17種類の赤と白のブドウ品種を分類するために,畳み込みニューラルネットワーク(CNN)を提案する。
論文参考訳（メタデータ） (2024-01-23T15:35:50Z)
Assorted, Archetypal and Annotated Two Million (3A2M) Cooking Recipes Dataset based on Active Learning [2.40907745415345]
それぞれのカテゴリにラベル付けされた200万の料理レシピのデータセットを新たに提示する。データセットを構築するために、レシピをRecipeNLGデータセットから収集する。私たちのデータセットには200万以上のレシピがあり、それぞれが分類され、信頼性スコアが関連付けられています。
論文参考訳（メタデータ） (2023-03-27T07:53:18Z)
Seeking Subjectivity in Visual Emotion Distribution Learning [93.96205258496697]
視覚感情分析(VEA)は、人々の感情を異なる視覚刺激に向けて予測することを目的としている。既存の手法では、集団投票プロセスにおいて固有の主観性を無視して、統合されたネットワークにおける視覚的感情分布を予測することが多い。視覚的感情分布の主観性を調べるために,新しいテキストサブジェクティビティ評価ネットワーク(SAMNet)を提案する。
論文参考訳（メタデータ） (2022-07-25T02:20:03Z)
Knowledge Distillation via the Target-aware Transformer [83.03578375615614]
本稿では,新しい一対一空間マッチング知識蒸留手法を提案する。具体的には,教師の特徴のそれぞれのピクセルを,生徒の特徴の空間的位置すべてに蒸留する。我々のアプローチは、様々なコンピュータビジョンベンチマークにおいて最先端の手法をはるかに上回っている。
論文参考訳（メタデータ） (2022-05-22T10:26:54Z)
Classification of Beer Bottles using Object Detection and Transfer Learning [0.0]
本稿では,ビールボトルの画像を2段階のアプローチで分類する深層学習モデルを提案する。挑戦が終わった後、100%の正確さを達成できた。
論文参考訳（メタデータ） (2022-01-11T05:45:07Z)
Bombus Species Image Classification [0.2351364540155133]
昆虫学者や生態学者などは、フィールドワークや研究で遭遇したバンブルミツバチの種を迅速かつ正確に特定することに苦慮している。本研究では,移動学習から派生した画像分類システムが,この課題に対処できるかどうかを検討した。 Google Inception、Oxford VGG16、VGG19、Microsoft ResNet 50を使いました。
論文参考訳（メタデータ） (2020-06-09T21:28:32Z)
The EPIC-KITCHENS Dataset: Collection, Challenges and Baselines [88.47608066382267]
この大規模なデータセットが、32人の参加者によって、彼らのネイティブキッチン環境でどのようにキャプチャされたか、詳しく説明します。録音は10カ国から4カ国で行われた。私たちのデータセットは、11.5万フレームからなる55時間のビデオで構成されており、合計39.6Kアクションセグメントと454.2Kオブジェクトバウンディングボックスを密にラベル付けしています。
論文参考訳（メタデータ） (2020-04-29T21:57:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。