論文の概要: AromaGen: Interactive Generation of Rich Olfactory Experiences with Multimodal Language Models
- arxiv url: http://arxiv.org/abs/2604.01650v1
- Date: Thu, 02 Apr 2026 05:47:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.461128
- Title: AromaGen: Interactive Generation of Rich Olfactory Experiences with Multimodal Language Models
- Title(参考訳): AromaGen:マルチモーダル言語モデルを用いたリッチな嗅覚体験のインタラクティブ生成
- Authors: Yunge Wen, Awu Chen, Jianing Yu, Jas Brooks, Hiroshi Ishii, Paul Pu Liang,
- Abstract要約: AromaGenはAIを利用したウェアラブルインタフェースで、自由形式のテキストや視覚的な入力からリアルタイムに汎用のアロマを生成することができる。
AromaGenは、ゼロショット生成において人間と合成された混合物と一致し、反復精製後にそれらを著しく上回っている。
- 参考スコア(独自算出の注目度): 29.111586871914167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Smell's deep connection with food, memory, and social experience has long motivated researchers to bring olfaction into interactive systems. Yet most olfactory interfaces remain limited to fixed scent cartridges and pre-defined generation patterns, and the scarcity of large-scale olfactory datasets has further constrained AI-based approaches. We present AromaGen, an AI-powered wearable interface capable of real-time, general-purpose aroma generation from free-form text or visual inputs. AromaGen is powered by a multimodal LLM that leverages latent olfactory knowledge to map semantic inputs to structured mixtures of 12 carefully selected base odorants, released through a neck-worn dispenser. Users can iteratively refine generated aromas through natural language feedback via in-context learning. Through a controlled user study ($N = 26$), AromaGen matches human-composed mixtures in zero-shot generation and significantly surpasses them after iterative refinement, achieving a median similarity of 8/10 to real food aromas and reducing perceived artificiality to levels comparable to real food. AromaGen is a step towards real-world interactive aroma generation, opening new possibilities for communication, wellbeing, and immersive technologies.
- Abstract(参考訳): スメルの食品、記憶、社会体験との深いつながりは、研究者が対話的なシステムに嗅覚を組み込む動機づけてきた。
しかし、ほとんどの嗅覚インターフェイスは、固定された嗅覚カートリッジと事前定義された生成パターンに限られており、大規模な嗅覚データセットの不足により、AIベースのアプローチはさらに制限されている。
本稿では,AIを利用したウェアラブルインタフェースであるAromaGenについて紹介する。
AromaGenは、潜在嗅覚知識を活用して、ネックウーンのディスペンサから放出される12個の慎重に選択された塩基性臭気の混合物にセマンティックインプットをマッピングするマルチモーダルLLMを動力としている。
ユーザは、コンテキスト内学習を通じて、自然言語フィードバックを通じて生成されたアロマを反復的に洗練することができる。
コントロールされたユーザスタディ($N = 26$)を通じて、AromaGenは、ゼロショット生成において人間の合成混合物と一致し、反復精製後にそれらを著しく上回り、実際の食品の香りに対して8/10の中央値の類似性を達成し、認識された人工性を実際の食品に匹敵するレベルまで減少させる。
AromaGenは、現実世界のインタラクティブなアロマ生成へのステップであり、コミュニケーション、幸福、没入型テクノロジーの新たな可能性を開く。
関連論文リスト
- New York Smells: A Large Multimodal Dataset for Olfaction [93.162210916881]
ニューヨーク・スメルズ(New York Smells)は、野生で撮影された画像と嗅覚信号の大規模なデータセットである。
我々のデータセットには、屋内と屋外の環境にまたがる3,500個の異なる物体から7000個の匂いとイメージのペアが含まれています。
我々のベンチマークには3つのタスクがある: クロスモーダルな匂いとイメージの検索、シーン、物体、物質を嗅覚だけで認識すること、草種間のきめ細かい識別。
論文 参考訳(メタデータ) (2025-11-25T17:44:50Z) - Diffusion Graph Neural Networks and Dataset for Robust Olfactory Navigation in Hazard Robotics [0.0]
香りによるナビゲーションは、ロボットシステムにおいて需要が高まっている能力である。
現在の方法はしばしば曖昧さに悩まされ、特にロボットが不正な物体に臭気をあてはめる場合である。
本稿では,新しい機械学習手法とともに,マルチモーダル・ウルフアクション・データセットを提案する。
論文 参考訳(メタデータ) (2025-05-31T08:22:09Z) - WeGen: A Unified Model for Interactive Multimodal Generation as We Chat [51.78489661490396]
マルチモーダル生成と理解を統合するモデルWeGenを紹介する。
より詳細な指示を省くために、創造性の高い多様な結果を生成することができる。
様々なビジュアル生成ベンチマークにおいて,最先端性能が達成されていることを示す。
論文 参考訳(メタデータ) (2025-03-03T02:50:07Z) - Molecule Generation and Optimization for Efficient Fragrance Creation [0.0]
この研究は、嗅覚体験を再現する機械学習中心のアプローチを導入する。
主な貢献は、香水分子構造と人間の嗅覚を結合するハイブリッドモデルである。
この方法論は、利用可能な実験データを用いて、2つの異なる嗅覚経験を再現することによって検証される。
論文 参考訳(メタデータ) (2024-02-19T13:32:30Z) - Diffusion Recommender Model [85.9640416600725]
そこで我々は,DiffRecと呼ばれる新しい拡散レコメンダモデルを提案し,その生成過程を認知的に学習する。
ユーザインタラクションにおけるパーソナライズされた情報を維持するため、DiffRecは追加のノイズを低減し、画像合成のような純粋なノイズに対するユーザのインタラクションを損なうことを避ける。
論文 参考訳(メタデータ) (2023-04-11T04:31:00Z) - Multilinear Latent Conditioning for Generating Unseen Attribute
Combinations [61.686839319971334]
本研究では, 変異自己エンコーダ(VAE)とGAN(Generative Adversarial Network)が, 人間の知覚において自然に発生する一般化能力を欠いていることを示す。
本稿では,属性間の乗法的相互作用をキャプチャする多線形潜在条件付けフレームワークを提案する。
また,どのアーキテクチャでも使用可能な新しい条件付けフレームワークを設計し,未知の属性の組み合わせを合成する。
論文 参考訳(メタデータ) (2020-09-09T02:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。