論文の概要: NOSE: Neural Olfactory-Semantic Embedding with Tri-Modal Orthogonal Contrastive Learning
- arxiv url: http://arxiv.org/abs/2604.10452v1
- Date: Sun, 12 Apr 2026 04:31:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.024622
- Title: NOSE: Neural Olfactory-Semantic Embedding with Tri-Modal Orthogonal Contrastive Learning
- Title(参考訳): NOSE:三次元直交コントラスト学習を用いた神経嗅覚・意味埋め込み
- Authors: Yanyi Su, Hongshuai Wang, Zhifeng Gao, Jun Cheng,
- Abstract要約: オルフアクションは化学構造、ニューラルエンコーディング、言語知覚の交差点に位置する。
嗅覚経路に沿って3つのモーダルを整列させる表現学習フレームワークであるNOSE(Neural Olfactory-Semantic Embedding)を提案する。
- 参考スコア(独自算出の注目度): 10.537140540596491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Olfaction lies at the intersection of chemical structure, neural encoding, and linguistic perception, yet existing representation methods fail to fully capture this pathway. Current approaches typically model only isolated segments of the olfactory pathway, overlooking the complete chain from molecule to receptors to linguistic descriptions. Such fragmentation yields learned embeddings that lack both biological grounding and semantic interpretability. We propose NOSE (Neural Olfactory-Semantic Embedding), a representation learning framework that aligns three modalities along the olfactory pathway: molecular structure, receptor sequence, and natural language description. Rather than simply fusing these signals, we decouple their contributions via orthogonal constraints, preserving the unique encoded information of each modality. To address the sparsity of olfactory language, we introduce a weak positive sample strategy to calibrate semantic similarity, preventing erroneous repulsion of similar odors in the feature space. Extensive experiments demonstrate that NOSE achieves state-of-the-art (SOTA) performance and excellent zero-shot generalization, confirming the strong alignment between its representation space and human olfactory intuition.
- Abstract(参考訳): オルフアクションは化学構造、ニューラルエンコーディング、言語知覚の交差点にあるが、既存の表現法はこの経路を完全に捉えることができない。
現在のアプローチは典型的には嗅経路の孤立した部分のみをモデル化し、分子から受容体、言語記述までの全鎖を見渡す。
このような断片化は、生物学的基盤と意味論的解釈性の両方を欠いた埋め込みを学習する。
NOSE(Neural Olfactory-Semantic Embedding)は、分子構造、受容体配列、自然言語記述という嗅覚経路に沿った3つのモードを整列する表現学習フレームワークである。
これらの信号を単純に融合させるのではなく、直交的な制約によってそれらの寄与を分離し、各モダリティのユニークな符号化情報を保存する。
嗅覚言語の空間性に対処するため, 意味的類似性を校正する弱い正のサンプル戦略を導入し, 特徴空間における類似臭の誤検出を防止する。
広汎な実験によりNOSEは最先端(SOTA)性能と優れたゼロショット一般化を実現し、その表現空間と人間の嗅覚的直感との強い整合性を確認した。
関連論文リスト
- Far from the Shallow: Brain-Predictive Reasoning Embedding through Residual Disentanglement [43.96899536703126]
現代の大規模言語モデル(LLM)は、言語に対する神経反応をモデル化するためにますます使われている。
彼らの内部表現は極めて「絡み合っている」ものであり、語彙、構文、意味、推論に関する情報を混ぜている。
この絡み合いは、言語学的に浅い特徴に対する従来の脳のコード解析に偏っている。
論文 参考訳(メタデータ) (2025-10-26T22:46:26Z) - Concept-Guided Interpretability via Neural Chunking [64.6429903327095]
ニューラルネットワークは、トレーニングデータの規則性を反映した生の集団活動のパターンを示す。
神経集団レベルで繰り返しチャンクを抽出する3つの方法を提案する。
私たちの研究は、認知原則と自然主義的データの構造の両方を活用する、解釈可能性の新しい方向性を指し示しています。
論文 参考訳(メタデータ) (2025-05-16T13:49:43Z) - Discovering Chunks in Neural Embeddings for Interpretability [53.80157905839065]
本稿では, チャンキングの原理を応用して, 人工神経集団活動の解釈を提案する。
まず、この概念を正則性を持つ人工シーケンスを訓練したリカレントニューラルネットワーク(RNN)で実証する。
我々は、これらの状態に対する摂動が関連する概念を活性化または阻害すると共に、入力における概念に対応する同様の繰り返し埋め込み状態を特定する。
論文 参考訳(メタデータ) (2025-02-03T20:30:46Z) - Faithful and Plausible Natural Language Explanations for Image Classification: A Pipeline Approach [10.54430941755474]
本稿では,CNNに基づく分類システムに適用可能な,ポストホックな自然言語説明法を提案する。
影響力のあるニューロンと対応する活性化マップを分析して、分類器の決定過程の忠実な記述を生成する。
実験の結果,提案手法により構築されたNLEは,より信頼性が高く,忠実であることがわかった。
論文 参考訳(メタデータ) (2024-07-30T15:17:15Z) - BEST: BERT Pre-Training for Sign Language Recognition with Coupling
Tokenization [135.73436686653315]
我々は、BERTの事前学習の成功を活用し、手話認識(SLR)モデルを肥大化させるために、ドメイン固有の統計モデルを構築している。
手と体が手話表現の優位性を考えると、それらを三重奏単位として整理し、トランスフォーマーのバックボーンに供給する。
劣化した入力シーケンスからマスク三重項ユニットを再構成して事前学習を行う。
意味的ジェスチャー/身体状態を表すポーズ三重奏ユニットから離散擬似ラベルを適応的に抽出する。
論文 参考訳(メタデータ) (2023-02-10T06:23:44Z) - Probing for Constituency Structure in Neural Language Models [11.359403179089817]
我々は、Penn Treebank (PTB)で表される構成構造に焦点をあてる。
4つの事前訓練されたトランスフォーマーLMが,我々の探索作業において高い性能を得ることがわかった。
完全な選挙区木をLM表現から線形に分離できることを示す。
論文 参考訳(メタデータ) (2022-04-13T07:07:37Z) - Toward a Visual Concept Vocabulary for GAN Latent Space [74.12447538049537]
本稿では,GANの潜在空間で表現される原始視覚概念のオープンエンド語彙を構築するための新しい手法を提案する。
提案手法は, 層選択性に基づく知覚的正当方向の自動識別, 自由形, 構成的自然言語記述による人為的アノテーションの3つの要素から構成される。
実験により、我々のアプローチで学んだ概念は信頼性があり、構成可能であることが示され、クラス、コンテキスト、オブザーバをまたいで一般化される。
論文 参考訳(メタデータ) (2021-10-08T17:58:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。