論文の概要: NOEM$^{3}$A: A Neuro-Symbolic Ontology-Enhanced Method for Multi-Intent Understanding in Mobile Agents
- arxiv url: http://arxiv.org/abs/2511.19780v1
- Date: Mon, 24 Nov 2025 23:14:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.203766
- Title: NOEM$^{3}$A: A Neuro-Symbolic Ontology-Enhanced Method for Multi-Intent Understanding in Mobile Agents
- Title(参考訳): NOEM$^{3}$A: 移動体エージェントにおけるマルチインテント理解のためのニューロシンボリックオントロジー強化手法
- Authors: Ioannis Tzachristas, Aifen Sui,
- Abstract要約: 我々は、構造化意図オントロジーとコンパクト言語モデルを統合することにより、移動型AIエージェントにおける多言語理解のためのニューロシンボリックフレームワークを導入する。
我々は,階層的オントロジーの深さに基づいて,予測意図が語彙的に異なる場合でも意味的近接を捉える,新しい評価指標-意味的固有類似性(SIS)を定式化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a neuro-symbolic framework for multi-intent understanding in mobile AI agents by integrating a structured intent ontology with compact language models. Our method leverages retrieval-augmented prompting, logit biasing and optional classification heads to inject symbolic intent structure into both input and output representations. We formalize a new evaluation metric-Semantic Intent Similarity (SIS)-based on hierarchical ontology depth, capturing semantic proximity even when predicted intents differ lexically. Experiments on a subset of ambiguous/demanding dialogues of MultiWOZ 2.3 (with oracle labels from GPT-o3) demonstrate that a 3B Llama model with ontology augmentation approaches GPT-4 accuracy (85% vs 90%) at a tiny fraction of the energy and memory footprint. Qualitative comparisons show that ontology-augmented models produce more grounded, disambiguated multi-intent interpretations. Our results validate symbolic alignment as an effective strategy for enabling accurate and efficient on-device NLU.
- Abstract(参考訳): 我々は、構造化意図オントロジーとコンパクト言語モデルを統合することにより、移動型AIエージェントにおける多言語理解のためのニューロシンボリックフレームワークを導入する。
提案手法は,検索強化プロンプト,ロジットバイアス,任意の分類ヘッドを利用して,入力と出力の両方の表現に記号的意図構造を注入する。
我々は,階層的オントロジーの深さに基づいて,予測意図が語彙的に異なる場合でも意味的近接を捉える,新しい評価指標-意味的固有類似性(SIS)を定式化する。
MultiWOZ 2.3(GPT-o3)の曖昧/オンデマンド対話のサブセットの実験では、オントロジーを増強した3B LlamaモデルがGPT-4の精度(85%対90%)に、エネルギーとメモリフットプリントのごく一部でアプローチしていることが示されている。
質的な比較は、オントロジーを拡張したモデルがより基礎的で曖昧な多眼的解釈を生み出すことを示している。
本研究は, デバイス上での高精度なNLUを実現するための効果的な戦略として, シンボリックアライメントの有効性を検証した。
関連論文リスト
- Semantic Visual Anomaly Detection and Reasoning in AI-Generated Images [96.43608872116347]
AnomReasonは4倍のtextbfAnomAgentのような構造化アノテーションを備えた大規模ベンチマーク
AnomReasonとAnomAgentは、AI生成画像の意味的妥当性の測定と改善の基盤となっている。
論文 参考訳(メタデータ) (2025-10-11T14:09:24Z) - Capsule Network-Based Semantic Intent Modeling for Human-Computer Interaction [2.3784833490134867]
本稿では,Capsule Networksに基づくユーザ意味意図モデリングアルゴリズムを提案する。
これは、ベクトル化されたカプセル構造を通して入力テキストのセマンティックな特徴を表す。
動的ルーティング機構を使用して、複数のカプセル層に情報を転送する。
論文 参考訳(メタデータ) (2025-07-01T08:00:12Z) - Mechanistic understanding and validation of large AI models with SemanticLens [13.712668314238082]
航空機のような人間工学的なシステムとは異なり、AIモデルの内部動作はほとんど不透明である。
本稿では、コンポーネントによって符号化された隠れた知識をマッピングするニューラルネットワークの普遍的説明法であるSemanticLensを紹介する。
論文 参考訳(メタデータ) (2025-01-09T17:47:34Z) - Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - Explaining Text Similarity in Transformer Models [52.571158418102584]
説明可能なAIの最近の進歩により、トランスフォーマーの説明の改善を活用することで、制限を緩和できるようになった。
両線形類似性モデルにおける2次説明の計算のために開発された拡張であるBiLRPを用いて、NLPモデルにおいてどの特徴相互作用が類似性を促進するかを調べる。
我々の発見は、異なる意味的類似性タスクやモデルに対するより深い理解に寄与し、新しい説明可能なAIメソッドが、どのようにして深い分析とコーパスレベルの洞察を可能にするかを強調した。
論文 参考訳(メタデータ) (2024-05-10T17:11:31Z) - A BiRGAT Model for Multi-intent Spoken Language Understanding with
Hierarchical Semantic Frames [30.200413352223347]
まず、MIVSと呼ばれる現実的な車載対話システムから収集されるマルチインテントデータセットを提案する。
対象のセマンティックフレームは、3層階層構造で構成され、多目的ケースにおけるアライメントとアライメントの問題に対処する。
我々は,2つの関係グラフアテンションネットワークであるアイテムの階層構造を符号化するBiRGATモデルを考案した。
論文 参考訳(メタデータ) (2024-02-28T11:39:26Z) - Co-guiding for Multi-intent Spoken Language Understanding [53.30511968323911]
本稿では,2つのタスク間の相互指導を実現するための2段階のフレームワークを実装した,コガイドネットと呼ばれる新しいモデルを提案する。
第1段階では,単一タスクによる教師付きコントラスト学習を提案し,第2段階ではコガイドによる教師付きコントラスト学習を提案する。
マルチインテリジェントSLU実験の結果,我々のモデルは既存のモデルよりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-22T08:06:22Z) - New Intent Discovery with Pre-training and Contrastive Learning [20.636192945382145]
新しい意図発見は、ユーザ発話から新しい意図カテゴリーを明らかにして、サポート対象クラスのセットを拡張することを目的としている。
既存のアプローチは通常、大量のラベル付き発話に依存する。
新たな意図発見のための2つの重要な研究課題に対する新しい解決策を提供する。
論文 参考訳(メタデータ) (2022-05-25T17:07:25Z) - AGIF: An Adaptive Graph-Interactive Framework for Joint Multiple Intent
Detection and Slot Filling [69.59096090788125]
本稿では,多目的検出とスロットフィリングを併用する適応グラフ対話フレームワーク(AGIF)を提案する。
スロットとインテントの強い相関関係をモデル化するために,インテント-スロットグラフ相互作用層を導入する。
このような相互作用層が各トークンに適応的に適用され、関連する意図情報を自動抽出する利点がある。
論文 参考訳(メタデータ) (2020-04-21T15:07:34Z) - Efficient Intent Detection with Dual Sentence Encoders [53.16532285820849]
本稿では,USE や ConveRT などの事前訓練された二重文エンコーダによるインテント検出手法を提案する。
提案するインテント検出器の有用性と適用性を示し,完全なBERT-Largeモデルに基づくインテント検出器よりも優れた性能を示す。
コードだけでなく、新しい挑戦的な単一ドメイン意図検出データセットもリリースしています。
論文 参考訳(メタデータ) (2020-03-10T15:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。