論文の概要: Comparative Analysis of Large Language Models for the Machine-Assisted Resolution of User Intentions
- arxiv url: http://arxiv.org/abs/2510.08576v2
- Date: Tue, 11 Nov 2025 14:36:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.052534
- Title: Comparative Analysis of Large Language Models for the Machine-Assisted Resolution of User Intentions
- Title(参考訳): 機械支援によるユーザ意図の解決のための大規模言語モデルの比較分析
- Authors: Justus Flerlage, Alexander Acker, Odej Kao,
- Abstract要約: 大きな言語モデル(LLM)は、自然言語の理解とユーザ意図の解決のための変換ツールとして登場した。
本研究では,複数のオープンソースおよびオープンアクセスモデルが,マシンアシストによるユーザ意図の解決を容易にする能力について検討する。
- 参考スコア(独自算出の注目度): 43.383726755143044
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have emerged as transformative tools for natural language understanding and user intent resolution, enabling tasks such as translation, summarization, and, increasingly, the orchestration of complex workflows. This development signifies a paradigm shift from conventional, GUI-driven user interfaces toward intuitive, language-first interaction paradigms. Rather than manually navigating applications, users can articulate their objectives in natural language, enabling LLMs to orchestrate actions across multiple applications in a dynamic and contextual manner. However, extant implementations frequently rely on cloud-based proprietary models, which introduce limitations in terms of privacy, autonomy, and scalability. For language-first interaction to become a truly robust and trusted interface paradigm, local deployment is not merely a convenience; it is an imperative. This limitation underscores the importance of evaluating the feasibility of locally deployable, open-source, and open-access LLMs as foundational components for future intent-based operating systems. In this study, we examine the capabilities of several open-source and open-access models in facilitating user intention resolution through machine assistance. A comparative analysis is conducted against OpenAI's proprietary GPT-4-based systems to assess performance in generating workflows for various user intentions. The present study offers empirical insights into the practical viability, performance trade-offs, and potential of open LLMs as autonomous, locally operable components in next-generation operating systems. The results of this study inform the broader discussion on the decentralization and democratization of AI infrastructure and point toward a future where user-device interaction becomes more seamless, adaptive, and privacy-conscious through locally embedded intelligence.
- Abstract(参考訳): 大きな言語モデル(LLM)は、自然言語理解とユーザ意図の解決のための変換ツールとして登場し、翻訳、要約、そしてますます複雑なワークフローのオーケストレーションといったタスクを可能にしている。
この開発は、GUI駆動のユーザインタフェースから直感的で言語優先の対話パラダイムへのパラダイムシフトを表している。
ユーザは手動でアプリケーションをナビゲートするのではなく、自然言語で目的を表現でき、複数のアプリケーション間で動的かつコンテキスト的にアクションをオーケストレーションできる。
しかし、既存の実装はしばしばクラウドベースのプロプライエタリモデルに依存しており、プライバシ、自律性、スケーラビリティの制限が導入されている。
言語ファーストのインタラクションが真に堅牢で信頼性の高いインターフェースパラダイムになるためには、ローカルデプロイメントは単なる便利さではない。
この制限は、将来のインテントベースのオペレーティングシステムの基本コンポーネントとして、ローカルにデプロイ可能、オープンソース、そしてオープンアクセス可能なLCMの実現可能性を評価することの重要性を強調している。
本研究では,複数のオープンソースおよびオープンアクセスモデルが,マシンアシストによるユーザ意図の解決を容易にする能力について検討する。
OpenAIのプロプライエタリなGPT-4ベースのシステムと比較分析を行い、さまざまなユーザ意図のワークフローを生成する際のパフォーマンスを評価する。
本研究は,次世代オペレーティングシステムにおいて,オープンLCMを自律的かつ局所的に動作可能なコンポーネントとして,実用可能性,性能トレードオフ,および可能性に関する実証的な知見を提供する。
この研究の結果は、AIインフラストラクチャの分散化と民主化に関する広範な議論と、ユーザとデバイス間のインタラクションが、ローカルな組み込みインテリジェンスを通じて、よりシームレスで適応的、プライバシを重視したものになる未来への視点を示唆している。
関連論文リスト
- API Agents vs. GUI Agents: Divergence and Convergence [37.13923771130588]
APIとGUIベースの大規模言語モデル(LLM)は、グラフィカルなユーザインターフェースを人間的な方法で操作する。
本稿では,それらの分散と潜在的収束を系統的に解析する。
LLMベースの自動化における継続的なイノベーションは、APIとGUI駆動エージェントの境界線を曖昧にする可能性があることを示唆している。
論文 参考訳(メタデータ) (2025-03-14T04:26:21Z) - Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。
未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。
まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。
インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文 参考訳(メタデータ) (2024-12-02T08:16:38Z) - Adaptive Self-Supervised Learning Strategies for Dynamic On-Device LLM Personalization [3.1944843830667766]
大規模言語モデル(LLM)は私たちがテクノロジと対話する方法に革命をもたらしたが、個々のユーザの好みに対するパーソナライズは依然として大きな課題である。
本稿では,LSMを動的にパーソナライズするために自己指導型学習技術を利用する適応型自己監督学習戦略(ASLS)を提案する。
論文 参考訳(メタデータ) (2024-09-25T14:35:06Z) - Large Language Model as a Catalyst: A Paradigm Shift in Base Station Siting Optimization [62.16747639440893]
大規模言語モデル(LLM)とその関連技術は、特に迅速な工学とエージェント工学の領域において進歩している。
提案するフレームワークは、検索拡張生成(RAG)を組み込んで、ドメイン固有の知識を取得してソリューションを生成するシステムの能力を高める。
論文 参考訳(メタデータ) (2024-08-07T08:43:32Z) - LVLM-Interpret: An Interpretability Tool for Large Vision-Language Models [50.259006481656094]
本稿では,大規模視覚言語モデルの内部メカニズムの理解を目的とした対話型アプリケーションを提案する。
このインタフェースは, 画像パッチの解釈可能性を高めるために設計されており, 応答の生成に有効である。
本稿では,一般的な大規模マルチモーダルモデルであるLLaVAにおける障害機構の理解に,アプリケーションがどのように役立つかのケーススタディを示す。
論文 参考訳(メタデータ) (2024-04-03T23:57:34Z) - Large Language User Interfaces: Voice Interactive User Interfaces powered by LLMs [5.06113628525842]
ユーザとユーザインターフェース(UI)の仲介として機能するフレームワークを提案する。
アノテーションの形でUIコンポーネントのテキストセマンティックマッピングに立つシステムを採用している。
我々のエンジンは、最も適切なアプリケーションを分類し、関連するパラメータを抽出し、その後、ユーザの期待するアクションの正確な予測を実行することができる。
論文 参考訳(メタデータ) (2024-02-07T21:08:49Z) - Modular approach to data preprocessing in ALOHA and application to a
smart industry use case [0.0]
データ前処理と変換パイプラインをサポートするために、ALOHAツールフローに統合されたモジュラーアプローチに対処する。
提案手法の有効性を示すために,キーワードスポッティングのユースケースに関する実験結果を示す。
論文 参考訳(メタデータ) (2021-02-02T06:48:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。