論文の概要: From Technical Excellence to Practical Adoption: Lessons Learned Building an ML-Enhanced Trace Analysis Tool
- arxiv url: http://arxiv.org/abs/2508.01430v1
- Date: Sat, 02 Aug 2025 16:32:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 14:11:10.44907
- Title: From Technical Excellence to Practical Adoption: Lessons Learned Building an ML-Enhanced Trace Analysis Tool
- Title(参考訳): 技術的卓越から実践的採用へ:ML強化トレース分析ツールの構築から学んだ教訓
- Authors: Kaveh Shahedi, Matthew Khouzam, Heng Li, Maxime Lamothe, Foutse Khomh,
- Abstract要約: 産業環境における微量分析導入の障壁について検討した。
専門家が専門家の知識を実践可能な洞察に翻訳するのに苦労していることがわかりました。
TMLLは、インターフェイスに専門家の知識を埋め込んだ採用にフォーカスした設計を通じて、この問題に対処する。
- 参考スコア(独自算出の注目度): 14.908341749591594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: System tracing has become essential for understanding complex software behavior in modern systems, yet sophisticated trace analysis tools face significant adoption gaps in industrial settings. Through a year-long collaboration with Ericsson Montr\'eal, developing TMLL (Trace-Server Machine Learning Library, now in the Eclipse Foundation), we investigated barriers to trace analysis adoption. Contrary to assumptions about complexity or automation needs, practitioners struggled with translating expert knowledge into actionable insights, integrating analysis into their workflows, and trusting automated results they could not validate. We identified what we called the Excellence Paradox: technical excellence can actively impede adoption when conflicting with usability, transparency, and practitioner trust. TMLL addresses this through adoption-focused design that embeds expert knowledge in interfaces, provides transparent explanations, and enables incremental adoption. Validation through Ericsson's experts' feedback, Eclipse Foundation's integration, and a survey of 40 industry and academic professionals revealed consistent patterns: survey results showed that 77.5% prioritize quality and trust in results over technical sophistication, while 67.5% prefer semi-automated analysis with user control, findings supported by qualitative feedback from industrial collaboration and external peer review. Results validate three core principles: cognitive compatibility, embedded expertise, and transparency-based trust. This challenges conventional capability-focused tool development, demonstrating that sustainable adoption requires reorientation toward adoption-focused design with actionable implications for automated software engineering tools.
- Abstract(参考訳): システムトレースは、現代のシステムにおける複雑なソフトウェア動作を理解するために欠かせないものとなっているが、高度なトレース分析ツールは、産業環境において大きな採用ギャップに直面している。
Ericsson Montr\'eal氏との1年間のコラボレーションを通じて、TMLL(Trace-Server Machine Learning Library、現在はEclipse Foundationにある)を開発した。
複雑性や自動化のニーズに関する仮定とは対照的に、実践者は専門家の知識を実行可能な洞察に翻訳し、分析をワークフローに統合し、検証できない自動化結果を信頼することに苦労した。
技術的卓越性は、ユーザビリティ、透明性、実践的信頼と矛盾する場合、積極的に採用を妨げる可能性があります。
TMLLは、専門家の知識をインターフェースに組み込み、透過的な説明を提供し、インクリメンタルな採用を可能にする、採用にフォーカスした設計を通じて、この問題に対処する。
調査の結果、77.5%が技術的洗練よりも品質と信頼性を優先し、67.5%はユーザーコントロールによる半自動分析、産業協力からの質的なフィードバックと外部のピアレビューが支持する結果を好むことが示された。
結果は、認知互換性、組み込みの専門知識、透明性に基づく信頼の3つの基本原則を検証する。
このことは、従来の機能重視のツール開発に挑戦し、持続可能な採用には、自動化されたソフトウェアエンジニアリングツールに実用的な意味を持つ、採用にフォーカスした設計への方向転換が必要であることを証明している。
関連論文リスト
- Software Fairness Testing in Practice [0.21427777919040417]
本研究では、ソフトウェアプロフェッショナルがAIとMLプロジェクトに取り組む22人の実践者とのインタビューを通じて、公正のためにAIを活用したシステムをテストする方法について検討する。
以上の結果から,理論的公正の概念と産業実践との間に大きなギャップがあることが示唆された。
主な課題は、データ品質と多様性、時間制約、効果的なメトリクスの定義、モデルの相互運用性の確保である。
論文 参考訳(メタデータ) (2025-06-20T16:03:02Z) - OpenUnlearning: Accelerating LLM Unlearning via Unified Benchmarking of Methods and Metrics [101.78963920333342]
我々は,大規模言語モデル(LLM)のアンラーニング手法とメトリクスをベンチマークするための標準フレームワークであるOpenUnlearningを紹介する。
OpenUnlearningは、9つのアンラーニングアルゴリズムと16のさまざまな評価を3つの主要なベンチマークで統合する。
また、多様なアンラーニング手法をベンチマークし、広範囲な評価スイートとの比較分析を行う。
論文 参考訳(メタデータ) (2025-06-14T20:16:37Z) - Hybrid Reasoning for Perception, Explanation, and Autonomous Action in Manufacturing [0.0]
CIPHERは、産業制御のための人間のような推論を再現することを目的としたビジョン言語アクション(VLA)モデルフレームワークである。
システム状態の定量的評価を可能にする回帰モデルであるプロセスエキスパートを統合する。
プロセス監視からの視覚的またはテキスト的入力を解釈し、その決定を説明し、正確なマシン命令を自律的に生成する。
論文 参考訳(メタデータ) (2025-06-10T05:37:33Z) - A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文 参考訳(メタデータ) (2025-03-27T17:58:31Z) - AI-Driven Sentiment Analytics: Unlocking Business Value in the E-Commerce Landscape [0.0]
本稿では,eコマースアプリケーションに特化して設計されたAIによる感情分析システムを提案する。
私たちのアプローチは、従来の機械学習技術と現代的なディープラーニングモデルを統合することで、顧客の感情をより微妙な理解を可能にします。
実験結果から,本システムは,多種多様な大規模データセットにおいて89.7%の精度で,標準的な感情分析手法よりも優れていた。
論文 参考訳(メタデータ) (2025-03-20T18:56:22Z) - DeepPerception: Advancing R1-like Cognitive Visual Perception in MLLMs for Knowledge-Intensive Visual Grounding [61.26026947423187]
人間の専門家は、ドメイン知識を活用して知覚的特徴を洗練することによって、きめ細かい視覚的識別に長けている。
現在のMLLM(Multimodal Large Language Models)は、推論を視覚的知覚に統合するのに苦労している。
本稿では,認知的視覚能力を強化したMLLMであるDeepPerceptionを提案する。
論文 参考訳(メタデータ) (2025-03-17T04:06:34Z) - Enhancing LLM Reliability via Explicit Knowledge Boundary Modeling [48.15636223774418]
大規模言語モデル(LLM)は、不一致の自己認識に起因する幻覚の傾向にある。
本稿では,高速かつ低速な推論システムを統合し,信頼性とユーザビリティを調和させる明示的知識境界モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-04T03:16:02Z) - From Critique to Clarity: A Pathway to Faithful and Personalized Code Explanations with Large Language Models [3.5176327869934747]
本稿では、忠実でパーソナライズされたコード説明を生成する革新的なアプローチを提案する。
本手法は,プロンプト強化,自己消費機構,パーソナライズされたコンテンツカスタマイズ,外部ツールとのインタラクションを統合した手法である。
提案手法は,コード説明の質と関連性を大幅に向上させることが示唆された。
論文 参考訳(メタデータ) (2024-12-08T09:02:04Z) - The Role of Accuracy and Validation Effectiveness in Conversational Business Analytics [0.0]
本研究では,AIを利用した対話型ビジネス分析を用いて,エンドユーザが従来のセルフサービス分析を効果的に利用できない技術的能力ギャップに対処する手法について検討する。
自然言語による対話を容易にすることによって、対話型ビジネス分析は、ユーザが独立してデータを検索し、洞察を生成できるようにすることを目的としている。
論文 参考訳(メタデータ) (2024-11-18T23:58:24Z) - Exploring Federated Unlearning: Review, Comparison, and Insights [101.64910079905566]
フェデレーション・アンラーニングは、フェデレーション・システムで訓練されたモデルからデータを選択的に除去することを可能にする。
本稿では,既存のフェデレーション・アンラーニング手法について検討し,アルゴリズムの効率,モデル精度への影響,プライバシ保護の有効性について検討する。
フェデレートされたアンラーニング手法を評価するための統一ベンチマークであるOpenFederatedUnlearningフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-30T01:34:33Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z) - Empowered and Embedded: Ethics and Agile Processes [60.63670249088117]
私たちは倫理的考慮事項を(アジャイル)ソフトウェア開発プロセスに組み込む必要があると論じています。
私たちは、すでに存在しており、確立されたアジャイルソフトウェア開発プロセスで倫理的な議論を実施する可能性を強調しました。
論文 参考訳(メタデータ) (2021-07-15T11:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。