論文の概要: Threshy: Supporting Safe Usage of Intelligent Web Services
- arxiv url: http://arxiv.org/abs/2008.08252v1
- Date: Wed, 19 Aug 2020 04:02:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 20:44:21.853109
- Title: Threshy: Supporting Safe Usage of Intelligent Web Services
- Title(参考訳): Threshy: インテリジェントWebサービスの安全な利用を支援する
- Authors: Alex Cummaudo, Scott Barnett, Rajesh Vasa and John Grundy
- Abstract要約: Threshyは開発者が問題領域に適した決定しきい値を選択するのを助けるツールである。
既存のツールとは異なり、Threshyは開発前、リリース前、サポートのために設計されている。
- 参考スコア(独自算出の注目度): 4.346610687701405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Increased popularity of `intelligent' web services provides end-users with
machine-learnt functionality at little effort to developers. However, these
services require a decision threshold to be set which is dependent on
problem-specific data. Developers lack a systematic approach for evaluating
intelligent services and existing evaluation tools are predominantly targeted
at data scientists for pre-development evaluation. This paper presents a
workflow and supporting tool, Threshy, to help software developers select a
decision threshold suited to their problem domain. Unlike existing tools,
Threshy is designed to operate in multiple workflows including pre-development,
pre-release, and support. Threshy is designed for tuning the confidence scores
returned by intelligent web services and does not deal with hyper-parameter
optimisation used in ML models. Additionally, it considers the financial
impacts of false positives. Threshold configuration files exported by Threshy
can be integrated into client applications and monitoring infrastructure. Demo:
https://bit.ly/2YKeYhE.
- Abstract(参考訳): intelligent' の web サービスの人気が高まり、エンドユーザは少ない労力でマシン主導の機能を提供するようになった。
しかし、これらのサービスは、問題固有のデータに依存する決定しきい値を設定する必要がある。
開発者はインテリジェントなサービスを評価するための体系的なアプローチを欠いている。
本稿では,ソフトウェア開発者が問題領域に適した決定しきい値を選択するためのワークフローおよびサポートツールであるthreshyを提案する。
既存のツールとは異なり、threshyは開発前、リリース前、サポートを含む複数のワークフローで動作するように設計されている。
ThreshyはインテリジェントなWebサービスによって返される信頼性スコアを調整するために設計されており、MLモデルで使用されるハイパーパラメータ最適化には対応しない。
さらに、偽陽性の経済的影響も考慮している。
ThreshyがエクスポートしたThreshold構成ファイルは、クライアントアプリケーションや監視インフラストラクチャに統合できる。
デモ: https://bit.ly/2ykeyhe。
関連論文リスト
- WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks? [83.19032025950986]
本稿では,Webブラウザを介してソフトウェアと対話する大規模言語モデルベースエージェントについて検討する。
WorkArenaは、広く使用されているServiceNowプラットフォームに基づく33のタスクのベンチマークである。
BrowserGymは、そのようなエージェントの設計と評価のための環境である。
論文 参考訳(メタデータ) (2024-03-12T14:58:45Z) - Interpretable Self-Aware Neural Networks for Robust Trajectory
Prediction [50.79827516897913]
本稿では,意味概念間で不確実性を分散する軌道予測のための解釈可能なパラダイムを提案する。
実世界の自動運転データに対する我々のアプローチを検証し、最先端のベースラインよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-16T06:28:20Z) - A Multiple Criteria Decision Analysis based Approach to Remove
Uncertainty in SMP Models [1.6244541005112747]
異種ソフトウェアの保守性を評価することが不可欠である。
構造化された方法論が設計され、データセットが前処理され、メンテナンス性指標(MI)の範囲も見つかった。
上記の手法間の不確実性を取り除くため、一般的な複数の基準決定モデル、すなわち、理想解(TOPSIS)と類似性による順序選好の手法を用いる。
論文 参考訳(メタデータ) (2022-09-30T06:38:10Z) - Exploring Attention-Aware Network Resource Allocation for Customized
Metaverse Services [69.37584804990806]
我々は、カスタマイズされたMetaverseサービスを実現するために、アテンション対応ネットワークリソース割り当てスキームを設計する。
目的は、ユーザーがより興味を持つ仮想オブジェクトにより多くのネットワークリソースを割り当てることである。
論文 参考訳(メタデータ) (2022-07-31T06:04:15Z) - Performance Modeling of Metric-Based Serverless Computing Platforms [5.089110111757978]
提案されたパフォーマンスモデルは、開発者とプロバイダが異なる構成でデプロイメントのパフォーマンスとコストを予測するのに役立つ。
Knative上での実環境実験を行うことで,提案した性能モデルの適用性と精度を検証した。
論文 参考訳(メタデータ) (2022-02-23T00:39:01Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z) - Beware the evolving 'intelligent' web service! An integration
architecture tactic to guard AI-first components [5.975695375814527]
我々の提案は、インテリジェントなサービス依存ソフトウェアロバスト性を改善するために設計されたアーキテクチャ戦略である。
この戦略には、インテリジェントなサービスに対してベースラインでアプリケーション固有のベンチマークデータセットを作成することが含まれる。
本アーキテクチャの実装に関する技術的評価は,本手法が実質的な信頼進化の1,054例と,応答ラベルセットに対する実質的な変化の2,461例を識別できることを示す。
論文 参考訳(メタデータ) (2020-05-27T06:15:18Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z) - Unsupervised Model Personalization while Preserving Privacy and
Scalability: An Open Problem [55.21502268698577]
本研究では,非教師なしモデルパーソナライゼーションの課題について検討する。
この問題を探求するための新しいDual User-Adaptation Framework(DUA)を提供する。
このフレームワークは、サーバ上のモデルパーソナライズとユーザデバイス上のローカルデータ正規化に柔軟にユーザ適応を分散させる。
論文 参考訳(メタデータ) (2020-03-30T09:35:12Z) - Improving IoT Analytics through Selective Edge Execution [0.0]
エッジインフラストラクチャを活用して分析性能を向上させることを提案する。
我々は、IoTデバイスがそれらのルーチンをローカルに実行できるようにするアルゴリズムを考案した。
そして、それらをクラウドレットサーバにアウトソースします。
論文 参考訳(メタデータ) (2020-03-07T15:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。