Fugu-MT 論文翻訳(概要): Threshy: Supporting Safe Usage of Intelligent Web Services

論文の概要: Threshy: Supporting Safe Usage of Intelligent Web Services

arxiv url: http://arxiv.org/abs/2008.08252v1
Date: Wed, 19 Aug 2020 04:02:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-05 20:44:21.853109
Title: Threshy: Supporting Safe Usage of Intelligent Web Services
Title（参考訳）: Threshy: インテリジェントWebサービスの安全な利用を支援する
Authors: Alex Cummaudo, Scott Barnett, Rajesh Vasa and John Grundy
Abstract要約: Threshyは開発者が問題領域に適した決定しきい値を選択するのを助けるツールである。既存のツールとは異なり、Threshyは開発前、リリース前、サポートのために設計されている。
参考スコア（独自算出の注目度）: 4.346610687701405
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Increased popularity of `intelligent' web services provides end-users with machine-learnt functionality at little effort to developers. However, these services require a decision threshold to be set which is dependent on problem-specific data. Developers lack a systematic approach for evaluating intelligent services and existing evaluation tools are predominantly targeted at data scientists for pre-development evaluation. This paper presents a workflow and supporting tool, Threshy, to help software developers select a decision threshold suited to their problem domain. Unlike existing tools, Threshy is designed to operate in multiple workflows including pre-development, pre-release, and support. Threshy is designed for tuning the confidence scores returned by intelligent web services and does not deal with hyper-parameter optimisation used in ML models. Additionally, it considers the financial impacts of false positives. Threshold configuration files exported by Threshy can be integrated into client applications and monitoring infrastructure. Demo: https://bit.ly/2YKeYhE.
Abstract（参考訳）: intelligent' の web サービスの人気が高まり、エンドユーザは少ない労力でマシン主導の機能を提供するようになった。しかし、これらのサービスは、問題固有のデータに依存する決定しきい値を設定する必要がある。開発者はインテリジェントなサービスを評価するための体系的なアプローチを欠いている。本稿では,ソフトウェア開発者が問題領域に適した決定しきい値を選択するためのワークフローおよびサポートツールであるthreshyを提案する。既存のツールとは異なり、threshyは開発前、リリース前、サポートを含む複数のワークフローで動作するように設計されている。 ThreshyはインテリジェントなWebサービスによって返される信頼性スコアを調整するために設計されており、MLモデルで使用されるハイパーパラメータ最適化には対応しない。さらに、偽陽性の経済的影響も考慮している。 ThreshyがエクスポートしたThreshold構成ファイルは、クライアントアプリケーションや監視インフラストラクチャに統合できる。デモ: https://bit.ly/2ykeyhe。

関連論文リスト

The Next Paradigm Is User-Centric Agent, Not Platform-Centric Service [44.35361893379857]
本稿では,デジタルサービスの未来が,プラットフォーム中心からユーザ中心のエージェントへと移行すべきである,と論じる。ユーザ中心のエージェントは、プライバシを優先し、ユーザ定義の目標と整合し、ユーザが好みやアクションをコントロールできるようにする。
論文参考訳（メタデータ） (2026-02-17T16:07:44Z)
Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文参考訳（メタデータ） (2025-12-23T03:10:09Z)
QoSGMAA: A Robust Multi-Order Graph Attention and Adversarial Framework for Sparse QoS Prediction [12.037416164995605]
本稿では,複雑でノイズの多いネットワークサービス環境における予測精度の向上を目的とした新しいアーキテクチャMGAAを提案する。ユーザとサービス間の複雑な高次相互作用を捉えるために、離散サンプリング手法を用いる。提案モデルでは,既存のベースライン手法を著しく上回り,サービス選択やレコメンデーションシナリオへの実践的展開の可能性を強調した。
論文参考訳（メタデータ） (2025-10-27T04:03:28Z)
OSS-UAgent: An Agent-based Usability Evaluation Framework for Open Source Software [47.02288620982592]
我々のフレームワークは,大規模言語モデル(LLM)を利用したインテリジェントエージェントを用いて,プログラミングタスクを実行する開発者をシミュレートする。 OSS-UAgentは正確でコンテキスト対応のコード生成を保証する。本稿では,OSS-UAgentがグラフ解析プラットフォーム評価に活用している実例を紹介する。
論文参考訳（メタデータ） (2025-05-29T08:40:10Z)
Offline Model-Based Optimization: Comprehensive Review [61.91350077539443]
オフライン最適化は、オフラインデータセットのみを使用してブラックボックス機能の最適化を目標とする、科学とエンジニアリングの基本的な課題である。モデルベース最適化の最近の進歩は、オフライン固有の代理モデルと生成モデルを開発するために、ディープニューラルネットワークの一般化能力を活用している。科学的な発見を加速させる効果が増大しているにもかかわらず、この分野は包括的なレビューを欠いている。
論文参考訳（メタデータ） (2025-03-21T16:35:02Z)
Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。 MeCoは表現空間の高レベル認知信号をキャプチャし、ツールを呼び出すタイミングを指示する。実験の結果,MeCoはLSMの内部認知信号を正確に検出し,ツール使用による意思決定を大幅に改善することがわかった。
論文参考訳（メタデータ） (2025-02-18T15:45:01Z)
SMART: Self-Aware Agent for Tool Overuse Mitigation [58.748554080273585]
現在のLarge Language Model (LLM) エージェントは、強力な推論とツールの使用能力を示すが、しばしば自己認識に欠ける。この不均衡はツール・オーバーユースにつながり、モデルはパラメトリックな知識を持つタスクに対して、不要に外部ツールに依存する。 SMART(Strategic Model-Aware Reasoning with Tools)は、エージェントの自己認識を高め、タスクハンドリングを最適化し、ツールの過剰使用を減らすパラダイムである。
論文参考訳（メタデータ） (2025-02-17T04:50:37Z)
LLM-Generated Microservice Implementations from RESTful API Definitions [3.740584607001637]
本稿では,Large Language Models (LLMs) を用いて,APIファーストのソフトウェア開発を自動化するシステムを提案する。システムはOpenAPI仕様を生成し、そこからサーバコードを生成し、実行ログとエラーメッセージを分析するフィードバックループを通じてコードを精査する。このシステムは、ソフトウェア開発サイクルをスピードアップする上で、ソフトウェア開発者、アーキテクト、組織に利益をもたらす可能性がある。
論文参考訳（メタデータ） (2025-02-13T20:50:33Z)
Microservices-Based Framework for Predictive Analytics and Real-time Performance Enhancement in Travel Reservation Systems [1.03590082373586]
本稿では,リアルタイム旅行予約システムの性能向上を目的としたアーキテクチャの枠組みを提案する。私たちのフレームワークには、顧客の需要予測を最適化する機械学習モデルによるリアルタイム予測分析、動的価格設定、システムパフォーマンスが含まれています。今後は、高度なAIモデルとエッジ処理を調査して、採用するシステムのパフォーマンスと堅牢性をさらに向上する予定である。
論文参考訳（メタデータ） (2024-12-20T07:19:42Z)
WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks? [83.19032025950986]
本稿では,Webブラウザを介してソフトウェアと対話する大規模言語モデルベースエージェントについて検討する。 WorkArenaは、広く使用されているServiceNowプラットフォームに基づく33のタスクのベンチマークである。 BrowserGymは、そのようなエージェントの設計と評価のための環境である。
論文参考訳（メタデータ） (2024-03-12T14:58:45Z)
Interpretable Self-Aware Neural Networks for Robust Trajectory Prediction [50.79827516897913]
本稿では,意味概念間で不確実性を分散する軌道予測のための解釈可能なパラダイムを提案する。実世界の自動運転データに対する我々のアプローチを検証し、最先端のベースラインよりも優れた性能を示す。
論文参考訳（メタデータ） (2022-11-16T06:28:20Z)
A Multiple Criteria Decision Analysis based Approach to Remove Uncertainty in SMP Models [1.6244541005112747]
異種ソフトウェアの保守性を評価することが不可欠である。構造化された方法論が設計され、データセットが前処理され、メンテナンス性指標(MI)の範囲も見つかった。上記の手法間の不確実性を取り除くため、一般的な複数の基準決定モデル、すなわち、理想解(TOPSIS)と類似性による順序選好の手法を用いる。
論文参考訳（メタデータ） (2022-09-30T06:38:10Z)
Exploring Attention-Aware Network Resource Allocation for Customized Metaverse Services [69.37584804990806]
我々は、カスタマイズされたMetaverseサービスを実現するために、アテンション対応ネットワークリソース割り当てスキームを設計する。目的は、ユーザーがより興味を持つ仮想オブジェクトにより多くのネットワークリソースを割り当てることである。
論文参考訳（メタデータ） (2022-07-31T06:04:15Z)
Performance Modeling of Metric-Based Serverless Computing Platforms [5.089110111757978]
提案されたパフォーマンスモデルは、開発者とプロバイダが異なる構成でデプロイメントのパフォーマンスとコストを予測するのに役立つ。 Knative上での実環境実験を行うことで,提案した性能モデルの適用性と精度を検証した。
論文参考訳（メタデータ） (2022-02-23T00:39:01Z)
Federated Learning with Unreliable Clients: Performance Analysis and Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文参考訳（メタデータ） (2021-05-10T08:02:27Z)
Beware the evolving 'intelligent' web service! An integration architecture tactic to guard AI-first components [5.975695375814527]
我々の提案は、インテリジェントなサービス依存ソフトウェアロバスト性を改善するために設計されたアーキテクチャ戦略である。この戦略には、インテリジェントなサービスに対してベースラインでアプリケーション固有のベンチマークデータセットを作成することが含まれる。本アーキテクチャの実装に関する技術的評価は,本手法が実質的な信頼進化の1,054例と,応答ラベルセットに対する実質的な変化の2,461例を識別できることを示す。
論文参考訳（メタデータ） (2020-05-27T06:15:18Z)
A Privacy-Preserving Distributed Architecture for Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文参考訳（メタデータ） (2020-03-30T15:12:03Z)
Unsupervised Model Personalization while Preserving Privacy and Scalability: An Open Problem [55.21502268698577]
本研究では,非教師なしモデルパーソナライゼーションの課題について検討する。この問題を探求するための新しいDual User-Adaptation Framework(DUA)を提供する。このフレームワークは、サーバ上のモデルパーソナライズとユーザデバイス上のローカルデータ正規化に柔軟にユーザ適応を分散させる。
論文参考訳（メタデータ） (2020-03-30T09:35:12Z)
Improving IoT Analytics through Selective Edge Execution [0.0]
エッジインフラストラクチャを活用して分析性能を向上させることを提案する。我々は、IoTデバイスがそれらのルーチンをローカルに実行できるようにするアルゴリズムを考案した。そして、それらをクラウドレットサーバにアウトソースします。
論文参考訳（メタデータ） (2020-03-07T15:02:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。