論文の概要: muRelBench: MicroBenchmarks for Zonotope Domains
- arxiv url: http://arxiv.org/abs/2404.16243v1
- Date: Wed, 24 Apr 2024 23:16:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-26 15:17:42.261048
- Title: muRelBench: MicroBenchmarks for Zonotope Domains
- Title(参考訳): muRelBench: Zonotopeドメイン用のマイクロベンチマーク
- Authors: Kenny Ballou, Elena Sherman,
- Abstract要約: 本稿では、弱い関係の抽象ドメインとその操作のための合成ベンチマークであるttexttmuRelBenchを紹介する。
例えば、ベンチマークはドメイン閉鎖のような提案されたアルゴリズムの実験的な評価をサポートすることができる。
- 参考スコア(独自算出の注目度): 1.2430809884830318
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present \texttt{muRelBench}, a suite of synthetic benchmarks for weakly-relational abstract domains and their operations. For example, the benchmarks can support experimental evaluations of proposed algorithms such as domain closure.
- Abstract(参考訳): 我々は、弱い関係の抽象ドメインとその操作のための合成ベンチマークスイートである、texttt{muRelBench}を提示する。
例えば、ベンチマークはドメイン閉鎖のような提案されたアルゴリズムの実験的な評価をサポートすることができる。
関連論文リスト
- Partial Rankings of Optimizers [0.0]
各種テスト関数に対する複数の基準に従ってベンチマークを行うフレームワークを提案する。
本手法では,アグリゲーションの悪名高い欠点を回避するため,全ての部分順序/ランクの分布を記述する。
論文 参考訳(メタデータ) (2024-02-26T13:43:25Z) - A structured regression approach for evaluating model performance across
intersectional subgroups [57.84444882410051]
分散評価は、AIフェアネスアセスメントにおける中心的なタスクであり、異なるサブグループ間でAIシステムのパフォーマンスを測定することを目的としている。
本稿では,システム性能評価の信頼性を実証する,非凝集評価のための構造化回帰手法を提案する。
我々は2つの公開データセットといくつかの半合成データの変種についてアプローチを評価した。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Evaluating Cross-Domain Text-to-SQL Models and Benchmarks [7.388002745070808]
テキスト・ツー・ベンチマークを研究し、これらのベンチマークの中で最高のパフォーマンスのモデルを再評価する。
これらのベンチマークで完全な性能を達成することは、提供されたサンプルから導出できる複数の解釈のため不可能であることがわかった。
GPT4ベースのモデルは、人間の評価においてスパイダーベンチマークのゴールド標準基準クエリを上回る。
論文 参考訳(メタデータ) (2023-10-27T23:36:14Z) - Ten New Benchmarks for Optimization [1.6589012298747952]
ベンチマークは、パフォーマンスを評価するために、新しい最適化アルゴリズムとその変種をテストするために使用される。
この章では、ノイズ、不連続性、パラメータ推定、未知のパスなど、さまざまな特性を持つ10の新しいベンチマークを紹介します。
論文 参考訳(メタデータ) (2023-08-30T10:02:52Z) - FFB: A Fair Fairness Benchmark for In-Processing Group Fairness Methods [57.18130745705417]
本稿では,グループフェアネス手法のベンチマークフレームワークであるFair Fairness Benchmark(textsfFFB)を紹介する。
グループフェアネスの異なる概念を確実にするための最先端手法を包括的に分析する。
論文 参考訳(メタデータ) (2023-06-15T19:51:28Z) - Comparing Methods for Extractive Summarization of Call Centre Dialogue [77.34726150561087]
そこで本稿では,これらの手法を用いて呼の要約を生成し,客観的に評価することにより,実験的な比較を行った。
TopicSum と Lead-N は他の要約法よりも優れており,BERTSum は主観的評価と客観的評価の両方で比較的低いスコアを得た。
論文 参考訳(メタデータ) (2022-09-06T13:16:02Z) - A Framework for Generating Informative Benchmark Instances [3.8848561367220276]
ベンチマークは、代替解決アプローチの相対的なパフォーマンスを評価するための重要なツールである。
現代の制約プログラミング言語は、インスタンスデータに対してパラメータ化されるクラスレベルのモデルの仕様を許容する。
これら2つのプロパティを組み合わせて多数のベンチマークインスタンスを生成するフレームワークを導入する。
論文 参考訳(メタデータ) (2022-05-29T19:56:08Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - Parallelizing Contextual Linear Bandits [82.65675585004448]
並列な)コンテキスト線形バンディットアルゴリズムの族を提示し、その遺残はそれらの完全シーケンシャルなアルゴリズムとほぼ同一である。
また,これらの並列アルゴリズムについて,材料発見や生物配列設計の問題など,いくつかの領域で実証評価を行った。
論文 参考訳(メタデータ) (2021-05-21T22:22:02Z) - Collaborative Management of Benchmark Instances and their Attributes [1.8047694351309207]
パブリックなベンチマークインスタンスはSAT解決の手法を評価するために広く利用されている。
ベンチマークインスタンスとその属性の相互関係のキャプチャは、ベンチマークインスタンス識別子の仕様によって大幅に単純化されます。
論文 参考訳(メタデータ) (2020-09-07T10:23:08Z) - Is Temporal Difference Learning Optimal? An Instance-Dependent Analysis [102.29671176698373]
我々は、割引決定過程における政策評価の問題に対処し、生成モデルの下で、ll_infty$errorに対するマルコフに依存した保証を提供する。
我々は、ポリシー評価のために、局所ミニマックス下限の両漸近バージョンと非漸近バージョンを確立し、アルゴリズムを比較するためのインスタンス依存ベースラインを提供する。
論文 参考訳(メタデータ) (2020-03-16T17:15:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。