論文の概要: Towards a Measure of Algorithm Similarity
- arxiv url: http://arxiv.org/abs/2510.27063v1
- Date: Fri, 31 Oct 2025 00:20:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:15.940325
- Title: Towards a Measure of Algorithm Similarity
- Title(参考訳): アルゴリズムの類似性の尺度に向けて
- Authors: Shairoz Sohail, Taher Ali,
- Abstract要約: 同じ問題に対して2つのアルゴリズムが与えられた場合、それらが有意に異なるかどうかを判断できるだろうか?
本稿では,アルゴリズムの実装を下流タスクに適した機能空間に組み込む評価メモリ・操作・複雑度フレームワークEMOCを紹介する。
検証済みPython実装のキュレートされたデータセットであるPACDを3つの問題に分けてコンパイルし、EMOCがクラスタリングとアルゴリズム型の分類、ほぼ重複の検出、LCM生成プログラムにおける多様性の定量化をサポートすることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given two algorithms for the same problem, can we determine whether they are meaningfully different? In full generality, the question is uncomputable, and empirically it is muddied by competing notions of similarity. Yet, in many applications (such as clone detection or program synthesis) a pragmatic and consistent similarity metric is necessary. We review existing equivalence and similarity notions and introduce EMOC: An Evaluation-Memory-Operations-Complexity framework that embeds algorithm implementations into a feature space suitable for downstream tasks. We compile PACD, a curated dataset of verified Python implementations across three problems, and show that EMOC features support clustering and classification of algorithm types, detection of near-duplicates, and quantification of diversity in LLM-generated programs. Code, data, and utilities for computing EMOC embeddings are released to facilitate reproducibility and future work on algorithm similarity.
- Abstract(参考訳): 同じ問題に対して2つのアルゴリズムが与えられた場合、それらが有意に異なるかどうかを判断できるだろうか?
完全な一般性において、問題は計算不可能であり、実証的には類似性の競合する概念に浸食される。
しかし、多くの応用(クローン検出やプログラム合成など)において、実用的で一貫した類似度計量が必要である。
我々は、既存の等価性と類似性の概念をレビューし、EMOCを紹介します。 下流タスクに適した機能空間にアルゴリズムの実装を組み込む評価記憶-操作-複雑度フレームワーク。
検証済みPython実装のキュレートされたデータセットであるPACDを3つの問題に分けてコンパイルし、EMOCがクラスタリングとアルゴリズム型の分類、ほぼ重複の検出、LCM生成プログラムにおける多様性の定量化をサポートすることを示す。
EMOC埋め込みを計算するためのコード、データ、ユーティリティがリリースされ、再現性とアルゴリズムの類似性に関する今後の研究が促進される。
関連論文リスト
- Memetic collaborative approaches for finding balanced incomplete block designs [0.0]
平衡不完全ブロック設計(BIBD)問題は、多数の対称性を持つ難しい問題である。
本稿では,古典的二元数定式化の代替として機能する双対(整数)問題表現を提案する。
論文 参考訳(メタデータ) (2024-11-04T16:41:18Z) - A Parametrizable Algorithm for Distributed Approximate Similarity Search with Arbitrary Distances [0.5030361857850012]
PDASC(Parametrizable Distributed Approximate similarity Search with Clustering)を提案する。
PDASCは、分散データ環境での運用や、異なるトポロジで定義されたデータセットの処理に適していることを示す。
論文 参考訳(メタデータ) (2024-05-22T16:19:52Z) - Multi-Dimensional Ability Diagnosis for Machine Learning Algorithms [88.93372675846123]
本稿では,機械学習アルゴリズム評価のためのタスク非依存評価フレームワークCamillaを提案する。
認識診断の仮定とニューラルネットワークを用いて、各サンプルのアルゴリズム、サンプル、スキル間の複雑な相互作用を学習する。
我々の実験では、カミラはメートル法信頼性、ランクの整合性、ランクの安定性で最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-07-14T03:15:56Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Encoding of data sets and algorithms [0.0]
多くの高インパクトアプリケーションにおいて、機械学習アルゴリズムの出力品質を保証することが重要である。
我々は、ある指標の観点から、どのモデルが互いに近いかを決定するために、数学的に厳密な理論を開始した。
このグリッドに作用する所定のしきい値メートル法は、それぞれのアルゴリズムと関心のデータセットから、任意のアプリケーションに近接性(または統計的距離)を表現します。
論文 参考訳(メタデータ) (2023-03-02T05:29:27Z) - An algorithm for clustering with confidence-based must-link and cannot-link constraints [0.0]
我々はPCCCアルゴリズム(Pairwise-Confidence-Constraints-Clustering)を導入する。
PCCCアルゴリズムは、オブジェクトのペアに提供された情報を考慮しながら、反復的にオブジェクトをクラスタに割り当てる。
既存のアルゴリズムとは異なり、我々のアルゴリズムは最大6万のオブジェクト、100のクラスタ、数百万のnot-link制約を持つ大規模インスタンスにスケールする。
論文 参考訳(メタデータ) (2022-12-29T19:21:33Z) - Efficient Approximate Kernel Based Spike Sequence Classification [56.2938724367661]
SVMのような機械学習モデルは、シーケンスのペア間の距離/相似性の定義を必要とする。
厳密な手法により分類性能は向上するが、計算コストが高い。
本稿では,その予測性能を向上させるために,近似カーネルの性能を改善する一連の方法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:44:19Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - Selection-Expansion: A Unifying Framework for Motion-Planning and
Diversity Search Algorithms [69.87173070473717]
本稿では,2つの多様性探索アルゴリズム,ノベルティ探索アルゴリズムとゴール探索処理アルゴリズムの特性について検討する。
mpアルゴリズムとの関係は、ポリシーパラメータ空間と結果空間の間のマッピングの滑らかさ、あるいは滑らかさの欠如が検索効率において重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2021-04-10T13:52:27Z) - Identifying Co-Adaptation of Algorithmic and Implementational
Innovations in Deep Reinforcement Learning: A Taxonomy and Case Study of
Inference-based Algorithms [15.338931971492288]
我々は、アルゴリズムの革新と実装決定を分離するために、一連の推論に基づくアクター批判アルゴリズムに焦点を当てる。
実装の詳細がアルゴリズムの選択に一致すると、パフォーマンスが大幅に低下します。
結果は、どの実装の詳細がアルゴリズムと共適応され、共進化しているかを示す。
論文 参考訳(メタデータ) (2021-03-31T17:55:20Z) - A Systematic Characterization of Sampling Algorithms for Open-ended
Language Generation [71.31905141672529]
本稿では,自己回帰型言語モデルに広く採用されている祖先サンプリングアルゴリズムについて検討する。
エントロピー低減, 秩序保存, 斜面保全の3つの重要な特性を同定した。
これらの特性を満たすサンプリングアルゴリズムのセットが,既存のサンプリングアルゴリズムと同等に動作することがわかった。
論文 参考訳(メタデータ) (2020-09-15T17:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。