論文の概要: The Role of Codeword-to-Class Assignments in Error-Correcting Codes: An
Empirical Study
- arxiv url: http://arxiv.org/abs/2302.05334v1
- Date: Fri, 10 Feb 2023 15:48:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-13 15:24:13.951507
- Title: The Role of Codeword-to-Class Assignments in Error-Correcting Codes: An
Empirical Study
- Title(参考訳): 誤り訂正符号におけるコードワード・クラス・アサインメントの役割--実証的研究
- Authors: Itay Evron, Ophir Onn, Tamar Weiss Orzech, Hai Azeroual, Daniel Soudry
- Abstract要約: 誤り訂正符号(ECC)の性能において,コードワードからクラスへの代入が重要な役割を担っていることを示す。
具体的には、類似したコードワードが類似クラスに割り当てられる類似性保存代入について検討する。
類似性を保存する代入によって、既定のコードブックは問題依存となり、他の望ましいコードブックのプロパティを変更することはなくなる。
- 参考スコア(独自算出の注目度): 18.322821472645064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Error-correcting codes (ECC) are used to reduce multiclass classification
tasks to multiple binary classification subproblems. In ECC, classes are
represented by the rows of a binary matrix, corresponding to codewords in a
codebook. Codebooks are commonly either predefined or problem dependent. Given
predefined codebooks, codeword-to-class assignments are traditionally
overlooked, and codewords are implicitly assigned to classes arbitrarily. Our
paper shows that these assignments play a major role in the performance of ECC.
Specifically, we examine similarity-preserving assignments, where similar
codewords are assigned to similar classes. Addressing a controversy in existing
literature, our extensive experiments confirm that similarity-preserving
assignments induce easier subproblems and are superior to other assignment
policies in terms of their generalization performance. We find that
similarity-preserving assignments make predefined codebooks become
problem-dependent, without altering other favorable codebook properties.
Finally, we show that our findings can improve predefined codebooks dedicated
to extreme classification.
- Abstract(参考訳): 誤り訂正符号(ECC)は、多重クラス分類タスクを複数のバイナリ分類サブプロブレムに還元するために用いられる。
ECCでは、クラスはバイナリマトリックスの行で表され、コードブックのコードワードに対応する。
コードブックは、通常、事前定義されたか問題に依存します。
事前に定義されたコードブックによって、コードワードからクラスへの割り当ては伝統的に見過ごされ、コードワードは任意のクラスに暗黙的に割り当てられる。
本稿は,これらの課題がECCのパフォーマンスにおいて重要な役割を担っていることを示す。
具体的には、類似したコードワードが類似クラスに割り当てられる類似性保存代入について検討する。
既存の文献の論争に対処するため, 類似性保存課題はより容易なサブプロブレムを誘導し, 一般化性能の点で他の課題政策よりも優れていることを確認した。
類似性を保存する代入によって、既定のコードブックは問題依存となり、他の望ましいコードブックのプロパティを変更することはなくなる。
最後に, 極端分類専用コードブックの改良が期待できることを示す。
関連論文リスト
- Sifting through the Chaff: On Utilizing Execution Feedback for Ranking the Generated Code Candidates [46.74037090843497]
大規模言語モデル(LLM)は、自然言語記述に基づいたコードの自動生成によって、開発者がプログラミングにアプローチする方法を変えつつある。
本稿では,実行フィードバックを活用するコードランキングの革新的なアプローチである RankEF について述べる。
3つのコード生成ベンチマークの実験では、RanEFが最先端のCodeRankerよりも大幅に優れていることが示されている。
論文 参考訳(メタデータ) (2024-08-26T01:48:57Z) - A Novel ICD Coding Method Based on Associated and Hierarchical Code Description Distillation [6.524062529847299]
ICD符号化は、ノイズの多い医療文書入力による多ラベルテキスト分類の問題である。
近年のICD符号化の進歩により、医療用ノートやコードに付加的なデータや知識ベースを組み込むことで、性能が向上した。
コード表現学習の改善と不適切なコード代入の回避を目的とした,関連および階層型コード記述蒸留(AHDD)に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T07:26:23Z) - Mitigating Word Bias in Zero-shot Prompt-based Classifiers [55.60306377044225]
一致したクラス先行は、オラクルの上界性能と強く相関していることを示す。
また,NLPタスクに対するプロンプト設定において,一貫したパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2023-09-10T10:57:41Z) - CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。
汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。
特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文 参考訳(メタデータ) (2023-06-05T20:39:08Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - CodeRetriever: Unimodal and Bimodal Contrastive Learning [128.06072658302165]
関数レベルのコードセマンティック表現を訓練するために,一様および二様のコントラスト学習を組み合わせたCodeRetrieverモデルを提案する。
ノンモーダルなコントラスト学習のために、文書と関数名に基づいてポジティブなコードペアを構築するためのセマンティックガイド付き手法を設計する。
バイモーダルなコントラスト学習では、コードのドキュメンテーションとインラインコメントを活用して、テキストコードペアを構築します。
論文 参考訳(メタデータ) (2022-01-26T10:54:30Z) - CLSEBERT: Contrastive Learning for Syntax Enhanced Code Pre-Trained
Model [23.947178895479464]
CLSEBERTは,構文強化符号事前学習モデルのための構築学習フレームワークである。
事前学習段階では、抽象構文木(AST)に含まれるコード構文と階層について検討する。
ひとつは抽象構文木内のノード間のエッジを予測することであり、もう一つはコードトークンの型を予測することである。
論文 参考訳(メタデータ) (2021-08-10T10:08:21Z) - Integer Programming-based Error-Correcting Output Code Design for Robust
Classification [4.7464518249313805]
誤り訂正出力コード(ECOC)は、単純なバイナリ分類器をマルチクラス分類器に結合する原則的なアプローチを提供する。
本稿では, 最適ECOCを設計し, 名目精度と対角精度を両立させる問題について検討する。
我々の研究は、最適性を保証するコードブックを生成するために、IPソルバの進歩を活用している。
論文 参考訳(メタデータ) (2020-10-30T23:35:18Z) - GraphCodeBERT: Pre-training Code Representations with Data Flow [97.00641522327699]
本稿では,コード固有の構造を考慮したプログラミング言語の事前学習モデルであるGraphCodeBERTを提案する。
これは変数間の"where-the-value-comes-from"の関係をエンコードするコードのセマンティックレベルの構造です。
コード検索,クローン検出,コード翻訳,コード改良の4つのタスクにおいて,本モデルを評価する。
論文 参考訳(メタデータ) (2020-09-17T15:25:56Z) - Self-Supervised Contrastive Learning for Code Retrieval and
Summarization via Semantic-Preserving Transformations [28.61567319928316]
Corderは、ソースコードモデルのための自己教師付きコントラスト学習フレームワークである。
重要なイノベーションは、ソースコードモデルをトレーニングし、類似した、異種のコードスニペットを認識するように要求することです。
Corderで事前訓練されたコードモデルは、コード・ツー・コード検索、テキスト・ツー・コード検索、およびコード・ツー・テキスト要約タスクにおいて、他のベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2020-09-06T13:31:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。