Fugu-MT 論文翻訳(概要): The Role of Codeword-to-Class Assignments in Error-Correcting Codes: An Empirical Study

論文の概要: The Role of Codeword-to-Class Assignments in Error-Correcting Codes: An Empirical Study

arxiv url: http://arxiv.org/abs/2302.05334v1
Date: Fri, 10 Feb 2023 15:48:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-13 15:24:13.951507
Title: The Role of Codeword-to-Class Assignments in Error-Correcting Codes: An Empirical Study
Title（参考訳）: 誤り訂正符号におけるコードワード・クラス・アサインメントの役割--実証的研究
Authors: Itay Evron, Ophir Onn, Tamar Weiss Orzech, Hai Azeroual, Daniel Soudry
Abstract要約: 誤り訂正符号(ECC)の性能において,コードワードからクラスへの代入が重要な役割を担っていることを示す。具体的には、類似したコードワードが類似クラスに割り当てられる類似性保存代入について検討する。類似性を保存する代入によって、既定のコードブックは問題依存となり、他の望ましいコードブックのプロパティを変更することはなくなる。
参考スコア（独自算出の注目度）: 18.322821472645064
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Error-correcting codes (ECC) are used to reduce multiclass classification tasks to multiple binary classification subproblems. In ECC, classes are represented by the rows of a binary matrix, corresponding to codewords in a codebook. Codebooks are commonly either predefined or problem dependent. Given predefined codebooks, codeword-to-class assignments are traditionally overlooked, and codewords are implicitly assigned to classes arbitrarily. Our paper shows that these assignments play a major role in the performance of ECC. Specifically, we examine similarity-preserving assignments, where similar codewords are assigned to similar classes. Addressing a controversy in existing literature, our extensive experiments confirm that similarity-preserving assignments induce easier subproblems and are superior to other assignment policies in terms of their generalization performance. We find that similarity-preserving assignments make predefined codebooks become problem-dependent, without altering other favorable codebook properties. Finally, we show that our findings can improve predefined codebooks dedicated to extreme classification.
Abstract（参考訳）: 誤り訂正符号(ECC)は、多重クラス分類タスクを複数のバイナリ分類サブプロブレムに還元するために用いられる。 ECCでは、クラスはバイナリマトリックスの行で表され、コードブックのコードワードに対応する。コードブックは、通常、事前定義されたか問題に依存します。事前に定義されたコードブックによって、コードワードからクラスへの割り当ては伝統的に見過ごされ、コードワードは任意のクラスに暗黙的に割り当てられる。本稿は,これらの課題がECCのパフォーマンスにおいて重要な役割を担っていることを示す。具体的には、類似したコードワードが類似クラスに割り当てられる類似性保存代入について検討する。既存の文献の論争に対処するため, 類似性保存課題はより容易なサブプロブレムを誘導し, 一般化性能の点で他の課題政策よりも優れていることを確認した。類似性を保存する代入によって、既定のコードブックは問題依存となり、他の望ましいコードブックのプロパティを変更することはなくなる。最後に, 極端分類専用コードブックの改良が期待できることを示す。

関連論文リスト

Contrastive ECOC: Learning Output Codes for Adversarial Defense [2.07180164747172]
本稿では,コントラスト学習に基づく自動コードブック学習の3つのモデルを紹介する。提案モデルでは, 2つのベースラインと比較して, 敵攻撃に対する強靭性が高いことを示す。
論文参考訳（メタデータ） (2025-08-14T09:50:50Z)
Is Compression Really Linear with Code Intelligence? [60.123628177110206]
textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文参考訳（メタデータ） (2025-05-16T16:59:14Z)
Memorize or Generalize? Evaluating LLM Code Generation with Code Rewriting [54.48306552577881]
大規模な言語モデル(LLM)は、主にメモリ化(トレーニングデータの大きな部分を複製または再利用する)と一般化(Generalization)を併用している、と我々は主張する。既存の評価は、表面/構造的類似性を無視し、繰り返しコードの良質な再利用を有害なリコールと記憶タスクの正しさで混同する。そこで我々は,2つの信号を組み合わせた正規化スコアである覚書リスク指標(MRI)を提案する。 (i) モデルが元の地平解とどのように類似しているか, (ii) 元のタスクから書き換えされたタスクにどの程度の性能が低下するか。
論文参考訳（メタデータ） (2025-03-04T05:39:24Z)
Sifting through the Chaff: On Utilizing Execution Feedback for Ranking the Generated Code Candidates [46.74037090843497]
大規模言語モデル(LLM)は、自然言語記述に基づいたコードの自動生成によって、開発者がプログラミングにアプローチする方法を変えつつある。本稿では,実行フィードバックを活用するコードランキングの革新的なアプローチである RankEF について述べる。 3つのコード生成ベンチマークの実験では、RanEFが最先端のCodeRankerよりも大幅に優れていることが示されている。
論文参考訳（メタデータ） (2024-08-26T01:48:57Z)
A Novel ICD Coding Method Based on Associated and Hierarchical Code Description Distillation [6.524062529847299]
ICD符号化は、ノイズの多い医療文書入力による多ラベルテキスト分類の問題である。近年のICD符号化の進歩により、医療用ノートやコードに付加的なデータや知識ベースを組み込むことで、性能が向上した。コード表現学習の改善と不適切なコード代入の回避を目的とした,関連および階層型コード記述蒸留(AHDD)に基づく新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-04-17T07:26:23Z)
Mitigating Word Bias in Zero-shot Prompt-based Classifiers [55.60306377044225]
一致したクラス先行は、オラクルの上界性能と強く相関していることを示す。また,NLPタスクに対するプロンプト設定において,一貫したパフォーマンス向上を示す。
論文参考訳（メタデータ） (2023-09-10T10:57:41Z)
CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文参考訳（メタデータ） (2023-06-05T20:39:08Z)
ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-03-15T08:25:08Z)
CodeRetriever: Unimodal and Bimodal Contrastive Learning [128.06072658302165]
関数レベルのコードセマンティック表現を訓練するために,一様および二様のコントラスト学習を組み合わせたCodeRetrieverモデルを提案する。ノンモーダルなコントラスト学習のために、文書と関数名に基づいてポジティブなコードペアを構築するためのセマンティックガイド付き手法を設計する。バイモーダルなコントラスト学習では、コードのドキュメンテーションとインラインコメントを活用して、テキストコードペアを構築します。
論文参考訳（メタデータ） (2022-01-26T10:54:30Z)
CLSEBERT: Contrastive Learning for Syntax Enhanced Code Pre-Trained Model [23.947178895479464]
CLSEBERTは,構文強化符号事前学習モデルのための構築学習フレームワークである。事前学習段階では、抽象構文木(AST)に含まれるコード構文と階層について検討する。ひとつは抽象構文木内のノード間のエッジを予測することであり、もう一つはコードトークンの型を予測することである。
論文参考訳（メタデータ） (2021-08-10T10:08:21Z)
Integer Programming-based Error-Correcting Output Code Design for Robust Classification [4.7464518249313805]
誤り訂正出力コード(ECOC)は、単純なバイナリ分類器をマルチクラス分類器に結合する原則的なアプローチを提供する。本稿では, 最適ECOCを設計し, 名目精度と対角精度を両立させる問題について検討する。我々の研究は、最適性を保証するコードブックを生成するために、IPソルバの進歩を活用している。
論文参考訳（メタデータ） (2020-10-30T23:35:18Z)
GraphCodeBERT: Pre-training Code Representations with Data Flow [97.00641522327699]
本稿では,コード固有の構造を考慮したプログラミング言語の事前学習モデルであるGraphCodeBERTを提案する。これは変数間の"where-the-value-comes-from"の関係をエンコードするコードのセマンティックレベルの構造です。コード検索,クローン検出,コード翻訳,コード改良の4つのタスクにおいて,本モデルを評価する。
論文参考訳（メタデータ） (2020-09-17T15:25:56Z)
Self-Supervised Contrastive Learning for Code Retrieval and Summarization via Semantic-Preserving Transformations [28.61567319928316]
Corderは、ソースコードモデルのための自己教師付きコントラスト学習フレームワークである。重要なイノベーションは、ソースコードモデルをトレーニングし、類似した、異種のコードスニペットを認識するように要求することです。 Corderで事前訓練されたコードモデルは、コード・ツー・コード検索、テキスト・ツー・コード検索、およびコード・ツー・テキスト要約タスクにおいて、他のベースラインを大幅に上回っていることを示す。
論文参考訳（メタデータ） (2020-09-06T13:31:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。