論文の概要: Tips for making the most of 64-bit architectures in langage design,
libraries or garbage collection
- arxiv url: http://arxiv.org/abs/2310.15632v1
- Date: Tue, 24 Oct 2023 08:54:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 19:51:18.541083
- Title: Tips for making the most of 64-bit architectures in langage design,
libraries or garbage collection
- Title(参考訳): 言語設計、ライブラリ、ガベージコレクションで64ビットアーキテクチャを最大限活用するためのヒント
- Authors: Beno\^it Sonntag (UNISTRA), Dominique Colnet (LORIA)
- Abstract要約: 本研究では,アドレスレジスタの空白ビットをどのように利用できるかを示す具体例を3つ開発する。
そのうちの2つは、新しい静的型付け言語のためのライブラリの実装に関するものである。
3つ目の例は、ガベージコレクタ、特にオブジェクトマーキングフェーズのマーク&スイープの強化である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The 64-bit architectures that have become standard today offer unprecedented
low-level programming possibilities. For the first time in the history of
computing, the size of address registers far exceeded the physical capacity of
their bus.After a brief reminder of the possibilities offered by the small size
of addresses compared to the available 64 bits,we develop three concrete
examples of how the vacant bits of these registers can be used.Among these
examples, two of them concern the implementation of a library for a new
statically typed programming language.Firstly, the implementation of
multi-precision integers, with the aim of improving performance in terms of
both calculation speed and RAM savings.The second example focuses on the
library's handling of UTF-8 character strings.Here, the idea is to make
indexing easier by ignoring the physical size of each UTF-8 characters.Finally,
the third example is a possible enhancement of garbage collectors, in
particular the mark \& sweep for the object marking phase.
- Abstract(参考訳): 今日標準になった64ビットアーキテクチャは、前例のない低レベルプログラミングの可能性を秘めている。
For the first time in the history of computing, the size of address registers far exceeded the physical capacity of their bus.After a brief reminder of the possibilities offered by the small size of addresses compared to the available 64 bits,we develop three concrete examples of how the vacant bits of these registers can be used.Among these examples, two of them concern the implementation of a library for a new statically typed programming language.Firstly, the implementation of multi-precision integers, with the aim of improving performance in terms of both calculation speed and RAM savings.The second example focuses on the library's handling of UTF-8 character strings.Here, the idea is to make indexing easier by ignoring the physical size of each UTF-8 characters.Finally, the third example is a possible enhancement of garbage collectors, in particular the mark \& sweep for the object marking phase.
関連論文リスト
- From Language Models over Tokens to Language Models over Characters [54.123846188068384]
現代の言語モデルは、内部的、数学的には、エンファラクタ文字列ではなくトークン文字列上の分布である。
本稿では,トークンレベル言語モデルから文字レベル言語への変換アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-04T21:19:20Z) - BitStack: Any-Size Compression of Large Language Models in Variable Memory Environments [53.71158537264695]
大規模言語モデル(LLM)は、多くのアプリケーションに革命をもたらしたが、ローカルデバイスにおけるメモリ制限により、その展開は依然として困難である。
textbfBitStackは,メモリ使用量とモデル性能のトレードオフを可能にする,新しいトレーニング不要な重み圧縮手法である。
論文 参考訳(メタデータ) (2024-10-31T13:26:11Z) - Optimizing Byte-level Representation for End-to-end ASR [4.247168417243709]
エンドツーエンド自動音声認識(ASR)のためのバイトレベルの表現を最適化する新しい手法を提案する。
バイトレベルの表現は、サポート対象言語の文字集合が大きい場合、大規模なASRシステムでしばしば使用される。
この手法を用いて構築されたバイリンガル ASR モデルは,英語/マンダリン宣言タスクにおいて,エラー率の相対的に5% 向上することを示した。
論文 参考訳(メタデータ) (2024-06-14T02:58:19Z) - SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - Deepparse : An Extendable, and Fine-Tunable State-Of-The-Art Library for
Parsing Multinational Street Addresses [0.0]
本稿では、LGPL-3.0ライセンス下でPythonのオープンソースで拡張可能で、微調整可能なアドレス解析ソリューションであるDeepparseについて述べる。
任意の言語で書かれたアドレスを解析し、任意のアドレス標準を使用することができる。
ライブラリは、カスタムアドレスを生成するために、新しいデータによる微調整をサポートする。
論文 参考訳(メタデータ) (2023-11-20T15:37:33Z) - Private-Library-Oriented Code Generation with Large Language Models [52.73999698194344]
本稿では,大規模言語モデル(LLM)をプライベートライブラリのコード生成に活用することに焦点を当てる。
プログラマがプライベートコードを書く過程をエミュレートする新しいフレームワークを提案する。
TorchDataEval、TorchDataComplexEval、MonkeyEval、BeatNumEvalの4つのプライベートライブラリベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-07-28T07:43:13Z) - Prompting with Pseudo-Code Instructions [12.166296720125187]
我々は、分類、QA、生成言語タスクにまたがる132のタスクに対して、擬似コードプロンプトのデータセットを作成する。
これらのプロンプトと自然言語の対応を利用して, BLOOM と CodeGen の2つの LLM ファミリ上での性能について検討する。
実験の結果, 擬似符号命令を用いることで, 分類作業におけるF1得点の平均7~16ポイント, ROUGE-L得点の12~38%の増加(絶対値)が得られた。
論文 参考訳(メタデータ) (2023-05-19T16:25:01Z) - HDCC: A Hyperdimensional Computing compiler for classification on
embedded systems and high-performance computing [58.720142291102135]
この研究は、HDC分類メソッドの高レベルな記述を最適化されたCコードに変換する最初のオープンソースコンパイラである、ネームコンパイラを紹介している。
nameは現代のコンパイラのように設計されており、直感的で記述的な入力言語、中間表現(IR)、再ターゲット可能なバックエンドを備えている。
これらの主張を裏付けるために,HDC文献で最もよく使われているデータセットについて,HDCCを用いて実験を行った。
論文 参考訳(メタデータ) (2023-04-24T19:16:03Z) - FP8 Formats for Deep Learning [49.54015320992368]
2つのエンコーディングからなる8ビット浮動小数点(FP8)バイナリインターチェンジフォーマットを提案する。
E4M3のダイナミックレンジは無限大を表現せず、NaNに対して1つのマティーサビットパターンしか持たないことによって拡張される。
16ビットのトレーニングセッションで達成した結果の質を効果的にマッチングし,FP8フォーマットが様々な画像および言語タスクに対して有効であることを示す。
論文 参考訳(メタデータ) (2022-09-12T17:39:55Z) - Compilable Neural Code Generation with Compiler Feedback [43.97362484564799]
本稿では、言語モデルの微調整、コンパイル可能性強化、コンパイル可能性判定を含む、コンパイル可能なコード生成のための3段階パイプラインを提案する。
2つのコード生成タスクの実験は,提案手法の有効性を示し,平均44.18から89.18に,テキスト・コード生成では70.3から96.2に向上した。
論文 参考訳(メタデータ) (2022-03-10T03:15:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。