Fugu-MT 論文翻訳(概要): Compiling Away the Overhead of Race Detection

論文の概要: Compiling Away the Overhead of Race Detection

arxiv url: http://arxiv.org/abs/2512.05555v1
Date: Fri, 05 Dec 2025 09:26:08 GMT
ステータス: 翻訳完了
システム内更新日: 2025-12-13 22:40:56.977351
Title: Compiling Away the Overhead of Race Detection
Title（参考訳）: レース検出のオーバヘッドをコンパイルする
Authors: Alexey Paznikov, Andrey Kogutenko, Yaroslav Osipov, Michael Schwarz, Umang Mathur,
Abstract要約: 動的データ競合検出器は、ソフトウェアにおけるエラーのフラグ付けには不可欠だが、その高いランタイムオーバーヘッドは採用を制限している。そこで本稿では,競合のないアクセスのためのインスツルメンテーションをなくすための,命令間静的解析のスイートを紹介する。提案手法はレース検出のオーバーヘッドを大幅に低減し,ジオ平均速度が1.34倍,ピーク速度が2.5倍に達した。
参考スコア（独自算出の注目度）: 4.072903728718951
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Dynamic data race detectors are indispensable for flagging concurrency errors in software, but their high runtime overhead limits their adoption. This overhead stems primarily from pervasive instrumentation of memory accesses - a significant fraction of which is redundant. We addresses this inefficiency through a static, compiler-integrated approach that identifies and eliminates redundant instrumentation, drastically reducing the runtime cost of dynamic data race detectors. We introduce a suite of interprocedural static analyses reasoning about memory access patterns, synchronization, and thread creation to eliminate instrumentation for provably race-free accesses and show that the completeness properties of the data race detector are preserved. We further observe that many inserted checks flag a race if and only if a preceding check has already flagged an equivalent race for the same memory location - albeit potentially at a different access. We characterize this notion of equivalence and show that, when limiting reporting to at least one representative for each equivalence class, a further class of redundant checks can be eliminated. We identify such accesses using a novel dominance-based elimination analysis. Based on these two insights, we have implemented five static analyses within the LLVM, integrated with the instrumentation pass of the race detector ThreadSanitizer. Our experimental evaluation on a diverse suite of real-world applications demonstrates that our approach significantly reduces race detection overhead, achieving a geomean speedup of 1.34x, with peak speedups reaching 2.5x under high thread contention. This performance is achieved with a negligible increase in compilation time and, being fully automatic, places no additional burden on developers. Our optimizations have been accepted by the ThreadSanitizer maintainers and are in the process of being upstreamed.
Abstract（参考訳）: 動的データ競合検出器は、ソフトウェアにおける並行性エラーのフラグ付けには不可欠だが、その高いランタイムオーバーヘッドは採用を制限している。このオーバーヘッドは主にメモリアクセスの広範にわたる計測から生じており、その大部分は冗長である。我々は、動的データ競合検出器のランタイムコストを大幅に削減し、冗長なインスツルメンテーションを特定し、排除する静的なコンパイラ統合アプローチを通じて、この非効率に対処する。本稿では、メモリアクセスパターン、同期、スレッド生成を推論して、競合のないアクセスのためのインスツルメンテーションを確実に排除し、データ競合検出器の完全性特性が保存されていることを示す。さらに、多くの挿入されたチェックがレースにフラグを付けるのは、前回のチェックが同じメモリロケーションで同等のレースをフラグ付けしている場合に限りです。この等価性の概念を特徴付け、各等価性クラスの少なくとも1つの代表にレポートを限定する場合、さらに冗長なチェックのクラスを排除できることを示す。このようなアクセスを,新規な支配に基づく排除分析を用いて同定する。これら2つの知見に基づいて,レース検出器ThreadSanitizerの計測パスと統合したLLVM内に5つの静的解析を実装した。実世界の多種多様なアプリケーションに対する実験結果から,提案手法はレース検出のオーバーヘッドを大幅に低減し,最大速度は1.34倍,ピーク速度は2.5倍に達した。このパフォーマンスはコンパイル時間の無視できる増加によって達成され、完全に自動化されているため、開発者には余計な負担がかからない。私たちの最適化はThreadSanitizerメンテナによって受け入れられ、アップストリーム化のプロセスにあります。

関連論文リスト

Detecting Overflow in Compressed Token Representations for Retrieval-Augmented Generation [49.48204107529758]
我々はトークンオーバーフローを、圧縮された表現が与えられたクエリに応答する十分な情報を含んでいない状態として定義する。本稿では,非圧縮トークン表現から,クエリ非依存の飽和統計を確実に分離することを見出した。クエリとコンテキストの両方のxRAG表現上の軽量なプローブ分類器は平均0.72 AUC-ROCでオーバーフローを検出する。これらの結果は、クエリ非依存の診断からクエリ対応検出まで進歩し、低コストのプレLLMゲーティングにより、圧縮によるエラーを軽減できる。
論文参考訳（メタデータ） (2026-02-12T18:15:08Z)
Fast SAM2 with Text-Driven Token Pruning [52.8350457627401]
Segment Anything Model 2 (SAM2) では、視覚計算モデルがプロンプト駆動のビデオオブジェクトセグメンテーションにおいて大幅に進歩している。 SAM2パイプラインは、イメージエンコーダが生成するすべての視覚トークンを、ターゲットオブジェクトとの関係にかかわらず、下流の時間的推論モジュールを通じて伝達する。本稿では,時間的伝播に先立ってトークン密度を選択的に低減し,推論効率を向上させるためのテキスト誘導型トークンプルーニングフレームワークを提案する。
論文参考訳（メタデータ） (2025-12-24T18:59:05Z)
Sequential Testing for Descriptor-Agnostic LiDAR Loop Closure in Repetitive Environments [12.304166871828777]
逐次確率比テスト(SPRT)としてLiDARループクロージャを定式化する多フレームループクロージャ検証法を提案する。単一の記述子比較から決定したり、後期反復閉点(ICP)検証と固定しきい値を使用する代わりに、検証者はクエリと各候補間の記述子類似性の短い時間ストリームを蓄積する。この精度優先ポリシーは、構造的に反復的な屋内環境における偽陽性を抑制するように設計されている。
論文参考訳（メタデータ） (2025-12-10T09:20:09Z)
Data Race Detection by Digest-Driven Abstract Interpretation (Extended Version) [4.3994959886619185]
音の静的解析は、2つの競合するメモリアクセスが同時に発生しないことを確立することで、データ競合がないことを証明することができる。我々はダイジェストを使用して、競合するアクセスが並列に起こらない状況を把握する。本稿では,静的解析器Goblintにおけるダイジェスト駆動型データ競合検出の実装について報告し,SV-COMPベンチマークスイートで評価する。
論文参考訳（メタデータ） (2025-11-14T08:11:31Z)
vCache: Verified Semantic Prompt Caching [95.16654660556975]
本稿では,ユーザ定義エラー率保証を備えた最初の検証済みセマンティックキャッシュであるvCacheを提案する。オンライン学習アルゴリズムを使用して、キャッシュされたプロンプト毎に最適な閾値を推定し、追加のトレーニングなしで信頼性の高いキャッシュ応答を可能にする。我々の実験によると、vCacheは特定のエラー境界を一貫して満たし、最先端の静的な閾値と微調整された埋め込みベースラインより優れています。
論文参考訳（メタデータ） (2025-02-06T04:16:20Z)
PARIS: A Practical, Adaptive Trace-Fetching and Real-Time Malicious Behavior Detection System [6.068607290592521]
本稿では,適応的トレースフェッチ,軽量かつリアルタイムな悪意ある行動検出システムを提案する。具体的には、Event Tracing for Windows (ETW)で悪意ある振る舞いを監視し、悪意のあるAPIやコールスタックを選択的に収集することを学ぶ。その結果、より広い範囲のAPIを監視し、より複雑な攻撃行動を検出することができる。
論文参考訳（メタデータ） (2024-11-02T14:52:04Z)
Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文参考訳（メタデータ） (2024-03-27T15:15:14Z)
RelationTrack: Relation-aware Multiple Object Tracking with Decoupled Representation [3.356734463419838]
既存のオンラインマルチオブジェクトトラッキング(MOT)アルゴリズムは、しばしば2つのサブタスク、検出および再識別(ReID)で構成されています。推論速度を高め、複雑さを減らすために、現在のメソッドは一般的にこれらの二重サブタスクを統一されたフレームワークに統合します。学習した表現を検出特異的およびReID固有の埋め込みに分離するGlobal Context Disentangling(GCD)というモジュールを考案した。この制約を解決するために,トランスコーダの強力な推論能力と変形可能な注意を組み合わせることで,誘導トランス(gte)と呼ばれるモジュールを開発した。
論文参考訳（メタデータ） (2021-05-10T13:00:40Z)
SegmentMeIfYouCan: A Benchmark for Anomaly Segmentation [111.61261419566908]
ディープニューラルネットワーク(DNN)は通常、閉集合のセマンティッククラスで訓練される。未発見のオブジェクトを扱うには不備だ。このような物体の検出と局在化は、自動運転の認識などの安全クリティカルなアプリケーションに不可欠です。
論文参考訳（メタデータ） (2021-04-30T07:58:19Z)
Target-Aware Object Discovery and Association for Unsupervised Video Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。より正確で効率的な時間区分のための新しいアプローチを紹介します。 DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2021-04-10T14:39:44Z)
Joint Detection and Tracking in Videos with Identification Features [36.55599286568541]
本稿では,ビデオ検出,追跡,再識別機能の最初の共同最適化を提案する。提案手法はMOTの最先端に到達し,オンライントラッカーにおけるUA-DETRAC'18追跡課題のうち,第1位,第3位にランクインした。
論文参考訳（メタデータ） (2020-05-21T21:06:40Z)
EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文参考訳（メタデータ） (2020-02-18T08:04:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。