論文の概要: Impact of Data-Oriented and Object-Oriented Design on Performance and Cache Utilization with Artificial Intelligence Algorithms in Multi-Threaded CPUs
- arxiv url: http://arxiv.org/abs/2512.07841v1
- Date: Sat, 22 Nov 2025 17:48:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 04:16:52.504377
- Title: Impact of Data-Oriented and Object-Oriented Design on Performance and Cache Utilization with Artificial Intelligence Algorithms in Multi-Threaded CPUs
- Title(参考訳): マルチスレッドCPUにおけるデータ指向設計とオブジェクト指向設計が人工知能アルゴリズムの性能とキャッシュ利用に及ぼす影響
- Authors: Gabriel M. Arantes, Richard F. Pinto, Bruno L. Dalmazo, Eduardo N. Borges, Giancarlo Lucca, Viviane L. D. de Mattos, Fabian C. Cardoso, Rafael A. Berri,
- Abstract要約: 本研究は,データ指向設計(DOD)と従来のオブジェクト指向設計(OOD)の総合的なパフォーマンス解析を提供する。
評価は実行時間、メモリ使用量、CPUキャッシュミスなどのメトリクスに基づいて行われた。
我々は、複雑な大規模AIおよび並列コンピューティングタスクにおいて、ハードウェア効率を最大化するためのより効果的なアプローチである、と結論付けている。
- 参考スコア(独自算出の注目度): 0.5410454963232194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing performance gap between multi-core CPUs and main memory necessitates hardware-aware software design paradigms. This study provides a comprehensive performance analysis of Data Oriented Design (DOD) versus the traditional Object-Oriented Design (OOD), focusing on cache utilization and efficiency in multi-threaded environments. We developed and compared four distinct versions of the A* search algorithm: single-threaded OOD (ST-OOD), single-threaded DOD (ST-DOD), multi-threaded OOD (MT-OOD), and multi-threaded DOD (MT-DOD). The evaluation was based on metrics including execution time, memory usage, and CPU cache misses. In multi-threaded tests, the DOD implementation demonstrated considerable performance gains, with faster execution times and a lower number of raw system calls and cache misses. While OOD occasionally showed marginal advantages in memory usage or percentage-based cache miss rates, DOD's efficiency in data-intensive operations was more evident. Furthermore, our findings reveal that for a fine-grained task like the A* algorithm, the overhead associated with thread management led to single-threaded versions significantly outperforming their multi-threaded counterparts in both paradigms. We conclude that even when performance differences appear subtle in simple algorithms, the consistent advantages of DOD in critical metrics highlight its foundational architectural superiority, suggesting it is a more effective approach for maximizing hardware efficiency in complex, large-scale AI and parallel computing tasks.
- Abstract(参考訳): マルチコアCPUとメインメモリの間のパフォーマンスギャップは、ハードウェアを意識したソフトウェア設計パラダイムを必要とする。
本研究では,データ指向設計(DOD)と従来のオブジェクト指向設計(OOD)の総合的なパフォーマンス解析を行い,マルチスレッド環境におけるキャッシュ利用と効率性に着目した。
我々は、A*検索アルゴリズムの4つの異なるバージョン、シングルスレッドOD(ST-OOD)、シングルスレッドOD(ST-DOD)、マルチスレッドOD(MT-OOD)、マルチスレッドOD(MT-DOD)を開発した。
評価は実行時間、メモリ使用量、CPUキャッシュミスなどのメトリクスに基づいて行われた。
マルチスレッドテストでは、DODの実装は実行時間を短縮し、生のシステムコールやキャッシュミスの数が少なくなるなど、大幅なパフォーマンス向上を示した。
OODは時折メモリ使用率やパーセンテージベースのキャッシュミス率に限界的優位性を示したが、データ集約操作におけるDODの効率性はより明確であった。
さらに,A*アルゴリズムのようなきめ細かいタスクでは,スレッド管理に伴うオーバーヘッドが,マルチスレッドバージョンを両パラダイムで著しく上回る結果となった。
我々は、単純なアルゴリズムで性能の違いが微妙に見えるとしても、重要なメトリクスにおけるDODの一貫性のあるアドバンテージは、その基本的なアーキテクチャ上の優位性を強調し、複雑な大規模AIおよび並列コンピューティングタスクにおいて、ハードウェア効率を最大化するためのより効果的なアプローチであることを示唆している。
関連論文リスト
- Log-Augmented Generation: Scaling Test-Time Reasoning with Reusable Computation [80.69067017594709]
大規模言語モデル(LLM)とそのエージェントモデルは、以前のタスクからの推論を維持するのに苦労する。
本稿では,従来の計算を直接再利用し,テスト時に過去のログから推論する新しいフレームワークであるLAGを提案する。
本手法は,ログを使用しない標準的なエージェントシステムよりも優れている。
論文 参考訳(メタデータ) (2025-05-20T14:14:38Z) - DAOP: Data-Aware Offloading and Predictive Pre-Calculation for Efficient MoE Inference [14.676716521856813]
Mixture-of-Experts (MoE)モデルは、メモリ制限されたデバイスにおいて、重大なデプロイメント上の課題に直面している。
並列GPU-CPU実行を最適化するデバイス上でのMoE推論エンジンである presentP を提案する。
Pは従来のエキスパートキャッシングとプリフェッチの手法を最大8.20倍、オフロード技術は1.35倍、精度は維持する。
論文 参考訳(メタデータ) (2024-12-16T07:59:21Z) - A Pairwise Comparison Relation-assisted Multi-objective Evolutionary Neural Architecture Search Method with Multi-population Mechanism [56.09418231453024]
ニューラルアーキテクチャサーチ(NAS)により、研究者は広大なサーチスペースを自動的に探索し、効率的なニューラルネットワークを見つけることができる。
NASは重要なボトルネックに悩まされており、探索プロセス中に多くのアーキテクチャを評価する必要がある。
SMEM-NASは,多集団構造に基づく相互比較比較支援型多目的進化アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-22T12:46:22Z) - EffiPerception: an Efficient Framework for Various Perception Tasks [6.1522068855729755]
EffiPerceptionは、一般的な学習パターンを探求し、モジュールを増やすためのフレームワークである。
複数の知覚タスクにおいて比較的低いメモリコストで、高い精度のロバスト性を実現することができる。
EffiPerceptionは4つの検出およびセグメンテーションタスクにおいて、精度-メモリ全体のパフォーマンスが大幅に向上する可能性がある。
論文 参考訳(メタデータ) (2024-03-18T23:22:37Z) - Real-Time Image Segmentation via Hybrid Convolutional-Transformer Architecture Search [51.89707241449435]
本稿では,高分解能表現CNNにマルチヘッド自己認識を効率よく組み込むという課題に対処する。
本稿では,高解像度機能の利点をフル活用したマルチターゲットマルチブランチ・スーパーネット手法を提案する。
本稿では,Hybrid Convolutional-Transformer Architecture Search (HyCTAS)法を用いて,軽量畳み込み層とメモリ効率のよい自己保持層を最適に組み合わせたモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T15:47:54Z) - IM-IAD: Industrial Image Anomaly Detection Benchmark in Manufacturing [88.35145788575348]
画像異常検出(英: Image Anomaly Detection、IAD)は、産業用コンピュータビジョンの課題である。
統一IMベンチマークの欠如は、現実世界のアプリケーションにおけるIADメソッドの開発と利用を妨げる。
7つの主要なデータセットに19のアルゴリズムを含む包括的画像異常検出ベンチマーク(IM-IAD)を構築した。
論文 参考訳(メタデータ) (2023-01-31T01:24:45Z) - NAS-LID: Efficient Neural Architecture Search with Local Intrinsic
Dimension [37.04463309816036]
ワンショットアーキテクチャサーチ (NAS) は、1つのスーパーネットをトレーニングして全ての子アーキテクチャーを推定することにより、探索効率を大幅に向上させる。
NASBench-201の実験は、NAS-LIDが優れた効率で優れた性能を発揮することを示している。
論文 参考訳(メタデータ) (2022-11-23T08:08:17Z) - An Efficiency Study for SPLADE Models [5.725475501578801]
本稿では,SPLADEモデルの効率向上に焦点をあてる。
本稿では、クエリのL1正規化、ドキュメント/エンコーダの分離、FLOPS正規化ミドルトレーニング、高速なクエリエンコーダの使用など、いくつかの手法を提案する。
論文 参考訳(メタデータ) (2022-07-08T11:42:05Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。