Fugu-MT 論文翻訳(概要): Linked Array Tree: A Constant-Time Search Structure for Big Data

論文の概要: Linked Array Tree: A Constant-Time Search Structure for Big Data

arxiv url: http://arxiv.org/abs/2504.00828v1
Date: Tue, 01 Apr 2025 14:15:55 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-03 15:43:09.124801
Title: Linked Array Tree: A Constant-Time Search Structure for Big Data
Title（参考訳）: Linked Array Tree:ビッグデータの定時間検索構造
Authors: Songpeng Liu,
Abstract要約: Linked Array Tree (LAT) は、検索、挿入、削除操作の時間的複雑さを実現するために設計された新しいデータ構造である。 LATの低メモリオーバーヘッドとポインタ重構造の回避は、大規模かつ集中的なワークロードに適しています。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As data volumes continue to grow rapidly, traditional search algorithms, like the red-black tree and B+ Tree, face increasing challenges in performance, especially in big data scenarios with intensive storage access. This paper presents the Linked Array Tree (LAT), a novel data structure designed to achieve constant-time complexity for search, insertion, and deletion operations. LAT leverages a sparse, non-moving hierarchical layout that enables direct access paths without requiring rebalancing or data movement. Its low memory overhead and avoidance of pointer-heavy structures make it well-suited for large-scale and intensive workloads. While not specifically tested under parallel or concurrent conditions, the structure's static layout and non-interfering operations suggest potential advantages in such environments. This paper first introduces the structure and algorithms of LAT, followed by a detailed analysis of its time complexity in search, insertion, and deletion operations. Finally, it presents experimental results across both data-intensive and sparse usage scenarios to evaluate LAT's practical performance.
Abstract（参考訳）: データボリュームが急速に増加するにつれて、レッドブラックツリーやB+ツリーのような従来の検索アルゴリズムは、特にストレージアクセスが集中したビッグデータシナリオにおいて、パフォーマンス上の課題に直面する。本稿では,検索,挿入,削除操作の時間的複雑さを実現するために設計された新しいデータ構造であるLinked Array Tree(LAT)を提案する。 LATは、疎結合やデータ移動を必要とせずに直接アクセスパスを可能にする、非移動階層レイアウトを利用する。メモリオーバーヘッドの低減とポインタ重構造の回避により、大規模かつ集中的なワークロードに適している。並列または並列条件下では特にテストされていないが、構造体の静的レイアウトと非干渉操作は、そのような環境において潜在的な利点を示唆している。本稿では,LATの構造とアルゴリズムをまず紹介し,検索,挿入,削除操作における時間的複雑さを詳細に分析する。最後に、データ集約的およびスパースな使用シナリオにまたがる実験結果を示し、LATの実用性能を評価する。

関連論文リスト

FlashResearch: Real-time Agent Orchestration for Efficient Deep Research [62.03819662340356]
FlashResearchは効率的なディープリサーチのための新しいフレームワークです。シーケンシャル処理を並列なランタイムオーケストレーションに変換する。同等のクオリティを維持しつつ、最大5倍のスピードアップを提供できる。
論文参考訳（メタデータ） (2025-10-02T00:15:39Z)
ELITE: Embedding-Less retrieval with Iterative Text Exploration [5.8851517822935335]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。長期のコンテキスト制約を維持する能力は、ドキュメントレベルやマルチターンタスクのパフォーマンスを制限します。
論文参考訳（メタデータ） (2025-05-17T08:48:43Z)
ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文参考訳（メタデータ） (2025-02-11T21:35:13Z)
Efficient Long Context Language Model Retrieval with Compression [57.09163579304332]
情報検索のための新しいパラダイムとしてLong Context Language Models (LCLM)が登場した。本稿では,LCLM検索に適した新しい圧縮手法を提案する。また,CoLoRはテキスト内サイズを1.91倍に圧縮し,検索性能を6%向上することを示した。
論文参考訳（メタデータ） (2024-12-24T07:30:55Z)
Score-matching-based Structure Learning for Temporal Data on Networks [17.166362605356074]
因果発見は経験的データと背景知識から因果関係を確立するための重要な第一歩である。現在のスコアマッチングベースのアルゴリズムは、主に独立および同一に分散された(d.d.)データを分析するために設計されている。我々はDAGの葉ノードのための新しい親フィンディングサブルーチンを開発し、プロセスの最も時間を要する部分である刈り込みステップを著しく加速した。
論文参考訳（メタデータ） (2024-12-10T12:36:35Z)
KV Cache Compression, But What Must We Give in Return? A Comprehensive Benchmark of Long Context Capable Approaches [52.02764371205856]
長期の文脈能力は、大規模言語モデル(LLM)にとって重要な能力であるこの研究は、現在の手法の分類を提供し、長いコンテキストタスクの7つのカテゴリにまたがる10以上の最先端のアプローチを評価する。
論文参考訳（メタデータ） (2024-07-01T17:59:47Z)
LiteSearch: Efficacious Tree Search for LLM [70.29796112457662]
本研究では,動的ノード選択とノードレベルの探索予算を備えた新しいガイド付き木探索アルゴリズムを提案する。 GSM8KおよびTabMWPデータセットを用いて行った実験により,本手法はベースライン法に比べて計算コストが大幅に低いことを示した。
論文参考訳（メタデータ） (2024-06-29T05:14:04Z)
Learning-Augmented Search Data Structures [14.015114340879544]
本研究では,効率的な検索クエリのために設計された従来のデータ構造を改善するために,機械学習アドバイスの統合について検討する。スキップリストとKDツリーを構築し、2倍近い確率で最適な探索時間を提供する。実際、我々の学習強化されたスキップリストとKDツリーは、たとえオラクルが一定要素内でのみ正確であっても、まだ一定要素まで最適である。
論文参考訳（メタデータ） (2024-02-16T05:27:13Z)
Autoregressive Search Engines: Generating Substrings as Document Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文参考訳（メタデータ） (2022-04-22T10:45:01Z)
Exploring Complicated Search Spaces with Interleaving-Free Sampling [127.07551427957362]
本稿では,長距離接続を伴う複雑な検索空間上に探索アルゴリズムを構築する。我々はtextbfIF-NAS という単純なアルゴリズムを提案し、異なるサブネットワークを構築するために周期的なサンプリング戦略を実行する。提案した探索空間において、IF-NASはランダムサンプリングと従来の重み付け検索のアルゴリズムを有意差で上回っている。
論文参考訳（メタデータ） (2021-12-05T06:42:48Z)
A Hierarchical Approach to Scaling Batch Active Search Over Structured Data [0.5076419064097732]
本稿では,能動探索を大規模なバッチサイズに拡張するために,帯域幅アルゴリズムに基づく汎用階層型フレームワークを提案する。 HBBSの応用は、大規模なバッチ実験が研究プロセスに欠かせない現代生物学に重点を置いている。
論文参考訳（メタデータ） (2020-07-20T16:50:25Z)
Succinct Trit-array Trie for Scalable Trajectory Similarity Search [3.2197141014728805]
膨大なトラジェクトリの集合の類似性探索は、これらのデータセットを知識に変えるのに不可欠である。この問題に対処するため, トラジェクトリトアレイトリエ (tSTAT) のトラジェクトリ・インデクシングについて述べる。 tSTATは,最先端の類似性探索法と比較して優れた性能を示す。
論文参考訳（メタデータ） (2020-05-21T21:42:30Z)
Progressively Pretrained Dense Corpus Index for Open-Domain Question Answering [87.32442219333046]
本稿では,段落エンコーダを事前学習するための簡易かつ資源効率の高い手法を提案する。本手法は,事前学習に7倍の計算資源を使用する既存の高密度検索法より優れている。
論文参考訳（メタデータ） (2020-04-30T18:09:50Z)
Qd-tree: Learning Data Layouts for Big Data Analytics [33.07610112749939]
本稿では、クエリデータルーティングツリー(qd-tree)と呼ばれる新しいフレームワークを提案し、この問題に対処する。実験により、qd木は現在のブロッキング方式と比較して1桁以上の物理的スピードアップを提供できることが示された。
論文参考訳（メタデータ） (2020-04-22T23:42:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。