Fugu-MT 論文翻訳(概要): Accelerating Code Search with Deep Hashing and Code Classification

論文の概要: Accelerating Code Search with Deep Hashing and Code Classification

arxiv url: http://arxiv.org/abs/2203.15287v1
Date: Tue, 29 Mar 2022 07:05:30 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-30 16:46:17.118588
Title: Accelerating Code Search with Deep Hashing and Code Classification
Title（参考訳）: ディープハッシュとコード分類によるコード検索の高速化
Authors: Wenchao Gu, Yanlin Wang, Lun Du, Hongyu Zhang, Shi Han, Dongmei Zhang, and Michael R. Lyu
Abstract要約: コード検索とは、自然言語クエリに基づいてソースコードコーパスから再利用可能なコードスニペットを検索することである。深層ハッシュとコード分類を用いたコード検索を高速化する新しい手法CoSHCを提案する。
参考スコア（独自算出の注目度）: 64.3543949306799
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Code search is to search reusable code snippets from source code corpus based on natural languages queries. Deep learning-based methods of code search have shown promising results. However, previous methods focus on retrieval accuracy but lacked attention to the efficiency of the retrieval process. We propose a novel method CoSHC to accelerate code search with deep hashing and code classification, aiming to perform an efficient code search without sacrificing too much accuracy. To evaluate the effectiveness of CoSHC, we apply our method to five code search models. Extensive experimental results indicate that compared with previous code search baselines, CoSHC can save more than 90% of retrieval time meanwhile preserving at least 99% of retrieval accuracy.
Abstract（参考訳）: コード検索は、自然言語クエリに基づいてソースコードコーパスから再利用可能なコードスニペットを検索する。深層学習に基づくコード検索手法は有望な結果を示している。しかし,従来の手法は検索精度に重点を置いていたが,検索効率に注意が払わなかった。本研究では,コード探索の精度を犠牲にすることなく,効率的なコード探索を実現することを目的とした,ディープハッシュとコード分類によるコード探索を高速化する新しい手法であるcoshcを提案する。 CoSHCの有効性を評価するため,提案手法を5つのコード検索モデルに適用した。その結果,CoSHCは検索時間の90%以上を節約できる一方で,検索精度の99%は保存できることがわかった。

関連論文リスト

SECRET: Towards Scalable and Efficient Code Retrieval via Segmented Deep Hashing [83.35231185111464]
ディープラーニングは、検索パラダイムを語彙ベースのマッチングから、ソースコードとクエリをベクトル表現にエンコードした。従来の研究では、クエリやコードスニペットのハッシュコードを生成し、ハミング距離を使ってコード候補を高速にリコールするディープハッシュベースの手法が提案されている。提案手法は,既存の深層ハッシュ法によって計算された長いハッシュコードを,反復的学習戦略により複数の短いハッシュコードセグメントに変換する手法である。
論文参考訳（メタデータ） (2024-12-16T12:51:35Z)
RethinkMCTS: Refining Erroneous Thoughts in Monte Carlo Tree Search for Code Generation [65.5353313491402]
本稿では,モンテカルロ木探索(MCTS)アルゴリズムを用いて,コードを生成する前に思考レベルの探索を行うRethinkMCTSを紹介する。我々は,検索中の誤った思考を洗練させるために,微動コード実行フィードバックからの言語フィードバックを構築した。 RethinkMCTSは従来の検索ベースおよびフィードバックベースのコード生成ベースラインよりも優れていることを実証する。
論文参考訳（メタデータ） (2024-09-15T02:07:28Z)
Revisiting Code Search in a Two-Stage Paradigm [67.02322603435628]
TOSSは2段階のフュージョンコード検索フレームワークである。まずIRベースのバイエンコーダモデルを使用して、少数のトップkコード候補を効率的にリコールする。その後、より微細なクロスエンコーダを使用してランク付けを行う。
論文参考訳（メタデータ） (2022-08-24T02:34:27Z)
Enhancing Semantic Code Search with Multimodal Contrastive Learning and Soft Data Augmentation [50.14232079160476]
コード検索のためのマルチモーダルコントラスト学習とソフトデータ拡張を用いた新しい手法を提案する。我々は,6つのプログラミング言語を用いた大規模データセットにおけるアプローチの有効性を評価するために,広範囲な実験を行った。
論文参考訳（メタデータ） (2022-04-07T08:49:27Z)
Search4Code: Code Search Intent Classification Using Weak Supervision [5.441318460204245]
本稿では,C# および Java プログラミング言語の検索クエリにおけるコード検索意図を検出するための弱監督に基づくアプローチを提案する。我々は,BingのWeb検索エンジンから100万以上のクエリをマイニングした実世界のデータセット上で,いくつかのベースラインに対するアプローチを評価する。また、BingのWeb検索エンジンから抽出されたコード検索クエリの大規模なリアルタイムデータセットであるSearch4Codeもリリースしています。
論文参考訳（メタデータ） (2020-11-24T08:06:53Z)
CoNCRA: A Convolutional Neural Network Code Retrieval Approach [0.0]
本稿では,コード検索のための畳み込みニューラルネットワーク手法を提案する。私たちの技術は、自然言語で表現された開発者の意図に最も近いコードスニペットを見つけることを目的としています。 Stack Overflowから収集した質問やコードスニペットからなるデータセットに対して,このアプローチの有効性を評価した。
論文参考訳（メタデータ） (2020-09-03T23:38:52Z)
Neural Code Search Revisited: Enhancing Code Snippet Retrieval through Natural Language Intent [1.1168121941015012]
コードスニペットの意図をよりよく把握するために,記述を活用することで,コード検索システムを改善する方法について検討する。翻訳学習と自然言語処理の最近の進歩に基づき,自然言語記述を付加したコードに対するドメイン固有検索モデルを構築した。
論文参考訳（メタデータ） (2020-08-27T15:39:09Z)
Faster Person Re-Identification [68.22203008760269]
本稿では,新しいハッシュコード検索戦略を定式化することによって,高速ReIDのための新しいソリューションを提案する。より短いコードを使用して、より正確なReIDのいくつかのトップ候補を洗練するために、より広い一致の類似性を粗くランク付けし、より長いコードを使用する。 2つのデータセットに対する実験結果から,提案手法(CtF)は現在のハッシュReID法よりも8%精度が高いだけでなく,5倍高速であることがわかった。
論文参考訳（メタデータ） (2020-08-16T03:02:49Z)
Progressively Pretrained Dense Corpus Index for Open-Domain Question Answering [87.32442219333046]
本稿では,段落エンコーダを事前学習するための簡易かつ資源効率の高い手法を提案する。本手法は,事前学習に7倍の計算資源を使用する既存の高密度検索法より優れている。
論文参考訳（メタデータ） (2020-04-30T18:09:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。