Fugu-MT 論文翻訳(概要): Multi-line AI-assisted Code Authoring

論文の概要: Multi-line AI-assisted Code Authoring

arxiv url: http://arxiv.org/abs/2402.04141v1
Date: Tue, 6 Feb 2024 16:48:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-07 13:51:59.196583
Title: Multi-line AI-assisted Code Authoring
Title（参考訳）: マルチラインAI支援コードオーサリング
Authors: Omer Dunay and Daniel Cheng and Adam Tait and Parth Thakkar and Peter C Rigby and Andy Chiu and Imad Ahmad and Arun Ganesan and Chandra Maddila and Vijayaraghavan Murali and Ali Tayyebi and Nachiappan Nagappan
Abstract要約: 単行提案から複数行提案まで、プロダクトのスケール方法を紹介します。 LLMの提案は、開発者の既存のコードの周りを常に動き回っているので、マルチラインの提案がどのように"ジャリング"効果を持つのかについて議論する。私たちは、マルチライン提案がユーザエクスペリエンスに与える影響を理解するために、10人のエンジニアで実験を行います。
参考スコア（独自算出の注目度）: 10.162609177132914
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: CodeCompose is an AI-assisted code authoring tool powered by large language models (LLMs) that provides inline suggestions to 10's of thousands of developers at Meta. In this paper, we present how we scaled the product from displaying single-line suggestions to multi-line suggestions. This evolution required us to overcome several unique challenges in improving the usability of these suggestions for developers. First, we discuss how multi-line suggestions can have a 'jarring' effect, as the LLM's suggestions constantly move around the developer's existing code, which would otherwise result in decreased productivity and satisfaction. Second, multi-line suggestions take significantly longer to generate; hence we present several innovative investments we made to reduce the perceived latency for users. These model-hosting optimizations sped up multi-line suggestion latency by 2.5x. Finally, we conduct experiments on 10's of thousands of engineers to understand how multi-line suggestions impact the user experience and contrast this with single-line suggestions. Our experiments reveal that (i) multi-line suggestions account for 42% of total characters accepted (despite only accounting for 16% for displayed suggestions) (ii) multi-line suggestions almost doubled the percentage of keystrokes saved for users from 9% to 17%. Multi-line CodeCompose has been rolled out to all engineers at Meta, and less than 1% of engineers have opted out of multi-line suggestions.
Abstract（参考訳）: CodeComposeは、大規模言語モデル(LLM)を活用したAI支援のコードオーサリングツールで、Metaの10万人の開発者にインライン提案を提供する。本稿では,単一行の提案表示から複数行の提案まで,製品のスケールアップ方法について述べる。この進化によって、開発者のためにこれらの提案のユーザビリティを改善する上で、いくつかのユニークな課題を克服する必要がありました。まず、LLMの提案が開発者の既存のコードの周りを常に動き回っており、そうでなければ生産性と満足度が低下します。第2に、マルチラインの提案は、生成にかなり時間がかかるため、ユーザによるレイテンシの認識を減らすために、いくつかの革新的な投資を行いました。これらのモデルホスト最適化により、複数行提案遅延が2.5倍になった。最後に,マルチライン提案がユーザエクスペリエンスに与える影響を理解し,これをシングルライン提案と対比するために,10万のエンジニアを対象に実験を行った。私たちの実験は (i)受理された文字の42%が複数行の提案である(ただし表示された提案は16%) (ii)複数行の提案により、9%から17%のユーザが保存したキーストロークの割合がほぼ倍増した。マルチラインのCodeComposeはMetaの全エンジニアに展開されており、エンジニアの1%未満がマルチラインの提案をオプトアウトしている。

関連論文リスト

Boosting Offline Optimizers with Surrogate Sensitivity [8.750390242872138]
オフライン最適化は、オンライン実験が高価すぎる多くの材料工学領域において重要であり、ブラックボックス関数のシリコサロゲートに置き換えられる必要がある。このようなサロゲートはオフラインデータから学ぶことができるが、その予測はオフラインデータ体制以外では信頼性がないかもしれない。 1)サロゲートモデルの感度をどうやって調節するか、(2)そのようなサロゲートで表現されたオフラインインフォームがより良いパフォーマンスをもたらすかどうか。
論文参考訳（メタデータ） (2025-03-06T07:50:32Z)
TETRIS: Optimal Draft Token Selection for Batch Speculative Decoding [76.23719557942917]
TETRISは、(バッチ内のすべてのリクエストに対して)最も有望なドラフトトークンを積極的に選択する。我々は,TETRISがベースライン投機的復号法およびドラフトトークンを動的に選択する既存手法より優れていることを理論的かつ実証的に示す。
論文参考訳（メタデータ） (2025-02-21T04:19:24Z)
Multi-expert Prompting Improves Reliability, Safety, and Usefulness of Large Language Models [75.44218111729442]
本稿では,大規模言語モデル(LLM)生成を改善するために,Promptingの新たな拡張であるMulti-expert Promptingを提案する。具体的には、複数の専門家をシミュレートし、応答を集約し、個々のレスポンスと集約されたレスポンスの中で最高のものを選択することで、入力命令を満たすようLLMを誘導する。評価の結果, マルチエキスパート・プロンプトは, 毒性や傷害を低減しつつ, 真理性, 事実性, 情報性, 応答の有用性を高める上で, エキスパート・プロンプトと同等のベースラインを著しく上回っていることがわかった。
論文参考訳（メタデータ） (2024-11-01T10:06:52Z)
Towards Realistic Evaluation of Commit Message Generation by Matching Online and Offline Settings [77.20838441870151]
コミットメッセージ生成は、ソフトウェアエンジニアリングにおいて重要なタスクであり、正しく評価することが難しい。オンラインメトリック - VCSに生成されたメッセージをコミットする前にユーザが導入する編集回数 - を使用して、オフライン実験用のメトリクスを選択します。その結果,編集距離が最も高い相関を示すのに対し,BLEUやMETEORなどの類似度は低い相関を示すことがわかった。
論文参考訳（メタデータ） (2024-10-15T20:32:07Z)
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation [18.39379838806384]
本稿では,CriSPO(Prompt Optimization)アプローチを提案する。 CriSPO はコアコンポーネントとして critique-suggestion モジュールを導入している。このモジュールは自然にアスペクトを発見し、これらのアスペクト間で生成された参照テキストを比較し、即時修正のための実行可能な提案を提供する。マルチメトリック最適化によりCrisPOをさらに改善するため、複数のメトリクスにわたるタスクプロンプトのパフォーマンスを向上させるために、自動サフィックスチューニング(AST)拡張を導入する。
論文参考訳（メタデータ） (2024-10-03T17:57:01Z)
Ducho meets Elliot: Large-scale Benchmarks for Multimodal Recommendation [9.506245109666907]
商品やサービスを特徴付ける多面的機能は、オンライン販売プラットフォームにおいて、各顧客に影響を与える可能性がある。一般的なマルチモーダルレコメンデーションパイプラインは、(i)マルチモーダルな特徴の抽出、(ii)レコメンデーションタスクに適したハイレベルな表現の精製、(iv)ユーザイテムスコアの予測を含む。本論文は,マルチモーダルレコメンデータシステムに対する大規模ベンチマークを行う最初の試みとして,特にマルチモーダル抽出器に着目したものである。
論文参考訳（メタデータ） (2024-09-24T08:29:10Z)
A Decoding Acceleration Framework for Industrial Deployable LLM-based Recommender Systems [49.588316022381385]
本稿では,LLMベースのレコメンデーション(DARE)のためのデコード高速化フレームワークを提案し,検索効率を向上させるためのカスタマイズされた検索プールと,ドラフトトークンの受け入れ率を高めるための緩和検証を提案する。 DAREは大規模な商用環境でのオンライン広告シナリオにデプロイされ、ダウンストリームのパフォーマンスを維持しながら3.45倍のスピードアップを実現している。
論文参考訳（メタデータ） (2024-08-11T02:31:13Z)
Design2Code: Benchmarking Multimodal Code Generation for Automated Front-End Engineering [74.99736967448423]
私たちは、このタスクのための最初の実世界のベンチマークであるDesign2Codeを構築します。テストケースとして484の多様な実世界のWebページを手作業でキュレートし、自動評価指標のセットを開発する。我々の詳細なブレークダウンメトリクスは、入力されたWebページから視覚要素をリコールし、正しいレイアウト設計を生成するモデルがほとんど遅れていることを示している。
論文参考訳（メタデータ） (2024-03-05T17:56:27Z)
CAViaR: Context Aware Video Recommendations [0.0]
本稿では,低多様性が個々の項目に対するユーザのエンゲージメントに与える影響をモデル化し,多様性を導入する手法を提案する。提案手法は,既存の大規模レコメンデータシステムに簡単にプラグインできるように設計されている。
論文参考訳（メタデータ） (2023-04-17T16:56:23Z)
Efficient Online Reinforcement Learning with Offline Data [78.92501185886569]
オンライン学習時にオフラインデータを活用するために、既存のオフライン手法を単純に適用できることを示します。私たちはこれらの設計選択を広範囲に改善し、パフォーマンスに最も影響を与える重要な要因を示します。これらのシンプルなレコメンデーションの正しい適用によって、既存のアプローチよりも$mathbf2.5times$の改善が得られます。
論文参考訳（メタデータ） (2023-02-06T17:30:22Z)
Multi-Task Fusion via Reinforcement Learning for Long-Term User Satisfaction in Recommender Systems [3.4394890850129007]
バッチ強化学習に基づくマルチタスク融合フレームワーク(BatchRL-MTF)を提案する。我々は、長期ユーザー満足のために、固定バッチデータから最適なレコメンデーションポリシーをオフラインで学習する。ユーザの行動に関する包括的調査により,ユーザの定着度とユーザ活動性の2つの側面から,ユーザ満足度報酬を微妙にモデル化する。
論文参考訳（メタデータ） (2022-08-09T06:35:05Z)
Do Offline Metrics Predict Online Performance in Recommender Systems? [79.48653445643865]
6つのシミュレーション環境におけるレコメンデータの評価により,オフラインメトリクスがオンラインのパフォーマンスを予測する程度について検討した。オフラインメトリクスは、様々な環境におけるオンラインのパフォーマンスと相関している。本研究は,探索戦略の追加による影響について検討し,その有効性はレコメンデーションアルゴリズムに大きく依存していることを示す。
論文参考訳（メタデータ） (2020-11-07T01:41:13Z)
RNE: A Scalable Network Embedding for Billion-scale Recommendation [21.6366085346674]
データ効率のよいレコメンデーションベースのネットワーク埋め込み手法であるRNEを提案し、ユーザに対してパーソナライズされた多様なアイテムを提供する。一方,提案手法は,ユーザの関心の多様性と動的特性をモデル化し,推薦品質を高めるとともに,ユーザとアイテム間の局所的な構造を維持できる。当社は、中国最大のEコマースプラットフォームであるTaobaoのレコメンデーションシナリオにRNEをデプロイし、それを10億規模のユーザテムグラフでトレーニングしています。
論文参考訳（メタデータ） (2020-03-10T07:08:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。