論文の概要: When to Show a Suggestion? Integrating Human Feedback in AI-Assisted Programming
- arxiv url: http://arxiv.org/abs/2306.04930v3
- Date: Mon, 22 Apr 2024 04:12:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 01:12:24.679681
- Title: When to Show a Suggestion? Integrating Human Feedback in AI-Assisted Programming
- Title(参考訳): 提案をいつ提示するか?AI支援プログラミングにおける人間のフィードバックの統合
- Authors: Hussein Mozannar, Gagan Bansal, Adam Fourney, Eric Horvitz,
- Abstract要約: 我々は、プログラマの受け入れやコード提案の拒否に関する信号を活用するメカニズムを追求し、レコメンデーションをガイドする。
我々は、表示を控えるよりも提示する提案について決定を下すためのユーティリティ理論フレームワークを導入する。
人間のフィードバックからの条件付き提案表示は、推奨コードが受け入れられる可能性を提供するモデルのカスケードに依存します。
- 参考スコア(独自算出の注目度): 28.254978977288868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI powered code-recommendation systems, such as Copilot and CodeWhisperer, provide code suggestions inside a programmer's environment (e.g., an IDE) with the aim of improving productivity. We pursue mechanisms for leveraging signals about programmers' acceptance and rejection of code suggestions to guide recommendations. We harness data drawn from interactions with GitHub Copilot, a system used by millions of programmers, to develop interventions that can save time for programmers. We introduce a utility-theoretic framework to drive decisions about suggestions to display versus withhold. The approach, conditional suggestion display from human feedback (CDHF), relies on a cascade of models that provide the likelihood that recommended code will be accepted. These likelihoods are used to selectively hide suggestions, reducing both latency and programmer verification time. Using data from 535 programmers, we perform a retrospective evaluation of CDHF and show that we can avoid displaying a significant fraction of suggestions that would have been rejected. We further demonstrate the importance of incorporating the programmer's latent unobserved state in decisions about when to display suggestions through an ablation study. Finally, we showcase how using suggestion acceptance as a reward signal for guiding the display of suggestions can lead to suggestions of reduced quality, indicating an unexpected pitfall.
- Abstract(参考訳): CopilotやCodeWhispererといったAIによるコード推奨システムは、生産性向上を目的としたプログラマの環境(IDEなど)内のコード提案を提供する。
我々は、プログラマの受け入れやコード提案の拒否に関する信号を活用するメカニズムを追求し、レコメンデーションをガイドする。
数百万のプログラマが使用しているシステムであるGitHub Copilotとのインタラクションから引き出されたデータを活用して、プログラマの時間を節約できる介入を開発します。
我々は、表示を控えるよりも提示する提案について決定を下すためのユーティリティ理論フレームワークを導入する。
このアプローチは、人間のフィードバック(CDHF)からの条件付き提案表示であり、推奨コードが受け入れられる可能性を示すモデルのカスケードに依存している。
これらの可能性を利用して提案を選択的に隠蔽し、レイテンシとプログラマの検証時間を短縮する。
535人のプログラマのデータを用いて、CDHFの振り返り評価を行い、拒否されたであろう提案のかなりの部分の表示を回避できることを示します。
さらに,Ablationによる提案の提示時期の決定に,プログラマの潜伏状態が組み込まれることの重要性を実証する。
最後に,提案の表示を誘導する報奨信号として提案受理を用いると,品質が低下し,予期せぬ落とし穴が生じることを示す。
関連論文リスト
- Exploiting Correlated Auxiliary Feedback in Parameterized Bandits [56.84649080789685]
そこで本研究では,学習者が追加の補助的フィードバックを観察できるパラメータ化帯域問題の新たな変種について検討する。
補助的なフィードバックは、ユーザのサービス評価(リワード)を観察し、サービス提供時間(補助的なフィードバック)などの追加情報を収集するオンラインプラットフォームなど、多くの現実的なアプリケーションで容易に利用可能である。
論文 参考訳(メタデータ) (2023-11-05T17:27:06Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Optimizing Audio Recommendations for the Long-Term: A Reinforcement
Learning Perspective [14.202749983552717]
本研究では,数週間ないし数ヶ月にわたって発生する結果に対して,レコメンデータシステムを最適化する問題について検討する。
我々は,数億のリスナーに対してパーソナライズされたレコメンデーションを行うポッドキャストレコメンデーションシステムにアプローチを適用した。
論文 参考訳(メタデータ) (2023-02-07T16:17:25Z) - Reading Between the Lines: Modeling User Behavior and Costs in AI-Assisted Programming [28.254978977288868]
GitHub Copilotは、何百万人ものプログラマが毎日使っているコード推奨システムです。
Copilotと対話する際の共通プログラマ活動の分類であるCUPSを開発した。
私たちの洞察は、プログラマがCopilotとどのように相互作用し、新しいインターフェース設計とメトリクスを動機付けるかを明らかにします。
論文 参考訳(メタデータ) (2022-10-25T20:01:15Z) - Breaking Feedback Loops in Recommender Systems with Causal Inference [99.22185950608838]
近年の研究では、フィードバックループが推奨品質を損なう可能性があり、ユーザの振る舞いを均質化している。
本稿では、因果推論を用いてフィードバックループを確実に破壊するアルゴリズムCAFLを提案する。
従来の補正手法と比較して,CAFLは推奨品質を向上することを示す。
論文 参考訳(メタデータ) (2022-07-04T17:58:39Z) - ELIXIR: Learning from User Feedback on Explanations to Improve
Recommender Models [26.11434743591804]
説明に対するユーザフィードバックをユーザ好みのペアワイズ学習に活用する,ループ内人間フレームワーク ELIXIR を考案した。
elixirは、レコメンデーションと説明のペアに対するフィードバックを活用して、ユーザ固有の潜在選好ベクトルを学習する。
このフレームワークは、ランダムウォークとリスタートによる一般化グラフレコメンデーションを用いてインスタンス化される。
論文 参考訳(メタデータ) (2021-02-15T13:43:49Z) - Adversarial Counterfactual Learning and Evaluation for Recommender
System [33.44276155380476]
ユーザ嗜好を検出するために教師付き学習を適用することは、露出情報がない場合に矛盾する結果になる可能性があることを理論的に示す。
ミニマックス経験的リスクの定式化を導入することにより, 基本解を提案する。
論文 参考訳(メタデータ) (2020-11-08T00:40:51Z) - Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。
提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。
このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T11:18:57Z) - Fairness-Aware Explainable Recommendation over Knowledge Graphs [73.81994676695346]
ユーザのアクティビティのレベルに応じて異なるグループのユーザを分析し、異なるグループ間での推奨パフォーマンスにバイアスが存在することを確認する。
不活性なユーザは、不活性なユーザのためのトレーニングデータが不十分なため、不満足なレコメンデーションを受けやすい可能性がある。
本稿では、知識グラフに対する説明可能な推奨という文脈で、この問題を緩和するために再ランク付けすることで、公平性に制約されたアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-03T05:04:38Z) - Graph-based, Self-Supervised Program Repair from Diagnostic Feedback [108.48853808418725]
本稿では,ソースコードの修復や診断フィードバックに関連するシンボルを結合するプログラムフィードバックグラフを提案する。
次に、推論プロセスのモデル化にグラフニューラルネットワークを適用します。
オンラインで利用可能なラベルのないプログラムを活用するプログラム修復のための自己指導型学習パラダイムを提案する。
論文 参考訳(メタデータ) (2020-05-20T07:24:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。