Fugu-MT 論文翻訳(概要): When to Show a Suggestion? Integrating Human Feedback in AI-Assisted Programming

論文の概要: When to Show a Suggestion? Integrating Human Feedback in AI-Assisted Programming

arxiv url: http://arxiv.org/abs/2306.04930v1
Date: Thu, 8 Jun 2023 04:24:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-09 16:25:37.940073
Title: When to Show a Suggestion? Integrating Human Feedback in AI-Assisted Programming
Title（参考訳）: 提案はいつ提示するか? AI支援プログラミングにおけるヒューマンフィードバックの統合
Authors: Hussein Mozannar, Gagan Bansal, Adam Fourney, Eric Horvitz
Abstract要約: 私たちは、Copilotと対話するプログラマの事前データを活用して、プログラマの時間を節約できる介入を開発します。本稿では,プログラマとのインタラクションをモデル化し,いつ,どの提案を表示するかを決定するユーティリティ理論フレームワークを提案する。本フレームワークは,プログラマ行動の予測モデルに基づく,ヒューマンフィードバックからの条件付き提案表示(CDHF)である。
参考スコア（独自算出の注目度）: 36.270310963941434
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: AI powered code-recommendation systems, such as Copilot and CodeWhisperer, provide code suggestions inside a programmer's environment (e.g., an IDE) with the aim to improve their productivity. Since, in these scenarios, programmers accept and reject suggestions, ideally, such a system should use this feedback in furtherance of this goal. In this work we leverage prior data of programmers interacting with Copilot to develop interventions that can save programmer time. We propose a utility theory framework, which models this interaction with programmers and decides when and which suggestions to display. Our framework Conditional suggestion Display from Human Feedback (CDHF) is based on predictive models of programmer actions. Using data from 535 programmers we build models that predict the likelihood of suggestion acceptance. In a retrospective evaluation on real-world programming tasks solved with AI-assisted programming, we find that CDHF can achieve favorable tradeoffs. Our findings show the promise of integrating human feedback to improve interaction with large language models in scenarios such as programming and possibly writing tasks.
Abstract（参考訳）: CopilotやCodeWhispererといったAIによるコード推奨システムは、プログラマの環境(IDEなど)内で、生産性の向上を目的としたコード提案を提供する。これらのシナリオでは、プログラマは提案を受け入れ拒否するので、理想的には、そのようなシステムは、この目標をさらに進めるためにこのフィードバックを使うべきである。この作業では、Copilotと対話するプログラマの事前データを活用して、プログラマの時間を節約できる介入を開発します。本稿では,プログラマとのインタラクションをモデル化し,いつ,どの提案を表示するかを決定するユーティリティ理論フレームワークを提案する。本フレームワークは,プログラマ行動の予測モデルに基づく,ヒューマンフィードバックからの条件付き提案表示(CDHF)である。 535人のプログラマのデータを使って提案を受け入れる可能性を予測するモデルを構築します。 AI支援プログラミングで解決された実世界のプログラミングタスクの振り返り評価において,CDHFは良好なトレードオフを達成できることがわかった。この結果から,プログラムやタスク記述などのシナリオにおける大規模言語モデルとのインタラクションを改善するために,人間のフィードバックを統合することが期待できる。

関連論文リスト

Towards a Real-World Aligned Benchmark for Unlearning in Recommender Systems [49.766845975588275]
推薦システムにおける非学習のためのより現実的なベンチマークの開発を導くために,設計デシダータと研究質問のセットを提案する。我々は、現実世界の削除要求の逐次的で時間に敏感な性質を反映した、未学習のセットアップについて論じる。本稿では,提案したdesiderataをベースとした次世代レコメンデーションセッティングの予備実験を行い,アンラーニングが逐次レコメンデーションモデルにも有効であることを確認した。
論文参考訳（メタデータ） (2025-08-23T16:05:40Z)
$\ ext{R}^2\ ext{ec}$: Towards Large Recommender Models with Reasoning [50.291998724376654]
我々は,本質的な推論機能を備えた統合された大規模レコメンデータモデルであるnameを提案する。 RecPOは、単一のポリシー更新で推論とレコメンデーションの両方の機能を同時に最適化する、対応する強化学習フレームワークである。さまざまなベースラインを持つ3つのデータセットの実験では、Hit@5で68.67%、NDCG@20で45.21%の相対的な改善が見られた。
論文参考訳（メタデータ） (2025-05-22T17:55:43Z)
How Do Developers Use Code Suggestions in Pull Request Reviews? [9.004005678155023]
46のエンジニアリングGitHubプロジェクトからのプルリクエストに関する実証的研究を行った。提案のタイプと使用頻度を明らかにするために,オープンコーディングアプローチを適用した。コードスタイルの提案、改善、修正、ドキュメントの4つの提案タイプを明らかにしました。
論文参考訳（メタデータ） (2025-02-07T11:09:25Z)
Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-09T04:20:15Z)
Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.88747330066049]
きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文参考訳（メタデータ） (2024-06-24T17:19:34Z)
De-fine: Decomposing and Refining Visual Programs with Auto-Feedback [75.62712247421146]
De-fineは、複雑なタスクを単純なサブタスクに分解し、オートフィードバックを通じてプログラムを洗練する、トレーニング不要のフレームワークである。様々な視覚的タスクに対する我々の実験は、De-fineがより堅牢なプログラムを生成することを示している。
論文参考訳（メタデータ） (2023-11-21T06:24:09Z)
MISSRec: Pre-training and Transferring Multi-modal Interest-aware Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文参考訳（メタデータ） (2023-08-22T04:06:56Z)
Impression-Aware Recommender Systems [53.48892326556546]
本稿ではインプレッションを用いたレコメンデーションシステムに関する体系的な文献レビューを行う。本稿では,印象型レコメンデーションシステムと,印象型レコメンデーションシステムという,パーソナライズされたレコメンデーションのための新しいパラダイムを論じる。
論文参考訳（メタデータ） (2023-08-15T16:16:02Z)
Reading Between the Lines: Modeling User Behavior and Costs in AI-Assisted Programming [28.254978977288868]
GitHub Copilotは、何百万人ものプログラマが毎日使っているコード推奨システムです。 Copilotと対話する際の共通プログラマ活動の分類であるCUPSを開発した。私たちの洞察は、プログラマがCopilotとどのように相互作用し、新しいインターフェース設計とメトリクスを動機付けるかを明らかにします。
論文参考訳（メタデータ） (2022-10-25T20:01:15Z)
Breaking Feedback Loops in Recommender Systems with Causal Inference [99.22185950608838]
近年の研究では、フィードバックループが推奨品質を損なう可能性があり、ユーザの振る舞いを均質化している。本稿では、因果推論を用いてフィードバックループを確実に破壊するアルゴリズムCAFLを提案する。従来の補正手法と比較して,CAFLは推奨品質を向上することを示す。
論文参考訳（メタデータ） (2022-07-04T17:58:39Z)
ELIXIR: Learning from User Feedback on Explanations to Improve Recommender Models [26.11434743591804]
説明に対するユーザフィードバックをユーザ好みのペアワイズ学習に活用する,ループ内人間フレームワーク ELIXIR を考案した。 elixirは、レコメンデーションと説明のペアに対するフィードバックを活用して、ユーザ固有の潜在選好ベクトルを学習する。このフレームワークは、ランダムウォークとリスタートによる一般化グラフレコメンデーションを用いてインスタンス化される。
論文参考訳（メタデータ） (2021-02-15T13:43:49Z)
Adversarial Counterfactual Learning and Evaluation for Recommender System [33.44276155380476]
ユーザ嗜好を検出するために教師付き学習を適用することは、露出情報がない場合に矛盾する結果になる可能性があることを理論的に示す。ミニマックス経験的リスクの定式化を導入することにより, 基本解を提案する。
論文参考訳（メタデータ） (2020-11-08T00:40:51Z)
Self-Supervised Reinforcement Learning for Recommender Systems [77.38665506495553]
逐次リコメンデーションタスクのための自己指導型強化学習を提案する。提案手法は,2つの出力層を持つ標準レコメンデーションモデルを強化する。このようなアプローチに基づいて、自己監督型Q-ラーニング(SQN)と自己監督型アクター・クライブ(SAC)という2つのフレームワークを提案する。
論文参考訳（メタデータ） (2020-06-10T11:18:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。