Fugu-MT 論文翻訳(概要): GEMS: Generative Expert Metric System through Iterative Prompt Priming

論文の概要: GEMS: Generative Expert Metric System through Iterative Prompt Priming

arxiv url: http://arxiv.org/abs/2410.00880v1
Date: Tue, 1 Oct 2024 17:14:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-05 00:19:53.344666
Title: GEMS: Generative Expert Metric System through Iterative Prompt Priming
Title（参考訳）: GEMS: 反復的プロンプトプライミングによる創発的エキスパートメトリックシステム
Authors: Ti-Chung Cheng, Carmen Badea, Christian Bird, Thomas Zimmermann, Robert DeLine, Nicole Forsgren, Denae Ford,
Abstract要約: 非専門家は、効果的な測度を作成したり、理論を文脈特異的なメトリクスに変換するのが直感的ではないと考えることができる。この技術的レポートは、大規模ソフトウェア企業内のソフトウェアコミュニティを調べることで、この問題に対処する。本稿では,ニューラルアクティビティにインスパイアされたプロンプトエンジニアリングフレームワークを提案し,生成モデルが理論を抽出し,要約できることを実証する。
参考スコア（独自算出の注目度）: 18.0413505095456
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Across domains, metrics and measurements are fundamental to identifying challenges, informing decisions, and resolving conflicts. Despite the abundance of data available in this information age, not only can it be challenging for a single expert to work across multi-disciplinary data, but non-experts can also find it unintuitive to create effective measures or transform theories into context-specific metrics that are chosen appropriately. This technical report addresses this challenge by examining software communities within large software corporations, where different measures are used as proxies to locate counterparts within the organization to transfer tacit knowledge. We propose a prompt-engineering framework inspired by neural activities, demonstrating that generative models can extract and summarize theories and perform basic reasoning, thereby transforming concepts into context-aware metrics to support software communities given software repository data. While this research zoomed in on software communities, we believe the framework's applicability extends across various fields, showcasing expert-theory-inspired metrics that aid in triaging complex challenges.
Abstract（参考訳）: ドメイン全体にわたって、メトリクスと測定は、課題を特定し、決定を下し、対立を解決するのに不可欠です。この情報時代に利用可能なデータが豊富にあるにもかかわらず、単一の専門家が複数の学際的なデータにまたがって作業することは困難であるだけでなく、非専門家は効果的な測度を作成したり、理論を適切に選択された文脈固有のメトリクスに変換するのが直感的であることも見出すことができる。この技術的レポートは、大企業内のソフトウェアコミュニティを調べることで、この課題に対処する。本稿では,ニューラルアクティビティにインスパイアされたプロンプトエンジニアリングフレームワークを提案し,生成モデルが理論を抽出・要約し,基本的な推論を行うことで,概念をコンテキスト対応のメトリクスに変換し,ソフトウェアコミュニティにソフトウェアリポジトリデータを提供することを示す。この研究はソフトウェアコミュニティに浸透したが、フレームワークの適用性は様々な分野にまたがり、複雑な課題をトリアージする専門家理論に触発されたメトリクスを示していると信じている。

関連論文リスト

GenAI for Systems: Recurring Challenges and Design Principles from Software to Silicon [62.2138479061386]
ジェネレーティブAIは、コンピュータシステムの設計、最適化、構築方法を変えようとしているが、ソフトウェア、アーキテクチャ、チップデザインコミュニティの間で研究は断片化されている。本稿では、ハードウェア設計空間探索からRTL合成、物理レイアウト、検証に至るまで、コード生成と分散ランタイムから生成モデルがどのように適用されているかを検討する。
論文参考訳（メタデータ） (2026-02-16T22:45:33Z)
Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。 SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。本稿では,この新興領域を体系的に調査する。
論文参考訳（メタデータ） (2026-01-15T18:55:03Z)
A Methodology for Assessing the Risk of Metric Failure in LLMs Within the Financial Domain [0.25409967292854213]
過去の機械学習メトリクスは、しばしばGenAIワークロードへの一般化に失敗することがある。本稿では、これらの課題を説明し、中小企業と機械学習メトリクスのより良い適用を可能にするリスクアセスメントフレームワークを提供する。
論文参考訳（メタデータ） (2025-10-15T13:17:16Z)
A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文参考訳（メタデータ） (2025-10-10T06:56:50Z)
MEXA: Towards General Multimodal Reasoning with Dynamic Multi-Expert Aggregation [64.85885900375483]
MEXAは、エキスパートモデルのモダリティおよびタスク対応アグリゲーションを実行する、トレーニング不要のフレームワークである。我々は,ビデオ推論,オーディオ推論,3D理解,医用QAなど,多様なマルチモーダルベンチマークに対するアプローチを評価した。
論文参考訳（メタデータ） (2025-06-20T16:14:13Z)
Rethinking Machine Unlearning in Image Generation Models [59.697750585491264]
CatIGMUは、新しい階層的なタスク分類フレームワークである。 EvalIGMUは包括的な評価フレームワークである。高品質な未学習データセットであるDataIGMを構築した。
論文参考訳（メタデータ） (2025-06-03T11:25:14Z)
Cooperation of Experts: Fusing Heterogeneous Information with Large Margin [11.522412489437702]
CoE(Cooperation of Experts)フレームワークは、マルチタイプ情報を統一された異種多重ネットワークにエンコードする。このフレームワークでは、専用のエンコーダがドメイン固有の専門家として機能し、それぞれが特定の意味空間における異なる関係パターンの学習に特化している。
論文参考訳（メタデータ） (2025-05-27T08:04:32Z)
ModelingAgent: Bridging LLMs and Mathematical Modeling for Real-World Challenges [72.19809898215857]
ModelingBenchは、様々な領域にわたる数学モデリングの競争から、現実に着想を得たオープンエンドの問題を特徴付ける新しいベンチマークである。これらのタスクには、自然言語を形式的な数学的定式化に翻訳し、適切なツールを適用し、構造化された防御可能なレポートを生成する必要がある。ツール使用をコーディネートするマルチエージェントフレームワークである ModelingAgent も紹介します。
論文参考訳（メタデータ） (2025-05-21T03:33:23Z)
Why Reasoning Matters? A Survey of Advancements in Multimodal Reasoning (v1) [66.51642638034822]
推論は人間の知性の中心であり、多様なタスクにまたがる構造化された問題解決を可能にする。大規模言語モデル(LLM)の最近の進歩は、算術、常識、記号領域における推論能力を大幅に向上させてきた。本稿では,テキストおよびマルチモーダルLLMにおける推論手法の簡潔かつ洞察に富んだ概要について述べる。
論文参考訳（メタデータ） (2025-04-04T04:04:56Z)
Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey [124.23247710880008]
マルチモーダルCoT (MCoT) 推論は近年大きな研究の注目を集めている。既存のMCoT研究は、画像、ビデオ、音声、オーディオ、3D、構造化データの課題に対処する様々な手法を設計している。我々はMCoT推論に関する最初の体系的な調査を行い、関連する基礎概念と定義を解明する。
論文参考訳（メタデータ） (2025-03-16T18:39:13Z)
GIVE: Structured Reasoning with Knowledge Graph Inspired Veracity Extrapolation [108.2008975785364]
Graph Inspired Veracity Extrapolation (GIVE)は、パラメトリックメモリと非パラメトリックメモリを統合する新しい推論フレームワークである。本手法は,ゴールド回答検索ではなく,専門家の問題解決に類似した論理的・段階的推論手法を提案する。
論文参考訳（メタデータ） (2024-10-11T03:05:06Z)
Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [46.55831783809377]
大規模言語モデル(LLM)の幻覚を緩和するための効果的なアプローチとして,検索拡張世代(RAG)がますます認識されている。 PruningRAGはマルチグラニュラリティ・プルーニング・ストラテジーを用いて,関連コンテキストをより効果的に統合し,誤った情報に対するネガティブな影響を軽減するためのプラグアンドプレイRAGフレームワークである。
論文参考訳（メタデータ） (2024-09-03T03:31:37Z)
DISCOVER: A Data-driven Interactive System for Comprehensive Observation, Visualization, and ExploRation of Human Behaviour [6.716560115378451]
我々は,人間行動分析のための計算駆動型データ探索を効率化するために,モジュール型でフレキシブルでユーザフレンドリなソフトウェアフレームワークを導入する。我々の主な目的は、高度な計算方法論へのアクセスを民主化することであり、これにより研究者は、広範囲の技術的熟練を必要とせずに、詳細な行動分析を行うことができる。
論文参考訳（メタデータ） (2024-07-18T11:28:52Z)
Navigating Expertise in Configurable Software Systems through the Maze of Variability [0.0]
本研究では,CSSにおける開発作業の分散について検討する。また、割り当てられたファイルに可変コードを持つ特定専門家の関与についても調べる。
論文参考訳（メタデータ） (2024-01-19T14:03:33Z)
The Transformative Influence of Large Language Models on Software Development [0.0]
Generalized Large Language Models (LLM) は様々な分野に進出している。 LLMはAIペアプログラミングアシスタントとしての役割をますます高めており、重要な課題やオープンな問題も提示している。予備的な調査結果は、データのプライバシー、偏見、誤報に関する懸念を浮き彫りにしている。調査で確認した12のオープンな問題を特定し、これらの領域をカバーしています。
論文参考訳（メタデータ） (2023-11-28T02:18:54Z)
Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文参考訳（メタデータ） (2023-07-24T08:58:25Z)
Understanding metric-related pitfalls in image analysis validation [59.15220116166561]
この研究は、画像解析におけるバリデーションメトリクスに関連する落とし穴に関する情報にアクセスするための、初めての包括的な共通点を提供する。バイオメディカル画像解析に焦点をあてるが、他の分野へ移行する可能性があるため、対処された落とし穴はアプリケーションドメイン全体にわたって一般化され、新しく作成されたドメインに依存しない分類に分類される。
論文参考訳（メタデータ） (2023-02-03T14:57:40Z)
Regressing Relative Fine-Grained Change for Sub-Groups in Unreliable Heterogeneous Data Through Deep Multi-Task Metric Learning [0.5999777817331317]
本研究では,マルチタスク・メトリック・ラーニングの手法を実データにおけるきめ細かい変化に応用する方法について検討する。この手法は異種データソースの処理に特化している。
論文参考訳（メタデータ） (2022-08-11T12:57:11Z)
Metrics reloaded: Recommendations for image analysis validation [59.60445111432934]
メトリクスのリロード(Metrics Reloaded)は、メトリクスの問題を意識した選択において研究者を導く包括的なフレームワークである。このフレームワークは多段階のDelphiプロセスで開発され、問題指紋という新しい概念に基づいている。問題指紋に基づいて、ユーザは適切なバリデーションメトリクスを選択して適用するプロセスを通じてガイドされる。
論文参考訳（メタデータ） (2022-06-03T15:56:51Z)
GeoQA: A Geometric Question Answering Benchmark Towards Multimodal Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文参考訳（メタデータ） (2021-05-30T12:34:17Z)
Understanding the Usability Challenges of Machine Learning In High-Stakes Decision Making [67.72855777115772]
機械学習(ML)は、多種多様な成長を続ける一連のドメインに適用されている。多くの場合、MLやデータサイエンスの専門知識を持たないドメインの専門家は、ML予測を使用してハイステークな意思決定を行うように求められます。児童福祉スクリーニングにおけるMLユーザビリティの課題について,児童福祉スクリーニング者との一連のコラボレーションを通じて検討する。
論文参考訳（メタデータ） (2021-03-02T22:50:45Z)
Synergizing Domain Expertise with Self-Awareness in Software Systems: A Patternized Architecture Guideline [11.155059219430207]
本稿では、ソフトウェアシステムにおける自己適応性を高めるために、ドメインの専門知識の相乗化と自己認識の重要性を強調する。我々は、DBASESと呼ばれる概念、豊富なパターン、方法論の総合的なフレームワークを提示し、エンジニアに原則化されたガイドラインを提供する。
論文参考訳（メタデータ） (2020-01-20T12:17:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。