論文の概要: Partial Orderings as Heuristic for Multi-Objective Model-Based Reasoning
- arxiv url: http://arxiv.org/abs/2310.19125v1
- Date: Sun, 29 Oct 2023 19:21:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 14:10:52.273657
- Title: Partial Orderings as Heuristic for Multi-Objective Model-Based Reasoning
- Title(参考訳): 多目的モデルに基づく推論のためのヒューリスティックな部分順序付け
- Authors: Andre Lustosa, Tim Menzies
- Abstract要約: 複雑なモデルが利害関係者を混乱させ、圧倒することがある。
ここでは,部分順序付けに基づく手法により,$O(log(N)$クエリ(以下)を必要とするバイナリチョップを通じて,人間が許容可能なソリューションを見つけることができる,と論じる。
本稿では,iSNEAK部分順序付けツールを用いて,このアプローチの価値を確認する。
- 参考スコア(独自算出の注目度): 13.19204187502255
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model-based reasoning is becoming increasingly common in software
engineering. The process of building and analyzing models helps stakeholders to
understand the ramifications of their software decisions. But complex models
can confuse and overwhelm stakeholders when these models have too many
candidate solutions. We argue here that a technique based on partial orderings
lets humans find acceptable solutions via a binary chop needing $O(log(N))$
queries (or less). This paper checks the value of this approach via the iSNEAK
partial ordering tool. Pre-experimentally, we were concerned that (a)~our
automated methods might produce models that were unacceptable to humans; and
that (b)~our human-in-the-loop methods might actual overlooking significant
optimizations. Hence, we checked the acceptability of the solutions found by
iSNEAK via a human-in-the-loop double-blind evaluation study of 20 Brazilian
programmers. We also checked if iSNEAK misses significant optimizations (in a
corpus of 16 SE models of size ranging up to 1000 attributes by comparing it
against two rival technologies (the genetic algorithms preferred by the
interactive search-based SE community; and the sequential model optimizers
developed by the SE configuration community~\citep{flash_vivek}). iSNEAK 's
solutions were found to be human acceptable (and those solutions took far less
time to generate, with far fewer questions to any stakeholder). Significantly,
our methods work well even for multi-objective models with competing goals (in
this work we explore models with four to five goals). These results motivate
more work on partial ordering for many-goal model-based problems.
- Abstract(参考訳): モデルに基づく推論はソフトウェア工学においてますます一般的になりつつある。
モデルの構築と分析のプロセスは、ステークホルダーがソフトウェア決定の分岐を理解するのに役立つ。
しかし、これらのモデルが候補となるソリューションが多すぎると、複雑なモデルは利害関係者を混乱させ、圧倒する可能性がある。
ここでは、部分順序付けに基づく手法により、$O(log(N))$クエリ(以下)を必要とするバイナリチョップを通じて、人間が許容できるソリューションを見つけることができると論じる。
本稿では,iSNEAK部分順序付けツールを用いて,このアプローチの価値を確認する。
実験前は、私たちは
(a)自動化された方法では、人間には受け入れられないモデルを作るかもしれません。
(b)本手法は,実際に重要な最適化を見落としている可能性がある。
そこで本研究では,ブラジルの20人のプログラマを対象に,Human-in-the-loop二重盲検評価によるiSNEAKの解の受容性を確認した。
また、iSNEAKが大きな最適化を怠っているかどうか(最大1000の属性を持つ16のSEモデルのコーパスにおいて、2つの競合技術(対話型検索ベースSEコミュニティで好まれる遺伝的アルゴリズムとSE構成コミュニティで開発されたシーケンシャルモデルオプティマイザ)を比較した。
iSNEAKのソリューションは人間に受け入れられることがわかりました(そしてそれらのソリューションは、どのステークホルダにもずっと少ない質問で生成するのにはるかに時間がかかりました)。
重要なことに、我々の手法は競合する目標を持つ多目的モデルでもうまく機能します(この研究では、4~5つの目標を持つモデルを調べます)。
これらの結果は、多目的モデルに基づく問題に対して、部分順序付けに関するさらなる取り組みを動機付ける。
関連論文リスト
- Look Before You Leap: A Universal Emergent Decomposition of Retrieval
Tasks in Language Models [58.57279229066477]
本研究では,言語モデル(LM)が様々な状況下での検索タスクをどのように解決するかを検討する。
ORIONは6つのドメインにまたがる構造化された検索タスクの集合である。
LMは内部的にモジュール方式で検索タスクを分解する。
論文 参考訳(メタデータ) (2023-12-13T18:36:43Z) - Models and algorithms for simple disjunctive temporal problems [0.8793721044482611]
イベントが任意に大量のリリースと予定日を持つ場合に焦点を当てる。
本稿では,制約プログラミングと線形プログラミングを用いた3つの数学的モデルを提案する。
論文から得られたアルゴリズムを実装し,簡単な時相問題を解くための手法の比較実験を行った。
論文 参考訳(メタデータ) (2023-02-06T09:40:24Z) - Successive Prompting for Decomposing Complex Questions [50.00659445976735]
最近の研究は、大規模言語モデル(LM)の機能を活用して、数ショットで複雑な質問応答を行う。
そこでは、複雑なタスクを単純なタスクに繰り返し分解し、それを解決し、最終解を得るまでプロセスを繰り返します。
我々の最良のモデル(逐次プロンプト付き)は、DROPデータセットの数ショットバージョンにおいて、5%の絶対F1の改善を実現します。
論文 参考訳(メタデータ) (2022-12-08T06:03:38Z) - Chaining Simultaneous Thoughts for Numerical Reasoning [92.2007997126144]
テキストによる数値推論は、AIシステムにとって不可欠なスキルであるべきです。
これまでの研究は方程式の構造をモデル化することに集中し、様々な構造化デコーダを提案してきた。
我々は、有向非巡回グラフを用いてステップを推論する数値推論器CANTORを提案する。
論文 参考訳(メタデータ) (2022-11-29T18:52:06Z) - Is a Question Decomposition Unit All We Need? [20.66688303609522]
モデルを解くのが比較的容易な、より単純な質問の集合に、人間が難解な質問を分解できるかどうかを検討する。
我々は、様々な推論形式を含むデータセットを解析し、モデルの性能を大幅に改善することは実際に可能であることを発見した。
以上の結果から,Human-in-the-loop Question Decomposition (HQD) が大規模LM構築の代替となる可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-25T07:24:09Z) - Minimizing Entropy to Discover Good Solutions to Recurrent Mixed Integer
Programs [0.0]
混合整数プログラミング(MIP)問題に対する現在の解法は、幅広い問題に対して良好に動作するように設計されている。
近年の研究では、機械学習(ML)をMIPソルバと統合してドメイン知識を注入し、最適性ギャップを効率的に閉じることが示されている。
本稿では、エントロピーの概念を用いて、最小限のトレーニングデータとチューニングで効率的にモデルを構築するオンラインソルバを提案する。
論文 参考訳(メタデータ) (2022-02-07T18:52:56Z) - A Mutual Information Maximization Approach for the Spurious Solution
Problem in Weakly Supervised Question Answering [60.768146126094955]
弱々しい教師付き質問応答は通常、最終的な答えのみを監督信号として持つ。
偶然に正解を導出する刺激的な解が多数存在するかもしれないが、そのような解の訓練はモデルの性能を損なう可能性がある。
本稿では,質問応答対と予測解間の相互情報の最大化により,このような意味的相関を明示的に活用することを提案する。
論文 参考訳(メタデータ) (2021-06-14T05:47:41Z) - Efficiently Explaining CSPs with Unsatisfiable Subset Optimization [17.498283247757445]
我々は,制約満足度問題の解法を説明する手法を最近提案した。
ここでの説明は、単純な推論ステップのシーケンスであり、推論ステップの単純さは、使用される制約の数や種類、事実によって測定される。
2つの新しい問題、すなわち、確実に最適である説明を生成する方法と、それらを効率的に生成する方法に取り組みます。
論文 参考訳(メタデータ) (2021-05-25T08:57:43Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Understanding Unnatural Questions Improves Reasoning over Text [54.235828149899625]
生テキストに対する複雑な質問応答(CQA)は難しい課題である。
効果的なCQAモデルを学ぶには、大量の人間が注釈付けしたデータが必要である。
我々は、自然の人間生成の質問を非自然の機械生成の質問に投影することで、高品質なプログラマ(パーザ)を学ぶという課題に対処する。
論文 参考訳(メタデータ) (2020-10-19T10:22:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。