論文の概要: A Semi-Automated Solution Approach Recommender for a Given Use Case: a Case Study for AI/ML in Oncology via Scopus and OpenAI
- arxiv url: http://arxiv.org/abs/2307.04573v2
- Date: Wed, 15 May 2024 07:46:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-16 18:31:50.454775
- Title: A Semi-Automated Solution Approach Recommender for a Given Use Case: a Case Study for AI/ML in Oncology via Scopus and OpenAI
- Title(参考訳): 特定のユースケースに対する半自動ソリューション・レコメンデーション:スコパスとOpenAIによるオンコロジーにおけるAI/MLのケーススタディ
- Authors: Deniz Kenan Kılıç, Alex Elkjær Vasegaard, Aurélien Desoeuvres, Peter Nielsen,
- Abstract要約: 提案するツールであるSARBOLD-LLMは,与えられた問題に関連するメソッドの発見と選択を可能にする。
意思決定の洞察を導き出すために、文学における彼らの使用に関する追加情報を提供する。
調査を最初に行う方法を選択し、調査を補完する上で有用なツールである。
- 参考スコア(独自算出の注目度): 0.6749750044497732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nowadays, literature review is a necessary task when trying to solve a given problem. However, an exhaustive literature review is very time-consuming in today's vast literature landscape. It can take weeks, even if looking only for abstracts or surveys. Moreover, choosing a method among others, and targeting searches within relevant problem and solution domains, are not easy tasks. These are especially true for young researchers or engineers starting to work in their field. Even if surveys that provide methods used to solve a specific problem already exist, an automatic way to do it for any use case is missing, especially for those who don't know the existing literature. Our proposed tool, SARBOLD-LLM, allows discovering and choosing among methods related to a given problem, providing additional information about their uses in the literature to derive decision-making insights, in only a few hours. The SARBOLD-LLM comprises three modules: (1: Scopus search) paper selection using a keyword selection scheme to query Scopus API; (2: Scoring and method extraction) relevancy and popularity scores calculation and solution method extraction in papers utilizing OpenAI API (GPT 3.5); (3: Analyzes) sensitivity analysis and post-analyzes which reveals trends, relevant papers and methods. Comparing the SARBOLD-LLM to manual ground truth using precision, recall, and F1-score metrics, the performance results of AI in the oncology case study are 0.68, 0.9, and 0.77, respectively. SARBOLD-LLM demonstrates successful outcomes across various domains, showcasing its robustness and effectiveness. The SARBOLD-LLM addresses engineers more than researchers, as it proposes methods and trends without adding pros and cons. It is a useful tool to select which methods to investigate first and comes as a complement to surveys. This can limit the global search and accumulation of knowledge for the end user. However...
- Abstract(参考訳): 今日では、ある問題を解くためには文献のレビューが不可欠である。
しかし、今日の広大な文学の風景において、徹底的な文献レビューは非常に時間がかかる。
たとえ抽象化やサーベイのみであっても、数週間かかる可能性がある。
さらに,メソッドの選択や,関連する問題領域やソリューション領域内での探索も容易ではない。
これは、若い研究者やエンジニアがこの分野で働き始めたときに特に当てはまる。
特定の問題を解決するための方法を提供する調査がすでに存在していても、特に既存の文献を知らない人にとっては、あらゆるユースケースに対して自動的に実施する方法が欠落している。
提案するツールであるSARBOLD-LLMは、与えられた問題に関連する方法の発見と選択を可能にし、わずか数時間で意思決定の洞察を導き出すために、文献におけるそれらの使用法に関する追加情報を提供する。
SARBOLD-LLMは、3つのモジュールから構成される: (1: スコープ検索) キーワード選択スキームを用いて、Scoopus APIをクエリする; (2: スコアとメソッド抽出) 関連性および人気スコア OpenAI API (GPT 3.5) を利用した論文における計算およびソリューションメソッド抽出(3: 分析) 感度分析と、トレンド、関連する論文、方法を明らかにするポストアナライズ。
SARBOLD-LLMを精度、リコール、F1スコアの計測値を用いて手動の真理と比較すると、腫瘍学ケーススタディにおけるAIの性能は0.68、0.9、0.77である。
SARBOLD-LLMは様々な領域で成功し、その堅牢性と有効性を示している。
SARBOLD-LLMは研究者以上のエンジニアに対処する。
調査を最初に行う方法を選択し、調査を補完する上で有用なツールである。
これにより、エンドユーザのグローバルな検索と知識の蓄積を制限できる。
しかし...。
関連論文リスト
- Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs [76.43407125275202]
o1のようなモデルは、推論中に人間のような長時間の思考をエミュレートすることができる。
本論文は,これらのモデルにおける過度な考察の課題に関する,最初の包括的研究である。
精度を損なうことなく、過剰思考を緩和し、推論プロセスを合理化するための戦略を提案する。
論文 参考訳(メタデータ) (2024-12-30T18:55:12Z) - A Comparative Study on Reasoning Patterns of OpenAI's o1 Model [69.08287909042421]
OpenAIのo1モデルは、ほとんどのデータセットで最高のパフォーマンスを実現しています。
また、いくつかの推論ベンチマークについて詳細な分析を行う。
論文 参考訳(メタデータ) (2024-10-17T15:09:03Z) - Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文 参考訳(メタデータ) (2024-06-21T20:06:31Z) - ResearchArena: Benchmarking Large Language Models' Ability to Collect and Organize Information as Research Agents [21.17856299966841]
本研究では,学術調査における大規模言語モデル(LLM)の評価のためのベンチマークであるResearchArenaを紹介する。
これらの機会を養うため、12万のフルテキスト学術論文と7.9Kのサーベイ論文の環境を構築した。
論文 参考訳(メタデータ) (2024-06-13T03:26:30Z) - AutoSurvey: Large Language Models Can Automatically Write Surveys [77.0458309675818]
本稿では,総合的な文献調査を自動作成する手法であるAutoSurveyを紹介する。
従来の調査論文は、膨大な量の情報と複雑さのために、課題に直面している。
我々の貢献には、調査問題に対する総合的な解決策、信頼性評価方法、AutoSurveyの有効性を実証する実験的な検証が含まれる。
論文 参考訳(メタデータ) (2024-06-10T12:56:06Z) - Artificial intelligence to automate the systematic review of scientific
literature [0.0]
我々は過去15年間に提案されたAI技術について,研究者が科学的文献の体系的な分析を行うのを助けるために調査を行った。
現在サポートされているタスク、適用されるアルゴリズムの種類、34の初等研究で提案されているツールについて説明する。
論文 参考訳(メタデータ) (2024-01-13T19:12:49Z) - A Survey on Query-based API Recommendation [12.999521865816185]
アプリケーションプログラミングインターフェース(API)は、開発者がより効率的にソフトウェアを構築するのに役立つように設計されています。
この研究領域を理解するため,過去10年間に公開されたAPIレコメンデーション研究を分析した。
論文 参考訳(メタデータ) (2023-12-17T06:39:10Z) - CRUISE-Screening: Living Literature Reviews Toolbox [8.292338880619061]
CRUISE-Screeningは、生物文学レビューを行うためのウェブベースのアプリケーションである。
APIを通じて複数の検索エンジンに接続しており、定期的に検索結果を更新することができる。
論文 参考訳(メタデータ) (2023-09-04T15:58:43Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - A multi-language toolkit for the semi-automated checking of research outputs [0.44998333629984877]
本稿では、セキュアなデータ環境におけるプライバシー開示のための研究出力(SACRO)の半自動チェックをサポートする、フリーでオープンソースのツールキットについて述べる。
SACROは、研究者が分析を行う際に、最も実践的な原理に基づく統計開示制御(SDC)技術を適用したフレームワークである。
このツールキットは、テーブル、プロット、統計モデルなどの出力を生成するよく知られた分析ツールの上に置かれる軽量のPythonパッケージで構成されている。
論文 参考訳(メタデータ) (2022-12-06T12:45:15Z) - A Review of Uncertainty Quantification in Deep Learning: Techniques,
Applications and Challenges [76.20963684020145]
不確実性定量化(UQ)は、最適化と意思決定プロセスの両方において不確実性の低減に重要な役割を果たしている。
ビザレ近似とアンサンブル学習技術は、文学において最も広く使われている2つのUQ手法である。
本研究は, 深層学習におけるUQ手法の最近の進歩を概観し, 強化学習におけるこれらの手法の適用について検討する。
論文 参考訳(メタデータ) (2020-11-12T06:41:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。