論文の概要: Experimenting with Large Language Models and vector embeddings in NASA
SciX
- arxiv url: http://arxiv.org/abs/2312.14211v1
- Date: Thu, 21 Dec 2023 10:19:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-25 17:26:26.109632
- Title: Experimenting with Large Language Models and vector embeddings in NASA
SciX
- Title(参考訳): NASA SciXにおける大規模言語モデルとベクトル埋め込みの実験
- Authors: Sergi Blanco-Cuaresma, Ioana Ciuc\u{a}, Alberto Accomazzi, Michael J.
Kurtz, Edwin A. Henneken, Kelly E. Lockhart, Felix Grezes, Thomas Allen,
Golnaz Shapurian, Carolyn S. Grant, Donna M. Thompson, Timothy W. Hostetler,
Matthew R. Templeton, Shinyi Chen, Jennifer Koch, Taylor Jacovich, Daniel
Chivvis, Fernanda de Macedo Alves, Jean-Claude Paquin, Jennifer Bartlett,
Mugdha Polimera, and Stephanie Jarmak
- Abstract要約: 我々は,大量の抽象文と全文コンテンツを集めたセマンティックベクターを開発した。
システムからコンテキストチャンクを用いて質問を行うプロンプトシステムを設計した。
非体系的な人的評価に基づいて、この実験は、検索拡張生成を用いた場合、より低い幻覚とより良い応答を示す。
- 参考スコア(独自算出の注目度): 26.396350836111935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-source Large Language Models enable projects such as NASA SciX (i.e.,
NASA ADS) to think out of the box and try alternative approaches for
information retrieval and data augmentation, while respecting data copyright
and users' privacy. However, when large language models are directly prompted
with questions without any context, they are prone to hallucination. At NASA
SciX we have developed an experiment where we created semantic vectors for our
large collection of abstracts and full-text content, and we designed a prompt
system to ask questions using contextual chunks from our system. Based on a
non-systematic human evaluation, the experiment shows a lower degree of
hallucination and better responses when using Retrieval Augmented Generation.
Further exploration is required to design new features and data augmentation
processes at NASA SciX that leverages this technology while respecting the high
level of trust and quality that the project holds.
- Abstract(参考訳): オープンソースのLarge Language Modelsは、NASA SciX(つまりNASA ADS)のようなプロジェクトで、データの著作権とユーザのプライバシーを尊重しながら、情報検索とデータ拡張のための代替アプローチを試すことができる。
しかし、大きな言語モデルが文脈のない質問で直接誘導される場合、幻覚を起こす傾向にある。
nasa scixで私たちは、大量の抽象とフルテキストコンテンツのためのセマンティックベクターを作成する実験を開発し、システムからコンテキストチャンクを使って質問するプロンプトシステムを設計しました。
非体系的人間評価に基づいて,検索拡張生成を用いた場合の幻覚の程度が低く,反応も良好であることを示す。
NASA SciXでは、この技術を活用しながら、プロジェクトの持つ高いレベルの信頼と品質を尊重する新機能とデータ拡張プロセスを設計するために、さらなる調査が必要である。
関連論文リスト
- Towards a Reliable Offline Personal AI Assistant for Long Duration Spaceflight [4.382282101149638]
本稿では, GPT, Retrieval-Augmented Generation (RAG), Knowledge Graphs (KGs), Augmented Reality (AR)を統合したMETISなどの拡張システムを提案する。
そのアイデアは、宇宙飛行士が自然言語のクエリを使って、より直感的に自分のデータと対話し、ARでリアルタイム情報を視覚化できるようにすることだ。
論文 参考訳(メタデータ) (2024-10-21T18:08:42Z) - Adapting a Foundation Model for Space-based Tasks [16.81793096235458]
宇宙ロボティクスの将来において、宇宙ベースのアプリケーションに適応した基礎モデルの使用を動機付ける3つのコア課題が見られます。
本研究では,1)既存の視覚言語モデルは空間ベースアプリケーションでは不十分な視覚推論モデルであり,2)地球外データ上での視覚言語モデルの微調整は応答の質を著しく向上させることを示した。
論文 参考訳(メタデータ) (2024-08-12T05:07:24Z) - UltraFeedback: Boosting Language Models with Scaled AI Feedback [99.4633351133207]
大規模で高品質で多様なAIフィードバックデータセットである textscUltraFeedback を提示する。
我々の研究は、強力なオープンソースのチャット言語モデルを構築する上で、スケールしたAIフィードバックデータの有効性を検証する。
論文 参考訳(メタデータ) (2023-10-02T17:40:01Z) - AutoHall: Automated Hallucination Dataset Generation for Large Language Models [56.92068213969036]
本稿では,AutoHallと呼ばれる既存のファクトチェックデータセットに基づいて,モデル固有の幻覚データセットを自動的に構築する手法を提案する。
また,自己コントラディションに基づくゼロリソース・ブラックボックス幻覚検出手法を提案する。
論文 参考訳(メタデータ) (2023-09-30T05:20:02Z) - NASA Science Mission Directorate Knowledge Graph Discovery [0.0]
本稿では,NASAの異なる領域を表す知識グラフ(KG)を生成するパイプラインを提案する。
これらのKGは、データセット検索エンジンの基礎として使用でき、研究者の時間を節約し、新しいコネクションを見つけるのをサポートする。
論文 参考訳(メタデータ) (2023-03-20T05:12:43Z) - Artificial Intelligence and Natural Language Processing and
Understanding in Space: Four ESA Case Studies [48.53582660901672]
本稿では,空間文書から情報を自動的に抽出するための,人工知能と自然言語処理と理解に基づく方法論的枠組みを提案する。
ケーススタディはミッションデザイン、品質保証、長期データ保存、オープンスペースイノベーションプラットフォームなど、ESAのさまざまな機能領域で実装されている。
論文 参考訳(メタデータ) (2022-10-07T15:50:17Z) - SpaceQA: Answering Questions about the Design of Space Missions and
Space Craft Concepts [57.012600276711005]
宇宙ミッション設計における最初のオープンドメインQAシステムであるSpaceQAについて述べる。
SpaceQAは、欧州宇宙機関(ESA)による、宇宙ミッションの設計に関する情報のアクセス、共有、再利用を容易にするイニシアチブの一部である。
論文 参考訳(メタデータ) (2022-10-07T09:41:39Z) - MuRAG: Multimodal Retrieval-Augmented Generator for Open Question
Answering over Images and Text [58.655375327681774]
我々は,Multimodal Retrieval-Augmented Transformer (MuRAG)を提案する。
MuRAGは外部の非パラメトリックマルチモーダルメモリにアクセスして言語生成を増強する。
以上の結果から, MuRAGは最先端の精度を達成し, 既存のモデルよりも10~20%精度が高いことがわかった。
論文 参考訳(メタデータ) (2022-10-06T13:58:03Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - A Spacecraft Dataset for Detection, Segmentation and Parts Recognition [42.27081423489484]
本稿では,宇宙船検出,インスタンスのセグメンテーション,部分認識のためのデータセットをリリースする。
この研究の主な貢献は、宇宙ステーションと衛星の画像を用いたデータセットの開発である。
また、データセットのベンチマークとして、オブジェクト検出やインスタンスセグメンテーションにおける最先端の手法による評価も提供する。
論文 参考訳(メタデータ) (2021-06-15T14:36:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。