Fugu-MT 論文翻訳(概要): Unstructured and structured data: Can we have the best of both worlds with large language models?

関連論文リスト

Integrating Unstructured Text into Causal Inference: Empirical Evidence from Real Data [3.6081423220512945]
本稿では,非構造化テキストを用いた因果推論を行うためにトランスフォーマーに基づく言語モデルを利用するフレームワークを提案する。本研究では,非構造化テキストから得られた因果推定値と,人口,集団,個人レベルで得られた構造化データとを比較して,本フレームワークの有効性を実証する。我々のアプローチは、因果推論手法の適用性を、テキストデータのみが利用可能なシナリオに拡張する。
論文参考訳（メタデータ） (2026-02-15T18:55:03Z)
OmniStruct: Universal Text-to-Structure Generation across Diverse Schemas [57.49565459553627]
OmniStructは、テキストから構造までのタスクにおいて、大規模言語モデルの能力を評価するためのベンチマークである。我々は,効率的なテキスト・ツー・ストラクチャ・モデルの開発を容易にするために,合成タスク生成による高品質なトレーニングデータを収集する。本実験は, 合成データのより小さなモデルから, 普遍構造生成モデルへの微調整の可能性を示すものである。
論文参考訳（メタデータ） (2025-11-23T08:18:12Z)
DISRetrieval: Harnessing Discourse Structure for Long Document Retrieval [51.89673002051528]
DISRetrievalは、言語談話構造を利用して長い文書理解を強化する新しい階層的検索フレームワークである。本研究は,談話構造が文書の長さや問合せの種類によって検索効率を著しく向上することを確認する。
論文参考訳（メタデータ） (2025-05-26T14:45:12Z)
Comparative Evaluation of Prompting and Fine-Tuning for Applying Large Language Models to Grid-Structured Geospatial Data [0.5249805590164902]
我々は、構造化されたプロンプトを通してベースモデルの性能を評価し、ユーザ・アシスタントインタラクションのデータセットに基づいて訓練された微調整された変種と対比する。
論文参考訳（メタデータ） (2025-05-21T16:27:51Z)
Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction [23.47150047875133]
文書解析は、構造化されていない文書と半構造化された文書を機械可読データに変換するのに不可欠である。文書解析は知識ベースの構築とトレーニングデータ生成において不可欠である。本稿では,モジュール型文書解析システムと複雑なレイアウト処理における視覚言語モデルが直面する課題について論じる。
論文参考訳（メタデータ） (2024-10-28T16:11:35Z)
Exploring the Role of Reasoning Structures for Constructing Proofs in Multi-Step Natural Language Reasoning with Large Language Models [30.09120709652445]
本稿では,現在最先端のジェネラリスト LLM がいくつかの例でこれらの構造を活用でき,テキスト・コンテクスト・ラーニングによる証明構造をより良く構築できるかどうかという,焦点を絞った研究に焦点をあてる。
論文参考訳（メタデータ） (2024-10-11T00:45:50Z)
BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.936320820180875]
大規模言語モデル(LLM)は、様々な領域でますます重要になっている。 BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。 BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文参考訳（メタデータ） (2024-10-01T15:11:24Z)
UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文参考訳（メタデータ） (2024-06-23T06:58:55Z)
dIR -- Discrete Information Retrieval: Conversational Search over Unstructured (and Structured) Data with Large Language Models [0.16060477887377675]
本稿では,自由テキストと構造化知識の両方を問う統一インターフェースとして,dIR,disrete Information Retrievalを提案する。我々は、独自の質問/回答データセットを用いて、我々のアプローチを検証し、dIRがフリーテキスト上で全く新しいクエリーのクラスを作成できると結論付けた。
論文参考訳（メタデータ） (2023-12-20T18:41:44Z)
Bridging the Gap: Deciphering Tabular Data Using Large Language Model [4.711941969101732]
この研究は、テーブルベースの質問応答タスクへの大規模言語モデルの初めての応用である。拡張言語モデルとのシームレスな統合のために,テーブルのシリアライズに特有なモジュールを設計しました。
論文参考訳（メタデータ） (2023-08-23T03:38:21Z)
Physics of Language Models: Part 1, Learning Hierarchical Language Structures [51.68385617116854]
トランスフォーマーベースの言語モデルは効率的だが複雑であり、内部動作を理解することは大きな課題である。本稿では,長文を生成可能な階層規則を生成する合成CFGのファミリーを紹介する。我々は、GPTのような生成モデルがこのCFG言語を正確に学習し、それに基づいて文を生成することを実証する。
論文参考訳（メタデータ） (2023-05-23T04:28:16Z)
StructGPT: A General Framework for Large Language Model to Reason over Structured Data [117.13986738340027]
我々は,構造化データに基づく質問応答タスクの解法として,emphIterative Reading-then-Reasoning(IRR)アプローチを開発した。提案手法はChatGPTの性能を大幅に向上させ,全データの教師付きベースラインに対して同等のパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-05-16T17:45:23Z)
Model Criticism for Long-Form Text Generation [113.13900836015122]
我々は,テキストの高レベル構造を評価するために,潜在空間におけるモデル批判という統計ツールを適用した。我々は,コヒーレンス,コア,トピックスという,ハイレベルな談話の3つの代表的な側面について実験を行った。トランスフォーマーベースの言語モデルでは、トピック構造をキャプチャできるが、構造コヒーレンスやモデリングコアスを維持するのが難しくなる。
論文参考訳（メタデータ） (2022-10-16T04:35:58Z)
Does Structure Matter? Leveraging Data-to-Text Generation for Answering Complex Information Needs [3.5331191621809794]
データ・テキスト・ジェネレーションの観点から,生成モデルの利用を想定する。中間計画を生成することで回答を構造化することを目的とした,コンテンツ選択計画パイプラインの利用を提案する。 TREC Complex Answer Retrieval (CAR) データセットを用いて実験評価を行った。
論文参考訳（メタデータ） (2021-12-08T15:51:27Z)
CateCom: a practical data-centric approach to categorization of computational models [77.34726150561087]
本稿では,物理モデルとデータ駆動型計算モデルのランドスケープを整理する取り組みについて述べる。オブジェクト指向設計の概念を適用し、オープンソース協調フレームワークの基礎を概説する。
論文参考訳（メタデータ） (2021-09-28T02:59:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: Unstructured and structured data: Can we have the best of both worlds with large language models?

関連論文リスト