OmnixR: Evaluating Omni-modality Language Models on Reasoning across Modalities [124.1] 我々は、SoTA Omni-modality Language Modelsをベンチマークするために設計された評価スイートであるOmnixRを紹介する。
OLMはテキスト、ビジョン、オーディオなどの複数のモードを統合し、ユニークな課題を提示する。
実験の結果,OmnixR問題に対処するためには,複数のモダリティからの情報を統合する必要があることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:29:46 GMT)
The Curse of Multi-Modalities: Evaluating Hallucinations of Large Multimodal Models across Language, Visual, and Audio [118.8] 本稿では,大規模マルチモーダルモデル(LMM)における幻覚に関する最初の系統的研究について述べる。
本研究は,幻覚に対する2つの重要な要因を明らかにした。
私たちの研究は、モダリティ統合の不均衡やトレーニングデータからのバイアスなど、重要な脆弱性を強調し、モダリティ間のバランスの取れた学習の必要性を強調した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:59:02 GMT)
Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate [118.4] 本稿では,LVLM(Large Vision Language Models)のマルチモーダル事前学習品質を示すために,MIR(Modality Integration Rate)を提案する。
MIRは、トレーニングデータ選択、トレーニング戦略スケジュール、モデルアーキテクチャ設計に重点を置いて、トレーニング前の結果を改善する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:23:03 GMT)
Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate [118.4] 本稿では,LVLM(Large Vision Language Models)のマルチモーダル事前学習品質を示すために,MIR(Modality Integration Rate)を提案する。
MIRは、トレーニングデータ選択、トレーニング戦略スケジュール、モデルアーキテクチャ設計に重点を置いて、トレーニング前の結果を改善する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:23:03 GMT)
Neuron-based Personality Trait Induction in Large Language Models [115.1] 大規模言語モデル (LLM) は、様々な性格特性をシミュレートする能力が増している。
LLMにおけるパーソナリティ特性誘導のためのニューロンに基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:47:45 GMT)
One Step Diffusion via Shortcut Models [109.7] 単一ネットワークとトレーニングフェーズを用いて高品質なサンプルを生成する,生成モデルのファミリであるショートカットモデルを導入する。
ショートカットモデルは、現在のノイズレベルと所望のステップサイズにネットワークを条件付け、生成プロセスでモデルをスキップすることができる。
蒸留と比較して、ショートカットモデルは複雑性を1つのネットワークとトレーニングフェーズに減らし、推論時に様々なステップ予算を許容する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:34:40 GMT)
Self-supervised Learning of LiDAR 3D Point Clouds via 2D-3D Neural Calibration [107.6] 本稿では,自律走行シーンにおける3次元知覚を高めるための,新しい自己教師型学習フレームワークを提案する。
本稿では,画像とポイントクラウドデータの領域ギャップを埋めるために,学習可能な変換アライメントを提案する。
我々は剛性ポーズを推定するために密度の高い2D-3D対応を確立する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:19:28 GMT)
Merge to Learn: Efficiently Adding Skills to Language Models with Model Merging [102.2] 汎用言語モデルを新しいスキルに適用することは、現在、高価なプロセスである。
既存のモデルに新たなスキルを付加する効果について,新たなスキルを単独で訓練し,その後一般モデルとマージすることによって検討した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:23:50 GMT)
Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance [95.0] 我々は、人間の指示なしにタスクを予測および開始できるプロアクティブエージェントを開発するという課題に取り組む。
まず,実世界の人的活動を収集し,前向きなタスク予測を生成する。
これらの予測は、ヒトのアノテータによって受け入れられるか拒否されるかのどちらかとしてラベル付けされる。
ラベル付きデータは、人間の判断をシミュレートする報酬モデルをトレーニングするために使用される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:24:09 GMT)
Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.4] 本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:28:12 GMT)
Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models [83.3] 大規模言語モデル(LLM)は知識ギャップと幻覚のために忠実な推論に苦しむ。
グラフ制約推論(GCR)は、KGにおける構造的知識とLLMにおける非構造的推論を橋渡しする新しいフレームワークである。
GCRは最先端のパフォーマンスを達成し、追加のトレーニングをすることなく、見えないKGに対して強力なゼロショット一般化性を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:55:17 GMT)
Identifying and Addressing Delusions for Target-Directed Decision-Making [81.2] 我々は,意思決定時計画において目標を導出する目標指向エージェントに興味を持ち,その行動の指導と評価時の一般化の促進を図っている。
これらのエージェントの不適切な訓練は妄想を招きかねない: エージェントはターゲットについて誤った信念を抱き、それは適切に拒否できないため、望ましくない行動につながり、アウト・オブ・ディストリビューションの一般化を損なう。
我々は、ターゲット指向のRLエージェントを訓練するための主流アプローチであるHendsight relabelingによって訓練されたエージェントに対して、妄想がどのように対処できるかを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:46:35 GMT)
Identifying and Addressing Delusions for Target-Directed Decision-Making [81.2] 我々は,意思決定時計画において目標を導出する目標指向エージェントに興味を持ち,その行動の指導と評価時の一般化の促進を図っている。
これらのエージェントの不適切な訓練は妄想を招きかねない: エージェントはターゲットについて誤った信念を抱き、それは適切に拒否できないため、望ましくない行動につながり、アウト・オブ・ディストリビューションの一般化を損なう。
我々は、ターゲット指向のRLエージェントを訓練するための主流アプローチであるHendsight relabelingによって訓練されたエージェントに対して、妄想がどのように対処できるかを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:46:35 GMT)
Identifying and Addressing Delusions for Target-Directed Decision-Making [81.2] 我々は,意思決定時計画において目標を導出する目標指向エージェントに興味を持ち,その行動の指導と評価時の一般化の促進を図っている。
これらのエージェントの不適切な訓練は妄想を招きかねない: エージェントはターゲットについて誤った信念を抱き、それは適切に拒否できないため、望ましくない行動につながり、アウト・オブ・ディストリビューションの一般化を損なう。
我々は、ターゲット指向のRLエージェントを訓練するための主流アプローチであるHendsight relabelingによって訓練されたエージェントに対して、妄想がどのように対処できるかを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:46:35 GMT)
Identifying and Addressing Delusions for Target-Directed Decision-Making [81.2] ターゲット指向のエージェントは、問題のあるターゲットを盲目的に追跡する傾向があり、その結果、より一層の一般化と安全性の破滅が生じる。
制御環境における直感的な例を通して異なる種類の妄想を識別し,その原因と緩和について検討する。
提案手法の有効性を実証的に検証し,妄想行動の補正とアウト・オブ・ディストリビューションの一般化の改善を図る。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:46:35 GMT)
MarkLLM: An Open-Source Toolkit for LLM Watermarking [80.0] MarkLLMは、LLMウォーターマーキングアルゴリズムを実装するためのオープンソースのツールキットである。
評価のために、MarkLLMは3つの視点にまたがる12のツールと、2種類の自動評価パイプラインを提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:13:51 GMT)
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Self-Regularization [77.6] そこで本研究では,事前訓練した重みを効率よく微調整する直交微調整法を導入し,頑健さと一般化の強化を実現した。
自己正規化戦略は、OrthSRと呼ばれるVLMのゼロショット一般化の観点から安定性を維持するためにさらに活用される。
筆者らはCLIPとCoOpを再検討し,少数の画像のクラスフィシエーションシナリオにおけるモデルの改善を効果的に行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:37:14 GMT)
Understanding the Role of LLMs in Multimodal Evaluation Benchmarks [77.6] 本稿では,MLLM評価におけるLarge Language Model (LLM)バックボーンの役割について検討する。
本研究は4つのMLLMベンチマークと8つの最先端MLLMベンチマークを含む。
鍵となる発見は、いくつかのベンチマークでは視覚的な入力がなくても高いパフォーマンスを実現しており、最大50%のエラーレートは、LLMバックボーンにおける不十分な世界的知識に起因していることを示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:49:13 GMT)
Diffusion Language Models Are Versatile Protein Learners [76.0] 本稿では,タンパク質配列の強い生成および予測能力を示す多目的なタンパク質言語モデルである拡散タンパク質言語モデル(DPLM)を紹介する。
まず, 自己制御型離散拡散確率フレームワークを用いて, 進化的タンパク質配列からのスケーラブルDPLMの事前学習を行った。
プレトレーニング後、DPLMは非条件生成のための構造的に可塑性で新規で多様なタンパク質配列を生成する能力を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:26:16 GMT)
Fusion from Decomposition: A Self-Supervised Approach for Image Fusion and Beyond [75.0] 画像融合の本質は、ソース画像からの相補的な情報を統合することである。
DeFusion++は、画像融合の品質を高め、下流の高レベル視覚タスクの有効性を高める、汎用的な融合表現を生成する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:28:49 GMT)
Hyper-YOLO: When Visual Object Detection Meets Hypergraph Computation [74.7] 本稿では,画像特徴量間の複雑な高次相関を捉えるためにハイパーグラフ計算を統合する新しいオブジェクト検出手法を提案する。
Hyper-YOLOは、高度なYOLOv8-NとYOLOv9Tを12%のtextval$と9%のAPMoonLabの改善で大幅に上回っている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:20:58 GMT)
WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines [74.3] 視覚言語モデル(VLM)は、特に英語以外の言語において、文化特有の知識に苦しむことが多い。
我々は多言語および多文化の視覚的理解のための大規模ベンチマークであるWorld Cuisinesを紹介した。
このベンチマークには、30の言語と方言にまたがるテキストイメージペアを備えた、視覚的質問応答(VQA)データセットが含まれている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:11:49 GMT)
A3D: Does Diffusion Dream about 3D Alignment? [74.0] 幾何学的アライメントの観点からテキスト駆動型3D生成の問題に取り組む。
テキストプロンプトのセットが与えられたら、意味的に対応する部分同士が整列したオブジェクトの集合を生成することを目指している。
我々は、これらのオブジェクトを共通の潜在空間に埋め込み、これらのオブジェクト間の連続的な遷移を最適化することを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:58:16 GMT)
Self-Comparison for Dataset-Level Membership Inference in Large (Vision-)Language Models [73.9] 本稿では,自己比較に基づくデータセットレベルのメンバシップ推定手法を提案する。
本手法では, 同一分布における地中構造データや非構造データへのアクセスは不要である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:05:59 GMT)
Reverse Stable Diffusion: What prompt was used to generate this image? [73.1] 本研究では, 生成拡散モデルにより生成された画像に対して, 迅速な埋め込みを予測できる課題について検討する。
本稿では,複数ラベルの語彙分類を目的とする共同学習フレームワークを提案する。
我々はDiffusionDBデータセットの実験を行い、安定拡散によって生成された画像からテキストプロンプトを予測する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:37:11 GMT)
Cross-Modal Safety Mechanism Transfer in Large Vision-Language Models [72.8] LVLM(Large Vision-Language Models)における視覚言語アライメントにより、LLMは視覚入力を理解することができる。
既存の視覚言語アライメント手法では,LLMにおけるテキストの安全性機構を視覚に転送できないことがわかった。
LVLMのための新しいテキストガイド型視覚言語アライメント法(TGA)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:20:08 GMT)
BroadWay: Boost Your Text-to-Video Generation Model in a Training-free Way [72.2] そこで,BroadWayを提案する。BroadWayは,追加パラメータやメモリ増設,サンプリング時間を追加することなく,テキスト・ビデオ・ジェネレーションの品質を向上するためのトレーニング不要な手法である。
具体的には、BroadWayは2つの主要コンポーネントから構成される: 1) 時間的自己誘導は、様々なデコーダブロック間の時間的注意マップ間の格差を減らし、生成されたビデオの構造的妥当性と時間的一貫性を改善する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:39:54 GMT)
BroadWay: Boost Your Text-to-Video Generation Model in a Training-free Way [72.2] そこで,BroadWayを提案する。BroadWayは,追加パラメータやメモリ増設,サンプリング時間を追加することなく,テキスト・ビデオ・ジェネレーションの品質を向上するためのトレーニング不要な手法である。
具体的には、BroadWayは2つの主要コンポーネントから構成される: 1) 時間的自己誘導は、様々なデコーダブロック間の時間的注意マップ間の格差を減らし、生成されたビデオの構造的妥当性と時間的一貫性を改善する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:39:54 GMT)
ProSA: Assessing and Understanding the Prompt Sensitivity of LLMs [72.1] ProSAは、大規模な言語モデルにおいて、迅速な感度を評価し、理解するために設計されたフレームワークである。
我々の研究は、データセットやモデル間で迅速に感度が変動することを発見し、より大きなモデルでは堅牢性が向上することを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:38:13 GMT)
Bridging the Language Gaps in Large Language Models with Inference-Time Cross-Lingual Intervention [71.1] 大規模言語モデル(LLM)は自然言語処理において顕著な能力を示している。
LLMは異なる言語間で大きな性能差を示す。
Inference-Time Cross-Lingual Intervention (INCLINE) を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:23:03 GMT)
DOCE: Finding the Sweet Spot for Execution-Based Code Generation [69.5] 本稿では,候補生成,$n$-best再ランク,最小ベイズリスク(MBR)復号化,自己老化などを含む包括的フレームワークを提案する。
本研究は,実行ベースメソッドの重要性と,実行ベースメソッドと実行フリーメソッドとの差を明らかにする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:07:41 GMT)
Parametric Graph Representations in the Era of Foundation Models: A Survey and Position [69.5] グラフは、包括的なリレーショナルデータをモデル化するために、過去数十年間、ビッグデータとAIで広く使われてきた。
有意義なグラフ法則の同定は、様々な応用の有効性を著しく向上させることができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:01:31 GMT)
PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation [68.2] ロボット操作のためのPrIrmitive-driVen waypOinT-aware world model(PIVOT-R)を提案する。
PIVOT-RはWAWM(Waypoint-aware World Model)と軽量アクション予測モジュールで構成される。
私たちのPIVOT-RはSeaWaveベンチマークで最先端のオープンソースモデルより優れており、4段階の命令タスクで平均19.45%の相対的な改善を実現しています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:20:44 GMT)
PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation [68.2] ロボット操作のためのPrIrmitive-driVen waypOinT-aware world model(PIVOT-R)を提案する。
PIVOT-RはWAWM(Waypoint-aware World Model)と軽量アクション予測モジュールで構成される。
私たちのPIVOT-RはSeaWaveベンチマークで最先端のオープンソースモデルより優れており、4段階の命令タスクで平均19.45%の相対的な改善を実現しています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:20:44 GMT)
VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos [67.8] ビデオデータの冗長性が高いため、ビデオの長文理解は難しい課題となっている。
我々は,クエリ適応的かつ階層的なビデオ表現を構築する,トレーニングフリーのフレームワークであるVideoTreeを提案する。
実験の結果,本フレームワークは従来の手法と比較して,推論精度と効率性を両立していることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:15:15 GMT)
Dynamic Tuning Towards Parameter and Inference Efficiency for ViT Adaptation [67.1] 動的チューニング(DyT)は、ViT適応のためのパラメータと推論効率を改善するための新しいアプローチである。
DyTは既存のPEFT法に比べて性能が優れており、VTAB-1KベンチマークではFLOPの71%しか呼び出されていない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:18:53 GMT)
SAFREE: Training-Free and Adaptive Guard for Safe Text-to-Image And Video Generation [65.3] 安全な生成のための学習/編集に基づく手法は、モデルから有害な概念を取り除くが、いくつかの課題に直面している。
安全なT2IとT2VのためのトレーニングフリーアプローチであるSAFREEを提案する。
テキスト埋め込み空間における有毒な概念の集合に対応する部分空間を検出し、この部分空間から直ちに埋め込みを行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:32:23 GMT)
Mind the Gap Between Prototypes and Images in Cross-domain Finetuning [65.0] プロトタイプと画像にそれぞれ異なる変換を適用するために,コントラスト型プロトタイプイメージ適応(CoPA)を提案する。
Meta-Datasetの実験では、CoPAが最先端のパフォーマンスをより効率的に達成できることが示されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:42:11 GMT)
Towards Neural Scaling Laws for Time Series Foundation Models [63.5] 我々は、エンコーダオンリーとデコーダオンリーのトランスフォーマーの2つの一般的なTSFMアーキテクチャについて検討し、IDおよびOODデータのスケーリング挙動について検討する。
実験の結果,TSFMのログライクな損失はOODとID設定の両方で同様のスケーリング挙動を示すことがわかった。
モデル機能を強化した大規模TSFMの設計とスケーリングのための実用的なガイドラインを提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:23:39 GMT)
Large Language Models in the Clinic: A Comprehensive Benchmark [63.2] 診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
まず、さまざまな臨床言語の生成、理解、推論タスクを含む11の既存のデータセットを収集します。
次に,現実の実践において複雑だが一般的である6つの新しいデータセットと臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:18:58 GMT)
MC-Bench: A Benchmark for Multi-Context Visual Grounding in the Era of MLLMs [61.6] 本稿では,マルチコンテキストの視覚的グラウンド化という新しい視覚的グラウンド化タスクを提案する。
オープンなテキストプロンプトに基づいて、複数の画像にまたがる関心のインスタンスをローカライズすることを目的としている。
我々は20以上の最先端MLLMと基盤モデルをベンチマークし、潜在的にマルチコンテキストの視覚的グラウンド化機能を有する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:52:57 GMT)
Agent-as-a-Judge: Evaluate Agents with Agents [61.3] 本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:54:12 GMT)
JudgeBench: A Benchmark for Evaluating LLM-based Judges [61.0] judgeBenchは、知識、推論、数学、コーディングにまたがる挑戦的な応答ペアに関するLSMベースの判断を評価するためのベンチマークである。
審査員、微調整された審査員、マルチエージェントの審査員、報酬モデルに関する包括的な評価は、審査員ベンチが以前のベンチマークよりもかなり大きな課題を課していることを示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:58:19 GMT)
Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.9] 本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:59:31 GMT)
How Does Variance Shape the Regret in Contextual Bandits? [59.8] 一般関数近似を用いた文脈的包帯について考察する。
共振器次元 $d_textelu$-$play が分散依存境界において重要な役割を果たすことを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:20:07 GMT)
Breaking Language Barriers in Multilingual Mathematical Reasoning: Insights and Observations [59.1] 本稿では, マルチリンガル数学推論 (xMR) LLM の探索と学習の先駆者である。
我々は10の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
翻訳を利用して、10個の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:26:04 GMT)
VersiCode: Towards Version-controllable Code Generation [58.8] 大規模言語モデル(LLM)は、コード生成において大きな進歩を遂げていますが、既存の研究は、ソフトウェア開発の動的な性質を説明できません。
バージョン別コード補完(VSCC)とバージョン別コードマイグレーション(VACM)の2つの新しいタスクを提案する。
VersiCodeについて広範な評価を行い、バージョン管理可能なコード生成が確かに重要な課題であることを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:56:24 GMT)
HyperDreamBooth: HyperNetworks for Fast Personalization of Text-to-Image Models [58.4] HyperDreamBoothは、単一のイメージから小さなパーソナライズされた重みを効率的に生成できるハイパーネットワークである。
本手法は,DreamBoothの約20秒,DreamBoothの約25倍,Textual Inversionの125倍の速さで顔のパーソナライズを実現する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:55:27 GMT)
Investigating the Transferability of Code Repair for Low-Resource Programming Languages [57.6] 大規模言語モデル(LLM)は、コード生成タスクにおいて顕著なパフォーマンスを示している。
近年の作業は、連鎖推論や蒸留といった現代的な技術を統合することで、コード修復のプロセスを強化している。
高低資源言語と低低資源言語の両方でコード修復を蒸留する利点について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:03:04 GMT)
Latent Inversion with Timestep-aware Sampling for Training-free Non-rigid Editing [56.5] 安定拡散を用いた非剛性編集のための学習自由アプローチを提案する。
提案手法は,テキスト最適化,潜時反転,タイムステップ対応テキストインジェクションサンプリングの3段階からなる。
本手法の有効性を,アイデンティティの保存,編集性,美的品質の観点から示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:16:31 GMT)
Free Video-LLM: Prompt-guided Visual Perception for Efficient Training-free Video LLMs [56.0] トレーニング不要ビデオLLMの効率的な推論のための新しいプロンプト誘導視覚認識フレームワーク(略してemphFree Video-LLM)を提案する。
提案手法は,複数のビデオ質問応答ベンチマークにおいて高い性能を維持しながら,視覚トークンの数を効果的に削減する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:45:06 GMT)
Free Video-LLM: Prompt-guided Visual Perception for Efficient Training-free Video LLMs [56.0] トレーニング不要ビデオLLMの効率的な推論のための新しいプロンプト誘導視覚認識フレームワーク(Free Video-LLM)を提案する。
提案手法は,複数のビデオ質問応答ベンチマークにおいて高い性能を維持しながら,視覚トークンの数を効果的に削減する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:45:06 GMT)
FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [56.0] 分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:13:19 GMT)
Open Domain Question Answering with Conflicting Contexts [55.7] あいまいでオープンなドメインの質問の25%は、Google Searchを使って検索すると、コンフリクトのあるコンテキストにつながります。
我々はアノテータに正しい回答の選択についての説明を依頼する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:24:28 GMT)
Towards LLM-based Cognitive Models of Students with Misconceptions [55.3] 本稿では,この2つの要件を満たすためにLLM(Large Language Models)を命令調整できるかどうかを検討する。
真正な学生ソリューションパターンを反映したデータセットを生成する新しいPythonライブラリであるMalAlgoPyを紹介する。
我々の洞察は、AIに基づく学生モデルの理解を高め、効果的な適応学習システムへの道を開く。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:51:09 GMT)
Seeker: Enhancing Exception Handling in Code with LLM-based Multi-Agent Approach [54.0] 現実世界のソフトウェア開発では、不適切な例外処理がコードの堅牢性と信頼性に重大な影響を与えます。
コードにおける例外処理を改善するために,大規模言語モデル (LLM) の利用について検討する。
例外処理のエキスパート開発者戦略にインスパイアされたマルチエージェントフレームワークであるSeekerを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:04:45 GMT)
Seeker: Enhancing Exception Handling in Code with LLM-based Multi-Agent Approach [54.0] 現実世界のソフトウェア開発では、不適切な例外処理がコードの堅牢性と信頼性に重大な影響を与えます。
コードにおける例外処理を改善するために,大規模言語モデル (LLM) の利用について検討する。
例外処理のエキスパート開発者戦略にインスパイアされたマルチエージェントフレームワークであるSeekerを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:04:45 GMT)
Gravity-aligned Rotation Averaging with Circular Regression [53.8] 我々は,重力方向をグローバルパイプラインの回転平均位相に統合する原理的アプローチを導入する。
4つの大規模データセットで最先端の精度を実現する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:37:43 GMT)
Understanding What Affects the Generalization Gap in Visual Reinforcement Learning: Theory and Empirical Evidence [53.5] 本稿では,テスト環境に障害がある場合の一般化ギャップに寄与する要因について理論的に考察する。
我々の理論は、人間の直観に沿う訓練環境とテスト環境の表現距離を最小化することが、一般化のギャップを減らすことの利点として最も重要であることを示唆している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:12:42 GMT)
Preference Optimization with Multi-Sample Comparisons [53.0] 本稿では,マルチサンプル比較を含むポストトレーニングの拡張手法を提案する。
これらのアプローチは、生成的多様性やバイアスといった重要な特徴を捉えられない。
マルチサンプル比較はシングルサンプル比較よりも集団特性の最適化に有効であることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:59:19 GMT)
Instruction Tuning for Large Language Models: A Survey [52.9] 我々は、ITの一般的な方法論、ITデータセットの構築、ITモデルのトレーニング、異なるモダリティ、ドメイン、アプリケーションへのアプリケーションを含む、文献を体系的にレビューする。
また、ITの潜在的な落とし穴とそれに対する批判、および既存の戦略の現在の欠陥を指摘し、実りある研究の道筋を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:44:07 GMT)
Stabilize the Latent Space for Image Autoregressive Modeling: A Unified Perspective [52.8] 遅延ベース画像生成モデルは、画像生成タスクにおいて顕著な成功を収めた。
同じ遅延空間を共有するにもかかわらず、自己回帰モデルは画像生成において LDM や MIM よりもかなり遅れている。
本稿では,画像生成モデルのための遅延空間を安定化する,単純だが効果的な離散画像トークン化手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:13:17 GMT)
MuVi: Video-to-Music Generation with Semantic Alignment and Rhythmic Synchronization [52.5] 本稿では,ビデオコンテンツに合わせた音楽を生成するためのフレームワークであるMuViについて述べる。
MuViは、特別に設計された視覚適応器を通じて映像コンテンツを分析し、文脈的および時間的に関係のある特徴を抽出する。
音声品質と時間同期の両方において, MuVi が優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:44:56 GMT)
BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models [52.5] 予測モデルは、現実世界のタスクで不完全な情報を扱う必要があることが多い。
現在の大規模言語モデル(LLM)は、そのような正確な推定には不十分である。
本稿では,新しい確率的推論フレームワークBIRDを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:45:10 GMT)
In-Context Learning Enables Robot Action Prediction in LLMs [52.3] 本稿では,ロボットの動作を直接予測する,オフザシェルフテキストのみの大規模言語モデルを実現するフレームワークであるRoboPromptを紹介する。
われわれのアプローチはまず、エピソードから重要な瞬間を捉えている。
我々は、初期オブジェクトのポーズだけでなく、エンドエフェクタアクションも抽出し、どちらもテキスト記述に変換する。
これにより、LLMはテスト時にロボットの動作を直接予測できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:56:49 GMT)
Table-LLM-Specialist: Language Model Specialists for Tables using Iterative Generator-Validator Fine-tuning [52.1] 本稿では,テーブルタスクに特化して設計された自己学習ファインチューニングパラダイムとして,テーブル-LLM-スペシャリスト(Table-LLM-Specialist,略してテーブル-スペシャリスト)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:04:17 GMT)
TAS: Distilling Arbitrary Teacher and Student via a Hybrid Assistant [52.0] 異質な教師と学生間の機能的知識の伝達を容易にするために,橋梁としてアシスタントモデルを導入する。
提案した設計原理の中では, クロスアーキテクチャ帰納バイアスとモジュール関数の利点を組み合わせたアシスタントモデルが提案されている。
提案手法は, CNN, ViT, 空間KDの同種モデルペアと任意の異種組み合わせを用いて評価する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:02:49 GMT)
Exploring Model Kinship for Merging Large Language Models [52.0] 本稿では,大規模言語モデル間の類似性や関連性の程度であるモデル親和性を紹介する。
モデル統合後の性能向上とモデル親和性の間には,一定の関係があることが判明した。
我々は新しいモデルマージ戦略を提案する。Top-k Greedy Merging with Model Kinship。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:29:29 GMT)
Multilinear Mixture of Experts: Scalable Expert Specialization through Factorization [52.0] Mixture of Experts (MoE)は、高密度層をより小さくモジュール化された計算に分解する強力な方法を提供する。
大きな課題は、きめ細かい特殊化を達成するのに十分高い専門家の数をスケーリングする計算コストである。
視覚モデルに焦点をあて、この問題に対処するため、Multilinear Mixture of Experts(mu$MoE)層を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:53:46 GMT)
Beyond Coarse-Grained Matching in Video-Text Retrieval [50.8] きめ細かい評価のための新しいアプローチを導入する。
テストキャプションを自動的に生成することで,既存のデータセットにアプローチを適用することができる。
きめ細かい評価実験は、このアプローチがきめ細かな違いを理解するモデルの能力を高めることを実証している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:42:29 GMT)
SeRTS: Self-Rewarding Tree Search for Biomedical Retrieval-Augmented Generation [50.3] 大規模言語モデル(LLM)は,検索増強世代(RAG)の進展に伴い,生物医学領域において大きな可能性を示した。
既存の検索強化アプローチは、様々なクエリやドキュメント、特に医療知識クエリに対処する上で、課題に直面している。
モンテカルロ木探索(MCTS)と自己回帰パラダイムに基づく自己回帰木探索(SeRTS)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:32:50 GMT)
Long-Tailed Backdoor Attack Using Dynamic Data Augmentation Operations [50.1] 既存のバックドア攻撃は主にバランスの取れたデータセットに焦点を当てている。
動的データ拡張操作(D$2$AO)という効果的なバックドア攻撃を提案する。
本手法は,クリーンな精度を維持しつつ,最先端の攻撃性能を実現することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:44:22 GMT)
EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference [49.9] 本稿では,新しいパイプラインスケジューラであるEPS-MoEを紹介する。
その結果,既存の並列推論手法に比べて,プリフィルスループットが平均21%向上していることが判明した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:17:49 GMT)
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.8] 近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:03:27 GMT)
Improved Anomaly Detection through Conditional Latent Space VAE Ensembles [49.2] 条件付きラテント空間変分オートエンコーダ(CL-VAE)は、既知の不整形クラスと未知の不整形クラスを持つデータに対する異常検出のための前処理を改善した。
モデルでは異常検出の精度が向上し、MNISTデータセットで97.4%のAUCが達成された。
さらに、CL-VAEは、アンサンブルの利点、より解釈可能な潜在空間、モデルサイズに制限のある複雑なデータでパターンを学習する能力の増大を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:48:53 GMT)
Progressive Retinal Image Registration via Global and Local Deformable Transformations [49.0] 我々はHybridRetinaと呼ばれるハイブリッド登録フレームワークを提案する。
キーポイント検出器とGAMorphと呼ばれる変形ネットワークを用いて、大域的な変換と局所的な変形可能な変換を推定する。
FIREとFLoRI21という2つの広く使われているデータセットの実験により、提案したHybridRetinaは最先端の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:49:27 GMT)
Evaluating Evidence Attribution in Generated Fact Checking Explanations [48.8] 生成した説明文の属性品質を評価するために,新しい評価プロトコル,引用マスキングとリカバリを導入する。
実験により、最高の性能を持つLSMは、不正確な属性を持つ説明を生成することが明らかとなった。
より良い説明を生み出すには人為的な証拠が不可欠である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:23:39 GMT)
LitSearch: A Retrieval Benchmark for Scientific Literature Search [48.6] 我々は,最近のMLおよびNLP論文に関する597のリアルな文献検索クエリからなる検索ベンチマークLitSearchを紹介する。
LitSearchのすべての質問は、高品質を保証するために専門家によって手作業で検査または編集された。
BM25と最先端の高密度リトリーバーの間には,24.8%の絶対差がみられた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:37:15 GMT)
StyleDistance: Stronger Content-Independent Style Embeddings with Synthetic Parallel Examples [48.4] スタイル表現は、内容に関係なく、類似した書体スタイルのテキストを密に埋め込み、異なる書体スタイルのテキストを遠くに埋め込むことを目的としている。
より強力なコンテンツに依存しないスタイル埋め込みをトレーニングするための新しいアプローチであるStyleDistanceを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:25:25 GMT)
"Set It Up!": Functional Object Arrangement with Compositional Generative Models [48.2] 未特定命令の解釈を学習するためのフレームワークであるSetItUpを導入する。
研究デスク,ダイニングテーブル,コーヒーテーブルからなるデータセット上で,我々のフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:35:31 GMT)
Tree-based variational inference for Poisson log-normal models [47.8] 階層木は、しばしば近接基準に基づいてエンティティを組織するために使用される。
現在のカウントデータモデルは、この構造化情報を利用していない。
本稿では,PLNモデルの拡張としてPLN-Treeモデルを導入し,階層的カウントデータをモデル化する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:57:57 GMT)
Evaluation of Attribution Bias in Retrieval-Augmented Large Language Models [47.7] 大規模言語モデルにおける著者情報に対する属性感度とバイアスを評価する。
文献に著者情報を追加することで, LLMの属性品質を3%から18%大きく変化させることができることを示す。
その結果,資料のメタデータがLCMの信頼度や回答の属性に影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:55:49 GMT)
Knowledge Circuits in Pretrained Transformers [47.3] 現代の大言語モデルが知識をいかに保存するかという内部的な研究は、長い間、研究者の間で激しい関心と調査の対象となっていた。
本稿では,言語モデルのグラフを掘り下げて,特定の知識を明確にするための知識回路を明らかにする。
これらの知識回路に対する現在の知識編集技術の影響を評価し,これらの編集手法の機能や制約についてより深い知見を提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:35:22 GMT)
PromptDSI: Prompt-based Rehearsal-free Instance-wise Incremental Learning for Document Retrieval [47.1] Differentiable Search Index (DSI) は、事前訓練された言語モデル(PLM)を用いて、外部インデックスに依存しない効率的な文書検索を行う。
本稿では,インクリメンタルな学習文書検索のためのプロンプトベースのリハーサルフリーアプローチであるPromptDSIを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:45:54 GMT)
Rethinking Token Reduction for State Space Models [47.0] 状態空間モデル(SSM)のための調整・統一されたポストトレーニングトークン削減手法を提案する。
我々のアプローチはトークンの重要性と類似性を統合し、プルーニングとマージの両方を活用する。
本手法は,Mamba-2を用いた6つのベンチマークにおいて,従来の手法と比較して平均精度を5.7%から13.1%向上させる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:06:13 GMT)
Channel-Wise Mixed-Precision Quantization for Large Language Models [47.0] 大規模言語モデル(LLM)は、幅広い言語タスクで顕著な成功を収めている。
重みのみの量子化は、LCMのメモリフットプリントを削減するための有望な解決策である。
本稿では,CMPQ(Channel-Wise Mixed-Precision Quantization)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:34:41 GMT)
Parsimony or Capability? Decomposition Delivers Both in Long-term Time Series Forecasting [46.6] 時系列予測(LTSF)は時系列分析において重要なフロンティアである。
本研究は, 分析的および実証的な証拠から, 分解が過剰なモデルインフレーションを包含する鍵であることを実証する。
興味深いことに、時系列データの本質的なダイナミクスに分解を合わせることで、提案モデルは既存のベンチマークより優れている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:20:35 GMT)
Semantic Token Reweighting for Interpretable and Controllable Text Embeddings in CLIP [46.5] CLIPのようなVision-Language Models (VLM)内のテキストエンコーダは、画像と共有する埋め込み空間へのテキスト入力の変換において重要な役割を果たす。
解釈可能なテキスト埋め込み(SToRI)を構築するためのセマンティックトークン再重み付けフレームワークを提案する。
SToRIは文脈的重要性に基づいて意味的要素を差分重み付けすることでCLIPのテキスト符号化プロセスを洗練する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:09:14 GMT)
Semantic Token Reweighting for Interpretable and Controllable Text Embeddings in CLIP [46.5] CLIPのようなVision-Language Models (VLM)内のテキストエンコーダは、画像と共有する埋め込み空間へのテキスト入力の変換において重要な役割を果たす。
解釈可能なテキスト埋め込み(SToRI)を構築するためのセマンティックトークン再重み付けフレームワークを提案する。
SToRIは文脈的重要性に基づいて意味的要素を差分重み付けすることでCLIPのテキスト符号化プロセスを洗練する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:09:14 GMT)
Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustment [46.4] リワード・イン・コンテキスト(Rewards-in-Context, RiC)を導入する。
RiCは単一のファンデーションモデルの教師付き微調整のみを必要とし、推論時間中にユーザの好みを動的に調整する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:24:02 GMT)
MING: A Functional Approach to Learning Molecular Generative Models [46.2] 本稿では,関数表現に基づく分子生成モデル学習のための新しいパラダイムを提案する。
本稿では,関数空間における分子分布を学習する拡散モデルである分子インプリシットニューラルジェネレーション(MING)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:02:02 GMT)
Towards Physically Consistent Deep Learning For Climate Model Parameterizations [46.1] パラメータ化は、気候予測において、系統的なエラーと大きな不確実性の主な原因である。
深層学習(DL)に基づくパラメータ化は、計算に高価で高解像度のショートシミュレーションのデータに基づいて訓練されており、気候モデルを改善するための大きな可能性を示している。
本稿では,DLに基づくパラメータ化のための効率的な教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:51:39 GMT)
Towards Physically Consistent Deep Learning For Climate Model Parameterizations [46.1] パラメータ化は、気候予測において、系統的なエラーと大きな不確実性の主な原因である。
深層学習(DL)に基づくパラメータ化は、計算に高価で高解像度のショートシミュレーションのデータに基づいて訓練されており、気候モデルを改善するための大きな可能性を示している。
本稿では,DLに基づくパラメータ化のための効率的な教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:51:39 GMT)
CLongEval: A Chinese Benchmark for Evaluating Long-Context Large Language Models [45.9] 長文LLMを評価するための総合的な中国のベンチマークであるCLongEvalを提案する。
CLongEvalの特徴は,(1) 7つの異なるタスクと7,267のサンプルからなる十分なデータボリューム,(2)コンテキストウィンドウサイズ1Kから100Kのモデルに適応する広範適用性,(3)高品質,2,000以上の手動で注釈付き質問応答ペア,に加えて自動構築されたラベル。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:59:22 GMT)
The Best of Both Worlds: Bridging Quality and Diversity in Data Selection with Bipartite Graph [45.5] 文をn-gramにリンクする二部グラフとしてデータセットを表現する新しい方法であるGraphFilterを導入する。
この表現は文と言語パターンの関係を効果的に捉え、n-gramの多様性を高める文の選択を容易にする。
GraphFilterは、高優先度の文を反復的に選択し、カバーされたn-gramを取り除き、二部グラフを更新し、進化するデータランドスケープを反映するように優先順位を再計算する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:16:34 GMT)
MORL-Prompt: An Empirical Analysis of Multi-Objective Reinforcement Learning for Discrete Prompt Optimization [45.4] RLに基づく手法は、ターゲット言語モデルに入力されると、ユーザ特定報酬関数の集合を最大化するプロンプトを探索するために用いられる。
現在の技術は報酬関数の平均値の最大化に重点を置いており、必ずしも報酬間の均衡を達成するプロンプトに繋がるとは限らない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:51:03 GMT)
AnimateLCM: Computation-Efficient Personalized Style Video Generation without Personalized Video Data [45.2] 同様のサイズのビデオ拡散モデルの必要な生成時間を25秒から1秒程度に短縮する。
この手法の有効性は、二重レベルデカップリング学習アプローチにある。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:53:55 GMT)
Future of Algorithmic Organization: Large-Scale Analysis of Decentralized Autonomous Organizations (DAOs) [45.0] 分散自律組織(DAO)は、初期のオンラインコミュニティ、特にオープンソースプロジェクトを中心としたコミュニティに似ている。
わずか数年で、ガバナンストークンの展開が急増し、2024年現在の13,000件を超える決定を総括して管理するガバナンストークン保有者数は245億ドル、ガバナンストークン保有者1100万人となった。
我々は,分散化のレベルを規定する投票力,参加力,特性などの要因について検討し,経営構造の効率性を検討した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:45:10 GMT)
LLM-based Translation Inference with Iterative Bilingual Understanding [45.0] 大規模言語モデル(LLM)の言語間機能に基づいた,新しい反復的バイリンガル理解翻訳法を提案する。
LLMの言語横断的能力により、ソース言語とターゲット言語を別々にコンテキスト理解することが可能になる。
提案したIBUTは、いくつかの強力な比較法より優れている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:21:46 GMT)
Revealing the Barriers of Language Agents in Planning [44.9] 現在の言語エージェントにはまだ人間レベルの計画能力がないことが示されています。
最先端の推論モデルであるOpenAI o1でさえ、複雑な現実世界の計画ベンチマークの1つで15.6%しか達成していない。
エージェント・プランニングを妨げる2つの重要な要因として,制約の役割の制限と質問の影響の減少があげられる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:44:38 GMT)
Super-resolving Real-world Image Illumination Enhancement: A New Dataset and A Conditional Diffusion Model [43.9] 本稿では,効率的な条件拡散確率モデルに基づくSRRIIEデータセットを提案する。
画像はILDCカメラと光学ズームレンズで撮影し、露光レベルは6EVから0EV、ISOレベルは50~12800である。
既存の手法は, 複雑なノイズから復元した画像の構造やシャープさを保ちつつも, 有効性は低いことが示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:47:04 GMT)
Reinforcement Learning with LTL and $ω$-Regular Objectives via Optimality-Preserving Translation to Average Rewards [43.8] 線形時間論理(LTL)およびより一般的には、$omega$-regular objectivesは、強化学習における従来の割引和と平均報酬目的の代替である。
我々は,$omega$-regularの目的に対する各RL問題を,最適性保存方式で,平均値の上限値問題に還元できることを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:42:37 GMT)
CoreGuard: Safeguarding Foundational Capabilities of LLMs Against Model Stealing in Edge Deployment [43.5] CoreGuardは、エッジデバイス上でのモデル盗難に対する、計算と通信効率のよいモデル保護アプローチである。
私たちは、CoreGuardがブラックボックスのセキュリティ保証と同じセキュリティ保護を無視可能なオーバーヘッドで達成していることを示します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:14:24 GMT)
Test-time adaptation for image compression with distribution regularization [43.5] 簡単なベイズ近似によるテキスト分布正規化を導入し、プラグアンドプレイ方式でより優れた関節確率近似を学習する。
提案手法は, 既存のTTA-IC法に柔軟に統合し, 漸進的な利点を生かしてR-D性能を向上する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:25:16 GMT)
JOOCI: a Framework for Learning Comprehensive Speech Representations [43.5] 音声中の他の情報とコンテンツ情報を協調的に最適化するエンドツーエンドの音声表現学習フレームワークを提案する。
以上の結果から,JOOCIは類似サイズのSOTAモデルよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:23:12 GMT)
A Note on Shumailov et al. (2024): `AI Models Collapse When Trained on Recursively Generated Data' [43.4] 分布やモデルがデータに適合する影響について検討し,次に繰り返しサンプリングを行った。
以上の結果から, 結果が統計的現象であり, 避けられない可能性が示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:43:52 GMT)
Linear cost and exponentially convergent approximation of Gaussian Matérn processes [43.3] ガウス過程に基づく統計モデルの推測と予測のための計算コストは、観測数に応じて3倍にスケールする。
本研究では,線形コストと共分散誤差が指数関数的に高速に減少する手法を提案近似の$m$で開発する。
この方法はスペクトル密度の最適な有理近似に基づいており、その結果、$m$独立マルコフ過程の和として表される近似が得られる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:57:15 GMT)
Reverse-Engineering the Reader [43.3] 本稿では,線形回帰器のパラメータを暗黙的に最適化するために,言語モデルを微調整する新しいアライメント手法を提案する。
単語をテストケースとして使用し、複数のモデルサイズとデータセットにわたる手法を評価する。
ダウンストリームNLPタスクにおける心理測定パワーとモデルの性能の逆関係と、ホールドアウトテストデータにおけるその難易度を見出した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:05:01 GMT)
Fool Me Once? Contrasting Textual and Visual Explanations in a Clinical Decision-Support Setting [43.1] 視覚的説明(可用性マップ)、自然言語の説明、両方のモダリティの組み合わせの3種類の説明を評価した。
テキストに基づく説明は、高い信頼度をもたらすことが分かっており、従順マップと組み合わせることで軽減される。
また、説明の質、すなわち、それがどれだけ事実的に正しい情報であり、それがAIの正しさとどの程度一致しているかが、異なる説明タイプの有用性に大きく影響していることも観察します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:43:02 GMT)
Tokens on Demand: Token Condensation as Training-free Test-time Adaptation [43.1] Token Condensation as Adaptation (TCA) は、テスト時推論において視覚言語モデル(VLM)が遭遇する分散シフトを軽減するために設計されたトレーニング不要のアプローチである。
テスト時間適応におけるトークン効率を探索する最初の方法として、TCAは、クロスデータセットおよびアウト・オブ・ディストリビューション適応タスクにおける優れたパフォーマンスを一貫して示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:13:35 GMT)
Adaptive Convolutional Neural Network for Image Super-resolution [43.1] 画像超解像のための適応畳み込みニューラルネットワーク(ADSRNet)を提案する。
上層ネットワークは、コンテキスト情報、カーネルマッピングの健全な情報関係、浅い層と深い層の関連性を高めることができる。
下位のネットワークは対称アーキテクチャを使用して、異なるレイヤの関係を強化し、より構造的な情報をマイニングする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:41:53 GMT)
DreamCraft3D++: Efficient Hierarchical 3D Generation with Multi-Plane Reconstruction Model [42.3] 我々はDreamCraft3Dの拡張機能であるDreamCraft3D++を紹介し、複雑な3Dアセットの効率的な高品質な生成を可能にする。
多様なデータセットの実験は、DreamCraft3D++が複雑な幾何学とリアルな360度テクスチャで創造的な3Dアセットを生成する能力を示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:14:09 GMT)
A Claim Decomposition Benchmark for Long-form Answer Verification [42.3] 我々は,LLM応答に対する原子的およびチェック価値のあるクレームを識別できるビルディングシステムを必要とする,新たなクレーム分解ベンチマークを導入する。
CACDDは、合計4956個の原子クレームを含む、500個の人間による注釈付き質問応答ペアを包含している。
その結果,クレームの分解は非常に困難であり,さらなる探索が必要であることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:34:51 GMT)
On the Relation Between Linear Diffusion and Power Iteration [42.2] 相関機械として生成過程を研究する」
生成過程の早い段階で低周波が出現し, 固有値に依存する速度で, 偏極基底ベクトルが真のデータにより整合していることが示される。
このモデルにより、線形拡散モデルが、一般的な電力反復法と同様に、基礎データの先頭固有ベクトルに平均的に収束することを示すことができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:33:12 GMT)
Robust RL with LLM-Driven Data Synthesis and Policy Adaptation for Autonomous Driving [41.9] 本稿では、政治強化学習エージェントを学習するための新しいフレームワークであるRAPIDを紹介する。
LLMベースの運転エージェントで合成されたデータとオンライン適応を用いて、警察のRLエージェントを専門に訓練する。
異なるタスクへの適応性を維持しながら、LLM知識の堅牢性を低減する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:43:00 GMT)
Position Specific Scoring Is All You Need? Revisiting Protein Sequence Classification Tasks [41.7] タンパク質配列のPSS表現と文字列カーネルの概念を組み合わせた重み付きPSSカーネル行列(W-PSSKM)を提案する。
この結果、タンパク質配列分類の他の多くのアプローチよりも優れた新しいカーネル関数がもたらされる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:16:50 GMT)
Do They Understand What They Are Using? -- Assessing Perception and Usage of Biometrics [41.6] 本研究は,生体情報の利用と知覚に及ぼす生体情報の利用量の増加の影響を明らかにするオンライン調査の結果である。
我々は、参加者の誤解、認証の失敗や潜在的な攻撃に対する対処戦略、そして一般のバイオメトリックスのユーザビリティとセキュリティに対する認識に光を当てた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:19:26 GMT)
MixedNUTS: Training-Free Accuracy-Robustness Balance via Nonlinearly Mixed Classifiers [41.6] MixedNUTSは、ロバストな分類器の出力ロジットを3つのパラメータしか持たない非線形変換で処理する訓練不要の手法である。
MixedNUTSは変換されたロジットを確率に変換し、それらを全体の出力として混合する。
CIFAR-10、CIFAR-100、ImageNetデータセットでは、MixedNUTSの精度とほぼSOTAの堅牢性を大幅に改善した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:15:51 GMT)
Measuring and Benchmarking Large Language Models' Capabilities to Generate Persuasive Language [41.1] 本研究では,Large Language Models (LLM) の説得的テキスト生成能力について検討する。
特定のドメインやタイプの説得に焦点を当てた先行研究とは対照的に、諸藩をまたいだ総合的研究を行う。
我々は、短いテキストのペア対からなる新しいデータセットPersuasive-Pairを構築し、LLMによって書き直され、説得言語を増幅または縮小する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:59:39 GMT)
Adversarial Training of Two-Layer Polynomial and ReLU Activation Networks via Convex Optimization [40.7] 敵対的攻撃に対して堅牢なニューラルネットワークのトレーニングは、ディープラーニングにおいて依然として重要な問題である。
凸プログラムとして2層ReLUおよびfty$アクティベーションネットワークのトレーニング問題を再構成する。
本研究では,大規模問題に対する凸対向訓練の実用性を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:52:37 GMT)
Pessimistic Backward Policy for GFlowNets [40.0] 本稿では,与えられた報酬関数に比例してオブジェクトをサンプリングする生成フローネットワーク(GFlowNets)について検討する。
本研究では,GFlowNetが低軌道の訓練により,高逆対象を過小評価する傾向にあることを示す。
本稿では,GFlowNetsに対する悲観的なバックワードポリシーを提案し,観測されたフローを最大化し,オブジェクトに対する真の報酬と密接に一致させる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:57:03 GMT)
Enhancing Mathematical Reasoning in LLMs by Stepwise Correction [39.7] Best-of-N復号法は、大規模言語モデル(LLM)に複数の解を生成するように指示し、それぞれがスコアリング関数を使用してスコアし、数学的な推論問題に対する最終解として最も高いスコアを選択する。
本稿では,LLMが生成した推論経路の誤りステップを特定し,修正するのに役立つ,ステップワイズ補正(StepCo)という新しいプロンプト手法を提案する。
バリデーション・then-reviseプロセスは、回答の正しさを向上するだけでなく、生成に必要なパスを減らしてトークン消費を減らす。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:18:42 GMT)
Two Birds with One Stone: Multi-Task Semantic Communications Systems over Relay Channel [38.8] 本稿では,新しいマルチタスク・マルチリンク・リレーセマンティック通信方式を提案する。
このスキームでは、ソースノードはセマンティック通信を使用して信号をブロードキャストし、リレーノードは信号を目的地に転送する。
宛先において、ノードは、ソースノードとリレーノードの両方からの信号を組み合わせて分類を行い、その分類結果を用いて、リレーノードからの信号を復号して画像再構成を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:02:51 GMT)
On the Effective Horizon of Inverse Reinforcement Learning [38.8] 逆強化学習(IRL)アルゴリズムは、しばしば所定の時間軸上の強化学習や計画に依存する。
時間地平線は、報酬推定の精度とIRLアルゴリズムの計算効率の両方を決定する上で重要な役割を果たす。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:59:58 GMT)
Can Graph Descriptive Order Affect Solving Graph Problems with LLMs? [38.2] 大規模言語モデル(LLM)は、数学的推論や論理的推論を含む推論タスクにおいて大きな成功を収めた。
従来の研究は様々な手法を用いてLSMのグラフ推論能力について研究してきた。
重要な要素は、主に見過ごされ、グラフ記述がモデルに提示される即時順序である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:34:57 GMT)
RosePO: Aligning LLM-based Recommenders with Human Values [38.0] 我々は、パーソナライズされた選好最適化(RosePO)を円滑にするための一般的なフレームワークを提案する。
RosePOは、トレーニング後の段階において、カスタマイズされた人的価値との整合性が向上する。
実世界の3つのデータセットの評価は,本手法の有効性を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:54:34 GMT)
Quantifying and Optimizing Global Faithfulness in Persona-driven Role-playing [37.9] ペルソナ駆動型ロールプレイング(PRP)は、すべてのペルソナステートメントに忠実に固執することで、ユーザクエリに応答可能なAI文字を構築することを目的としている。
本稿では,PRP忠実度を細粒度で説明可能な基準として定量化するための先駆的な探索について述べる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:54:48 GMT)
DIRAS: Efficient LLM Annotation of Document Relevance in Retrieval Augmented Generation [37.8] ドメイン固有のクエリは通常、浅いセマンティックな関連性を超えて、関連性のニュアンス定義を必要とする。
人間またはGPT-4アノテーションは費用がかかり、全ての(クエリ、ドキュメント)ペアをカバーできない。
DIRAS (Domain-specific Information Retrieval with Scalability) は手動アノテーションのないスキーマである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:16:25 GMT)
Nonradiant multiphoton states in quantum ring oligomers [37.7] 本稿では, 放射連続体による2つの状態の外部結合機構について述べる。
提案された多光子励起寿命制御のメカニズムは普遍的な性質を持ち、幅広い種類のオープン量子系や量子アンサンブルに適用することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:17:37 GMT)
Scaling Up Personalized Image Aesthetic Assessment via Task Vector Customization [37.7] 本稿では,画像の審美性評価や画質評価に手軽に利用できるデータベースを活用する,ユニークなアプローチを提案する。
各データベースの特徴を表すタスクベクトルの最適な組み合わせを決定することにより、個人向けにパーソナライズされたモデルを作成することに成功した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:11:30 GMT)
Ultra-High-Definition Image Restoration: New Benchmarks and A Dual Interaction Prior-Driven Solution [37.4] UHD-Snow と UHD-Rain という名の UHD 雪と降雨のベンチマークを構築した。
各ベンチマークには3200の分解/クリアイメージ対の4K解像度が含まれている。
モデル設計における勾配と正規項を考慮した効率的なUHD画像復元法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:11:04 GMT)
Ultra-High-Definition Image Restoration: New Benchmarks and A Dual Interaction Prior-Driven Solution [37.4] UHD-Snow と UHD-Rain という名の UHD 雪と降雨のベンチマークを構築した。
各ベンチマークには3200の分解/クリアイメージ対の4K解像度が含まれている。
モデル設計における勾配と正規項を考慮した効率的なUHD画像復元法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:11:04 GMT)
Self-Pluralising Culture Alignment for Large Language Models [36.7] 本稿では,大規模言語モデルと多言語文化との整合性を実現するフレームワークであるCultureSPAを提案する。
カルチャー・アウェア/アウェアアウトプットを比較することで、カルチャー関連インスタンスを検出し、収集することができる。
広範囲な実験により、CultureSPAは、一般の能力を損なうことなく、多様な文化へのLCMのアライメントを著しく改善することが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:06:08 GMT)
Improving the Generalization of Unseen Crowd Behaviors for Reinforcement Learning based Local Motion Planners [36.7] 現在の強化学習ベースのモーションプランナーは、歩行者の動きをシミュレートするための単一のポリシーに依存している。
本稿では,情報理論の目的を最大化することにより,エージェントの多様性を高める効率的な手法を提案する。
未確認の群衆に対するエージェントの堅牢性を評価するために,歩行者の群集行動に触発された多様なシナリオを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:46:21 GMT)
Training Neural Samplers with Reverse Diffusive KL Divergence [36.5] 非正規化密度関数からサンプルを得るための生成モデルを訓練することは、機械学習において重要かつ困難な課題である。
従来の訓練方法は、そのトラクタビリティのため、逆のKL(Kulback-Leibler)の分岐に依存することが多い。
モデルおよび対象密度の拡散軌跡に沿った逆KLの最小化を提案する。
本手法はボルツマン分布のサンプリング性能を向上させることを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:08:02 GMT)
Large Language Model-driven Multi-Agent Simulation for News Diffusion Under Different Network Structures [36.5] この研究は、情報エコシステム内の複雑な相互作用を再現するために、大規模言語モデル(LLM)によるマルチエージェントシミュレーションを用いている。
エージェントのパーソナリティやネットワーク構造など,ニュースの伝播を促進する重要な要因について検討する。
我々は3つの対策策を評価し、ネットワーク内の影響力のあるエージェントをブロックするブルートフォースを発見するか、あるいはニュースの正確性を示すことで、誤情報を効果的に軽減することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:58:26 GMT)
POROver: Improving Safety and Reducing Overrefusal in Large Language Models with Overgeneration and Preference Optimization [36.3] 近年,大規模言語モデルにおける安全性と有用性のバランスが重要な課題となっている。
本稿では,優れた教師モデルの完成度を生かして,過度な拒絶を減らすための選好最適化手法を提案する。
汎用プロンプトの過剰生成は安全性と有用性のバランスを著しく改善することを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:56:22 GMT)
Facilitating Multi-turn Function Calling for LLMs via Compositional Instruction Tuning [36.2] 大規模言語モデル(LLM)は多様なタスクを実行する上で大きな可能性を秘めている。
本稿では,LLMがマルチターン関数呼び出しを行う上で,見過ごされる必要性に対処する。
BUTTONはボトムアップ命令構築とトップダウン軌道生成による合成合成命令チューニングデータを生成する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:40:26 GMT)
Reinforcement Learning-based Non-Autoregressive Solver for Traveling Salesman Problems [35.9] 特殊設計アーキテクチャと強化強化学習戦略を取り入れた新しいNARモデルNAR4TSPを提案する。
NAR4TSPは、ソリューションの品質、推論速度、そして予測できないシナリオへの一般化の点で、最先端の5つのモデルより優れていることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:24:13 GMT)
LLM Processes: Numerical Predictive Distributions Conditioned on Natural Language [35.8] 我々のゴールは、数値データを処理し、任意の場所で確率的予測を行うレグレッションモデルを構築することである。
まず、大規模言語モデルから明示的で一貫性のある数値予測分布を抽出する戦略を探求する。
本研究では,テキストを数値予測に組み込む能力を示し,予測性能を改善し,定性的な記述を反映した定量的な構造を与える。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:39:56 GMT)
Towards Scalable Exact Machine Unlearning Using Parameter-Efficient Fine-Tuning [35.7] S3T(Sequence-aware Sharded Sliced Training)を導入した。
S3Tは、モデルの性能への影響を最小限に抑えつつ、正確な未学習システムの削除能力を高めるように設計されている。
我々は、S3Tが幅広い設定におけるベースラインに比べて優れた削除能力と性能を発揮できることを実証した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:57:24 GMT)
A Survey on Data Synthesis and Augmentation for Large Language Models [35.6] 本稿では,大規模言語モデルのライフサイクルを通じてデータ生成手法をレビューし,要約する。
これらの手法が直面する現在の制約について考察し,今後の開発・研究の道筋について考察する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:12:39 GMT)
Adaptive and Stratified Subsampling Techniques for High Dimensional Non-Standard Data Environments [35.4] 本稿では,非標準データ環境における高次元パラメータ推定の課題に対処する。
本稿では,頑健なサブサンプリング手法,特に適応サンプリング重要度(AIS)と階層サブサンプリングを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:39:40 GMT)
Fourier Circuits in Neural Networks and Transformers: A Case Study of Modular Arithmetic with Multiple Inputs [35.2] 一層ニューラルネットワークと一層トランスフォーマーの研究を行った。
1つの隠れた層ニューラルネットワークは、データセット上で最大$L_2,k+1$-marginに達する。
同様の計算機構を1層変換器に注意して観察する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:48:42 GMT)
Meta-Unlearning on Diffusion Models: Preventing Relearning Unlearned Concepts [34.7] メタ学習事前学習拡散モデル(DM)の枠組みを提案する。
我々のフレームワークは既存のほとんどの未学習メソッドと互換性があり、実装が容易なメタオブジェクトを追加するだけでよい。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:51:25 GMT)
Credal Two-Sample Tests of Epistemic Ignorance [34.4] 干潟集合を比較するための新しい仮説テストフレームワークである干潟2サンプル試験を導入する。
両サンプル試験を一般化して, 対等性, 包摂性, 交叉性, 相互排他性の推論を可能にする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:09:09 GMT)
CREAM: Consistency Regularized Self-Rewarding Language Models [34.3] 自己回帰型大規模言語モデル (LLM) は, 優先データに対する人間のアノテーションを必要とせずに, LLM-as-a-Judge を用いてアライメント性能を向上させることに成功した。
しかし、報酬とランキングの正確性は保証されていないため、精度の高い報酬と高品質な選好データを保証するのに不可欠である。
本稿では,各イテレーション間の報酬整合性を利用して自己回帰訓練を規則化する一貫性正規化sElf-rewarding lAnguage Model (CREAM)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:51:01 GMT)
Negative-Prompt-driven Alignment for Generative Language Model [34.2] 本稿では,言語モデルが望ましくない行動から遠ざかるように,NEGative-prompt-driven AlignmenTを提案する。
NEATは有害なアウトプットを生成するためのモデルを明確に罰し、望ましい行動だけでなく、望ましくない偏見のある反応を発生させないよう仕向けている。
大規模な実験により、NEATは言語モデルと人間の価値観と嗜好との整合性を著しく向上させる効果を検証した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:30:09 GMT)
TransAgent: Transfer Vision-Language Foundation Models with Heterogeneous Agent Collaboration [33.9] 視覚言語基礎モデル(CLIPなど)は、大規模な画像テキスト事前学習により、転送学習におけるその能力を示している。
本稿では,分離されたエージェントの知識を統一的に伝達する,汎用的で簡潔なTransAgentフレームワークを提案する。
われわれのTransAgentは、11の視覚的認識データセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:01:44 GMT)
Embedding an Ethical Mind: Aligning Text-to-Image Synthesis via Lightweight Value Optimization [33.8] LiVOは、T2Iモデルを人間の値に合わせるための新しい軽量な方法である。
本研究では,86kサンプルのテキスト画像選好データセットを自動構築するフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:03:42 GMT)
Divide-Verify-Refine: Aligning LLM Responses with Complex Instructions [33.2] LLMは、複数の制約を持つ複雑な命令に従うのに苦労する。
最近の研究によると、LLM、特にオープンソースモデルは、複数の制約を持つ複雑な命令に従うのに苦労している。
3つのステップでDVR(Divide-Verify-Refine)フレームワークを提案する。
LLama3.1-8Bの制約準拠性を6つの制約で2倍にすることで,フレームワークのパフォーマンスが大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:01:55 GMT)
Learning to Control and Coordinate Mixed Traffic Through Robot Vehicles at Complex and Unsignalized Intersections [33.0] 実世界の複雑な交差点における混在トラフィックの制御と調整のための分散型マルチエージェント強化学習手法を提案する。
特に,5%のRVを使用すれば,1時間あたり700台の車両の実際の交通需要の下で,複雑な交差点内での渋滞発生を防止できることを示す。
また,ブラックアウトイベントや突然のRVパーセンテージ低下に対して頑健であり,汎用性も良好である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:58:10 GMT)
Open-Source Conversational AI with SpeechBrain 1.0 [33.0] SpeechBrainはオープンソースのConversational AIツールキットで、PyTorchをベースとしている。
事前トレーニングされたモデルと、トレーニングに必要なコードとアルゴリズムの完全な“レシピ”の両方をリリースすることで、透明性と複製性を促進する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:13:32 GMT)
Theoretical Analysis of Hierarchical Language Recognition and Generation by Transformers without Positional Encoding [32.0] 因果マスキングと開始トークンによってトランスフォーマーは階層構造内の位置情報と深さを計算することができることを示す。
位置エンコーディングのないトランスフォーマーは階層型言語を生成することができることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:56:01 GMT)
Motion Inversion for Video Customization [31.6] 本稿では,映像モデルにおける動き表現の探索における広範なギャップに対処する,動き生成のための新しいアプローチを提案する。
本研究では,ビデオから抽出した時間的コヒーレントな埋め込みの集合であるMotion Embeddingsを紹介する。
我々の貢献には、カスタマイズタスクのための調整されたモーション埋め込みと、本手法の実用的メリットと有効性を示すことが含まれる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:35:31 GMT)
D$^3$Fields: Dynamic 3D Descriptor Fields for Zero-Shot Generalizable Rearrangement [31.6] D$3$Fields -- 動的3D記述子フィールドを導入します。
これらのフィールドは暗黙的な3D表現であり、3Dポイントを取り込み、セマンティックな特徴とインスタンスマスクを出力する。
D$3$Fields はゼロショットの一般化可能な再配置タスクに有効であることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:30:58 GMT)
Prompt Compression for Large Language Models: A Survey [31.6] 本稿では, ハードプロンプト法とソフトプロンプト法に分類した, プロンプト圧縮技術の概要について述べる。
また, 各種急速圧縮手法の下流適応について検討した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:13:23 GMT)
The Comparative Trap: Pairwise Comparisons Amplifies Biased Preferences of LLM Evaluators [31.5] 大規模言語モデル (LLM) は、自然言語生成タスクの評価器としてますます使われている。
LLMは、冗長性や権威的なトーンを好むなど、バイアスのある好みを示す。
ペアワイズフレームワークにポイントワイズ推論を統合するPRePairを導入する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:39:49 GMT)
Long-LRM: Long-sequence Large Reconstruction Model for Wide-coverage Gaussian Splats [31.4] Long-LRMは、A100 80G GPUでわずか1.3秒で960x540の解像度で32のソース画像を処理できる。
入力画像の処理に制限のある以前のフィードフォワードモデルとは異なり、Long-LRMはシーン全体を単一のフィードフォワードステップで再構築する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:54:06 GMT)
SiFiSinger: A High-Fidelity End-to-End Singing Voice Synthesizer based on Source-filter Model [31.3] 本稿では,音源フィルタ機構に基づくSVS(Advanced End-to-end Song Voice Synsynse)システムを提案する。
提案システムは、基本ピッチ(F0)予測器や波形生成デコーダなどの要素も組み込んでいる。
Opencpopデータセットの実験により,提案モデルの有効性が実証された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:18:45 GMT)
AdaCropFollow: Self-Supervised Online Adaptation for Visual Under-Canopy Navigation [31.2] アンダーキャノピー農業ロボットは、精密なモニタリング、スプレー、雑草、植物操作などの様々な応用を可能にする。
本稿では,視覚的基礎モデル,幾何学的事前,擬似ラベリングを用いて意味キーポイント表現を適応するための自己教師付きオンライン適応手法を提案する。
これにより、人間による介入を必要とせずに、畑や作物をまたがるアンダーキャノピーロボットの完全な自律的な行追尾が可能になる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:52:38 GMT)
Harmon: Whole-Body Motion Generation of Humanoid Robots from Language Descriptions [31.1] この研究は、言語記述からヒューマノイドロボットのための多様な全身運動を生成することに焦点を当てている。
我々は、人体の動きを初期化するために、広範囲な人体の動きデータセットから人体の動きの先行を活用できる。
提案手法は, 自然な, 表現的, テキストに沿ったヒューマノイド運動を生成できることを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:48:50 GMT)
VrdONE: One-stage Video Visual Relation Detection [31.0] Video Visual Relation Detection (VidVRD)は、ビデオの時間と空間におけるエンティティの理解に焦点を当てている。
VidVRDの従来の手法は、その複雑さに悩まされ、通常、タスクを2つの部分に分割する。
VidVRDのワンステージモデルであるVrdONEを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:28:19 GMT)
Abnormality Forecasting: Time Series Anomaly Prediction via Future Context Modeling [30.9] 時系列データから異常を識別することは、インフラのセキュリティ、インテリジェントな運用とメンテナンス、宇宙探査など、様々な分野で重要な役割を果たしている。
現在の研究では、異常発生後の異常の検出に焦点が当てられている。
本研究では,より実用的で非常に困難な問題である時系列異常予測について検討し,発生前の異常事象を早期に警告することを目的とした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:00:00 GMT)
Mastering the Craft of Data Synthesis for CodeLLMs [30.6] 大規模な言語モデル(LLM)は、エンコード理解と生成において素晴らしいパフォーマンスを示している。
データ合成とフィルタリング技術は広く採用されており、この文脈では非常に効果的であることが示されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:57:14 GMT)
What Do Speech Foundation Models Not Learn About Speech? [30.5] 我々はWhisper, Seamless, Wav2Vec, HuBERT, Qwen2-Audioなどの音声基礎モデルを分析する。
まず、ゼロショット設定でモデルを評価し、次にこれらのモデルから抽出した層ワイドな特徴を微調整する。
この結果から,モデルの一般化能力,レイヤワイド表現の特徴,下流タスク適応に必要な変換度などの知見が得られた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:34:07 GMT)
Towards Flexible and Efficient Diffusion Low Light Enhancer [30.5] 拡散に基づく低照度画像強調(LLIE)は、低照度画像の可視性向上に大きく成功している。
LLIE用に特別に設計されたステップ蒸留フレームワークである textbfDistilled textbfTrajectory (textbfReDDiT) を用いた textbfReflectance-aware textbfDiffusion を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:07:18 GMT)
Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation [30.3] ニューラルマシン翻訳(NMT)の一般的な手法である、最大後部復号法は、推定後部確率を最大化することを目的としている。
最小ベイズリスク(MBR)復号法は、最も期待されているユーティリティで仮説を求める方法を提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:22:53 GMT)
An Automatic and Cost-Efficient Peer-Review Framework for Language Generation Evaluation [29.8] 既存の評価手法は、しばしば高いコスト、限られたテスト形式、人間の参照の必要性、体系的な評価バイアスに悩まされる。
人間のアノテーションに依存する以前の研究とは対照的に、Auto-PREはそれら固有の特性に基づいて自動的に評価者を選択する。
実験結果から,我々のAuto-PREは最先端の性能を低コストで達成できることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:06:06 GMT)
Revisiting Benchmark and Assessment: An Agent-based Exploratory Dynamic Evaluation Framework for LLMs [29.7] 従来のQAベンチマークを、より柔軟な"戦略基準"フォーマットに拡張するBenchmark+と、インタラクションプロセスを強化するAccess+という2つの概念を紹介します。
本研究では,これらの概念を検索の強化と強化学習を通じて実装するTestAgentというエージェントベース評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:36:18 GMT)
DEeR: Deviation Eliminating and Noise Regulating for Privacy-preserving Federated Low-rank Adaptation [29.3] 我々は、UnderlineDeviation UnderlineEliminatingとNoisunderlinee Underline Regulating (DEeR)と呼ばれるプライバシー保護フェデレーションファインタニングフレームワークを提案する。
DeeRは、最先端のアプローチと比較して、公開医療データセットのパフォーマンスが向上していることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:11:52 GMT)
SAC-GLAM: Improving Online RL for LLM agents with Soft Actor-Critic and Hindsight Relabeling [29.3] 本稿では,LSM剤に適応するソフトアクター・クライトと後方視の適応について検討する。
本手法は,従来のマルチゴールRL環境において,オンライン学習を行う自動LLMエージェントへの道筋を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:59:27 GMT)
Is Complex Query Answering Really Complex? [28.8] CQAの現在のベンチマークはそれほど複雑ではなく、それらの構築方法がこの分野の進歩に対する認識を歪めていることを示している。
我々は、複数のホップを推論し、現実世界のKGの構築をより良く反映するモデルを必要とするクエリで構成された、より困難なベンチマークセットを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:19:03 GMT)
EmbedLLM: Learning Compact Representations of Large Language Models [28.5] 大規模言語モデルのコンパクトなベクトル表現を学習するためのフレームワークである EmbedLLM を提案する。
このような埋め込みを学習するためのエンコーダ-デコーダアプローチと,その有効性を評価するための体系的なフレームワークを導入する。
EmbedLLMはモデルルーティングにおいて,精度とレイテンシの両方において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:23:00 GMT)
EmbedLLM: Learning Compact Representations of Large Language Models [28.5] 大規模言語モデルのコンパクトなベクトル表現を学習するためのフレームワークである EmbedLLM を提案する。
このような埋め込みを学習するためのエンコーダ-デコーダアプローチと,その有効性を評価するための体系的なフレームワークを導入する。
EmbedLLMはモデルルーティングにおいて,精度とレイテンシの両方において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:23:00 GMT)
Feature Augmentation for Self-supervised Contrastive Learning: A Closer Look [28.4] 本稿では,機能拡張(Feature Augmentation)として知られる機能空間でデータ拡張を行う統一フレームワークを提案する。
この戦略はドメインに依存しないため、元のものと同様の機能が追加され、データの多様性が向上する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:25:11 GMT)
Quadratic Gating Functions in Mixture of Experts: A Statistical Insight [28.2] 混合専門家モデル(MoE)は、計算効率を保ちながら、モデルのキャパシティのスケーリングに非常に効果的である。
我々は、MoEフレームワークとアテンションメカニズムの新たな接続を確立し、より表現力があり効率的な代替手段として2次ゲーティングがどのように機能するかを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:30:15 GMT)
Building Better: Avoiding Pitfalls in Developing Language Resources when Data is Scarce [27.9] 与えられた言語のデータは、トークンの集まり以上のものと見なすべきである。
優れたデータ収集とラベル付けのプラクティスは、より人間中心で社会的に意識した技術を構築する上で鍵となる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:51:18 GMT)
Evaluating Fairness in Large Vision-Language Models Across Diverse Demographic Attributes and Prompts [27.7] いくつかの主流大規模視覚言語モデル(LVLM)の視覚的公正性について実験的に検討する。
我々の公正度評価フレームワークは、視覚的質問応答/分類タスクにおいて、直接的および単選択的な質問プロンプトを用いている。
我々は,オープンソースのLVLMとクローズドソースの両方に適用可能な,バイアス軽減のためのマルチモーダル・チェーン・オブ・シント(CoT)ベースの戦略を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:47:16 GMT)
InterMask: 3D Human Interaction Generation via Collaborative Masked Modelling [27.5] 離散空間におけるマスクモデルを用いたヒューマンインタラクション生成のための新しいフレームワークであるInterMaskを紹介する。
InterMaskは、2人の対話する個人のトークンを協調的にモデル化するために、生成的なマスク付きモデリングフレームワークを使用している。
動作表現の強化、専用のアーキテクチャ、効果的な学習戦略により、InterMaskは高忠実で多様な人間のインタラクションを実現する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:22:41 GMT)
InterMask: 3D Human Interaction Generation via Collaborative Masked Modelling [27.5] 離散空間におけるマスクモデルを用いたヒューマンインタラクション生成のための新しいフレームワークであるInterMaskを紹介する。
InterMaskは、2人の対話する個人のトークンを協調的にモデル化するために、生成的なマスク付きモデリングフレームワークを使用している。
動作表現の強化、専用のアーキテクチャ、効果的な学習戦略により、InterMaskは高忠実で多様な人間のインタラクションを実現する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:22:41 GMT)
Uncovering, Explaining, and Mitigating the Superficial Safety of Backdoor Defense [27.5] 現行のバックドア浄化法における精製後ロバスト性について検討した。
現在の安全浄化法は, バックドア行動の迅速な再学習に弱いことが判明した。
モデル更新を伴うバックドア接続経路の偏差を緩和するチューニングディフェンス,Path-Aware Minimization (PAM)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:59:19 GMT)
Uncovering, Explaining, and Mitigating the Superficial Safety of Backdoor Defense [27.5] 現行のバックドア浄化法における精製後ロバスト性について検討した。
現在の安全浄化法は, バックドア行動の迅速な再学習に弱いことが判明した。
モデル更新を伴うバックドア接続経路の偏差を緩和するチューニングディフェンス,Path-Aware Minimization (PAM)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:59:19 GMT)
Self-supervised learning of video representations from a child's perspective [27.4] 子どもたちは、エゴセントリックな視覚経験から、周囲の強力な内部モデルを学びます。
そのような内部モデルは、高度に汎用的な学習アルゴリズムで子どもの視覚経験から学べるか、あるいは強い帰納的バイアスを必要とするのか?
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:10:03 GMT)
Video-to-Audio Generation with Hidden Alignment [27.1] 我々は、視覚エンコーダ、補助埋め込み、データ拡張技術に焦点をあてて、ビデオ・オーディオ生成パラダイムに関する洞察を提供する。
提案モデルでは,最先端のビデオ・オーディオ生成機能を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:44:41 GMT)
Cocoon: Robust Multi-Modal Perception with Uncertainty-Aware Sensor Fusion [27.0] オブジェクトレベルの不確実性を認識した融合フレームワークであるCocoonを紹介します。
鍵となる革新は不均一表現に対する不確実な定量化である。
Cocoonは、通常の条件と挑戦条件の両方において、既存の静的および適応的な手法より一貫して優れている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:10:53 GMT)
Conformity in Large Language Models [27.0] 誤った応答に対する整合性は、言語モデルの有効性を損なう可能性がある。
我々は心理実験に適応し、最先端言語モデルにおける適合度について検討する。
私たちは、LSMが彼ら自身の予測でより不確実である場合に、より適合する可能性が高いことを示す最初の人です。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:16:34 GMT)
Hazards in Daily Life? Enabling Robots to Proactively Detect and Resolve Anomalies [26.8] 家庭用ロボットは、家庭内でそのような危険や異常を積極的に検出すべきである。
我々は、シミュレートされた環境を構築するために手動でラベル付けされたデータに頼るのではなく、基礎的なモデルを活用します。
タスク記述やシーンの多様性の観点から、生成した環境が他よりも優れていることを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:29:14 GMT)
Beyond Graphs: Can Large Language Models Comprehend Hypergraphs? [26.4] NLGraphやGraphQAといった既存のベンチマークでは、ペア関係を中心にグラフ上のLLMを評価している。
LLM4Hypergraphは、8つの低次、5つの高次、および2つの同型タスクにまたがる21,500の問題をまとめた最初の総合的なベンチマークである。
GPT-4oを含む6つの著名なLCMを評価し、モデル強度と弱点の同定におけるベンチマークの有効性を実証した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:33:06 GMT)
Beyond Graphs: Can Large Language Models Comprehend Hypergraphs? [26.4] LLM4Hypergraphは、8つの低次、5つの高次、および2つの同型タスクにまたがる21,500の問題をまとめた最初の総合的なベンチマークである。
GPT-4oを含む6つの著名なLCMを評価し、モデル強度と弱点の同定におけるベンチマークの有効性を実証した。
特殊プロンプトフレームワークには7つのハイパーグラフ言語が組み込まれており、高次推論を強化するHyper-BAGとHyper-COTという2つの新しい技術が導入されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:33:06 GMT)
Explainable Natural Language Processing for Corporate Sustainability Analysis [26.3] コーポレート・サステナビリティの概念は、コーポレート・オペレーションの多様で複雑な性質のために複雑である。
企業サステナビリティ評価は、企業サステナビリティの取り組みを反映したデータと、それらを評価するアナリストの両方で主観性に悩まされている。
我々は、説明可能な自然言語処理(XNLP)は企業サステナビリティ分析を大幅に向上させることができると主張している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:24:59 GMT)
SDI-Paste: Synthetic Dynamic Instance Copy-Paste for Video Instance Segmentation [26.3] 生成モデルの最近のビデオ忠実度向上を利用して、既存のビデオデータセットに合成されたオブジェクトを組み込んで、オブジェクトのインスタンスプールを人工的に拡張する効果的な方法を模索する。
ビデオデータ拡張パイプラインをSynthetic Dynamic Instance Copy-Pasteと名付け、ビデオシーケンス全体にわたるビデオインスタンスの検出、セグメンテーション、トラッキングという複雑なタスクでそれをテストします。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:11:34 GMT)
FedGTST: Boosting Global Transferability of Federated Models via Statistics Tuning [26.1] Federated Learning(FL)は、クライアント間のコラボレーションを促進し、データセットを間接的に拡張し、計算コストを分散し、プライバシを保存することで、問題に対処する。
まず、クライアント-サーバ交換プロトコルを導入し、クロスクライアントのJacobianノルムを活用し、転送可能性を高める。
第2に、クライアント間の平均ジャコビアンノルムをサーバ上で増加させ、これを局所正規化器として使用して、クロスクライアントジャコビアン分散を低減する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:13:52 GMT)
HumanEval-V: Evaluating Visual Understanding and Reasoning Abilities of Large Multimodal Models Through Coding Tasks [26.0] HumanEval-Vは、コード生成による大規模言語モデルの視覚的理解と推論能力を評価するために設計されたベンチマークである。
HumanEval-Vには、CodeForcesやStack Overflowといったプラットフォームから派生した、108の慎重に構築されたエントリーレベルのPythonコーディングタスクが含まれている。
我々はHumanEval-Vを用いて19の最先端LMMを評価し、重要な課題を明らかにした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:04:57 GMT)
X-ray Made Simple: Radiology Report Generation and Evaluation with Layman's Terms [25.9] ラジオロジーレポート生成(RRG)は多モード生成モデルの進歩によって大きな進歩を遂げた。
既存の語彙ベースのメトリクス(例えばBLEU)によるRRGのハイパフォーマンスは、単なるミラージュ(mirage)である。
我々は、レイマンの用語ベースのデータセット、評価およびトレーニングフレームワークであるRRGフレームワークを提案することによって、この問題に意図せずにアプローチする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:57:58 GMT)
Reward-Robust RLHF in LLMs [25.3] 大規模言語モデル(LLM)は、より高度なインテリジェンスへと進化を続けている。
報酬モデルに基づく(RMに基づく)アライメント手法への依存は、大きな課題をもたらす。
本稿では,これらの課題に対処することを目的とした報酬損耗型RLHFフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:56:15 GMT)
Reward-Robust RLHF in LLMs [25.3] 大規模言語モデル(LLM)は、より高度なインテリジェンスへと進化を続けている。
報酬モデルに基づく(RMに基づく)アライメント手法への依存は、大きな課題をもたらす。
本稿では,これらの課題に対処することを目的とした報酬損耗型RLHFフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:56:15 GMT)
TradExpert: Revolutionizing Trading with Mixture of Expert LLMs [25.2] TradeExpertは、専門的な4つのLLMを使用して、専門家(MoE)のアプローチを組み合わせた、新しいフレームワークである。
実験の結果は、すべての取引シナリオにおいて、TradeExpertの優れたパフォーマンスを示しています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:24:16 GMT)
SeedLM: Compressing LLM Weights into Seeds of Pseudo-Random Generators [25.2] 大規模言語モデル(LLM)は自然言語処理を変革しているが、ランタイムコストが高いため、広範なデプロイメントにおいて課題に直面している。
本稿では,擬似ランダム発生器の種をモデル重みのエンコードおよび圧縮に用いる,新しい訓練後圧縮法であるSeedLMを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:11:57 GMT)
SeedLM: Compressing LLM Weights into Seeds of Pseudo-Random Generators [25.2] 大規模言語モデル(LLM)は自然言語処理を変革しているが、ランタイムコストが高いため、広範なデプロイメントにおいて課題に直面している。
本稿では,擬似ランダム発生器の種をモデル重みのエンコードおよび圧縮に用いる,新しい訓練後圧縮法であるSeedLMを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:11:57 GMT)
The Non-Local Model Merging Problem: Permutation Symmetries and Variance Collapse [25.0] モデルマージは、特定のタスクでトレーニングされた複数のエキスパートモデルの重みを、単一のマルチタスクモデルに効率的に結合することを目的としている。
この研究は、"非ローカル"マージのより困難なシナリオを探求する。
標準的なマージ技術は、この非局所的な環境で効果的に一般化できないことが多い。
本稿では,タスク毎のマージモデルの出力アクティベーションを再スケール・シフトするマルチタスク手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:41:59 GMT)
MERLIN: Multimodal Embedding Refinement via LLM-based Iterative Navigation for Text-Video Retrieval-Rerank Pipeline [24.9] 本稿では,Large Language Models (LLMs) を反復的なフィードバック学習に活用する,学習不要のパイプラインであるMERLINを紹介する。
MERLINは、クエリの埋め込みをユーザの視点から洗練し、クエリとビデオコンテンツのアライメントを強化する。
MSR-VTT、MSVD、ActivityNetといったデータセットの実験結果は、MERLINがRecall@1を大幅に改善し、既存のシステムよりも優れた性能を示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:25:50 GMT)
CATCH: Channel-Aware multivariate Time Series Anomaly Detection via Frequency Patching [24.9] 周波数パッチに基づくフレームワークであるCATCHを紹介する。
本稿では,パッチワイドマスクジェネレータとマスクアテンション機構を備えたChannel Fusion Module (CFM)を提案する。
9つの実世界のデータセットと12の合成データセットの実験は、CATCHが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:58:55 GMT)
iFuzzyTL: Interpretable Fuzzy Transfer Learning for SSVEP BCI System [24.9] 本研究では,解釈可能なファジィ変換学習(iFuzzyTL)を利用した高度な分類手法について検討する。
iFuzzyTLは、ファジィ推論システムとアテンション機構を統合することで、人間の解釈可能な形式で入力信号処理と分類を洗練する。
モデルの有効性は3つのデータセットで示される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:07:23 GMT)
NSmark: Null Space Based Black-box Watermarking Defense Framework for Pre-trained Language Models [24.9] LL-LFEA攻撃に抵抗できるタスク非依存のブラックボックス透かし方式を提案する。
NSmarkは, (i) 所有者のデジタル署名を用いた透かし生成, (i) 拡散スペクトル変調による高ロバスト性向上, (ii) 透かし容量を最大化しながらPLM性能を維持する出力マッピング抽出器による透かし埋め込み, (iii) 抽出率と空隙整合性により評価された透かし検証の3段階からなる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:45:27 GMT)
Understanding Figurative Meaning through Explainable Visual Entailment [24.8] 本稿では,概念的意味理解問題を説明可能な視覚的含意タスクとしてフレーミングする新しいタスクを提案する。
我々は、6,027の画像、キャプション、ラベル、説明例を含む付随するデータセットV-FLUTEを構築した。
VLMはリテラルから比喩的意味への一般化に苦慮している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:45:35 GMT)
Implicit Counterfactual Data Augmentation for Robust Learning [24.8] 本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:26:25 GMT)
Understanding Expert Structures on Minimax Parameter Estimation in Contaminated Mixture of Experts [24.7] 汚染された専門家の混合物におけるパラメータ推定の収束解析を行う。
このモデルは、専門家として定式化できるプロンプトを利用する素早い学習問題から動機付けられ、下流のタスクを学習するための大規模な事前学習モデルを微調整する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:52:51 GMT)
FaceChain-FACT: Face Adapter with Decoupled Training for Identity-preserved Personalization [24.6] アダプタベースの手法は、顔データに対するテキスト・ツー・イメージのトレーニングによって、肖像画をカスタマイズし、生成する能力を得る。
ベースモデルと比較して、テスト後の能力、制御性、生成した顔の多様性が著しく低下することが多い。
我々は、モデルアーキテクチャとトレーニング戦略の両方に焦点を当てた、非結合トレーニング(FACT)フレームワークによるFace Adapterを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:25:24 GMT)
Feature Clipping for Uncertainty Calibration [24.5] 現代のディープニューラルネットワーク(DNN)は、しばしば過剰な自信に悩まされ、誤校正につながる。
この問題に対処するために,特徴クリッピング(FC)と呼ばれるポストホックキャリブレーション手法を提案する。
FCは特定の閾値に特徴値をクリップし、高い校正誤差サンプルのエントロピーを効果的に増加させる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:44:35 GMT)
CCSBench: Evaluating Compositional Controllability in LLMs for Scientific Document Summarization [24.5] CCSBenchは、科学領域における制御可能な合成要約のベンチマークである。
私たちのベンチマークでは、明示的な属性(長さなど)と暗黙的な属性(経験的焦点など)の両方をきめ細かな制御が可能です。
その結果,制御属性間のトレードオフのバランスをとる大きな言語モデルでは,大きな制限がみられた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:21:52 GMT)
Not All Votes Count! Programs as Verifiers Improve Self-Consistency of Language Models for Math Reasoning [24.4] 本稿では,プログラムベースの検証を用いて,潜在的に誤った推論経路をフィルタリングするPROVEを提案する。
バニラ多数決に頼る代わりに、我々の手法は、対応するプログラム出力が生成された解と矛盾する解を拒絶する。
PROVEは、すべてのデータセットとモデルサイズにわたる数学的推論タスクを解決するために、バニラ投票を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:24:55 GMT)
HEnRY: A Multi-Agent System Framework for Multi-Domain Contexts [24.1] HEnRYは、Intesa Sanpaoloにマルチエージェントシステム(MAS)を導入することを目指している。
HEnRYという名前はプロジェクトのコア原則を要約している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:28:49 GMT)
Communication-Efficient and Tensorized Federated Fine-Tuning of Large Language Models [24.1] 大規模言語モデルの適応手法であるFedTTとFedTT+を紹介する。
FedTTは汎用的で、クロスサイロFLと大規模クロスデバイスFLの両方に適用できる。
提案手法は,データ不均一性の問題に対処し,既存のPEFT手法よりも同等あるいはそれ以上の精度で処理する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:50:39 GMT)
Hypothesis Testing the Circuit Hypothesis in LLMs [23.7] 回路が適合する仮説を定式化し、回路がどの程度満足するかを評価するための仮説テストスイートを開発する。
この基準は、LCMの挙動が保存される範囲、この挙動の局所化の程度、回路が最小であるかどうかに焦点が当てられている。
合成回路 -- モデルでハードコードされた回路 -- は、理想化された特性と一致している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:45:29 GMT)
DAT: Improving Adversarial Robustness via Generative Amplitude Mix-up in Frequency Domain [23.7] 敵の攻撃からディープニューラルネットワーク(DNN)を保護するために、敵の訓練(AT)が開発された。
近年の研究では、敵対的攻撃がサンプルの周波数スペクトルの位相内のパターンに不均等に影響を及ぼすことが示されている。
モデルの堅牢性向上と位相パターンの維持のトレードオフを改善するために, 最適化された逆振幅発生器 (AAG) を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:18:36 GMT)
Dataless Quadratic Neural Networks for the Maximum Independent Set Problem [23.6] pCQO-MISはエッジ数ではなくグラフ内のノード数でスケールすることを示す。
提案手法は,分散の排除,サンプリング,データ中心のアプローチを回避する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:31:19 GMT)
CoFE-RAG: A Comprehensive Full-chain Evaluation Framework for Retrieval-Augmented Generation with Enhanced Data Diversity [23.5] Retrieval-Augmented Generation (RAG) は、外部知識ソースから取得したコンテキストの助けを借りて、より正確で信頼性の高い回答を生成することを目的としている。
これらのシステムの評価は, 以下の問題により, 依然として重要な研究領域である。
RAGパイプライン全体にわたって徹底的な評価を容易にするために,包括的全チェーン評価(CoFE-RAG)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:20:32 GMT)
MlingConf: A Comprehensive Study of Multilingual Confidence Estimation on Large Language Models [23.4] 本稿では,多言語信頼度推定(MlingConf)の大規模言語モデル(LLM)に関する包括的調査を紹介する。
このベンチマークは、LAタスクのための4つの厳密にチェックされ、人間によって評価された高品質な多言語データセットと、言語の特定の社会的、文化的、地理的コンテキストに合わせて調整されたLSタスクからなる。
LAのタスクでは、英語が他の言語よりも言語的優位性を示す一方で、LSタスクでは、質問関連言語を用いてLSMを誘導し、多言語的信頼度推定において言語的優位性を改善することが示されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:46:55 GMT)
UTF:Undertrained Tokens as Fingerprints A Novel Approach to LLM Identification [23.2] 大型言語モデル(LLM)のフィンガープリントは、モデルのオーナシップの検証、信頼性の確保、誤用防止に不可欠である。
本稿では,未学習トークンを利用したLDMのフィンガープリント手法を提案する。
提案手法は,モデルの性能に最小限のオーバーヘッドと影響があり,対象モデルのオーナシップ識別にホワイトボックスアクセスを必要としない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:36:57 GMT)
Tuning Language Models by Mixture-of-Depths Ensemble [23.1] Transformer-based Large Language Models (LLMs) は伝統的に、トレーニングのための最終層損失と予測のための最終層表現に依存している。
中間層にトレーニングを集中させることで、最終層に匹敵するトレーニング損失が得られることが分かりました。
我々は,後期層を最終ロジットに寄与するアンサンブルとして訓練する新しいチューニングフレームワークであるMixture-of-Depths(MoD)を導入する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:51:45 GMT)
Interpret Your Decision: Logical Reasoning Regularization for Generalization in Visual Classification [23.1] L-Regと呼ばれる論理正規化は、画像分類に論理解析の枠組みを橋渡しする。
具体的には、L-Regがもたらす解釈可能性を明らかにし、そのモデルが人物の顔などの有能な特徴を抽出して分類することを可能にする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:07:27 GMT)
Interpret Your Decision: Logical Reasoning Regularization for Generalization in Visual Classification [23.1] L-Regと呼ばれる論理正規化は、画像分類に論理解析の枠組みを橋渡しする。
具体的には、L-Regがもたらす解釈可能性を明らかにし、そのモデルが人物の顔などの有能な特徴を抽出して分類することを可能にする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:07:27 GMT)
Interpret Your Decision: Logical Reasoning Regularization for Generalization in Visual Classification [23.1] L-Regと呼ばれる論理正規化は、画像分類に論理解析の枠組みを橋渡しする。
具体的には、L-Regがもたらす解釈可能性を明らかにし、そのモデルが人物の顔などの有能な特徴を抽出して分類することを可能にする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:07:27 GMT)
End-to-end Planner Training for Language Modeling [22.6] 言語モデリングを強化するための成功したアプローチは、将来の文の抽象ラベルを予測するために別個の計画モジュールを使用する。
本研究では,プランナーとLMの協調微調整を可能とし,この手法を効果的に改善する手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:14:29 GMT)
Consistency Calibration: Improving Uncertainty Calibration via Consistency among Perturbed Neighbors [22.4] モデルキャリブレーションの代替視点として一貫性の概念を導入する。
本稿では,入力間の一貫性に基づいて信頼度を調整する,一貫性(CC)と呼ばれるポストホックキャリブレーション手法を提案する。
また,ロジットレベルでの摂動は計算効率を著しく向上させることを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:55:02 GMT)
Efficient Diffusion Models: A Comprehensive Survey from Principles to Practices [22.3] 拡散モデルは、様々な生成タスクにおいて、着実に優れた優位性を示している。
この調査は、アーキテクチャ設計、モデルトレーニング、高速な推論、信頼性のあるデプロイメントにおける深い原則と効率的なプラクティスに焦点を当てます。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:10:32 GMT)
Squeezing the quantum noise of a gravitational-wave detector below the standard quantum limit [21.8] LIGO A+のアップグレードにより、検出器の量子ノイズが標準量子限界以下で最大3dBまで低減され、ブロードバンド感度が向上したことを示す。
ハイゼンベルクの不確実性原理は、物体の位置と運動量の両方を正確に測定できないと規定する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:09:54 GMT)
Your Mixture-of-Experts LLM Is Secretly an Embedding Model For Free [21.6] 大規模言語モデル(LLM)は生成タスクに優れ、デコーダのみのアーキテクチャは、さらなる表現の微調整が適用されない場合、埋め込みモデルとしての可能性を制限することが多い。
我々の研究は、MoE LLMのエキスパートルータが、様々な組込みタスクに対して有望な性能を持つ既製の組込みモデルとして機能できることを示唆している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:00:24 GMT)
Your Mixture-of-Experts LLM Is Secretly an Embedding Model For Free [21.6] 大規模言語モデル(LLM)は生成タスクに優れ、デコーダのみのアーキテクチャは、さらなる表現の微調整が適用されない場合、埋め込みモデルとしての可能性を制限することが多い。
我々の研究は、MoE LLMのエキスパートルータが、様々な組込みタスクに対して有望な性能を持つ既製の組込みモデルとして機能できることを示唆している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:00:24 GMT)
Constrained Posterior Sampling: Time Series Generation with Hard Constraints [21.5] 時系列サンプルは、ストレステストモデルに不可欠であり、合成データを使用することでユーザのプライバシを保護する。
制約付き時系列を生成する既存のアプローチは、拡張性がないか、サンプルの品質が低下しているかのいずれかである。
本稿では,拡散に基づくサンプリングアルゴリズムであるConstrained Posterior Sampling (CPS)を導入する。
CPSは、実世界のストック、トラフィック、空気質のデータセットにおいて、サンプルの品質とリアルタイムシリーズとの類似性において、それぞれ10%と42%を上回ります。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:16:04 GMT)
DaDiff: Domain-aware Diffusion Model for Nighttime UAV Tracking [21.3] 本研究はドメイン認識拡散モデル(DaDiff)という,新しいプログレッシブアライメントパラダイムを提案する。
デイディフは、進行性および安定な世代により、夜間LRオブジェクトを昼間に整列させる。
100個のアノテートシーケンスからなるLRオブジェクトに対して、詳細な夜間UAV追跡ベンチマークを構築する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:14:15 GMT)
TorchQL: A Programming Framework for Integrity Constraints in Machine Learning [21.0] 本稿では、機械学習アプリケーションの正確性を評価し改善するプログラミングフレームワークであるTorchQLを紹介する。
TorchQLを使用することで、マシンラーニングモデルやデータセットに対する整合性制約を指定およびチェックするためのクエリの記述が可能になる。
我々は、自律運転においてビデオフレーム間で検出されたオブジェクトの時間的不整合を検知するなど、多様なユースケースでTorchQLを評価する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:55:36 GMT)
Key-Grid: Unsupervised 3D Keypoints Detection using Grid Heatmap Features [20.9] 我々は、剛体および変形可能な物体の両方に対して、キーグリッド(Key-Grid)を革新的な教師なしキーポイント検出器として導入する。
同定されたキーポイントを利用して,デコーダ部で使用されるグリッドヒートマップと呼ばれる3次元グリッド特徴ヒートマップを形成する。
Key-Gridはキーポイントのセマンティック一貫性と位置精度に関する最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:28:58 GMT)
Key-Grid: Unsupervised 3D Keypoints Detection using Grid Heatmap Features [20.9] 我々は、剛体および変形可能な物体の両方に対して、キーグリッド(Key-Grid)を革新的な教師なしキーポイント検出器として導入する。
同定されたキーポイントを利用して,デコーダ部で使用されるグリッドヒートマップと呼ばれる3次元グリッド特徴ヒートマップを形成する。
Key-Gridはキーポイントのセマンティック一貫性と位置精度に関する最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:28:58 GMT)
Continual Dialogue State Tracking via Reason-of-Select Distillation [20.8] そこで我々は,新しい「メタ・レゾニング」能力を持つ小型モデルを改良し,Riason-of-Select(RoS)蒸留法を導入する。
ドメインブートストラッププロセスは、複数の可能な値から複雑な対話を識別するモデルの能力を高める。
2つの新しい改善、"多重値分解"戦略とセマンティックコントラスト推論選択法は、RoSを大幅に向上させた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:15:20 GMT)
In the Eye of Transformer: Global-Local Correlation for Egocentric Gaze Estimation [20.6] エゴセントリックな視線推定の問題に対処する最初のトランスフォーマーベースモデルを提案する。
本稿では,グローバルトークンと各ローカルトークンの相関関係を明示的にモデル化する新しいGLCモジュールを提案する。
我々のアプローチは過去の最先端をはるかに上回っている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:47:58 GMT)
Multi-Cause Deconfounding for Recommender Systems with Latent Confounders [20.6] 潜伏要因は、ユーザーの行動、アイテムの露出、フィードバックに異なる方法で影響を及ぼす可能性がある。
既存のメソッドは、ユーザとフィードバックの間の潜伏した共同創設者を説明できない。
提案手法は,既存共同設立者によるリコメンデータシステムのためのマルチファインデコンウンディング手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:37:39 GMT)
Disentangling data distribution for Federated Learning [20.5] フェデレートラーニング(FL)は、分散クライアントが所有するプライベートデータによってパフォーマンスが向上するグローバルモデルの協調トレーニングを促進する。
しかし、FLの幅広い適用性は、異なるクライアント間のデータ分散の絡み合いによって妨げられている。
本稿では,FLがデータ分散を解き放つことによって,分散システムに匹敵する効率を原理的に達成できることを初めて示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:10:04 GMT)
SAM-Guided Masked Token Prediction for 3D Scene Understanding [20.3] ファンデーションモデルは2Dタスクのパフォーマンスを大幅に向上させており、Bridge3Dのような最近の研究はこれらのモデルを用いて3Dシーン理解を改善している。
しかし、3次元データセットにおける2次元と3次元の表現の不一致や長期分布といった課題は、知識蒸留の有効性を制限している。
本稿では,3次元変圧器構造と地域レベルの知識蒸留をシームレスに整合させる新しいSAM誘導トークン化手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:38:59 GMT)
PAPL-SLAM: Principal Axis-Anchored Monocular Point-Line SLAM [20.2] 本稿では,直線構造情報の利用と直線SLAMシステムにおけるラインの最適化について述べる。
主軸に類似した方向の線を固定し、$n+2$パラメータで$n$ラインを最適化し、両方の問題を一緒に解決する。
本研究では,異なる世界仮説に容易に拡張可能なシーン構造情報について考察する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:44:56 GMT)
Reconsidering Degeneration of Token Embeddings with Definitions for Encoder-based Pre-trained Language Models [20.1] 本研究では,エンコーダに基づく言語モデルのための等方的および意味論的トークン埋め込みを再構築するために,DefindEMBを提案する。
本実験は,Wiktionaryの定義を応用し,そのような埋め込みを再構築する効果を実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:08:51 GMT)
Interpreting and Analyzing CLIP's Zero-Shot Image Classification via Mutual Knowledge [20.1] Contrastive Language-Image Pretraining (CLIP)は画像とテキストのクラス表現を共有埋め込み空間にマッピングすることでゼロショット画像分類を行う。
この研究は、2つのモード間の相互知識のレンズから、画像分類のためのCLIPモデルを解釈するための新しいアプローチを提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:18:21 GMT)
ViLReF: An Expert Knowledge Enabled Vision-Language Retinal Foundation Model [19.9] この研究は、451,956枚の網膜画像とそれに対応する診断用テキストレポートからなるペアデータセットを事前トレーニングすることで、ViLReFと呼ばれる網膜基盤モデルを開発することを目的としている。
ビジョン言語による事前学習戦略では、専門家の知識を活用してラベルの抽出を容易にする。
我々は,モーメントエンコーダが保持する動的メモリキューを備えたバッチ拡張モジュールを用いて,偽陰性の排除による余分なサンプルの供給と空洞の補充を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:00:24 GMT)
ViLReF: A Chinese Vision-Language Retinal Foundation Model [19.9] この研究は、451,956枚の網膜画像とそれに対応する診断用テキストレポートからなるペアデータセットを事前トレーニングすることで、ViLReFと呼ばれる網膜基盤モデルを開発することを目的としている。
ビジョン言語による事前学習戦略では、専門家の知識を活用してラベルの抽出を容易にする。
我々は,モーメントエンコーダが保持する動的メモリキューを備えたバッチ拡張モジュールを用いて,偽陰性の排除による余分なサンプルの供給と空洞の補充を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:00:24 GMT)
Model Balancing Helps Low-data Training and Fine-tuning [19.6] 基礎モデルの最近の進歩は、事前訓練されたモデルを専門分野と整合させる必要性を強調している。
これらのトピックは、科学機械学習(SciML)の新興分野においても注目を集めている。
低データトレーニングと微調整の限界に対処するため、重機自己正規化(HT-SR)理論からインスピレーションを得た。
我々は最近提案されたレイヤーワイド学習率スケジューラであるTempBalanceに適応し、レイヤー間のトレーニング品質を効果的にバランスさせる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:48:39 GMT)
ARIC: An Activity Recognition Dataset in Classroom Surveillance Images [19.6] 私たちはARIC(Activity Recognition In Classroom)と呼ばれる教室監視画像行動認識に焦点を当てた新しいデータセットを構築した。
ARICデータセットには、複数の視点、32のアクティビティカテゴリ、3つのモダリティ、現実世界の教室シナリオの利点がある。
我々は、ARICデータセットが、オープンな教育シナリオの分析と研究のファシリテーターとして機能することを願っている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:59:07 GMT)
Adaptation Odyssey in LLMs: Why Does Additional Pretraining Sometimes Fail to Improve? [19.3] テキストドメイン上でモデルをトレーニングすることは、同じドメインのテスト部分において、その難易度を低下させる可能性があることを示す。
我々の発見は、いつモデルを適応するか、いつ基礎的な能力に頼るかを決める上で、私たちを導くでしょう。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:07:20 GMT)
Adaptation Odyssey in LLMs: Why Does Additional Pretraining Sometimes Fail to Improve? [19.3] テキストドメイン上でモデルをトレーニングすることは、同じドメインのテスト部分において、その難易度を低下させる可能性があることを示す。
我々の発見は、いつモデルを適応するか、いつ基礎的な能力に頼るかを決める上で、私たちを導くでしょう。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:07:20 GMT)
SIFM: A Foundation Model for Multi-granularity Arctic Sea Ice Forecasting [19.2] 本研究では,北極海氷再解析データから自然に得られた時間的多粒度を育成することを提案する。
我々の海氷基礎モデル(SIFM)は、粒内情報と粒間情報の両方を活用するように設計されている。
実験の結果,SIFMは特定の時間的粒度の深層学習モデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:52:12 GMT)
Towards Edge General Intelligence via Large Language Models: Opportunities and Challenges [19.0] エッジインテリジェンス(EI)は、エッジネットワークの計算能力を活用することで、リアルタイムなローカライズされたサービスを提供する上で重要な役割を果たしている。
大規模言語モデル(LLM)の統合により、EIは次のステージへと進化する。
本調査は, LLMを取り入れたEGIを, 集中型, ハイブリッド型, 分散型という3つの概念システムに分類し, 従来のEIとEGIの区別を明らかにした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:45:31 GMT)
Towards Human-centered Explainable AI: A Survey of User Studies for Model Explanations [19.0] 我々は過去5年間に人間によるXAI評価で97コア論文を特定し分析してきた。
我々の研究は、XAIがレコメンダシステムなど特定のアプリケーション領域で急速に普及していることを示している。
我々は,XAI研究者や実践者を対象としたユーザスタディの設計と実施に関する実践的ガイドラインを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:22:08 GMT)
Time-Varying Gaussian Process Bandits with Unknown Prior [18.9] PE-GP-UCBは時変ベイズ最適化問題を解くことができる。
これは、観測された関数の値が以前のいくつかの値と一致しているという事実に依存している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:46:34 GMT)
PND-Net: Plant Nutrition Deficiency and Disease Classification using Graph Convolutional Network [18.8] 本稿では,グラフ畳み込みネットワーク(GNN)を用いた植物栄養障害と疾患分類の新しい深層学習法を提案する。
The proposed method, called Plant Nutrition Deficiency and Disease Network (PND-Net) was evaluate on two public datasets for nutrition deficiency, and two for disease classification using four CNNs。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:01:28 GMT)
RAFA-Net: Region Attention Network For Food Items And Agricultural Stress Recognition [18.8] 本研究では、入力画像内の異なる領域間の相関関係を構築することにより、長距離依存をモデル化する領域アテンションスキームを提案する。
提案する食品の地域意識ネットワークとRAFA-Netと呼ばれる農業ストレス認識手法は,3つの食品データセットを用いて実験されている。
RAFA-Netの上位1つのアキュラシーは、それぞれUECFood-100、UECFood-256、MAFood-121データセットで91.69%、91.56%、96.97%である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:28:08 GMT)
Systems with Switching Causal Relations: A Meta-Causal Perspective [18.8] エージェントの行動の柔軟性や、環境プロセスにおける転換点の柔軟性は、システムの質的なダイナミクスを変える可能性がある。
新しい因果関係が出現し、既存の因果関係が変化または消失し、結果として因果グラフが変化する。
本稿では,古典的因果モデルを等価な定性行動に基づいてクラスタに分類するメタ因果状態の概念を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:32:31 GMT)
The Accuracy Paradox in RLHF: When Better Reward Models Don't Yield Better Language Models [18.6] 適度に正確な報酬モデルで訓練された言語モデルは、高い精度で指導された言語よりも優れていることを示す。
このことは、より強力な報酬モデルが常により良い言語モデルにつながるという広く信じられている信念に挑戦する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:48:08 GMT)
The Accuracy Paradox in RLHF: When Better Reward Models Don't Yield Better Language Models [18.6] 本研究は、強い報酬モデルがより良い言語モデルに必然的に繋がるかどうかを考察する。
適度に正確な報酬モデルで訓練された言語モデルは、非常に正確なモデルによってガイドされた言語よりも優れています。
このことは、より強力な報酬モデルが常により良い言語モデルにつながるという広く信じられている信念に挑戦する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:48:08 GMT)
FredNormer: Frequency Domain Normalization for Non-stationary Time Series Forecasting [18.5] 我々はFredNormerを提案し、周波数の観点からデータセットを観察し、鍵周波数成分を適応的にアップウェイトする。
FredNormer はプラグイン・アンド・プレイモジュールであり、既存の正規化手法と比べて効率を損なわない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:19:09 GMT)
FredNormer: Frequency Domain Normalization for Non-stationary Time Series Forecasting [18.5] 我々はFredNormerを提案し、周波数の観点からデータセットを観察し、鍵周波数成分を適応的にアップウェイトする。
FredNormer はプラグイン・アンド・プレイモジュールであり、既存の正規化手法と比べて効率を損なわない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:19:09 GMT)
FredNormer: Frequency Domain Normalization for Non-stationary Time Series Forecasting [18.5] 我々はFredNormerを提案し、周波数の観点からデータセットを観察し、鍵周波数成分を適応的にアップウェイトする。
FredNormer はプラグイン・アンド・プレイモジュールであり、既存の正規化手法と比べて効率を損なわない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:19:09 GMT)
FredNormer: Frequency Domain Normalization for Non-stationary Time Series Forecasting [18.5] 我々はFredNormerを提案し、周波数の観点からデータセットを観察し、鍵周波数成分を適応的にアップウェイトする。
FredNormer はプラグイン・アンド・プレイモジュールであり、既存の正規化手法と比べて効率を損なわない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:19:09 GMT)
Exploiting Longitudinal Speech Sessions via Voice Assistant Systems for Early Detection of Cognitive Decline [18.4] 軽度認知障害 (MCI) は、アルツハイマー病(英語版)(AD)の初期の段階であり、神経変性疾患の一種である。
既存の研究は、臨床面接やデジタルデバイスから収集した音声を用いて、MCIを検出する可能性を実証している。
本稿では,音声アシスタントシステム(VAS)を用いて,3ヵ月間にわたって遠隔で7セッション音声データを収集する縦断的研究を行った。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:10:21 GMT)
Reconstruction of Differentially Private Text Sanitization via Large Language Models [18.4] 大規模言語モデル(LLM)は、DP対応のプロンプトから変更/削除されたプライバシを再構築することができる。
LLMのアクセシビリティに基づいた2つの攻撃(ブラックボックスとホワイトボックス)を提案する。
本研究は、これらの有名なLCMが、既存のDPテキストサニタイズアプローチの新たなセキュリティリスクとして出現したことを示唆している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:41:17 GMT)
Towards Infinite-Long Prefix in Transformer [18.2] 本研究では,全パラメータの微調整性能に適合するプロンプト法と文脈に基づく微調整法について検討する。
無限長のプレフィックスではなく、トレーニング可能なパラメータをいくつか導入し、微調整するだけでよいアルゴリズムを実装している。
提案手法は, フルパラメータ細調整, P-Tuning V2, LoRA などの既存手法と比較して, 優れた性能, 競争性を実現している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:33:44 GMT)
Geometry-Aware Generative Autoencoders for Warped Riemannian Metric Learning and Generative Modeling on Data Manifolds [18.2] 本稿では,多様体学習と生成モデルを組み合わせた新しいフレームワークであるGeometry-Aware Generative Autoencoder (GAGA)を紹介する。
GAGAは、シミュレーションおよび実世界のデータセットにおける競合性能を示し、シングルセル集団レベルの軌道推定における最先端手法よりも30%改善されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:53:26 GMT)
P4GCN: Vertical Federated Social Recommendation with Privacy-Preserving Two-Party Graph Convolution Networks [17.9] プライバシ保護二要素グラフ畳み込みネットワーク(P4GCN)を利用した新しい縦型ソーシャルレコメンデーション手法を提案する。
4つの実世界のデータセットの実験により、P4GCNは推奨精度で最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:29:22 GMT)
ReLayout: Towards Real-World Document Understanding via Layout-enhanced Pre-training [17.7] 我々は、現在のVrDUアプローチは、OCRツールがそのようなグループ化を自動的に識別できないため、非現実的であると主張している。
そこで我々は,現実の視覚に富んだ文書理解(ReVrDU)という,VrDUタスクの新たな変種を導入する。
また,ReVrDUシナリオに準拠する新しい手法Reを提案し,単語をアレンジすることでセマンティックグルーピングを捉えることを学習する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:34:40 GMT)
ReLayout: Towards Real-World Document Understanding via Layout-enhanced Pre-training [17.7] 我々は、現在のVrDUアプローチは、OCRツールがそのようなグループ化を自動的に識別できないため、非現実的であると主張している。
そこで我々は,現実の視覚に富んだ文書理解(ReVrDU)という,VrDUタスクの新たな変種を導入する。
また,ReVrDUシナリオに準拠する新しい手法Reを提案し,単語をアレンジすることでセマンティックグルーピングを捉えることを学習する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:34:40 GMT)
A Prompt-Based Knowledge Graph Foundation Model for Universal In-Context Reasoning [17.7] そこで本研究では,テキスト内学習,すなわちKG-ICLを介し,プロンプトに基づくKGファウンデーションモデルを提案する。
クエリにおけるエンティティや関係を発見できないような一般化機能を備えたプロンプトグラフを符号化するために,まず統一トークン化器を提案する。
そこで我々は,プロンプトエンコーディングとKG推論を行う2つのメッセージパッシングニューラルネットワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:47:18 GMT)
Expand and Compress: Exploring Tuning Principles for Continual Spatio-Temporal Graph Forecasting [17.5] 本稿では,新しいプロンプトチューニングに基づく連続予測手法を提案する。
具体的には,基本時相グラフニューラルネットワークと連続的なプロンプトプールをメモリに格納する。
この手法により、モデルが広範囲な時間的データストリームから逐次学習し、対応する期間のタスクを達成できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:12:11 GMT)
STRUX: An LLM for Decision-Making with Structured Explanations [17.5] STRUXと呼ばれる新しいフレームワークを導入し、構造化された説明を提供することでLCMの意思決定を強化する。
STRUXは、キーファクトの簡潔なテーブルに長い情報を蒸留することから始まる。
次に、これらの事実のどれが重要かを決定するために一連の自己回帰ステップを使用し、特定の決定に関して、それらが好ましいか悪いかのどちらかに分類する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:01:22 GMT)
Evaluating Morphological Compositional Generalization in Large Language Models [17.5] 大規模言語モデル (LLM) の形態的一般化能力について, 構成性のレンズによる検討を行った。
我々はトルコ語やフィンランド語などの凝集言語に焦点を当てている。
解析の結果,LLMは特に新規語根に適用する場合,形態的構成一般化に苦慮していることが明らかとなった。
モデルは偶然よりも個々の形態的組み合わせを識別できるが、その性能は体系性に欠けており、人間に比べてかなりの精度の差が生じる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:17:20 GMT)
Context-Scaling versus Task-Scaling in In-Context Learning [17.4] In-Context Learning (ICL: In-Context Learning) の2つの重要なコンポーネント、コンテキストスケーリングとタスクスケーリングを分析します。
コンテクストスケーリングとタスクスケーリングの両方が可能であるが、ベクトル化された入力を持つ標準的なマルチ層パーセプトロン(MLP)はタスクスケーリングしかできないことを実証的に示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:58:08 GMT)
CMAL: A Novel Cross-Modal Associative Learning Framework for Vision-Language Pre-Training [17.3] 本稿では,係留点検出と相互関連学習を併用したクロスモーダル・アソシエイト学習フレームワークCMALを提案する。
CMALは、4つの共通下流視覚言語タスクにおいて、従来のCMCLベースの手法と競合する性能を達成している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:12:26 GMT)
ITINERA: Integrating Spatial Optimization with Large Language Models for Open-domain Urban Itinerary Planning [17.3] オープンドメイン都市イテナリープランニング(OUIP)の新たな課題について紹介する。
OUIPは、自然言語によるユーザ要求から、パーソナライズされた都市反復を生成する。
本稿では,大規模言語モデルと空間最適化を統合したOUIPシステムであるITINERAについて述べる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:28:18 GMT)
Unveiling and Manipulating Concepts in Time Series Foundation Models [17.2] 時系列基礎モデルは、幅広いアプリケーションのための強力なツールであることを約束します。
しかし、これらのモデルが学習する概念についてはほとんど知られていない。
本研究は,これらのモデルによって学習された概念を同定し,モデルの特定の部分に局所化し,モデル予測をこれらの概念の方向に沿って操ることで,これらのギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:08:08 GMT)
Exploring Representations and Interventions in Time Series Foundation Models [17.2] 時系列基礎モデル(TSFM)は、幅広いアプリケーションのための強力なツールであることを約束する。
彼らの内部表現や学習された概念はまだよく理解されていない。
本研究では,様々なTSFMにおける表現の構造と冗長性について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:08:08 GMT)
Few-Shot Classification of Interactive Activities of Daily Living (InteractADL) [17.2] 我々は、人間(と物体)間の相互作用を含む複雑なADLを理解するための新しいデータセットとベンチマーク、InteractADLを提案する。
そこで本研究では,クラス名ベクトルを学習することにより,よりセマンティックなセマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマン
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:00:23 GMT)
Configurable Embodied Data Generation for Class-Agnostic RGB-D Video Segmentation [17.1] 本稿では,異なる形状のロボット間での分類に依存しないビデオセグメンテーションを改善するために,大規模データセットを生成する手法を提案する。
汎用セグメンテーションデータに基づいて訓練されたビデオセグメンテーションモデルが、データ生成プロセスにロボットエンボディメントが組み込まれている場合、特定のロボットプラットフォームに対してより効果的であるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:43:23 GMT)
MFC-Bench: Benchmarking Multimodal Fact-Checking with Large Vision-Language Models [17.1] 大規模視覚言語モデル(LVLM)はマルチモーダル推論タスクを大幅に改善した。
これらのモデルは、事実情報を明示的に格納するために外部知識ベースに頼るのではなく、パラメータ内にマルチモーダルな事実を埋め込む。
しかし、LVLMによって識別される内容は、固有のバイアスや誤った推論のために、実際の事実から逸脱する可能性がある。
MFC-Benchは,3段階の検証予測において,LVLMの実際の精度を評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:59:17 GMT)
LoD-Loc: Aerial Visual Localization using LoD 3D Map with Neural Wireframe Alignment [16.9] 複雑な3次元表現における視覚的局所化のための新しい手法を提案する。
既存のローカライゼーションアルゴリズムとは異なり、LevelDetail(LoD)3Dマップを用いて無人車両(UAV)のポーズを推定する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:09:27 GMT)
Iter-AHMCL: Alleviate Hallucination for Large Language Model via Iterative Model-level Contrastive Learning [16.9] 幻覚に対処するための反復モデルレベルのコントラスト学習(Iter-AHMCL)
本稿では,幻覚に対処するイテレーティブモデルレベルのコントラスト学習(Iter-AHMCL)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:15:40 GMT)
Towards a Knowledge guided Multimodal Foundation Model for Spatio-Temporal Remote Sensing Applications [16.8] 本稿では,事前学習タスクが複数のモーダル間の因果関係をキャプチャする基礎モデルフレームワークを提案する。
本手法は,MultiModal Variable Step Forecasting (MM-VSF) と呼ばれ,衛星画像の予測を事前訓練作業として利用する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:18:10 GMT)
On the Risk of Evidence Pollution for Malicious Social Text Detection in the Era of LLMs [16.6] Evidence-enhanced detectorsは、悪意のある社会テキストと関連する証拠を識別する際、顕著な能力を示す。
大型言語モデル(LLM)の台頭は、検知器を混乱させる証拠汚染の潜在的なリスクをもたらす。
本稿では, 証拠の操作方法, 基本汚染を含む誤用シナリオのシミュレーション, 証拠の表現・生成について考察する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:17:53 GMT)
Correction to Local Information Privacy and Its Applications to Data Aggregation [16.4] 提案したLIP機構のプライバシーパラメータの有効範囲を補正する。
有効なプライバシパラメータの範囲を広げるための効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:22:53 GMT)
Expanding Chatbot Knowledge in Customer Service: Context-Aware Similar Question Generation Using Large Language Models [16.4] 我々は,Large Language Models(LLM)に基づく類似質問生成(SQG)アプローチを提案する。
本手法は, セマンティックな多様性の点で, ベースライン手法をはるかに上回っている。
人間の評価は、顧客の意図を反映した回答を統合することが、生成された質問の数を増やすために重要であることを確認します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:48:14 GMT)
DocLayout-YOLO: Enhancing Document Layout Analysis through Diverse Synthetic Data and Global-to-Local Adaptive Perception [16.3] 速度の優位性を保ちながら精度を向上させる新しいアプローチであるDoc-YOLOを導入する。
堅牢な文書事前学習には、Mesh-candidate BestFitアルゴリズムを導入する。
モデル最適化の観点からは,グローバルからローカライズ可能な受信モジュールを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:50:47 GMT)
No Bells, Just Whistles: Sports Field Registration by Leveraging Geometric Properties [16.3] 本稿では,3次元サッカー場モデルを用いてカメラキャリブレーションを可能にする新しいキャリブレーションパイプラインを提案し,そのプロセスを拡張して放送ビデオのマルチビュー特性を評価する。
本手法は, ホログラフィー推定における競合性を維持しつつ, マルチビューおよびシングルビューの3次元カメラキャリブレーションにおいて, 優れた性能を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:38:06 GMT)
PromptExp: Multi-granularity Prompt Explanation of Large Language Models [16.3] OurToolは、トークンレベルの洞察を集約することで、複数の粒度をプロンプトするフレームワークである。
OurToolは、ホワイトボックスとブラックボックスの説明の両方をサポートし、説明をより高いレベルまで拡張し、柔軟な分析を可能にします。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:25:15 GMT)
SynFlowNet: Design of Diverse and Novel Molecules with Synthesis Constraints [16.2] 反応空間が化学反応と購入可能な反応剤を用いて新しい分子を逐次構築するGFlowNetモデルであるSynFlowNetを紹介する。
生成機構の明示的な制約としてフォワード合成を取り入れることで、シリコン分子生成と実世界の合成能力のギャップを埋めることを目指す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:17:38 GMT)
Revisited Large Language Model for Time Series Analysis through Modality Alignment [16.1] 大規模言語モデルは、センサデータ分析のような多くの重要なWebアプリケーションにおいて、印象的なパフォーマンスを示している。
本研究では,予測,分類,計算,異常検出など,主要な時系列タスクにLLMを適用することの有効性を評価する。
この結果から,LLMはこれらのコア時系列タスクに対して最小限のアドバンテージを提供し,データの時間構造を歪めてしまう可能性があることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:47:31 GMT)
Fair Clustering for Data Summarization: Improved Approximation Algorithms and Complexity Insights [16.1] 一部のアプリケーションでは、すべてのデータポイントをセンターとして選択できるが、一般的な設定では、施設またはサプライヤーと呼ばれる一連のポイントからセンターを選択する必要がある。
そこで本研究では,複数のグループから構成されるデータに対して,各グループから最小限のセンタを選択する必要がある,公平な$k$-supplier問題としてモデル化された公平なデータ要約に焦点を当てる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:00:19 GMT)
Mitigating Dual Latent Confounding Biases in Recommender Systems [16.1] 本稿では,器用変数(IV)アプローチと識別可能な変分自動エンコーダ(iVAE)を併用したデバイアス化手法を提案する。
IViDRは、アイテムとユーザからのフィードバックの間に潜伏した共同創設者が引き起こした矛盾するバイアスに対処する。
それは、アイテムの露出とユーザからのフィードバックの間に潜伏した共同創設者の識別可能な表現を、元のデータとデバイアスされたインタラクションデータの両方から推論する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:58:53 GMT)
Translation Canvas: An Explainable Interface to Pinpoint and Analyze Translation Systems [16.1] 本稿では,翻訳システムの性能をピンポイントし解析するための説明可能なインタフェースであるTranslation Canvasを紹介する。
エラースパンを説明付きで強調し、システムの予測を選択的に表示することで、きめ細かい分析をサポートする。
人間による評価によると、Translation CanvasはCOMETやSacreBLEUパッケージよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:53:40 GMT)
Retrieval-Reasoning Large Language Model-based Synthetic Clinical Trial Generation [16.1] 本稿では, 大規模言語モデルを利用した新規な検索・推論フレームワークを提案する。
urlClinicalTrials.govデータベースによる実際の臨床試験で実施された実験は、我々の合成データが実際のデータセットを効果的に増大させることができることを示した。
本研究は, 臨床研究を加速し, 患者プライバシの倫理基準を高くする上で, 総合臨床試験生成のためのLCMが期待できることを示唆する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:46:32 GMT)
MedAide: Towards an Omni Medical Aide via Specialized LLM-based Multi-Agent Collaboration [16.1] 大規模言語モデル(LLM)による対話システムは、現在医療分野において潜在的に有望であることを示している。
本稿では,医療専門サービスのためのオムニ・メディカル・マルチエージェント・コラボレーション・フレームワークであるMedAideを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:10:27 GMT)
Conv-Basis: A New Paradigm for Efficient Attention Inference and Gradient Computation in Transformers [16.0] 最近のLarge Language Models(LLM)におけるトランスフォーマーの成功の鍵は自己認識メカニズムである
我々は、注目行列の畳み込み様構造を利用して、畳み込み行列を用いた注目の効率的な近似法を開発する。
トランスフォーマーモデルにおけるアテンション計算を加速するための新しいパラダイムが、より長いコンテキストへのアプリケーションを支援することを願っています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:55:47 GMT)
Neural Algorithmic Reasoning with Multiple Correct Solutions [16.0] 一部のアプリケーションでは、複数の正しい解を回収することが望ましい。
BF(Bellman-Ford)とDFS(Depth-First Search)の2つの古典的アルゴリズムで本手法を実証する。
この方法は、モデル出力からソリューションをサンプリングし、検証するだけでなく、適切なトレーニングデータを生成することを含む。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:56:20 GMT)
Irregularity-Informed Time Series Analysis: Adaptive Modelling of Spatial and Temporal Dynamics [16.0] 不規則時系列データ(IRTS)はNatural Irregular Time Series(NIRTS)とAccidental Irregular Time Series(AIRTS)の2種類に分けられる。
本稿では, IRTS を局所性, 時間, 時空間, 不規則性という 4 つの視点から扱う, 一般的な不規則時系列データのためのトランスフォーマーベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:52:25 GMT)
Robust ASR Error Correction with Conservative Data Filtering [15.8] 大規模言語モデルに基づく誤り訂正(EC)は,自動音声認識(ASR)システムの性能を向上させる新しい技術である。
本稿では,ECトレーニングデータが満足すべき2つの基本的な基準を提案する。
低品質のECペアを特定し、そのようなケースでは修正を行わないようにモデルを訓練する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:52:16 GMT)
ScaleFlow++: Robust and Accurate Estimation of 3D Motion from Video [15.6] 本稿では,3次元モーション認識手法であるScaleFlow++を提案する。
たった1対のRGBイメージで、ScaleFlow++は光学フローとモーションインディープス(MID)をしっかりと推定できる。
KITTIでは、ScaleFlow++は、SF-allを6.21から5.79に削減し、最高のモノクロシーンフロー推定性能を達成した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:16:21 GMT)
Task Aware Modulation using Representation Learning: An Approach for Few Shot Learning in Environmental Systems [15.4] TAM-RLは異種システムにおける少数ショット学習のための新しいフレームワークである。
2つの実環境データセット上でのTAM-RLの評価を行った。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:06:17 GMT)
DeltaDock: A Unified Framework for Accurate, Efficient, and Physically Reliable Molecular Docking [15.2] 分子ドッキングはタンパク質-リガンド相互作用を理解するために構造に基づく薬物設計において重要である。
近年のドッキング法の発展により,従来のサンプリング法に比べて効率と精度が著しく向上した。
ポケット予測とサイト固有のドッキングからなる新しい2段階ドッキングフレームワークDeltaDockを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:56:57 GMT)
A Practice-Friendly LLM-Enhanced Paradigm with Preference Parsing for Sequential Recommendation [15.2] 本稿では、シーケンシャルレコメンデータシステム(SRS)のための優先構文解析(P2Rec)を用いた実践的LLM拡張パラダイムを提案する。
具体的には、情報再構成段階において、事前学習したSRSモデルの助けを借りて、協調的な情報注入のための新しいユーザレベルSFTタスクを設計する。
我々のゴールは、LLMが各ユーザのインタラクションシーケンスから対応する優先度分布を再構築することを学ばせることである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:21:47 GMT)
Enhancing LLM Agents for Code Generation with Possibility and Pass-rate Prioritized Experience Replay [15.1] BTPパイプラインは、ビームサーチサンプリング、テストフェーズ、優先されたエクスペリエンス再生フェーズの3つのフェーズで構成されている。
このアプローチでは、コードモデルによって収集された失敗プログラムを利用し、高い可能性とパスレート優先度を持つプログラムを再生する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:54:42 GMT)
CELL your Model: Contrastive Explanations for Large Language Models [15.1] 大規模言語モデル(LLM)では、説明すべきクラス予測は存在しない。代わりに、LLMが与えられたプロンプトに対して特定の応答を出力する理由を問うことができる。
我々の説明は、LLMが与えられたプロンプトに対して応答を出力していることを示唆している。なぜなら、もしプロンプトがわずかに修正されたら、LLMは異なる応答を与えられるだろう。
i) コントラストを作成するのに効果的であるが、多くのモデルコールが必要であり、i) より長いコンテキストで要求されるクエリ予算に適合するコントラストをインテリジェントに生成する予算付きアルゴリズム。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:15:44 GMT)
Details Make a Difference: Object State-Sensitive Neurorobotic Task Planning [15.0] オブジェクトの状態は現在の状態や状態を反映しており、ロボットのタスク計画と操作にとって重要である。
近年,LLM (Large Language Models) とVLM (Vision-Language Models) は,計画生成において顕著な能力を示している。
我々は、事前学習ニューラルネットワークによって強化されたタスク計画エージェントであるObject State-Sensitive Agent (OSSA)を紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:48:38 GMT)
How Do Humans Write Code? Large Models Do It the Same Way Too [15.0] Program-of-Thought(PoT)は、自然言語ベースのChain-of-Thought(CoT)を、大規模言語モデルにおいて最も一般的な方法として置き換える。
PoTを使用すると、CoTと比較して、不正な公式や欠陥論理などの推論エラーがより多く導入される。
本稿では,PoTとCoTの統合を支援する一連の戦略を活用するHTL(Human-Think Language)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:04:46 GMT)
Efficient and Effective Universal Adversarial Attack against Vision-Language Pre-training Models [14.8] 非普遍的敵攻撃は、多くの場合、データインスタンス当たりの計算要求が高いため、リアルタイムオンラインアプリケーションでは実用的ではない。
DO-UAPと呼ばれる直接最適化に基づくUAPアプローチを提案し、高い攻撃性能を維持しながら資源消費を大幅に削減する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:48:37 GMT)
Instability of steady-state mixed-state symmetry-protected topological order to strong-to-weak spontaneous symmetry breaking [14.7] 混合状態対称性を保護した位相状態を持つ開量子系が、定常状態が対称摂動の下でこの特性を保持するかどうかを考察する。
典型的対称性の摂動は、任意に小さな摂動で強弱自然対称性の破れを引き起こし、定常な混合状態の対称性を保護した位相秩序を不安定化する。
我々はリンドブラディアンの基本物理を再現し、クリフォードゲート、パウリ測定、フィードバックのみを用いて効率的にシミュレートできる量子チャネルを構築する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:00:00 GMT)
Attention-Guided Perturbation for Consistency Regularization in Semi-Supervised Medical Image Segmentation [14.7] 本稿では,医療画像セグメンテーションの文脈における半教師付き整合正則化のための注意誘導型摂動戦略を提案する。
画像と特徴レベルのモデルからの注意に基づく摂動を加えて、一貫性の正則化を実現する。
提案手法は,ACDCデータセットの90.4%のDiceスコアを含む,ベンチマークデータセットの最先端結果を7ケースシナリオで達成した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:04:22 GMT)
Personality-Guided Code Generation Using Large Language Models [14.7] コーディングタスクに適した性格特性のエミュレートが,大規模言語モデル(LLM)の性能に与える影響について検討する。
以上の結果から,パーソナリティガイダンスはコード生成精度を大幅に向上し,28 LLM-データセットの組み合わせのうち23のパスレートが向上した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:42:55 GMT)
AdaptiveDrag: Semantic-Driven Dragging on Diffusion-Based Image Editing [14.5] マスクレスのポイントベース画像編集手法であるAdaptiveDragを提案する。
入力画像とドラッグプロセスとの包括的接続を確保するため,セマンティック駆動型最適化を開発した。
提案手法は,これらの効果的な設計に基づいて,単一入力画像とハンド・ターゲット・ポイント・ペアのみを用いて,優れた生成結果を提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:59:02 GMT)
Towards Graph Foundation Models: The Perspective of Zero-shot Reasoning on Knowledge Graphs [14.4] 我々は、ゼロショット学習を用いて、多様なグラフタスクを効果的に一般化する統合グラフ推論フレームワークSCOREを紹介する。
SCOREを38種類のグラフデータセットを用いて評価し、ノードレベル、リンクレベル、グラフレベルのタスクを複数のドメインでカバーする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:26:08 GMT)
KcMF: A Knowledge-compliant Framework for Schema and Entity Matching with Fine-tuning-free LLMs [14.4] 大規模言語モデル(LLM)は、タスク命令に関する幻覚や混乱に悩まされる。
本稿では、ドメイン固有の微調整を必要とせず、これらの問題に対処する知識-互換性マッチングフレームワーク(KcMF)を提案する。
KcMFは、タスク固有の自然言語文を採用するために、擬似コードに基づくタスク分解戦略を採用している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:50:02 GMT)
Light-Weight Fault Tolerant Attention for Large Language Model Training [14.2] 大規模言語モデル (LLM) は様々な自然言語処理タスクにおいて顕著な性能を示した。
LLMは、特にアテンション機構において故障の影響を受けやすいが、これはトランスフォーマーベースのLLMの重要な構成要素である。
我々は,LLMにおけるアテンション機構に適したアルゴリズムベースフォールトトレランス(ABFT)技術であるATTNCheckerを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:10:58 GMT)
ConLUX: Concept-Based Local Unified Explanations [14.1] ツールネームは、任意の機械学習モデルに対して概念ベースのローカル説明を提供するための一般的なフレームワークである。
我々は、LIME、Kernel SHAP、Anchor、LOREの4種類の説明手法でツール名をインスタンス化した。
評価の結果,ツールネームはより忠実な説明を提供し,ユーザにとってより理解しやすいものとなった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:34:11 GMT)
MatryoshkaKV: Adaptive KV Compression via Trainable Orthogonal Projection [14.1] KVキャッシュは、大規模言語モデルの推論におけるデファクト技術となっている。
本稿では,低ランクな投影行列を用いて,キャッシュ特性を次元を小さくした空間に変換する。
提案手法は, 平均KVキャッシュ圧縮率60%で90%以上の性能を維持することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:34:51 GMT)
REFINE on Scarce Data: Retrieval Enhancement through Fine-Tuning via Model Fusion of Embedding Models [14.0] 検索拡張生成(RAG)パイプラインは、質問応答(QA)などのタスクで一般的に使用される。
本稿では,利用可能な文書から合成データを生成する新しい手法であるREFINEを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:43:39 GMT)
Learning to Predict Usage Options of Product Reviews with LLM-Generated Labels [14.0] 複雑な自然言語タスクにおけるデータアノテートのための,少人数の学習者としてLLMを使用する手法を提案する。
カスタムモデルを学ぶことは、エネルギー効率とプライバシー対策を個別に制御する。
結果のデータの質が、サードパーティのベンダーサービスによって達成されたレベルを超えていることに気付きました。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:34:33 GMT)
Orthogonalized Estimation of Difference of $Q$-functions [14.0] オフライン強化学習は、利用可能な観測データを持つ多くの環境で重要であるが、安全性、コスト、その他の懸念から、オンラインで新しいポリシーをデプロイできない。
CATEのような因果的コントラスト関数の因果的推論と機械学習目標推定の最近の進歩は、決定を最適化するのに十分であり、潜在的にスムーズな構造に適応できる。
我々は、Rラーナーの動的一般化を開発し、$Qpi$-functions, $Qpi(s,1)-Qpi(s,0)$の差を推定し、最適化する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:41:36 GMT)
Evaluating Software Development Agents: Patch Patterns, Code Quality, and Issue Complexity in Real-World GitHub Scenarios [13.9] この調査は、500の現実のGitHubイシューで上位10のエージェントから4,892のパッチを評価した。
一人のエージェントが支配的であり、170の問題が未解決であり、改善の余地があった。
ほとんどのエージェントはコードの信頼性とセキュリティを維持し、新しいバグや脆弱性を避けた。
一部のエージェントはコードの複雑さを増し、多くの重複を減らし、コードの臭いを最小限にした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:33:57 GMT)
Quantum subspace verification for error correction codes [13.9] 本稿では,量子誤り訂正符号部分空間の知識を活用し,潜在的な測定予算を削減する量子部分空間検証の枠組みを紹介する。
有名なCalderbank-Shor-Steane符号やQLDPC安定化符号のような特定の符号の場合、設定数とサンプルの複雑さは著しく減少する。
提案した部分空間検証と直接忠実度推定を組み合わせることで、一般的なマジック論理状態の忠実度を検証するためのプロトコルを構築する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:28:33 GMT)
First-Person Fairness in Chatbots [13.8] ユーザに対する公平さを意味する「ファースト・パーソナライズ・フェアネス」について検討する。
これには、アイデンティティやバックグラウンドに関わらず、すべてのユーザに高品質なレスポンスを提供することが含まれる。
本稿では,一人称フェアネスの1つの側面を評価するための,スケーラブルなプライバシ保護手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:59:47 GMT)
I Want to Break Free! Persuasion and Anti-Social Behavior of LLMs in Multi-Agent Settings with Social Hierarchy [13.7] 本研究では,Large Language Model (LLM) に基づくエージェントの相互作用パターンについて,厳密な社会的階層を特徴とする文脈で検討する。
本研究では,警備員と囚人エージェントが関与するシミュレートシナリオにおける説得と反社会的行動の2つの現象について検討した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:06:22 GMT)
I Want to Break Free! Anti-Social Behavior and Persuasion Ability of LLMs in Multi-Agent Settings with Social Hierarchy [13.7] 本研究では,Large Language Model (LLM) に基づくエージェントの相互作用パターンについて,厳密な社会的階層を特徴とする文脈で検討する。
本研究では,警備員と囚人エージェントが関与するシミュレートシナリオにおける説得と反社会的行動の2つの現象について検討した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:06:22 GMT)
Sensitivity of Generative VLMs to Semantically and Lexically Altered Prompts [13.6] テキストの語彙的および意味的変化を理解するための生成的視覚言語モデルの有効性を評価する。
この脆弱性は,出力の一貫性の実現を目的とした技術の性能に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:41:32 GMT)
Tracking Universal Features Through Fine-Tuning and Model Merging [13.6] 異なるドメインのテキストで微調整されたモデルに対して、機能がどのように出現し、消滅し、持続するかを研究する。
我々の調査は、典型的な移行学習シナリオにおける機能の安定性と変換に関する深い洞察を提供することを目的としています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:18:39 GMT)
General bounds on the quality of Bayesian coresets [13.5] この研究は、KL(Kulback-Leibler)上の一般上界と下界を示す。
下限は、コアセット近似の質に関する基本的な制限を得るために適用される。
上界は最近のサブサンプル最適化手法の性能解析に使用される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:30:47 GMT)
UniCoN: Universal Conditional Networks for Multi-Age Embryonic Cartilage Segmentation with Sparsely Annotated Data [13.4] 骨軟骨異形成症は、新生児の2-3%に影響を及ぼし、骨と軟骨の障害の集団である。
この病気に関する現在の研究は、胚性マウスの3DマイクロCT画像において、発育する軟骨を正確にセグメント化することを含んでいる。
本研究では, 軟骨形状変化の正確な表現を可能にするために, 個別の年齢区分と連続的な画像作物位置の2つの新しいメカニズムを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:06:55 GMT)
Beyond Oversmoothing: Evaluating DDPM and MSE for Scalable Speech Synthesis in ASR [13.3] ASRモデルのトレーニングに使用する場合, DPM(Denoising Diffusion Probabilistic Models)とTSのMean Squared Error(MSE)ベースのモデルを比較した。
与えられたモデルサイズに対して、DDPMはMSEモデルよりも多くのデータとより多様な話者の集合をうまく利用することができる。
実話と合成音声のWERの比率(1.46)は最も高いが,大きなギャップが残っていることも確認できた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:35:56 GMT)
Comprehending Knowledge Graphs with Large Language Models for Recommender Systems [13.3] 本稿では,知識認識のための大規模言語モデルを活用したCoLaKGという新しい手法を提案する。
まず、KG から各項目を中心とする部分グラフを抽出し、それらを LLM のテキスト入力に変換する。
LLMはこれらの項目中心のサブグラフの理解を出力し、その後セマンティック埋め込みに変換する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:44:34 GMT)
Why Go Full? Elevating Federated Learning Through Partial Network Updates [13.2] フェデレートラーニング(Federated Learning)は、ユーザのデータプライバシを保護するために設計された分散機械学習パラダイムである。
我々はFedPartメソッドを導入し、各通信ラウンドにおいて、モデル更新を単一のレイヤまたはいくつかのレイヤに制限する。
その結果,FedPart法はコンバージェンス速度と精度の点で従来のフルネットワーク更新手法をはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:35:22 GMT)
FedCAP: Robust Federated Learning via Customized Aggregation and Personalization [13.2] フェデレートラーニング(FL)は、様々なプライバシー保護シナリオに適用されている。
我々はデータ不均一性とビザンチン攻撃に対する堅牢なFLフレームワークであるFedCAPを提案する。
我々は,FedCAPがいくつかの非IID環境において良好に機能し,連続的な毒殺攻撃下で強い堅牢性を示すことを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:01:22 GMT)
TPFL: A Trustworthy Personalized Federated Learning Framework via Subjective Logic [13.1] フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。
ほとんどのFLアプローチは、プライバシ保護に重点を置いているが、信頼性が不可欠であるシナリオでは不足している。
主観的論理を用いた分類タスク用に設計された信頼に足る個人化フェデレーション学習フレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:33:29 GMT)
Sample-Efficient Reinforcement Learning with Temporal Logic Objectives: Leveraging the Task Specification to Guide Exploration [13.1] 本稿では,不確実な力学を持つシステムに対する最適制御ポリシーの学習問題に対処する。
本稿では,競争的アプローチよりもはるかに高速に制御ポリシーを学習できる高速化されたRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:53:41 GMT)
MuseTalk: Real-Time High Quality Lip Synchronization with Latent Space Inpainting [12.9] MuseTalkは、変分オートエンコーダによって符号化された潜時空間でリップシンクターゲットを生成する。
オンラインのフェース生成をサポートする。256x256で30 FPS以上で、起動遅延は無視できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:04:01 GMT)
MuseTalk: Real-Time High Quality Lip Synchronization with Latent Space Inpainting [12.9] MuseTalkは、変分オートエンコーダによって符号化された潜時空間でリップシンクターゲットを生成する。
オンラインのフェース生成をサポートする。256x256で30 FPS以上で、起動遅延は無視できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:04:01 GMT)
CoLLEGe: Concept Embedding Generation for Large Language Models [12.8] CoLLEGeは、新しい概念のための柔軟な埋め込みを生成することができるメタ学習フレームワークである。
我々は,現実のシナリオに挑戦する上で,新しい概念学習をテストするための一連のタスクを設計する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:57:08 GMT)
The State of Robot Motion Generation [12.8] 本稿では,50年間にわたるロボット工学研究の成果を概説する。
これは、通常調査されていない方法論の境界を、明示的なモデルで運用するものから暗黙的なモデルで学習するものへと横断する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:31:31 GMT)
ReadMe++: Benchmarking Multilingual Language Models for Multi-Domain Readability Assessment [12.7] 本稿では、アラビア語、英語、フランス語、ヒンディー語、ロシア語で9757文の人間のアノテーションを付加した多言語マルチドメインデータセットであるReadMe++を紹介する。
ReadMe++を使って、教師付き、教師なし、および少数ショットプロンプト設定において、多言語および単言語言語モデルをベンチマークする。
本実験は,ReadMe++で学習したモデルによる優れたドメイン一般化と言語間変換能力の強化によるエキサイティングな結果を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:27:49 GMT)
Stable Object Placement Planning From Contact Point Robustness [12.6] 我々のプランナーはまず接触点を選択し、次に選択した点をソリケートする配置ポーズを決定する。
本アルゴリズムは, 物体形状, 凸性, 質量密度の均一性に制約を加えることなく, 安定性を考慮した物体配置計画を容易にする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:02:15 GMT)
DocETL: Agentic Query Rewriting and Evaluation for Complex Document Processing [12.6] 本稿では,複雑な文書処理パイプラインを最適化するDocETLを提案する。
DocETLは、ユーザーがそのようなパイプラインを定義するための宣言的インターフェースを提供し、エージェントベースのフレームワークを使用して自動的に最適化する。
DocETLは出力が1.34$から4.6times$のプランを見つける。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:22:35 GMT)
Real-time Stereo-based 3D Object Detection for Streaming Perception [12.5] 本稿では,ストリーミング知覚のための3Dオブジェクト検出フレームワークStreamDSGNを紹介する。
StreamDSGNは、過去の情報を利用して、次の瞬間にオブジェクトの3D特性を直接予測する。
強いベースラインと比較して、StreamDSGNはストリーミング平均精度を最大4.33%向上させる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:23:02 GMT)
UNDIAL: Self-Distillation with Adjusted Logits for Robust Unlearning in Large Language Models [12.5] 本稿では,UnDIAL(Unlearning via Self-Distillation on Adjusted Logits)を紹介する。
本手法では, 自己蒸留を利用してロジットを調整し, ターゲットトークンの影響を選択的に低減する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:50:27 GMT)
Devil in the Tail: A Multi-Modal Framework for Drug-Drug Interaction Prediction in Long Tail Distinction [12.4] 薬物と薬物の相互作用(DDI)の同定は薬理学研究の重要な側面である。
本稿では、DDI分類を実現するために、薬物の複数の特性を活用するために、新しいマルチモーダルディープラーニングベースのフレームワークTFDMを紹介した。
カテゴリーごとの分布歪による課題に対処するため, タレド・フォカル・ロスと呼ばれる新たな損失関数を導入する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:21:22 GMT)
Shaping a Stabilized Video by Mitigating Unintended Changes for Concept-Augmented Video Editing [12.4] 本研究は、多種多様な安定したターゲット映像を柔軟に生成する改良されたコンセプト拡張ビデオ編集手法を提案する。
このフレームワークには、概念強化されたテキストインバージョンと、二重の事前監視機構が含まれる。
包括的評価により,本手法はより安定的で生活的なビデオを生成し,最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:03:15 GMT)
Two-Timescale Linear Stochastic Approximation: Constant Stepsizes Go a Long Way [12.3] マルコフ過程のレンズを通した等質化スキームについて検討する。
我々は、定段化によって導入された分散とバイアスと同様に、明示的な幾何学的および非漸近収束率を導出する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:49:27 GMT)
Triple Modality Fusion: Aligning Visual, Textual, and Graph Data with Large Language Models for Multi-Behavior Recommendations [12.2] 本稿では,三重モダリティの融合を活かした,多行動レコメンデーションのための新しいフレームワークを提案する。
提案モデルであるTriple Modality Fusion (TMF)は,大規模言語モデル(LLM)のパワーを利用して,これらの3つのモダリティを調整・統合する。
大規模な実験により,提案手法の有効性が示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:44:15 GMT)
Active Fake: DeepFake Camouflage [12.0] Face-Swap DeepFakeは、オリジナルの顔と合成顔とを交換することで振舞いを作る。
既存の法医学的手法は、主にディープニューラルネットワーク(DNN)に基づいており、これらの操作を効果的に公開し、重要な認証指標となっている。
混合不整合を発生し,不感,有効性,伝達性を確保したDeepFakeカモフラージュを作成するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:36:17 GMT)
Adaptive Prompt Learning with SAM for Few-shot Scanning Probe Microscope Image Segmentation [11.9] Segment Anything Model (SAM) は自然シーン画像のイメージセグメンテーションにおいて強い性能を示した。
SAMの有効性は、SPM(Scanning Probe Microscope)画像のような特定の科学的領域に適用すると著しく低下する。
本稿では,数ショットのSPM画像セグメンテーションに適したSAMフレームワークを用いたAdaptive Prompt Learningを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:38:01 GMT)
Satellite-Terrestrial Quantum Networks and the Global Quantum Internet [11.9] 地上局と統合されたGEO衛星とLEO衛星の3層化手法を提案する。
まず,3層間のチャネル条件を分析し,宇宙・地球系統合におけるLEO衛星の役割を明らかにする。
我々の設計は、トランシーバーで限られた量子メモリを仮定するという点では未来的だが、量子メモリが利用できないネットワークの短期的利用についても論じる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:45:18 GMT)
How Transformers Implement Induction Heads: Approximation and Optimization Analysis [11.8] 変換器が誘導ヘッドを実装する方法の近似と最適化の両方を提供する。
近似解析では、標準および一般化誘導ヘッド機構の両方を定式化する。
最適化解析のために,4-gramと2-gram成分からなる合成混合ターゲットのトレーニングダイナミクスについて検討した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:04:06 GMT)
Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review [11.8] ピアリビュー(FAIR)による新しいフォールト・アウェア蒸留法を提案する。
本手法では, 教師から金の合理性を得る代わりに, 生徒の過ちを特定・説明するよう教師に求めている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:01:58 GMT)
Enhance Reasoning by Learning from Mistakes: Peer-Review Knowledge Distillation from Multiple Large Language Models [11.8] そこで本研究では,新しいMAPD法について紹介する。
本手法では, 教師から金の合理性を得る代わりに, 生徒の過ちを特定・説明するよう教師に求めている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:01:58 GMT)
New Paradigm of Adversarial Training: Breaking Inherent Trade-Off between Accuracy and Robustness via Dummy Classes [11.7] 対人訓練(AT)は、DNNの堅牢性を高める最も効果的な方法の1つである。
既存のAT手法は、対向的堅牢性とクリーンな精度の間の本質的にのトレードオフに悩まされる。
そこで本研究では,各オリジナルクラスに対してダミークラスを追加することで,新たなATパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:36:10 GMT)
Identifying Task Groupings for Multi-Task Learning Using Pointwise V-Usable Information [11.5] ポイントワイド V-Uable Information (PVI) を用いたタスク難易度に基づくタスク関連度尺度を提案する。
我々は, 一般, バイオメディカル, 臨床領域において, 15個のNLPデータセットを用いたタスクグループ化の実現可能性を評価する実験を行った。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:49:45 GMT)
Dual Prototype Evolving for Test-Time Generalization of Vision-Language Models [11.5] 本稿では,事前学習型視覚言語モデル(VLM)のための新しいテスト時間適応手法であるDual Prototype Evolving (DPE)を紹介する。
テスト期間中にターゲットクラスに対するより正確なマルチモーダル表現を段階的にキャプチャするために、テキストとビジュアルの2つのプロトタイプを作成し、進化させます。
提案したDPEは,従来の最先端手法を一貫して上回りながら,競争力のある計算効率を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:59:49 GMT)
ExoTST: Exogenous-Aware Temporal Sequence Transformer for Time Series Prediction [11.5] 時系列予測のためのトランスフォーマーベースのフレームワークであるExoTSTを提案する。
過去の変数と現在の変数を統合するために、ExoTSTは、新しい時間的相互モダリティ融合モジュールを導入した。
実世界の炭素フラックスデータセットと時系列ベンチマークの実験は、ExoTSTの優れた性能を示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:04:37 GMT)
ECoDe: A Sample-Efficient Method for Co-Design of Robotic Agents [11.4] 自律ロボットエージェントを共同設計するには、エージェントのコントローラと物理的設計を同時に最適化する必要がある。
デザインスペースが大きくなると、これは難しくなります。
共設計のサンプル効率を向上させるための多要素探索手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:03:25 GMT)
Loss Landscape Characterization of Neural Networks without Over-Parametrziation [11.4] 本稿では, 過度な過度なパラメータ化を必要とせず, 最新の深層モデルの損失を特徴付ける新しい関数のクラスを提案する。
この仮定の下で、勾配に基づく函数が収束の理論的保証を持つことを証明する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:05:43 GMT)
Query Provenance Analysis: Efficient and Robust Defense against Query-based Black-box Attacks [11.3] 我々は、より堅牢で効率的なステートフルディフェンスモデル(SDM)のための新しいアプローチ、QPA(Query Provenance Analysis)を提案する。
QPAは、クエリ間の履歴関係をシーケンスの特徴としてカプセル化し、良性クエリシーケンスと逆性クエリシーケンスの基本的な違いをキャプチャする。
我々は,6つのクエリベースのブラックボックスアタックアルゴリズムを用いて,広く使用されている4つのデータセットに対して,2つのベースラインであるBlackLightとPIHAと比較した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:08:34 GMT)
FiRST: Finetuning Router-Selective Transformers for Input-Adaptive Latency Reduction [11.1] FIRSTは、層固有のルータを使用して、各入力シーケンスに適応的にトランスフォーマー層のサブセットを選択することで、推論レイテンシを低減するアルゴリズムである。
私たちのアプローチでは、入力適応性は重要であり、タスクによって異なるタスク固有の中間層が隠れた表現を進化させる上で重要な役割を担っています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:45:35 GMT)
Machine Learning Approach to Brain Tumor Detection and Classification [11.1] 脳MRI画像を用いて脳腫瘍を検出し分類するために,様々な統計的および機械学習モデルを適用した。
以上の結果から,CNNは他のモデルよりも優れており,最高の性能を実現していることがわかった。
本研究では、機械学習アプローチが脳腫瘍の検出と分類に適していることを示し、現実の医療応用を促進する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:52:32 GMT)
Multi-trait User Simulation with Adaptive Decoding for Conversational Task Assistants [11.1] 本稿では,デコード時に多様なユーザプロファイルを生成する手法であるMulti-Trait Adaptive Decoding (mTAD)を提案する。
Conversational Task Assistantドメインから現実世界の対話を解析することにより、重要な対話特性を識別する。
我々は、会話の多様性を高めるプロファイル認識対話を生成するフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:40:34 GMT)
Parallel Momentum Methods Under Biased Gradient Estimations [11.1] 並列勾配法は、複数のノードに分散したデータを含む大規模機械学習問題の解決において注目されている。
しかし、最も理論的な研究の焦点となっている非バイアス境界の取得は、多くの機械学習応用において困難である。
本稿では,メタラーニングにおける推定値の偏りや,勾配の圧縮や切り抜きといった特殊勾配の影響について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:39:02 GMT)
AdaMSS: Adaptive Multi-Modality Segmentation-to-Survival Learning for Survival Outcome Prediction from PET/CT Images [11.0] 深層学習に基づくディープサバイバルモデルは、医療画像からエンド・ツー・エンドのサバイバル予測を行うために広く採用されている。
近年のディープサバイバルモデルでは, 生存予測と共同で腫瘍セグメンテーションを行い, 有望な性能を達成している。
既存のディープサバイバルモデルは、マルチモダリティイメージを効果的に活用することはできない。
本稿では,融合戦略の適応最適化を実現する多モード情報を融合するためのデータ駆動型戦略を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:10:44 GMT)
Know your limits! Optimize the robot's behavior through self-awareness [11.0] 最近の人間ロボット模倣アルゴリズムは、高精度な人間の動きを追従することに焦点を当てている。
本稿では,ロボットが参照を模倣する際の動作を予測できるディープラーニングモデルを提案する。
我々のSAW(Self-AWare Model)は、転倒確率、基準運動への固執、滑らかさといった様々な基準に基づいて、潜在的なロボットの挙動をランク付けする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:36:56 GMT)
Self-Supervised Learning of Disentangled Representations for Multivariate Time-Series [11.0] TimeDRLは多変量時系列表現学習のためのフレームワークである。
TimeDRLの特徴は, []トークン戦略を用いたタイムスタンプレベルおよびインスタンスレベルの埋め込み, (ii)表現学習のためのタイムスタンプ予測およびインスタンスコントラストタスク, (iii)帰納的バイアスを取り除くための拡張手法の回避である。
予測と分類データセットの実験では、TimeDRLは既存の手法よりも優れており、ラベル付きデータに制限のある半教師付き設定でさらなる検証が行われている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:24:44 GMT)
Mechanistic Unlearning: Robust Knowledge Unlearning and Editing via Mechanistic Localization [10.9] 大規模言語モデルにおける知識編集と未学習の方法は、性能を損なうことなく、望ましくない知識の編集や削除を試みている。
異なる手法でローカライズされたトレーニングコンポーネントでは、学習の非学習と編集の堅牢性に大きな違いがある。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:35:02 GMT)
Interpreting token compositionality in LLMs: A robustness analysis [10.8] Constituent-Aware Pooling (CAP)は、大規模言語モデルが言語構造をどのように処理するかを分析するために設計された方法論である。
CAPは様々なモデルレベルで構成型プールを通してモデル活性化に介入する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:10:50 GMT)
Weak-to-Strong Generalization beyond Accuracy: a Pilot Study in Safety, Toxicity, and Legal Reasoning [10.8] 従来のアライメント手法は、微調整モデルへの人間のフィードバックに依存している。
人間の理解を超越したアウトプットを持つ超人的モデルには、大きな課題がある。
近年の研究では、より強力なモデルから知識を引き出すために弱いスーパーバイザーを使用している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:40:32 GMT)
Reclaiming the Source of Programmatic Policies: Programmatic versus Latent Spaces [10.7] プログラム空間は、潜在空間で観測されたような行動損失の値を示す。
プログラム空間で探索するアルゴリズムは、LEAPSやHPRLよりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:10:04 GMT)
Meta-Chunking: Learning Efficient Text Segmentation via Logical Perception [10.6] 本稿では,文と段落の粒度を表すメタチャンキングの概念を紹介する。
本稿では,メタチャンキングと動的マージを組み合わせることで,粒度の細かいテキストチャンキングと粗いテキストチャンキングのバランスをとる戦略を提案する。
11のデータセットで実施された実験により、Meta-Chunkingはシングルホップおよびマルチホップ質問応答のパフォーマンスをより効率的に改善できることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:59:32 GMT)
Disentangling Singlish Discourse Particles with Task-Driven Representation [10.6] シングリッシュ(英語: Singlish、正式にはコロキール・シンガポール英語)は、南東アジアのシンガポールを起源とするクレオール語である。
シングリッシュを理解するための基本的な課題は、まずその言論粒子の実用的函数を理解することである。
この研究は、Singlishの談話粒子をタスク駆動表現学習で解き放つための予備的な取り組みを提供する。
解離後、これらの談話粒子をクラスタリングし、実効性を識別し、Singlish-to- English 機械翻訳を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:09:14 GMT)
Nearly Tight Black-Box Auditing of Differentially Private Machine Learning [10.3] 本稿では,ブラックボックス脅威モデルにおけるDP-SGDアルゴリズムの監査手順を提案する。
DP-SGDのプライバシ分析は、初期モデルパラメータの選択に非依存であるからである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:13:01 GMT)
Examining Long-Context Large Language Models for Environmental Review Document Comprehension [10.3] 長いコンテキストと検索強化世代(RAG)は、最近人気が高まった2つの方法である。
本研究では,ニッチ領域における質問応答(QA)タスクを利用して,これらの手法の利点を検討する。
5つの長文LLMの性能を評価するため, NEPAQuAD1.0ベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:33:58 GMT)
MSc-SQL: Multi-Sample Critiquing Small Language Models For Text-To-SQL Translation [10.2] テキスト・ツー・ジェネレーションは、非専門家が自然言語でデータベースと対話することを可能にする。
GPT-4のような大規模クローズドソースモデルの最近の進歩は、アクセシビリティ、プライバシ、レイテンシの課題を提示している。
我々は、小型で効率的でオープンソースのテキスト・ツー・ジェネレーション・モデルの開発に注力する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:03:24 GMT)
Energy and Carbon Considerations of Fine-Tuning BERT [10.2] 本研究では,タスク,データセット,ハードウェアインフラストラクチャ,計測モダリティの微調整の計算コストについて検討する。
この結果から, 微調整エネルギーと炭素コストを事前学習と推定の観点から考察した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:22:54 GMT)
How much do contextualized representations encode long-range context? [10.2] 我々は、数千のトークンにまたがる長距離コンテキストを強調し、ニューラルネットワークの自己回帰言語モデルにおける文脈表現を分析する。
提案手法では,表現幾何学の観点から長距離パターンの文脈化の度合いを捉えるために,摂動セットアップと計量エンファンソトロピー・キャリブレーション・コサイン類似度を用いている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:49:54 GMT)
Efficient Optimization Algorithms for Linear Adversarial Training [9.9] 逆行訓練は摂動に対して堅牢なモデルを学ぶのに使える。
本稿では,線形モデルの対数学習のための最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:41:08 GMT)
PKU-SafeRLHF: Towards Multi-Level Safety Alignment for LLMs with Human Preference [9.9] PKU-SafeRLHFデータセットは、大規模言語モデル(LLM)における安全性アライメントの研究を促進するために設計された。
全体として、44.6kの精巧なプロンプトと265kの質問応答ペアに、安全メタラベルを19の有害カテゴリーと3つの重度レベルを付与する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:33:35 GMT)
Optimal Transport for Probabilistic Circuits [9.6] 我々は、関連する最適輸送問題の結合度を確率回路に制限するワッサーシュタイン型距離を考える。
我々は,線形プログラミング問題に対する解から,PC間の最適輸送計画を取得することができることを示す。
次に、PCとデータセット間の経験的ワッサースタイン距離を考察し、PCパラメータを推定し、効率的な反復アルゴリズムによりこの距離を最小化できることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:42:16 GMT)
A Unified Framework for Forward and Inverse Problems in Subsurface Imaging using Latent Space Translations [9.6] 本稿では,GFI(Generalized Forward-Inverse)フレームワークと呼ばれる,この分野における先行研究を特徴付ける統一フレームワークを提案する。
GFIは、GFIの特定のインスタンス化とみなすことができる地下画像の深層学習における従来の成果を包含していることを示す。
また,GFI のフレームワークとして,潜在 U-Net と非可逆 X-Net の2つの新しいモデルアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:41:49 GMT)
Counterfactual Effect Decomposition in Multi-Agent Sequential Decision Making [9.5] 本稿では,各エージェントに寄与し,各エージェントに寄与し,各要因に寄与するスコアを変動させることにより,その効果を分解する新たな因果的説明式を提案する。
エージェントの作用の総合的反事実効果は, エージェントの作用を伝播する効果を計測する要素と, 状態遷移を伝播する効果に関連する要素の2つに分解できることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:20:35 GMT)
Reversal of Thought: Enhancing Large Language Models with Preference-Guided Reverse Reasoning Warm-up [9.4] 大規模言語モデル(LLM)は、推論タスクにおいて顕著な性能を示すが、数学的および複雑な論理的推論において制限に直面している。
LLMの論理的推論能力の向上を目的とした新しいフレームワークであるReversal of Thought (RoT)を提案する。
RoT は Preference-Guided Reverse Reasoning warm-up 戦略を利用している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:44:28 GMT)
Codellm-Devkit: A Framework for Contextualizing Code LLMs with Program Analysis Insights [9.4] codellm-devkit (以下, CLDK') は,プログラム解析のプロセスを大幅に単純化したオープンソースライブラリである。
CLDKは開発者に対して直感的でユーザフレンドリなインターフェースを提供しています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:05:59 GMT)
Expected Sliced Transport Plans [9.3] 本研究では, 1次元の最適輸送計画を, もともとの空間に戻す「揚力」操作を提案する。
本研究では、EST計画を用いて、ある点から別の点へ移動する際のユークリッドの個々のコストの和を重み付けし、入力された離散確率測度間の有効距離を求めることを証明する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:44:36 GMT)
How much does AI impact development speed? An enterprise-based randomized controlled trial [9.3] 複雑なエンタープライズレベルのタスクに開発者が費やす時間に対する3つのAI機能の影響を見積もる。
また、コード関連のアクティビティに1日あたり何時間も費やす開発者は、AIがより速くなるという興味深い効果も見出しました。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:31:14 GMT)
Nonconvex Stochastic Bregman Proximal Gradient Method with Application to Deep Learning [9.2] 非合成対象函数のロバスト性を最小化する二次法は、典型的には微分可能部分のリプシッツ滑らか性に依存する。
本稿では適応性のみを考慮したBregman(SBPG)手法のファミリーを提案する。
MSBPGは運動量に基づく変種であり、ミニバッチサイズ要求を緩和することで収束感度を高める。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:44:04 GMT)
Gaussian Primitives for Deformable Image Registration [9.2] 脳MRI、肺CT、心臓MRIのデータセットの実験結果から、GaussianDIRは既存のDIR法よりも精度と効率が優れていることが示されている。
トレーニングなしのアプローチとして、反復的手法は本質的に遅く、一般化不足の限界を超越しているというステレオタイプに挑戦する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:48:21 GMT)
Radon Implicit Field Transform (RIFT): Learning Scenes from Radar Signals [9.2] Inlicit Neural Representation (INR)は、最小限のデータを持つコンパクトで連続的な表現を提供し、目に見えない視点に補間する。
本稿では、レーダフォワードモデル(Generalized Radon Transform, GRT)と、レーダ信号から学習したINRに基づくシーン表現を組み合わせたRadeon Implicit Field Transform (RIFT)を提案する。
RIFTは3倍の再構築を実現し、見当たらない視点に一般化すると10%改善する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:59:37 GMT)
Generative Models: What Do They Know? Do They Know Things? Let's Find Out! [9.2] 小型のローランド適応器 (LoRA) は, 固有画像深度, 正規度, アルベド, シェーディングアクロスの異なる発電機を復元可能であることを示す。
また,生成モデルの品質と,制御実験により得られた内生学の精度との間には正の相関関係が認められた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:08:57 GMT)
Bad Students Make Great Teachers: Active Learning Accelerates Large-Scale Visual Understanding [9.1] パワーロースケーリングは、均一サンプリングによる大規模トレーニングが違法に遅いことを示している。
アクティブな学習手法は、最も関係のある事例に基づいて学習を優先順位付けすることで、データの効率を向上させることを目的としている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:43:27 GMT)
Unsupervised End-to-End Task-Oriented Dialogue with LLMs: The Power of the Noisy Channel [9.1] タスク指向の対話システムは一般的に、APIと対話するためにターンレベルのアノテーションを必要とする。
ラベルなしデータとスキーマ定義は、完全に教師なしの作業タスク指向対話システムを構築するのに十分である。
本稿では,ターンレベルのアノテーションを潜在変数として推論する予測最大化(EM)を用いた革新的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:01:59 GMT)
Characterizing Behavioral Differences and Adaptations of Automated Vehicles and Human Drivers at Unsignalized Intersections: Insights from Waymo and Lyft Open Datasets [9.1] 自動運転車(AV)の交通システムへの統合は、道路の安全性と効率を高める前例のない機会である。
本研究では,無人交差点におけるAVと人間駆動車(HV)の行動差と適応性を調べることにより,ギャップを埋めることを目的とする。
この研究は、系統的な手法を用いて、重要な安全性と効率の指標を計算することによって、衝突の合併と交差を識別し分析する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:19:32 GMT)
Mixed-Precision Federated Learning via Multi-Precision Over-The-Air Aggregation [9.1] 複数のビット精度を持つクライアントの混合精度OTA-FLフレームワークを提案する。
32ビットと16ビットの同種標準精度と比較して、4ビット超低精度クライアントの性能は10%以上である。
これは、異種エッジコンピューティング環境における混合精度OTA-FLアプローチの大きな可能性を示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:14:36 GMT)
On the sample complexity of purity and inner product estimation [8.9] 本研究では,タスクの量子純度推定と内部積推定の複雑さについて検討する。
純度推定では、未知の量子状態$rho$の$tr(rho2)$を加算誤差$epsilon$に見積もる。
量子内積推定では、アリスとボブは$tr(rhosigma)$を加算誤差$epsilon$未知の量子状態$rho$と$sigma$のコピーとして推定する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:17:21 GMT)
Proposal of quantum repeater architecture based on Rydberg atom quantum processors [8.9] 大規模量子ネットワークは、リモート量子ノード間の高忠実な量子絡み合い状態を生成する必要がある。
本稿では、Rydberg原子量子プロセッサと光学キャビティを統合し、これらの課題を克服する新しい量子リピータアーキテクチャを提案する。
実測的な実験パラメータを取り入れた数値シミュレーションは、局所領域ネットワーク内の2ノード間の1.1,kHzの速度で99%の忠実度を持つベル状態の生成を実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:02:36 GMT)
Semantics-Adaptive Activation Intervention for LLMs via Dynamic Steering Vectors [8.8] 大規模言語モデル(LLM)の行動を修正するための効果的かつ経済的手法として活性化介入が出現した。
本稿では,モデルアクティベーションを推論時に介入するための動的ステアリングベクトルを構成する新しい手法であるSemantics-Adaptive Dynamic Intervention (SADI)を提案する。
実験結果から,SADIが確立したベースラインをかなりのマージンで上回り,トレーニングなしでのタスク性能が向上した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:58:49 GMT)
Covert Multicast in UAV-Enabled Wireless Communication Systems With One-hop and Two-hop Strategies [8.7] 無人航空機(UAV)による無線通信システムにおける隠蔽マルチキャストの時間について検討する。
本稿では,1つの(OH)パーティクルスワム(PSO)に基づくアルゴリズムと,送信方式とTH方式の性能モデリングのための網羅的なフレームワークを提案する。
提案したPSOアルゴリズムの効率は、広範囲な数値的な結果によって検証される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:46:30 GMT)
ShapefileGPT: A Multi-Agent Large Language Model Framework for Automated Shapefile Processing [8.6] 大規模言語モデル(LLM)を利用した革新的なフレームワークであるShapefileGPTを提案する。
ShapefileGPTはマルチエージェントアーキテクチャを使用し、プランナーエージェントがタスクの分解と監督を担当し、ワーカーエージェントがタスクを実行する。
評価のために,幾何演算や空間的クエリといったカテゴリのタスクを含む,権威教科書に基づくベンチマークデータセットを開発した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:48:27 GMT)
Local transfer learning Gaussian process modeling, with applications to surrogate modeling of expensive computer simulators [8.5] 科学的進歩における重要なボトルネックは、複雑なシステムのためのコンピュータシミュレーションのコストのかかる性質である。
多くのアプリケーションでは、関連するシステムで利用可能なデータがあることが多い。
重要な疑問は、このような"ソース"システムからの情報を効果的にサロゲートトレーニングのためにどのように転送するかである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:50:57 GMT)
How does Your RL Agent Explore? An Optimal Transport Analysis of Occupancy Measure Trajectories [8.4] 我々は、RLアルゴリズムの学習過程を、トレーニング中に生成されたポリシーのシーケンスとして表現する。
次に、状態-作用占有度尺度の多様体に誘導される政策軌跡について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:48:38 GMT)
From Explainable to Interpretable Deep Learning for Natural Language Processing in Healthcare: How Far from Reality? [8.4] eXplainable and Interpretable Artificial Intelligence (XIAI)は、XAIとIAIを区別するために導入された人工知能である。
分析の結果,注目メカニズムが最も普及しているIAI技術であることが判明した。
主要な課題は、ほとんどのXIAIが"グローバル"なモデリングプロセス、ベストプラクティスの欠如、体系的な評価とベンチマークの欠如を探求していないことである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:14:27 GMT)
Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion [8.4] スコア関数のヤコビアンの固有値のスペクトルを解析し、その不連続性(ギャップ)は異なる部分多様体の存在と次元性を明らかにする。
本研究は, 生成過程における3つの異なる定性相の存在を明らかにした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:10:54 GMT)
Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion [8.4] スコア関数のヤコビアンの固有値のスペクトルを解析し、その不連続性(ギャップ)は異なる部分多様体の存在と次元性を明らかにする。
本研究は, 生成過程における3つの異なる定性相の存在を明らかにした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:10:54 GMT)
Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion [8.4] スコア関数のヤコビアンの固有値のスペクトルを解析し、その不連続性(ギャップ)は異なる部分多様体の存在と次元性を明らかにする。
本研究は, 生成過程における3つの異なる定性相の存在を明らかにした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:10:54 GMT)
Explore, Select, Derive, and Recall: Augmenting LLM with Human-like Memory for Mobile Task Automation [8.2] 本稿では,ヒューマンライクなアプリメモリを備えたモバイルタスク・オートマトンであるMobileGPTを紹介する。
MobileGPTは、モバイルアプリと対話する人間の認知プロセスをエミュレートする。
我々は,オンラインLLMサービス(GPT-3.5およびGPT-4)を用いてMobileGPTを実装し,その性能を18のモバイルアプリで185タスクのデータセット上で評価した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:15:53 GMT)
Unsupervised Point Cloud Completion through Unbalanced Optimal Transport [8.1] 未ペアのポイントクラウド補完は、未ペアの未完了と完全なポイントクラウドデータから完了マップを学ぶ方法を探る。
非平衡の最適輸送マップを用いた不対向点雲補修のための新しい手法を提案する。
我々のモデルは特に、不完全なクラウドデータセットと完全なクラウドデータセットのカテゴリの割合が異なるクラス不均衡のシナリオで有効である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:06:49 GMT)
SplitLLM: Collaborative Inference of LLMs for Model Placement and Throughput Optimization [8.1] 大きな言語モデル(LLM)は、人間のようなテキストを理解し、生成する能力のために、私たちの日常生活において重要な役割を担います。
本稿では,サーバとクライアント間の協調推論アーキテクチャを設計し,スループットの限界を緩和する。
実験では、サーバのワークロードを約1/3削減できるように、効率よくワークロードを分散できることを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:31:37 GMT)
SplitLLM: Collaborative Inference of LLMs for Model Placement and Throughput Optimization [8.1] 大きな言語モデル(LLM)は、人間のようなテキストを理解し、生成する能力のために、私たちの日常生活において重要な役割を担います。
本稿では,サーバとクライアント間の協調推論アーキテクチャを設計し,スループットの限界を緩和する。
実験では、サーバのワークロードを約1/3削減できるように、効率よくワークロードを分散できることを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:31:37 GMT)
Insights from the Inverse: Reconstructing LLM Training Goals Through Inverse RL [8.0] Reinforcement Learning from Human Feedbackで訓練された大規模言語モデル(LLM)は、目覚ましい能力を示しているが、その基盤となる報酬関数や意思決定プロセスは不透明である。
本稿では, 逆強化学習(IRL)を用いて暗黙の報酬関数を復元することにより, LLMを解釈する新しい手法を提案する。
我々は,ヒトの嗜好を予測する上で,最大80.40%の精度を達成できる報酬モデルを抽出し,様々な大きさの毒性アライメントLDMについて実験を行った。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:14:25 GMT)
Open Ko-LLM Leaderboard2: Bridging Foundational and Practical Evaluation for Korean LLMs [7.9] 我々は、以前のOpen Ko-LLM Leaderboardの改良版であるOpen Ko-LLM Leaderboard2を提案する。
オリジナルのベンチマークは、現実の能力とより密に整合した新しいタスクに完全に置き換えられている。
韓国語の特徴をよりよく反映するために、4つの新しい韓国語ベンチマークが導入されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:49:22 GMT)
When to Trust Your Data: Enhancing Dyna-Style Model-Based Reinforcement Learning With Data Filter [7.9] ダイナスタイルのアルゴリズムは、推定環境モデルからのシミュレーションデータを用いてモデルフリートレーニングを加速することにより、2つのアプローチを組み合わせる。
これまでの作業では、モデルアンサンブルを使用したり、実際の環境から収集されたデータで推定されたモデルを事前訓練することで、この問題に対処している。
本研究では,実環境において収集したデータから大きく分岐する推定モデルからシミュレーションデータを除去するアウト・オブ・ディストリビューションデータフィルタを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:49:03 GMT)
LFOSum: Summarizing Long-form Opinions with Large Language Models [7.8] 本稿では,(1)長文ユーザレビューの新しいデータセット,(1)1000以上のレビューを含むエンティティ,(2)長期入力にスケールする2つのトレーニングフリーLCMベースの要約アプローチ,(3)自動評価指標を紹介する。
ユーザレビューのデータセットは、ドメインの専門家による詳細な、偏見のない批判的な要約と組み合わせられ、評価の基準として役立ちます。
我々の評価では、LLMは長文要約における感情と形式順守のバランスをとる上で依然として課題に直面しているが、オープンソースモデルでは、関連する情報が集中的に検索される場合のギャップを狭めることができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:52:39 GMT)
Mixture of Experts Made Personalized: Federated Prompt Learning for Vision-Language Models [7.8] 我々は,Mixture of Experts (MoE) のレンズを通して,迅速な学習プロセスをパーソナライズする新しいフレームワークを提案する。
pFedMoAPは、クライアント上のローカル画像データとの整合性を改善するために、拡張されたテキスト機能を生成することを学習する、ローカルアテンションベースのゲーティングネットワークを実装している。
その結果、pFedMoAPは最先端の代替品よりも一貫して優れており、CLIPの迅速な学習をパーソナライズする効果が強調されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:30:53 GMT)
Mixture of Experts Made Personalized: Federated Prompt Learning for Vision-Language Models [7.8] 我々は,Mixture of Experts (MoE) のレンズを通して,迅速な学習プロセスをパーソナライズする新しいフレームワークを提案する。
pFedMoAPは、クライアント上のローカル画像データとの整合性を改善するために、拡張されたテキスト機能を生成することを学習する、ローカルアテンションベースのゲーティングネットワークを実装している。
その結果、pFedMoAPは最先端の代替品よりも一貫して優れており、CLIPの迅速な学習をパーソナライズする効果が強調されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:30:53 GMT)
MAX: Masked Autoencoder for X-ray Fluorescence in Geological Investigation [7.8] 本稿では,XRFスペクトル(MAX)にマスク付き自己教師付きオートエンコーダを導入し,基礎モデルの事前学習を行う。
入力スペクトルの高い割合(50%)をマスキングすると、非自明で有意義な自己監督タスクが生じる。
その結果、MAXはデータの3分の1しか必要とせず、量子化精度の点で事前学習なしでモデルより優れていることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:52:26 GMT)
Data Augmentation for Continual RL via Adversarial Gradient Episodic Memory [7.8] 連続RLでは、学習者は定常的でないシーケンシャルなタスクと対話し、以前の知識を忘れずに新しいタスクを学習する必要がある。
本稿では,連続RLにおけるデータ拡張の有効性について検討する。
本稿では,乱数振幅スケーリング,ステートスウィッチ,ミックスアップ,逆数拡張,Adv-GEMなどのデータ拡張が,既存の連続RLアルゴリズムを改善することを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:43:08 GMT)
NAR-*ICP: Neural Execution of Classical ICP-based Pointcloud Registration Algorithms [7.5] 本研究ではニューラルネットワークと古典ロボットアルゴリズムの交点をニューラルネットワーク推論フレームワークを用いて検討する。
我々は従来のICPベースのポイントクラウド登録アルゴリズムの中間アルゴリズムステップを学習するグラフニューラルネットワーク(GNN)ベースの学習フレームワークであるNAR-*ICPを提案する。
我々は、実世界から合成まで多様なデータセットにまたがってアプローチを評価し、複雑でノイズの多い入力を扱う際の柔軟性を実証した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:05:57 GMT)
Leveraging Large Vision Language Model For Better Automatic Web GUI Testing [7.5] 本稿では,最初のLVLM駆動のエンドツーエンドWebテスト技術であるVETLを提案する。
LVLMのシーン理解機能により、VETLはローカルコンテキストに焦点を当てた有効な意味のあるテキスト入力を生成することができる。
関連GUI要素の選択は視覚的質問応答問題として定式化され、LVLMは入力ボックスと関連する要素の間の論理的接続をキャプチャする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:37:58 GMT)
Optimization and Application of Cloud-based Deep Learning Architecture for Multi-Source Data Prediction [7.4] 本研究では,早期糖尿病予測のためのクラウドベースのディープラーニングシステムを開発した。
予測に基づく早期介入は、ターゲット人口の37.5%の糖尿病罹患率を減少させる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:03:28 GMT)
SEMSO: A Secure and Efficient Multi-Data Source Blockchain Oracle [7.4] 現在のMDSオラクル方式では、データの信頼性を保証するため、ノードは複数のデータソースから冗長にデータを取得する必要がある。
本稿では,データソースの多様性と信頼性を低コストで保証する,新たなオフチェーンデータアグリゲーションプロトコルTBLSを提案する。
セキュリティ分析は提案手法の信頼性を検証し、同じ環境条件下ではSEMSOがデータの多様性を考慮し、応答時間を23.5%削減することを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:20:45 GMT)
GraphMaker: Can Diffusion Models Generate Large Attributed Graphs? [7.3] ノード属性を持つ大規模グラフは、様々な現実世界のアプリケーションでますます一般的になっている。
従来のグラフ生成法は、これらの複雑な構造を扱う能力に制限がある。
本稿では,大きな属性グラフを生成するために特別に設計された新しい拡散モデルであるGraphMakerを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:48:31 GMT)
Conditional Outcome Equivalence: A Quantile Alternative to CATE [7.3] 条件量子処理効果(CQTE)は、条件平均処理効果(CATE)を超える治療の効果についての洞察を与えることができる。
CQTEの推定は困難であり、個々の量子の滑らかさに依存することが多い。
条件量子コンパレータ(CQC)の新たな評価法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:04:16 GMT)
Flash Inference: Near Linear Time Inference for Long Convolution Sequence Models and Beyond [7.3] 本稿では,LCSMの正確な推定速度を準線形$O(Llog2L)$ timeに高速化する手法を提案する。
私たちはHyenaのコンセプト実装の証明を提供し、標準推論よりも1.6倍のエンドツーエンドの改善が得られます。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:23:46 GMT)
FTII-Bench: A Comprehensive Multimodal Benchmark for Flow Text with Image Insertion [7.2] Flow Text with Image Insertion Taskでは、LVLMは画像理解、命令理解、長文解釈において優れた能力を持つ必要がある。
318の高品質な中国語画像テキストニュース記事と307の高品質な英語画像テキストニュース記事を含む、画像挿入ベンチマーク付きフローテキスト(FTII-Bench)を導入し、10の異なるニュースドメインをカバーする。
9つのオープンソースと2つのクローズドソースのLVLMと2つのCLIPベースのモデルを評価した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:38:31 GMT)
Controlled Automatic Task-Specific Synthetic Data Generation for Hallucination Detection [7.2] 幻覚検出のための非自明なタスク固有合成データセットを自動生成する新しい手法を提案する。
提案手法は,幻覚パターンのガイダンスと生成中の言語スタイルのアライメントを用いて,2段階の世代選択パイプラインを特徴とする。
我々の幻覚検出装置は、合成データセットで訓練され、ICL(In-context-learning)ベースの検出器よりも32%大きなマージンで優れていた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:31:59 GMT)
Using Protected Attributes to Consider Fairness in Multi-Agent Systems [7.1] マルチエージェントシステム(MAS)の公正性は、システムのルール、エージェントの振る舞い、それらの特性など、さまざまな要因に依存する。
機械学習に基づく意思決定におけるバイアスに対処するアルゴリズムフェアネスの研究から着想を得た。
我々は、アルゴリズムの公正度文献から、自己関心のあるエージェントが環境内で相互作用するマルチエージェント設定まで、公平度メトリクスを適応させる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:12:01 GMT)
One-Shot Imitation under Mismatched Execution [7.1] プロンプトとしての人間のデモは、ロボットに長距離操作のタスクをプログラムするための強力な方法だ。
これらのデモをロボット実行可能なアクションに変換することは、運動スタイルや身体能力のミスマッチの実行による重大な課題を呈する。
本稿では,人間とロボットのタスク実行を最適な輸送コストで自動調整する新しいフレームワークRHyMEを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:19:05 GMT)
One-Shot Imitation under Mismatched Execution [7.1] プロンプトとしての人間のデモは、ロボットに長距離操作のタスクをプログラムするための強力な方法だ。
これらのデモをロボット実行可能なアクションに変換することは、運動スタイルや身体能力のミスマッチの実行による重大な課題を呈する。
RHyMEは、最適な輸送コストを用いてロボットとデモレータのタスク実行を自動的に調整するフレームワークである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:19:05 GMT)
Exploiting LLMs' Reasoning Capability to Infer Implicit Concepts in Legal Information Retrieval [7.0] 本研究は,大規模言語モデル(LLM)の論理的推論能力を活用し,関連する法的用語を特定することに焦点を当てる。
提案する検索システムは,検索精度を向上させるために,用語ベースの拡張とクエリ再構成の付加情報を統合する。
COLIEE 2022とCOLIEE 2023データセットの実験は、LLMからの余分な知識が語彙的および意味的ランキングモデルの検索結果の改善に役立つことを示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:34:14 GMT)
Reinforcement Learning with Euclidean Data Augmentation for State-Based Continuous Control [6.9] この研究は、RLエージェントが生のキネマティックとタスクの機能を直接観察できる状態ベースの制御に焦点を当てている。
我々は、回転のような変換の下でユークリッド対称性に基づいて、これらの特徴に適用される別のデータ拡張を考える。
この新たなユークリッドデータ拡張戦略は、広範囲な連続制御タスクにおいて、RLのデータ効率と性能の両方を大幅に改善することを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:25:30 GMT)
HerO at AVeriTeC: The Herd of Open Large Language Models for Verifying Real-World Claims [6.8] 自動ファクトチェックの各ステップに,公開可能な大規模言語モデル(LLM)のみを利用するシステムを導入する。
証拠検索では、仮説的事実チェック文書を生成することにより、クエリを強化するために言語モデルが使用される。
HerOはAVeriTeCスコア0.57でリーダーボードで2位を獲得し、現実世界のクレームを検証するためのオープンLLMの可能性を示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:49:17 GMT)
BOXR: Body and head motion Optimization framework for eXtended Reality [6.8] 身体の動きによる遅延をキャプチャするC2Dレイテンシメトリックを導入する。
BoxRは、XRシステム内での身体と頭部の動作遅延を協調最適化するように設計されたフレームワークである。
BoxRは、3つのハードウェアプラットフォームで4つのXRアプリケーションにまたがる11のEuRoC MAVデータセットにおいて、最先端のソリューションを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:01:39 GMT)
Stylistic Multi-Task Analysis of Ukiyo-e Woodblock Prints [6.7] 本稿では, 文体分析の範囲を広げることを目的とした, この近代日本美術様式について考察する。
私たちのデータセットは17世紀から今日のメタデータに対応する175.000ドル以上の印刷物で構成されています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:55:09 GMT)
Context-Infused Visual Grounding for Art [6.7] 本稿では,CIGAr(Context-Infused GroundingDINO for Art)について述べる。
さらに,手動で注釈付きフレーズグラウンドアノテーションを付加した新しいデータセットUkiyo-eVGを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:41:19 GMT)
Advancing Web Browser Forensics: Critical Evaluation of Emerging Tools and Techniques [6.7] Web法医学では、ブラウザ履歴、検索キーワード、ダウンロードなどのブラウザアーティファクトを収集、分析する。
本稿では,人気ブラウザの総合的な評価を行うために,4つのブラウジングシナリオを定義した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:24:16 GMT)
Towards Robust Blockchain Price Oracle: A Study on Human-Centric Node Selection Strategy and Incentive Mechanism [6.5] Oracleは、支払いや決済などの金融アプリケーションのための信頼できるリアルタイム価格情報と、ブロックチェーン上のアセットバリュエーションを取得することができる。
本稿では,タスクに参加するための評価の高いノードを匿名で選択する匿名ノード選択方式を提案する。
有理マンの仮説の下では、スタックルバーグゲームに基づくインセンティブ機構が提案される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:44:26 GMT)
DH-VTON: Deep Text-Driven Virtual Try-On via Hybrid Attention Learning [6.5] DH-VTONは、特別なハイブリッドアテンション学習戦略と深層着衣意味保存モジュールを備えた、深層テキスト駆動型仮想試行モデルである。
衣服の深い意味を抽出するために,我々はまずInternViT-6Bを細粒度特徴学習機として導入する。
カスタマイズドレッシング能力を高めるため,Garment-Feature ControlNet Plus (略してGFC+)モジュールを導入する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:27:10 GMT)
Energy-Efficient Computation with DVFS using Deep Reinforcement Learning for Multi-Task Systems in Edge Computing [6.4] 本研究は、省エネのための強化学習に基づくDVFSを用いたマルチタスク、マルチデッドラインシナリオを備えた一般化システムについて研究する。
この方法は、Linuxカーネル内の時系列情報を強化学習に容易に利用できる情報に符号化する。
テスト結果から,Linuxの組込み知事と比較して3%~10%の省電力化が可能であった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:28:32 GMT)
Energy-Efficient Computation with DVFS using Deep Reinforcement Learning for Multi-Task Systems in Edge Computing [6.4] 本研究は、省エネのための強化学習に基づくDVFSを用いたマルチタスク、マルチデッドラインシナリオを備えた一般化システムについて研究する。
この方法は、Linuxカーネル内の時系列情報を強化学習に容易に利用できる情報に符号化する。
テスト結果から,Linuxの組込み知事と比較して3%~10%の省電力化が可能であった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:28:32 GMT)
Prompting Explicit and Implicit Knowledge for Multi-hop Question Answering Based on Human Reading Process [6.4] 心理学的研究は、通過中の明示的な情報と読書中の人間の事前知識の間に重要なつながりがあることを示唆している。
本稿では,明示的知識と暗黙的知識を結び付けるためにプロンプトを利用するPmpting Explicit and Implicit Knowledge (PEI)フレームワークを提案する。
我々のモデルは、暗黙の知識の形式であるプロンプトによる型固有の推論を取り入れている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:12:47 GMT)
Incorporating Long-term Data in Training Short-term Traffic Prediction Model [6.4] タクシーと自転車の使用率を含む2つのデータセットは、ニューヨークで8年以上にわたって使われてきた。
最新の12,24,48,96ヶ月でトレーニングされたモデルの精度を評価する実験を行った。
その結果,96ヶ月のトレーニングセットは,過去の交通パターンと現在との相違により,精度が低下することが判明した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:22:01 GMT)
Entanglement-enabled advantage for learning a bosonic random displacement channel [6.4] 量子絡み合いは、ボソニック連続変数系の学習特性において指数関数的に有利であることを示す。
簡単な絡み合わせ支援スキームは、十分な量のスクイーズを条件に、$n$に依存しないサンプル数だけを必要とする。
本研究は, 連続変数システム学習における絡み合いの役割を照らし, 証明可能な絡み合いを生かした実験的な実証を目指している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:07:24 GMT)
Promoting the Culture of Qinhuai River Lantern Shadow Puppetry with a Digital Archive and Immersive Experience [6.3] 本研究は,漢詩や絵画の場面を再現するデジタル技術を活用した,清海川ランタン祭の影人形のデジタルアーカイブを作成する。
その結果、使いやすさと文化体験の向上は、観客の魅力と理解を向上させる一方で、感情体験の強化は観客の参加意欲を高めることが示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:35:21 GMT)
Free-text Rationale Generation under Readability Level Control [6.3] 我々は,可読性レベル制御の影響下で,大規模言語モデル (LLM) が合理的生成をいかに行うかを検討する。
要求された可読性は、しばしば測定されたテキストの複雑さと一致しないが、説明はそのような命令に適応できる。
我々のアノテータは、すべての可読性レベルにおける理性に対する概ね満足のいく印象を確認します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:52:12 GMT)
Finding Logic Bugs in Spatial Database Engines via Affine Equivalent Inputs [6.3] 空間データベース管理システム(SDBMS)は、空間データを保存、操作、検索することを目的としている。
SDBMSのロジックバグの存在は、誤った結果をもたらす可能性がある。
SDBMSのロジックバグの検出は、誤った結果を特定するための基礎的な真実が欠如しているため、難しい。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:18:16 GMT)
ToBlend: Token-Level Blending With an Ensemble of LLMs to Attack AI-Generated Text Detection [6.3] ToBlendはトークンレベルのアンサンブルテキスト生成手法であり、現在のAIコンテンツ検出アプローチの堅牢性に挑戦する。
ToBlendは、主要なAIコンテンツ検出手法の性能を著しく低下させる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:40:51 GMT)
Sample what you cant compress [6.2] 拡散に基づく損失の下で、連続エンコーダとデコーダの学習方法を示す。
このアプローチは、GANベースのオートエンコーダと比較して、再構築品質が向上する。
また, 得られた表現は, 最先端のGANに基づく損失から得られた表現と比較して, 潜時拡散モデルによりモデル化し易いことを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:08:57 GMT)
Sample what you cant compress [6.2] 拡散に基づく損失の下で、連続エンコーダとデコーダの学習方法を示す。
このアプローチは、GANベースのオートエンコーダと比較して、再構築品質が向上する。
また, 得られた表現は, 最先端のGANに基づく損失から得られた表現と比較して, 潜時拡散モデルによりモデル化し易いことを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:08:57 GMT)
Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination [6.1] 本稿は,Twitter/X(米国)とSina Weibo(中国本土)を比較し,感情表現の文化的差異を考察する。
NRC-VADレキシコンを用いて、両プラットフォームにまたがる感情表現の異なるパターンを同定した。
われわれは、米国ユーザーが中国ユーザーよりも感情的な強さを示すなど、異文化間の大きな差異を明らかにした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:35:29 GMT)
Quantum Speedup for the Quadratic Assignment Problem [6.1] そこで我々は,Dicke状態演算子を用いたGrover Adaptive Search (GAS)を用いて,二次代入問題の探索空間を小さくすることができることを示す。
また、GASの位相ゲートをZ軸の回転ゲートに置き換えることで、ペナルティを伴わずに量子回路を簡素化できることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:00:37 GMT)
MMFusion: Combining Image Forensic Filters for Visual Manipulation Detection and Localization [6.1] 最近の画像操作のローカライゼーションと検出技術は、一般的にノイズ感受性フィルタによって生成された法医学的アーティファクトとトレースを利用する。
本稿では,このような手法でよく用いられる異なるフィルタが,異なる種類の操作を提示し,補完的な法医学的トレースを提供するのに優れていることを示す。
画像操作の局所化と検出を行うために,このようなフィルタの出力を組み合わせて生成した成果物の相補的な性質を活用する方法について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:08:45 GMT)
DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMs [6.0] 大規模言語モデル(LLM)は様々なタスクに優れるが、ハードウェアの制約によりデプロイメントの課題に直面している。
重み付き重み付き量子化(DAQ)を提案する。
LLaMAとLLaMA-2の実験では、DAQが最良基準法より一貫して優れていることが示されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:13:51 GMT)
Trajectory Manifold Optimization for Fast and Adaptive Kinodynamic Motion Planning [6.0] システムが動的に変化する環境に適応するためには、高速なキノダイナミックな運動計画が不可欠である。
本稿では,新しいニューラルネットワークモデル,その微分可能な運動マニフォールドプリミティブ(DMMP)と実践的なトレーニング戦略を提案する。
任意の目標位置への動的投球を行う7-DoFロボットアームを用いた実験により,提案手法が計画速度,タスク成功,制約満足度といった既存手法を超えることを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:29:33 GMT)
Beyond Demographics: Aligning Role-playing LLM-based Agents Using Human Belief Networks [5.8] 人間の調査から得られたデータを用いて,9つの非重複要因に64のトピックをロードする信念ネットワークを推定した。
次に, LLMをベースとしたエージェントを1つのトピックに対する意見付きでシードし, 残りのテストトピックと対応する人的データとのアライメントについて, その表現された意見のアライメントを評価した。
人口統計情報のみに基づくロールプレイングはLLMと人的意見の一致はしなかったが、エージェントを単一の信念でシードすることで、ネットワーク外のトピックではなく、信念ネットワークに関連するトピックのアライメントを大幅に改善した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:36:09 GMT)
A Flexible Job Shop Scheduling Problem Involving Reconfigurable Machine Tools Under Industry 5.0 [5.8] フレキシブルなジョブショップスケジューリング問題(FJSSP)は、現代の製造環境の複雑さを正確に反映している。
本稿では、設定依存のセットアップ時間を持つ再構成可能なマシンツールを含むFJSSPについて検討する。
混合整数プログラミング(MIP)モデルは、これらの目的を同時に最適化するために開発された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:40:06 GMT)
VividMed: Vision Language Model with Versatile Visual Grounding for Medicine [5.7] 医用視覚基盤を用いた視覚言語モデルVividMedを提案する。
我々のモデルはセマンティックセグメンテーションマスクとインスタンスレベルのバウンディングボックスの両方を生成することをサポートしている。
VividMedは、VQA(Visual Question Answering)やレポート生成など、他の一般的な下流タスクにも長けている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:54:11 GMT)
Knowledge Graph Embeddings: A Comprehensive Survey on Capturing Relation Properties [5.7] 知識グラフ埋め込み(KGE)技術は、記号的知識グラフを数値表現に変換する上で重要な役割を果たしている。
本稿では、一対一、一対多、多対一、多対多といった関係に固有の複素写像特性について述べる。
我々は、KGEにマルチモーダル情報を統合すること、規則付き関係パターンモデリングを強化すること、動的KGE設定における関係特性を捉えるモデルを開発することなど、革新的なアイデアを探求する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:54:52 GMT)
Causal Inference with Large Language Model: A Survey [5.7] 因果推論は医学や経済学といった様々な分野において重要な課題となっている。
自然言語処理(NLP)の最近の進歩は、従来の因果推論タスクに有望な機会をもたらした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:20:43 GMT)
A Survey of Out-of-distribution Generalization for Graph Machine Learning from a Causal View [5.7] グラフ機械学習(GML)は、幅広いタスクでうまく適用されている。
GMLは、アウト・オブ・ディストリビューション(OOD)データを一般化する上で大きな課題に直面している。
近年の進歩は、これらの一般化の課題を克服する上で、因果関係によるアプローチの重要な役割を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:23:11 GMT)
A Survey of Out-of-distribution Generalization for Graph Machine Learning from a Causal View [5.7] グラフ機械学習(GML)は、幅広いタスクでうまく適用されている。
GMLは、アウト・オブ・ディストリビューション(OOD)データを一般化する上で大きな課題に直面している。
近年の進歩は、これらの一般化の課題を克服する上で、因果関係によるアプローチの重要な役割を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:23:11 GMT)
Semiclassical study of diagonal and offdiagonal functions in the eigenstate thermalization hypothesis [5.6] いわゆる固有状態熱化仮説(ETH)は、最終的な熱化を理解する方法を提供する。
本稿では,hbarの高次寄与を含む半古典的表現を前者の関数に対して導出する。
そして、エネルギー固有関数間の無視可能な相関を仮定して、後者の関数に対して半古典近似が導出される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:05:00 GMT)
RADS-Checker: Measuring Compliance with Right of Access by the Data Subject in Android Markets [5.6] 一般データ保護規則(RADS)のような最新のデータ保護規則は、個人データにアクセスする権利を確立している。
RADSはユーザーに対して、個人データコントローラから個人情報のコピーを取得する権利を与える。
現在、モバイルアプリケーションでRADSが効果的に実装されているかどうかを体系的に調査する研究は行われていない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:23:26 GMT)
FairGLVQ: Fairness in Partition-Based Classification [5.5] 本研究では,特定の公平性定義に依存しない分割モデルに対して,公平な機械学習を行うための一般的なフレームワークを開発する。
学習ベクトル量子化(LVQ)の公平なバージョンを特定のインスタンス化として導出する。
理論的および実世界のデータに関する文献から得られた他のアルゴリズムと比較し,その実用的妥当性を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:00:25 GMT)
A quantum central path algorithm for linear optimization [5.5] 中心経路の量子力学的シミュレーションにより線形最適化問題を解くための新しい量子アルゴリズムを提案する。
このアプローチは、$m$制約と$n$変数を含む線形最適化問題を$varepsilon$-optimalityに解くアルゴリズムをもたらす。
標準ゲートモデル(すなわち、量子RAMにアクセスせずに)では、我々のアルゴリズムは少なくとも$$mathcalO left( sqrtm + n textsfnnz (A) fracR_1 を用いてLO問題の高精度な解を得ることができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:11:03 GMT)
Proactive Detection and Calibration of Seasonal Advertisements with Multimodal Large Language Models [5.4] 広告ランキングと推薦コミュニティにとって関心のある研究課題を提示する。
本論文は, 大規模産業広告ランキングシステムによって検証され, 動機付けられた, 様々な角度から詳細なガイドラインを提供する。
我々はこの調査で得た決定的な解決策として、季節性を検出するために、マルチモーダルLLMを利用した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:14:05 GMT)
On the Role of Activation Functions in EEG-To-Text Decoder [5.4] 脳波を用いてテキストを生成する最初の試みの本来の性能を改善することを試みる。
モデルアーキテクチャを変更することなく,高次アクティベーション関数の導入によりモデル性能が向上することを示す。
また,学習可能な3次アクティベーション関数は,学習可能な3次アクティベーション関数よりも1-gram評価が優れていることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:50:04 GMT)
Strong Converse Exponent of Quantum Dichotomies [5.4] 本研究では, 量子二コトミーの大規模解離挙動について検討し, 精製された距離に基づいて, 正確な強い逆指数を決定する。
この結果は、4つの非交換量子状態すべてを含む量子R'enyi情報の簡単な最適化によって特徴づけられる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:54:18 GMT)
IntGrad MT: Eliciting LLMs' Machine Translation Capabilities with Sentence Interpolation and Gradual MT [5.3] 大規模言語モデル(LLM)は、追加の並列コーパスを微調整することなく、翻訳において強力な性能を示している。
これまでの研究は、関連するいくつかの例や辞書や文法書などの外部リソースを活用することでこの問題を軽減することに重点を置いてきた。
本稿では,LLM固有の翻訳機能を完全に活用することを目的とした,IntGrad MTという新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:45:28 GMT)
Can We Reverse In-Context Knowledge Edits? [5.3] In-context knowledge editing (IKE) は、パラメータの変更なしに、かつゼロコストで、大規模言語モデル(LLM)出力の効率的な修正を可能にする。
誤った情報や攻撃的な内容の挿入など、不適切な応答を操作するために誤用することができる。
特別に調整された逆転トークンを用いたIKE-editsの逆転タスクについて紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:04:26 GMT)
Supply Chain Network Extraction and Entity Classification Leveraging Large Language Models [5.2] 我々は,大規模言語モデル(LLM)を用いた土木分野向けサプライチェーングラフを開発する。
LLMを微調整してサプライチェーングラフ内のエンティティを分類し、それらの役割と関係に関する詳細な洞察を提供する。
我々の貢献には、土木分野向けのサプライチェーングラフの開発や、サプライチェーンネットワークのエンティティ分類と理解を強化する微調整LCMモデルなどが含まれます。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:24:13 GMT)
End-to-End Heterogeneous Graph Neural Networks for Traffic Assignment [5.2] 我々は、異種グラフニューラルネットワークのパワーを活用して、トラフィック割り当てのための新しいエンドツーエンドサロゲートモデルを提案する。
本モデルでは,アダプティブグラフアテンション機構と,原点-終点ノードペアを接続する補助的な"仮想"リンクを統合する。
提案するヘテロジニアスグラフニューラルネットワークモデルは,収束率や予測精度の観点から,従来のニューラルネットワークモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:19:52 GMT)
Challenges, Methods, Data -- a Survey of Machine Learning in Water Distribution Networks [5.2] この研究は、配水ネットワークにおける主要なタスクを示し、機械学習との関係について論じる。
ドメインの特殊性がどのように課題を提起し、機械学習のアプローチによって活用されるかを分析する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:21:07 GMT)
TMI! Finetuned Models Leak Private Information from their Pretraining Data [5.2] 我々は,敵が細かなモデルにのみアクセス可能な新しいメンバーシップ推論脅威モデルを提案する。
我々は、複数の移動学習環境において、視覚と自然言語の両方のタスクに対して$textbfTMI$を評価した。
$textbfTMI$のオープンソース実装はGitHubにある。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:55:39 GMT)
Coding Speech through Vocal Tract Kinematics [5.1] 調音特徴は声道調音器のキネマティックな形状と音源の特徴の痕跡であり、直感的に解釈可能で制御可能である。
話者埋め込みは音節から効果的に切り離され、アクセントを保ったゼロショット音声変換が可能となる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:40:33 GMT)
Unveiling the Limits of Alignment: Multi-modal Dynamic Local Fusion Network and A Benchmark for Unaligned RGBT Video Object Detection [5.1] 現在のRGB-Thermal Video Object Detection (RGBT VOD) 法は、画像レベルで手動で調整するデータに依存する。
不整合RGBTペアを扱うために設計されたMDLNet(Multi-modal Dynamic Local fusion Network)を提案する。
MDLNet と State-of-the-art (SOTA) モデルとの総合的な評価と比較を行い,MDLNet の有効性を実証した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:06:12 GMT)
Advancing Healthcare: Innovative ML Approaches for Improved Medical Imaging in Data-Constrained Environments [5.1] 本研究では,制約を克服する新たなアプローチとして,CAT-U-Netフレームワークを紹介する。
提案するフレームワークは,部品をサンプリングする余分な結合層を追加し,限られたデータから学習する能力を向上させる。
このフレームワークは98%の再現精度を達成し、Dice係数は0.946に近かった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:16:14 GMT)
SoK: Prompt Hacking of Large Language Models [5.1] 大規模言語モデル(LLM)ベースのアプリケーションの安全性と堅牢性は、人工知能において重要な課題である。
私たちは、ジェイルブレイク、リーク、インジェクションという3つの異なるタイプのプロンプトハッキングについて、包括的で体系的な概要を提供しています。
LLM応答を5つの異なるクラスに分類する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:30:41 GMT)
Learning Representations for Reasoning: Generalizing Across Diverse Structures [5.0] 我々は、知識とクエリ構造をまたいだアルゴリズムを考案し、推論モデルの境界を推し進めることを目指している。
図書館は構造化データを第一級市民として扱い,構造化データのアルゴリズム開発における障壁を取り除く。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:23:37 GMT)
HELM: Hierarchical Encoding for mRNA Language Modeling [5.0] 我々は、mRNA言語モデリング(HELM)のための階層的生成アプローチを紹介する。
HELMはコドンの同義性に基づいて損失関数を調節し、モデルの学習過程とmRNA配列の生物学的現実を一致させる。
我々は,多様なmRNAデータセットとタスク上でHELMを評価し,HELMが標準言語モデルの事前学習より優れていることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:16:47 GMT)
Evaluating the Instruction-following Abilities of Language Models using Knowledge Tasks [4.9] 本稿では,タスク性能と命令追従機能の両方を検証し易い命令追従ベンチマークの開発に焦点をあてる。
既存の知識ベンチマークを適応させ、(a)知識タスクを正しく答える条件付きで強化するか、(b)複数の知識回答タスクにおいて候補オプションの空間を使用する。
大規模な命令調整 LLM でさえ、ゼロショット設定で単純な命令に従わないことがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:07:37 GMT)
GOOSE Algorithm: A Powerful Optimization Tool for Real-World Engineering Challenges and Beyond [4.9] GOOSEアルゴリズムは19のよく知られたテスト関数でベンチマークされる。
提案アルゴリズムは, 最新のベンチマーク関数10を用いて検証する。
得られた結果は,提案アルゴリズムの優れた性能を示すものである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:04:57 GMT)
Leveraging Intra-Period and Inter-Period Features for Enhanced Passenger Flow Prediction of Subway Stations [4.9] 地下鉄駅の短期旅客フロー予測は、駅員が乗客数の変化に積極的に対応できるようにする上で重要な役割を担っている。
異なる期間、特に時代内および時代間の特徴を効果的に統合する研究が欠如している。
我々はtextbfMuti textbfPeriod textbfSpatial bfbfTemporal textbfMPSTN という新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:14:51 GMT)
Quantum Embedding of Non-local Quantum Many-body Interactions in Prototypal Anti-tumor Vaccine Metalloprotein on Near Term Quantum Computing Hardware [4.9] 複素ヘモシアニン分子の量子コンピュータシミュレーションを初めて提示する。
ヘモシアニンは様々な生理的過程に関与する重要な呼吸タンパク質である。
ヘモシアニンの磁気構造は多体補正の影響が大きい。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:49:42 GMT)
Rethinking Visual Counterfactual Explanations Through Region Constraint [4.9] 現在の最先端のアプローチでは、領域の制約という重要なコンポーネントが欠如している、と私たちは主張します。
新たな最先端を大きなマージンで設定することに加えて、RCSBを拡張して、正確な反ファクト推論を可能にします。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:10:48 GMT)
A linguistic analysis of undesirable outcomes in the era of generative AI [4.8] 本稿では,LLama2のチャットバージョンを基盤として,生成されたコンテンツの言語的側面に着目した総合シミュレーションフレームワークを提案する。
以上の結果から,このモデルでは世代ごとの語彙的リッチコンテンツの生成が減少し,多様性が低下することが示唆された。
オートファジーは、最初のモデルをより創造的で疑わしい、混乱したものに変換し、不正確な答えをもたらす可能性がある。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:02:48 GMT)
MambaBEV: An efficient 3D detection model with Mamba2 [4.8] 本稿では,mamba2を用いたBEV 3Dオブジェクト検出モデルを提案する。
また、モデルの性能をテストするためにエンド・ツー・エンドの自動運転パラダイムを適用します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:37:29 GMT)
Mini-Splatting: Representing Scenes with a Constrained Number of Gaussians [4.7] 本研究では,ガウスの制約の多いシーンを効率よく表現することの課題について検討する。
本稿では, ブラース分割や深部再初期化, 交差点保存・サンプリングによる簡易化など, 密度化戦略を紹介する。
我々のMini-Splattingは、オリジナル化パイプラインとシームレスに統合され、ガウス・スプレイティングに基づく将来の研究の強力なベースラインを提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:07:21 GMT)
A Fast Convoluted Story: Scaling Probabilistic Inference for Integer Arithmetic [4.7] 整数値の確率変数に対する線形算術をテンソル演算として定式化する。
我々は、自由な勾配に基づく学習のために、事実上アンロック可能な、微分可能なデータ構造を得る。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:16:10 GMT)
FedCCRL: Federated Domain Generalization with Cross-Client Representation Learning [4.7] ドメイン一般化(DG)は、目に見えないドメインに効果的に一般化できるモデルを訓練することを目的としている。
クライアントがデータを直接共有せずに協調的にモデルをトレーニングするフェデレートラーニング(FL)では、既存のDGアルゴリズムはFL設定に直接適用できない。
本稿では,新しいフェデレーションドメイン一般化手法であるFedCCRLを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:00:09 GMT)
Mental Disorders Detection in the Era of Large Language Models [4.7] 本稿では、抑うつや不安を検知するタスクにおける機械学習手法、エンコーダベースモデル、および大規模言語モデル(LLM)の有効性を比較した。
我々は、言語的特徴に基づくAutoMLモデル、BERTのようなエンコーダベースのトランスフォーマーのバリエーション、そして病理分類モデルとして最先端のLCMを試験した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:14:54 GMT)
Mental Disorders Detection in the Era of Large Language Models [4.7] 本稿では、抑うつや不安を検知するタスクにおける機械学習手法、エンコーダベースモデル、および大規模言語モデル(LLM)の有効性を比較した。
我々は、言語的特徴に基づくAutoMLモデル、BERTのようなエンコーダベースのトランスフォーマーのバリエーション、そして病理分類モデルとして最先端のLCMを試験した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:14:54 GMT)
The Fellowship of the LLMs: Multi-Agent Workflows for Synthetic Preference Optimization Dataset Generation [4.5] 本稿では,マルチエージェントを用いた合成優先度最適化(PO)データセットの生成手法を提案する。
データセット生成プロセスの自動化と向上において,これらの有効性と可能性を評価する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:15:19 GMT)
Comparative Analysis of Extrinsic Factors for NER in French [4.5] 名前付きエンティティ認識(NER)は構造化情報の識別を目的とした重要なタスクである。
本稿では,NERモデルの性能向上のために,モデル構造,コーパスアノテーション,データ拡張手法などの諸要因について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:12:06 GMT)
Sharing to learn and learning to share; Fitting together Meta-Learning, Multi-Task Learning, and Transfer Learning: A meta review [4.5] 本稿では、これらの学習アルゴリズムを2つ組み合わせた研究についてレビューする。
文献から蓄積した知識に基づいて、汎用的なタスクに依存しないモデルに依存しない学習ネットワークを仮定する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:45:22 GMT)
Automating Traffic Model Enhancement with AI Research Agent [4.4] Traffic Research Agent(TR-Agent)は、交通モデルを自律的に開発・洗練するAI駆動システムである。
TR-Agentは、複数のトラフィックモデルで大幅なパフォーマンス向上を実現している。
研究とコラボレーションをさらに支援するため、私たちは実験で使用されるコードとデータの両方をオープンソース化しました。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:39:43 GMT)
De-Identification of Medical Imaging Data: A Comprehensive Tool for Ensuring Patient Privacy [4.4] オープンソースツールを使用して、DICOMの磁気共鳴画像、コンピュータ画像、スライド画像全体、および磁気共鳴twixの生データを識別することができる。
複数種類の入力のための精巧な匿名化パイプラインを備えており、画像データの非識別に使用される追加ツールの必要性を低減している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:31:24 GMT)
Yama: Precise Opcode-based Data Flow Analysis for Detecting PHP Applications Vulnerabilities [4.3] Yama は、PHP のための文脈に敏感で経路に敏感な相互言語間データフロー解析手法である。
我々は,PHPオペコードの正確なセマンティクスと明確な制御フローにより,データフロー解析をより正確かつ効率的に行えることを発見した。
我々は,基本データフロー解析機能,複雑な意味解析機能,実世界のアプリケーションにおける脆弱性発見機能という3つの側面からヤマを評価した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:14:37 GMT)
Which Spaces can be Embedded in $L_p$-type Reproducing Kernel Banach Space? A Characterization via Metric Entropy [4.3] 我々は、計量エントロピー成長と函数空間の再生核ヒルベルト/バナッハ空間への埋め込み性の間に新しい接続を確立する。
その結果、複雑な関数空間を学習するためのカーネル手法のパワーと限界に新たな光を当てた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:28:06 GMT)
BenchmarkCards: Large Language Model and Risk Reporting [4.2] 大きな言語モデル(LLM)は強力な能力を提供するが、大きなリスクをもたらす。
これらのリスクを軽減する方法の1つは、特定の脆弱性をテストするために設計されたベンチマークを使用して、包括的な事前デプロイ評価を行うことである。
BenchmarkCardsは、LLMベンチマークプロパティのドキュメント化に特化した構造化フレームワークを提供することで、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:09:02 GMT)
Perseus: Leveraging Common Data Patterns with Curriculum Learning for More Robust Graph Neural Networks [4.2] グラフニューラルネットワーク(GNN)は、グラフデータを扱うのに優れるが、敵の攻撃に弱いままである。
本稿では,カリキュラム学習に基づく新たな対人防御手法であるPerseusを提案する。
実験の結果、ペルセウスは優れた性能を発揮し、敵の攻撃に対してはるかに堅牢であることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:08:02 GMT)
Topological reconstruction of sampled surfaces via Morse theory [4.2] 本稿では,点サンプルの注意深いトポロジカルスタディに基づく再構成アルゴリズムを提案する。
三角形や局所暗黙の方程式は中間段階として使われない。
このアルゴリズムは、任意の次元の周囲空間に埋め込まれた境界の有無にかかわらず滑らかな曲面に適用することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:08:50 GMT)
WorldMedQA-V: a multilingual, multimodal medical examination dataset for multimodal language models evaluation [4.1] マルチモーダル/ビジョン言語モデル(VLM)は、世界中の医療分野でますます普及している。
既存のデータセットはテキストのみであり、言語や国の限られたサブセットで利用可能である。
WorldMedQA-Vには、4カ国の医療画像と組み合わせて568のラベル付き多重選択QAが含まれている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:31:24 GMT)
Deep Optimal Experimental Design for Parameter Estimation Problems [4.1] ディープラーニングを用いた新しい実験設計手法について検討する。
ネットワークのトレーニングをLikelihood Free Estorとして行うことで,設計プロセスを大幅に単純化できることを示す。
パラメータ推定問題に対する回収プロセスの品質は, 深い設計により向上する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:51:13 GMT)
SoK: On Finding Common Ground in Loss Landscapes Using Deep Model Merging Techniques [4.0] 本稿では,モデルマージ手法の新たな分類法を提案する。
これらの分野における文献からの反復的な経験的観察を,ロスランドスケープ幾何学の4つの主要な側面のキャラクタリゼーションに用いた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:14:05 GMT)
Additivity of quantum capacities in simple non-degradable quantum channels [4.0] 付加性の例は稀であるが、非付加性の起源に関する重要な洞察を与える。
付加的なコヒーレント情報を持つ分解可能なチャネルは、量子容量を計算できる唯一のチャネルである。
付加的なコヒーレントな情報を持ちながら容易に計算可能な量子チャネルを構築する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:50:27 GMT)
With a Grain of SALT: Are LLMs Fair Across Social Dimensions? [4.0] 本稿では,オープンソースLarge Language Models (LLM) における様々な性別,宗教,人種間のバイアスの分析を行う。
一般討論,定位討論,キャリアアドバイザ,ストーリー生成,問題解決,カバーレタライティング,CV生成という,7つのバイアストリガを用いたバイアス検出データセットを生成する手法を提案する。
我々は, GPT-4o-mini を用いて各グループに関連付けられた LLM 生成テキストを匿名化し, GPT-4o-as-a-Judge を用いて相互比較を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:22:47 GMT)
NSSI-Net: Multi-Concept Generative Adversarial Network for Non-Suicidal Self-Injury Detection Using High-Dimensional EEG Signals in a Semi-Supervised Learning Framework [4.0] 非監督的自己損傷(NSSI)は、青年期における身体的および精神的な健康に対する深刻な脅威である。
本研究では、NSSIに関連する脳波の特徴を効果的にモデル化する高度半時間対向ネットワークNSSI-Netを提案する。
モデルの有効性と信頼性が実証され、既存の機械学習やディープラーニングに比べてパフォーマンスが7.44%向上した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:39:04 GMT)
Multi-modal graph neural networks for localized off-grid weather forecasting [3.9] 機械学習や数値気象モデルによる天気予報製品は、現在、グローバル・レギュラー・グリッドで作成されている。
本研究では、異種グラフニューラルネットワーク(GNN)をエンドツーエンドにトレーニングし、グリッド化された予測をダウンスケールして、関心のある場所をオフグリッドする。
提案手法は,グローバルな大規模気象モデルと局所的高精度な予測とのギャップを橋渡しして,局所的な意思決定に役立てることができることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:25:43 GMT)
Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models [3.9] 本稿では,Open Materials 2024 (OMat24) の大規模オープンデータセットのMeta FAIRリリースについて述べる。
OMat24は、構造的および構成的多様性に焦点を当てた1億1000万以上の密度汎関数理論(DFT)計算を含んでいる。
私たちのEquiformerV2モデルは、Matbench Discoveryのリーダーボード上で最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:48:34 GMT)
Composable free-space continuous-variable quantum key distribution using discrete modulation [3.9] 連続可変(CV)量子鍵分布(QKD)は、量子セキュアな通信を可能にする。
本稿では,特に都市大気流路向けに設計された離散変調を用いたCVQKDシステムを提案する。
これにより、CV QKDネットワークを既存のファイバーバックボーンを超えて拡張することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:02:53 GMT)
Optimizing Low-Resource Language Model Training: Comprehensive Analysis of Multi-Epoch, Multi-Lingual, and Two-Stage Approaches [3.8] 既存の作業では、制限対象の言語コーパスを効率的に活用するために、マルチエポック、多言語、二段階の訓練が採用されている。
我々は、これらの3つのアプローチを組み合わせて、低リソース言語LLMのトレーニング設定を徹底的に検討する。
対象言語コーパスの量が減少するにつれて、最適トレーニングアプローチは、単言語単段階訓練から、計算予算依存しきい値における多言語二段階訓練へと移行する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:45:56 GMT)
AERO: Softmax-Only LLMs for Efficient Private Inference [3.8] 本稿では,変換器を用いたデコーダのみの言語モデルにおける非線形性の役割を理解するための包括的解析を行う。
AEROは,既存のLLMアーキテクチャを改良した4段階アーキテクチャ最適化フレームワークである。
まず,効率のよい PI に適したFLOP が大幅に少ないSoftmax のみのアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:40:49 GMT)
Blockchain-based AI Methods for Managing Industrial IoT: Recent Developments, Integration Challenges and Opportunities [3.8] 著者は、スマートIIoTにおいて、BCによるAIアプローチに関する包括的な調査を提示する。
AI、BC、スマートIoTアプリケーションに関する最先端の概要に注目します。
セキュリティ、安定性、スケーラビリティ、機密性など、さまざまな問題を強調します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:55:32 GMT)
Fate of localization features in a one-dimensional non-Hermitian flat-band lattice with quasiperiodic modulations [3.7] 平面バンドを有する人工磁束$theta$の1次元非エルミタンダイヤモンド格子に対する準周期変調の影響について検討した。
本研究は,これらの変調の対称性と磁束$theta$が,系の局在特性を形成する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:12:34 GMT)
Distributed inner product estimation with limited quantum communication [3.7] 量子通信が制限された場合, 内部積の分散推定の課題を考察する。
我々は、$k=Theta(sqrt2n-q)$コピーが本質的に必要であり、このタスクに十分であることを示す。
また、任意のエルミート $M$ に対して $|langle psi|M|phirangle|2$ を推定することを考える。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:46:59 GMT)
Discovering Leitmotifs in Multidimensional Time Series [3.6] 本稿では,MDTSのための新しい,効率的かつ高効率なリートモチーフ探索アルゴリズムLAMAを提案する。
LAMAは2つの中核主成分に依存している: (a) リートモチーフは、まだ未知の数のサブディメンジョンしか与えられていない ― 少なすぎる、あるいは多すぎる、そして (b) サブディメンジョンの集合は、見つかった最良のパターンから独立していない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:50:45 GMT)
Evaluating Quantum Optimization for Dynamic Self-Reliant Community Detection [3.6] 量子計算カラーブルーを用いて解くのに適した二次非拘束バイナリ最適化(QUBO)問題を定式化する。
この定式化は、最大自己充足力とそれらの間を流れる最小限のパワーを持つコミュニティを見つけることを目的としている。
D-Waveのハイブリッド量子古典解法、古典解法、分枝結合解法などである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:24:37 GMT)
Unsupervised Point Cloud Completion through Unbalanced Optimal Transport [3.6] 未ペアのポイントクラウド補完は、未ペアの未完了と完全なポイントクラウドデータから完了マップを学ぶ方法を探る。
非平衡の最適輸送マップを用いた不対向点雲補修のための新しい手法を提案する。
我々のモデルは特に、不完全なクラウドデータセットと完全なクラウドデータセットのカテゴリの割合が異なるクラス不均衡のシナリオで有効である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:06:49 GMT)
Hiding-in-Plain-Sight (HiPS) Attack on CLIP for Targetted Object Removal from Images [3.5] Hiding-in-Plain-Sight (HiPS) 攻撃はターゲットオブジェクトを選択的に隠蔽することでモデル予測を微調整する
本稿では,HPS-clsとHiPS-capの2種類のHiPS攻撃モデルを提案し,下流画像キャプションモデルへの転送の有効性を実証した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:11:32 GMT)
A Primal-dual algorithm for image reconstruction with ICNNs [3.5] 我々は、正規化器が入力ニューラルネットワーク(ICNN)によってパラメータ化されるデータ駆動変分フレームワークにおける最適化問題に対処する。
勾配に基づく手法はそのような問題を解決するのに一般的に用いられるが、非滑らかさを効果的に扱うのに苦労する。
提案手法は, 速度と安定性の両方の観点から, 下位段階の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:36:29 GMT)
Dual Action Policy for Robust Sim-to-Real Reinforcement Learning [3.5] デュアルアクションポリシー(DAP)は、強化学習のシミュ---リアルギャップに固有の動的ミスマッチに対処する新しいアプローチである。
1つはシミュレーションにおけるタスク報酬の最大化のためのもので、もう1つは報酬調整によるドメイン適応のためのものである。
実験により,DAPが実間ギャップを埋めることの有効性が示され,シミュレーションにおける課題のベースラインを上回り,不確実性推定を取り入れることでさらなる改善が達成された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:22:06 GMT)
Enhancing Speech Emotion Recognition through Segmental Average Pooling of Self-Supervised Learning Features [3.4] 音声感情認識(SER)は、音声を通して表現される人間の感情を分析する。
現在の手法は、音声信号を表現し、音声と非音声のセグメントを等しく扱うために、Global Average Pooling (GAP) に依存している。
本稿では,非音声区間を無視した音声区間を選択的に注目するセグメント平均プール(SAP)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:00:57 GMT)
Quantum Fourier Transform for Image Processing [3.4] 本稿では,周波数領域における1次元時系列や2次元画像などの情報処理のための量子アルゴリズムを提案する。
提案手法はIBM Qiskit量子シミュレータに実装されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:21:42 GMT)
Exploring the Head Effect in Live Streaming Platforms: A Two-Sided Market and Welfare Analysis [3.4] 本稿では、ライブストリーミングプラットフォームを、ストリーマーと視聴者を結ぶ双方向市場として分析するための理論的枠組みを開発する。
少数のトップストリーマーが、強いネットワーク効果とコミッショナーレートやトラフィック割り当てアルゴリズムのようなプラットフォームポリシーのために、ほとんどの視聴者を惹きつける"ヘッドエフェクト"に焦点を当てている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:30:42 GMT)
Beyond Silent Letters: Amplifying LLMs in Emotion Recognition with Vocal Nuances [3.4] 本稿では,音声特徴を自然言語記述に変換するSpeechCueLLMを提案する。
我々は、IEMOCAPとMELDの2つのデータセット上でSpeechCueLLMを評価し、感情認識精度を大幅に改善した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:26:45 GMT)
Pyramid-Driven Alignment: Pyramid Principle Guided Integration of Large Language Models and Knowledge Graphs [3.3] 大きな言語モデル(LLM)は印象的な推論能力を持っているが、誤った情報を生成する傾向があり、しばしば幻覚と呼ばれる。
既存の手法は主に外部知識グラフ(KG)を静的知識リポジトリとして扱い、KGとLLMの知識の重大な相違を見越す。
本稿では,LLMとKGをシームレスに統合する新しいフレームワークであるPDAを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:57:18 GMT)
Privacy-Preserving Synthetically Augmented Knowledge Graphs with Semantic Utility [3.3] 推論は、複雑なビジネスセマンティクスをキャプチャする派生した知識を生成することを可能にする。
金融機関、中央銀行、経済研究機関、国家監督当局は、重要なビジネス課題に対処するために知識グラフに存在論的推論を適用している。
KGの共有における大きな障害は、データ対象の同一性とその機密性または企業機密情報が不適切に暴露される可能性があるため、プライバシー上の考慮によって表現される。
本稿では,KGの共有を可能にする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:04:02 GMT)
REST API Testing in DevOps: A Study on an Evolving Healthcare IoT Application [3.2] 本稿では、最先端かつ十分に確立されたREST APIテストツールを評価する。
120のエンドポイントを持つすべてのアクセス可能なREST APIを使って実験を行った。
すべてのツールがテストを生成し、いくつかの障害、18の潜在的な障害、84%のカバレッジ、23のレグレッション、80%以上のコストオーバーヘッドが発生した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:24:42 GMT)
Quantum Boltzmann machine learning of ground-state energies [3.2] ハミルトニアンの基底状態エネルギーを推定することは、量子コンピュータが役に立つ基本的な課題である。
提案アルゴリズムは,新しい量子回路構築法により,エネルギー関数の勾配を効率的に推定する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:22:03 GMT)
MambaPainter: Neural Stroke-Based Rendering in a Single Step [3.2] ストロークに基づくレンダリングは、ブラシストロークシーケンスを予測して入力画像を油絵スタイルに再構築することを目的としている。
単一推論ステップで100以上のブラシストロークのシーケンスを予測できるMambaPainterを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:02:45 GMT)
Modeling Short-Range Microwave Networks to Scale Superconducting Quantum Computation [3.2] チップレットとして知られる小さな量子ビットアレイをまたいだ分散量子コンピューティングは、これらの課題をスケーラブルな方法で解決することができる。
短期ハードウェア上でのモノリシック性能を超える可能性のあるマイクロ波リンク上のチップレットアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:14:23 GMT)
Leveraging LLMs for Translating and Classifying Mental Health Data [3.0] 本研究は,ギリシャ語におけるうつ病の重症度の自動検出に焦点をあてる。
以上の結果から,GPT3.5-turboは英語における抑うつの重症度を同定するにはあまり成功せず,ギリシャ語でも多彩な性能を示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:30:11 GMT)
Context Matters: Leveraging Contextual Features for Time Series Forecasting [3.0] 既存の予測モデルにマルチモーダルなコンテキスト情報を外科的に統合する新しいプラグイン・アンド・プレイ手法であるContextFormerを導入する。
ContextFormerは、カテゴリ、連続、時間変化、さらにはテキスト情報を含む、リッチなマルチモーダルコンテキストから予測固有の情報を効果的に蒸留する。
エネルギー、交通、環境、金融ドメインにまたがるさまざまな実世界のデータセットにおいて、SOTA予測モデルを最大30%上回ります。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:36:13 GMT)
MultiCamCows2024 -- A Multi-view Image Dataset for AI-driven Holstein-Friesian Cattle Re-Identification on a Working Farm [2.9] 複数のカメラで撮影されたMultiCamCows2024は、ホルシュタイン・フリース種牛の生体認証のための大規模画像データセットである。
データセットは90頭の牛の101,329枚の画像と、基盤となるCCTVの映像で構成されている。
本研究の枠組みは, トラッカーレットの完全自動識別を可能にすることを示し, トラッカーレットの完全性の簡易な検証のみを禁止している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:58:47 GMT)
EdgeRL: Reinforcement Learning-driven Deep Learning Model Inference Optimization at Edge [2.9] 本稿では,Advantage Actor-Critic (A2C) Reinforcement Learning (RL)アプローチを用いて,バランスを打とうとするEdgeRLフレームワークを提案する。
我々はEdgeRLフレームワークの利点を,端末の省エネ,推論精度の向上,エンドツーエンドの推論遅延低減の観点から評価した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:31:39 GMT)
LoraMap: Harnessing the Power of LoRA Connections [2.9] 本稿では,複数のローランド適応(LoRA)間の接続を確立する手法について検討する。
ファクトチェックと微調整の個々のLoRAに適した3つの推論データセットを作成します。
それらの間の接続をマップするアプローチであるLoraMapを紹介します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:19:45 GMT)
On the Utility of Domain Modeling Assistance with Large Language Models [2.9] 本稿では,大規模言語モデル(LLM)とドメインモデリング支援のための数発のプロンプト学習を利用した新しいアプローチの有用性を評価する。
このアプローチの目的は、不足するドメイン固有のデータセット上で、AIベースの補完モデルの広範なトレーニングの必要性を克服することである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:55:34 GMT)
Global Censored Quantile Random Forest [2.8] 我々は,正しい検閲対象データに対する条件付き量子化過程を予測するために,GCQRF(Global Censored Quantile Random Forest)を提案する。
我々は、無限の森林を仮定することなく予測過程の変動を定量化し、その弱収束を確立する。
提案手法の予測精度は,既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:05:01 GMT)
The state hidden subgroup problem and an efficient algorithm for locating unentanglement [2.8] 我々は「隠されたカット問題」と呼ばれる絡み合いテストの一般化について研究する。
本稿では,隠されたカット問題を,慎重に選択されたアベリアグループアクションでステートHSPとして定式化する方法について述べる。
隠蔽状態のサンプリングは、よく知られたシモンの問題の変種として同様の結果をもたらすことを証明している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:12:12 GMT)
Agent Skill Acquisition for Large Language Models via CycleQD [2.7] CycleQDはアルゴリズムの循環的適応を通じて品質多様性フレームワークを活用する新しいアプローチである。
各タスクのパフォーマンス指標は品質指標として交換され、他のタスクは行動特性として機能する。
CycleQD を LLAMA3-8B-INSTRUCT ベースのモデルに適用することで、コーディング、オペレーティングシステム、データベースタスクにおける従来の微調整手法を超越するだけでなく、GPT-3.5-TURBO と同等のパフォーマンスを達成できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:27:15 GMT)
AI-Oracle Machines for Intelligent Computing [2.7] インテリジェントコンピューティングのためのAI-オラクルマシンの概念を導入し、その可能性を示すいくつかのアプリケーションを概説する。
我々は、AI-オラクルマシンの実装を合理化するための包括的なプラットフォームの開発を提唱する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:55:50 GMT)
An exactly solvable model for emergence and scaling laws in the multitask sparse parity problem [2.6] 本稿では,新たな能力(スキル)を基礎関数として表現するフレームワークを提案する。
新たなスキルの出現と、トレーニング時間、データサイズ、モデルサイズ、最適計算による損失の法則のスケーリングに関する分析式を見つける。
私たちの単純なモデルでは、単一の適合パラメータを使用して、トレーニング時間、データサイズ、モデルサイズが増大するにつれて、複数の新しいスキルのシグモダルな出現を捉えます。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:36:49 GMT)
A Location Validation Technique to Mitigate GPS Spoofing Attacks in IEEE 802.11p based Fleet Operator's Network of Electric Vehicles [2.6] 車両再バランスアプリケーションは、定期的に車両のGPS位置情報を使用して、その車両を別の充電ステーションに移動して再バランスを行う。
ネットワークに潜んでいる悪意のある攻撃者は、対象車両のGPS位置情報パケットを偽装し、車両の位置を誤解釈する。
本稿では,以前の位置とロードマップに基づいて,車両の現在位置を検証できる位置追跡手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:42:27 GMT)
Nominal Class Assignment in Swahili: A Computational Account [2.5] スワヒリ語における意味論と名目クラス代入の関係に関するオープンな疑問について論じる。
以上の結果から,各学級における意味的凝集度を定量的に評価した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:41:48 GMT)
A low complexity contextual stacked ensemble-learning approach for pedestrian intent prediction [2.4] 現在の研究では、コンピュータビジョンと機械学習の進歩を活用して、ニアミスを予測する。
本研究は,歩行者の横断意図を予測するための文脈データを用いた,低複雑さアンサンブル学習手法を提案する。
異なるデータセットに対する実験は、最先端のアプローチと同様の歩行者意図予測性能を実現する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:02:24 GMT)
Optimizing 3D Geometry Reconstruction from Implicit Neural Representations [2.4] 暗黙の神経表現は、3D幾何学を学ぶための強力なツールとして登場した。
本稿では,計算コストを削減し,細部を捉える新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:36:23 GMT)
LPUF-AuthNet: A Lightweight PUF-Based IoT Authentication via Tandem Neural Networks and Split Learning [2.4] IoT(Internet of Things)は2025年までに全世界で75億以上のデバイスを接続する計画だ。
従来の暗号手法は、IoTデバイスの制約に悩まされることが多い。
本稿では、物理的非拘束機能(PUF)を堅牢なセキュリティソリューションとみなす。
提案手法では,タンデムニューラルネットワーク(TNN)とスプリットラーニング(SL)パラダイムを組み合わせた,LPUF-AuthNetと呼ばれる軽量PUF機構を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:25:04 GMT)
Token-based Decision Criteria Are Suboptimal in In-context Learning [2.3] In-Context Learning (ICL) は通常、手動で選択したラベルトークンの出力確率から分類基準を利用する。
このようなトークンベースの分類基準は、最適下決定境界につながると我々は主張する。
トークン確率を放棄し,LMの最後の隠蔽状態に最も近いセントロイドを使用するHiddenを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:00:46 GMT)
Enhancing Accuracy-Privacy Trade-off in Differentially Private Split Learning [2.3] Split Learning(SL)は、クライアントサーバ間で詳細なモデルを分散し、プライベートデータをローカルに保持することで、ユーザのデータプライバシを保護することを目的としている。
最近提案されたモデル反転攻撃は、スマッシュされたデータから元のデータを復元することができる。
ディファレンシャルプライバシ(DP)を採用する戦略では、スマッシュされたデータをある程度の精度の損失を犠牲にして保護する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:36:31 GMT)
Identity Emergence in the Context of Vaccine Criticism in France [2.3] 本研究は、新型コロナウイルス感染拡大に伴うフランスにおける予防接種政策に批判的な個人間の集団的アイデンティティの出現について検討した。
代名詞の使用、グループ外ラベリング、およびつぶやき類似性の分析を用いて、このアイデンティティがどのように出現したかを検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:40:46 GMT)
The second-order zero differential uniformity of the swapped inverse functions over finite fields [2.2] 置換された逆関数の2階ゼロ微分均一性について検討する。
この論文は、偶数標数で 4 に等しい二階ゼロ微分均一性を持つ非パワー関数の類を特徴づける最初の結果である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:21:46 GMT)
Causal Discovery under Latent Class Confounding [2.2] グローバルに構築された因果構造は、任意の構造方程式や雑音関数で識別可能であることを示す。
グローバルに構築された因果構造は、任意の構造方程式や雑音関数で識別可能であることを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:28:25 GMT)
Smart Casual Verification of the Confidential Consortium Framework [2.2] Confidential Consortium Framework(CCF)は、信頼できる信頼性のあるクラウドアプリケーションを開発するためのオープンソースプラットフォームである。
CCFはMicrosoftのAzure Confidential Ledgerサービスを動かしている。
本稿では、CCFの新しい分散プロトコルの正当性を検証するために、スマートカジュアル検証を適用した経験を報告する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:14:29 GMT)
EG-HumanNeRF: Efficient Generalizable Human NeRF Utilizing Human Prior for Sparse View [2.1] 一般化可能なニューラルレイディアンスフィールド(NeRF)は、シーンごとのトレーニングなしに、ニューラルネットワークによるデジタル人間のレンダリングを可能にする。
スパース・インプット・ビューを用いた高品質かつリアルタイムなレンダリングを実現する一般化可能なヒューマンNeRFフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:08:00 GMT)
SAT: Data-light Uncertainty Set Merging via Synthetics, Aggregation, and Test Inversion [2.1] 我々は、様々な潜在的に依存する不確実性集合を単一の集合にマージする、効率的で柔軟な合成、凝集、およびテスト逆変換(SAT)アプローチを導入する。
提案手法は, 合成試験統計学の新たなクラスを構築し, それらを集約し, 実験逆転による統合集合を導出する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:52:47 GMT)
Standalone 16-bit Training: Missing Study for Hardware-Limited Deep Learning Practitioners [2.1] 混合精度技術は、モデルトレーニングと推論の間に異なる数値精度を活用し、資源利用を最適化する。
リソースが限られている多くの人にとって、利用可能なオプションは32ビット、16ビット、または2つの組み合わせに限られている。
この研究は重要なギャップを埋め、スタンドアロンの16ビット精度のニューラルネットワークが32ビットと混合精度の精度で一致したことを初めて証明した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:22:01 GMT)
Development of Image Collection Method Using YOLO and Siamese Network [2.1] 著者らは、意図しないデータがユーザとともに収集されるのに、クローリング方法に問題があることに気付いた。
彼らは、オブジェクト認識モデル YOLOv10 を用いてフィルタリングできることを発見した。
著者らは、Siameseネットワークは少ないリソースで高いパフォーマンスを達成することができることも見出した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:36:47 GMT)
From Measurement Instruments to Training Data: Leveraging Theory-Driven Synthetic Training Data for Measuring Social Constructs [2.1] 理論駆動型総合学習データの社会構造測定における可能性について検討する。
政治トピック分類におけるラベル付きデータの必要性を低減するために,合成データが極めて有効であることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:42:23 GMT)
Can Search-Based Testing with Pareto Optimization Effectively Cover Failure-Revealing Test Inputs? [2.0] 我々は,検索領域内の障害発生領域をカバーするには,検索ベースソフトウェアテスト(SBST)が不十分であると主張している。
本研究では,入力空間におけるフェールリベリングテスト入力のカバレッジを,Coverage Inverted Distance品質指標と呼ぶ指標を用いて測定する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:30:57 GMT)
CVCP-Fusion: On Implicit Depth Estimation for 3D Bounding Box Prediction [2.0] Cross-View Center Point-Fusionは、3Dオブジェクト検出を行う最先端モデルである。
我々のアーキテクチャは、以前に確立されたアルゴリズム、クロスビュートランスフォーマー、CenterPointのアスペクトを利用する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:03:35 GMT)
cedar: Optimized and Unified Machine Learning Input Data Pipelines [2.0] cedarは、機械学習入力データパイプラインのための最適化された統一プログラミングフレームワークである。
cedarは、ローカルおよび分散コンピューティングリソースのカスタマイズ可能なセットで処理をオーケストレーションする。
cedarは、最先端の入力データシステムと比較して、パフォーマンスを最大1.87倍から10.65倍改善する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:54:15 GMT)
Learning quantum states and unitaries of bounded gate complexity [2.0] 我々は、G$2量子ビットゲートを持つ量子回路によって生成された状態を微量なトレース距離に学習するには、G$で線形にスケールするサンプル複雑性が必要であることを証明した。
また、$G$ゲートによって生成されるユニタリを、小さな平均ケースエラーに対して線形に$G$で学習するのに最適なクエリの複雑さが証明される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:10:50 GMT)
Counterfactual Generative Modeling with Variational Causal Inference [1.9] 本稿では, 逆ファクト生成モデリングタスクを扱うための変分ベイズ因果推論フレームワークを提案する。
実験では, 反ファクト生成モデルにおける最先端モデルと比較して, フレームワークの利点を実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:44:12 GMT)
Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography [1.8] 我々は3次元医用画像と対応するテキストレポートとをマッチングする最初のデータセットであるCT-RATEを紹介する。
我々はCTに焦点を当てたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。
我々は3次元胸部CTボリュームのための視覚言語基礎チャットモデルであるCT-CHATを作成する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:49:19 GMT)
Conjunction Subspaces Test for Conformal and Selective Classification [1.8] 異なるランダム部分空間上で有意なテスト結果を統合して、コンセンサス p-値を得る新しい分類器を提案する。
提案した分類器は、共形予測や、リジェクションと精巧なオプションによる選択的な分類のために容易に展開できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:56:53 GMT)
Dual-Model Distillation for Efficient Action Classification with Hybrid Edge-Cloud Solution [1.8] 我々は、より大規模で正確なクラウドベースモデルに必要に応じて遅延しながら、より小さなモデルのローカル処理効率を活用するハイブリッドエッジクラウドソリューションを設計する。
具体的には、エッジモデルの出力が不確かである場合に予測可能な軽量スイッチャーモデルをトレーニングするための、新しい教師なしデータ生成手法であるDual-Model Distillation(DMD)を提案する。
動作分類タスクの実験結果から,我々のフレームワークは計算オーバーヘッドを少なくするだけでなく,大規模モデルのみを使用する場合と比較して精度も向上することが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:06:27 GMT)
ÚFAL CorPipe at CRAC 2022: Effectivity of Multilingual Models for Coreference Resolution [1.8] CRAC 2022 における多言語照合解決のための共有タスクの入賞条件について述べる。
提案システムは,まず参照検出を解き,抽出したスパンと先行最大化手法をリンクする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:56:17 GMT)
Syn2Real Domain Generalization for Underwater Mine-like Object Detection Using Side-Scan Sonar [1.8] 本稿では,拡散モデルを用いたSyn2Real(Synthetic to Real)領域一般化手法を提案する。
DDPMモデルとDDIMモデルによるノイズによって生成された合成データは、完全に現実的でないとしても、トレーニングのための実世界のサンプルを効果的に増強できることを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:42:08 GMT)
On Large Uni- and Multi-modal Models for Unsupervised Classification of Social Media Images: Nature's Contribution to People as case study [1.8] ソーシャルメディア画像は、重要な主題との人間の相互作用を理解するための貴重な情報源であることが示されている。
このようなイメージをラベルのない意味論的意味のあるクラスタにグループ化する作業は困難である。
この研究は、ソーシャルメディアイメージを予め定義されたクラスにマッピングするための様々なアプローチを提案し、分析し、比較する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:27:14 GMT)
On Large Uni- and Multi-modal Models for Unsupervised Classification of Social Media Images: Nature's Contribution to People as a case study [1.8] 本研究は、ソーシャルメディアイメージを予め定義された多くのクラスにマッピングするための様々なアプローチを提案し、分析し、比較する。
事例研究として、人間と自然の相互作用を理解するという問題、いわゆる自然の人への貢献、文化生態系サービス(CES)について考察する。
我々の実験によると、95%以上の精度で高い性能のアプローチでは、まだ小さなラベル付きデータセットを作成する必要がある。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:27:14 GMT)
LLM Chain Ensembles for Scalable and Accurate Data Annotation [1.7] 大規模言語モデル(LLM)はゼロショット分類を行うことができるが、大規模デプロイメントは高価である。
本稿では,複数のLLMを列に並べたLLMチェーンアンサンブル手法を提案し,データサブセットをその後のモデルにルーティングする。
以上の結果から,チェーンアンサンブル法は,チェーン内の最高の個々のモデルの性能を上回り,大幅なコスト削減を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:03:51 GMT)
LLM Confidence Evaluation Measures in Zero-Shot CSS Classification [1.6] データアノテーションタスクに適した不確実性定量化(UQ)性能尺度を提案する。
本稿では,低信頼なLDMアノテーションを効果的に識別し,不正にラベル付けされたデータを発見できる新しいUQアグリゲーション戦略を提案する。
提案したUQアグリゲーション戦略は,既存の手法により改善され,ループ内データアノテーションプロセスの大幅な改善が期待できることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:17:18 GMT)
Boosting Asynchronous Decentralized Learning with Model Fragmentation [1.6] DivShareは通信ストラグラーの存在下で高速なモデル収束を実現する新しいDLアルゴリズムである。
我々はDivShareを、AD-PSGDとSwiftの2つの最先端DLベースラインに対して実験的に評価した。
CIFAR-10データセットのAD-PSGDと比較して、通信ストラグラーを持つDivShareは、時間と精度を最大3.9倍下げることがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:03:52 GMT)
Toleo: Scaling Freshness to Tera-scale Memory using CXL and PIM [1.6] セキュアなCXL IDEネットワークを介して接続された信頼されたスマートメモリを使用して、バージョン番号を安全に保存するToleoを提案する。
Toleoは、信頼の根源としてスマートメモリを使用することで、バージョン番号の完全性を保護するために、スケールできないMerkleツリーを不要にする。
プライバシに敏感なゲノミクス、グラフ、生成AI、データベースワークロードを使用して、Toleoのメリットを分析します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:10:48 GMT)
InterACT: Inter-dependency Aware Action Chunking with Hierarchical Attention Transformers for Bimanual Manipulation [1.5] 階層型注意変換器を用いた相互依存認識型アクションチャンキング(InterACT: Inter-Dependency aware Action Chunking)を紹介する。
InterACTは、バイマニュアル操作に特化して設計された新しい模倣学習フレームワークである。
シミュレーションおよび実世界の実世界のバイマニュアル操作タスクで行った実験は、InterACTが既存の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:52:42 GMT)
Generative Neural Reparameterization for Differentiable PDE-constrained Optimization [1.5] 部分微分方程式 (Partial-differential-equation, PDE) は、PDEが支配するシステムの最適パラメータを求める手法である。
本手法は,レーザー核融合に伴うレーザープラズマ不安定性を最小限に抑える最適パラメータを生成するニューラルネットワークの訓練に応用する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:46:48 GMT)
Continuous-Variable Fault-Tolerant Quantum Computation under General Noise [1.4] CV系におけるマルコフ型ノイズは、ゴッテマン・キタエフ・プレスキル符号を通じて論理量子ビットのマルコフ型ノイズに変換されることを示す。
CV量子計算は一般的なマルコフ型雑音に対して耐障害しきい値を持ち、CV量子計算における既存の重要なギャップを埋めることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:34:50 GMT)
Explainable Moral Values: a neuro-symbolic approach to value classification [1.4] 本研究では、オントロジーに基づく推論と、説明可能な値分類のための機械学習技術の統合について検討する。
道徳的価値のオントロジ的形式化をモラル・ファンデーションズ・セオリー(英語版)のように頼りにすることで、テクティサンドラのニューラルシンボリック・リセサイザーは、ある文で満たされる価値を推測するために用いられる。
推理器の推論のみに依存すると、他のより複雑な手法に匹敵する説明可能な分類が得られることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:53:13 GMT)
Disentangling Singlish Discourse Particles with Task-Driven Representation [1.4] シングリッシュ(英語: Singlish、正式にはコロキール・シンガポール英語)は、南東アジアのシンガポールを起源とするクレオール語である。
シングリッシュを理解するための基本的な課題は、まずその言論粒子の実用的函数を理解することである。
この研究は、Singlishの談話粒子をタスク駆動表現学習で解き放つための予備的な取り組みを提供する。
解離後、これらの談話粒子をクラスタリングし、実効性を識別し、Singlish-to- English 機械翻訳を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:09:14 GMT)
Disentangling Singlish Discourse Particles with Task-Driven Representation [1.4] シングリッシュ(英語: Singlish、正式にはコロキール・シンガポール英語)は、南東アジアのシンガポールを起源とするクレオール語である。
シングリッシュを理解するための基本的な課題は、まずその言論粒子の実用的函数を理解することである。
この研究は、Singlishの談話粒子をタスク駆動表現学習で解き放つための予備的な取り組みを提供する。
解離後、これらの談話粒子をクラスタリングし、実効性を識別し、Singlish-to- English 機械翻訳を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:09:14 GMT)
Accurate and Data-Efficient Toxicity Prediction when Annotators Disagree [1.4] アノテータが同意しない場合、個々のアノテータによって与えられるラベルを予測すれば、従来のラベル集約によって見落とされたニュアンスをキャプチャすることができる。
テキストの毒性に基づいて,個々のアノテータ評価を予測するための3つのアプローチを提案する。
評価予測のための人口統計情報の有用性について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:26:40 GMT)
Can LLMs Patch Security Issues? [1.3] LLM(Large Language Models)は、コード生成に優れた習熟度を示している。
LLMは人間と弱点を共有している。
我々は、LLMが生成した脆弱性のあるコードを自動的に洗練するフィードバック駆動セキュリティパッチング(FDSP)を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:46:45 GMT)
Benign Overfitting under Learning Rate Conditions for $α$ Sub-exponential Input [1.2] 重み付けされた入力の設定でも、良心的な過剰適合が持続することを示す。
これらの結果は、より現実的なデータ環境における現象のより深い理解に寄与する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:14:57 GMT)
Self-DenseMobileNet: A Robust Framework for Lung Nodule Classification using Self-ONN and Stacking-based Meta-Classifier [1.2] Self-DenseMobileNetは胸部X線写真(CXR)における結節と非結節の分類を強化するように設計されている
我々のフレームワークは、入力品質を最適化するために高度な画像標準化と拡張技術を統合している。
外部データセットでテストすると、このフレームワークは89.40%の精度で強力な一般化性を維持した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:04:06 GMT)
SSET: Swapping-Sliding Explanation for Time Series Classifiers in Affect Detection [1.2] 機械学習(ML)モデルの局所的な説明は、モデルが特定の決定を下す理由に関する曖昧さを減らすことができるため、大きな注目を集めている。
さまざまなデータタイプ、特にイメージの説明可能性に対処するために、大規模な努力が注がれている。
時系列データにおける時間と他の変数の融合は、生成された説明が人間には理解できない原因となる可能性がある。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:47:08 GMT)
Large data limits and scaling laws for tSNE [1.2] 元の tSNE アルゴリズムの埋め込みは、$n から in$ への一貫した極限を持たないことを示す。
本稿では、魅力的なエネルギーの減衰を緩和し、一貫した極限を持つ再スケールモデルを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:43:02 GMT)
Initialization Method for Factorization Machine Based on Low-Rank Approximation for Constructing a Corrected Approximate Ising Model [1.2] Isingモデルは、機械学習モデルであるFacterization Machine(FM)を用いて、高い精度で近似される。
FMQAの最適化性能は、ウォームスタート方式の実装により向上することが期待されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:06:55 GMT)
Enhancing Data Privacy in Large Language Models through Private Association Editing [1.1] 大規模言語モデル(LLM)は、データ集約型アプリケーションにおけるプライバシを保護するために、ソリューションを大幅に再設計する必要がある。
本稿では,プライベートデータ漏洩に対する新しい防御手法として,プライベートアソシエーション編集(PAE)を紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:31:05 GMT)
Superconducting flux qubit with ferromagnetic Josephson $π$-junction operating at zero magnetic field [1.0] 3つのNbN/AlN/NbNジョセフソン接合とNbN/PdNi/NbN強磁性$pi$-接合をベースとしたゼロフラックスバイアス束量子ビットの実現を報告した。
我々の研究結果は、強磁性と超伝導の相互作用を利用する量子コヒーレントデバイス(量子ビットやセンサなど)を開発するための道を開いた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:29:18 GMT)
MALADY: Multiclass Active Learning with Auction Dynamics on Graphs [1.0] 効率的なアクティブラーニングのためのマルチクラスアクティブラーニングとオークション・ダイナミクス・オン・グラフ(MALADY)フレームワークを提案する。
我々は[24]における半教師付き学習のための類似性グラフ上のオークションダイナミクスアルゴリズムを一般化し、より一般的な最適化関数を組み込む。
また,オークションアルゴリズムの双対変数を用いて,分類器内の不確実性を測定し,異なるクラス間の決定境界付近のクエリを優先順位付けする,新しい能動的学習獲得関数を導入する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:13:43 GMT)
A Proactive Decoy Selection Scheme for Cyber Deception using MITRE ATT&CK [1.0] サイバー詐欺は、攻撃者の戦術、技術、手順(TTP)に対する守備隊の遅さを補うことができる。
本研究では,実世界の攻撃者の経験的観察に基づく敵モデルにより支援されたデコイ選択方式を設計する。
その結果,提案手法は最小のデコイを用いた攻撃経路のインターセプション率が最も高いことがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:27:13 GMT)
Dynamic Learning Rate for Deep Reinforcement Learning: A Bandit Approach [1.0] 深層強化学習(LRRL)のための動的学習率を提案する。
LRRLは、トレーニング中のエージェントのパフォーマンスに基づいて学習率を選択するメタラーニングアプローチである。
実験の結果,LRRLは深部RLアルゴリズムの性能を大幅に向上できることが示された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:15:28 GMT)
$\textit{lucie}$: An Improved Python Package for Loading Datasets from the UCI Machine Learning Repository [1.0] $textitlucie$は、データフォーマットを決定し、これまで利用できなかったデータセットの多くをインポートするユーティリティである。
$textitlucie$は98%のコードカバレッジを持つPyPI上のPythonパッケージとして利用できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:15:12 GMT)
$\textit{lucie}$: An Improved Python Package for Loading Datasets from the UCI Machine Learning Repository [1.0] $textitlucie$は、データフォーマットを決定し、これまで利用できなかったデータセットの多くをインポートするユーティリティである。
$textitlucie$は98%のコードカバレッジを持つPyPI上のPythonパッケージとして利用できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:15:12 GMT)
From Lab to Pocket: A Novel Continual Learning-based Mobile Application for Screening COVID-19 [0.9] 新型コロナウイルススクリーニングのためのモバイルアプリケーションの設計と実装について述べる。
胸部X線から新型コロナウイルスを検出するための最先端の継続的学習法について検討した。
DenseNet161は96.87%の精度で最高の基礎モデルとして登場した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:10:15 GMT)
A distance function for stochastic matrices [0.9] Bhattacharyya角は、マルコフ連鎖の列から始めて、短周期と長期のマルコフ連鎖の実行を比較する自然なツールとして提唱されている。
マルコフ列上のバタチャリア角や新しい行列距離を考えると、モデル間の距離は同じである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:49:25 GMT)
Advancing Fairness in Natural Language Processing: From Traditional Methods to Explainability [0.9] この論文は、NLPシステムにおける株式と透明性の必要性に対処している。
高リスクNLPアプリケーションにおけるバイアスを軽減する革新的なアルゴリズムを導入している。
また、トランスフォーマーモデルの概念を特定し、ランク付けするモデルに依存しない説明可能性法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:38:58 GMT)
"Let's Argue Both Sides": Argument Generation Can Force Small Models to Utilize Previously Inaccessible Reasoning Capabilities [0.9] 本稿では,モデルに推論能力の活用を強制する手法として,Argument Generationを提案する。
提案手法では,可能な各推論結果に対する引数の生成と,生成した引数のランク付けをエンドモデルに依頼する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:49:30 GMT)
Cascade learning in multi-task encoder-decoder networks for concurrent bone segmentation and glenohumeral joint assessment in shoulder CT scans [0.9] この研究は、肩部CTスキャンを処理する革新的なディープラーニングフレームワークを導入している。
上腕骨と肩甲骨のセグメンテーション、骨表面の3次元再構成、角膜関節領域の同定などが特徴である。
パイプラインは、セグメンテーションのための3D CEL-UNetと3倍分類のための3D Arthro-Netの2つのケースケードCNNアーキテクチャで構成されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:00:31 GMT)
Towards Computational Analysis of Pansori Singing [0.8] パンソリ(英: Pansori)は、韓国の伝統音楽の最も代表的な声楽ジャンルの一つ。
本稿では,音声と対応する書き起こしの両方に基づいて,パンソリの計算解析を導入する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:44:28 GMT)
Hamiltonian bridge: A physics-driven generative framework for targeted pattern control [0.8] 複数のスケールでパターンを制御できるフレームワークを提案する。
そこで本稿では,Euler フローとしてキャスティング可能なパターン形成 Pdes 上での反復制御プロトコルを用いて,複雑なパターンを生成するための最適制御方法を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:24:54 GMT)
Towards Designing Scalable Quantum-Enhanced Generative Networks for Neutrino Physics Experiments with Liquid Argon Time Projection Chambers [0.7] LArTPCにおける高解像度画像の生成モデリングは、データの複雑さと空間性のために大きな課題を呈している。
正規化手法を導入し、小規模な画像で成功し、トレーニングプロセスの安定化を実証した。
これらの知見は、LArTPCデータ生成における量子強化生成モデルの可能性を強調し、核・高エネルギー物理学におけるスケーラブルなハイブリッド量子古典解の開発に有用な洞察を提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:14:37 GMT)
FragNet: A Graph Neural Network for Molecular Property Prediction with Four Layers of Interpretability [0.7] 本稿では,現在の最先端モデルに匹敵する予測精度を達成可能なグラフニューラルネットワークであるFragNetアーキテクチャを紹介する。
このモデルにより、どの原子、共有結合、分子断片、分子フラグメント結合が与えられた分子特性の予測に重要なのかを理解することができる。
FragNetの解釈能力は、分子構造と分子特性の間の学習パターンから科学的洞察を得るための鍵となる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:37:01 GMT)
How Do AI Companies "Fine-Tune" Policy? Examining Regulatory Capture in AI Governance [0.7] アメリカ合衆国の産業俳優は、汎用人工知能(AI)システムの規制に広範囲に影響を及ぼしてきた。
AI開発者とデプロイ担当者によるAIポリシーの取得は、汎用AIシステムの安全性、公正性、便益性、透明性、革新を保証するような規制上の目標を妨げうる。
専門家は、主に、AI規制の欠如、弱い規制、あるいは他者よりも特定の政策目標を過度に強調する規制の欠如につながる捕獲に関心を持っていた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:06:54 GMT)
Increasing Both Batch Size and Learning Rate Accelerates Stochastic Gradient Descent [0.7] 4つのスケジューラを用いたミニバッチ勾配降下(SGD)の理論解析を行った。
我々は,スケジューラ(i)を用いたミニバッチSGDが,経験的損失の完全な勾配ノルムの期待を最小化しているとは限らないことを示す。
また,スケジューラ (iii) や (iv) を用いることで,スケジューラ (i) や (ii) よりもスケジューラ (i) よりもスケジューラ (i) や (ii) の方がスケジューラ (iv) の完全勾配ノルムが小さくなることを示す解析結果も提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:14:41 GMT)
Increasing Both Batch Size and Learning Rate Accelerates Stochastic Gradient Descent [0.7] 4つのスケジューラを用いたミニバッチ勾配降下(SGD)の理論解析を行った。
我々は,スケジューラ(i)を用いたミニバッチSGDが,経験的損失の完全な勾配ノルムの期待を最小化しているとは限らないことを示す。
また,スケジューラ (iii) や (iv) を用いることで,スケジューラ (i) や (ii) よりもスケジューラ (i) よりもスケジューラ (i) や (ii) の方がスケジューラ (iv) の完全勾配ノルムが小さくなることを示す解析結果も提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:14:41 GMT)
Unleashing quantum algorithms with Qinterpreter: bridging the gap between theory and practice across leading quantum computing platforms [0.6] QInterpreterはQuantum Science Gateway QubitHubに組み込まれたツールである。
1つのライブラリからもう1つのライブラリにシームレスにプログラムを変換し、結果を視覚化する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:34:29 GMT)
When Not to Answer: Evaluating Prompts on GPT Models for Effective Abstention in Unanswerable Math Word Problems [0.6] 大規模言語モデル(LLM)は、複雑な数学的単語問題を解決するためにますます頼りになっている。
答えがつかない質問を提示すると、不正確な結果が得られ、潜在的な害について懸念を提起する。
本稿では,解答可能な数学的シナリオで一般的に用いられるプロンプトを適用することにより,GPTが解答不能な数学的単語問題に適切に対応できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:40:50 GMT)
Exploring Quantum Aspects of Dark Matter Axions and Dark Photons Transitions within a Resonant Cavity [0.6] 量子レベルでは、単一の軸イオン-光子遷移はキャビティの品質係数$Q$によって増幅されることを示す。
また,暗黒光子暗黒物質を含むシナリオの解析を行った。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:54:30 GMT)
Demonstrating Linked Battery Data To Accelerate Knowledge Flow in Battery Science [0.6] 電池は気候にやさしい未来へ移行する上で重要な要素であり、バッテリー研究の急増につながっている。
スコプスは、2023年だけで「リチウムイオン電池」に言及した14,388の論文を挙げている。
本稿では、この情報過負荷を管理するための構造化データ、意味データ、リンクデータに基づく戦略について論じる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:12:41 GMT)
Automated Test Case Repair Using Language Models [0.6] 欠陥のないテストケースは、テストスイートの品質を低下させ、ソフトウェア開発プロセスを破壊します。
テストケースの自動修復に事前訓練されたコード言語モデルを活用する新しいアプローチであるTaRGetを提案する。
TaRGetは、テスト修復を言語翻訳タスクとして扱い、言語モデルを微調整するために2段階のプロセスを使用する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:36:15 GMT)
Approaching Metaheuristic Deep Learning Combos for Automated Data Mining [0.5] 本研究では,メタヒューリスティック手法を従来の分類器やニューラルネットワークと組み合わせて自動データマイニングを行う手法を提案する。
手書き文字認識のためのMNISTデータセットの実験を行った。
根拠真理ラベル付きデータセットの検証精度は、これまで見つからなかった他のデータインスタンスのラベルを修正するのに不十分である、という実証的な観察がなされた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:28:22 GMT)
MIRROR: A Novel Approach for the Automated Evaluation of Open-Ended Question Generation [0.5] 自動質問生成システムによって生成される質問に対する評価プロセスを自動化する新しいシステムMIRRORを提案する。
その結果,MIRRORと呼ばれるフィードバックに基づく手法を用いることで,人間の評価指標,すなわち妥当性,適切性,新規性,複雑性,文法性のスコアが向上した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:24:42 GMT)
Adding web pentesting functionality to PTHelper [0.5] このプロジェクトは、PThelper: Penetration Testingプロセスをサポートするオープンソースツールと呼ばれる以前のイニシアチブの直接的な継続である。
この継続はPThelperを拡張し、Web脆弱性を検出し、後に報告する機能に重点を置いている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:05:56 GMT)
The Useful Side of Motion: Using Head Motion Parameters to Correct for Respiratory Confounds in BOLD fMRI [0.5] 呼吸は頭部の動きを誘発し、実際の動きや擬似的な動きを誘導する。
推奨ノッチフィルターは呼吸誘発運動アーティファクトを緩和し、呼吸周波数帯のバンドパスフィルタが呼吸誘発頭部運動を分離することを示唆する。
本研究では,推定頭部運動パラメータを統合することで静止状態BOLD-fMRIデータからRV推定精度を向上させることを目的とする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:58:20 GMT)
Large Language Models as a Tool for Mining Object Knowledge [0.4] 大きな言語モデルは、その答えの根拠の不透明さと、疑問が持たれたときに事実を議論する傾向があるため、信頼できるインテリジェントシステムとして不足する。
本稿では,日常の共通アーティファクトに関する明示的な知識について考察する。
約2,300個のオブジェクトとそのサブタイプの部品や材料に関するデータのリポジトリを作成します。
この知識マイニングへの貢献は、物体の構造と構成に関する推論に関するAI研究に有用であることが証明されるべきである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:46:02 GMT)
Benchmarking Defeasible Reasoning with Large Language Models -- Initial Experiments and Future Directions [0.4] 本稿では,様々なデファシブルなルールベースの推論パターンに対応するベンチマークを提案する。
我々は、デファシブルなルールを大規模言語モデルに適したテキストに変換することで、デファシブルな論理推論のための既存のベンチマークを修正した。
そこで我々は,ChatGPTを用いた非単調な規則に基づく推論の予備実験を行い,デファジブル論理で定義された推論パターンと比較した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:36:23 GMT)
Bayesian Inference Under Differential Privacy With Bounded Data [0.4] 我々は,事前分布を特定する際に,境界によって課される制約を考慮に入れることができることを示す。
我々は、デフォルト前のクラスのどのクラスが、微分プライベートリリースに対して有効な推論を生成するかについて、理論的および実証的な結果を提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:29:30 GMT)
GAN Based Top-Down View Synthesis in Reinforcement Learning Environments [0.4] 本研究は, GAN(Generative Adversarial Network)を用いた, 人工エージェントの初対人視点観測に基づくRL環境のトップダウンビューの学習について検討する。
プロジェクトの焦点は、RL環境のトップダウンビューを学ぶことです。強化学習のタスクには対処しません。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:44:23 GMT)
Hamiltonian non-Hermicity: accurate dynamics with the multiple Davydov D$_2$ Ansätze [0.3] 非エルミート系に対する複数のダヴィドフ・アンサツェによる時間依存性変動の数値的高精度な方法の適用性を示す。
以上の結果から,mDAは複雑な多体非エルミチアン系を探索するための強力な数値ツールとしての有用性が示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:44:57 GMT)
Synthetic Augmentation for Anatomical Landmark Localization using DDPMs [0.2] 拡散型生成モデルは近年,高品質な合成画像を生成する能力に注目が集まっている。
ランドマークマッチングのためのマルコフランダムフィールド(MRF)モデルと統計的形状モデル(SSM)を用いて,生成画像の品質を評価する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:09:38 GMT)
Stress Assessment with Convolutional Neural Network Using PPG Signals [0.2] 本研究は,Empatica E4 センサによって記録された生の PPG 信号を用いてストレスのある事象を評価する新しい手法の開発に焦点をあてる。
マルチレイヤパーセプトロン(MLP)と組み合わせた適応畳み込みニューラルネットワーク(CNN)を用いて、ストレスのある事象の検出を実現している。
この研究は、一般公開され、ウェアラブルストレスとエフェクト検出(WESAD)と名付けられたデータセットを使用する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:24:16 GMT)
Transformer based super-resolution downscaling for regional reanalysis: Full domain vs tiling approaches [0.2] 超解像 (SR) は高解像度の気候情報を生成するための有望なコスト効率のダウンスケーリング手法である。
本研究では,温度に着目したSRダウンスケーリング手法の相互比較を行った。
空間移動性を必要とするタイリング手法は,性能低下のコストがかかることを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:42:20 GMT)
Continuous Pupillography: A Case for Visual Health Ecosystem [0.2] 本稿では, 眼科領域における眼科診断の応用の可能性について紹介する。
私たちは、継続的な視線モニタリングを中心に展開する健康エコシステムのケースを作ろうとしています。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:05:06 GMT)
Spectrum Sharing using Deep Reinforcement Learning in Vehicular Networks [0.1] 本稿では、DQNモデルの有効性を実証し、スペクトル共有効率を向上させるためのいくつかの結果と分析を行った。
SARLモデルとMARLモデルの両方がV2V通信の成功率を示し、トレーニングが進むにつれてRLモデルの累積報酬が最大に達する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:59:59 GMT)
Anti-de Sitterian "massive" elementary systems and their Minkowskian and Newton-Hooke contraction limits [0.1] 1+3$-dimensional Anti-de Sitter (AdS$_4$) 時空における「重大」基本系の定義と性質について詳しく述べる。
我々は、AdS$_4$時空に居住する「大規模」初等システムの双対性を明らかにし、それぞれがミンコフスキー的な初等系の組み合わせである。
この双対性は、ダークマターの現在の存在を説明する上でのその役割を考慮し、量子状態において完全に重要である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:44:50 GMT)
An Exact Finite-dimensional Explicit Feature Map for Kernel Functions [0.1] 機械学習におけるカーネルメソッドは、2つのデータポイントを入力として取り、ヒルベルト空間にマッピングした後、実際にマッピングを計算せずに内部製品を返すカーネル関数を使用する。
本稿では任意のカーネル関数が与えられた場合、任意のカーネル関数に対して明示的で有限次元な特徴写像を導入する。
この明示的な写像の存在により、カーネルのトリックや双対表現を必要とせずに、カーネル化されたアルゴリズムを原始形式で定式化することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:55:11 GMT)
Metal Price Spike Prediction via a Neurosymbolic Ensemble Approach [0.1] 我々の研究は、複数のニューラルモデルとシンボリックエラー検出と修正規則を統合した、ニューロシンボリックアンサンブルフレームワークを導入している。
提案手法は,最大6.42%の精度向上,29.41%のリコール,13.24%のF1増加を実現している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:58:34 GMT)
Exploring Large Language Models for Hate Speech Detection in Rioplatense Spanish [0.1] ヘイトスピーチ検出は多くの言語変種、スラング、スラー、表現モダリティ、文化的ニュアンスを扱う。
本研究では,リオプラテンセ・スペイン語のヘイトスピーチ検出における大規模言語モデルの性能について,簡単な解析を行った。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:32:12 GMT)
Game Theory Meets Statistical Mechanics in Deep Learning Design [0.1] 本稿では,ゲーム理論の原理と統計力学の法則をシームレスに融合する新しいディープ表現を提案する。
単一の学習フレームワーク内で特徴抽出、次元縮小、パターン分類を行う。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:02:18 GMT)
Unifying Economic and Language Models for Enhanced Sentiment Analysis of the Oil Market [0.1] 原油は世界経済の重要な要素であり、経済動向、政治的出来事、自然災害など様々な要因の影響を受けている。
自然言語処理の最近の進歩は、イベントベースの分析に新たな可能性をもたらす。
原油市場に特化した微調整LMであるCrudeBERTを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:41:24 GMT)
UMambaAdj: Advancing GTV Segmentation for Head and Neck Cancer in MRI-Guided RT with UMamba and nnU-Net ResEnc Planner [0.0] 頭頸部癌(HNC)に対する適応放射線療法においてMRIが重要な役割を担っている。
原発性腫瘍 (GTVp) とリンパ節 (GTVn) の両方を含む総腫瘍容積 (GTV) を正確に区分することは依然として困難である。
最近の2つのディープラーニングセグメンテーションの革新は、効果的に長距離依存関係をキャプチャするUMambaと、多段階残差ブロックによる特徴抽出を強化するnnU-Net Residual (ResEnc)の2つの大きな約束を示している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:26:27 GMT)
Gradient Map-Assisted Head and Neck Tumor Segmentation: A Pre-RT to Mid-RT Approach in MRI-Guided Radiotherapy [0.0] 本研究は,頭頸部癌に対する pre-RT 腫瘍領域と局所勾配図を用いて,中RT 腫瘍セグメンテーションを増強することを目的としたものである。
プリRT画像からの腫瘍領域の勾配マップを算出し、ミッドRT画像に適用し、腫瘍境界勾配を改善する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:26:51 GMT)
Large Language Models and the Rationalist Empiricist Debate [0.0] 大規模言語モデルは合理主義を擁護すると主張する者もいる。
主張は、支持している経験主義の性質に依存する。
合理主義的な経験主義的議論に対するLLMの人間との関係は疑わしい。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:49:33 GMT)
Automatic Mapping of Anatomical Landmarks from Free-Text Using Large Language Models: Insights from Llama-2 [0.0] 解剖学的ランドマークは、ナビゲーションと異常検出のための医療画像に不可欠である。
現代の大言語モデル(LLM)は、自由テキストラジオグラフィーレポートでこれらのランドマークを画像データの対応する位置にマッピングすることを約束する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:48:28 GMT)
Pseudoentanglement from tensor networks [0.0] 擬似絡み合い状態は、その絡み合い構造を隠す能力によって定義される。
擬アンタングル状態の(擬)ランダムテンソルネットワークに基づく新しい構成を導入する。
この結果の顕著な応用は、角化エントロピーが龍高柳最小切断式に従う擬角化ホログラフィック状態の構築である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:42:29 GMT)
Pseudoentanglement from tensor networks [0.0] 擬似絡み合い状態は、その絡み合い構造を隠す能力によって定義される。
擬アンタングル状態の(擬)ランダムテンソルネットワークに基づく新しい構成を導入する。
この結果の顕著な応用は、角化エントロピーが龍高柳最小切断式に従う擬角化ホログラフィック状態の構築である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:42:29 GMT)
Vision-Based Adaptive Robotics for Autonomous Surface Crack Repair [0.0] 本稿では,ロボットを用いた表面き裂検出と修復のための適応型自律システムを提案する。
このシステムは、亀裂検出にRGB-Dカメラ、精密測定にレーザースキャナー、押出機と物質沈着用ポンプを使用する。
実世界の適用性とテストの再現性を確保するため, 3Dプリントによるクラック検体を用いた新しい検証手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:18:45 GMT)
Vaccinating Federated Learning for Robust Modulation Classification in Distributed Wireless Networks [0.0] 雑音レベルの異なる信号間の一般化性向上を目的とした新しいAMCモデルであるFedVaccineを提案する。
FedVaccineは、分割学習戦略を用いることで、既存のFLベースのAMCモデルの線形集約の限界を克服する。
これらの結果は、実用的な無線ネットワーク環境におけるAMCシステムの信頼性と性能を高めるためのFedVaccineの可能性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:48:47 GMT)
Unitary Multi-Margin BERT for Robust Natural Language Processing [0.0] 近年のディープラーニングに対する敵対的攻撃は、多くのミッションクリティカル自然言語処理(NLP)システムを搾取の危険にさらしている。
本稿では,計算効率のよい対角防御手法の欠如に対処するため,一元重みとマルチマージン損失を組み合わせることにより,変換器(BERT)からの双方向表現の堅牢性を大幅に向上させる,新しい普遍的手法を報告する。
統一マルチマージンBERT (UniBERT) は,攻撃後分類の精度を5.3%から73.8%向上させ,競争前の精度を維持した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:30:58 GMT)
Unifying error-correcting code/Narain CFT correspondences via lattices over integers of cyclotomic fields [0.0] シンクロトミック場$Q(zeta_p)$$(zeta_p=efrac2pi ip)$ for general prime $pgeq 3$。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:08:04 GMT)
Triplet: Triangle Patchlet for Mesh-Based Inverse Rendering and Scene Parameters Approximation [0.0] 逆レンダリングは、光、幾何学、テクスチャ、材料を含むシーンの物理的特性を導き出そうとする。
メッシュは、多くのシミュレーションパイプラインで採用されている伝統的な表現として、いまだに逆レンダリングのラディアンスフィールドに限られた影響しか示していない。
本稿では,これらのパラメータを包括的に近似するメッシュベースの表現であるTriangle Patchlet (abbr. Triplet) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:59:11 GMT)
Transfer Learning on Multi-Dimensional Data: A Novel Approach to Neural Network-Based Surrogate Modeling [0.0] 畳み込みニューラルネットワーク(CNN)はそのようなサロゲートモデルの基礎として人気を集めている。
本稿では,$d$次元問題と$d-1$次元近似の両方に対する数値解の混合によるCNN代理モデルのトレーニングを提案する。
転送学習を用いて,2種類のデータに対して,高密度な完全畳み込みエンコーダ・デコーダCNNを学習する多相フローテスト問題に対するアプローチを実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:07:48 GMT)
Towards aerodynamic surrogate modeling based on $β$-variational autoencoders [0.0] 次元還元法と回帰法を組み合わせたサーロゲートモデルは,高忠実度計算流体力学データの必要性を低減するために不可欠である。
飛行条件を考慮に入れた超音速翼の圧力分布(マッハ数と攻撃角度)を予測するために,潜時空間回帰に基づく代理モデルを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:57:33 GMT)
Towards Zero-Shot Camera Trap Image Categorization [0.0] 本稿では,カメラトラップ画像の自動分類に対する代替手法の探索について述べる。
すべての画像に対して単一のモデルを用いて最先端の分類器をベンチマークする。
次に,MegaDetectorを1つ以上の分類器とSegment Anythingを組み合わせて,位置特化オーバーフィッティングの低減効果を評価する。
最後に,DINOv2,BioCLIP,BLIP,ChatGPTなどの大規模言語モデルと基礎モデルを用いて,ゼロショットシナリオで2つのアプローチを提案し,検証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:44:58 GMT)
Towards Arbitrary QUBO Optimization: Analysis of Classical and Quantum-Activated Feedforward Neural Networks [0.0] 二次非拘束バイナリ最適化(QUBO)は、ロジスティクス、サプライチェーン、金融、化学、IT、エネルギー部門など、多くの産業や学術分野の中心に位置する。
これらの問題は通常、多数のバイナリ変数を最適化することを伴うため、正確な解を見つけることは指数関数的に困難である。
この課題に対処するため、任意のQUBO問題に対して強力なフィードフォワードニューラルネットワーク(FNN)を開発した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:55:16 GMT)
The rotating normal form of braids is regular [0.0] バーマン=コ=リー単体では、回転する正規形はデホーノイのブレイド秩序と強い関係を持つ。
我々は、n個のストランド上で回転する単語を認識する有限状態オートマトンを構築し、回転する正規形式が正則であることを証明した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:13:52 GMT)
The Optimization of Flux Trajectories for the Adiabatic Controlled-Z Gate on Split-Tunable Transmons [0.0] クビット周波数を調整した好ましい断熱軌道を決定する問題に対処する。
これらの量子プロセッサの特に最小限の非調和性は、量子ビット制御のよい候補となる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:17:01 GMT)
The Bayesian Confidence (BACON) Estimator for Deep Neural Networks [0.0] 本稿では、ディープニューラルネットワークのためのベイズ信頼度推定器(BACON)を紹介する。
BACONは、ResNet-18のSoftmaxと比較して85%の精度でECEとACEの校正誤差が優れている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:23:36 GMT)
Synthesis and Perceptual Scaling of High Resolution Natural Images Using Stable Diffusion [0.0] 我々は、6つのカテゴリから18個のオブジェクトを持つ写真リアル画像のカスタム刺激セットを開発する。
各オブジェクトに対して、知覚連続体に沿って順序付けられた10のグレードの変種を生成しました。
このイメージセットは、視覚知覚、注意、短期記憶、長期記憶の研究に注目されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:49:19 GMT)
Superconducting Quantum Simulation for Many-Body Physics beyond Equilibrium [0.0] 超伝導量子シミュレーションの基本概念と最近の実験的進歩について概説する。
非平衡多体系における開問題を真に解くための量子シミュレーション実験の展望について論じる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:27:01 GMT)
Stable Diffusion with Continuous-time Neural Network [0.0] 連続的に動作するセルラーニューラルネットワークは、拡散の概念を自然に受け入れている。
一般的に引用されるMNISTデータセットの離散時間と比較すると,高品質な画像の生成と,より高速なトレーニング時間の達成において,パフォーマンス上の優位性を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:55:05 GMT)
Snell's law in multirefringent systems [0.0] 2つ以上の伝播モードを持つ多屈折系が存在する。
このような系では、短波長限界における波動の伝播は異常因果の形成をもたらす。
我々の結果は、多屈折系におけるより複雑な現象を探索するためのさらなる研究を生み出すかもしれない。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:48:49 GMT)
Single-shot and measurement-based quantum error correction via fault complexes [0.0] フォトニクスは、スケーラブルなフォールトトレラント量子コンピュータへの実行可能なパスを提供する。
葉は耐障害性グラフ状態の構築である。
本稿では,動的量子誤り訂正プロトコルの表現であるフォールトコンプレックスを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:52:24 GMT)
Simulation of Quantum Computers: Review and Acceleration Opportunities [0.0] 量子コンピューティングは、現在の古典的コンピュータでは合理的に解決できない複雑な問題を解くことで、複数の分野に革命をもたらす可能性がある。
現在、量子アルゴリズムを開発し、テストする最も実践的な方法は、量子コンピュータの古典的なシミュレータを使うことである。
このレビューでは、量子コンピュータのコンポーネントの概要、これらのコンポーネントと量子コンピュータ全体をシミュレートできるレベル、および異なる最先端の加速アプローチの分析について紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:19:12 GMT)
Self-sustained optomechanical state destruction triggered by the Kerr nonlinearity [0.0] 空洞光学は、動く物体を量子場から探すことのできる、ユニークなプラットフォームを実装している。
共振器共振器の周波数を超える周波数でポンプトーンを駆動することで、大きな噴射力で自己持続振動をトリガーすることができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:34:11 GMT)
Self-Reflection in LLM Agents: Effects on Problem-Solving Performance [0.0] 大規模言語モデル(LLM)における自己回帰が問題解決性能に及ぼす影響について検討した。
各質問に対して, 誤りを反映するように8種類の自己反射型LLMエージェントを指示した。
このガイダンスを用いて、各自己表現エージェントは、同じ質問を再回答しようと試みた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 23:19:46 GMT)
Security Threats in Agentic AI System [0.0] AIシステムの複雑さと、大量のデータを処理して分析する能力が組み合わさって、データ漏洩や漏洩の可能性が高まる。
AIエージェントがより自律的に進化するにつれて、セキュリティ対策を回避または活用する能力が懸念される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:40:02 GMT)
Scalable Structure Learning for Sparse Context-Specific Systems [0.0] 数百の変数にスケールする文脈特化モデルを学習するためのアルゴリズムを提案する。
本手法は, 合成データと実世界の実例でよく動作することを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:42:33 GMT)
Sarcasm Detection in a Less-Resourced Language [0.0] 我々はSlovenianのような低リソースの言語のためのSarcasm検出データセットを構築した。
機械翻訳特化中型変圧器モデルと、非常に大きな生成言語モデルである。
以上の結果から,より大型のモデルの方がより小型モデルより優れており,アンサンブルにより肉腫検出性能がわずかに向上することが示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:10:59 GMT)
Risk Assessment for Autonomous Landing in Urban Environments using Semantic Segmentation [0.0] 都市環境のセマンティックセグメンテーションのために,最先端のビジュアルトランスフォーマーネットワークであるSegFormerを提案する。
提案手法はいくつかのケーススタディを通じて検証されている。
都市部における公民権の応用において、UAVの潜在能力を最大限に活用するのに役立つと信じている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:34:03 GMT)
Rescuing Counterspeech: A Bridging-Based Approach to Combating Misinformation [0.0] 我々は、ブリジングベースのランキングは、反音声の戦闘誤報を支援するための有望なアプローチであると主張している。
同意する傾向にあるユーザと、偽情報に同意しない傾向にあるユーザの両方に好まれる反響を識別することにより、ブリッジングは、誤報を信じる可能性が最も高いユーザを説得する反響を促進する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:02:39 GMT)
Reflection and Transmission Amplitudes in a Digital Quantum Simulation [0.0] 短距離ポテンシャルを持つ粒子の一次元散乱の反射・透過振幅をディジタル量子シミュレーションで測定する方法を示す。
これにより、1量子ビットの読み出しから、一般的な複素数である散乱振幅をトモグラフィ的に再構成することができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:08:11 GMT)
Realization of three and four-body interactions between momentum states in a cavity through optical dressing [0.0] レーザー冷却された原子の集合体を高精細な光学キャビティに利用して,有効$n=3$ボディハミルトン相互作用を観測した。
結果として生じる光子を介する相互作用は、$n>2$-body だけでなく、オール・トゥ・オール(-to-all) である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 00:29:45 GMT)
QueensCAMP: an RGB-D dataset for robust Visual SLAM [0.0] 本稿では,VSLAMシステムのロバスト性を評価するために設計された新しいRGB-Dデータセットを提案する。
データセットは、動的オブジェクト、動きのぼかし、様々な照明を備えた現実世界の屋内シーンで構成されている。
我々は、任意の画像にカメラ障害を注入するためのオープンソースのスクリプトを提供し、さらなるカスタマイズを可能にします。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:58:08 GMT)
Qtok: A Comprehensive Framework for Evaluating Multilingual Tokenizer Quality in Large Language Models [0.0] トークン化の品質は、モデルが多様な言語を効果的に扱う能力に大きな影響を及ぼす可能性がある。
Qtokは、多言語環境でのパフォーマンスに特に重点を置いて、トークン化ツールの品質を評価するために設計されたツールである。
Qtokはこれらのメトリクスを適用して、58の公開モデルから13の異なるトークン化子を評価し、異なる言語コンテキストでアウトプットを分析する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:34:34 GMT)
QPUF 2.0: Exploring Quantum Physical Unclonable Functions for Security-by-Design of Energy Cyber-Physical Systems [0.0] 量子デコヒーレンス、絡み合い、重ね合わせに基づく量子論理ゲートを用いた新しいQPUFアーキテクチャを導入する。
提案したQPUF設計はIBMとGoogleの量子システムとシミュレータで評価される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:04:45 GMT)
Polarization-entangled photon pair source using beam displacers and thin crystals [0.0] ビーム転位器を用いた偏光共役光子対源の実験的実装について述べる。
ダウンコンバージョンされた光子は、非退化および型0過程において自発的なパラメトリックなダウンコンバージョンによって放出される。
我々の情報源はまた、多数の空間モードを利用して、量子イメージングの応用に薄い結晶を使用している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:12:19 GMT)
Phase vs coin vs position disorder as a probe for the resilience and revival of single particle entanglement in cyclic quantum walks [0.0] 単一粒子エンタングルメント(SPE)を示す量子状態は、それらの多粒子アナログよりも堅牢に量子情報をエンコードし、処理することができる。
この手紙は、離散時間量子ウォークによる位相、コイン、位置障害を奇数および巡回グラフ上で調べ、それらのSPEへの影響を研究する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:15:48 GMT)
Personalized Prediction Models for Changes in Knee Pain among Patients with Osteoarthritis Participating in Supervised Exercise and Education [0.0] 膝関節症(英語: Knee osteoarthritis, OA)は、運動性障害と生活の質を低下させる慢性疾患である。
OA症状の痛みと機能的制限を管理するための運動療法と患者教育のメリットが証明されているにもかかわらず、これらの戦略は、しばしば未利用である。
予測を改善するには、GLA:D以外の新しい変数が必要である。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:15:01 GMT)
Parsing Akkadian Verbs with Prolog [0.0] 本稿では,Prologで実装された接尾辞の追加が可能な,アッカディアンにおける有限動詞形式の構文解析・生成システムについて述べる。
記述された研究は、D, N, G の幹を解釈するフレームワークとエンジンと、アクセプティブ、ディベート、そして通気の終端を提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:34:30 GMT)
Parameter optimization comparison in QAOA using Stochastic Hill Climbing with Random Re-starts and Local Search with entangled and non-entangled mixing operators [0.0] 本研究では,Hill Climbing with Random Restarts (SHC-RR) の有効性を検討した。
以上の結果から,SHC-RRはLSアプローチよりも優れており,より単純な最適化機構にもかかわらず優れた有効性を示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:57:16 GMT)
PRefLexOR: Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning and Agentic Thinking [0.0] PRefLexORは、好みの最適化と強化学習の概念を組み合わせることで、モデルを自己学習可能にする。
本研究は, 生体材料科学の応用に焦点をあて, 様々なケーススタディでその手法を実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:46:26 GMT)
Optomechanical self-organization in a mesoscopic atom array [0.0] 空間自己組織化相転移のメソスコピックなシグネチャを光学キャビティ内で10から22原子の配列で決定的に生成した。
原子-空洞相互作用の精密な工学により、臨界挙動が原子数にどのように依存するかを明らかにする。
この研究は、メソスコピック系における相転移の粒子数および時間分解特性を求めるための扉を開く。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:18:15 GMT)
Option pricing under stochastic volatility on a quantum computer [0.0] We developed quantum algorithm for pricing Asian and barrier options under the Heston model。
これらのアルゴリズムは、微分方程式と量子振幅法をうまく組み合わせた数値計算法に基づいている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:49:02 GMT)
Optimizing Multi-Task Learning for Accurate Spacecraft Pose Estimation [0.0] 本稿では,単眼画像を用いた衛星ポーズ推定のためのマルチタスク学習フレームワークにおけるタスクの影響について検討する。
直接ポーズ推定やキーポイント予測,オブジェクトの局所化,セグメンテーションといったタスクをひとつのネットワークに統合することにより,タスク間の相互影響を評価することを目的とする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:44:15 GMT)
On A Scale From 1 to 5: Quantifying Hallucination in Faithfulness Evaluation [0.0] 幻覚は自然言語生成(NLG)においてポピュラーな話題となっている。
本稿では,ガイド付きNLGにおける信頼度の自動評価について検討する。
我々は,ルーブリックステンプレートを開発し,大規模言語モデル(LLM)を用いて,その生成を定量的に評価した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:36:17 GMT)
Nonlinearity of transparent SNS weak links decreases sharply with length [0.0] 弱リンクの有限長は、その零長極限と比較して非線形性を強く抑制することを示す。
我々は、非相互作用ジョセフソン接合に対して、非調和性はゼロと最大負の値の間に有界であると予想する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:51:37 GMT)
Nonlinearity of transparent SNS weak links decreases sharply with length [0.0] 弱リンクの有限長は、その零長極限と比較して非線形性を強く抑制することを示す。
我々は、非相互作用ジョセフソン接合に対して、非調和性はゼロと最大負の値の間に有界であると予想する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:51:37 GMT)
Nonlinear bayesian tomography of ion temperature and velocity for Doppler coherence imaging spectroscopy in RT-1 [0.0] 我々はコヒーレンスイメージング分光法(CIS)のための新しいベイズトモグラフィー手法を提案する。
プラズマ中のイオン温度と速度分布を同時に再構成する。
この研究はCISトモグラフィーの範囲を大きく広げ、プラズマ診断のための堅牢なツールを提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 10:07:07 GMT)
Noncommuting charges can remove non-stationary quantum many-body dynamics [0.0] 固有状態熱化仮説(ETH)に基づく局所観測値の削減により,非可換電荷が熱化を促進できることを示す。
以上の結果から,ETHによる局所観測値の削減により,非可換電荷が熱化を促進できることが示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:59:52 GMT)
Non-Universality from Conserved Superoperators in Unitary Circuits [0.0] 量子制御理論における重要な結果は、2ドルの局所ユニタリゲートの「ユニバーサリティ」である。
近年の研究では、普遍性は対称性の存在下で崩壊する可能性があることが示されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:55:01 GMT)
NoCodeGPT: A No-Code Interface for Building Web Apps with Language Models [0.0] ChatGPTはアプリケーションを構築するためのユーザフレンドリーなインターフェースを提供していません。
NoCodeGPTは、言語モデルに送信されたプロンプトを有用なコンテキスト情報で計測する。
シンプルなバージョン管理機能があり、ユーザーはすぐに以前のバージョンに戻すことができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:08:46 GMT)
Neural-based Control for CubeSat Docking Maneuvers [0.0] 本稿では、強化学習(RL)によって訓練されたニューラルネットワーク(ANN)を用いた革新的なアプローチを提案する。
提案した戦略は実装が容易であり、経験から制御ポリシーを学習することで、高速な適応性と障害に対する堅牢性を提供する。
本研究は、宇宙機RVDの適応性と効率の確保におけるRLの有効性を強調し、今後のミッションへの期待について考察した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:05:46 GMT)
Mitigating higher-band heating in Floquet-Hubbard lattices via two-tone driving [0.0] 高エネルギーレベルに対する多光子共鳴は、強い駆動量子系におけるフロック加熱の避けられない源である。
我々は、最近開発されたマルチ光子共鳴の2トーンアプローチを、ハバード系における揺らぎ格子に拡張する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:21:41 GMT)
Mini-Omni2: Towards Open-source GPT-4o with Vision, Speech and Duplex Capabilities [0.0] Mini-Omni2はヴィソインとオーディオクエリにリアルタイム、エンドツーエンドの音声応答を提供するビジュアルオーディオアシスタントである。
限られたデータセットでトレーニングした後、言語モデルでマルチモーダル入力と出力を処理できる3段階のトレーニングプロセスを提案する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:19:56 GMT)
Microwave Cavity Resonator with Extreme Dispersion to Enable a Test of the Electric-Scalar Aharonov-Bohm Effect [0.0] 干渉計の構成は、共振器内の電界と電位の操作を可能にする。
25dBの共振周波数での電界抑制が達成され,同時に時間変動電位の振幅も高められた。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:59:34 GMT)
Microwave Cavity Resonator with Electromagnetic Induced Absorption to Enable a Test of the Electric-Scalar Aharonov-Bohm Effect [0.0] この研究は、電場や磁気ベクトルポテンシャルを伴わずに、電気スカラーのアハロノフ・ボーム効果を試験できる機能を備えた実験的なセットアップを提示する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:59:34 GMT)
Mechanistic interpretability of large language models with applications to the financial services industry [0.0] 我々は、金融サービスアプリケーションで使用する大規模言語モデルの内部動作に光を当てるために、機械的解釈可能性の使用の先駆者です。
特に,フェアレンディング法違反の可能性を特定するために,GPT-2スモールの注意パターンについて検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 02:40:53 GMT)
Mapping acceptance: micro scenarios as a dual-perspective approach for assessing public opinion and individual differences in technology perception [0.0] 本稿では,様々な技術や概念にまたがるメンタルモデルと社会的受容を評価する統合的手法として,マイクロシナリオを紹介する。
各参加者の平均評価は個人差と見なすことができ、技術やトピックにわたって反射的な測定を提供する。
本稿では,技術発展と社会的認知のギャップを埋めることを目的として,技術開発と政策立案におけるより深い意思決定のためのツールを提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:32:45 GMT)
Many-body quantum resources of graph states [0.0] 複素多体系の非古典的相関を特徴づけることは量子技術の重要な部分である。
我々は、辺を持つ星グラフ状態、ターアングラフ、$r$ary木グラフ、および正方形格子クラスタ状態の4つの位相を考える。
グラフ状態における多体絡み合う深さは、局所変換やグラフ同型では同値でない146$クラスの最大8$ qubitsで特徴づける。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 12:05:19 GMT)
Local Properties of the Rapidity Distribution in the Lieb-Liniger Model [0.0] We study the rapidity distribution in the Lieb-Liniger model and derived exact relations for its derivatives at the Fermi level。
後者は、低温および任意の相互作用で系の自由エネルギーを解析的に扱うことができる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:30:27 GMT)
Leveraging Spatial Attention and Edge Context for Optimized Feature Selection in Visual Localization [0.0] 画像の情報領域を選択的にターゲットするアテンションネットワークを導入する。
このネットワークを用いて、特徴選択プロセスを改善し、エッジ検出と組み合わせることで、最高の特徴を識別する。
提案手法を屋外ベンチマークデータセットで検証し,従来の手法と比較して優れた結果を示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:00:51 GMT)
Language Models as Semiotic Machines: Reconceptualizing AI Language Systems through Structuralist and Post-Structuralist Theories of Language [0.0] 本稿では,大規模言語モデル(LLM)を理解するための新しいフレームワークを提案する。
LLMは言語自体のモデルとして理解されるべきであり、ジャックの「書き方」(l'ecriture)の概念と一致している、と私は主張する。
私は、Sausure の Saussure 批判を LLM でモデル化されたオブジェクトとして位置づけ、機械の 'mind' を統計的近似として提供します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:45:54 GMT)
LU-PZE: Lund University Pole-Zero Explorer [0.0] LU-PZEは制御理論に関する基本的な概念を記述するためのインタラクティブツールである。
このツールは、ダイナミックな割り当てとクイズで教育を楽しませる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:26:37 GMT)
LEGAL-UQA: A Low-Resource Urdu-English Dataset for Legal Question Answering [0.0] LEGAL-UQAはパキスタンの憲法から派生した最初のウルドゥー語法的問合せデータセットである。
このパラレル・イングリッシュ・ウルドゥデータセットは、619の質問応答ペアを含み、それぞれが対応する法的記事コンテキストを持つ。
我々は、OCR抽出、手動精細化、GPT-4による翻訳およびQAペアの生成を含むデータセット作成プロセスについて述べる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:14:45 GMT)
Kallini et al. (2024) do not compare impossible languages with constituency-based ones [0.0] 言語理論の中心的な目的は、「可能な人間言語」という概念を特徴づけることである。
NLPアプリケーションにおける最近の大規模言語モデル(LLM)は、LLMがこの目標を満たす計算機器である可能性を高める。
私は、この矛盾を説明し、根底にある問題を適切にテストする比較を構築するためのいくつかの方法を提案します。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:16:30 GMT)
Is the Wavefunction Already an Object on Space? [0.0] 波動関数は3$次元の空間ではなく3$$次元の構成空間上で定義される。
波動関数は、実際には、宇宙上の真の物体であることが示される。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 11:35:07 GMT)
Is Semantic Chunking Worth the Computational Cost? [0.0] 本研究は,3つの共通検索タスクを用いた意味的チャンキングの有効性を体系的に評価する。
その結果,セマンティックチャンキングに伴う計算コストは,一貫した性能向上によって正当化されないことがわかった。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:53:48 GMT)
Is ETHICS about ethics? Evaluating the ETHICS benchmark [0.0] 道徳理論,心理学,迅速な評価に基づいて,ETHICSベンチマークの有効性を問う。
倫理の明確な理解と経験的現象との関連性を持つことは、AIの倫理評価の有効性の鍵となる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 20:10:38 GMT)
Investigating Sensitive Directions in GPT-2: An Improved Baseline and Comparative Analysis of SAEs [0.0] Sparse Autoencoder (SAE) 再構成誤差に対するKLのばらつきは, 改善されたベースラインと比較して, もはや病理学的に高くはない。
また,SAEが発見する特徴方向が,SAEの疎度に依存するモデル出力に与える影響も示した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:32:35 GMT)
Increasing the clock speed of a thermodynamic computer by adding noise [0.0] 得られた熱力学コンピュータプログラムは、元のコンピュータプログラムと等価であるが、クロック速度は高い。
このアプローチは、計算の忠実性を保ちながら熱力学計算の速度を向上する方法を提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:08:22 GMT)
Incentive Non-Compatibility of Optimistic Rollups [0.0] 本稿では,プレイヤーの期待する行動とインセンティブが一致していないことを示す,楽観的なロールアップのモデルを提案する。
我々のモデルに照らされた潜在的な解決策について議論する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:53:43 GMT)
Implementation of EMR System in Indonesian Health Facilities: Benefits and Constraints [0.0] 本稿では,インドネシアの医療施設における電子カルテ(EMR)の広範な実装について述べる。
EMR導入の原動力、特に政府の規制の役割を調べ、これらのデジタルシステムへの移行においてクリニック所有者や医療提供者が直面する課題に対処する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:42:56 GMT)
Galois Symmetries in the Classification and Quantification of Quantum Entanglement [0.0] 本稿では,ガロア群との深い関係を明らかにすることによって,絡み合い分類の新しい解釈を提案する。
この研究はガロア理論の数学的エレガンスを、量子力学の複雑さ、量子コンピューティングと情報理論の進歩への道を開くことで橋渡しする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:34:57 GMT)
Galois Symmetries in the Classification and Quantification of Quantum Entanglement [0.0] 本稿では,ガロア群との深い関係を明らかにすることによって,絡み合い分類の新しい解釈を提案する。
この研究はガロア理論の数学的エレガンスを、量子力学の複雑さ、量子コンピューティングと情報理論の進歩への道を開くことで橋渡しする。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 05:34:57 GMT)
GECTurk WEB: An Explainable Online Platform for Turkish Grammatical Error Detection and Correction [0.0] 我々は、最も一般的なトルコ文字の誤りを検出し、修正できるWebベースのシステムであるGECTurk WEBを紹介した。
提案システムは88,3システムのユーザビリティスコアを達成し,文法規則の学習・記憶を支援する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 08:13:54 GMT)
Five Years of COVID-19 Discourse on Instagram: A Labeled Instagram Dataset of Over Half a Million Posts for Multilingual Sentiment Analysis [0.0] 本稿では、2020年1月から2024年9月までに発行された新型コロナウイルスに関する500,153件のInstagram投稿の多言語データセットを示す。
第二に、2020年から2024年にかけての感情分析の結果を示す。
第3に,言語固有の感情分析の知見も提示する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:11:21 GMT)
Five Years of COVID-19 Discourse on Instagram: A Labeled Instagram Dataset of Over Half a Million Posts for Multilingual Sentiment Analysis [0.0] 本稿では、2020年1月から2024年9月までに発行された新型コロナウイルスに関する500,153件のInstagram投稿の多言語データセットを示す。
第二に、2020年から2024年にかけての感情分析の結果を示す。
第3に,言語固有の感情分析の知見も提示する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:11:21 GMT)
Five Years of COVID-19 Discourse on Instagram: A Labeled Instagram Dataset of Over Half a Million Posts for Multilingual Sentiment Analysis [0.0] 本稿では、2020年1月から2024年9月までに発行された新型コロナウイルスに関する500,153件のInstagram投稿の多言語データセットを示す。
第二に、2020年から2024年にかけての感情分析の結果を示す。
第3に,言語固有の感情分析の知見も提示する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 14:11:21 GMT)
Facing Identity: The Formation and Performance of Identity via Face-Based Artificial Intelligence Technologies [0.0] アナログ・フェイスを駆使しながら既存の施設文化を築き上げていく「ポスト・フェイス」技術の時代が今あることを提案する。
実際の顔の代わりにモーションキャプチャーされたアバターを使用するオンラインストリーマーであるVTubersとのインタビュースタディを提案することで、私は締めくくります。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:14:04 GMT)
Extreme time extrapolation capabilities and thermodynamic consistency of physics-inspired Neural Networks for the 3D microstructure evolution of materials via Cahn-Hilliard flow [0.0] 畳み込みリカレントニューラルネットワーク(CRNN)は,3次元のスピノーダル分解過程の進化を再現するために訓練される。
特殊で物理学に触発されたアーキテクチャは、予測された進化と基礎的な真実とを密に一致させることが証明されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 16:20:44 GMT)
Exploring the impact of virtual reality user engagement on tourist behavioral response integrated an environment concern of touristic travel perspective: A new hybrid machine learning approach [0.0] 新しいアトラクションの方法は、訪問者に仮想現実(VR)などのツアー製品やサービスを提供する魅力的なサイトによって適応される傾向にある。
我々は,PLS-SEMとAIニューラルネットワーク(ANN)のハイブリッド型最小二乗構造方程式モデルを用いて,理論的枠組みを開発し,検証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:39:59 GMT)
Exploring Changes in Nation Perception with Nationality-Assigned Personas in LLMs [0.0] LLMとペルソナの組み合わせは、西欧諸国が好む傾向にある。
国民的パーソナリティは、LLMの行動にもっと焦点を当て、国家的パーソナの地域をより好意的に扱うように促す。
東ヨーロッパ、ラテンアメリカ、アフリカ諸国は、異なる国籍の人格によってより否定的に扱われる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:14:20 GMT)
Explainable Binary Classification of Separable Shape Ensembles [0.0] 材料科学者は、マイクログラフのイメージセグメンテーションを利用して、材料ミクロ構造の粒界を表す大きな曲線アンサンブルを作成する。
分割された曲線の大規模なアンサンブルに対して,新しいパターン認識形式と推論を用いて,この応用を推し進める。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 19:42:47 GMT)
Exact Dynamics and Shortcuts to Adiabaticity in the Tomonaga-Luttinger Liquid [0.0] 友長・ラッティンガー液体(TLL)によるギャップレス多体量子系の制御の進展を報告する。
本手法は, 駆動されたTLLの最後の非断熱残エネルギーをキャンセルする, 断熱のショートカットを行うのに有用であることを示す。
第2に、線形ランプやスムーズなプロトコルを含む様々な駆動スキームを有限時間で解析するために、この枠組みを適用した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:02:10 GMT)
Evaluating Utility of Memory Efficient Medical Image Generation: A Study on Lung Nodule Segmentation [0.0] 本研究は,合成医用画像を生成するためのメモリ効率のパッチワイド拡散確率モデル(DDPM)を提案する。
本手法は, メモリ制約を効率的に管理しながら, 結節分割による高能率合成画像を生成する。
本手法は,合成データのみに基づくセグメンテーションモデルのトレーニングと,合成画像を用いた実世界のトレーニングデータの拡張の2つのシナリオで評価する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:20:57 GMT)
Evaluating Cascaded Methods of Vision-Language Models for Zero-Shot Detection and Association of Hardhats for Increased Construction Safety [0.0] 本稿では、ゼロショット検出のための視覚言語モデル(VLM)と、建設安全性を高めるためのハードハットの関連性を評価する。
本研究では,実際の建設現場画像におけるハードハット検出のための基礎モデル,特にOWLv2の適用性について検討する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 04:42:10 GMT)
ERAS: Evaluating the Robustness of Chinese NLP Models to Morphological Garden Path Errors [0.0] 我々は,中国のNLPモデルは形態的庭道誤差に弱いことを示す。
以上の結果から,漢文のモデルの分節化は,形態素構文的文脈を考慮にいられないことが多いことが示唆された。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 21:35:20 GMT)
Dynamical weight reduction of Pauli measurements [0.0] 我々は,高重量パウリ測定をより小さな重量の一連の測定に分解する動的重量減少(DWR)スキームを定式化した。
一定の時間または一定の空間オーバーヘッドを達成する3つの例を強調します。
本研究は,ZXダイアグラムの変形を用いた低ウェイト測定で測定回路をコンパイルする際の柔軟性を示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:03:33 GMT)
Discovering Elementary Discourse Units in Textual Data Using Canonical Correlation Analysis [0.0] 本研究は,初等談話単位(EDU)の同定におけるカノニカル相関分析(CCA)の可能性を示すことによって,さらに一歩進める。
モデルは単純で、線形で、適応可能で、言語に依存しないため、特にラベル付きトレーニングデータが不足している場合、理想的なベースラインとなる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:52:13 GMT)
Dialects for CoAP-like Messaging Protocols [0.0] 我々は、CoAPメッセージングプロトコルを調査し、異なる脆弱性を定式化する2つの攻撃モデルを定義する。
CoAPプロトコル、方言、アタックモデルは、書き換えロジックシステムMaudeで形式化されている。
いくつかのケーススタディでは、この方言を適用した際の脆弱性と効果が報告されている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:39:03 GMT)
Depth Estimation From Monocular Images With Enhanced Encoder-Decoder Architecture [0.0] 本稿では,エンコーダデコーダアーキテクチャを用いた新しい深層学習手法を提案する。
Inception-ResNet-v2モデルはエンコーダとして利用される。
NYU Depth V2データセットの実験結果は、我々のモデルが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:09:12 GMT)
Delta-ICM: Entropy Modeling with Delta Function for Learned Image Compression [0.0] コンピュータビジョンの研究が進むにつれて、画像符号化(ICM)の重要性が高まっている。
認識モデルの需要は一般大衆の間で急速に増加している。
ICM技術を使用して、コンシューマデバイスとクラウドAI間でイメージデータを交換することは、可能な解決策のひとつだ。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:45:50 GMT)
Delta-ICM: Entropy Modeling with Delta Function for Learned Image Compression [0.0] コンピュータビジョンの研究が進むにつれて、画像符号化(ICM)の重要性が高まっている。
認識モデルの需要は一般大衆の間で急速に増加している。
ICM技術を使用して、コンシューマデバイスとクラウドAI間でイメージデータを交換することは、可能な解決策のひとつだ。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:45:50 GMT)
Context is Key(NMF): Modelling Topical Information Dynamics in Chinese Diaspora Media [0.0] KeyNMFは、トランスフォーマーベースのコンテキスト埋め込みモデルを使用した静的および動的トピックモデリングの新しいアプローチである。
我々は、5つのニュースサイトのデータにKeyNMFを適用し、2024年の欧州議会選挙までの期間に焦点を当てる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 17:59:52 GMT)
Coherent Coupling of a Diamond Tin-Vacancy Center to a Tunable Open Microcavity [0.0] 本研究では, 単一Tin-Vacancy中心をベースとした量子フォトニックインタフェースを, 調整可能なオープンマイクロキャビティに結合したマイクロメートルのダイヤモンド膜に提案する。
我々は、パーセル還元励起状態寿命当たりの低入射光子数に対して50パーセントの伝送ディップを観察する一方、エミッタは高い光子数で飽和しているため、ディップは消滅する。
この研究は、先進的な量子光学の実験と、固体量子ビットを用いた量子ネットワークへの実証実証のための多用途でチューニング可能なプラットフォームを確立する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:10:50 GMT)
Cancellation of phonon hopping in trapped ions by modulation of the trap potential [0.0] トラップされたイオンの局所モードは、アナログ量子シミュレータとデジタル量子コンピュータを構築するために使用できる。
そこで本稿では,位相シフトゲートのシーケンスを適用して,与えられた局所モードの集合間のフォノンホッピングをキャンセルする手法を提案する。
本手法は、ボソニック系のシミュレーションや、トラップイオンを用いた量子コンピューティングの連続変数符号化に適用できる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:46:12 GMT)
Bridging magic and non-Gaussian resources via Gottesman-Kitaev-Preskill encoding [0.0] 連続変数系における非安定化状態と非ガウス状態の基本的な関係を確立する。
符号化されたGKP状態に対する連続変数ウィグナー関数の負性は、マジック測度と一致することを示す。
また、安定化器 R'enyi エントロピーの連続変数表現も提供する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:17:41 GMT)
Autonomous Stabilization of Floquet States Using Static Dissipation [0.0] 量子システムの特性を強い周期駆動を用いて修正するフロケット工学は、原子および凝縮物質系において欠かせない道具である。
本稿では、Floquetシステムの大規模クラスを所望の状態に冷却するために、駆動系と損失補助体の静的結合を利用する単純な自律スキームについて述べる。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:00:02 GMT)
AssemAI: Interpretable Image-Based Anomaly Detection for Manufacturing Pipelines [0.0] 製造パイプラインにおける異常検出は、産業環境の複雑さと変動性によって強化され、依然として重要な課題である。
本稿では,スマート製造パイプラインに適した解釈可能な画像ベース異常検出システムAssemAIを紹介する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 15:53:15 GMT)
Advancements In Heart Disease Prediction: A Machine Learning Approach For Early Detection And Risk Assessment [0.0] 本稿では,臨床データを用いた心疾患のリスク予測における機械学習モデルの役割,関連性,効率性を理解し,評価し,分析する。
Support Vector Machine (SVM) は91.51%の精度を示し、予測能力の観点から評価されたモデル間にその優位性を確認している。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 22:32:19 GMT)
AT-RAG: An Adaptive RAG Model Enhancing Query Efficiency with Topic Filtering and Iterative Reasoning [0.0] 本稿では,効率的な文書検索と推論のためのトピックモデリングを取り入れた新しい多段階RAGAT-RAGを提案する。
BERTopicを用いてクエリにトピックを動的に割り当て,検索精度と効率を向上する。
その結果,既存手法に比べて精度,完全性,妥当性が著しく向上した。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 01:57:56 GMT)
A negativity-based non-convex entanglement monotone characterizing continuous-variable entanglement swapping [0.0] 量子ネットワーク(QN)は、遠距離に絡み合った状態を分散することにより、近い将来に様々な量子技術の性能を高めることを約束する。
最初のステップは、情報的かつ計算的に大規模に抽出可能な新しい絡み合い尺度を開発することである。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 09:11:20 GMT)
A long-distance quantum-capable internet testbed [0.0] 本稿では,新しい物理中心のスタックベースの量子ネットワークパラダイムを用いた,量子可能なインターネットプロトタイプの実装について述べる。
この概念を,ストーニーブルック大学とブルックヘイブン国立研究所の大規模量子ネットワークを用いて実証する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 18:38:45 GMT)
A SARS-CoV-2 Interaction Dataset and VHH Sequence Corpus for Antibody Language Models [0.0] AVIDa-SARS-CoV-2は重鎖抗体(VHH)相互作用の抗原可変ドメインを特徴とするデータセットである。
抗体言語モデルの事前学習データセットであるVHHCorpus-2Mには200万以上のVHH配列が含まれている。
VHHCorpus-2Mおよび既存の一般タンパク質および抗体特異的言語モデルを用いたVHHBERTを用いたSARS-CoV-2-VHH結合予測のためのベンチマーク結果を報告する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:35:31 GMT)
A Numerical Study of Chaotic Dynamics of K-S Equation with FNOs [0.0] FNOを用いた2次元倉本-シヴァシンスキー方程式のカオス状態における力学のシミュレーションを実証する。
出力を2dパワースペクトルや放射パワースペクトルなどの測定値を用いて比較する。
フーリエモードのカットオフが十分に高く保たれた場合、FNOは2d K-S方程式のカオス状態のダイナミクスを捕捉する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 06:36:33 GMT)
A Lattice-based Method for Optimization in Continuous Spaces with Genetic Algorithms [0.0] 本研究は,連続決定変数に多次元制約を組み込む格子に基づく新しい手法を提案する。
提案手法は、連続決定変数のクロスオーバーのための確立された転写技術を統合する。
ドメイン知識を活用し、デザイン空間の実行可能な領域に向けて探索プロセスを導くことを目的としている。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 03:14:09 GMT)
A Hodge Theory for Entanglement Cohomology [0.0] 量子絡み合いを記述するホモロジー代数の応用を探求し、拡張する。
我々は、Hodge星作用素、内積、共微分、およびラプラシアン(英語版)(Laplacian)の類似体を、絡み合い$k$-形式のために構成する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 13:09:56 GMT)
A First Principles Numerical Demonstration of Emergent Decoherent Histories [0.0] 一般確率行列モデルにおいて、遅くて粗い観測値に対するデコヒーレンス(decoherence)の頑健な出現を見出した。
系の粒子数の関数として、コヒーレント効果の指数的抑制を予想し、観測する。
論文参考訳(メタデータ) (Wed, 16 Oct 2024 07:26:57 GMT)