AIM 2024 Challenge on Video Saliency Prediction: Methods and Results [105.1] 本稿では,AIM 2024におけるビデオ・サリエンシ予測の課題について概説する。
参加者の目標は、提供されたビデオシーケンスのセットに対して正確な精度マップを予測する方法を開発することであった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:59:22 GMT)
Multi-modal Auto-regressive Modeling via Visual Words [96.3] 本稿では,視覚的特徴を大規模多モードモデルの語彙上の確率分布にマッピングする視覚トークンの概念を提案する。
さらに、LMM内の意味空間における視覚的特徴の分布と、視覚情報を表現するためにテキスト埋め込みを使用することの可能性について検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:51:01 GMT)
Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models [89.1] モデル編集は、大きな言語モデル(LLM)の振る舞いを、特定の知識に関連して正確に変更することを目的としている。
このアプローチは、LLMにおける幻覚や時代遅れの情報の問題に対処する上で有効であることが証明されている。
しかし、医療分野における知識の修正にモデル編集を用いることの可能性はほとんど解明されていない。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:09:00 GMT)
A Controlled Study on Long Context Extension and Generalization in LLMs [85.5] 広義のテキスト理解とテキスト内学習は、完全な文書コンテキストを利用する言語モデルを必要とする。
長期コンテキストモデルを直接訓練する際の実装上の課題のため、長期コンテキストを扱うためにモデルを拡張する多くの方法が提案されている。
我々は,一貫したベースモデルと拡張データを利用して,標準化された評価による拡張メソッドの制御プロトコルを実装した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:39:07 GMT)
Toward Efficient Visual Gyroscopes: Spherical Moments, Harmonics Filtering, and Masking Techniques for Spherical Camera Applications [83.9] 視覚ジャイロスコープは、画像を通してカメラの回転を推定する。
従来のRGBカメラに比べて視野が広い全方位カメラの統合は、より正確で堅牢な結果をもたらすことが証明されている。
本稿では,効率的なマルチマスク・フィルタ回転エステータと学習に基づく最適化を組み合わせた,新しい視覚ジャイロスコープを導入することで,これらの課題に対処する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:07:13 GMT)
A Realistic Simulation Framework for Analog/Digital Neuromorphic Architectures [73.7] ARCANAは、混合信号ニューロモルフィック回路の特性を考慮に入れたスパイクニューラルネットワークシミュレータである。
その結果,ソフトウェアでトレーニングしたスパイクニューラルネットワークの挙動を,信頼性の高い推定結果として提示した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:16:46 GMT)
Towards Unified 3D Object Detection via Algorithm and Data Unification [70.3] 我々は、最初の統一型マルチモーダル3Dオブジェクト検出ベンチマークMM-Omni3Dを構築し、上記のモノクロ検出器をマルチモーダルバージョンに拡張する。
設計した単分子・多モード検出器をそれぞれUniMODEとMM-UniMODEと命名した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:55:21 GMT)
The BRAVO Semantic Segmentation Challenge Results in UNCV2024 [68.2] 我々は,(1)モデルが様々な摂動にさらされたときの精度とキャリブレーションを反映したセマンティック信頼性,(2)トレーニング中に未知のオブジェクトクラスを検出する能力を測定するOOD信頼性の2つのカテゴリを定義した。
その結果、大規模事前学習と最小限のアーキテクチャ設計が、堅牢で信頼性の高いセマンティックセグメンテーションモデルを開発する上で重要であるという興味深い洞察が浮かび上がっている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:17:30 GMT)
MaterialFusion: Enhancing Inverse Rendering with Material Diffusion Priors [67.7] 本稿では,テクスチャと材料特性に先立って2Dを組み込んだ,従来の3次元逆レンダリングパイプラインであるMaterialFusionを紹介する。
本稿では,2次元拡散モデルであるStableMaterialについて述べる。
種々の照明条件下で, 合成および実物体の4つのデータセット上でのMaterialFusionの照度特性を検証した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:59:06 GMT)
AIM 2024 Sparse Neural Rendering Challenge: Methods and Results [64.2] 本稿では,ECCV 2024と共同で開催されるAIM(Advanceds in Image Manipulation)ワークショップの一部であるスパースニューラルレンダリングの課題についてレビューする。
この課題は、スパース画像から多様なシーンを合成する新しいカメラビューを作ることである。
参加者は、Pak Signal-to-Noise Ratio (PSNR) 測定によって測定された地中真実像に対する客観的忠実度を最適化するよう依頼される。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:17:40 GMT)
Mixture of Efficient Diffusion Experts Through Automatic Interval and Sub-Network Selection [64.0] 本稿では, 事前学習した拡散モデルを用いて, 効率の良い専門家の混入を図り, サンプリングコストを削減することを提案する。
提案手法であるDiffPruningの有効性を,複数のデータセットで示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:27:26 GMT)
CamLoPA: A Hidden Wireless Camera Localization Framework via Signal Propagation Path Analysis [59.9] CamLoPAは、トレーニング不要の無線カメラ検出およびローカライゼーションフレームワークである。
低コストの商用オフ・ザ・シェルフ(COTS)デバイスを使用して、最小限の活動空間制約で運用する。
95.37%のスヌーピングカメラ検出精度と17.23の平均位置誤差を達成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:23:50 GMT)
UDA-Bench: Revisiting Common Assumptions in Unsupervised Domain Adaptation Using a Standardized Framework [59.4] 現代無監督領域適応法(UDA)の有効性に影響を及ぼす様々な要因について, より深く考察する。
分析を容易にするため,ドメイン適応のためのトレーニングと評価を標準化する新しいPyTorchフレームワークであるUDA-Benchを開発した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:57:07 GMT)
AQA: Adaptive Question Answering in a Society of LLMs via Contextual Multi-Armed Bandit [59.1] 質問応答(QA)では、異なる質問を異なる回答戦略で効果的に扱うことができる。
本稿では,各質問に対して最適なQA戦略を適応的に選択する動的手法を提案する。
提案手法は,複数のモジュールを持つQAシステムの適応的オーケストレーションに有効であることを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:43:06 GMT)
Ternary-Type Opacity and Hybrid Odometry for RGB NeRF-SLAM [58.7] 表面を交差する光線上の点を3つの領域(前・前・後・後)に分類する3成分式不透明度モデルを導入する。
これにより、より正確な深度のレンダリングが可能となり、画像ワープ技術の性能が向上する。
TTとHOの統合アプローチは,合成および実世界のデータセット上で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:48:06 GMT)
Robust Federated Learning Over the Air: Combating Heavy-Tailed Noise with Median Anchored Clipping [57.4] 重み付き雑音による有害な影響に対処するため,メディアアンコールド・クリッピング (MAC) と呼ばれる新しい勾配クリッピング法を提案する。
また、MAC下でのアナログオーバー・ザ・エア・フェデレーション学習によるモデルトレーニングの収束率の解析式も導出する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:11:40 GMT)
Attack Atlas: A Practitioner's Perspective on Challenges and Pitfalls in Red Teaming GenAI [52.1] 生成AI、特に大規模言語モデル(LLM)は、製品アプリケーションにますます統合される。
新たな攻撃面と脆弱性が出現し、自然言語やマルチモーダルシステムにおける敵の脅威に焦点を当てる。
レッドチーム(英語版)はこれらのシステムの弱点を積極的に識別する上で重要となり、ブルーチーム(英語版)はそのような敵の攻撃から保護する。
この研究は、生成AIシステムの保護のための学術的な洞察と実践的なセキュリティ対策のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:18:10 GMT)
Pre-trained Language Model and Knowledge Distillation for Lightweight Sequential Recommendation [51.3] 本稿では,事前学習言語モデルと知識蒸留に基づく逐次推薦アルゴリズムを提案する。
提案アルゴリズムは,推薦精度を高め,タイムリーな推薦サービスを提供する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:39:07 GMT)
Past Meets Present: Creating Historical Analogy with Large Language Models [46.6] 本稿では,あるイベントに類推された過去の出来事を収集することを目的とした,歴史的類推獲得タスクに焦点を当てる。
LLMが歴史的類推を生成する際に,幻覚やステレオタイプを緩和する自己回帰法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:52:09 GMT)
From Commands to Prompts: LLM-based Semantic File System for AIOS [46.3] プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。
従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。
実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:39:16 GMT)
Preventing Rowhammer Exploits via Low-Cost Domain-Aware Memory Allocation [46.3] Rowhammerは、最新のDRAMベースのメモリを持つすべてのシステムの中心にあるハードウェアセキュリティの脆弱性である。
C Citadelは、Rowhammerの初期セキュリティエクスプロイトを防ぐ新しいメモリアロケータ設計である。
C Citadelは数千のセキュリティドメインを、平均7.4%のメモリオーバーヘッドでサポートし、パフォーマンスを損なわない。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:41:14 GMT)
Fair Enough? A map of the current limitations of the requirements to have fair algorithms [43.6] 我々は、社会が自動意思決定システムから要求しているものと、この要求が現実のシナリオで実際に意味しているものとの間には、因果関係があることを論じる。
自動意思決定システムにおける公正性の増大に具体的な意味を与えるため、社会として対応しなければならない重要なオープンポイントの集合を概説する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:20:12 GMT)
Do Large Language Models have Problem-Solving Capability under Incomplete Information Scenarios? [43.0] 大規模言語モデル(LLM)の不完全情報シナリオ下での問題解決能力の評価はますます重要である。
本論では,「潜入者」と「二十問」を基にしたブレインキングという新作ゲームを紹介する。
LLMは、限定されたイエスまたはノーの質問と潜在的な誤解を招く答えを持つターゲットエンティティを識別する必要がある。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:18:02 GMT)
Speech-Copilot: Leveraging Large Language Models for Speech Processing via Task Decomposition, Modularization, and Program Generation [42.6] Speech-Copilotは、命令指向の音声処理タスクのためのモジュラーフレームワークである。
事前にコンパイルされたタスク命令を分析することで、音声処理固有のツールセットを構築する。
プログラム生成を通じてタスクを実行する大きな言語モデルに基づく柔軟なエージェントを備えている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:45:04 GMT)
Open-CRB: Towards Open World Active Learning for 3D Object Detection [40.8] LiDARによる3次元物体検出は,最近,能動学習(AL)によって著しく進歩した。
ストリーミングポイントクラウドが未知または新しいオブジェクトを含む実世界のデプロイメントでは、そのようなオブジェクトをキャプチャする現在のALメソッドが探索されていない。
本稿では,3次元物体検出のためのオープンワールドアクティブラーニング(OWAL-3D)という,より実践的で困難な研究課題について検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 04:48:30 GMT)
Structure-based Drug Design with Equivariant Diffusion Models [40.7] 本稿では,タンパク質ポケットに新しい条件を付加したSE(3)-同変拡散モデルDiffSBDDを提案する。
我々のサイリコ実験では、DiffSBDDが地上の真実データの統計を効果的に捉えていることが示されています。
これらの結果は、拡散モデルが従来の方法よりも正確に構造データの複雑な分布を表すという仮定を支持する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:31:01 GMT)
S$^2$AG-Vid: Enhancing Multi-Motion Alignment in Video Diffusion Models via Spatial and Syntactic Attention-Based Guidance [40.5] 既存のテキスト・トゥ・ビデオ(T2V)モデルは、単一のモーションを実行する単一のオブジェクトを特徴とする単純なシーンに焦点を当てている。
課題は、異なる動きを持つ複数の物体を含むシナリオで発生し、しばしば被写体とその対応する動きの間の誤ったビデオテキストアライメントを引き起こす。
トレーニング不要な推論ステージ最適化手法である textbfS$2$AG-Vid を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:56:03 GMT)
Human Hair Reconstruction with Strand-Aligned 3D Gaussians [39.3] 従来のヘアストランドと3Dガウスの二重表現を用いた新しいヘアモデリング手法を提案する。
ヒトのアバターをモデル化するための非構造ガウス的アプローチとは対照的に,本手法は3Dポリラインや鎖を用いて髪を再構築する。
提案手法はGaussian Haircutと呼ばれ, 合成シーンと実シーンで評価し, ストランドベースヘア再構築作業における最先端性能を実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:49:46 GMT)
Phantom of Latent for Large Language and Vision Models [39.3] モデルサイズ0.5B,1.8B,3.8B,7Bパラメータを持つ新しい効率的なLLVMファミリーPhantomを提案する。
LLVMは、物理的モデルのサイズを大幅に増加させることなく、潜在言語に関するよりビジョン的な知識を、より深く検討し、理解する準備を整えます。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:19:06 GMT)
Human4DiT: 360-degree Human Video Generation with 4D Diffusion Transformer [38.9] 1枚の画像から高品質でコヒーレントな人間ビデオを生成するための新しい手法を提案する。
本フレームワークは,グローバル相関を捉える拡散変圧器の強度と,正確な条件注入を行うCNNの強度を組み合わせたものである。
我々は,360度リアルでコヒーレントな人間のモーションビデオを合成する手法の能力を実証した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:52:01 GMT)
An Incremental Unified Framework for Small Defect Inspection [38.8] Incremental Unified Framework(IUF)を提案し、パイプラインに新しいオブジェクトを継続的に統合する場合に、機能衝突の問題を軽減することができる。
最先端のトランスフォーマーを用いて、異なるセマンティックバウンダリを規定するために、OASA(Object-Aware Self-Attention)を導入する。
本手法は, 動的かつスケーラブルな産業検査に欠かせない, 最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 04:08:05 GMT)
Gaps or Hallucinations? Gazing into Machine-Generated Legal Analysis for Fine-grained Text Evaluations [38.3] LLM(Large Language Models)は、法律分析を行う専門家のための文書作成支援である。
LLMは、非専門職や既存のテキスト評価指標によって認識しにくい方法で、この設定で幻覚を起こすことが多い。
厳密な誤った意味での幻覚とは対照的に、中性的なギャップの概念を導入し、人間による記述と機械による法的な分析の違いを言及する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:06:25 GMT)
MODEL&CO: Exoplanet detection in angular differential imaging by learning across multiple observations [37.8] ほとんどの後処理法は、対象の観測自体から核分裂のモデルを構築している。
本稿では,教師付き深層学習技術を利用して,複数観測のアーカイブからニュアンスモデルを構築することを提案する。
本稿では,提案手法をVLT/SPHERE機器から得られた複数のデータセットに適用し,高精度なリコールトレードオフを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:22:45 GMT)
End-to-End Graph Flattening Method for Large Language Models [37.5] グラフをLarge Language Models (LLM) の自然言語に変換する一般的な実践は、優れた一般化性と解釈可能性を示している。
人間の認知的推論の習慣に触発されて,エンド・ツー・エンドDAG-Path prompting (EEDP) と呼ばれるLCMに適合するグラフ平坦化法を提案する。
実世界のデータセットでの実験では、EEDPは長距離シナリオにおけるLLMの推論性能を高めつつ、短距離シナリオにおける優れたパフォーマンスを維持している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:28:47 GMT)
KISS-Matcher: Fast and Robust Point Cloud Registration Revisited [37.4] 我々はtextitKISS-Matcher という,ポイントクラウド登録のためのオープンソースライブラリを開発した。
KISS-Matcherは、古典的なファストポイント特徴ヒストグラム(FPFH)を改善する新しい特徴検出器、textitFaster-PFHを組み合わせた。
さらに、$k$コアベースのグラフ理論プルーニングを採用して、外れ値対応を拒否する際の時間的複雑さを低減している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:39:03 GMT)
Stalactite: Toolbox for Fast Prototyping of Vertical Federated Learning Systems [37.1] 本稿では,VFL(Vertical Federated Learning)システムのためのオープンソースのフレームワークであるemphStalactiteを紹介する。
VFLはデータサンプルが複数のデータ所有者にまたがる機能によって分割されるFLの一種である。
実世界のレコメンデーションデータセットでその使い方を実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:29:03 GMT)
Asynchronous Local-SGD Training for Language Modeling [37.0] 局所勾配降下(Local-SGD)は、各デバイスが通信毎に複数のSGD更新を行う分散最適化のアプローチである。
この研究は、言語モデルをトレーニングするための非同期ローカル-SGDについて実証的研究を行い、SGDのステップが完了した直後に、各ワーカーがグローバルパラメータを更新する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:49:33 GMT)
Ditto: Elastic Confidential VMs with Secure and Dynamic CPU Scaling [36.0] Elastic CVM"とWorker vCPU設計は、より柔軟で費用対効果の高い機密計算環境を実現するための道を開いた。
Elastic CVM"とWorker vCPUの設計は、クラウドリソースの利用を最適化するだけでなく、より柔軟で費用対効果の高い機密計算環境の道を開く。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:52:10 GMT)
Robust Training Objectives Improve Embedding-based Retrieval in Industrial Recommendation Systems [35.4] 自己教師付きマルチタスク学習(SSMTL)は、埋め込み学習における学術ベンチマークにおいて強い性能を示している。
我々は、テクノロジーセクターのソーシャルメディアプラットフォーム上で、大規模な友人推薦システムを通じて、堅牢なトレーニング目標、特にSSMTLを用いて評価する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:12:33 GMT)
NeurLZ: On Enhancing Lossy Compression Performance based on Error-Controlled Neural Learning for Scientific Data [35.4] 大規模科学シミュレーションは、ストレージとI/Oに挑戦する巨大なデータセットを生成する。
我々は、科学データのための新しいクロスフィールド学習およびエラー制御圧縮フレームワークNeurLZを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:30:35 GMT)
TextToon: Real-Time Text Toonify Head Avatar from Single Video [34.1] 乾燥可能なトーン化アバターを生成するためのTextToonを提案する。
短い単眼ビデオシーケンスとアバタースタイルに関する命令が与えられた場合,本モデルは高忠実度トーン化アバターを生成することができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:04:45 GMT)
ReLoo: Reconstructing Humans Dressed in Loose Garments from Monocular Video in the Wild [33.8] ReLooは、モノラルなインザワイルドビデオから、ゆるい服を着た人間の高品質な3Dモデルを再構築する。
まず、布を被った人間を神経内装と外装に分解する層状神経人間表現を構築した。
グローバルな最適化は、多層異なるボリュームレンダリングにより、人体と衣服の形状、外観、変形を共同で最適化する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:58:39 GMT)
Quantum sensing of acceleration and rotation by interfering magnetically-launched atoms [33.7] 磁気的に起動された原子干渉計をベースとした小型の冷間原子加速度計ジャイロスコープのアーキテクチャを提案する。
700ppmのジャイロスコープスケールファクターを1日で安定させ,加速速度と回転速度のバイアス安定性は7×10-7$m/s$2/s,4×10-7$rad/sは2日間の統合後に到達した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:37:44 GMT)
A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor? [33.7] OpenAIのo1は、強化学習戦略を使ったチェーン・オブ・ソート技術を使った最初のモデルとして際立っている。
本報告では、様々な医療シナリオにおけるo1の総合的な探索を行い、理解、推論、多言語性という3つの重要な側面について検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:59:43 GMT)
SiT: Exploring Flow and Diffusion-based Generative Models with Scalable Interpolant Transformers [33.2] Diffusion Transformers (DiT) のバックボーン上に構築された生成モデル
補間フレームワークは、2つの分布を標準拡散モデルよりも柔軟な方法で接続することができる。
SiT は条件付き ImageNet 256x256 と 512x512 ベンチマークで DiT を均一に上回っている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:59:41 GMT)
Can CLIP Count Stars? An Empirical Study on Quantity Bias in CLIP [32.7] われわれはCLIPの量バイアスを実験的に検討した。
実験の結果,CLIP埋め込みの量バイアスが,下流タスクの信頼性に影響を与えることが明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:01:16 GMT)
DiLoCo: Distributed Low-Communication Training of Language Models [32.2] 大規模言語モデル(LLM)は、機械学習の多くのアプリケーションにおいて重要なコンポーネントである。
LLMのトレーニングのための標準的なアプローチは、多数の相互接続されたアクセラレータを必要とする。
本研究では,低接続のデバイス上での言語モデルのトレーニングを可能にする分散最適化アルゴリズムDiLoCoを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:41:27 GMT)
Revise, Reason, and Recognize: LLM-Based Emotion Recognition via Emotion-Specific Prompts and ASR Error Correction [31.7] 本研究では、音響学、言語学、心理学から感情固有の知識を取り入れた新しいプロンプトを提案する。
LLMトレーニングスキームの有用性を検討するために,文脈認識学習,文脈内学習,指導訓練の実験を行った。
本研究の目的は、感情認識および関連ドメインにおけるLLMの使用を改善することである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:07:06 GMT)
Dynamic Integration of Task-Specific Adapters for Class Incremental Learning [31.7] 非典型的なクラス インクリメンタルラーニング (NECIL) では、モデルがスクラッチからリトレーニングしたり、古いタスク インクリメンタルを格納したりすることなく、新しいクラスを継続的に取得できる。
本稿では,タスク特化アダプタ統合(TSAI)とパッチレベルモデルアライメントという,タスク特化アダプタの動的統合(DIA)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:01:33 GMT)
RWKV-CLIP: A Robust Vision-Language Representation Learner [31.5] コントラスト言語-画像事前学習(CLIP)は、様々な視覚言語タスクのパフォーマンスを大幅に改善した。
本稿では,Large Language Models(LLM)を利用して,Webベースのテキスト,合成キャプション,検出タグからコンテンツを合成・洗練する多種多様な記述生成フレームワークを提案する。
RWKV-CLIPは,変換器の効果的な並列学習とRNNの効率的な推論を組み合わせた,最初のRWKV駆動型視覚言語表現学習モデルである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 06:19:44 GMT)
MTP: A Dataset for Multi-Modal Turning Points in Casual Conversations [30.9] 感情的なアウトバーストや会話中の意思決定の変化といった重要な瞬間は、人間の行動とその結果の変化を理解するために不可欠である。
我々の研究は、これらの瞬間をターンポイント(TP)として焦点をあてた、新しい問題設定を導入する。
我々は,これらの転換点における感情,行動,視点,決定の光度の高い変化について,正確なタイムスタンプ,説明,および視覚的テキスト的証拠を提供する。
また,現状の視覚言語モデルを用いて,映像や大規模言語モデルから物語を構築し,回転点の分類と検出を行うフレームワークTP Mavenを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:26:08 GMT)
Speaking in Wavelet Domain: A Simple and Efficient Approach to Speed up Speech Diffusion Model [30.8] Denoising Diffusion Probabilistic Models (DDPM)は、様々な生成タスクにおいて主要なパフォーマンスを達成した。
音声信号自体を変更することにより、DDPMのトレーニング/推論速度と性能を向上させることが可能か?
本稿では、生成対象をウェーブレット領域に単純にリダイレクトすることで、音声DDPMのトレーニング速度と推論速度を2倍にする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:57:44 GMT)
ToxiCraft: A Novel Framework for Synthetic Generation of Harmful Information [30.3] Toxicraftは有害な情報のデータセットを合成するための新しいフレームワークである。
少量のシードデータだけで、我々のフレームワークは多種多様な合成データを生成することができるが、驚くほど現実的であり、有毒な情報の例である。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 06:36:57 GMT)
Knowledge Planning in Large Language Models for Domain-Aligned Counseling Summarization [30.3] 大規模言語モデル(LLM)は、様々な生成タスクにおいて顕著な能力を示す。
メンタルヘルスの専門家はまず、要約を書く際にドメイン知識を適用する計画だ。
構造化知識のアライメントを編成する新しい計画エンジンを導入する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:01:31 GMT)
RMCBench: Benchmarking Large Language Models' Resistance to Malicious Code [30.2] LLMが悪意のあるコード生成に抵抗する能力を評価する研究はない。
我々は、悪意のあるコード生成に抵抗する能力を評価するために、11の代表的なLCMについて実証的研究を行った。
以上の結果から,現在のLLMは,テキスト・ツー・コード・シナリオでは平均40.36%,コード・ツー・コード・シナリオでは11.52%の拒否率で,悪意のあるコード生成に抵抗する能力に限界があることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:03:26 GMT)
FedGCA: Global Consistent Augmentation Based Single-Source Federated Domain Generalization [30.0] Federated Domain Generalization (FedDG) は、多ドメイントレーニングサンプルでドメインを見落とせるように、グローバルモデルをトレーニングすることを目的としている。
連合学習ネットワークのクライアントは、固有のサンプリングと時間制限のため、単一のIIDドメインに制限されることが多い。
本稿では,FedGCA(Federated Global Consistent Augmentation)法について紹介する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:24:46 GMT)
Evaluating Theory of (an uncertain) Mind: Predicting the Uncertain Beliefs of Others in Conversation Forecasting [29.9] 対話における他者の不確実性をモデル化するために,新たなタスクスイート,挑戦言語モデル(LM)を提案する。
我々は、インターロケータ自体を予測者とみなし、インターロケータの不確実性を予測するようLMに求めている。
LMは、他者の不確実性に最大7%のばらつきを説明できるが、タスクの難しさと将来の仕事の余地を強調している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:05:25 GMT)
Deep Cost Ray Fusion for Sparse Depth Video Completion [29.5] スパース深度ビデオ補完のための学習ベースフレームワークを提案する。
隣り合うコストボリュームの重なり合った1対の光線に対して、注意機構を効果的に活用するRayFusionを導入する。
我々のフレームワークは、さまざまな屋内および屋外データセットに対する最先端のアプローチを一貫して上回るか、あるいはライバルする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:42:16 GMT)
Speech2rtMRI: Speech-Guided Diffusion Model for Real-time MRI Video of the Vocal Tract during Speech [29.5] 音声中の人間の声道のMRIビデオにおいて,音声を視覚的に表現するデータ駆動方式を提案する。
先行知識に埋め込まれた大規模な事前学習音声モデルを用いて、視覚領域を一般化し、見当たらないデータを生成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:19:24 GMT)
FastGL: A GPU-Efficient Framework for Accelerating Sampling-Based GNN Training at Large Scale [29.3] グラフニューラルネットワーク(GNN)は、非ユークリッドグラフデータに対して大きな優位性を示している。
我々は,大規模なGNNのサンプリングベーストレーニングを高速化するGPU効率のフレームワークであるFastGLを提案する。
FastGLは、最先端フレームワークであるPyG、DGL、GNNLabに対して平均11.8x、2.2x、1.5xのスピードアップを達成することができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:45:47 GMT)
Location is Key: Leveraging Large Language Model for Functional Bug Localization in Verilog [29.0] 本稿では,Verilogスニペット内の機能的エラーを検出するオープンソースLLMソリューションであるLocation-is-Keyを提案する。
Pass@1のローカライゼーション精度は、RTLLMに基づくテストデータセットで93.3%で、GPT-4の77.9%を超え、Claude-3.5の90.8%に匹敵する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:38:53 GMT)
Semantic Inference-Based Deep Learning and Modeling for Earth Observation: Cognitive Semantic Augmentation Satellite Networks [28.7] 本稿では,地球観測衛星ネットワークにおける意味コミュニケーションの枠組みについて述べる。
認知的セマンティック処理と衛星間リンクを統合することにより、マルチスペクトル衛星画像の解析と伝送を強化する。
このエンドツーエンドアーキテクチャは、6Gをサポートする次世代衛星ネットワーク向けに調整されている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:42:05 GMT)
Pathfinder for Low-altitude Aircraft with Binary Neural Network [28.3] 以前のグローバルトポロジマップ(例えば、OpenStreetMap, OSM)は、地上移動ロボットによる自律的マッピングの性能を高めることができる。
本稿では,低高度航空機が搭載する空中センサを用いたOSMメーカを提案する。
OSMメーカーの中核は、LiDARとカメラデータに基づく、新しい効率的なパスファインダーアプローチである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 01:29:58 GMT)
(De)-regularized Maximum Mean Discrepancy Gradient Flow [27.7] 本稿では,最大平均離散(DrMMD)とワッサーシュタイン勾配流の正則化を導入する。
DrMMDフローは、連続時間と離散時間の両方において、広範囲の目標に対して、同時にニア・グロバル収束を保証することができる。
我々の数値スキームは、フロー全体を通して適応的な非正規化スケジュールを使用して、離散化誤差と$chi2$の規則からの逸脱を最適にトレードオフする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:57:42 GMT)
EFUF: Efficient Fine-grained Unlearning Framework for Mitigating Hallucinations in Multimodal Large Language Models [27.7] ペア化データなしで幻覚を除去する,効率的な粒度の未学習フレームワーク(EFUF)を提案する。
本手法は, 高い計算オーバーヘッドで生成品質を保ちながら, 幻覚を常に低減する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:05:02 GMT)
Enabling Tensor Decomposition for Time-Series Classification via A Simple Pseudo-Laplacian Contrast [26.3] 本稿では, Pseudo Laplacian Contrast (PLC) テンソル分解フレームワークを提案する。
データ拡張とラプラシアンのクロスビューを統合し、クラス認識表現の抽出を可能にする。
様々なデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:48:13 GMT)
Towards Efficient and Robust VQA-NLE Data Generation with Large Vision-Language Models [26.1] 自然言語解説(NLE)は、自然言語の詳細な人間フレンドリーな説明を提供することで、意思決定プロセスの解明を目的としている。
自然言語説明データセットを用いた視覚質問応答作成のための既存の手法は、人間のアノテーションに依存している。
本稿では,LVLMを用いて高品質な合成VQA-NLEデータセットを効率的に生成する手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:59:50 GMT)
MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies [25.5] MATCH POLICYは、高精度なピックと配置タスクを解決するパイプラインである。
アクション推論をポイントクラウド登録タスクに転送する。
非常に高いサンプル効率と、目に見えない構成への一般化性を実現する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:09:43 GMT)
Identify As A Human Does: A Pathfinder of Next-Generation Anti-Cheat Framework for First-Person Shooter Games [25.0] オンラインゲームでのティーティングは、ゲーム体験の完全性に重大な脅威をもたらす。
本稿では,人気ゲームCS:GOのためのサーバサイドFPSアンチチートフレームワークHAWKを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:00:07 GMT)
PackageIntel: Leveraging Large Language Models for Automated Intelligence Extraction in Package Ecosystems [24.9] PackageIntelは、悪意のあるパッケージインテリジェンスの収集、処理、検索に革命をもたらす新しいプラットフォームである。
我々は,21の異なるインテリジェンスリポジトリから生成された20,692のNPMおよびPyPIパッケージを含む包括的データベースを開発した。
PackageIntelは、SnykやOSVのような主要なデータベースよりも平均70%早く脅威を検出し、1インテリジェンスあたり0.094ドルで費用対効果で運用する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:22:53 GMT)
Dual Graph Attention based Disentanglement Multiple Instance Learning for Brain Age Estimation [24.5] 本稿では,DGA-DMIL(Dual Graph Attention based Disentanglement Multi-instance Learning)フレームワークを提案する。
次に,双対グラフ注意アグリゲータを提案し,instance内およびinter-instance間関係を利用してバックボーンの特徴を学習する。
提案モデルでは,脳年齢推定における異常な精度を示し,英国バイオバンクで2.12年間の絶対誤差を達成した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:53:31 GMT)
Early alignment in two-layer networks training is a two-edged sword [24.4] 1次最適化手法によるニューラルネットワークのトレーニングは、ディープラーニングの実証的な成功の核心にある。
小さな初期化は一般的に、単純な解に対して勾配降下が暗黙的に偏っている特徴学習体制に関連付けられている。
この研究は、元来Maennelらによって導入された初期のアライメントフェーズの一般的かつ定量的な記述を提供する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:08:11 GMT)
Method of Equal Shares with Bounded Overspending [23.2] 境界超過(BOS等分)による等分法の導入
BOS Equal Sharesは、厳密な比例保証に固有の非効率性に対処するが、元の等式共有方法と同様、優れた比例性を提供する。
分析の過程では、プロジェクトの部分的な資金提供を可能にする方法の分数変種についても論じる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:30:25 GMT)
Learning the Target Network in Function Space [23.1] Lookahead-Replicate (LR) は新しい値関数近似アルゴリズムである。
LRは値関数の学習において収束挙動をもたらすことを示す。
また、LRベースのターゲットネットワーク更新により、Atariベンチマークの深いRLが大幅に改善されることを示す実験結果を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:43:55 GMT)
TeeRollup: Efficient Rollup Design Using Heterogeneous TEE [23.0] 本稿では,低ガスコストと短時間の退避遅延を有する効率的なロールアップ設計であるTeeRollupを紹介する。
以上の結果から,TeeRollupはゼロ知識ロールアップ(zkロールアップ)に優れ,オンチェーン検証コストが約86%削減され,離脱遅延が数分に短縮された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 01:15:03 GMT)
A comprehensive study of on-device NLP applications -- VQA, automated Form filling, Smart Replies for Linguistic Codeswitching [22.8] 2つのカテゴリに3つの新しい体験を提案する。
まず、画面理解に活用できる体験について議論する。
拡張可能な2つ目のカテゴリは、多言語話者をサポートするスマートリプライである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:28:52 GMT)
Towards Efficient Neuro-Symbolic AI: From Workload Characterization to Hardware Architecture [22.3] ニューロシンボリックAIは、解釈可能性、堅牢性、信頼性を高めるニューラルネットワークとシンボリックアプローチを融合して、有望なパラダイムとして出現する。
最近のニューロシンボリックシステムは、推論と認知能力を備えた協調的な人間-AIシナリオにおいて大きな可能性を示している。
まず, ニューロシンボリックAIアルゴリズムを体系的に分類し, 実行時, メモリ, 計算演算子, 疎結合性, システム特性を実験的に評価し, 解析する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 01:30:12 GMT)
A Survey of Resource-efficient LLM and Multimodal Foundation Models [22.2] 大規模言語モデル(LLM)、ビジョントランスフォーマー(ViT)、拡散、マルチモーダルモデルを含む大規模な基盤モデルは、機械学習ライフサイクル全体に革命をもたらしている。
しかしながら、これらのモデルが提供する汎用性と性能の大幅な進歩は、ハードウェアリソースの面でかなりのコストがかかる。
この調査は、アルゴリズム的側面とシステム的側面の両方を調べることで、そのような研究の重要さを掘り下げるものである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:37:34 GMT)
CAMAL: Optimizing LSM-trees via Active Learning [21.9] 機械学習を用いてLSMツリー構造を最適化し、様々な読み取り/書き込み操作の処理コストを削減する。
Camalを完全なシステムRocksDBに統合することにより,最先端のRocksDB設計と比較して,システムパフォーマンスが平均28%,最大8倍向上する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:35:23 GMT)
MediConfusion: Can you trust your AI radiologist? Probing the reliability of multimodal medical foundation models [20.8] 医用ビジュアル質問回答(VQA)ベンチマークデータセットであるMedConfusionを紹介した。
現状のモデルは、画像のペアによって容易に混同され、それ以外は視覚的に異なっており、医療専門家にとってはっきりと区別されている。
また、医療における信頼性が高く信頼性の高いMLLMの新しい世代の設計に役立つモデル失敗の共通パターンを抽出する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:59:37 GMT)
Electric imaging and dynamics of photo-charged graphene edge [20.5] フローティンググラフェンフレークの実空間走査マップは、空間分解能が$sim$10 nmで取得された。
電場のリアルタイム追跡は、光熱イオン放出過程と放出された電子の再結合過程を検出した。
本研究は,グラフェンを用いた一次元ゲートとナノスケール実空間イメージングを用いた光エレクトロニクスの新しい視点を提供する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:53:08 GMT)
Revolutionizing Biomarker Discovery: Leveraging Generative AI for Bio-Knowledge-Embedded Continuous Space Exploration [20.4] 本稿では,2つの重要なモジュールを持つバイオマーカー識別フレームワークを提案する。
第1モジュールはマルチエージェントシステムを使用して,バイオマーカーサブセットのペアと,それに対応する予測精度をトレーニングデータとして自動収集する。
第2のモジュールは、収集したデータの知識を連続的な空間に圧縮するために、エンコーダ-評価器-デコーダ学習パラダイムを使用する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:36:30 GMT)
GNNAnatomy: Systematic Generation and Evaluation of Multi-Level Explanations for Graph Neural Networks [20.1] 本稿では,グラフ分類タスクの多段階説明の生成と評価を目的とした視覚解析システムであるGNNAnatomyを紹介する。
GNNAnatomyは、グラフレット、原始グラフサブ構造を用いて、GNN予測とグラフレット周波数の相関を分析することにより、グラフクラスで最も重要なサブ構造を識別する。
社会学・生物学領域からの合成および実世界のグラフデータセットのケーススタディを通して,GNN解剖学の有効性を実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:38:54 GMT)
Flash STU: Fast Spectral Transform Units [19.9] 本稿では、スペクトル変換ユニットの効率的でオープンソースのPyTorch実装について述べる。
本研究では,言語,ロボット工学,シミュレートされた力学系を含むいくつかのモードにおけるシーケンス予測タスクについて検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 00:26:07 GMT)
Cog-GA: A Large Language Models-based Generative Agent for Vision-Language Navigation in Continuous Environments [19.8] VLN-CE(Vision Language Navigation in Continuous Environments)は、AIのフロンティアである。
本稿では,VLN-CEタスクに適した大規模言語モデル(LLM)に基づく生成エージェントであるCog-GAを紹介する。
Cog-GAは、人間のような認知過程をエミュレートするための二重戦略を採用している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:18:27 GMT)
Steward: Natural Language Web Automation [19.3] 大規模言語モデル(LLM)は、AIアシスタントの基盤として機能する優れた能力を示している。
我々は、低コストでスケーラブルでエンドツーエンドなWebインタラクション自動化ソリューションとして機能するように設計された、新しいLLMベースのWeb自動化ツールであるStewardを紹介します。
本稿では,状態表現,アクションシーケンス選択,システム応答性,タスク完了の検出,キャッシュ実装など,さまざまな設計と実装の課題について論じる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:06:32 GMT)
VLM's Eye Examination: Instruct and Inspect Visual Competency of Vision Language Models [19.3] ビジョン言語モデル(VLM)は、様々なベンチマークで有望な推論能力を示している。
本研究では,VLMがどのようにイメージを知覚するかを調べるために,視線検査プロセスを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:15:29 GMT)
Do Large Language Models Possess Sensitive to Sentiment? [18.9] 大規模言語モデル(LLM)は、最近、言語理解における異常な能力を示した。
本稿では,LLMがテキストモーダルの感情を検知し,反応する能力について検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:28:27 GMT)
VLMine: Long-Tail Data Mining with Vision Language Models [18.4] この研究は、ラベルなしデータのコーパス内の稀な例を識別する問題に焦点を当てている。
本稿では,大規模視覚言語モデル(VLM)に含まれる知識を活用する,シンプルでスケーラブルなデータマイニング手法を提案する。
私たちの実験は、ベースライン技術よりも大きな改善(10%から50%)を示しています。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:13:51 GMT)
VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models [18.3] VLEU(Visual Language Evaluation Understudy)と呼ばれる新しい指標を導入する。
VLEUは、視覚テキストの限界分布とモデルが生成した画像の条件分布との間のクルバック・リーバーの偏差を計算することにより、モデルの一般化可能性を定量化する。
本実験は,様々なT2Iモデルの一般化能力を評価する上で,VLEUの有効性を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 04:50:36 GMT)
Handling Long-Term Safety and Uncertainty in Safe Reinforcement Learning [17.9] 安全性は、現実世界のロボットに強化学習技術が配備されるのを防ぐ重要な問題の1つだ。
本稿では,安全な探索手法であるATACOMを学習可能な制約で拡張することにより,そのギャップを埋める。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:42:32 GMT)
CITI: Enhancing Tool Utilizing Ability in Large Language Models without Sacrificing General Performance [17.7] コンポーネントベースツール活用能力注入法(CITI)を提案する。
異なるコンポーネントの勾配に基づく重要度スコアによると、CITIは微調整プロセスによって生じる能力衝突を軽減する。
実験結果から,本手法は様々な評価指標において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:38:24 GMT)
Revisiting Video Quality Assessment from the Perspective of Generalization [17.7] YouTube Shorts、TikTok、Kwaiなどの短いビデオプラットフォームは、ユーザー生成コンテンツ(UGC)の急増につながっている。
これらの課題は、テストセットのパフォーマンスに影響を与えるだけでなく、異なるデータセットをまたいで一般化する能力にも影響を及ぼす。
対向重み摂動は、この景観を効果的に滑らかにし、一般化性能を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:24:55 GMT)
GlitchProber: Advancing Effective Detection and Mitigation of Glitch Tokens in Large Language Models [17.6] 大規模言語モデル(LLM)は、自然言語処理の分野で前例のない成功を収めた。
最近の研究では、モデルの語彙空間に異常トークンのクラスを発見し、それらを「グリッチトークン」と名付けた。
本研究では,グリッチトークンの理解を深め,その検出と緩和のための手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:46:55 GMT)
General Flow as Foundation Affordance for Scalable Robot Learning [17.5] 大規模RGBDビデオデータセットから直接,言語条件付き3次元フロー予測モデルを開発する。
提案手法は,ゼロショットの人間とロボットのスキル伝達において,81%の成功率を達成した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:22:04 GMT)
Enabling Resource-Efficient On-Device Fine-Tuning of LLMs Using Only Inference Engines [17.5] 大規模言語モデル(LLM)は、テキスト生成や要約といった様々なタスクの自動化において、例外的な性能を示してきた。
現在、LLMは大規模なクラウドサーバ上でトレーニングと微調整が行われていますが、これらのモデルをリソース制約のあるエッジデバイス上で微調整することは、依然として大きな課題です。
本稿では,制約環境下での微調整LDMの障壁を低減するため,資源効率の高いゼロ階最適化手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:14:09 GMT)
Advancing Video Quality Assessment for AIGC [17.2] 本稿では,平均絶対誤差とクロスエントロピー損失を組み合わせ,フレーム間品質の不整合を緩和する新たな損失関数を提案する。
また,モデルの一般化能力を高めるために,敵対的トレーニングを活用しながら,重要なコンテンツを維持するために革新的なS2CNet技術を導入する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:36:22 GMT)
Enhancing Pedestrian Trajectory Prediction with Crowd Trip Information [17.1] 正確な歩行者軌道予測には、個々の行動、社会的相互作用、道路環境の深い理解が必要である。
本稿では,歩行者軌道モデルに旅行情報を新たなモダリティとして取り入れた新しいアプローチを提案する。
道路網内の群集行動を調べることで,正確な軌道予測による歩行者の安全向上が期待できる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:11:31 GMT)
When LLMs Meets Acoustic Landmarks: An Efficient Approach to Integrate Speech into Large Language Models for Depression Detection [17.0] 抑うつは世界的メンタルヘルスにおいて重要な関心事であり、AIに基づく検出方法の広範な研究を促している。
大規模言語モデル(LLM)は、メンタルヘルスケアアプリケーションにおいて、その汎用性において際立っている。
マルチモーダル抑うつ検出のためのLLMフレームワークに音声情報を統合するための革新的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:54:05 GMT)
On The Specialization of Neural Modules [16.8] 本稿では,データセットの有用な構造に特化し,系統的な一般化を実現するネットワークモジュールの能力について検討する。
その結果、モジュールの特殊化の難しさ、モジュールの専門化を成功させるために必要なもの、モジュールアーキテクチャの体系化の必要性が明らかになった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:58:11 GMT)
With Ears to See and Eyes to Hear: Sound Symbolism Experiments with Multimodal Large Language Models [16.6] 視覚言語モデル (VLM) は, 正書法や画像のみからの抽象的推論により, 暗黙的に音による現象を理解できることを示す。
我々は,古典的キキ・ブーバやミル・マール形状の再現,等級記号課題などの実験を行った。
以上の結果から, VLMは人体ラベルとの一致のレベルが異なることが示され, サイリコ実験ではVLMと人体ラベルとの対応がより重要となる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:13:25 GMT)
PROMPTFUZZ: Harnessing Fuzzing Techniques for Robust Testing of Prompt Injection in LLMs [16.3] 大規模言語モデル(LLM)は、人間のようなテキストを生成する強力な能力のため、様々なアプリケーションで広く利用されている。
プロンプトインジェクション攻撃は、モデルの最初の命令を悪意のあるプロンプトで上書きし、生成されたテキストを操作する。
本稿では,ファジィ技術を利用した新規な試験フレームワークであるProMPTFUZZを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 06:08:32 GMT)
M2OST: Many-to-one Regression for Predicting Spatial Transcriptomics from Digital Pathology Images [16.2] 病理画像の階層構造に対応する多対一回帰変換器M2OSTを提案する。
1対1のイメージラベルペアで訓練された従来のモデルとは異なり、M2OSTはデジタル病理画像の異なるレベルからの複数の画像を使用して、共通の対応する領域における遺伝子発現を共同で予測する。
M2OSTはパラメータが少なく、浮動小数点演算(FLOP)で最先端のパフォーマンスを実現することができる
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:06:37 GMT)
Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QA [16.1] シングルターンSELF-RAGフレームワークを構築し,会話設定のためのSELF-multi-RAGを提案する。
SELF-multi-RAGは、関連するパスの検索に関して、シングルターン変種よりも改善された機能を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:05:12 GMT)
Analyzing Privacy Implications of Data Collection in Android Automotive OS [16.0] Android Automotive OS(AAOS)は1億台以上の車両に統合されている。
この膨大なデータ収集によって、プライバシーはますます重要になっている。
本稿では,AAOSのプライバシ含意に焦点をあて,データ収集の性質と範囲,および元の機器メーカー(OEM)のプライバシポリシについて検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:35:40 GMT)
FaceVid-1K: A Large-Scale High-Quality Multiracial Human Face Video Dataset [15.9] 我々はtextbfFaceVid-1K という高品質な多人種顔コレクションを作成している。
我々は,テキスト・トゥ・ビデオ,画像・トゥ・ビデオ,無条件映像生成など,確立されたビデオ生成モデルを用いて実験を行った。
対応するパフォーマンスベンチマークを取得し、公開データセットでトレーニングされたベンチマークと比較し、データセットの優位性を実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:27:02 GMT)
History, Development, and Principles of Large Language Models-An Introductory Survey [15.9] 自然言語処理(NLP)の基盤となる言語モデル
数十年にわたる広範な研究を経て、言語モデリングは、初期統計言語モデル(SLM)から、大規模言語モデル(LLM)の現代的景観へと進歩してきた。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:12:40 GMT)
Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models [15.5] 大言語モデル(LLM)は、ロボットが共通感覚推論を用いてタスクプランを生成するためのツールとして登場した。
最近の研究は、固定された意味クラスを持つ明示的な写像から暗黙的なオープンな語彙マップへと移行している。
LLMと簡単に統合しながら、数千のセマンティッククラスを表現できる明示的なテキストベースのマップを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:26:19 GMT)
Are LLMs Good Annotators for Discourse-level Event Relation Extraction? [15.4] 大規模言語モデル (LLM) は、様々な自然言語処理タスクにおいて習熟度を示す。
本研究は, 教師あり学習によって確立されたベースラインと比較して, LLMの顕著な性能低下を明らかにした。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:25:16 GMT)
Adaptive Learning on User Segmentation: Universal to Specific Representation via Bipartite Neural Interaction [15.3] 本稿では,情報ボトルネックを通じて汎用ユーザ表現を学習する新しい学習フレームワークを提案する。
次に、ニューラルネットワークを通じてセグメンテーション特化あるいはタスク特化表現をマージし、学習する。
提案手法は2つのオープンソースベンチマーク、2つのオフラインビジネスデータセットで評価され、ユーザのCVRを予測するために2つのオンラインマーケティングアプリケーションにデプロイされる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:02:23 GMT)
TS-TCD: Triplet-Level Cross-Modal Distillation for Time-Series Forecasting Using Large Language Models [15.3] 本稿では,3段階のクロスモーダルな知識蒸留機構を包括的に導入する新しいフレームワークTS-TCDを提案する。
分離されたアライメント技術に焦点を当てた以前の作業とは異なり、私たちのフレームワークは体系的に統合されます。
ベンチマークタイムシリーズの実験では、TS-TCDは最先端の結果を達成し、精度と堅牢性の両方で従来の手法より優れていることが示されている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:57:24 GMT)
How Privacy-Savvy Are Large Language Models? A Case Study on Compliance and Privacy Technical Review [15.2] プライバシ情報抽出(PIE)、法および規制キーポイント検出(KPD)、質問応答(QA)などのプライバシー関連タスクにおいて、大規模言語モデルの性能を評価する。
本稿では, BERT, GPT-3.5, GPT-4, カスタムモデルなど, プライバシコンプライアンスチェックや技術プライバシレビューの実行能力について検討する。
LLMは、プライバシーレビューの自動化と規制上の相違点の特定を約束する一方で、法律標準の進化に完全に準拠する能力において、大きなギャップが持続している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:30:21 GMT)
Back-stepping Experience Replay with Application to Model-free Reinforcement Learning for a Soft Snake Robot [15.0] Back-stepping Experience Replay (BER)は、任意の外部強化学習アルゴリズムと互換性がある。
柔らかいヘビロボットの移動とナビゲーションのためのモデルレスRLアプローチにおけるBERの適用について述べる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:58:39 GMT)
Using Game Play to Investigate Multimodal and Conversational Grounding in Large Multimodal Models [14.9] 本稿では,テキストモデルからマルチモーダルモデルへの評価パラダイムを提案する。
我々は、視覚情報から状況を表現するためのモデルの能力に挑戦するゲームを定義し、対話を通じてそのような表現を調整する。
最大のクローズドモデルは、私たちが定義したゲームでかなりよく機能し、最高のオープンウェイトモデルでさえそれらと苦労している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:07:18 GMT)
Enhancing Aspect-based Sentiment Analysis in Tourism Using Large Language Models and Positional Information [14.9] 本稿では,Aspect-Category-Sentiment Quadruple extract (ACOSQE)のためのアスペクトベース感情分析モデルACOS_LLMを提案する。
このモデルは補助知識生成とACOSQEという2つの重要な段階から構成される。
その結果、F1は観光データセットの他のモデルと比較して7.49%改善した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:19:17 GMT)
Quantum Optimization: Potential, Challenges, and the Path Forward [14.8] 量子コンピュータの最近の進歩は、ブラトフォース古典シミュレーションを超えるスケールで問題を解決する能力を示している。
計算機科学や物理学全般において、主要な最適化問題に対するアプローチは様々である。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:21:25 GMT)
Large Language Model-Enhanced Interactive Agent for Public Education on Newborn Auricular Deformities [14.4] 耳介変形は、心身障害や聴覚障害の長期的悪影響を持つ新生児によく見られる。
Baidu Inc.のErnieの大規模言語モデルの助けを借りて、対話型エージェントの実現を導き出した。
アップロードされた画像に対応する耳介変形の種類を検出するのに十分な知能である。
耳介変形の知識の普及に関して、このエージェントは両親に病気の専門的な提案をすることができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:10:35 GMT)
FACET: Fast and Accurate Event-Based Eye Tracking Using Ellipse Modeling for Extended Reality [14.1] イベントカメラは、高時間分解能と低消費電力のため、有望な代替手段を提供する。
FACET(Fast and Accurate Event-based Eye Tracking)は、イベントデータから瞳孔パラメータを直接出力するエンドツーエンドのニューラルネットワークである。
改良されたEV-Eyeテストセットでは、FACETは平均瞳孔中心誤差0.20ピクセル、推論時間0.53msを達成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:31:38 GMT)
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models [13.1] Takin AudioLLMは、主にTakin TTS、Takin VC、Takin Morphingを含む一連の技術とモデルである。
これらのモデルはゼロショット音声生成が可能であり、実際の人間の音声とほとんど区別できない高品質な音声を生成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:25:27 GMT)
3D Hand Pose Estimation in Everyday Egocentric Images [13.0] 我々は、視線歪みと野生における3Dアノテーションの欠如から生じる課題に焦点を当てる。
日常の自我中心画像における3次元手ポーズ推定システムWildHandsを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:32:08 GMT)
Rethinking Conventional Wisdom in Machine Learning: From Generalization to Scaling [12.8] 大規模言語の事前学習とスケーリング法則の発見は、機械学習のパラダイムシフトを表している。
本稿では,スケール中心の大規模言語モデル (LLM) 時代においてもはや成り立たないような,レギュラー化に基づくいくつかの重要な原則について検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:04:03 GMT)
3D Reconstruction of Objects in Hands without Real World 3D Supervision [12.7] ハンドヘルドオブジェクトを再構築するためのモデル学習をスケールアップするために,3Dインスペクションを活用するモジュールを提案する。
具体的には、ビデオから多視点2Dマスクの監視を抽出し、形状収集から3次元形状の前兆を抽出する。
我々はこれらの間接的な3次元キューを用いて、単一のRGB画像から物体の3次元形状を予測する占有ネットワークを訓練する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:38:20 GMT)
In-Context Learning May Not Elicit Trustworthy Reasoning: A-Not-B Errors in Pretrained Language Models [12.7] A-Not-Bエラー(A-Not-B error)は、乳幼児にみられる現象で、よく観察された状態が変化したにもかかわらず、前報の振る舞いを繰り返す現象である。
このことは、抑止力の欠如、つまり習慣的または衝動的な反応を止める能力の欠如を浮き彫りにする。
Llama3-8bのような最先端のLLMは、コンテキスト内学習(ICL)と一貫してうまく動作するが、エラーを発生させ、コンテキストが自明に変化すると、タスクの推論において最大83.3%の大幅な低下を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:30:31 GMT)
Generalization vs. Specialization under Concept Shift [12.2] 機械学習モデルは、分散シフトの下では不安定であることが多い。
二重降下が欠如している場合でも,テスト性能が非単調なデータ依存を示すことを示す。
MNISTとFashionMNISTの実験は、この興味深い挙動が分類問題にも存在することを示唆している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:30:28 GMT)
MemBench: Towards Real-world Evaluation of Memory-Augmented Dialogue Systems [12.1] 長期記憶はチャットボットや対話システム(DS)にとって非常に重要であり、研究者は多数のメモリ拡張DSを開発した。
彼らはクエリが与えられた事実情報の正確さや生成したレスポンスの難解さだけを測定したが、それはそのパフォーマンスをほとんど反映しなかった。
本研究では,認知科学と心理学理論に基づく,記憶のリコールパラダイムを網羅する新しいベンチマークを構築した。
メモリベンチマーク(MemBench)は、認知科学における2句理論(メモリ検索、メモリ認識、注入)に基づく2つのタスクを含む。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:38:41 GMT)
Rethinking Emotion Bias in Music via Frechet Audio Distance [11.9] 我々は、音楽感情認識(MER)と感情音楽生成(EMG)の研究を行う。
本稿では,Frechet Audio Distance(FAD)と並行して,多様なオーディオエンコーダを用いる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:59:15 GMT)
Research on Dynamic Data Flow Anomaly Detection based on Machine Learning [11.5] 本研究では,非教師なし学習法を用いて動的データフローの異常を同定する。
類似したデータをクラスタリングすることで、ラベル付きデータを必要とせずに、通常のトラフィックから著しく逸脱するデータ挙動を検出することができる。
特に、不均衡なデータのコンテキストにおいて、堅牢で適応可能なパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:19:15 GMT)
A Framework for Human Evaluation of Large Language Models in Healthcare Derived from Literature Review [11.3] 我々は、標準化された一貫した人間評価アプローチに対する顕著なニーズを強調します。
大規模言語モデル(LLM)の人間評価のための包括的で実践的な枠組みを提案する。
このフレームワークは、異なる医療アプリケーションにおけるLCMの信頼性、一般化可能性、適用性を改善することを目的としている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:00:20 GMT)
CSPS: A Communication-Efficient Sequence-Parallelism based Serving System for Transformer based Models with Long Prompts [11.2] LLM (Long-sequence Generative Large-Language Model) が普及している。
提案手法は, 逐次チャンク処理により, TTFT (TimeToFirstToken) が高い結果が得られた。
本稿では,テンソル並列性(TP)と非TPの2つのアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:16:29 GMT)
Generative AI Is Not Ready for Clinical Use in Patient Education for Lower Back Pain Patients, Even With Retrieval-Augmented Generation [11.1] 腰痛 (LBP) は世界の障害の主要な原因である。
患者教育戦略の進歩にもかかわらず、LCP患者にパーソナライズされたエビデンスベースの情報を提供することで、大きなギャップが持続する。
大規模言語モデル(LLM)と生成人工知能(GenAI)の最近の進歩は、患者教育を強化する可能性を示している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:56:08 GMT)
Apparate: Rethinking Early Exits to Tame Latency-Throughput Tensions in ML Serving [10.9] 本稿では,機械学習モデルにおける早期退避を自動的に適用し,管理するシステムであるApparateを紹介する。
EEがもたらす時間的なオーバーヘッドと正確性に対処するために、Apparateは出口を再利用して継続的なフィードバックを提供する。
CVおよびNLP分類ワークロードの中央値応答レイテンシを40.5--91.5%と10.0--24.2%に下げる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:59:42 GMT)
Gaussian Déjà-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities [10.8] 本稿では,まず頭部アバターの一般化モデルを取得し,その結果をパーソナライズするガウス的D'eja-vuフレームワークを紹介する。
最先端の3Dガウシアンヘッドアバターをフォトリアリスティックな品質で上回り、既存の方法の少なくとも4分の1のトレーニング時間を短縮する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 00:11:30 GMT)
RAM2C: A Liberal Arts Educational Chatbot based on Retrieval-augmented Multi-role Multi-expert Collaboration [10.7] 我々は,このような対話データを自動的に生成する検索型多言語多言語協調フレームワークを設計する。
具体的には、まずHTS指導の知識基盤を確立し、スキル、心理学、安全倫理の3つの領域知識を包含する。
次に、RAM2Cは、上記の異なる知識ベースによって強化されたLLMを、異なる役割を持つ複数の専門家グループに編成し、HTS準拠の教育対話データセットを生成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:38:04 GMT)
MICSim: A Modular Simulator for Mixed-signal Compute-in-Memory based AI Accelerator [10.7] この研究はMICSimを紹介した。MICSimは、チップレベルのソフトウェア性能とCIM(Mixed-signal Compute-in-Memory)アクセラレータのハードウェアオーバーヘッドを評価するために設計された、オープンソースの回路前シミュレータである。
MICSimはモジュラー設計を特徴とし、多層共同設計と設計空間の探索が容易である。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:12:46 GMT)
How Does Return Distribution in Distributional Reinforcement Learning Help Optimization? [10.1] ニューラルネットワークZ-Iteration(Neural FZI)フレームワークにおける分布RLの最適化の利点について検討する。
その結果, 分布RLは良好な滑らかさ特性を有し, 安定な勾配を享受できることが示唆された。
本研究は,分布RLアルゴリズムの帰属分布が最適化にどう役立つかを明らかにする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 00:19:05 GMT)
Attention Heads of Large Language Models: A Survey [10.1] 本研究では,Large Language Models (LLMs) の内部理化プロセスについて,その基盤となるアテンションヘッドのメカニズムに焦点を絞って光を当てることを目的としている。
まず、人間の思考過程を4段階の枠組みに蒸留する。
この枠組みを用いて,既存の研究を体系的に検証し,特定の注目者の機能を特定し,分類する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:36:23 GMT)
SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.8] 本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。
学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。
我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:16:35 GMT)
Choose the Final Translation from NMT and LLM hypotheses Using MBR Decoding: HW-TSC's Submission to the WMT24 General MT Shared Task [9.8] 本稿では,Huawei Translate Services Center(HW-TSC)をWMT24汎用機械翻訳(MT)共有タスクに提出する。
我々は、正規化ドロップアウト、双方向トレーニング、データ多様化、前方翻訳、後方翻訳、交互学習、カリキュラム学習、トランスダクティブアンサンブル学習などのトレーニング戦略を用いて、ニューラルマシン翻訳(NMT)モデルをトレーニングする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:25:37 GMT)
Domino: Eliminating Communication in LLM Training via Generic Tensor Slicing and Overlapping [9.6] 大規模言語モデル(LLM)を大規模にトレーニングする場合、通信オーバーヘッドがより顕著になる。
計算の背後にある通信を隠蔽する汎用的なスキームであるDominoを提案する。
DominoはNvidia DGX-H100 GPU上でのLLMトレーニングの最大1.3倍の高速化を実現している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:38:52 GMT)
From Zero to Hero: How local curvature at artless initial conditions leads away from bad minima [9.5] 複雑な損失景観のケーススタディとして,位相探索問題に焦点をあてる。
スペクトルの遷移が起こり、方向が失われ、システムが悪いミニマに閉じ込められることを示す。
我々の分析は、有限次元の勾配勾配勾配ダイナミクスを促進する新しいメカニズムに光を当てている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:00:09 GMT)
Efficient Tabular Data Preprocessing of ML Pipelines [9.2] データ前処理パイプラインは機械学習(ML)トレーニングの重要なコンポーネントである。
Piperは、データ前処理のためのハードウェアアクセラレータで、FPGA上でプロトタイプし、商用レコメンデータシステムのパイプラインをトレーニングする可能性を実証している。
Piperは128コアのCPUサーバ上でのレイテンシの高速化を4.7$sim$ 71.3$times$達成し、バイナリ入力を使用する場合のデータセンタGPUの4.8$sim$ 20.3$times$を上回っている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:07:57 GMT)
Not Only the Last-Layer Features for Spurious Correlations: All Layer Deep Feature Reweighting [9.1] 急激な相関と戦うための強力なアプローチは、バランスの取れたバリデーションデータセットで最後のレイヤを再トレーニングすることです。
重要な属性は、ニューラルネットワークによって最後のレイヤに向けて破棄されることがある。
本研究では,すべての層から派生した特徴の集合上で,分類器を再学習することを検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 00:31:39 GMT)
Improving Adversarial Robustness for 3D Point Cloud Recognition at Test-Time through Purified Self-Training [9.1] 3Dポイントのクラウドディープラーニングモデルは、敵の攻撃に対して脆弱である。
敵の浄化は 生成モデルを使って 敵の攻撃の影響を緩和する
そこで我々は,この目的を達成するために,テスト時間浄化型自己学習戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:46:38 GMT)
Lessons Learned on Information Retrieval in Electronic Health Records: A Comparison of Embedding Models and Pooling Strategies [8.8] 大きな言語モデルを臨床領域に適用することは、医療記録を処理するという文脈重大な性質のために困難である。
本稿では, 組込みモデルとプール法の違いが臨床領域の情報検索に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:16:08 GMT)
RoWSFormer: A Robust Watermarking Framework with Swin Transformer for Enhanced Geometric Attack Resilience [8.8] 本稿では,RoWSFormer という Swin Transformer をベースとしたロバストな透かしフレームワークを提案する。
具体的には、エンコーダとデコーダの両方のコアとして、ローカルチャネル拡張スウィントランスブロックを設計する。
多くの非幾何学的攻撃に対して、RoWSFormerは同じ抽出精度を維持しながらPSNRを3dB改善する。
幾何攻撃の場合、RoWSFormerはPSNRの6dB以上の改善を実現し、抽出精度は97%を超えた。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:59:55 GMT)
Fair Overlap Number of Balls (Fair-ONB): A Data-Morphology-based Undersampling Method for Bias Reduction [8.7] 信頼できる人工知能における分類問題に関する重要な問題の1つは、異なるクラスの予測において公平性を保証することである。
トレーニングデータのバイアスが機械学習に反映され、人間の生活に影響を与え、現在の規制に従わないため、これらのケースではデータ品質が重要になります。
本研究は,各データ群のデータ形態を利用したアンダーサンプリング手法であるフェアオーバーラップボール数(Fair-ONB)を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:52:05 GMT)
Human-Centered LLM-Agent User Interface: A Position Paper [8.7] 大規模言語モデル (LLM) - ループ内でのアプリケーションは、人間のコマンドを効果的に解釈できることが示されている。
基盤となるツールやシステムにほとんど無知なユーザは、LAUIを使って創発的なワークフローを見つけることができるべきです。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:41:04 GMT)
CritiPrefill: A Segment-wise Criticality-based Approach for Prefilling Acceleration in LLMs [8.6] 本稿では,CritiPrefillを提案する。
CritiPrefillは、入力シーケンスのクエリとKVキャッシュをセグメントとブロックに分割する。
複数の長コンテキストデータセットの大規模な評価では、Llama3-8Bで2.7倍、Yi-9Bで3.0倍、単一のA100 GPUで128Kのコンテキスト長を持つ。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:24:33 GMT)
PipeFill: Using GPUs During Bubbles in Pipeline-parallel LLM Training [8.6] PipeFillは、他の保留中のジョブの実行でパイプラインバブルを埋める。
大規模なLLMトレーニングで使用されるGPUでは,PipeFillが全体の利用率を最大63%向上させることができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:39:05 GMT)
Adaptive and Robust Watermark for Generative Tabular Data [8.6] 生成表データに対するフレキシブルでロバストな透かし機構を提案する。
ウォーターマークされたデータセットがデータ品質と下流のユーティリティに無視できる影響があることを理論的および実証的に示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 04:37:30 GMT)
Uncovering Coordinated Cross-Platform Information Operations Threatening the Integrity of the 2024 U.S. Presidential Election Online Discussion [8.6] 情報操作は民主的プロセスの完全性に重大な脅威をもたらす。
2024年のアメリカ合衆国大統領選挙を期待して、調整されたIOのデジタルトレースを$mathbbX$(元Twitter)で発見することを目的とした研究を発表した。
オンラインコーディネーションを検出するための機械学習フレームワークを用いて,2024年5月からの選挙関連会話を含むデータセットをmathbbX$で分析した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:36:14 GMT)
Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely [8.5] 外部データで拡張された大規模言語モデル(LLM)は、現実世界のタスクを完了させる際、顕著な能力を示した。
Retrieval-Augmented Generation (RAG) とファインチューニングが注目され、広く応用されている。
しかし、データ拡張LDMを様々な専門分野に効果的に展開することは、重大な課題である。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:20:20 GMT)
FisheyeDepth: A Real Scale Self-Supervised Depth Estimation Model for Fisheye Camera [8.5] 魚眼カメラに適した自己監督深度推定モデルである魚眼深度について述べる。
魚眼カメラモデルを訓練中の投射と再投射の段階に組み込んで画像歪みの処理を行う。
また、連続するフレーム間の幾何学的投影に実際のポーズ情報を組み込んで、従来のポーズネットワークで推定されたポーズを置き換える。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:31:42 GMT)
DSG-KD: Knowledge Distillation from Domain-Specific to General Language Models [8.3] 本研究は,韓国の小児救急部門(PED)から得られた電子カルテ(EMR)データに基づく緊急時・緊急時・緊急時分類タスクについて検討した。
既存のドメイン固有の事前学習言語モデルは、N言語自由テキストデータ特性を扱う場合の一般的な言語モデルと比較して性能が劣る。
本稿では,知識蒸留を利用したドメイン知識伝達手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:59:02 GMT)
Physics Enhanced Residual Policy Learning (PERPL) for safety cruising in mixed traffic platooning under actuator and communication delay [8.2] 線形制御モデルは、その単純さ、使いやすさ、安定性解析のサポートにより、車両制御に広範囲に応用されている。
一方、強化学習(RL)モデルは適応性を提供するが、解釈可能性や一般化能力の欠如に悩まされる。
本稿では,物理インフォームドポリシによって強化されたRL制御系の開発を目標とする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:02:34 GMT)
SAMEdge: An Edge-cloud Video Analytics Architecture for the Segment Anything Model [8.0] エッジユーザのためのSAM計算をサポートするために設計された,新しいエッジクラウドコンピューティングアーキテクチャであるPamedgeを提案する。
Madedgeはエッジとクラウドの新たなモジュールを統合して、視覚的なプロンプト下での分析精度を最大化し、遅延制約のある入力プロンプトをイメージする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:59:09 GMT)
From Text to Treatment Effects: A Meta-Learning Approach to Handling Text-Based Confounding [7.5] 本稿では,テキストに変数を埋め込んだ場合のメタラーナーの性能について検討する。
共同創設者の事前学習したテキスト表現を用いた学習者は,CATE推定精度の向上を図っている。
テキスト埋め込みの絡み合った性質のため、これらのモデルは、完全な共同創設者の知識を持つメタ学習者のパフォーマンスと完全には一致しない。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:46:19 GMT)
Learning from Contrastive Prompts: Automated Optimization and Adaptation [7.5] 本稿では,高速な最適化と適応を実現するためのLCP(Learning from Contrastive Prompts)フレームワークを提案する。
LCPは、良い例と悪い例のパターンを分析することによって効果的なプロンプトを生成するために、対照的な学習を採用している。
我々のBig-Bench Hardデータセットに対する評価は、LCPが既存の最適化手法よりも76%以上勝っていることを示している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:47:23 GMT)
Unveiling the Potential of Graph Neural Networks in SME Credit Risk
Assessment [7.3] 本稿では、グラフニューラルネットワークを技術的枠組みとして捉え、企業財務指標間の本質的な関係を統合し、企業信用リスク評価モデルを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:41:54 GMT)
BehaVR: User Identification Based on VR Sensor Data [7.1] これは、VRデバイス上で実行される複数のアプリによって収集されたすべてのセンサグループからのデータを収集し、分析するフレームワークである。
私たちはBehaVRを使って、20の人気のある現実世界のアプリと対話する実際のユーザーからデータを収集しています。
私たちは、利用可能なセンサデータから機能を抽出して、アプリ内およびアプリ間のユーザ識別のための機械学習モデルを構築します。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:13:55 GMT)
A study of why we need to reassess full reference image quality assessment with medical images [7.0] 特に、FR-IQA測度PSNRとSSIMは、多くの自然画像処理に成功するために知られ、テストされている。
本稿では、2つの最も一般的なフルレファレンス(FR)画像品質尺度が、新しいアルゴリズムの評価に不適であることを証明した、構造化された総合的な例のコレクションを提供する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:17:30 GMT)
Enhancing Visual Question Answering through Ranking-Based Hybrid Training and Multimodal Fusion [7.0] Rank VQAモデルは、Faster R-CNNモデルと、事前訓練されたBERTモデルから得られたリッチセマンティックテキスト特徴を用いて抽出された高品質な視覚特徴を統合する。
回答の相対ランク付けを最適化するためにランキング学習モジュールが組み込まれ、回答精度が向上する。
我々のモデルは、標準VQAデータセットにおける既存の最先端モデルよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 04:46:26 GMT)
zsLLMCode: An Effective Approach for Functional Code Embedding via LLM with Zero-Shot Learning [7.0] 大型言語モデル(LLM)はゼロショット学習の能力を持ち、訓練や微調整を必要としない。
LLMを用いた関数型コード埋め込みを生成する新しいアプローチであるzsLLMCodeを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 01:03:15 GMT)
Reliability Function of Classical-Quantum Channels [7.0] 一般古典量子チャネルの信頼性関数について検討する。
我々は、信頼性関数に対するペッツ形式における量子レニー情報の観点から、低い境界を証明した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:24:30 GMT)
Curb Your Attention: Causal Attention Gating for Robust Trajectory Prediction in Autonomous Driving [6.9] 自律走行における軌道予測モデルは、非因果エージェントの摂動に弱い。
過去のステップのウィンドウ上で、エージェント間の因果関係を特定するために、$textitCausal tRajecTory predICtion$ $textbf(CRiTIC)$を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:01:20 GMT)
CauSkelNet: Causal Representation Learning for Human Behaviour Analysis [6.9] 本研究では,人間の関節動態や複雑な動作をよりよく理解するために,因果推論に基づく表現学習手法を提案する。
我々のアプローチは、人間の動作分析を前進させ、より適応的なインテリジェントヘルスケアソリューションの道を開く。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:38:49 GMT)
Eagle: Efficient Training-Free Router for Multi-LLM Inference [6.8] さまざまな能力とコストを持つ大規模言語モデル(LLM)は、AIシステムにおける効率的なモデル選択の必要性を生み出している。
グローバルおよびローカルELOランキングモジュールを組み合わせた,新しいLLMルーティング手法であるEagleを提案する。
イーグルは、AUC(Area Under Curve)スコアで最大23.2%の改善とともに、ベースライン法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:10:10 GMT)
Neural refractive index field: Unlocking the Potential of Background-oriented Schlieren Tomography in Volumetric Flow Visualization [6.7] 本研究はニューラル屈折指数場(NeRIF)と呼ばれる革新的な再構成手法を提案する。
NeRIFはニューラルネットワークで流れの場を暗黙的に表現する。
乱流文泉火炎における数値シミュレーションと実験実験の両方により, 再現精度と空間分解能を大幅に向上させることができることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:40:50 GMT)
Analysis of Human Perception in Distinguishing Real and AI-Generated Faces: An Eye-Tracking Based Study [6.7] 本研究では,人間がどのように実像と偽像を知覚し,区別するかを検討する。
StyleGAN-3生成画像を解析したところ、参加者は76.80%の平均精度で偽の顔と現実を区別できることがわかった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:34:30 GMT)
Large Language Models Are Involuntary Truth-Tellers: Exploiting Fallacy Failure for Jailbreak Attacks [6.6] 言語モデルでは、誤った推論や偽りの推論を発生させることが困難であることがわかった。
本稿では、悪意のある出力に対して一致した言語モデルを引き出すジェイルブレイク攻撃法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:48:20 GMT)
CURO: Curriculum Learning for Relative Overgeneralization [6.6] 相対的オーバージェネリゼーション(Relative Over generalization, RO)は、協調的なマルチエージェントタスクで発生する病理である。
相対オーバージェネリゼーション(CURO)のためのカリキュラム学習という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:43:25 GMT)
On-device Training: A First Overview on Existing Systems [6.6] リソース制約のあるデバイスにいくつかのモデルをデプロイする努力も行われている。
この研究は、デバイス上でモデルトレーニングを可能にする最先端のシステム研究を要約し、分析することを目的としている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:59:38 GMT)
MapEx: Indoor Structure Exploration with Probabilistic Information Gain from Global Map Predictions [6.4] 我々は、しばしば予測可能で繰り返しパターンから構成される、構造化された屋内環境を探索するロボットに焦点を当てる。
近年の研究では、深層学習技術を用いて地図の未知領域を予測し、これらの予測を情報ゲイン計算に利用している。
本研究では,予測地図を用いて情報ゲイン推定のための確率的センサモデルを構築する新しい探索フレームワークであるMapExを紹介する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:48:04 GMT)
Generative LLM Powered Conversational AI Application for Personalized Risk Assessment: A Case Study in COVID-19 [6.4] 大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な能力を示している。
本研究は,ヒトとAIの会話をストリーミングすることで,LSMを用いた新たな疾病リスク評価手法を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:55:13 GMT)
Can It Edit? Evaluating the Ability of Large Language Models to Follow Code Editing Instructions [6.4] コード編集タスクのベンチマークを導入し、それをいくつかの最先端LCMの評価に利用する。
我々の評価は、最先端のオープンモデルとクローズドモデルの間の大きなギャップを露呈する。
我々は、自然言語命令と組み合わされたコード編集タスクの新しい、慎重にキュレートされ、パーミッシブにライセンスされたトレーニングデータセットを導入する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:57:18 GMT)
Accountable authentication with privacy protection: The Larch system for universal login [6.2] larchは、強力なセキュリティとプライバシ特性を備えた、説明可能な認証フレームワークである。
FIDO2、TOTP、パスワードベースのログインのためのlarchを実装している。
4コアのクライアントと8コアのログサーバを持つと、larchによる認証はFIDO2で150ms、TOTPで91ms、パスワードで74msとなる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:11:02 GMT)
Temperature shift of magnetic-field-dependent photoluminescence features of nitrogen-vacancy ensembles in diamond [6.2] 幅広い磁場で観測できる様々な特徴の温度変動について検討した。
幅広い特徴の熱的挙動に関する深い洞察は、様々な応用に重要な結果をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:27:28 GMT)
Reducing Energy Bloat in Large Model Training [6.1] トレーニング中に消費されるすべてのエネルギーが、エンドツーエンドのスループットに直接寄与する訳ではない。
本研究では,大規模モデルトレーニングにおける2つの独立したエネルギー肥大源を特定し,両者を緩和するトレーニングシステムであるPerseusを提案する。
これを実現するために、Perseusは効率的なグラフカットベースのアルゴリズムを用いて、大規模なモデルトレーニングジョブの時間-エネルギートレードオフフロンティアを取得し、時間にわたってエネルギー消費をスケジュールし、両方のタイプのエネルギー肥大を減少させる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:02:41 GMT)
3D Gaussian Splatting for Large-scale Surface Reconstruction from Aerial Images [6.1] AGS(Aerial Gaussian Splatting)という,空中多視点ステレオ(MVS)画像を用いた3DGSによる大規模表面再構成手法を提案する。
まず,大規模空中画像に適したデータチャンキング手法を提案する。
次に,レイ・ガウス断面積法を3DGSに統合し,深度情報と正規情報を得る。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:07:08 GMT)
Deep Reinforcement Learning-based Obstacle Avoidance for Robot Movement in Warehouse Environments [6.1] 本稿では,移動ロボット障害物回避アルゴリズムである倉庫環境に基づく深層強化学習を提案する。
深部強化学習アルゴリズムにおける値関数ネットワークの学習能力不足に対して、歩行者間の相互作用情報を歩行者角度グリッドを介して抽出する。
歩行者の空間行動に基づいて、強化学習の報酬関数を設計し、その角度が過度に変化する状態に対して、ロボットを罰する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:42:35 GMT)
Data governance: A Critical Foundation for Data Driven Decision-Making in Operations and Supply Chains [5.9] 本研究は、運用・サプライチェーン管理(OSCM)分野におけるデータガバナンス(DG)研究への注目を喚起することを目的とする。
3つのケーススタディに基づいて、業界における実生活データ問題を調べ分析した。
1)人的要因,2)ルールや規則の欠如,3)非効率な技術ハードウェアとソフトウェア,4)リソースの欠如,の4つの原因が判明した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:41:56 GMT)
Fully automatic extraction of morphological traits from the Web: utopia
or reality? [5.9] 本研究では,植物形質に関する情報を非構造的テキスト記述形式で収集・処理する機構を提案する。
その結果, F1スコアは75%以上であった。
この結果から,LLMの情報抽出機能により,構造化された特徴データベースの大規模作成が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:40:24 GMT)
Distributed Differentiable Dynamic Game for Multi-robot Coordination [5.8] 我々は,ロボットの動作が,他者の行動にも依存する自身のダイナミクスと目的によって決定される動的ゲームとして,マルチロボット協調を定式化する。
本稿では,マルチロボット協調における前方および逆問題の効率よく解決できる分散微分可能動的ゲーム(D3G)フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:07:38 GMT)
Don't Use LLMs to Make Relevance Judgments [5.7] 最近の大きな言語モデルの出現は、自然言語のプロンプトに反応して、驚くべきほど人間らしく流れるテキストを生成することで、IR研究者は、それらのモデルが関連判断の収集プロセスでどのように使われるのか疑問に思うようになった。
ACM SIGIR 2024 カンファレンスでは,ワークショップ LLM4Eval' が,この作業の場を提供し,TREC 深層学習トラックの判断を再現するデータチャレンジ活動を開催した。
ボトムアップフロントのメッセージは、TRECスタイルの評価のための関連判断を作成するためにLLMを使用しないことです。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:38:12 GMT)
BoQ: A Place is Worth a Bag of Learnable Queries [5.5] Bag-of-Queries (BoQ)は、普遍的な場所特化属性をキャプチャするために設計されたグローバルクエリセットを学習する。
BoQは異なる学習可能なグローバルクエリを採用し、クロスアテンションを通じて入力機能を探索する。
NetVLAD、MixVPR、EigenPlacesといった最先端技術よりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:59:21 GMT)
Identifying Elasticities in Autocorrelated Time Series Using Causal Graphs [5.5] 機器変数を用いた観測データから需要の価格弾力性の推定(IV)
因果時間グラフはIV同定を単純化し、一貫した推定器を選択するのに役立つと論じる。
この手法をドイツの電力市場に適用し、シミュレーションおよび実世界のデータに基づいて需要の価格弾力性を推定する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:28:08 GMT)
Safe Guard: an LLM-agent for Real-time Voice-based Hate Speech Detection in Social Virtual Reality [5.4] ソーシャルVR(VRChat)における音声によるヘイトスピーチ検出のためのLLMエージェントであるSafe Guardを提案する。
本システムは,リアルタイム音声対話において,Open AI GPTと音声特徴抽出を利用する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:54:45 GMT)
Bilingual Rhetorical Structure Parsing with Large Parallel Annotations [5.4] 我々は,大規模で多様な英語GUM RSTコーパスに対して,パラレルなロシア語アノテーションを導入する。
我々のエンドツーエンドRTTは、英語とロシア語のコーパスで最先端の結果を得る。
我々の知る限り、この研究は、手動で注釈付けされた並列コーパス上での言語間エンドツーエンドのRTT解析の可能性を評価する最初のものである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:40:33 GMT)
Kriformer: A Novel Spatiotemporal Kriging Approach Based on Graph Transformers [5.4] 本研究は, 環境問題として, スパースセンサの配置と信頼性の低いデータに対処する。
グラフクリフォーマーモデルであるKriformerは、限られた資源であっても、空間的および時間的相関をマイニングすることで、センサのない場所でデータを推定する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:01:18 GMT)
Necessary and Sufficient Condition for Randomness Certification from Incompatibility [5.4] 量子ランダム性はベル非局所性またはアインシュタイン-ポドルスキー-ローゼンステアリングを示す確率的挙動から証明することができる。
不整合性の観点からは,不整合性不整合性に対する必要十分条件を提供する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:13:47 GMT)
A Survey on Large Language Models from General Purpose to Medical Applications: Datasets, Methodologies, and Evaluations [5.3] 本調査は,オープンソース汎用LSMをベースとした医療用LSMのトレーニング方法を体系的にまとめたものである。
a) トレーニングコーパスの取得方法、カスタマイズされた医療トレーニングセットの構築方法、(b) 適切なトレーニングパラダイムの選択方法、(d) 既存の課題と有望な研究方向性をカバーしている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:45:29 GMT)
Reducing the Footprint of Multi-Vector Retrieval with Minimal Performance Impact via Token Pooling [5.2] ColBERTによって先導されたマルチベクター検索手法は、ニューラルIRに対するアプローチとしてますます人気が高まっている。
しかし、大量のベクトルを格納するために必要なストレージとメモリの要求は、依然として重要な欠点である。
簡単なクラスタリングベースのトークンプーリング手法を導入し、保存が必要なベクトルの数を積極的に削減する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:12:43 GMT)
Revealing an Unattractivity Bias in Mental Reconstruction of Occluded Faces using Generative Image Models [5.2] 以前の研究では、顔が部分的に隠されているとき、より魅力的なものとして評価されていることが示されている。
1つの説明は、難易度評価タスクで示されるように、より魅力的な知覚に偏った、隠蔽された顔部分の精神的再構成である。
この仮説を,心的再建を直接必要とする遅延マッチングタスクを用いて検証した。
我々の実験は、最初の仮説を支持しておらず、隠蔽された顔に対する魅力のないバイアスを明らかにします。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:10:19 GMT)
Robust Second-order LiDAR Bundle Adjustment Algorithm Using Mean Squared Group Metric [5.2] 我々は,LiDAR BAアルゴリズムの最適化目標を構築するために,新しい平均2乗群計量(MSGM)を提案する。
堅牢なカーネル関数を統合することで、BAアルゴリズムに関わるメトリクスを再重み付けし、ソリューションプロセスの堅牢性を高める。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:38:55 GMT)
A Security Risk Taxonomy for Prompt-Based Interaction With Large Language Models [5.1] 本稿では,大規模言語モデル(LLM)によるセキュリティリスクに着目し,現在の研究のギャップに対処する。
我々の研究は,ユーザモデル通信パイプラインに沿ったセキュリティリスクの分類を提案し,一般的に使用されている機密性,完全性,可用性(CIA)3つのトライアドと並行して,ターゲットタイプと攻撃タイプによる攻撃を分類する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:23:02 GMT)
Indoor Air Quality Dataset with Activities of Daily Living in Low to Middle-income Communities [5.0] インドでは夏と冬の6ヶ月間に30箇所の屋内から空気の質を測定した。
データセットにはさまざまな種類の屋内環境が含まれている。
発展途上国のユニークな汚染パターンに対応することを目的としたデータ駆動学習モデル研究の基盤を提供することができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 06:46:19 GMT)
Mixing Data-driven and Geometric Models for Satellite Docking Port State Estimation using an RGB or Event Camera [5.0] この研究は、最近リリースされたLockheed Martin Mission Augmentation Port (LM-MAP) をターゲットとして、衛星に依存しない運用に焦点を当てている。
本稿では,標準RGBセンサやイベントカメラの単眼視データを用いて,衛星ドッキングポートの自動検出と状態推定を行うパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:28:09 GMT)
Improved Routing of Multiparty Entanglement over Quantum Networks [4.8] 本稿では,GHZ状態を共有するための2つのグラフ状態ベースのルーティングプロトコルを提案する。
任意のネットワークトポロジに対して、上記の木が最適な結果を得るための特別な構成を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:52:44 GMT)
When Context Leads but Parametric Memory Follows in Large Language Models [4.6] 大規模言語モデル (LLM) は多様な知識源の活用において顕著な進歩を見せている。
本研究では,9つのLLMがオープンな質問に対して,局所的な文脈とグローバルなパラメータの知識を割り当てる方法について検討した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 00:42:36 GMT)
Optimizing News Text Classification with Bi-LSTM and Attention Mechanism for Efficient Data Processing [4.5] 本稿では,ディープラーニングに基づくニューステキストの自動分類手法を提案する。
高度な機械学習アルゴリズムを導入することにより、ニューステキストの効率的な分類と管理を実現する。
ニュース業界の情報処理能力を向上させるために重要な実践的重要性を持っている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:23:08 GMT)
Feeding the Crave: How People with Eating Disorders Get Trapped in the Perpetual Cycle of Digital Food Content [4.5] 摂食障害のある人を対象に,デジタル食品を消費する動機と実践を理解するために2つの研究を行った。
本研究は、参加者が食品メディアの症状を克服するために陽性効果を期待していることを明らかにするが、実際には障害を悪化させることがしばしばある。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:50:41 GMT)
Classification of Breast Cancer Histopathology Images using a Modified Supervised Contrastive Learning Method [4.3] モデルロバスト性を高めるために、画像レベルラベルとドメイン固有の拡張の両方を活用することで教師付きコントラスト学習法を改善する。
乳癌の病理組織像から得られたBreakHisデータセットについて検討した。
この改良は93.63%の絶対精度に対応し、データの特性を利用してより適切な表現空間を学習するアプローチの有効性を強調した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:08:53 GMT)
Coherent population trapping and spin relaxation of a silicon vacancy center in diamond at mK temperatures [4.3] 1K以下では、自然に豊富な13C原子のスピン浴によって引き起こされるものと比べ、フォノン誘起のスピン脱落は無視できる。
スピン寿命の100倍近い増加は、温度が4Kから1K以下に下がったときに観測される。
2フォノンスピンフリップ遷移は、SiV基底状態のスピン緩和において重要な役割を果たす。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:49:09 GMT)
OMPar: Automatic Parallelization with AI-Driven Source-to-Source Compilation [4.3] 本稿では,OpenMP pragmasを用いたC/C++コードの並列化を自動化するAI駆動型ツールであるOMParを紹介する。
OMParは、ループ並列化ポテンシャルを評価するOMPifyと、正確なOpenMPパグマを生成する新しい微調整モデルであるMonoCoder-OMPの2つの主要なコンポーネントを通じて、LLM(Large Language Models)を統合している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:39:01 GMT)
EDSNet: Efficient-DSNet for Video Summarization [4.1] 従来の注意をフーリエ、ウェーブレット変換、Nystrオムフォーマなどの代替品に置き換えることで、効率と性能が向上することを示す。
私たちの仕事は、ビデオ要約タスクに対して、よりスケーラブルなソリューションを提供します。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:43:37 GMT)
Fast and Accurate Triangle Counting in Graph Streams Using Predictions [4.0] 本稿では, グラフストリーム中の三角形の数を予測した最初の効率的かつ実用的なアルゴリズムを提案する。
提案アルゴリズムは,待機室サンプリングと貯水池サンプリングと,エッジの重み,すなわちエッジが関与する三角形の数の予測器を組み合わせる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:52:11 GMT)
ChatGPT as a Solver and Grader of Programming Exams written in Spanish [3.9] 我々はChatGPTの能力を評価し、実際のプログラミング試験を解き、評価する。
我々の研究結果は、このAIモデルは単純なコーディングタスクを解くのにのみ有効であることを示唆している。
複雑な問題に対処する能力や、他の人によって書かれたソリューションを評価する能力は、決して効果的ではない。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:20:07 GMT)
The Number of Trials Matters in Infinite-Horizon General-Utility Markov Decision Processes [3.9] 無限水平GUMDPにおいて試行回数が重要な役割を担い、ある政策の期待性能は一般に試行数に依存することを示す。
まず, 割引GUMDPによる政策評価について検討し, GUMDPの有限と無限の試験式間のミスマッチについて, 下位と上位の境界を証明した。
第2に、GUMDPの異なるクラスが、有限と無限の試行公式のミスマッチにどのように影響するかを研究することで、平均的なGUMDPに対処する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:34:45 GMT)
Exploring Public Attention in the Circular Economy through Topic Modelling with Twin Hyperparameter Optimisation [3.7] 本研究は, 一般の注意の進化, 循環生成物に関する大衆の認知経路, および主要な関心事を明らかにすることを目的としている。
Twitter、Reddit、The Guardianといったさまざまなプラットフォームからデータを収集し、3つのトピックモデルを使用してデータを分析しました。
我々の最適化されたモデルは、持続可能性や円周的なプラクティスの経済的影響について、国民が懸念していることを明らかにする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:21:51 GMT)
Interval spectrum for electric quantum walk and related skew-shift CMV matrices [3.6] 電場を持つ量子ウォークモデルの族に対して、スペクトルは任意の不合理体に対する単位円であることを示す。
この結果は、スキューシフトによって定義される関連するCMV行列についても成り立つ。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:49:58 GMT)
Membership Inference Attacks and Privacy in Topic Modeling [3.5] トレーニングデータのメンバーを確実に識別できるトピックモデルに対する攻撃を提案する。
本稿では,DP語彙選択を前処理ステップとして組み込んだプライベートトピックモデリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:57:56 GMT)
Generalizing monocular colonoscopy image depth estimation by uncertainty-based global and local fusion network [3.4] 本研究の目的は,大腸内視鏡画像によく応用できる堅牢なフレームワークを開発することである。
本稿では,局所的な特徴を捉えるための畳み込みニューラルネットワーク(CNN)と,グローバルな情報を取得するためのトランスフォーマーを組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:30:59 GMT)
Clinical-grade Multi-Organ Pathology Report Generation for Multi-scale Whole Slide Images via a Semantically Guided Medical Text Foundation Model [3.4] 患者に対する病理報告を生成するために, 患者レベル多臓器報告生成(PMPRG)モデルを提案する。
我々のモデルはMETEORスコア0.68を達成し、我々のアプローチの有効性を実証した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:22:32 GMT)
A new baseline for edge detection: Make Encoder-Decoder great again [3.3] 提案されたNew Baseline for Edge Detection (NBED)は、複数のエッジ検出ベンチマークで一貫してパフォーマンスを向上する。
BSDS500におけるNBEDのODSは0.838であり、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:54:38 GMT)
Circuit decompositions and scheduling for neutral atom devices with limited local addressability [3.3] 現在の中性原子アーキテクチャは、ブロッホ球のxy平面の軸の1量子ビット回転の局所的アドレス付けをサポートしない。
本稿では,任意のゲートセットからグローバルゲートを含むリアルな中性原子ネイティブゲートセットに入力回路を変換する最適化コンパイラパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:51:30 GMT)
Using Similarity to Evaluate Factual Consistency in Summaries [2.8] 抽象要約器は流動的な要約を生成するが、生成したテキストの事実性は保証されない。
本稿では,ゼロショット事実性評価尺度であるSBERTScoreを提案する。
実験の結果,SBERTScoreでは,各手法の強度が異なることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:02:38 GMT)
Bi-modality Images Transfer with a Discrete Process Matching Method [2.7] 両モード画像転送タスクを実現するために,新しいフローベースモデルである離散プロセスマッチング(DPM)を提案する。
MRI T1/T2とCT/MRIの3つのデータセットに対する実験により、DPMは両モード画像合成における他の最先端フローベース手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:17:45 GMT)
DeepCloth-ROB$^2_{\text{QS}}$P&P: Towards a Robust Robot Deployment for Quasi-Static Pick-and-Place Cloth-Shaping Neural Controllers [2.7] シミュレーショントレーニングされた視覚ベースのデータ駆動型ニューラルネットワークと実世界の操作の間の忠実度ギャップは、シミュレーションから物理実験へのメソッドの信頼性を損なう。
We propose DeepCloth-ROB$2_textQS$P&P with a Simulation-to-Reality transfer strategy Towel-Sim2Real and a cloth grasping protocol。
私たちのアプローチでは、実環境で複数のニューラルコントローラを初めて比較することができ、布の操作コミュニティに貴重な洞察を与えます。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:08:16 GMT)
SPEED: Scalable Preprocessing of EEG Data for Self-Supervised Learning [2.7] 自己教師付き学習に最適化されたPythonベースのEEG前処理パイプラインを提案する。
この最適化は、自己教師付きトレーニングを安定化し、下流タスクのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:30:15 GMT)
Beyond Fine-tuning: Unleashing the Potential of Continuous Pretraining for Clinical LLMs [2.5] 大言語モデル (LLMs) は臨床応用の転換に有意な可能性を示唆している。
臨床応用には, 連続事前訓練, 微調整, NEFTune, 即時工学の4つの手法を応用した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:09:57 GMT)
VaLID: Verification as Late Integration of Detections for LiDAR-Camera Fusion [2.5] LiDARの使用法は一般的にカメラのみを使用する方法よりも優れている。
本稿では,各予測境界ボックスが許容可能であるかどうかを検証したモデル独立遅延融合法VaLIDを提案する。
提案手法はモデル非依存であり,汎用カメラ検出器を用いた場合においても,最先端の競争性能を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:27:10 GMT)
Unbiased third-party bots lead to a tradeoff between cooperation and social payoffs [2.5] 人工知能(AI)の台頭は、より適用性と制御性の高い協調力学に影響を与える新たな機会を提供する。
我々は、不偏のボットは、よく混ざった集団の正常なプレイヤーの間で欠陥均衡をシフトできないことを示した。
構造化された集団では、不偏な行動にもかかわらず、ボットは自発的に共同作業者や欠陥者に対して異なる影響を生じさせ、協力の強化につながった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:50:12 GMT)
Generalized conformal quantum mechanics as an ideal observer in two-dimensional gravity [2.4] 我々は、荷電粒子の運動の二重スケーリング限界から、ジャッキー・タイテルボイム重力に結合した一般化共形力学(GCM)に対する作用を得る。
フル理論の半古典的ヒルベルト空間は、GCM に対するシュル「オーディンガー方程式」の一般時依存正規化解を明示的に解いて構成する。
JT重力に結合したGCMの完全な理論は量子化に寄与するので、量子重力に結合した検出器の可解モデルにつながる可能性がある。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:00:01 GMT)
Validity Learning on Failures: Mitigating the Distribution Shift in Autonomous Vehicle Planning [2.4] 計画問題は、自律運転フレームワークの基本的な側面を構成する。
この問題に対処するための対策として,失敗に対する妥当性学習,VL(on failure)を提案する。
VL(on failure)は最先端の手法よりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:47:50 GMT)
On demand single photon generation and coherent control of excitons from resonantly driven nanowire quantum dots [2.3] ナノワイヤベースの量子ドット源は、オンチップハイブリッド統合の可能性から人気がある。
共振励起InAsP/InPナノワイヤ量子ドットからのオンデマンド単光子生成を実証する。
ハイブリッド量子フォトニクス統合の道を開き、スピン光子絡み合いと物質記憶をチップ上で実現している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:29:41 GMT)
ZeroSCD: Zero-Shot Street Scene Change Detection [2.3] Scene Change Detectionは、コンピュータビジョンとロボティクスにおいて難しいタスクである。
従来の変更検出方法は、これらのイメージペアを入力として、変更を見積もるトレーニングモデルに依存しています。
我々は,ゼロショットシーン変化検出フレームワークであるZeroSCDを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:53:44 GMT)
Rapid Bayesian identification of sparse nonlinear dynamics from scarce and noisy data [2.3] 我々はベイジアンフレームワーク内でSINDy法をリキャストし、ガウス近似を用いて計算を高速化する。
ベイジアン・シンディは推定したパラメータの不確かさを定量化するが、限られたノイズのあるデータから正しいモデルを学ぶ際にもより堅牢である。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:51:21 GMT)
IGCN: Integrative Graph Convolution Networks for patient level insights and biomarker discovery in multi-omics integration [2.1] 本稿では,癌分子サブタイプとバイオメディカル分類のための新しい統合ニューラルネットワークアプローチを提案する。
IGCNは、特定のクラスを予測するために患者に対してどのタイプのオミクスがより強調されるかを特定することができる。
IGCNは、様々なオミクスデータタイプから重要なバイオマーカーを特定できる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:15:07 GMT)
An Effective Deployment of Diffusion LM for Data Augmentation in Low-Resource Sentiment Classification [2.1] 感性分類(SC)は、ドメイン固有のコンテキスト、不均衡なラベル分布、少数ショットシナリオなど、低リソースの課題に悩まされることが多い。
我々はDiffusion LMを提案し、強力なラベル関連トークンを再構成することでドメイン内の知識を捕捉し、擬似サンプルを生成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:39:34 GMT)
Skills Made to Order: Efficient Acquisition of Robot Cooking Skills Guided by Multiple Forms of Internet Data [2.1] 我々は,様々なインターネットデータソースを用いて,一連のテンプレートロボットの動作を選択して,スキルを発揮できる方法を探究する。
その結果,LLMは視覚情報の欠如にもかかわらず驚くほど有能なテンプレートセレクタであることが判明した。
これらのシナジーを活用することで、ツール使用を含む16種類の調理スキルのセットで79%の成功率を達成する、複数種類のインターネットデータを用いたテンプレートセレクタを作成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:25:44 GMT)
Autonomous Exploration and Semantic Updating of Large-Scale Indoor Environments with Mobile Robots [1.9] 移動ロボットが未知の環境を自律的に探索できる新しいロボットシステムを提案する。
ロボットは、93m×90mのフロアを意味的にマッピングし、オブジェクトが環境に移動されるとセマンティックマップを更新する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:25:03 GMT)
Experimental Simulation of Two Pulses and Three Pulses Coherent One Way Quantum Key Distribution Protocol in Noisy/Noiseless and Wired/Wireless Environment [1.9] Coherent One Way(COW)プロトコルは、ハードウェア展開の容易さから、最も有名なプロトコルの1つである。
我々は、ノイズのないシナリオとノイズのないシナリオの両方で、プロトコルの符号化と復号部分を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 11:02:52 GMT)
MACeIP: A Multimodal Ambient Context-enriched Intelligence Platform in Smart Cities [1.8] 本稿では,スマートシティのためのマルチモーダル環境情報プラットフォーム(MACeIP)を提案する。
私たちのプラットフォームは、IoT(Internet of Things)センサー、エッジとクラウドコンピューティング、マルチモーダルAIなど、高度なテクノロジを統合して、応答性とインテリジェントな都市エコシステムを構築します。
主なコンポーネントは、市民インタラクションのためのInteractive Hubs、広範なIoTセンサーネットワーク、インテリジェントな公開資産管理、歩行者監視システム、都市計画ポータル、クラウドコンピューティングシステムである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:39:53 GMT)
Spectral Gap Optimization for Enhanced Adiabatic State Preparation [1.8] 本稿では,テンソルネットワーク状態(TNS)を近似的に生成する効率的な手法を提案する。
1次元のランダムなTNS、AKLT、GHZ状態の例を通して、この効率的なTNS作成アルゴリズムを実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:00:32 GMT)
InsightPulse: An IoT-based System for User Experience Interview Analysis [1.8] 本稿では,IoT(Internet of Things)ベースのハードウェアおよびソフトウェアシステムであるInsightPulseを紹介する。
InsightPulseは、重要な議論ポイントを自動的に識別しハイライトし、フォローアップ質問を積極的に提案し、テーマの要約を生成することで、ユーザインタビュー中のリアルタイムサポートを提供する。
システムは堅牢なバックエンド分析ダッシュボードを備えており、インタービュー後のレビュープロセスが簡単になり、実行可能な洞察の迅速な抽出が容易になり、全体的なUX研究効率が向上する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:39:34 GMT)
CON: Continual Object Navigation via Data-Free Inter-Agent Knowledge Transfer in Unseen and Unfamiliar Places [1.5] 本研究は,ロボット物体目標ナビゲーション(ON)を強化するため,短時間のエージェント間知識伝達(KT)の可能性を探るものである。
私たちはこのプロセスを,ブラックボックスモデル(教師)から新しいモデル(学生)への知識伝達を目的とした,データフリー連続学習(CL)チャレンジとして捉えています。
このギャップに対処するために,オープンワールド環境における非協力的なブラックボックス教師を対象とした,軽量でプラグ&プレイ可能なKTモジュールを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:50:11 GMT)
Two-component repulsive atomic Fermi gases in a thin spherical shell [1.4] 薄い球状殻形状の反動相互作用を持つ2成分原子フェルミガスの基底状態構造を示す。
このシステムは、相互作用強度が臨界値を超えたときに、均一混合物から2チャンク相分離への不可解な遷移を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:17:33 GMT)
Probing the limits of variational quantum algorithms for nonlinear ground states on real quantum hardware: The effects of noise [1.4] 非線形シュリンガー方程式の基底状態を取得するために, 実振幅, ハードウェア効率のアンサッツの表現性について検討する。
量子ハードウェアノイズはエネルギーコスト関数の評価を損なうが、問題の小さなインスタンスは基底状態に一貫して収束する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 06:21:53 GMT)
A New Algorithm for Computing Branch Number of Non-Singular Matrices over Finite Fields [1.3] 状態差やリニアマスクにおけるゼロでない要素の数は、アクティブなSボックスと直接相関する。
微分分岐数または線形分岐数は、SPN暗号の2つの連続するラウンドにおける活性S-ボックスの最小数を示す。
本稿では,有限体上の非特異行列の分岐数を計算するための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:20:04 GMT)
Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia [1.3] 急性骨髄性白血病(AML)におけるMRD(Representing and Minimal Residual Disease)は予後と予後に必須である。
本稿では, 最適輸送(OT)に基づく統計的学習手法について検討し, フロー計測の低次元表現を実現する。
特に、我々のOTベースのアプローチは、FlowSomアルゴリズムの結果の関連性および情報的2次元表現を可能にする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:09:01 GMT)
SEAL: Suite for Evaluating API-use of LLMs [1.3] SEALは、現実世界のAPI使用時に大きな言語モデルを評価するように設計されたエンドツーエンドのテストベッドである。
既存のベンチマークを標準化し、API検索と計画をテストするエージェントシステムを統合し、リアルタイムAPIの不安定性に対処する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:16:49 GMT)
Quantifying Context Bias in Domain Adaptation for Object Detection [1.2] オブジェクト検出のためのドメイン適応(DAOD)は、トレーニングされたモデルをソースからターゲットドメインに転送することを目的としている。
フォグギーDにおける文脈バイアスは、適応中の背景特徴の変化を解析することによって研究されていない。
我々は,文脈バイアスの理解が霧のDアプローチに影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:01:50 GMT)
A Diagonal Structured State Space Model on Loihi 2 for Efficient Streaming Sequence Processing [1.1] 本稿では,Intel の Loihi 2 状態のニューロモルフィックプロセッサ上で,SSM S4D のトークン・バイ・トークン推論を行う。
これにより、SSMの効率的なリアルタイムストリーミングアプリケーションへの新たな道が開ける。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:50:11 GMT)
Automatic Feature Learning for Essence: a Case Study on Car Sequencing [1.0] 問題インスタンスに最適な組み合わせを自動的に選択するために、機械学習モデルを構築するタスクについて検討する。
学習プロセスの重要な部分は、選択モデルへの入力として機能するインスタンス機能を定義することである。
私たちの貢献は、言語モデルを用いた問題インスタンスの高レベル表現から直接、インスタンス機能の自動学習です。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:06:44 GMT)
The solving degrees for computing Gröbner bases of affine semi-regular polynomial sequences [0.9] 本研究では,アフィン半正則配列とその均質化配列の解度について検討する。
これらの結果から,Gr"オブザーバー基底の計算方法の正確性を数学的に厳密に評価できると考えられる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:30:23 GMT)
Decision support system for Forest fire management using Ontology with Big Data and LLMs [0.9] 火災リスクを評価し、資源需要を予測する火災指標が不可欠である。
医療や環境モニタリングなどの分野におけるセンサネットワークの増加に伴い、セマンティックセンサーネットワークは、気候データ収集にますます利用されている。
本稿では,Apache Sparkによる森林火災の早期検出,気象・地理データによる火災リスク予測の強化について論じる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 06:13:48 GMT)
Shadow Quantum Linear Solver: A Resource Efficient Quantum Algorithm for Linear Systems of Equations [0.8] 本稿では,デジタル量子デバイス上での量子線形システム問題(QLSP)の解法を提案する。
その結果、大きな制御されたユニタリの必要性を回避し、システムサイズで対数的な多くの量子ビットを必要とする量子アルゴリズムが実現した。
これを、線形代数の分解定理を利用して、2次元格子における離散化されたラプラス方程式を解くことで、実用的妥当性の物理問題に適用する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:47:57 GMT)
Dynamic Realms: 4D Content Analysis, Recovery and Generation with Geometric, Topological and Physical Priors [0.8] 私の研究は、4Dは3つの空間次元(x, y, z)と、形状や動きなどの時間次元tを含む4Dコンテンツの分析、回復、生成に焦点を当てています。
私の研究は、幾何学的、トポロジ的、物理的優先事項を取り入れることで、4Dコンテンツ生成をより効率的、アクセシビリティ、高品質にすることを目的としています。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:46:51 GMT)
Two Deep Learning Solutions for Automatic Blurring of Faces in Videos [0.8] 本稿では,監視ビデオにおける顔ぼやけ問題に対処するための,ディープラーニングに基づく2つの選択肢を提案する。
まず、顔を検出するために訓練された古典的な物体検出装置で構成され、その後、ぼやけている。
第二に、Unetのようなセグメンテーションネットワークを訓練して、すべての顔がぼやけた入力画像のバージョンを出力する間接的アプローチである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:59:44 GMT)
A Novel Framework for the Automated Characterization of Gram-Stained Blood Culture Slides Using a Large-Scale Vision Transformer [0.5] 本研究では,グラムスライディング画像(WSI)の人工知能による特徴付けのための新しい枠組みを提案する。
我々は,従来の畳み込みニューラルネットワーク(CNN)よりも大規模データセットにスケーラブルな,グラムスタンプWSI分類のための新しいトランスフォーマーベースモデルを開発した。
本モデルでは, 475-slideデータセット上の5倍のネスト型クロスバリデーションを用いて, 0.858の分類精度と0.952のAUCを実現する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:02:21 GMT)
Polyatomic Complexes: A topologically-informed learning representation for atomistic systems [0.5] 原子系の表現について述べる。
原子論系を符号化する一般的なアルゴリズムを提供する。
各種タスクにおける最先端手法に匹敵する性能を報告する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:09:23 GMT)
Blind Spatial Impulse Response Generation from Separate Room- and Scene-Specific Information [0.4] ユーザの実際の音響環境に関する知識は,環境にシームレスに溶け込む仮想音のレンダリングに不可欠である。
最終出力において,室内パラメータと位置パラメータの両方がどう考慮されるかを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:41:31 GMT)
WisPerMed at BioLaySumm: Adapting Autoregressive Large Language Models for Lay Summarization of Scientific Articles [0.4] 本稿では,BioLaySumm2024共有タスクにおけるWisPerMedチームの作業について述べる。
大規模言語モデル(LLM)、特にBioMistralとLlama3は微調整され、レイサマリーを作成するために使用された。
実験によると、微調整は一般的に、最も評価されたメトリクスで最高のパフォーマンスをもたらす。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:03:32 GMT)
Computational Pathology for Accurate Prediction of Breast Cancer Recurrence: Development and Validation of a Deep Learning-based Tool [0.4] Deep-BCR-Autoは、乳がん再発リスクを予測するディープラーニングベースの計算病理学アプローチである。
我々の方法論は2つの独立したコホートで検証された。
Deep-BCR-Autoは、患者を低頻度と高頻度のリスクカテゴリに分類する上で、堅牢なパフォーマンスを示した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:22:06 GMT)
Learning Diverse Robot Striking Motions with Diffusion Models and Kinematically Constrained Gradient Guidance [0.4] 私たちは、オフラインで制約付きで、多様なアジャイルの振る舞いを表現する、新しい拡散モデリングアプローチを開発しています。
エアホッケーとリアル卓球の2つの課題領域において, KCGG を評価することで, 時間クリティカルなロボット作業に対するアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:26:51 GMT)
Efficient and precise quantum simulation of ultra-relativistic quark-nucleus scattering [0.4] クォーク核散乱のダイナミクスをシミュレートする,効率的かつ高精度な枠組みを提案する。
我々のフレームワークは量子力学における様々な散乱問題の力学をシミュレートするために一般化することができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:40:32 GMT)
Lateral Ventricle Shape Modeling using Peripheral Area Projection for Longitudinal Analysis [0.3] 側心室形状(LV)の変形は, 疾患に伴う特定の形態的変化を明らかにするために広く研究されている。
周辺領域のプロジェクションを用いた新しい深層学習手法を提案し,その周辺領域を考慮したLV解析の試みを行った。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 01:49:24 GMT)
Cavity Quantum Electrodynamics with Atom Arrays in Free Space [0.3] キャビティ量子電磁力学(キャビティQED)は、単一光子レベルでの光-物質相互作用の制御を可能にする。
自由空間に閉じ込められた原子に基づく空洞QEDアーキテクチャを提案する。
本稿では,従来の空洞QEDパラメータを用いて,原子の2次元配列を記述できることを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:01:27 GMT)
Evaluating the Usability of LLMs in Threat Intelligence Enrichment [0.3] 大規模言語モデル(LLM)は、脅威知能を著しく向上させる可能性がある。
しかし、その信頼性、正確性、および不正確な情報を生成する可能性に関する懸念は継続する。
本研究では、ChatGPT、Gemini、Cohere、Copilot、Meta AIの5つのLCMの総合的ユーザビリティ評価を行う。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:44:56 GMT)
Analytical derivation and extension of the anti-Kibble-Zurek scaling in the transverse field Ising model [0.3] スピン基底状態からの偏差を定量化する欠陥密度は、相転移中の非平衡ダイナミクスを特徴づける。
広く知られているKibble-Zurekスケーリングは、相転移中に欠陥密度がどのように進化するかを予測する。
しかし、ノイズによって摂動できるため、アンチ・キブル・ズールクのスケーリングに繋がる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 06:32:44 GMT)
Adenocarcinoma Segmentation Using Pre-trained Swin-UNet with Parallel Cross-Attention for Multi-Domain Imaging [0.3] 本稿では,Swin-UNetアーキテクチャを並列モジュールで拡張した事前学習型エンコーダにより構成するフレームワークについて述べる。
実験の結果, クロストラックでは0.7469, クロススキャナでは0.7597のセグメンテーションスコアが得られた。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:38:43 GMT)
LLM in the Shell: Generative Honeypots [0.3] ハニーポットはサイバーセキュリティにおいて、早期発見、脅威情報収集、攻撃者の行動分析に不可欠なツールである。
この研究は、Linuxライクなシェル出力を生成するLarge Language Modelsをベースとした、動的で現実的なソフトウェアハニーポットであるShelLMを導入している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 12:51:00 GMT)
Eigenstate localization in a many-body quantum system [0.2] 我々は、多体相互作用と多体移動エッジを持つ広い多体ハミルトンの存在を証明した。
非零エネルギー密度以下のすべての固有状態は、ヒルベルト空間内の「エネルギー的に許容される構成」の指数的に小さな部分で局所化される。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:26:51 GMT)
EMERS: Energy Meter for Recommender Systems [0.2] EMERSは,推奨システム実験のエネルギー消費の測定,監視,記録,共有を簡単にするソフトウェアライブラリである。
EMERSは、スマート電源プラグを用いてエネルギー消費を測定し、推奨システム実験のエネルギー消費を監視し比較するためのユーザインターフェースを提供する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:35:06 GMT)
Synthesis of Energy-Conserving Quantum Circuits with XY interaction [0.2] 我々は、XX+YY相互作用だけで実現できる$sqrtiSWAP$ゲートとエンタングルゲートから構築された量子回路について研究する。
このようなゲートは、計算ベースで状態のハミング重みを保存する。
一般エネルギー保存ユニタリを$sqrtiSWAP$ゲートと2個のアシラリー量子ビットのみを用いて合成する方法を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 01:20:42 GMT)
Advancing Global South University Education with Large Language Models [0.2] 研究は、グローバル・サウスとグローバル・ノースの間の高等教育の質の格差を示している。
グローバル・サウスの生徒と教師の比率は、グローバル・ノースの生徒よりもかなり高い。
インドネシア大学は、大きな言語モデルを統合することで品質学習と教育を強化する実験を開始した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:33:38 GMT)
Patch-Based End-to-End Quantum Learning Network for Reduction and Classification of Classical Data [0.2] ノイズの多い中間スケール量子(NISQ)時代には、量子デコヒーレンス、クロストーク、不完全校正による誤差により、量子ビットの制御が制限される。
量子ネットワークによって処理される場合,画像などの大規模古典データのサイズを小さくする必要がある。
本稿では、このようなデータ削減を回避するために、古典的な注意機構を持つ動的パッチベースの量子ドメインデータ削減ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:58:02 GMT)
Convergence rate of random scan Coordinate Ascent Variational Inference under log-concavity [0.2] Coordinate Ascent Variational Inference schemeは、関心の確率分布の平均場近似を計算するために使われる一般的なアルゴリズムである。
対象密度の対数共共振仮定に基づいてランダムスキャンバージョンを解析する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:27:50 GMT)
Bayesian computation with generative diffusion models by Multilevel Monte Carlo [0.2] 本稿では,拡散モデルによるベイズ計算のコストを大幅に削減するマルチレベルモンテカルロ戦略を提案する。
提案したマルチレベルモンテカルロ法の有効性は、3つの標準計算イメージング問題で実証された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:57:08 GMT)
Instruction Tuning Vs. In-Context Learning: Revisiting Large Language Models in Few-Shot Computational Social Science [0.1] In-context Learning (ICL) とインストラクションチューニング (IT) を用いた大規模言語モデル (LLM) の分類性能の評価を行った。
ICLは、明示的な勾配更新なしで例から学ぶことで、タスク適応の迅速な代替手段を提供する。
私たちの研究は、CSSタスクを数ショットで処理する上で、ICLの重大な利点を強調しています。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:43:08 GMT)
Witnessing mass-energy equivalence with trapped atom interferometers [0.1] 本稿では,質量-エネルギー等価性から生じる量子重ね合わせ原理と重力時間拡張との相互作用を探索する実験装置を提案する。
最先端の原子干渉計を利用して、地球の重力場の高度の重なり合いに閉じ込められた原子を、極端に小さなスケールまで長時間保持することができる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:42:05 GMT)
Views on AI aren't binary -- they're plural [0.1] 単純なバイナリはAI談話の正確なモデルではない、と私たちは主張する。
私たちは、AI開発とガバナンスに取り組んでいる人々の広いコミュニティにおいて、個人がus-vs-themの衝突の発生を避けるためにどのように役立つかを具体的に提案します。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:23:47 GMT)
Using Agile Story Points and Game Theory Together: Better Software Planning and Development in Agile Software Development [0.0] この研究は、アジャイルソフトウェア開発、ストーリーポイント推定、ゲーム理論の主な概念を統合します。
本稿では,ゲーム理論の応用,特にVickrey AuctionとStag Hunt Gameを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:21:04 GMT)
Towards Better Monolingual Japanese Retrievers with Multi-Vector Models [0.0] 日本語では、最も優れたディープラーニングに基づく検索手法は多言語密着型埋め込みに依存している。
マルチ言語よりも2桁少ないデータで訓練されたマルチベクトルレトリバーのファミリーであるJaColBERTを紹介する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:51:31 GMT)
Total and Symmetry resolved Entanglement spectra in some Fermionic CFTs from the BCFT approach [0.0] 約2ドルのフェルミオンCFTの単一間隔における全スペクトルと対称性分解スペクトルについて検討する。
ヒルベルト空間の分割は、絡み合う境界点の周りの円盤を切断し、精査の下で拡張対称性を保つ境界条件を課すことによって達成される。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:06:57 GMT)
The last Dance : Robust backdoor attack via diffusion models and bayesian approach [0.0] 拡散モデルは、前方と後方の学習原理に基づいて訓練された最先端のディープラーニング生成モデルである。
人工知能研究の世界で人気のあるフレームワークであるHugging Faceから派生したオーディオトランスフォーマーに対するバックドア攻撃の可能性を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 05:19:58 GMT)
The Top Manifold Connectedness of Quantum Control Landscapes [0.0] 本稿では,地形の上部多様体を形成する大域最適制御解の経路接続性について数値的に検討する。
状態-状態遷移確率を含む異なる量子制御目標に対して、観測可能な期待値とユニタリ変換は、そのような連続経路を容易に見つけることができる。
後者の予想の意義は、原目的の完全な最適性を維持しつつも、補助目的を最適化できるトップ多様体内の位置を求めることである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:42:53 GMT)
The ParlaSpeech Collection of Automatically Generated Speech and Text Datasets from Parliamentary Proceedings [0.0] 我々は,低リソース言語による大規模かつオープンな音声・テキスト対応データセットを構築するためのアプローチを提案する。
我々は3つのスラヴ語、すなわちクロアチア語、ポーランド語、セルビア語に焦点を当てている。
このパイロット実行の結果は、5000時間以上のスピーチと付随するテキストの書き起こしにまたがる、高品質な3つのデータセットである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:12:18 GMT)
The Palomar twilight survey of 'Ayló'chaxnim, Atiras, and comets [0.0] 太陽近傍のツワイライト観測により、金星(アイロス)、地球(アティラス)、彗星の軌道上の小惑星の内部を検出できる。
太陽から31から66度の範囲で、夕方と朝のツイライトに46,000回以上の露光が観測された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:56:45 GMT)
The Impact of Generative Artificial Intelligence on Ideation and the performance of Innovation Teams (Preprint) [0.0] この研究は、知識の流出、ジェネレーション、応用に対するAIの効果を理解するために、知識スパイルオーバー理論を応用している。
その結果,GenAIは神経回路の知識スパイルオーバー理論の重要な要素に肯定的な影響を与えることが明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:25:49 GMT)
Taylorformer: Probabilistic Modelling for Random Processes including Time Series [0.0] 時系列などのランダムなプロセスに対してTaylorformerを提案する。
1) ニューラルネットワークベースの確率モデルで使用するためにTaylor近似を適用するLocalTaylorラッパー,2) ガウス過程の平均予測がコンテキストデータの線形滑らか化にどのように影響するかに触発された方法で予測を行うMHA-Xアテンションブロックである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:56:20 GMT)
SynthAI: A Multi Agent Generative AI Framework for Automated Modular HLS Design Generation [0.0] 本稿では,HLS設計の自動化手法であるSynthAIを紹介する。
SynthAIはReActエージェント、Chain-of-Thought(CoT)プロンプト、Web検索技術、Retrieval-Augmented Generationフレームワークを統合している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:38:16 GMT)
Stochastic Thermodynamics at the Quantum-Classical Boundary: A Self-Consistent Framework Based on Adiabatic-Response Theory [0.0] マイクロサーマルマシンは将来の量子技術において重要な役割を果たすことを約束する。
このようなデバイスを広く応用するには、出力を古典的自由度のような容易にアクセス可能なストレージシステムに流すための効果的な戦略が必要である。
我々は,このような量子古典ハイブリッドデバイスを熱力学的に一貫した方法でモデル化できる自己整合理論フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:34:10 GMT)
Spectroscopy, Crystal-Field, and Transition Intensity Analyses of the C$_{\rm 3v}$(O$^{2-}$) Centre in Er$^{3+}$ Doped CaF$_{2}$ Crystals [0.0] 本稿では,CaF$:Er$3+$におけるC$_rm 3v$(O$2-$)中心の詳細な吸収とレーザーサイト選択分光について述べる。
この遷移は、167$Er同位体から観測可能な超微細構造を持つ1GHzの低温不均一線を有する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:52:40 GMT)
Signature of attochemical quantum interference upon ionization and excitation of an electronic wavepacket in fluoro-benzene [0.0] ベンゼンおよびフルオロベンゼン分子の異なる電子波束へのイオン化に伴う結合電子核動力学をシミュレートする。
フルオロベンゼンでは、状態間および状態内量子干渉の両方を解き、アトケミカルと電荷指向力学の明確なシグネチャを残す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:49:31 GMT)
SOFI: Multi-Scale Deformable Transformer for Camera Calibration with Enhanced Line Queries [0.0] 我々は、カメラキャリブレットIon用のtextitmulti-Scale defOrmable transFormerを導入し、拡張された行クエリ、SOFIを提案する。
SOFIは、ライン内容とライン幾何学的特徴の両方を用いて、MSC-CとMSCCで使用される行クエリを改善している。
テキストGoogleストリートビュー、WildのテキストHorizon Line、テキストHollicityデータセットの既存のメソッドよりも優れており、競合する推論速度を維持している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:17:38 GMT)
Rotational properties of two interacting cold polar molecules: linear, symmetric, and asymmetric tops [0.0] 分子を量子剛性ローターとしてモデル化し、自由度を考慮に入れます。
分子の性質は、短い分離で磁場の方向に強く依存していることが分かる。
後者は、分子双極子気体の自転自由度を説明できる可能性についての洞察を与える。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:07:49 GMT)
Quantum phase diagrams of Dicke-Ising models by a wormhole algorithm [0.0] 我々は,パラダイム的Dicke-Isingモデルのためのワームホールアルゴリズムを提案する。
強磁性相互作用と反強磁性相互作用では、超固体格子の光-物質類似体が外対角超格子と対角磁気秩序で成立する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:54:20 GMT)
QUB-PHEO: A Visual-Based Dyadic Multi-View Dataset for Intention Inference in Collaborative Assembly [0.0] QUB-PHEOは、人間-ロボット相互作用(HRI)研究を前進させる可能性を備えた、視覚に基づく、ダイアディックなデータセットを導入している。
このデータセットは、2人の参加者間のリッチなマルチモーダルインタラクションをキャプチャします。
QUB-PHEOは微妙な相互作用の手がかりと意図をより深く分析し、この分野への貢献を約束する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:34:49 GMT)
Prompting Techniques for Reducing Social Bias in LLMs through System 1 and System 2 Cognitive Processes [0.0] 我々は, LLMにおけるバイアス, CoTプロンプト, 脱バイアスプロンプト, および二重プロセス理論の関係を直接的に検討する。
人間のペルソナ、嫌悪感、システム2、CoTは、LLMの社会的偏見を減らしがちである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 02:20:13 GMT)
PrivaMatch: A Privacy-Preserving DNA Matching Scheme for Forensic Investigation [0.0] 被疑者の身元や事件現場から得られた証拠等の調査に関する機密情報を調査機関に非公開にしておく必要がある。
我々は,容疑者のDNAプロファイルと犯罪現場の証拠のプライバシーに関する複数の懸念に対処する,PrivaMatchと呼ばれる新しいDNAマッチング手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:22:31 GMT)
Positivity and entanglement of polynomial Gaussian integral operators [0.0] 正の保存は、オープン量子系の力学において重要な問題である。
自己随伴積分ガウス作用素 $widehatkappa_PG$ の正当性について検討する。
例えば、$widehatkappa_PG$ はガウス部分の正が正の場合にのみ正であることを示し、これは強で極めて簡単な正の検定をもたらす。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:52:57 GMT)
Oracle problems as communication tasks and optimization of quantum algorithms [0.0] 鍵となる疑問は、アルゴリズムが一定の数のクエリのみを使用して学習タスクをどの程度うまく成功させることができるかである。
本研究では,出力と実値の相互情報を用いたアルゴリズムの性能測定を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:03:39 GMT)
Nonexponential decay law of the 2P-1S transition of the H-atom [0.0] 我々は水素原子の不安定な2P励起状態に対する生存確率$P(t)$を評価する。
短い時間と長い時間に$P(t)$は指数法則からの偏差を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 07:27:05 GMT)
Natural Language Query Engine for Relational Databases using Generative AI [0.0] この記事では、ジェネレーティブAIを活用してギャップを埋め、自然言語を使ってデータベースをクエリできる革新的なソリューションを紹介します。
提案手法は,自然言語クエリを insql に翻訳し,構文的および意味的正当性を確保しつつ,検索したデータから自然言語応答を生成する。
ユーザとデータベース間のインタラクションを合理化することにより、技術的専門知識のない個人がデータを直接的かつ効率的に扱えるようにし、価値ある洞察へのアクセスを民主化し、生産性を向上させる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 01:07:02 GMT)
Multiscale scattered data analysis in samplet coordinates [0.0] グローバルにサポートされたラジアル基底関数に対するマルチスケールデータ分散スキームについて検討する。
結果の一般化されたヴァンダーモンド行列をサンプル座標で表現することを提案する。
各レベルにおける線形系の条件数は、特定のレベルとは独立に有界であることを証明する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:07:47 GMT)
MotifDisco: Motif Causal Discovery For Time Series Motifs [0.0] 連続グルコースモニター(CGM)から採取したグルコースの痕跡に着目した。
モチーフ間の因果関係を識別し、定量化する能力は、これらのパターンをよりよく理解し、表現するためのメカニズムを提供することができる。
時系列トレースからモチーフ間の因果関係を学習するための新しい因果発見フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:08:37 GMT)
Modeling a demographic problem using the Leslie matrix [0.0] レスリー行列は1940年代に初めて提案され、1960年代半ばに人気を得た。
レスリー行列の普遍性は、植物や動物の多様なライフサイクルにまで拡張され、非ヒト種においてユビキタスな道具となる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:57:01 GMT)
Many-body phases from effective geometrical frustration and long-range interactions in a subwavelength lattice [0.0] 幾何学的なフラストレーションと長距離結合は、物理学を通して異なる性質を持つ量子相を作るための鍵となる貢献者である。
両成分がラマン誘導サブ波長格子に自然に出現する手法を提案する。
フラストレーションと長距離結合の組み合わせがボソンの多体相を生成することを数値的に示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:17:12 GMT)
Making Data: The Work Behind Artificial Intelligence [0.0] 本稿では,ブラジルにおけるマイクロワークの実態を報告し,労働者の肖像画を提供する。
これは、現状の不安定化を克服するための、より広範な努力の一歩である。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:12:24 GMT)
Lost in the Logic: An Evaluation of Large Language Models' Reasoning Capabilities on LSAT Logic Games [0.0] 法学校入学試験(LSAT)における大規模言語モデル(LLM)の性能評価
論理ゲームとその関連メタデータのデータセットを構築し、Chain-of-Thoughtプロンプト設定においてLLMの性能を広範囲に評価する。
私は、モデルがより良いか悪いかを示す論理ゲームの種類と、人間のアノテーションから観察する論理エラーのタイプを分析します。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:37:40 GMT)
Logarithmic singularities of Renyi entropy as a sign of chaos? [0.0] 様々な二次元共形場理論におけるレニーエントロピーの対数特異点を解析する。
ホログラフィック CFT におけるレニイエントロピーの対数特異点は常に存在するが、自由かつ有理な CFT におけるそのような特異点は存在しない。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:39:23 GMT)
Logarithmic Subdiffusion from a Damped Bath Model [0.0] スペクトル密度がOhmicであるとき、メモリカーネルは$k(t) sim 1/t$ as $tto infty$のように振る舞う。
メモリカーネルは有限積分を持たないので、半拡散的であり、拡散を$langleDelta Q2(t)rangle sim t/log(t)$ as $tto infty$として数値的に示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:37:47 GMT)
LX-mixers for QAOA: Optimal mixers restricted to subspaces and the stabilizer formalism [0.0] 与えられた部分空間を保存するミキサーの理解と構築を両立させる新しい形式主義を提示する。
我々は、我々のアプローチを論理X-ミクサーまたは論理XQAOAと呼ぶ。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:59:36 GMT)
Investigating Robot Dogs for Construction Monitoring: A Comparative Analysis of Specifications and On-site Requirements [0.0] 本稿では,建設現場で現在利用可能なロボット犬の利用可能性について検討する。
四足歩行ロボットを用いた大規模建設現場での実環境実験を行った。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:51:31 GMT)
Interaction dependence of the Hall response for the Bose-Hubbard triangular ladder [0.0] 磁場中におけるBose-Hubbard三角はしごのホール応答について検討する。
我々は、弱い相互作用の限界からハードコア体制まで、幅広い相互作用の強さを考察する。
様々なキラル状態の指紋にホール応答を適用できることが示される。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:59:32 GMT)
Institutional Platform for Secure Self-Service Large Language Model Exploration [0.0] 論文では、データセットキュレーション、モデルトレーニング、セキュア推論、テキストベースの特徴抽出を含む、システムのアーキテクチャと重要な特徴について概説する。
プラットフォームはセキュアなLLMサービスの提供、プロセスとデータ分離の強調、エンドツーエンドの暗号化、ロールベースのリソース認証を目指している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:24:09 GMT)
Improving the Accessibility of Dating Websites for Individuals with Visual Impairments [0.0] アクセシビリティが制限されているため、デートサービスの利用は困難であり、視覚障害のある人にとってはイライラする可能性がある。
デートプラットフォームのプロフィール写真から、顔の表情、年齢、性別、子(レン)の存在などを自動的に認識できる実装がいくつか存在する。
このプロジェクトの目的は、既存のシステムの能力をさらに強化するために、追加機能(ペット、屋内画像、屋外画像など)を組み込むことである。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:14:55 GMT)
Identification and Localization of Cometary Activity in Solar System Objects with Machine Learning [0.0] 本稿では,太陽系天体の彗星活動の同定と位置決定に機械学習を用いる方法について論じる。
まずは、恒星型源の存在下で、既知の、未知の、活動的な拡張された太陽系天体を特定することの課題について議論する。
次に、拡張オブジェクト識別の課題に対処するため、ML技術の実装に関する議論に移行する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 17:56:32 GMT)
Generating the Ground Truth: Synthetic Data for Soft Label and Label Noise Research [0.0] 実世界のデータからノイズのないデータセットを作成するためのフレームワークであるSynLABELを紹介する。
ラベルノイズを精度よく定量化する能力と,既存の手法による改善を実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:15:52 GMT)
Generalized boson and fermion operators with a maximal total occupation property [0.0] 本稿では、ボソンとフェルミオンの生成と演算子に対する標準(反)交換関係の新しい一般化を提案する。
1つの生成と1つの演算子を含む標準(反)交換子関係のみが、分数係数を導入して変形する。
フォック空間における生成および消滅作用素の作用から、群理論の枠組みが決定される。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:05:34 GMT)
Gamifying the Vehicle Routing Problem with Stochastic Requests [0.0] 我々は、古典的な物流問題をゲームとして表現するタスクを考え、エージェントにそれをプレイするよう訓練する。
視点,視野,超人的ミニマップなど,さまざまなデザインがエージェントのパフォーマンスにどのような影響を与えるかを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 22:49:27 GMT)
Exploring Requirements Elicitation from App Store User Reviews Using Large Language Models [0.0] 本研究は,大規模言語モデルのパワーを活用して,ユーザレビューの分析を行い,自動要求の導出を行うアプローチを提案する。
有用性を示すようにラベル付けされたアプリレビューのデータセット上に,確立された3つのLMM BERT, DistilBERT, GEMMAを微調整した。
評価の結果、BERTの精度は92.40%、F1スコアは92.39%であり、有用レビューを正確に分類する効果が示された。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 18:57:31 GMT)
Exploring Error Types in Formal Languages Among Students of Upper Secondary Education [0.0] 高校生の形式言語における誤りの探索的研究について報告する。
その結果,概念の非機能的理解の事例が示唆された。
これらの発見は、学生がなぜこの話題に苦しむのか、より広い理解の出発点となる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:16:13 GMT)
Explainable and Human-Grounded AI for Decision Support Systems: The Theory of Epistemic Quasi-Partnerships [0.0] 我々は、倫理的で説明可能なAI(XAI)の要求を満たすことは、人間の意思決定者に3種類の人為的説明を提供するAI-DSSを開発することであると論じている。
優れた人為的理由を構成するものに関する現在の理論が、この証拠を適切に説明していないか、あるいは開発に健全な倫理的アドバイスを提供していないかを実証する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:14:25 GMT)
Evaluating Synthetic Activations composed of SAE Latents in GPT-2 [0.0] スパースオートエンコーダ(SAE)は、機械的解釈可能性において一般的に用いられる。
最近の研究は、モデルが初期層でアクティベーションを乱すことが、モデルの最終層アクティベーションのステップ関数のような変化をもたらすことを示した。
実際の活性化とSAE潜伏剤からなる合成活性化を比較した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:46:38 GMT)
Entropic Fluctuations in Statistical Mechanics II. Quantum Dynamical Systems [0.0] 我々は、エバンス・サールズゆらぎ定理のいくつかの可能な拡張を量子系に考慮し、比較する。
モジュラー理論は古典的な位相空間収縮率の概念を量子領域に拡張する方法を提供する。
得られた結果は、量子統計力学におけるエントロピー変動の性質に新たな光を当てた。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 19:12:14 GMT)
Entanglement transfer of a Rydberg W-state to a multi-mode photonic state [0.0] 3原子Rydberg系からの高効率な絡み合い転送を実現する頑健な量子プロトコルが開発されている。
本研究は, 完全断熱プロトコルと非断熱遷移を制御した断熱プロトコルを用いて, 絡み合いの伝達が可能であることを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:08:12 GMT)
Enhancing Scientific Reproducibility Through Automated BioCompute Object Creation Using Retrieval-Augmented Generation from Publications [0.0] IEEE Biocompute Object(BCO)標準は、ニーズに対処するが、準拠するドキュメントを作成するオーバーヘッドのため、採用上の課題に直面している。
本稿では,Large Language Models(LLM)とRAG(Retrieval-Augmented Generation)を用いた科学論文からのBCOの自動生成手法を提案する。
この実装には最適化された検索プロセスが含まれており、再ランク付けされた2パスの検索と、各BCOドメインに対して慎重に設計されたプロンプトが採用されている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:51:22 GMT)
Efficient Hamiltonian learning from Gibbs states [0.0] 自由エネルギー変動原理を用いて,ギブス状態の局所的な期待値からハミルトニアンを学習するアルゴリズムについて述べる。
このアルゴリズムは、自由エネルギーを直接計算する必要を回避し、代わりに状態の摂動に関する自由エネルギーの導関数の効率的な推定を使用する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:01:51 GMT)
EDGE-Rec: Efficient and Data-Guided Edge Diffusion For Recommender Systems Graphs [0.0] 本稿では,ユーザとアイテムの機能だけでなく,リアルタイムなインタラクションの重み付けを生かした新しいアテンション機構を提案する。
我々は,ユーザ・イテム相互作用グラフの重み付き相互作用行列を反復的に復調するために,新しいグラフ拡散変換器GDiTアーキテクチャを訓練する。
テキスト条件付き画像生成の最近の進歩に触発されて,本手法は,従来の評価と同一スケールのユーザ・イテム評価を直接生成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 03:23:20 GMT)
Dissipative dynamics of an open quantum battery in the BTZ spacetime [0.0] 量子電池の充電性能は、量子場の真空揺らぎの存在によってどのように影響されるかを考える。
量子場の異なる境界条件は、異なる充電性能をもたらす可能性がある。
本研究は,曲面時空における緩和効果を解明するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:21:15 GMT)
Dirac Equation Solution with Generalized tanh-Shaped Hyperbolic Potential: Application to Charmonium and Bottomonium Mass Spectra [0.0] 一般化された接形双曲ポテンシャルを用いて、ディラック方程式の有界解を研究する。
その結果,エネルギー固有値はポテンシャルパラメータと強く相関していることが示唆された。
このポテンシャルを用いて、チャーモニウムとボトムニウムの質量スペクトルをモデル化し、計算されたクォーク質量スペクトルの結果が実験的に観測された値と密接に一致していることを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 20:40:59 GMT)
Deterministic Quantum Repeater with Single Atoms in Cavities [0.0] 将来の量子ネットワークにおいて、ファイバーの光子損失に対処するために、効率的な量子リピータが必要である。
本稿では,光子-原子ゲートに基づく決定論的絡み合い生成と絡み合いスワップを用いた量子リピータ方式を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:37:07 GMT)
Designing an Interpretable Interface for Contextual Bandits [0.0] 我々は,盗賊の根底にある振る舞いを説明するために,ドメインの専門家に新しいインターフェースを設計する。
技術的厳密さとアクセシブルなプレゼンテーションを慎重にバランスさせることで、非専門家に複雑な機械学習システムを管理する力を与えることが可能であることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:47:44 GMT)
Designing Pre-training Datasets from Unlabeled Data for EEG Classification with Transformers [0.0] 本稿では,未ラベル脳波(EEG)データからラベル付きデータセットを設計する方法を提案する。
これらは、脳波信号の表現を学習するために、トランスフォーマーを事前訓練するために使用できる。
本手法を,テンプル大学清水検出コーパスのてんかん発作予知タスクで検証した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:26:13 GMT)
Demonstration of Scully-Drühl-type quantum erasers on quantum computers [0.0] 本稿では,Scully-Dr"uhl型遅延チョイス量子消去器を真に実装した新しい量子回路を提案する。
IBM QuantumとIonQプロセッサで行った実験では、干渉パターンの回復が様々な程度に理論的な予測と密接に一致していることが示されている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:04:46 GMT)
Deep Learning Approach for Knee Point Detection on Noisy Data [0.0] 曲線上の膝点とは、曲線の上昇後に曲線が下降する点である。
本研究では,正規化データに基づいて膝点を定義する。
我々は、基盤となる真の分布の膝点を正確に検出するために、U-Netのようなアーキテクチャを持つ畳み込みニューラルネットワーク(CNN)を用いる。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:29:19 GMT)
Deep Evidential Learning for Radiotherapy Dose Prediction [0.0] 本稿では放射線治療用線量予測分野におけるDeep Evidential Learningと呼ばれる不確実性定量化フレームワークの新たな応用法を提案する。
このモデルは,ネットワークトレーニング完了時の予測誤差と相関関係を持つ不確実性推定に有効に活用できることを見出した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:45:43 GMT)
Data-driven model discovery with Kolmogorov-Arnold networks [0.0] 疎度条件を満たさないものを含む任意の力学系に対する一般的なモデル発見フレームワークを開発する。
特に, 系の近似モデルが多数存在し, 正確な統計量で同じ不変量を生成することが, 非特異性を示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:22:07 GMT)
Covariant quantum field theory of tachyons is unphysical [0.0] タキオンはその特異な振る舞いのために代々の物理学者を魅了してきたが、実際の物理的問題は解決しなかった。
ドラガンとエケルトは、超光度観測者は量子力学の基礎に関係しているかもしれないことを示した。
タキオンの古典的および量子場理論が構築されていることを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 04:43:37 GMT)
Cooperative atomic emission from a line of atoms interacting with a resonant plane surface [0.0] カシミール・ポルダー効果は、集合的な原子の周波数シフトと崩壊率を変化させることができる。
自由空間において期待される協調効果は、原子が表面に近いときに欠落していることを示す。
本研究では, 共振形地表面の前にあるセシウム6P3/2原子の研究を, この研究結果を実験的に実証するための最も有望なシナリオとして提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:51:24 GMT)
Control of solid-state nuclear spin qubits using an electron spin-1/2 [0.0] 電子スピン1/2による単一核スピンの制御を動的に分離した高周波ゲートを用いて改善した。
我々の研究は、電子スピン1/2系における核スピン制御の課題と機会に関する重要な洞察を提供する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:53:00 GMT)
Confinement-induced field-linked states of ultracold polar molecules [0.0] 我々は、静電場と1次元高調波閉じ込めの助けを借りて、超低温二原子分子の対間に安定な結合状態が存在することを予測した。
双極子長スケールのごく一部で二原子分子が結合しているため、これらの錯体は多原子化学やフェルミガス超流動対の探索を可能にする。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:57:52 GMT)
Conditional disclosure of secrets with quantum resources [0.0] 秘密の条件開示(英: Conditional revealsure of Secrets、CDS)は、通信、ランダム性、セキュリティの関係を研究する最も単純な暗号設定の一つである。
近年、CDQSと呼ばれるプリミティブの量子アナログが定義され、量子位置検証の文脈で研究される$f$-routingに関連している。
我々は,情報理論設定におけるプライバシと量子リソースの関係をよりよく理解することを目的として,CDQSの体系的研究を開始した。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:03:27 GMT)
Complete complementarity relations in tree level QED processes [0.0] 我々は、木レベルでのQED散乱過程において、完全相補性関係(CCR)を利用して量子性の様々な側面を完全に特徴づける。
分析の結果,フェルミオンのみを入力状態と出力状態として含む散乱過程において,最大絡み合いが保存されることがわかった。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:25:25 GMT)
Chattronics: using GPTs to assist in the design of data acquisition systems [0.0] 本稿では,データ取得システムの設計段階を支援するために,汎用事前学習変換器を用いた新しい手法を提案する。
このソリューションは、LLMの会話的側面を保持するアプリケーションという形でパッケージ化されている。
160回の試行を経て、この研究はこれらのモデルがデータ取得システムの合成・補助ツールとして適切に機能する可能性があると結論付けている。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 16:36:16 GMT)
Assessment of Submillimeter Precision via Structure from Motion Technique in Close-Range Capture Environments [0.0] 本研究では,SfM法が短距離キャプチャを用いた構造試験のためのサブミリ品質モデルを作成する可能性について検討した。
テストボード上に撮像された画像と、テスト領域に適切に分布するスケールバー(SB)のセットと、80%のオーバーラップ率、垂直および斜め画像の統合により、RMSEの値は約0.1mmを得た。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 23:13:06 GMT)
Asking an AI for salary negotiation advice is a matter of concern: Controlled experimental perturbation of ChatGPT for protected and non-protected group discrimination on a contextual task with no clear ground truth answers [0.0] 実験によるChatGPTの4種類のバイアス監査を行った。
我々は、各バージョンに98,800通のプロンプトを提出し、従業員の性別、大学、専攻を体系的に変更した。
マルチモデルプラットフォームとしてのChatGPTは、そのようなタスクに対して信頼できるほど堅牢で一貫したものではない。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:48:32 GMT)
Anomalous diffusion in quantum system driven by heavy-tailed stochastic processes [0.0] 本研究では,ホッピングと待ち行列からなる非平衡量子系について検討する。
ウェーブパケットの2乗幅を計算することで,様々な異常輸送現象が出現することを示す。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 15:38:46 GMT)
Analogous Alignments: Digital "Formally" meets Analog [0.0] 本稿では,デジタルブロックとアナログブロックを組み合わせた混合信号知的特性(IP)の実用的形式検証に着目する。
Digital and Analog Mixed-Signal (AMS)設計は、本質的に異なるが、形式的な検証設定でシームレスに統合される。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:38:31 GMT)
AlphaZip: Neural Network-Enhanced Lossless Text Compression [0.0] 本稿では,Large Language Model (LLM) を用いたロスレステキスト圧縮手法を提案する。
第一に、トランスフォーマーブロックのような高密度ニューラルネットワークアーキテクチャを使用した予測、第二に、予測ランクをAdaptive Huffman、LZ77、Gzipといった標準的な圧縮アルゴリズムで圧縮する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 14:21:06 GMT)
Advancing Depression Detection on Social Media Platforms Through Fine-Tuned Large Language Models [0.0] 本研究では,利用者のソーシャルメディアデータからの抑うつ検出にLarge Language Models (LLMs) を用いることを検討した。
微調整された GPT 3.5 Turbo 1106 と LLaMA2-7B モデルを使用することで、ソーシャルメディア投稿中の落ち込んだコンテンツを96.0パーセントの精度で識別することができた。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 08:18:25 GMT)
Acting for the Right Reasons: Creating Reason-Sensitive Artificial Moral Agents [0.0] 道徳的意思決定を可能にする強化学習アーキテクチャの拡張を提案する。
理由に基づくシールドジェネレータは、認識された規範的理由に従う行動にエージェントを結合する道徳的シールドを生成する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 13:38:57 GMT)
Accurate Automatic 3D Annotation of Traffic Lights and Signs for Autonomous Driving [0.0] 交通信号や道路標識などの交通管理対象の3D検出は、自動運転車にとって不可欠である。
本稿では,信号機や標識の3次元バウンディングボックスアノテーションを自動生成する手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 09:54:59 GMT)
About the role of short and long trajectories on the quantum optical state after high-harmonic generation [0.0] 高調波発生は高強度駆動場の高調波順序へのアップコンバージョンを伴う。
我々は、運動場における光学的シュリンガー・キャット様状態の生成をハーモニック・ジェネレーションを用いて予測する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 21:24:38 GMT)
A novel agent with formal goal-reaching guarantees: an experimental study with a mobile robot [0.0] 強化学習 (Reinforcement Learning, RL) は, ロボット工学における多くの課題に対して有効かつ便利であることが示されている。
この研究は、Crytic As Lyapunov Function(CALF)と呼ばれる新しい安全なモデルフリーRLエージェントを提示する。
論文参考訳(メタデータ) (Mon, 23 Sep 2024 10:04:28 GMT)