Command A: An Enterprise-Ready Large Language Model [180.2] コマンドAはエージェント最適化および多言語対応モデルである。
クラス内で最高のRetrieval Augmented Generation機能を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:37:51 GMT)
Global2Local: A Joint-Hierarchical Attention for Video Captioning [106.7] 本稿では,キークリップ,キーフレーム,キー領域をキャプションモデルに組み込んだ,ビデオキャプションのための新しい階層型アテンションモデルを提案する。
このような連立階層型アテンションモデルは、まずキーフレームを識別するためのグローバルセレクションを行い、続いてガムベルサンプリング操作を行い、キーフレームに基づいてさらにキー領域を識別する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:42:38 GMT)
Assessing Judging Bias in Large Reasoning Models: An Empirical Study [99.9] DeepSeek-R1やOpenAI-o1のような大きな推論モデル(LRM)は、顕著な推論能力を示している。
本稿では、主観的嗜好アライメントデータセットと客観的事実ベースデータセットの両方において、LLMとLRMの偏りを判定するベンチマークを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:14:27 GMT)
Tulu 3: Pushing Frontiers in Open Language Model Post-Training [94.1] トゥル3(Tulu 3)は、最先端の訓練後モデルである。
Tulu 3はLlama 3.1ベースモデルをベースにしており、Llama 3.1、Qwen 2.5、Mistral、さらにGPT-4o-mini、Claude 3.5-Haikuといったクローズドモデルにも勝っている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:39:09 GMT)
Mosaic3D: Foundation Dataset and Model for Open-Vocabulary 3D Segmentation [92.2] 我々は、新しいデータ生成パイプラインとトレーニングフレームワークを導入することで、オープンな3Dシーン理解に取り組む。
本手法は, 正確な3次元領域分割, 包括的テキスト記述, 十分なデータセットスケールの3つの重要な要件に対処する。
このパイプラインを複数の3Dシーンデータセットに適用すると、Mosaic3D-5.6Mが生成される。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:27:02 GMT)
Real-time Free-view Human Rendering from Sparse-view RGB Videos using Double Unprojected Textures [87.8] スパースビューのRGB入力からのリアルタイム自由視点人体レンダリングは、センサー不足と厳しい時間予算のために難しい課題である。
本稿では,2重非投影テクスチャについて述べる。その中心部では外観合成から粗い幾何学的変形推定を行う。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:38:34 GMT)
SplatMesh: Interactive 3D Segmentation and Editing Using Mesh-Based Gaussian Splatting [86.5] 3Dベースのインタラクティブ編集における重要な課題は、与えられたメモリ制約の下で様々な修正と高品質なビュー合成のバランスをとる効率的な表現がないことである。
SplatMeshは,3次元ガウススプラッティングと事前計算メッシュを統合した,対話型3Dセグメンテーション・編集アルゴリズムである。
単純化されたメッシュのセグメンテーションと編集により、ガウススプレートの編集も効果的に行えます。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:53:02 GMT)
MB-TaylorFormer V2: Improved Multi-branch Linear Transformer Expanded by Taylor Formula for Image Restoration [85.4] MB-TaylorFormer V2は複数の画像復元タスクにおいて最先端の性能を達成することを示す。
提案したモデルでは,TaylorFormer V2のTaylorFormerの2番目のバージョンとして,粗大な特徴を同時に処理する機能を備えている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:45:58 GMT)
LiteTracker: Leveraging Temporal Causality for Accurate Low-latency Tissue Tracking [84.5] LiteTrackerは、内視鏡的ビデオストリームにおける組織追跡のための低遅延手法である。
LiteTrackerは最先端の長期追跡手法に基づいており、トレーニング不要なランタイム最適化のセットを導入している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:53:57 GMT)
Robust Barycenter Estimation using Semi-Unbalanced Neural Optimal Transport [84.5] 本研究では、ロバストな連続バリセンタを推定するための新しいスケーラブルなアプローチを提案する。
提案手法は min-max 最適化問題であり,一般的なコスト関数に適用可能である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:16:25 GMT)
Can LLMs Generate Tabular Summaries of Science Papers? Rethinking the Evaluation Protocol [83.9] 文献レビュー表は、科学論文の集合を要約し比較するために欠かせないものである。
学術論文の収集にあたり,ユーザの情報ニーズを最大限に満たす表を作成するタスクについて検討する。
我々の貢献は、現実世界で遭遇する3つの重要な課題に焦点を当てている: (i)ユーザープロンプトは、しばしば未特定である; (ii)検索された候補論文は、しばしば無関係な内容を含む; (iii)タスク評価は、浅いテキスト類似性技術を超えて進むべきである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:52:28 GMT)
Do We Really Need Curated Malicious Data for Safety Alignment in Multi-modal Large Language Models? [83.5] MLLM(Multi-modal large language model)は大きな進歩を遂げているが、その安全性は依然として限られている。
そこで我々は, 単純明快な拒絶文に代えて, 少数の良性命令追従データに対して, MLLMを微調整する手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:03:51 GMT)
I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data? [79.0] 大規模言語モデル (LLM) は、多くの人が知能の形式を示すと結論づけている。
本稿では,潜在離散変数として表される人間の解釈可能な概念に基づいてトークンを生成する新しい生成モデルを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:00:31 GMT)
Testing the Predictions of Surprisal Theory in 11 Languages [77.5] 本研究では,11言語における副次的時間と読解時間の関係について検討する。
より多様な言語に焦点をあてることで、これらの結果は、情報理論と言語間のインクリメンタル言語処理の最も堅牢なリンクを提供すると論じる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:45:41 GMT)
Deep Reasoning Translation via Reinforcement Learning [77.4] 我々は、強化学習を通して自由翻訳を学ぶ深層推論翻訳モデルDeepTransを紹介する。
原文が与えられた場合、報酬モデルは、強化学習中にそれらを思考し、自由に翻訳する方法を深層翻訳モデルに教える。
実験の結果,DeepTransは文学翻訳における性能を16.3%向上させることがわかった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:40:39 GMT)
H3AE: High Compression, High Speed, and High Quality AutoEncoder for Video Diffusion Models [76.2] オートエンコーダ(AE)は、画像およびビデオ生成のための潜時拡散モデルの成功の鍵である。
本研究では,アーキテクチャ設計の選択について検討し,効率的な高圧縮ビデオAEを得るために計算分布を最適化する。
我々のAEは、モバイル上での超高圧縮比とリアルタイム復号化速度を達成しつつ、再現率の点で先行技術より優れています。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:59:06 GMT)
M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models [72.8] 本稿では,Mambaアーキテクチャ上に構築されたハイブリッド線形RNN推論モデルM1を紹介する。
実験結果から,M1は従来の線形RNNモデルよりも優れていただけでなく,最先端のDeepSeek R1蒸留推論モデルの性能とも一致していることがわかった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:38:25 GMT)
EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.6] 戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
EPOはオープンなアクション空間で戦略を提供し、任意のLLMエージェントにプラグインすることで、ゴール指向の振る舞いを動機付けることができる。
社会的および物理的領域にわたる実験は、EPOの長期的なゴールアライメント能力を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:24:54 GMT)
The Scalability of Simplicity: Empirical Analysis of Vision-Language Learning with a Single Transformer [68.7] 本稿では,単一変圧器統合多モーダル大言語モデル(MLLM)であるSAILを紹介する。
事前訓練された視覚変換器(ViT)に依存している既存のモジュール型MLLMとは異なり、SAILは別個の視覚エンコーダを必要としない。
我々は,SAILの特性(スケーラビリティ,クロスモーダル情報フローパターン,視覚表現能力など)をモジュール型MLLMと体系的に比較した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:50:20 GMT)
Predicting ionic conductivity in solids from the machine-learned potential energy landscape [68.3] 本稿では, イオン伝導体の迅速かつ信頼性の高いスクリーニング手法として, 普遍的な原子間ポテンシャルの解析手法を提案する。
第一原理計算では,10種中8種が室温で超イオン性であることが確認された。
本手法は, 機械学習電位によって駆動される分子動力学と比較して約50倍の高速化係数を達成し, 第一原理分子動力学に比べて少なくとも3,000倍高速である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:32:09 GMT)
Cube: A Roblox View of 3D Intelligence [67.4] 膨大な量のデータに基づいてトレーニングされた基礎モデルは、驚くべき推論と生成能力を示している。
本稿では,テキスト・ツー・シェイプ生成,形状・ツー・テキスト生成,テキスト・ツー・シーン生成などに適用可能なトークン化方式について述べる。
我々は、3Dインテリジェンスのための完全に統一された基礎モデルを構築するための私たちの道筋を概説した議論で締めくくります。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:52:06 GMT)
Building Vision Models upon Heat Conduction [66.2] 本研究は, 物理的熱伝導原理に基づく熱伝導演算子 (HCO) について紹介する。
HCOは熱源としてイメージパッチを概念化し、適応的な熱エネルギー拡散を通じて相関をモデル化する。
vHeatは、Swin-Transformerと比較して最大で3倍のスループット、GPUメモリ割り当ての80%削減、計算FLOPの35%削減を実現している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:44:13 GMT)
Pixel-SAIL: Single Transformer For Pixel-Grounded Understanding [65.1] 画素ワイドMLLMタスクのための単一変換器であるPixel-SAILを提案する。
本稿では,視覚的プロンプト入力を単一変換器で理解するための新しい視覚的プロンプトインジェクション戦略を提案する。
また, 単一変圧器の微細な特徴抽出能力を効率的に向上するために, ビジョンエキスパート蒸留戦略を導入する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:52:22 GMT)
Hallucination Detection in LLMs via Topological Divergence on Attention Graphs [64.7] 幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:06:27 GMT)
Pseudo-Autoregressive Neural Codec Language Models for Efficient Zero-Shot Text-to-Speech Synthesis [64.1] 本稿では,AR と NAR を統一した新しい擬似自己回帰(PAR)言語モデリング手法を提案する。
PAR 上に構築した PALLE は 2 段階の TTS システムであり, PAR を初期生成に利用し, NAR を改良する。
実験では、LibriTTSでトレーニングされたPALLEが、大規模データでトレーニングされた最先端システムを上回っていることが示された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:03:21 GMT)
External Large Foundation Model: How to Efficiently Serve Trillions of Parameters for Online Ads Recommendation [63.2] 広告推薦はオンライン広告システムの顕著なサービスであり、積極的に研究されている。
近年の研究では、レコメンデーションモデルのスケールアップと高度な設計が、大幅な性能向上をもたらすことが示されている。
しかし、モデルスケールが大きくなるにつれて、従来の研究は産業規模での2つの基本的な課題を無視することが多いため、産業とのギャップが著しく増大する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:39:56 GMT)
Analysis of Attention in Video Diffusion Transformers [61.8] ビデオ拡散変換器(VDiT)における注意の3つの重要な特性を同定する。
異なるVDiT間の注意パターンは、異なるプロンプト間で類似した構造を示す。
提案手法は全VDiTに対して有効ではない。
VDiTにおける注意シンクの最初の研究を行い、それらを言語モデルにおける注意シンクと比較し、対比する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:25:37 GMT)
SocioVerse: A World Model for Social Simulation Powered by LLM Agents and A Pool of 10 Million Real-World Users [59.4] 本稿では,社会シミュレーションのためのエージェント駆動世界モデルであるSocioVerseを紹介する。
私たちのフレームワークは、4つの強力なアライメントコンポーネントと1000万の実際の個人からなるユーザプールを備えています。
SocioVerseは、多様性、信頼性、代表性を確保しつつ、大規模な人口動態を反映できることを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:12:52 GMT)
SemiETS: Integrating Spatial and Content Consistencies for Semi-Supervised End-to-end Text Spotting [59.1] エンドツーエンドテキストスポッティング,すなわちSemiETSのための新しいセミ教師付きフレームワークを提案する。
具体的には、各タスクの信頼性の高い階層的な擬似ラベルを徐々に生成し、ノイズの多いラベルを減らす。
双方向の流れから位置や転写の重要な情報を抽出し、一貫性を向上させる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:09:17 GMT)
Improving Instruction-Following in Language Models through Activation Steering [58.9] 命令固有ベクトル表現を言語モデルから導出し,それに従ってモデルをステアリングする。
提案手法は,出力形式や長さ,単語の包摂といった制約に対するモデル適合性をいかに向上させるかを示す。
本研究は,アクティベーションステアリングが言語生成におけるきめ細かい制御に実用的でスケーラブルなアプローチを提供することを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:04:45 GMT)
Better Estimation of the KL Divergence Between Language Models [58.8] Kullback-Leibler (KL) の言語モデル間のばらつきを推定することは、多くの応用がある。
また, 標準モンテカルロ推定器の偏差が, 標準モンテカルロ推定器の偏差以下であるようなラオ-ブラックウェル化推定器を導入する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:40:02 GMT)
C-FAITH: A Chinese Fine-Grained Benchmark for Automated Hallucination Evaluation [58.4] 本稿では,いくつかの知識文書に基づいて,詳細なQAデータセットを自動的に構築するエージェントフレームワークであるHaluAgentを紹介する。
本実験は,手作業で設計したルールと迅速な最適化により,生成データの品質が向上できることを実証する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:21:55 GMT)
Visual Chronicles: Using Multimodal LLMs to Analyze Massive Collections of Images [58.4] 我々は,Multimodal LLMを用いて,数千万枚の画像からなる大規模データベースを解析するシステムを提案する。
我々は,一定期間にわたって都市を横断する頻繁な共起的変化(トリエント)を捉えることを目的としている。
ベースラインをはるかに上回り、大都市で撮影された画像から興味深い傾向を見出すことができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:30:56 GMT)
IsoSEL: Isometric Structural Entropy Learning for Deep Graph Clustering in Hyperbolic Space [57.0] グラフクラスタリングは、機械学習における長年のトピックである。
本稿では,K を含まない深層グラフクラスタリングという,現実の非均衡を考慮した問題について検討する。
深層グラフクラスタリングのための新しいIsoSELフレームワークを提案する。このフレームワークでは、双曲空間のローレンツモデルにおける分割木を学習するための双曲型ニューラルネットワークを設計する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:21:41 GMT)
Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data [56.7] RefAlignはReINFORCEスタイルのアライメントアルゴリズムで、参照モデルと報酬モデルがない。
タスク関連の目的と類似性報酬を組み込むことで、安全性や信頼性の整合性といった多様なシナリオに容易に拡張できる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:43:21 GMT)
SlowFastVAD: Video Anomaly Detection via Integrating Simple Detector and RAG-Enhanced Vision-Language Model [52.5] ビデオ異常検出(VAD)は、ビデオ内の予期せぬ事象を識別することを目的としており、安全クリティカルドメインに広く応用されている。
視覚言語モデル(VLM)は強力なマルチモーダル推論能力を示し、異常検出の新しい機会を提供している。
SlowFastVADは高速異常検出器と低速異常検出器を統合したハイブリッドフレームワークである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:30:03 GMT)
Machine Unlearning in Hyperbolic vs. Euclidean Multimodal Contrastive Learning: Adapting Alignment Calibration to MERU [51.0] 本稿では,双曲型コントラスト学習における機械学習について検討する。
我々は、画像とテキストを双曲空間に埋め込んだモデルであるMERUにアライメントを適用し、セマンティック階層をよりよくキャプチャする。
提案手法では,双曲空間の特異性を利用したエンテーメントキャリブレーションやノルム正規化など,双曲特異成分を導入している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:38:46 GMT)
Beyond Progress Measures: Theoretical Insights into the Mechanism of Grokking [50.5] グロキング(Grokking)とは、オーバーフィッティングの拡張後のテスト精度の急激な改善を指す。
本研究では、素数演算のタスクにおいて、Transformerの基盤となるグルーキング機構について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:32:27 GMT)
SWE-PolyBench: A multi-language benchmark for repository level evaluation of coding agents [49.6] 我々はSWE-PolyBenchを紹介した。SWE-PolyBenchは、コードエージェントのリポジトリレベル、実行ベース評価のための新しいベンチマークである。
SWE-PolyBenchには21のリポジトリから2110のインスタンスが含まれており、Java(165)、JavaScript(1017)、TypeScript(729)、Python(199)のタスクが含まれており、バグ修正、機能追加、コードを含んでいる。
実験の結果,現在のエージェントは言語間で不均一なパフォーマンスを示し,複雑な問題に対処しつつ,単純なタスクで高いパフォーマンスを示すことがわかった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:52:04 GMT)
On a gap in the proof of the generalised quantum Stein's lemma and its consequences for the reversibility of quantum resources [49.4] 一般化された量子シュタインの補題の証明は、Lemma III.9 につながる議論のギャップのために正しくないことを示す。
このことは、文献、特に量子絡み合いの可逆性においていくつかの確立された結果に疑問を呈する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:28:47 GMT)
RAISE: Reinforenced Adaptive Instruction Selection For Large Language Models [48.6] 本稿では,タスクオブジェクト駆動型命令選択フレームワークRAISEを提案する。
RAISEは命令の微調整プロセス全体を最適化に組み込んでいる。
モデルの性能改善に対する命令の期待される影響に基づいて,各ステップで命令を選択する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:23:29 GMT)
Revocable Encryption, Programs, and More: The Case of Multi-Copy Security [48.5] 復号化可能な暗号化や復号化可能なプログラムなど,復号化可能なプリミティブの実現可能性を示す。
これは、マルチコピーセキュリティというより強い概念が、制限不能な暗号において到達範囲内にあることを示唆している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:29:30 GMT)
A Survey of Personalization: From RAG to Agent [48.3] パーソナライゼーションは現代のAIシステムにおいて不可欠な機能となり、個々のユーザの好みやコンテキスト、目標に合わせてカスタマイズされたインタラクションを可能にしている。
最近の研究は、ユーザ満足度を高めるために、Retrieval-Augmented Generation (RAG)フレームワークと、パーソナライズされた設定内のより高度なエージェントベースのアーキテクチャへの進化に集中している。
本調査は,RAGの3段階(検索前,検索後,生成前)のパーソナライゼーションを体系的に検討した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:57:52 GMT)
Air Quality Prediction with A Meteorology-Guided Modality-Decoupled Spatio-Temporal Network [47.7] 大気質の予測は公衆衛生と環境保護において重要な役割を担っている。
既存の研究は大気の質予測において重要な役割を過小評価している。
MDSTNetは、予測のための大気汚染依存性を明示的にキャプチャするエンコーダフレームワークである。
ChinaAirNetは、大気の質記録と多気圧レベルの気象観測を組み合わせた最初のデータセットである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:18:11 GMT)
BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.6] Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。
本稿では,機械学習モデル開発に関わる課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。
ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:27:14 GMT)
LLM Can be a Dangerous Persuader: Empirical Study of Persuasion Safety in Large Language Models [47.3] パースセーフティ(PersuSafety)は、パースセーフティを評価するための最初の総合的なフレームワークである。
PersuSafetyは6つの異なる非倫理的説得と15の共通の非倫理的戦略をカバーしている。
我々の研究は、説得のような進歩的、目標駆動的な会話における安全性の整合性を改善するために、より注意を払っている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:20:34 GMT)
UP-Person: Unified Parameter-Efficient Transfer Learning for Text-based Person Retrieval [47.0] テキストベースPerson Retrieval(TPR)は,テキスト記述が与えられた候補画像のプールから対象人物を検索することを目的としたマルチモーダルタスクであり,近年注目されている。
事前の作業では、事前訓練されたCLIPを使用して、人物の視覚的特徴とテキスト的特徴を抽出し、ネットワーク全体を完全に微調整する。
我々は小説『統一』を提案する。
-テキストベースの人検索(UPPerson)のためのPETL(Efficient Transfer Learning)手法を徹底的に導入する。
CLIPからのマルチモーダルな知識。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:40:54 GMT)
The Learning Stabilizers with Noise problem [46.6] 雑音のある学習パリティ(Learning Parity with Noise, LPN)問題は、雑音の存在下でランダムな線形コードを復号するタスクとみなすことができる。
LSNは特殊なケースとして含まれており、これは古典的なケースと同程度に難しいことを示唆している。
我々は、量子ビットスキームの構築から量子データからの学習の計算限界まで、LSN仮定のいくつかの応用を同定する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:20:52 GMT)
Metric-Guided Synthesis of Class Activation Mapping [46.3] クラスアクティベーションマッピング(クラスアクティベーションマッピング、Class activation mapping、CAM)は、畳み込みニューラルネットワーク(CNN)の振る舞いを説明するために用いられるサリエンシ手法のクラスである。
本稿では,CAM表現のためのメトリクスベースアプローチであるSyCAMを紹介する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:01:49 GMT)
ReadMe.LLM: A Framework to Help LLMs Understand Your Library [45.0] 大規模言語モデル(LLM)は、ニッチなソフトウェアライブラリを含むコード生成タスクにしばしば苦労する。
既存のコード生成テクニックは、人間指向のドキュメントだけで失敗する可能性がある。
ソフトウェアライブラリのためのLLM指向のドキュメントであるReadMe.LLMを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:57:43 GMT)
Abacus-SQL: A Text-to-SQL System Empowering Cross-Domain and Open-Domain Database Retrieval [44.9] 既存のテキスト・トゥ・ザ・システムシステムでは、オープンドメインデータベースの検索機能が欠如していることが多い。
abacus-はマルチターンテキスト・トゥ・ザ・タスクで優れたパフォーマンスを発揮し、アプローチの有効性を効果的に検証する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:49:54 GMT)
Lattice Surgery Compilation Beyond the Surface Code [44.5] 表面コード以外のトポロジカルコードに対する格子手術のコンパイルについて検討する。
カラーコードや折り畳まれた表面コードなど,特定の基板やコードについて検討する。
カラーコードでは, マイクロおよびマクロレベルの設計選択が, コンパイルされた論理的$mathrmCNOT+mathrmT$回路の深さにどのように影響するかを数値シミュレーションで解析する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:00:06 GMT)
Trade-offs in Privacy-Preserving Eye Tracking through Iris Obfuscation: A Benchmarking Study [44.4] ユーザアイデンティティを難読化するために,ボーリング,ノイズアップ,ダウンサンプリング,ゴムシートモデル,アイリススタイルの転送をベンチマークした。
実験の結果,曖昧化やノイズ化といった標準的な画像処理手法が,ディープラーニングに基づくタスクに限界的影響を与えることがわかった。
ダウンサンプリング,ゴムシートモデル,アイリススタイル転送は,ユーザ識別子の隠蔽に有効であるが,アイリススタイル転送は高い計算コストで,両ユーティリティタスクにおいて他よりも優れている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:29:38 GMT)
Iris Style Transfer: Enhancing Iris Recognition with Style Features and Privacy Preservation through Neural Style Transfer [44.4] アイリステクスチャは、認証と識別のための金の標準バイオメトリック・モダリティとして広く見なされている。
本稿では、ニューラルスタイル転送を用いて、識別可能なアイリススタイルの特徴を難読化することを提案する。
この研究は、虹彩指向でセキュアでプライバシーに配慮した生体認証システムのための新しい道を開く。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:29:04 GMT)
UniForm: A Unified Multi-Task Diffusion Transformer for Audio-Video Generation [44.2] UniFormはマルチタスク拡散変換器であり、共有潜在空間における音声と視覚のモダリティを共同で生成する。
単一の拡散プロセスは、音声とビデオの両方をモデル化し、音と視覚の固有の相関をキャプチャする。
大規模言語モデルと大規模テキスト・オーディオ・ビデオ複合データセットを活用することで、UniFormは以前のアプローチよりも優れた生成多様性を実現する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:45:19 GMT)
Vikhr: The Family of Open-Source Instruction-Tuned Large Language Models for Russian [44.1] Vikhr (英語: Vikhr) は、ロシア語に特化して設計された、バイリンガルなオープンソースの命令フォローリング LLM のシリーズである。
Vikhrは、適応されたトークン化剤の語彙を特徴とし、全ての重みのトレーニングと指導の継続を行っている。
モデルの重み、命令セット、コードは公開されています。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:23:27 GMT)
Neural Encoding and Decoding at Scale [42.3] NEDS(Neural and Decoding at Scale)を実現するマルチモーダルマルチタスクモデルを提案する。
私たちのアプローチの中心は、神経、行動、内部モダリティ、および相互モダリティマスキングを交互に交互に行う、新しいマルチタスクマスキング戦略です。
NEDSは、複数動物データに基づいて事前訓練された後、新しい動物に微調整された際に、符号化と復号の両方の最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:08:40 GMT)
Satellite Federated Fine-Tuning for Foundation Models in Space Computing Power Networks [42.1] 衛星-地上協調型ファインチューニングフレームワークを提案する。
通信資源と計算資源の両方を統合した通信戦略を導入する。
シミュレーションの結果,約33%の改善でトレーニング時間が大幅に短縮された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:52:34 GMT)
VAE-based Feature Disentanglement for Data Augmentation and Compression in Generalized GNSS Interference Classification [42.1] 干渉の正確な分類を可能にする重要な潜伏特徴を抽出するために, アンタングル化のための変分オートエンコーダ (VAE) を提案する。
提案するVAEは512から8,192の範囲のデータ圧縮率を実現し,99.92%の精度を実現している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:38:00 GMT)
Opinion: Revisiting synthetic data classifications from a privacy perspective [42.1] 合成データは、AI開発の増大するデータ要求を満たすための費用対効果のソリューションとして浮上している。
従来の合成データ型の分類は、合成データを生成するための絶え間なく増加する手法を反映していない。
我々は、プライバシーの観点をよりよく反映した、合成データ型をグループ化する、別のアプローチを例に挙げる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:05:31 GMT)
FUSION: Fully Integration of Vision-Language Representations for Deep Cross-Modal Understanding [42.0] マルチモーダルな大規模言語モデル(MLLM)のファミリーを紹介する。
我々は,ピクセルレベルの統合を実現するために,エンコーディングにテキスト情報を取り入れたテキストガイド統一ビジョンスーパーバイスを提案する。
我々は,新しいデータ合成手法を用いて,合成言語駆動質問応答データセットを構築した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:33:29 GMT)
Deep learning framework for action prediction reveals multi-timescale locomotor control [42.0] 我々は,行動予測のためのディープラーニングベースのフレームワークを開発した。
フレキシブルな入力履歴を持つニューラルネットワークアーキテクチャは、GRUやTransformerといったタイムスケールが全体的なパフォーマンスに優れています。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:08:16 GMT)
Radon: a Programming Model and Platform for Computing Continuum Systems [41.9] Radonは、エッジからクラウドへの連続体用に設計されたフレキシブルなプログラミングモデルとプラットフォームである。
RadonランタイムはWebAssembly(WASM)をベースとして、言語とデプロイメントに依存しない実行を可能にする。
本稿では,Radonのプロトタイプ実装について述べるとともに,分散キーバリューストアのケーススタディを通じてその有効性を評価する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:52:38 GMT)
Zero-shot Autonomous Microscopy for Scalable and Intelligent Characterization of 2D Materials [41.9] 従来、原子スケールの材料の特徴付けには、数ヶ月から数年の専門的な訓練を必要とする。
このボトルネックは、大規模なトレーニングデータセットを必要とせずに研究目的を理解できる完全自律的な実験システムへの需要を加速させる。
本稿では,2次元材料の完全自律的ゼロショットキャラクタリゼーションを実現するため,基礎モデルを統合するエンドツーエンドフレームワークであるATOMICを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:49:45 GMT)
Towards A Generalizable Pathology Foundation Model via Unified Knowledge Distillation [41.3] 現在の基礎モデルは限定型とタスク数でのみ評価されており、その一般化能力と全体的な性能は不明確である。
本研究は,6つの異なる臨床タスクタイプにわたる既成基礎モデルの性能を評価するためのベンチマークを構築した。
本稿では, エキスパートと自己知識の双方からなる統合された知識蒸留フレームワークを提案し, モデルが複数のエキスパートモデルの知識から学べるようにした。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:55:21 GMT)
RHanDS: Refining Malformed Hands for Generated Images with Decoupled Structure and Style Guidance [41.2] RHanDSは、不整形手を洗練するために設計された条件付き拡散ベースのフレームワークである。
不整形手から再構成された手メッシュは、手の構造を修正するための構造ガイダンスを提供する。
不整形手自体は、手のスタイルを保存するためのスタイルガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:00:32 GMT)
Probing then Editing Response Personality of Large Language Models [41.0] 大きな言語モデル(LLM)は、一貫した性格特性を示す応答を生成する有望な能力を示している。
応答するパーソナリティを符号化する上でのLCMのレイヤーワイズ能力を検討するための層ワイズ探索フレームワークを提案する。
推論中に LLM で表現される性格を編集する階層的な編集手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:46:35 GMT)
An Image is Worth $K$ Topics: A Visual Structural Topic Model with Pretrained Image Embeddings [40.7] 本稿では、事前学習した画像埋め込みと構造トピックモデルを組み合わせた視覚構造トピックモデル(vSTM)を提案する。
我々は、vSTMが、オンライン政治コミュニケーションの研究に、解釈可能で、一貫性があり、実質的に関係のあるトピックを特定できることを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:07:11 GMT)
Digital Staining with Knowledge Distillation: A Unified Framework for Unpaired and Paired-But-Misaligned Data [40.7] 近年のディープラーニングの進歩により、教師付きモデルトレーニングによるデジタル染色が可能になった。
本稿では,デジタルセル染色のための新しい教師なし深層学習フレームワークを提案する。
提案手法は, セルターゲットの位置や形状をより正確に把握した染色画像を, 両設定で生成できることを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:48:05 GMT)
FLOWR: Flow Matching for Structure-Aware De Novo, Interaction- and Fragment-Based Ligand Generation [40.6] FLOWRは3次元構造の生成と最適化のための新しいフレームワークである。
FLOWRは、PoseBustersの妥当性の観点から、最先端の拡散とフローベースのメソッドを超越し、精度とインタラクションの回復を図っている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:18:09 GMT)
DiffMOD: Progressive Diffusion Point Denoising for Moving Object Detection in Remote Sensing [40.6] リモートセンシングにおける移動物体検出(MOD)は、低解像度、極めて小さなオブジェクトサイズ、複雑なノイズ干渉によって著しく困難である。
現在のディープラーニングに基づくMOD法は、オブジェクト間の柔軟な情報相互作用を制限する確率密度推定に依存している。
本稿では,移動物体中心をスパースノイズ点から反復的に回収する遠隔センシングのためのポイントベースMODを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:44:52 GMT)
RULSurv: A probabilistic survival-based method for early censoring-aware prediction of remaining useful life in ball bearings [39.6] Kullback-Leibler分散とRUL推定を用いた早期故障検出のための新しいフレキシブルな手法を提案する。
我々は,XJTU-SYデータセットにおいて,3つの異なる操作条件にまたがる5倍のクロスバリデーション戦略を用いてアプローチを実証する。
提案手法は,最大荷重下での5軸受の平均累積相対精度(CRA)を0.7586で達成し,複数の最先端ベースラインを改良する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:57:40 GMT)
Mavors: Multi-granularity Video Representation for Multimodal Large Language Model [39.2] $mathbfMavors$は、全体的ロングビデオモデリングのための新しいフレームワークである。
Mavorsは生のビデオコンテンツを2つのコアコンポーネントを通して潜在表現にエンコードする。
このフレームワークは、イメージを単一フレームビデオとして扱うことにより、画像とビデオの理解を統一する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:14:44 GMT)
Facial Surgery Preview Based on the Orthognathic Treatment Prediction [39.0] 現在の可視化手法は、前処理と後処理のデータに制限があるため、しばしば不正確である。
本研究は,高精度かつ効率的な3次元手術後予測を生成する完全自動輪郭測地を開発する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:02:31 GMT)
Negate or Embrace: On How Misalignment Shapes Multimodal Representation Learning [37.3] マルチモーダル表現学習は、モダリティ間でキューを整列させることにより、強力な表現を学習することを目的としている。
最近の研究では、実世界のデータセットがしばしば不一致を示すことが明らかになっている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:54:19 GMT)
CriteoPrivateAds: A Real-World Bidding Dataset to Design Private Advertising Systems [36.8] このデータセットは、Criteoプロダクションログの匿名バージョンを表している。
これは、多くのプライバシー制約の下で、オンライン広告で一般的に使用される入札モデルを学ぶのに十分なデータを提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:17:42 GMT)
From Prompting to Alignment: A Generative Framework for Query Recommendation [36.5] 本稿では,クエリ生成とユーザの好みを一致させる生成クエリ推薦(GQR)フレームワークを提案する。
具体的には、多様なクエリレコメンデーションタスクを普遍的なプロンプトフレームワークで統一する。
また,クエリワイドCTR予測器をプロセス報酬モデルとしてトレーニングするCTRアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:21:29 GMT)
FATE: A Prompt-Tuning-Based Semi-Supervised Learning Framework for Extremely Limited Labeled Data [36.2] ラベル付きデータとラベルなしデータの両方を活用することで、半教師付き学習(SSL)は大きな進歩を遂げた。
我々は,ラベル付きデータに極めて制限のあるシナリオに適した新しいSSLフレームワークであるFirstly Adapt, Then catEgorize (FATE)を提案する。
FATEはラベルのないデータを利用して監視信号の不足を補い、下流のタスクに転送する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:54:28 GMT)
Robust Learning of Multi-index Models via Iterative Subspace Approximation [36.1] ガウス分布下でラベルノイズを伴うマルチインデックスモデル(MIM)の学習課題について検討する。
一定の正則性特性を満たす有限範囲の良好なMIMに着目する。
ランダムな分類ノイズが存在する場合、我々のアルゴリズムの複雑さは1/epsilon$と不可知的にスケールする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:41:56 GMT)
TAPNext: Tracking Any Point (TAP) as Next Token Prediction [36.0] ビデオ中のAny Point(TAP)の追跡は、ロボット工学、ビデオ編集、そして3D再構成における実証的な応用において、コンピュータビジョンの問題である。
我々は、TAPをシーケンシャルなマスク付きトークンデコーディングとして扱う新しいアプローチであるTAPNextを提案する。
我々のモデルは因果的であり、純粋にオンライン形式で追跡し、トラッキング固有の帰納バイアスを取り除く。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:17:03 GMT)
Designing Large Foundation Models for Efficient Training and Inference: A Survey [35.4] 本稿では,基礎モデルに基づく現代的効率的なトレーニングと推論技術に焦点を当てる。
モデルとシステムデザイン 計算資源を節約するために、異なる側面からのLLMトレーニングと推論を最適化する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:09:15 GMT)
Balancing Two Classifiers via A Simplex ETF Structure for Model Calibration [34.5] ディープニューラルネットワーク(DNN)は、さまざまな領域にわたる最先端のパフォーマンスを実証している。
彼らはしばしばキャリブレーションの問題に直面するが、特に自動運転やヘルスケアといった安全上重要な応用においてである。
近年,分類器の観点からモデルキャリブレーションの改善が試みられている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:09:01 GMT)
Uncertain Location Transmitter and UAV-Aided Warden Based LEO Satellite Covert Communication Systems [33.8] 我々は,地球低軌道衛星Bobに対して,地上のユーザであるAliceが許可されていないメッセージフラグメントを送信する新しい秘密通信システムを提案する。
メッセージチャンク送信中にWillieがAliceを検出して検出する)と、複数のメッセージチャンク上での全体的なキャッチ確率の2つの主要なパフォーマンス指標を紹介した。
1)検出ウィンドウのサイズと2)メッセージチャンクの数です。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:55:31 GMT)
Hearing Anywhere in Any Environment [33.6] 本稿では,クロスルームルームインパルス応答(RIR)予測のためのフレームワークであるxRIRを提案する。
我々の一般化可能なアプローチの中核は、パノラマ深度画像から空間コンテキストをキャプチャする幾何学的特徴抽出器と、いくつかの参照RIRサンプルから詳細な音響特徴を抽出するRIRエンコーダを組み合わせることである。
実験により,本手法が一連のベースラインを強く上回ることを示すとともに,実世界の4つの環境におけるモデルの評価を行い,我々のアプローチの一般化可能性とデータセットの現実性を示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:37:52 GMT)
HistLLM: A Unified Framework for LLM-Based Multimodal Recommendation with User History Encoding and Compression [33.3] HistLLMは、ユーザ履歴を通じてテキストと視覚機能を統合する革新的なフレームワークである。
モジュール (UHEM) は、ユーザ履歴のインタラクションを単一のトークン表現に圧縮する。
提案手法の有効性と有効性を示す実験を行った。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:01:11 GMT)
Labeling Messages as AI-Generated Does Not Reduce Their Persuasive Effects [33.2] 1つの顕著なポリシー提案は、透明性を高め、情報に対する批判的思考を促進するために、AI生成コンテンツを明示的にラベル付けすることである。
我々は多種多様なアメリカ人を対象に調査実験を行った。
その結果、メッセージは一般的に説得力があり、参加者の政策に対する見解に平均9.74ポイント影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:22:39 GMT)
A Semantic-based Optimization Approach for Repairing LLMs: Case Study on Code Generation [32.2] ulAnalytical ulRepair(textscSTAR)に対するulSemantic ulTargetingを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:57:28 GMT)
MURR: Model Updating with Regularized Replay for Searching a Document Stream [32.1] インターネットは、新しいドキュメントとユーザ生成クエリの連続ストリームを生成する。
クエリとドキュメントのペアの固定セットで一度トレーニングされたニューラル検索モデルは、新しく作成されたコンテンツを誤って表現し始める。
本稿では,正規化リプレイによるモデル更新戦略であるMURRを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:13:03 GMT)
Aligning Anime Video Generation with Human Feedback [31.7] アニメビデオ生成は、アニメデータの不足と異常な動きパターンのために大きな課題に直面している。
既存の報酬モデルは、主に現実世界のビデオ用に設計されており、アニメのユニークな外観と一貫性の要求を捉えていない。
そこで本研究では,人間のフィードバックを有効活用して,アニメ映像生成を向上するためのパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:49:34 GMT)
Let the Noise Speak: Harnessing Noise for a Unified Defense Against Adversarial and Backdoor Attacks [31.3] 機械学習に対する悪意のあるデータ操作攻撃は、安全クリティカルなアプリケーションにおける信頼性を損なう。
再建型侵入検知システムであるNoiSecを提案する。
NoiSecは、テスト入力からノイズを取り除き、ノイズから基礎となる特徴を抽出し、それらを活用して、システマティックな悪意のある操作を認識する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:19:46 GMT)
Predict+Optimize Problem in Renewable Energy Scheduling [31.0] 本稿では IEEE-CIS Technical Challenge on Predict+ for Renewable Energy Scheduling のソリューションをベンチマークする。
光GBMアンサンブルを用いた最適化手法は、少なくとも2%のエネルギーコスト削減を実現した。
この研究の新規性は、現実の再生可能エネルギースケジューリング問題に適用される予測+方法論の包括的評価にある。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:09:10 GMT)
ToxiCraft: A Novel Framework for Synthetic Generation of Harmful Information [30.3] Toxicraftは有害な情報のデータセットを合成するための新しいフレームワークである。
少量のシードデータだけで、我々のフレームワークは多種多様な合成データを生成することができるが、驚くほど現実的であり、有毒な情報の例である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:30:57 GMT)
Learning to Erase Private Knowledge from Multi-Documents for Retrieval-Augmented Large Language Models [30.1] 本稿では、検索型拡張世代(RAG)のプライバシ消去タスクを紹介する。
我々はまず、匿名化攻撃に対する防御を目的として、文書間の潜在的な知識を特定するために、グローバルな知識グラフを構築した。
4つのQAデータセットに対する実験により、Eraser4RAGはGPT-4oよりも優れた消去性能を示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:10:31 GMT)
COUNTS: Benchmarking Object Detectors and Multimodal Large Language Models under Distribution Shifts [30.0] 物体検出器のOOD(Out-of-distribution)一般化能力は、研究者の注目を集めている。
オブジェクトレベルのアノテーションを備えた大規模OODデータセットであるCOUNTSを紹介する。
COUNTSは14の自然分布シフト、222K以上のサンプルと1,196K以上のラベル付きバウンディングボックスを含んでいる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:13:33 GMT)
Interactivity x Explainability: Toward Understanding How Interactivity Can Improve Computer Vision Explanations [29.9] 本稿では,3つの共通説明型(ヒートマップベース,コンセプトベース,プロトタイプベース)で問題に対処するためのメカニズムとして,対話性について検討する。
対話性はユーザコントロールを強化し,関連情報への迅速な収束を促進する一方で,新たな課題ももたらした。
これらの問題に対処するために、我々は、慎重に選択されたデフォルトビュー、独立した入力制御、制約された出力空間を含む、インタラクティブなコンピュータビジョンの説明のための設計勧告を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:35:26 GMT)
Two Heads are Better Than One: Test-time Scaling of Multi-agent Collaborative Reasoning [29.6] 大規模言語モデル(LLM)上に構築されたマルチエージェントシステム(MAS)は、複雑で現実的なタスクを解決するための有望な道を提供する。
テストタイムスケーリング(TTS)の最近の進歩は、難解な推論タスクにおいて、シングルエージェントのパフォーマンスを大幅に改善した。
モデルレベルのトレーニングとシステムレベルの調整の両方を通じて協調推論を強化するために設計された適応型マルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:27:45 GMT)
VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model [29.5] 最近、DeepSeek R1は、強化学習が大規模言語モデル(LLM)の推論能力を大幅に改善できることを示した。
視覚言語モデル(VLM)へのR1型強化学習の拡張について検討する。
VLM-R1 は,汎用視覚言語タスクにおける VLM の性能向上のために RL を利用した専用フレームワークである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:15:54 GMT)
On Precomputation and Caching in Information Retrieval Experiments with Pipeline Architectures [29.1] 我々は、オープンソースのPyTerrier IRプラットフォームのキャッシング機能を改善する取り組みについて説明する。
1)システム比較時の共通パイプラインプレフィックスの自動暗黙キャッシュと,(2)新しい拡張パッケージであるpyterrier-cachingによるオペレーションの明示的なキャッシュである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:51:35 GMT)
The Mirage of Performance Gains: Why Contrastive Decoding Fails to Address Multimodal Hallucination [28.2] マルチモーダル大言語モデル(MLLM)における幻覚の低減に対照的な復号法が広く用いられている
本稿では,このような手法が幻覚の問題を効果的に軽減できないことを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:25:37 GMT)
Bundle Neural Networks for message diffusion on graphs [28.2] 結合ニューラルネットワーク(BuNN)は,任意のグラフ上の任意の特徴変換をインジェクティブな位置符号化で近似できることを示す。
また、BuNNが任意のグラフの族上の任意の特徴変換を近似して、任意の射影的位置エンコーディングを行えば、普遍的なノードレベルの表現性が得られることを証明した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:52:41 GMT)
Efficient Process Reward Model Training via Active Learning [27.8] プロセス・リワード・モデル(PRM)は、大規模言語モデル(LLM)の段階的な監視を提供する。
本稿では,トレーニングにおける最も不確実なサンプルを積極的に選択する,アクティブな学習手法であるActPRMを提案する。
有能だがコストのかかる推論モデルがこのデータをラベル付けする。
この選択されたデータセットの後のトレーニングでは、ProcessBench (75.0%) と PRMBench (65.5%) の新たな最先端(SOTA) PRMが同じサイズのモデルと比較される。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:53:56 GMT)
Transferable text data distillation by trajectory matching [27.8] データ蒸留法は、少数のデータサンプルを合成し、全データセットのトレーニング効果を達成することを目的としている。
本研究では,軌道マッチングに基づいて擬似的プロンプトデータを学習する手法を提案する。
ARC-Easy と MMLU の命令チューニングデータセットを含む2つのベンチマークによる評価により,SOTA データ選択手法 LESS よりも蒸留法の方が優れていることを確認した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:39:26 GMT)
A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science [27.7] 大規模言語モデル(LLM)における人間の空間認識とその空間知能への影響について検討する。
次に, LLMにおける空間記憶, 知識表現, 抽象的推論について検討し, その役割と関係を明らかにする。
我々は空間記憶と理解から空間的推論と知性へと進化する枠組みに従って、空間的インテリジェンス(空間的インテリジェンス、空間的インテリジェンス、空間的インテリジェンス)を分析した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:38:31 GMT)
HUMOTO: A 4D Dataset of Mocap Human Object Interactions [27.6] Human Motions with Objects(ヒューマン・モーション・ウィズ・オブジェクト)は、モーション生成、コンピュータビジョン、ロボット工学応用のための人間と物体の相互作用の高忠実なデータセットである。
Humotoは、63の精度でモデル化されたオブジェクトと72の明瞭なパーツとのインタラクションをキャプチャする。
プロのアーティストは、それぞれのシーケンスを厳格に掃除し、検証し、足の滑りや物体の侵入を最小限にする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:59:29 GMT)
How Do Recommendation Models Amplify Popularity Bias? An Analysis from the Spectral Perspective [26.9] 勧告システム(RS)は、しばしば人気バイアスに悩まされる。
本研究は,本現象の根本原因を明らかにするための包括的実験および理論的解析を行う。
本稿では、スペクトルノルム正規化器を利用して主特異値の大きさをペナルティ化する新しいデバイアスング戦略を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:40:38 GMT)
A Piecewise Lyapunov Analysis of Sub-quadratic SGD: Applications to Robust and Quantile Regression [26.8] 一階微分しか持たない関数を$f$で扱える新しいLyapunov関数を導入する。
一般の減少段数と定数段数の下で有限時間モーメント境界を導出する。
我々の結果は、特にオンライン統計手法に広く応用されている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:32:35 GMT)
Multi-view Intent Learning and Alignment with Large Language Models for Session-based Recommendation [26.6] セッションベースのレコメンデーション(SBR)メソッドは、しばしばユーザーの行動データに依存する。
複数の視点から意味的および行動的信号を統合したLLM強化SBRフレームワークを提案する。
第1段階では、複数のビュープロンプトを使用して、セッションセマンティックレベルで潜伏したユーザ意図を推測し、意図的位置決めモジュールによってサポートされ、幻覚を緩和する。
第2段階では、これらのセマンティック推論を行動表現と整合させ、大きなモデルと小さなモデルの両方からの洞察を効果的に融合させる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:13:08 GMT)
Focus on Local: Finding Reliable Discriminative Regions for Visual Place Recognition [26.3] 視覚的位置認識(VPR)は、ジオタグ付き画像のデータベースを参照することにより、クエリ画像の位置を予測することを目的としている。
既存の手法では、識別領域の正確なモデリングと完全な利用が欠如している。
本稿では、画像検索とVPRにおける再ランク付けを同時に行うために、FoL(FoL)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:04:51 GMT)
EquiVDM: Equivariant Video Diffusion Models with Temporally Consistent Noise [25.7] sim-to-real, style-transfer, video upsamplingなどの領域におけるビデオ拡散モデルの応用には,時間的に一貫したビデオ・ビデオ生成が不可欠である。
本稿では,時間的に一貫した雑音を利用して,特殊なモジュールや制約を伴わずにコヒーレントなビデオフレームを生成するビデオ拡散フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:26:29 GMT)
StruPhantom: Evolutionary Injection Attacks on Black-Box Tabular Agents Powered by Large Language Models [25.6] ブラックボックスLSMを用いた表型エージェントを対象とするStruPhantomという新たな攻撃手法を提案する。
我々の攻撃は、フィッシングリンクや悪意のあるコードを含むアプリケーションの応答を強制する上で、ベースラインよりも50%以上の成功率を達成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:22:04 GMT)
Enhancing Multi-task Learning Capability of Medical Generalist Foundation Model via Image-centric Multi-annotation Data [25.4] 画像中心型マルチアノテーションX線データセット(IMAX)について紹介する。
各X線画像は平均4.10タスクと7.46のトレーニングエントリに関連付けられ、画像毎のマルチタスク表現の豊かさが保証される。
一般的な分散マルチアノテーションX線データセット(DMAX)と比較すると、IMAXはマルチタスク平均性能の顕著な向上を一貫して示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:09:37 GMT)
Advancing RFI-Detection in Radio Astronomy with Liquid State Machines [25.1] 人為的な電波源からの電波周波数干渉(RFI)は、現在および将来の電波望遠鏡に重大な課題をもたらす。
本研究では、スパイクネットワークのクラスであるLiquid State Machines (LSMs) をRFI検出に適用する。
我々は、RFI検出の既知のベンチマークであるHyrogen Epoch of Reionization Array (HERA)から得られたシミュレーションデータに基づいてLSMを訓練する。
本モデルでは,画素あたり98%の精度,F1-Integrate 0.743の精度を実現し,この高い課題に対する競合性能を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:51:01 GMT)
OctGPT: Octree-based Multiscale Autoregressive Models for 3D Shape Generation [25.0] OctGPTは3次元形状生成のための新しいマルチスケール自己回帰モデルである。
従来の3D自動回帰手法の効率と性能を劇的に向上させる。
OctGPTは、テキスト、スケッチ、イメージコンディショナリ生成など、さまざまなタスクにまたがる優れた汎用性を示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:31:26 GMT)
How Instruction and Reasoning Data shape Post-Training: Data Quality through the Lens of Layer-wise Gradients [24.7] 本稿では,低品質な命令と推論データによって誘導される層次勾配のスペクトル解析を行う。
我々の研究は、データ品質とトレーニング安定性の相互作用を照らし、ポストトレーニングのためのより良いデータ探索戦略を開発するための新しい洞察を隠蔽する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 23:53:47 GMT)
Cross-Domain Continual Learning for Edge Intelligence in Wireless ISAC Networks [24.6] エッジインテリジェンス(EI)は、チャネル状態情報(CSI)に基づいてユーザアクティビティを検知するエッジデバイス(ED)で開発されることが期待される。
CSIはユーザの特性に非常に依存しているため、CSI-Activity関係はドメイン依存であることが知られている。
We propose the EdgeCL framework, which the EI can continue-then-discard each input dataset。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:58:21 GMT)
MoLe-VLA: Dynamic Layer-skipping Vision Language Action Model via Mixture-of-Layers for Efficient Robot Manipulation [24.2] MLLM(Multimodal Large Language Models)は、複雑な言語と視覚的データの理解に優れる。
彼らの実世界の展開は、相当な計算とストレージの需要によって妨げられている。
動的LDM層活性化のためのMixture-of-Layers Vision-Language-Action Model (MoLe) アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:39:39 GMT)
xVerify: Efficient Answer Verifier for Reasoning Model Evaluations [24.1] 推論モデル評価のための効率的な答え検証器であるxVerifyを提案する。
xVerifyは同値判定において強い能力を示し、推論モデルによって生成された答えが参照回答と等価であるかどうかを効果的に決定できる。
テストセットと一般化セットの両方で実施された評価実験では、すべてのxVerifyモデルが全体のF1スコアと95%を超える精度を達成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:59:36 GMT)
Characterizing LLM-driven Social Network: The Chirper.ai Case [24.1] 大規模言語モデル(LLM)は、人間の意思決定プロセスをシミュレートする能力を示している。
本稿では,LLMエージェントに代表されるX/TwitterのようなソーシャルネットワークであるChirper.aiを大規模に分析する。
投稿行動,虐待内容,ソーシャルネットワーク構造におけるLLMエージェントと人間の主な違いについて検討した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:53:31 GMT)
CurricuLLM: Automatic Task Curricula Design for Learning Complex Robot Skills using Large Language Models [24.0] CurricuLLMは複雑なロボット制御タスクのためのカリキュラム学習ツールである。
自然言語でサブタスクを生成し、サブタスクを実行可能なコードに変換する。
CurricuLLMは複雑なロボット制御タスクの学習を支援する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:02:44 GMT)
LLaVA-ReID: Selective Multi-image Questioner for Interactive Person Re-Identification [23.6] 対話型人物再識別(Inter-ReID)という新しいタスクを導入する。
Inter-ReIDは対話に基づく検索タスクであり、目撃者との対話を通じて初期記述を反復的に洗練する。
LLaVA-ReIDは,視覚的およびテキスト的コンテキストに基づいて,対象とする質問を生成する質問モデルである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:26:31 GMT)
SUMART: SUMmARizing Translation from Wordy to Concise Expression [23.6] 本研究では,動詞字幕翻訳のボリュームを要約し,圧縮する手法であるSUMARTを提案する。
SUMARTは、外国語で会話、音声、ビデオコンテンツ、およびスピーチを素早く理解したいユーザーを対象としている。
実践的な応用として,拡張現実空間における字幕翻訳を用いた会話を可能にするアプリケーションを開発した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:13:09 GMT)
MorphTok: Morphologically Grounded Tokenization for Indian Languages [23.6] トークン化は、特に大規模言語モデル(LLM)の台頭において、NLPにおいて重要なステップである。
サブワードのトークン化に先立って,形態素認識のセグメンテーションを事前学習ステップとして提案する。
また,スクリプト固有の制約を組み込んだ従来のBPEアルゴリズムの拡張であるConstrained BPEを導入する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:44:45 GMT)
LLM Unlearning Reveals a Stronger-Than-Expected Coreset Effect in Current Benchmarks [23.6] 大規模言語モデルアンラーニングは、安全性と制御モデル行動を保証する上で重要な課題となっている。
LLMのアンラーニングは、かなり小さなサブセット(コアセットとして機能する)で効果的に維持可能であることを示す。
これは、非常に低データ状態であっても、これらのベンチマークでのLLMアンラーニングが驚くほど容易に実行可能であることを示唆している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:38:37 GMT)
Undermining Federated Learning Accuracy in EdgeIoT via Variational Graph Auto-Encoders [23.4] EdgeIoTはIoT(Internet of Things)デバイスによるモバイルエッジコンピューティングを提供し、データソースに近いデータ処理を可能にする。
フェデレートされた学習により、各デバイスはローカルに処理されたデータで共有された機械学習モデルのアップデートをアップロードできる。
本稿では,データに依存しないモデル操作攻撃として知られるEdgeIoTにおけるフェデレーション学習を対象とする新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:09:38 GMT)
Guiding Reasoning in Small Language Models with LLM Assistance [23.3] 小さな言語モデルは、深く、多段階の論理的推論を必要とするタスクに適していると疑念を抱いた。
本稿では,Small Reasons, Large Hintsというフレームワークについて紹介する。
数学的推論データセットを用いた実験により, ターゲットとなる外部足場の性能が著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:32:45 GMT)
AgMMU: A Comprehensive Agricultural Multimodal Understanding and Reasoning Benchmark [22.8] 視覚言語モデル(VLM)の評価と開発のためのデータセットAgMMUをキュレートする。
私たちのデータセットの中核的な特徴として、現実のユーザと農業の専門家との116,231件の会話から、すべての事実、質問、回答が抽出されます。
また,205,399点の農業知識情報を含む開発環境も提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:59:45 GMT)
Trustworthiness of Stochastic Gradient Descent in Distributed Learning [22.4] 分散学習(DL)は訓練を加速するために複数のノードを使用し、大規模モデルの効率的な最適化を可能にする。
鍵となる最適化アルゴリズムであるSGDは、このプロセスにおいて中心的な役割を果たす。
通信ボトルネックはしばしばスケーラビリティと効率を制限し、これらの課題を軽減するために圧縮されたSGD技術の採用が増加する。
通信オーバーヘッドに対処しているにもかかわらず、圧縮されたSGDは、ノード間の勾配交換がグラッドインバージョン(GradInv)やメンバーシップ推論攻撃(MIA)のような攻撃に弱いため、信頼性の懸念をもたらす。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:19:21 GMT)
Art3D: Training-Free 3D Generation from Flat-Colored Illustration [22.4] Art3Dは、フラットカラーの2Dデザインを3Dに持ち上げる訓練不要の方法だ。
3次元感のないフラットカラー画像に対して,既存の画像から3次元モデルへの一般化性能をベンチマークした。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:53:10 GMT)
Hierarchical and Step-Layer-Wise Tuning of Attention Specialty for Multi-Instance Synthesis in Diffusion Transformers [22.3] テキスト・ツー・イメージ(T2I)生成モデルは、しばしばMIS(Multi-instance synthesis)と競合する。
UNetアーキテクチャの従来のMIS制御方法は、DiTベースのモデルに適合しない。
DiTモデルにおけるMIS向上のためのトレーニング不要アプローチを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:59:58 GMT)
Embedding Ontologies via Incorporating Extensional and Intensional Knowledge [22.1] オントロジーはドメイン内の豊富な知識を含み、拡張的知識と強迫的知識という2つのカテゴリに分けられる。
既存のオントロジの埋め込みアプローチは、拡張的知識と集約的知識の両方を同時に考慮することができない。
本研究では,拡張空間と拡張空間という2つの空間におけるオントロジーを表現することで,EIKE(Extensional and Intensional Knowledge Embedding)を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:08:09 GMT)
TAMP: Token-Adaptive Layerwise Pruning in Multimodal Large Language Models [22.0] MLLM(Multimodal Large Language Models)は多様なマルチモーダルデータやタスクを理解する上で,優れた汎用性を示している。
本稿では,MLLMに適した簡易かつ効果的な刈取フレームワークであるTAMPを提案する。
我々は、視覚言語タスク用に設計されたLLaVA-NeXTと、音声、視覚、言語モーダルを処理可能なVideoLLaMA2の2つの最先端MLLMに対して、本手法の有効性を検証する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:44:38 GMT)
The Jailbreak Tax: How Useful are Your Jailbreak Outputs? [21.5] 既存のjailbreakによって生成されたモデル出力が実際に有用かどうかを問う。
8つの代表的なジェイルブレイクに対する評価は、ジェイルブレイク応答におけるモデルユーティリティの一貫した低下を示す。
全体として、我々の研究は、AI安全性の新たな重要な指標としてジェイルブレイク税を提案している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:30:41 GMT)
LangPert: Detecting and Handling Task-level Perturbations for Robust Object Rearrangement [21.2] LangPertはTLP(Task-Level Perturbations)の検出と緩和を目的とした言語ベースのフレームワークである。
LangPertはVisual Language Model (VLM)を統合し、ポリシーのスキル実行と環境TLPを包括的に監視する。
実験の結果,LangPertはベースライン法よりも多種多様なTLP状況を効果的に処理できることがわかった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:39:15 GMT)
Separate to Collaborate: Dual-Stream Diffusion Model for Coordinated Piano Hand Motion Synthesis [20.9] 音声入力からピアノ演奏のための同期手ジェスチャーを生成するためのデュアルストリームニューラルフレームワークを提案する。
ハンドコーディネートな非対称アテンション機構は、非対称な手特有の特徴を強調するために対称(共通モード)ノイズを抑制する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:17:41 GMT)
LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models [20.8] LLM(Large Language Models)は、仮説生成に埋め込まれた科学的知識を活用する可能性に関心を寄せている。
既存のベンチマークは、LLMによる暗記の影響を受けやすい一般的な方程式に依存しており、発見を反映しないインフレーションされたパフォーマンス指標に繋がる。
本稿では,4つの領域にまたがる239の課題を伴う総合的なベンチマークであるLSM-SRBenchを紹介する。
我々のベンチマークは、2つの主要なカテゴリで構成されている: LSR-Transformは、一般的な物理モデルからあまり一般的でない数学的表現に変換し、記憶された形式を超えた推論をテストする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:00:13 GMT)
MDIT: A Model-free Data Interpolation Method for Diverse Instruction Tuning [20.8] 大規模言語モデル(LLM)は、様々なタスクにまたがってますます適用されてきている。
本稿では,多種多様な命令チューニングのためのモデルフリーデータ手法MDITを提案する。
複数のベンチマークタスクにおいて,本手法が優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:48:08 GMT)
PMNI: Pose-free Multi-view Normal Integration for Reflective and Textureless Surface Reconstruction [20.7] 神経表面再構成法PMNI(Pose-free Multi-view Normal Integration)を提案する。
表面の正規と多視点形状の整合性から幾何的制約を強制することにより、PMNIは同時に正確なカメラポーズと高忠実な表面形状を復元する。
合成および実世界のデータセットを用いた実験結果から,反射面の再構成における最先端性能が得られた。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:50:54 GMT)
CliniChat: A Multi-Source Knowledge-Driven Framework for Clinical Interview Dialogue Reconstruction and Evaluation [20.6] 我々はCliniChatを提案する。CliniChatは、マルチソース知識を統合して、大規模言語モデルを用いて実世界の臨床面接をシミュレートするフレームワークである。
Clini-ReconとClini-Evalの2つのモジュールがインタビュー対話の再構築と評価を担当している。
我々は,高品質な合成インタビュー対話データセットであるMedQA-Dialogと臨床面接に特化したモデルであるCliniChatGLMに貢献する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:06:47 GMT)
Localized Cultural Knowledge is Conserved and Controllable in Large Language Models [20.4] 文化的な文脈を明示的に提供することで、モデルが文化的に局所的な応答を生成できる能力が大幅に向上することを示す。
しかし、明確な促進効果にもかかわらず、答えは多様性を減らし、ステレオタイプに傾向がある。
我々は、すべての非英語言語にまたがって保存された明示的な文化的カスタマイズベクターを特定し、LLMを合成英語文化世界モデルから、各非英語文化世界に向けて操ることを可能にする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:53:58 GMT)
FedProphet: Memory-Efficient Federated Adversarial Training via Robust and Consistent Cascade Learning [20.1] FAT(Federated Adversarial Training)は、FAT(Federated Learning)に対する敵の例に対する頑健さを補うことができる。
既存のメモリ効率のFL法は、不整合な局所モデルと大域モデルによる精度の低下と弱い堅牢性に悩まされている。
我々は、メモリ効率、堅牢性、一貫性を同時に達成できる新しいFedProphetフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:20:43 GMT)
Scalable fluxonium qubit architecture with tunable interactions between non-computational levels [20.0] 非計算状態間の調整可能な結合を維持しつつ、キュービット状態の疎結合を可能にするスケーラブルなフラキソニウムアーキテクチャを導入する。
この問題は、フラキソニウムのプラズモン転移に対して調整可能なカップリングを実装することで緩和され、一方、高速で高忠実なゲートと受動ZZ抑制が可能であることを実証する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:31:47 GMT)
Steering No-Regret Agents in MFGs under Model Uncertainty [19.8] 本研究では,密度非依存遷移を伴う平均フィールドゲームにおけるステアリング報酬の設計について検討する。
我々は,エージェントの行動と所望の行動との累積的ギャップについて,サブ線形後悔の保証を確立する。
本研究は, 不確実な大人口システムにおいて, エージェントの操舵行動に有効な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:28:22 GMT)
TPC: Test-time Procrustes Calibration for Diffusion-based Human Image Animation [19.8] 人間の画像アニメーションは、参照された人間の画像と対象のモーションビデオの入力から人間のモーションビデオを生成することを目的としている。
現在の拡散に基づく画像アニメーションシステムは、人間のアイデンティティを目標運動に転送する精度が高いが、出力に不規則な品質を示す。
提案手法は単純で,任意の拡散型画像アニメーションシステムにモデルに依存しない方法で適用することができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:02:09 GMT)
AimTS: Augmented Series and Image Contrastive Learning for Time Series Classification [19.7] 時系列分類(TSC)は時系列解析において重要な課題である。
AimTSは、マルチソース時系列データから一般化可能な表現を学ぶための事前トレーニングフレームワークである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:55:16 GMT)
ClassEval-T: Evaluating Large Language Models in Class-Level Code Translation [19.7] クラスレベルのコード翻訳ベンチマークであるClassEval-Tを構築し、クラスレベルのコード翻訳における最近のLLMの性能を広範囲に評価する最初の試みを行う。
完全なコードサンプルと関連するテストスイートを使って、JavaとC++への手動移行を実現するのに、私たちは360人時間を費やしました。
実験結果は,最も広く研究されているメソッドレベルのコード翻訳ベンチマークと比較して,顕著な性能低下を示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:45:07 GMT)
DUKAE: DUal-level Knowledge Accumulation and Ensemble for Pre-Trained Model-Based Continual Learning [19.7] 事前学習型モデルベース連続学習(PTMCL)は,新たな知識のより迅速な獲得を可能にするため,注目を集めている。
本稿では,機能レベルと意思決定レベルの知識蓄積を両立させるDual-level Knowledge Accumulation and Ensemble(DUKAE)を提案する。
CIFAR-100、ImageNet-R、CUB-200、Cars-196データセットの実験は、我々のアプローチの優れた性能を示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:22:13 GMT)
Balancing Stability and Plasticity in Pretrained Detector: A Dual-Path Framework for Incremental Object Detection [19.7] 安定性と可塑性のバランスは、事前訓練されたモデルベースインクリメンタルオブジェクト検出における根本的な課題である。
局所化安定性と分類可塑性を分離する事前訓練されたDETR検出器上に構築したデュアルパスフレームワークを提案する。
我々はPTMIODの安定性と塑性のバランスを効果的に保ち、堅牢なクロスドメイン適応と強力な鍛造能力の維持を実現していることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:31:35 GMT)
Unveiling the Deficiencies of Pre-trained Text-and-Layout Models in Real-world Visually-rich Document Information Extraction [19.1] 視覚に富んだ文書から情報抽出をベンチマークするためのエンティティ中心のデータセットであるEC-FUNSDを紹介する。
PTLMの絶対性能, 一般化, 堅牢性, 公正性など, 複数の側面から実世界の情報抽出能力を評価する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:30:35 GMT)
Can Reasoning Models Reason about Hardware? An Agentic HLS Perspective [18.8] OpenAI o3-mini と DeepSeek-R1 は Chain-of-Thought (CoT) を通じて推論を強化している
本稿では, LLM の推論が高レベル合成(HLS)設計空間探索と最適化の課題に対処できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:39:57 GMT)
Characterizing Knowledge Manipulation in a Russian Wikipedia Fork [18.6] 最近ローンチされたウェブサイトRuwikiは、ロシアの法律に従ってオリジナルのウィキペディアのコンテンツをコピーして修正した。
この記事では、このロシアのウィキペディアのフォークを詳細に分析する。
本論文では,原版に対する主な変更を特徴付ける手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:30:30 GMT)
Improved Visual-Spatial Reasoning via R1-Zero-Like Training [18.6] ビデオ視覚空間インテリジェンス(VSI)は、マルチモーダル大言語モデル(MLLM)の最も重要な推論能力の1つである。
この研究は、R1-Zeroライクなトレーニングを通してMLLMの視覚空間的推論を改善するための、最初の詳細な研究を行う。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:12:57 GMT)
Fuzzing: On Benchmarking Outcome as a Function of Benchmark Properties [18.6] ベンチマーク結果に対する特性の影響を定量化する2つの手法について検討する。
ファジィの相対的有効性に影響を及ぼすと疑われる特性のサブセットに対する各アプローチをインスタンス化する。
そこで我々は, ファジィの相対的有効性に統計的に有意な影響を及ぼす新しい特性を複数同定した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:09:20 GMT)
NaviDiffusor: Cost-Guided Diffusion Model for Visual Navigation [18.5] 本稿では,学習に基づく手法の強みと視覚ナビゲーションの古典的アプローチを組み合わせたハイブリッドアプローチを提案する。
提案手法はまず,様々な経路-RGB観測ペア上で条件拡散モデルを訓練する。
推論中は、異なるシーン固有のコストとタスクレベルのコストの勾配を統合し、拡散モデルを誘導し、制約を満たす有効なパスを生成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:06:02 GMT)
A Policy Gradient Framework for Stochastic Optimal Control Problems with Global Convergence Guarantee [17.8] 最適制御問題に対するポリシー勾配法を連続的に検討する。
勾配流のグローバル収束を証明し、一定の正則性仮定の下で収束率を確立する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:34:46 GMT)
EgoEvGesture: Gesture Recognition Based on Egocentric Event Camera [17.6] 本稿では,イベントデータ処理に特化して設計された新しいネットワークアーキテクチャを提案する。
イベントカメラを用いたエゴセントリックなジェスチャー認識のための,最初の大規模データセットを構築した。
本手法は,7Mパラメータのみの未確認被験者に対して62.7%の精度を達成し,最先端手法よりも3.1%高い精度を示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:44:20 GMT)
LL-Gaussian: Low-Light Scene Reconstruction and Enhancement via Gaussian Splatting for Novel View Synthesis [17.5] 低照度シーンにおける新しいビュー合成(NVS)は、劣化した入力のために重要な課題である。
低照度sRGB画像からの3次元再構成と拡張のための新しいフレームワークであるLL-Gaussianを提案する。
最先端のNeRFベースの手法と比較して、LL-Gaussianは最大2000倍高速な推論を実現し、トレーニング時間を2%に短縮する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:39:31 GMT)
MSCoT: Structured Chain-of-Thought Generation for Multiple Programming Languages [17.4] CoT(Chain-of-Thought)推論は、コード生成モデルの再トレーニングや微調整を必要とせずに、モデルのパフォーマンスを大幅に改善することができる。
既存のCoT生成メソッドは主にPythonコードに集中しており、他のプログラミング言語のパフォーマンスは未定である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:30:47 GMT)
OVERLORD: Ultimate Scaling of DataLoader for Multi-Source Large Foundation Model Training [17.2] 産業レベルの分散データロードアーキテクチャであるOVERLORDを3つのイノベーションで紹介する。
OVERLORDは、(1)エンドツーエンドのトレーニングスループットの改善、(2)CPUメモリ使用量の最低3.6倍の削減を実現している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:31:22 GMT)
MultiLoKo: a multilingual local knowledge benchmark for LLMs spanning 31 languages [17.2] 我々は、31言語をカバーするLLMの多言語性を評価するための新しいベンチマークであるMultiLoKoを提案する。
我々はMultiLoKoのスコアを11のベースで計算し、マルチリンガルなチャットモデルを市場に出し、平均的なパフォーマンスについて研究する。
局所的データと英訳データを使用することで,最高の演奏モデルに対して20点以上の差が生じることが判明した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:05:59 GMT)
GaussVideoDreamer: 3D Scene Generation with Video Diffusion and Inconsistency-Aware Gaussian Splatting [17.2] GaussVideoDreamerは、画像、ビデオ、および3D生成のギャップを埋めることで、生成的マルチメディアアプローチを前進させる。
提案手法は,LLaVA-IQAスコアの32%,既存の手法に比べて少なくとも2倍の高速化を実現している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:04:01 GMT)
Perturbed State Space Feature Encoders for Optical Flow with Event Cameras [17.1] イベントベースのカメラは、光学的フロー推定のための従来のカメラよりも大きな利点がある。
イベントベースの光フローに採用されている現在のニューラルネットワークは、時間的および空間的推論の制限に直面している。
イベントカメラを用いた多フレーム光フローのための摂動状態空間特徴問題を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:45:07 GMT)
Intelligent Framework for Human-Robot Collaboration: Dynamic Ergonomics and Adaptive Decision-Making [17.0] 本稿では,高度な視覚認識,連続的エルゴノミクスモニタリング,適応的行動木決定を統合化するための革新的なフレームワークを提案する。
我々のアプローチは、ディープラーニングモデル、高度な追跡アルゴリズム、動的エルゴノミクスアセスメントをモジュラーでスケーラブルで適応的なシステムに合成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:02:26 GMT)
C-MTCSD: A Chinese Multi-Turn Conversational Stance Detection Dataset [16.9] C-MTCSDは中国最大のマルチターン会話姿勢検出データセットである。
最先端モデルでさえ、挑戦的なゼロショット設定で64.07%のF1スコアしか達成していない。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:55:47 GMT)
AlayaDB: The Data Foundation for Efficient and Effective Long-context LLM Inference [16.8] AlayaDBは、AlayaDB AIの大規模言語モデル(LLM)のための効率的で効果的な長文推論のために設計された、最先端のベクトルデータベースシステムである。
LLM推論システムからKVキャッシュと注意を分離し、それらを新しいベクトルデータベースシステムにカプセル化する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:34:26 GMT)
VeriLeaky: Navigating IP Protection vs Utility in Fine-Tuning for LLM-Driven Verilog Coding [14.7] 大規模言語モデル(LLMs)は、コーディングにおいて大きな可能性を秘めているが、Verilogのようなニッチな言語には、キュレートされたデータによる微調整(FT)が不可欠である。
FTの知的財産権(IP)を使用すると、LLM推論によってFTデータがリークされるため、深刻なリスクが生じる。
本研究は,FTに対して有効かつ最小限に破壊的な新しい戦略の必要性を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:28:43 GMT)
Programmable time-frequency mode encoded quantum state generator for silicon-on-insulator platform [14.7] シリコンオン絶縁体(SOI)プラットフォーム上での光の時間周波数モード符号化量子状態のプログラム生成法を提案する。
状態発生器は、Nタップ有限インパルス応答フィルタと、マッハ・ツェンダー干渉計(MZI)ベースの結合リング共振器からなる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:54:17 GMT)
Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws [14.5] 我々は,所与の品質と予測要求のモデルをトレーニングし,展開するために,最適LLMパラメータ数と事前学習データサイズを計算するために,Chinchillaスケーリング法を変更した。
我々は,パラメータ単位のトークンを極端な範囲にスケールするにつれて,モデルの品質が向上し続けることを確認するために,さまざまなサイズとパラメータ数の47モデルを訓練する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:11:13 GMT)
PatchContrast: Self-Supervised Pre-training for 3D Object Detection [14.5] PatchContrastは、3Dオブジェクト検出のための新しい自己教師付きポイントクラウド事前学習フレームワークである。
提案手法は,3つの一般的な3次元検出データセットにおいて,既存の最先端モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:22:23 GMT)
Integrating Reinforcement Learning and Model Predictive Control with Applications to Microgrids [14.4] 本研究は,有限水平最適制御問題を効率的に解くために,強化学習とモデル予測制御(MPC)を統合するアプローチを提案する。
我々のアプローチは、離散変数の決定を連続変数の決定から切り離すことによってこの問題を軽減することを目的としている。
提案手法では,MPC制御器のオンライン問題を混合整数線形プログラムから線形プログラムへ簡易化する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:44:22 GMT)
PQ-CAN: A Framework for Simulating Post-Quantum Cryptography in Embedded Systems [14.1] 本稿では,組込みシステムにおけるポスト量子暗号(PQC)アルゴリズムの性能とオーバーヘッドをシミュレーションするフレームワークであるPQ-CANを紹介する。
我々は、自動車分野をケーススタディとして、異なるシナリオ下で様々なPQCスキームをテストする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:50:26 GMT)
COMPASS: Computational Mapping of Patient-Therapist Alliance Strategies with Language Modeling [14.0] 治療作業同盟は精神療法の成功の重要な予測要因である。
本稿では,心理療法セッションで使用される自然言語から治療作業アライアンスを推定するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:58:34 GMT)
xLSTM-ECG: Multi-label ECG Classification via Feature Fusion with xLSTM [14.0] 本稿では,ECG信号のマルチラベル分類手法であるxLSTM-ECGを提案する。
我々の知る限り、この研究は、マルチラベルECG分類に特化して適応したxLSTMモジュールの設計と応用を表すものである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:12:46 GMT)
Multimodal Long Video Modeling Based on Temporal Dynamic Context [14.0] 時間的動的コンテキスト(TDC)と呼ばれるフレーム間の時間的関係を利用した動的長ビデオ符号化手法を提案する。
ビデオはフレーム間の類似性に基づいて意味的に一貫したシーンに分割し、各フレームを視覚音響エンコーダを使用してトークンにエンコードする。
極端に長いビデオを扱うために,複数のビデオセグメントから回答を段階的に抽出する学習自由連鎖戦略を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:34:06 GMT)
Learning to Harmonize Cross-vendor X-ray Images by Non-linear Image Dynamics Correction [13.8] 領域固有の画像力学の非線形特性は、単純な線形変換では扱えないことを示す。
ドメイン固有のミスマッチ露光を低減するため,Global Deep Curve Estimationという手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:24:57 GMT)
Reddit Rules and Rulers: Quantifying the Link Between Rules and Perceptions of Governance across Thousands of Communities [13.8] 5,225のコミュニティで67,545のユニークなルールを収集し、Redditのルールをこれまでで最大の分析を行いました。
単なるポイント・イン・タイムの研究以上のことで、我々の研究は5年以上にわたってコミュニティがルールをどのように変えていくかを測定します。
私たちは、ガバナンスに対する肯定的なコミュニティの認識と最も強く結びついているルールを最初に特定します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:23:42 GMT)
Large language models could be rote learners [13.6] 大規模言語モデル(LLM)の評価には,MCQ(Multiple-choice Question)ベンチマークが広く使用されている。
本研究では,汚染を学習の本質的な側面として再編成し,表層記憶からの真の能力獲得を抑えることを目的とする。
本稿では,MCQを新たなトリニティ形式に再構成し,知識評価を維持しつつ記憶を減らし,新たな評価フレームワークであるTrinEvalを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:27:13 GMT)
Can We Edit LLMs for Long-Tail Biomedical Knowledge? [13.5] 本研究は,長期の生物医学的知識を編集するための知識編集手法の有効性を検討するための総合的研究である。
以上の結果から,従来の編集手法はLLMの長細バイオメディカル知識における性能を向上させることができるが,長細バイオメディカル知識における性能は高頻度の一般知識と比較しても劣っていることが示唆された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:08:20 GMT)
See or Recall: A Sanity Check for the Role of Vision in Solving Visualization Question Answer Tasks with Multimodal LLMs [13.3] MLLMがどのように可視化について認識し、理由を判断するかは、人間が同じ問題にどのようにアプローチするかと根本的に異なる。
規則に基づく決定木と正当性チェックテーブルを統合した包括的正当性チェックフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:19:28 GMT)
Improving Decoupled Posterior Sampling for Inverse Problems using Data Consistency Constraint [13.3] 本稿では,逆問題に対するGDPS ( Guided Decoupled Posterior Smpling) を提案する。
我々はこの手法を潜在拡散モデルとツイーディの公式に拡張する。
GDPSは最先端のパフォーマンスを実現し、既存の手法よりも精度を向上させる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:25:03 GMT)
Efficient 2D to Full 3D Human Pose Uplifting including Joint Rotations [13.3] 本研究では,関節回転を含む3次元のポーズを直接1回の前方通過で推定する新しい2D-to-3D昇降モデルを提案する。
我々のモデルは回転推定における最先端の精度を達成し、IKベースのアプローチよりも150倍高速であり、HMRモデルよりも高精度である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:32:28 GMT)
Detecting AI-Generated Text: Factors Influencing Detectability with Current Methods [13.1] テキストが人工知能(AI)によって作成されたかどうかを知ることは、その信頼性を決定する上で重要である。
AIGT検出に対する最先端のアプローチには、透かし、統計学的およびスタイリスティック分析、機械学習分類などがある。
AIGTテキストがどのようなシナリオで「検出可能」であるかを判断するために、結合する健全な要因についての洞察を提供することを目指している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:42:35 GMT)
S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models [13.1] 大規模推論モデル(LRM)の深い分析的思考への依存は、システム1の思考能力を制限する可能性がある。
S1-Benchは、簡単なタスクでLEMの性能を評価するために設計された新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:13:23 GMT)
BO-SA-PINNs: Self-adaptive physics-informed neural networks based on Bayesian optimization for automatically designing PDE solvers [13.0] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法として一般的な方法である
PINNは、ネットワークのハイパーパラメータ、サンプリング方法、異なるPDEに対する損失関数重み付けを専用の手動で修正する必要がある。
この問題を軽減するため,BO-SA-PINNと呼ばれる汎用多段階フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:07:45 GMT)
Leveraging Anthropometric Measurements to Improve Human Mesh Estimation and Ensure Consistent Body Shapes [12.9] 推定した3次元キーポイント位置の精度に関して,SOTA 3D人間ポーズ推定(HPE)モデルがHMEモデルより優れていることがわかった。
A2Bと呼ばれるモデルを作成し、人間のメッシュモデルの基本形状パラメータに変換する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:36:54 GMT)
Can LLMs handle WebShell detection? Overcoming Detection Challenges with Behavioral Function-Aware Framework [11.6] 悪意のあるスクリプトをWebサーバに注入するWebShell攻撃は、サイバーセキュリティの大きな脅威である。
この研究は、WebShell検出のためのLarge Language Modelsの実現可能性と限界を初めて探求した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:09:37 GMT)
AGO: Adaptive Grounding for Open World 3D Occupancy Prediction [11.6] オープンワールドの3Dセマンティック占有予測は、センサ入力からボキセル化された3D表現を生成することを目的としている。
AGOは,多様なオープンワールドシナリオを扱うための適応的基盤を持つ,新しい3次元占有予測フレームワークである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:26:20 GMT)
Training Small Reasoning LLMs with Cognitive Preference Alignment [11.4] より小型で強力なLCMを学習するための新しいフレームワークであるCristique-Rethink-Verify(CRV)を紹介した。
CRVは複数のLLMエージェントから構成され、それぞれに固有の能力がある。
より小さなモデルの推論能力を高めるために,認知的嗜好最適化(CogPO)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:03:54 GMT)
GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents [11.4] nameは、高レベルな現実世界のタスクシナリオにおけるLVLMの能力を高めるために設計された最初の強化学習フレームワークである。
従来のOS-Atlasのような最先端のメソッドと比較して、データの0.02%しか使っていない。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:45:54 GMT)
Ham2Pose: Animating Sign Language Notation into Pose Sequences [11.3] 音声言語を手話に翻訳することは、聴覚障害者コミュニティと聴覚障害者コミュニティとの間のオープンなコミュニケーションに必要である。
本稿では,Lexical Sign言語表記法であるHamNoSysで書かれたテキストを,署名されたポーズ列にアニメーションする最初の方法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:52:30 GMT)
Understanding and Optimizing Multi-Stage AI Inference Pipelines [11.3] HERMESは不均一な多段LPM推論実行シミュレータである。
HERMESは、以前のフレームワークとは異なり、複数のモデルを同時に実行する異種クライアントをサポートする。
我々は、推論ステージがエンドツーエンドのレイテンシ、ハイブリッドパイプラインの最適戦略、リモートKVキャッシュ検索のアーキテクチャ的影響について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:29:49 GMT)
DataMosaic: Explainable and Verifiable Multi-Modal Data Analytics through Extract-Reason-Verify [11.1] 大規模言語モデル(LLM)はデータ分析を変革しているが、その普及は2つの限界によって妨げられている。
それらは説明不可能(不明確な推論プロセス)であり、検証不可能(幻覚や未確認の誤りが原因である)である。
データモザイク(DataMosaic)は、LCMを利用した分析を説明可能かつ検証可能とするために設計されたフレームワークである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:38:23 GMT)
Understanding the Impact of Data Domain Extraction on Synthetic Data Privacy [10.9] プライバシ攻撃、特にメンバーシップ推論攻撃(MIA)は、合成データの生成モデルのプライバシを評価するために広く利用されている。
これらの攻撃は、データドメインの境界における位置のために特に脆弱な、アウトリーチを悪用することが多い。
本稿では,生成モデルにおけるデータ領域抽出の役割とプライバシ攻撃への影響について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:34:24 GMT)
The Importance of Being Discrete: Measuring the Impact of Discretization in End-to-End Differentially Private Synthetic Data [10.9] そこで本研究では,差分プライベート(DP)生成限界モデルの文脈における4つの離散化戦略の測定を行った。
離散化器とビン数の選択を最適化することで,DPの限界モデル6モデルに対して,有効性を平均30%向上できることがわかった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:13:47 GMT)
Accelerate Coastal Ocean Circulation Model with AI Surrogate [10.8] 海洋学者は海岸沿いの海流をシミュレートし、生命を救い、海岸の危険から財産の損失や被害を防ぐ早期警戒システムを開発する。
伝統的に、このようなシミュレーションは、地域海洋モデリングシステム(ROMS)のような沿岸海洋循環モデルを用いて行われる。
近年のディープラーニングとGPUアーキテクチャの進歩により、より高速なAI(ニューラルネットワーク)サロゲートの開発が可能になった。
本稿では,4次元スウィントランスを用いたAIサロゲートを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:28:13 GMT)
Proofs of Useful Work from Arbitrary Matrix Multiplication [10.6] 我々は,実世界の計算課題に基づいて,中本のPoWコンセンサスを実装するという,長年にわたるオープンな問題を再考する。
所定の硬度と無視可能な計算オーバーヘッドを有するPoW証明書を生成する。
我々のプロトコルは、悪意のある証明者が正直な証明者に対して大きな優位性を得ることができないという意味で、最適なセキュリティを持っていると推測する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:22:40 GMT)
ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy [10.6] VLA(Vision-Language-Action)モデルは、現実世界のロボット操作において大きな可能性を示している。
これらのモデルを教師付き学習で微調整することで、制限された一貫性のないデモのために堅牢なパフォーマンスを達成することができる。
我々は,オフラインとオンラインのファインチューニングで構成されるConRFTという,VLAモデルのための強化されたファインチューニング手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:53:32 GMT)
Algorithmic Behaviors Across Regions: A Geolocation Audit of YouTube Search for COVID-19 Misinformation Between the United States and South Africa [10.4] YouTube上で10日間の位置情報調査を行い、米国(US)と南アフリカ(SA)の検索結果におけるCOVID-19誤報の頻度を比較した。
その結果、トップ10の検索結果の31.55%が、新型コロナウイルスの誤報が含まれていることがわかった。
上位10の検索結果のうち、SAのボットは、合衆国のボットよりもはるかに不正な検索結果に直面していた。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:13:38 GMT)
RadarLLM: Empowering Large Language Models to Understand Human Motion from Millimeter-wave Point Cloud Sequence [10.1] 本稿では、ミリ波レーダをセンシングモードとして用いた人間の理解に大規模言語モデル(LLM)を利用する最初のフレームワークであるRadar-LLMを提案する。
データ不足に対処するために、モーションテキストデータセットからリアルなレーダテキストペアを生成する物理対応パイプライン合成を導入する。
Radar-LLMは、合成および実世界のベンチマークの両方で最先端のパフォーマンスを実現し、ミリ波信号の自然言語記述への正確な変換を可能にする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:18:25 GMT)
Privacy Meets Explainability: Managing Confidential Data and Transparency Policies in LLM-Empowered Science [10.0] DataShield"は機密データ漏洩を検出し、プライバシポリシを要約し、データフローを可視化するように設計されたフレームワークである。
科学者とのユーザスタディは、現実世界のプライバシー問題に取り組む上で、フレームワークのユーザビリティ、信頼性、有効性を評価するために進行中である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:58:26 GMT)
Task-conditioned Ensemble of Expert Models for Continuous Learning [10.0] 既存のモデルの性能を維持するために,タスク条件付きモデルアンサンブルを提案する。
この方法は、タスクメンバーシップ情報に基づくエキスパートモデルのアンサンブルを含む。
実験は提案手法の利点を浮き彫りにする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:37:11 GMT)
M2S-RoAD: Multi-Modal Semantic Segmentation for Road Damage Using Camera and LiDAR Data [10.0] 本稿では,道路被害の分類のセマンティックセグメンテーションのためのデータセットであるM2S-RoADを紹介する。
M2S-RoADはオーストラリアのニューサウスウェールズ州の様々な町で収集され、9種類の道路損傷を識別するためにセマンティックセグメンテーションのためにラベル付けされた。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:32:01 GMT)
Moderate Actor-Critic Methods: Controlling Overestimation Bias via Expectile Loss [9.9] 過大評価はモデルフリー強化学習(MF-RL)の基本的特徴である
過大評価されたQ-関数とその下限の凸最適化として定式化された,Q-関数更新における新しい適度な目標を提案する。
我々の主な貢献は、状態に条件付けられたQ値分布の低い期待値を通して、この下界を効率的に推定することにある。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:41:15 GMT)
Emotion Alignment: Discovering the Gap Between Social Media and Real-World Sentiments in Persian Tweets and Images [9.9] 現実世界とオンラインプラットフォームの間の感情表現の相違が 現れます
革新的なパイプラインは、ソーシャルメディアと比較して現実世界の感情の類似度を測定するために設計された。
結果は、画像と現実世界の感情の間に28.67%の類似性を示し、ツイートは現実世界の感情と75.88%の一致を示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:30:08 GMT)
MCBlock: Boosting Neural Radiance Field Training Speed by MCTS-based Dynamic-Resolution Ray Sampling [9.8] そこで本研究では,動的分解能線サンプリングアルゴリズムであるMCBlockを提案する。
MCBlockは最大2.33倍のトレーニング加速を実現し、他のレイサンプリングアルゴリズムを上回っている。
MCBlockは任意のコーントレーシングNeRFモデルに適用でき、マルチメディアコミュニティに貢献できると考えています。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:59:28 GMT)
Data Augmentation as Free Lunch: Exploring the Test-Time Augmentation for Sequential Recommendation [9.6] 既存の方法は、モデルトレーニング中に新しいが効果的なデータを生成し、パフォーマンスを向上させる。
デプロイには、再トレーニング、アーキテクチャ修正、追加の学習可能なパラメータの導入が必要だ。
モデル推論中に入力を加算し、モデルが拡張したデータに対する予測を集約し、最終的な精度を向上させる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:01:59 GMT)
GeoUni: A Unified Model for Generating Geometry Diagrams, Problems and Problem Solutions [9.6] 一つのフレームワーク内で問題解と図を生成することのできる最初の統一幾何エキスパートモデルであるGeoUniを提案する。
1.5Bのパラメータしか持たないGeoUniは、幾何学的推論タスクにおいて、671Bのパラメータを持つDeepSeek-R1のようなより大きなモデルに匹敵するパフォーマンスを達成する。
GeoUniは正確な幾何学図の作成にも優れており、GPT-4o画像生成を含むテキスト・ツー・イメージモデルと統一モデルの両方を超越している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:56:55 GMT)
ReasonDrive: Efficient Visual Question Answering for Autonomous Vehicles with Reasoning-Enhanced Small Vision-Language Models [9.3] 視覚言語モデル(VLM)は自律運転の約束を示すが、安全にとって重要な透明な推論能力は欠如していることが多い。
微調整中の推論を明示的にモデル化することで、運転決定タスクにおけるVLM性能が向上するかどうかを検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 23:16:07 GMT)
Can Competition Enhance the Proficiency of Agents Powered by Large Language Models in the Realm of News-driven Time Series Forecasting? [8.7] 大規模言語モデル(LLM)の時代のパラダイムシフトとして,マルチエージェントによるニュース駆動時系列予測が考えられる。
本研究は,革新的思考を生み出すエージェントの能力を高めるために,マルチエージェントの議論に競争機構を組み込んだものである。
ミスリード情報を同定する際のモデル習熟度を高めるために, 反射段階に微調整された小型LCMモデルを組み込む。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:25:50 GMT)
Structuring Scientific Innovation: A Framework for Modeling and Discovering Impactful Knowledge Combinations [8.7] 本稿では,破壊的洞察の形成における手法の組み合わせの役割を強調する構造的アプローチを提案する。
歴史的に破壊的な手法の組み合わせを区別する特徴を識別するための、対照的な学習に基づくメカニズムを導入する。
第2に,LLMのチェーン・オブ・シント機能を活用して有望な知識再結合を同定する推論誘導モンテカルロ探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:52:38 GMT)
Challenges in interpretability of additive models [8.7] このモデルクラスでは、複数のタイプの非識別性を強調します。
このようなモデルにおける「解釈可能性」や「安全クリティカルなアプリケーション」に対する適合性を主張する場合の抑制を論じる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:24:17 GMT)
The Impact of Model Zoo Size and Composition on Weight Space Learning [8.1] トレーニングされたニューラルネットワークモデルを再利用することは、トレーニングコストを削減し、知識を伝達する一般的な戦略である。
重量宇宙学習は、将来のタスクのために事前訓練されたモデルの集団を再利用するための、有望な新しい分野である。
そこで本研究では,異種集団の訓練に適応する共通重み空間学習法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:54:06 GMT)
Towards Developing Socially Compliant Automated Vehicles: Advances, Expert Insights, and A Conceptual Framework [8.1] 自動走行車(AV)は、道路の安全性、交通効率、全体の移動性を改善することで交通の革新を約束している。
完全自動化への移行には、さまざまな自動化レベルのAVが人間駆動車(HDV)と共存する混合トラフィックの期間が必要となる。
HDVとの互換性の確保と社会的受容は、混在トラフィックへのシームレスな統合の成功に不可欠である。
本研究は,SCAVの開発における技術の現状を評価するための総合的なスコーピングのレビューを初めて行った。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:58:27 GMT)
Embedding Principle in Depth for the Loss Landscape Analysis of Deep Neural Networks [8.0] 我々は、NNのロスランドスケープが、より浅いNNの損失ランドスケープのすべての重要なポイントを「含んでいる」という、深く埋め込まれた原則を発見した。
NNの局所的な最小限は、より深いNNの厳密なサドルポイントまで持ち上げることができることを示す。
また, バッチ正規化は, 層状線形化を抑制することによって, より浅いNNから持ち上げられる臨界多様体を回避するのに役立つことを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:23:31 GMT)
RealWebAssist: A Benchmark for Long-Horizon Web Assistance with Real-World Users [8.0] RealWebAssistは、Webとの長い水平相互作用を含む現実的なシナリオにおいて、シーケンシャルなインストラクションフォローを評価するために設計された新しいベンチマークである。
各ユーザはWebベースのアシスタントに、複数のWebサイト上で一連のタスクを実行するように指示する。
成功したエージェントは、それぞれの命令の背後にある真の意図を推論し、ユーザの精神状態を追跡し、ユーザ固有のルーチンを理解し、意図したタスクを正しいGUI要素に基づいて実行しなければなりません。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:36:46 GMT)
Virtual domain extension for imposing boundary conditions in flow simulation using pre-trained local neural operator [7.8] 本稿では,LNOを用いた流れシミュレーションにおいて境界条件(BC)を付与する枠組みを構築した。
LNO推論中に計算領域の腐食特性を補うために拡張仮想ドメインを生成する。
フィールド値を計算するためのいくつかの戦略が提案され、数値的な例を解く際に有効である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:18:12 GMT)
LogLLM: Log-based Anomaly Detection Using Large Language Models [7.8] 大規模言語モデル(LLM)を活用するログベースの異常検出フレームワークであるLogLLMを提案する。
LogLLMはBERTを使用してログメッセージからセマンティックベクターを抽出し、変換器デコーダベースのモデルであるLlamaを使ってログシーケンスを分類する。
我々のフレームワークは、性能と適応性を高めるために設計された新しい3段階の手順によって訓練されている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:52:50 GMT)
FedRIR: Rethinking Information Representation in Federated Learning [7.8] ネットワークエッジのモバイルおよびWeb-of-Things(WoT)デバイスは、機械学習アプリケーションのために膨大な量のデータを生成する。
ネットワークエッジのモバイルおよびWeb-of-Things(WoT)デバイスは、機械学習アプリケーションのために膨大な量のデータを生成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:07:27 GMT)
Trustworthy Answers, Messier Data: Bridging the Gap in Low-Resource Retrieval-Augmented Generation for Domain Expert Systems [7.8] 生のマルチモーダルデータを構造化コーパスとQ&Aペアに変換するデータ生成パイプラインを導入する。
本システムは,非RAGベースライン上での事実正当性(+1.94),報知性(+1.16),助力性(+1.67)を改善する。
結果は、強い答えの根拠と透明性によって、異なる側面にわたるアプローチの有効性を強調します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:00:15 GMT)
LLM-Driven NPCs: Cross-Platform Dialogue System for Games and Social Platforms [7.7] 本研究では,大規模言語モデル(LLM)を用いたNPCが,ゲーム・エン・ヴィロンメント(Unity)とソーシャル・プラットフォーム(Discord)の両方でプレイヤーとコミュニケーションできるプロトタイプシステムを提案する。
対話ログはクラウドデータベース(LeanCloud)に格納され、プラットフォーム間でメモリを同期させ、コンバーサオプションを一貫性を保つことができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:06:26 GMT)
Towards Safer Chatbots: A Framework for Policy Compliance Evaluation of Custom GPTs [7.7] オープンAIの利用ポリシーに対するカスタムGPTの自動評価のためのフレームワークを提案する。
我々は,ロマン主義,サイバーセキュリティ,アカデミックGPTの3つのカテゴリにまたがって,722のカスタムGPTを用いた大規模研究を通じて評価を行った。
その結果、分析されたモデルの58.7%は、非準拠の兆候を示し、GPTストアのレビューと承認プロセスの弱点を明らかにしていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:58:48 GMT)
Generative Modeling of Class Probability for Multi-Modal Representation Learning [7.6] マルチモーダル理解は、モデルが異なるモーダルから入力を共同で解釈できるようにすることによって、人工知能において重要な役割を担っている。
マルチモーダル表現学習にクラス確率分布を利用する新しいクラスアンカーアライメント手法を提案する。
本手法は,クラスアンカーを各モードのクラス確率分布の生成と調整のプロンプトとして符号化する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:45:58 GMT)
Research on CNN-BiLSTM Network Traffic Anomaly Detection Model Based on MindSpore [7.6] 本研究では,CNN(Convolutional Neural Network)とBidirectional Long Short-Term Memory(BiLSTM)ネットワークを統合した新しいネットワークトラフィック異常検出モデルを提案する。
提案モデルでは精度,精度,リコール,F1スコアの99%を達成し,ネットワーク侵入検出タスクの性能と堅牢性を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:10:18 GMT)
An Investigation of Large Language Models and Their Vulnerabilities in Spam Detection [7.6] 本稿では,スパムデータセットを微調整したLarge Language Models(LLM)を利用したスパム検出システムを提案する。
この実験には、GPT2とBERTの2つのLLMモデルと、Enron、LingSpam、SMSspamCollectionの3つのスパムデータセットが使用されている。
その結果, LLMモデルは, 効果的なスパムフィルタとして機能するが, 敵対的・データ中毒攻撃の影響を受けやすいことがわかった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:30:27 GMT)
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models [7.5] 大規模言語モデル(LLM)は、最近、様々なタスクで顕著な成功を収めた。
重みのみの量子化は有望なアプローチであるが、大振幅のアクティベーションアウトレイアのため、サブ-4ビットの量子化は依然として課題である。
本稿では,各入力チャネル内の量子化グループを生成する簡易かつ効果的な手法である,IC単位の量子化を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:25:53 GMT)
CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data [7.5] 本稿では、特定の入力インスタンスに適応し、トレーニングと推論の両方を短時間で完了する効率的なフレームワークを提案する。
本手法は,512times512$イメージのトレーニングと推論の両方を,textit0.4 seconds$で実現する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:04:55 GMT)
The Code Barrier: What LLMs Actually Understand? [7.4] 本研究では,言語モデルの意味理解能力を評価するために,コード難読化を構造化テストフレームワークとして利用する。
難読化の複雑さが増加するにつれて、統計的に顕著な性能低下が見られる。
本研究では,言語モデルにおけるコード理解を評価するための新しい評価手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:11:26 GMT)
Controllable Expressive 3D Facial Animation via Diffusion in a Unified Multimodal Space [7.2] 本稿では,表現可能な3次元顔アニメーションのための拡散型フレームワークを提案する。
本手法では,(1)FLAME中心のマルチモーダル感情結合戦略,(2)注意に基づく潜在拡散モデルを提案する。
本手法は, 生理学的に妥当な顔面動態を保ちながら, 21.6%の感情類似性向上を実現している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:38:01 GMT)
Predictive AI with External Knowledge Infusion for Stocks [7.1] 株価の変動は、単なる歴史的データを超える要因の複雑な相互作用の影響を受けている。
本稿では,歴史的傾向から学習する学習メカニズムを提案するとともに,時間的知識グラフから外部知識を取り入れた学習機構を提案する。
広範な実験により、学習された動的表現は、複数の保持期間にまたがるリターンに基づいて、ストックを効果的にランク付けすることを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:15:48 GMT)
Towards Quantifying Commonsense Reasoning with Mechanistic Insights [7.1] 我々は、コモンセンス推論のプロキシはグラフィカルな構造として維持できると主張している。
我々は、この暗黙の知識を、37の日々の人間の活動のためのグラフィカルな構造として捉えるためのアノテーションスキームを作成する。
生成したリソースは、膨大な数のCommonsenseクエリのフレーム化に使用することができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:21:59 GMT)
MatterTune: An Integrated, User-Friendly Platform for Fine-Tuning Atomistic Foundation Models to Accelerate Materials Simulation and Discovery [7.1] MatterTuneは、高度な微調整機能を提供し、原子論の基礎モデルを下流の材料情報とシミュレーションにシームレスに統合するフレームワークである。
MatterTuneはORB、MatterSim、JMP、EquformerV2といった最先端の基礎モデルをサポートしている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:12:43 GMT)
Foundation Models for Remote Sensing: An Analysis of MLLMs for Object Localization [7.1] 我々は,空間的推論機能を含むように明示的に訓練された最近のMLLMを分析した。
これらのモデルが特定の設定で実行可能であることを実証し、ゼロショットシナリオに適していることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:34:06 GMT)
Carbon-Efficient 3D DNN Acceleration: Optimizing Performance and Sustainability [7.1] 3D統合はパフォーマンスを向上させるが、持続可能性の問題をもたらす。
本稿では3次元加速器の炭素効率設計手法を提案する。
提案手法は,高い計算精度を維持しつつ,シリコン面積と製造オーバーヘッドを効果的に低減する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:48:37 GMT)
Learning with Positive and Imperfect Unlabeled Data [7.0] 本研究では,ラベルのないデータ分布がシフトした場合に,正および未ラベルのデータからバイナリ分類器を学習する問題について検討する。
PIU学習における本研究の主な成果は,PIU学習におけるサンプルの複雑さの特徴と,誤分類誤差を実現するための計算的かつ標本効率のよいアルゴリズムである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:19:29 GMT)
Plasticity-Aware Mixture of Experts for Learning Under QoE Shifts in Adaptive Video Streaming [7.0] Plasticity-Aware Mixture of Experts (PA-MoE)は、記憶保持と選択的忘れのバランスをとることによって、ネットワークの可塑性を調節する新しい学習フレームワークである。
PA-MoEは、動的ストリーミング環境における競合ベースラインよりも45.5%のQoE改善を実現していることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:02:41 GMT)
Summarization Metrics for Spanish and Basque: Do Automatic Scores and LLM-Judges Correlate with Humans? [7.0] 我々はバスク語とスペイン語で2,040の抽象的な要約に関する人間の判断を収集する。
各要約において、アノテータはコヒーレンス、一貫性、流布性、妥当性、および5W1Hという5点類似度尺度の5つの基準を評価した。
我々はBASSEとコードを公開し、22,525のニュース記事とサブヘッドを含む最初の大規模バスク要約データセットを公開します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:25:42 GMT)
A Model Zoo of Vision Transformers [6.9] 視覚変換器の最初のモデル動物園(ViT)を紹介する。
近年のトレーニング手法をより良く表現するために,事前学習と微調整の両方を包含するモデル動物園生成のための新しい青写真を開発する。
それらは大量の生成因子で慎重に生成され、その多様性は重量空間と行動メトリクスの完全な選択によって検証される。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:52:26 GMT)
Seismic Facies Analysis: A Deep Domain Adaptation Approach [6.9] ディープニューラルネットワーク(DNN)は、大量のラベル付き入力データから正確に学習することができるが、ラベル付きデータが不足している場合には、その処理に失敗することが多い。
本研究では,オランダ沖のF3ブロック3Dデータセット(ソースドメイン,SD)とカナダからのペノブスコット3Dサーベイデータ(ターゲットドメイン,TD)の地震画像について実験を行った。
EarthAdaptNet(EAN)と呼ばれるディープニューラルネットワークアーキテクチャは、少数のクラスがデータ不足を抱えている場合に、地震像を意味的にセグメンテーションするために提案されている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:36:03 GMT)
Uncertainty Quantification for Gradient-based Explanations in Neural Networks [6.9] ニューラルネットワークの説明の不確実性を確認するパイプラインを提案する。
このパイプラインを使用して、CIFAR-10、FER+、California Housingデータセットの説明分布を生成する。
修正画素挿入/削除のメトリクスを計算し、生成した説明の質を評価する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:43:05 GMT)
Analyzing 16,193 LLM Papers for Fun and Profits [6.9] LLM(Large Language Models)は、コンピュータサイエンス研究のランドスケープを再構築している。
本研究は,過去6年間の77の上位コンピュータサイエンス会議におけるLSM関連論文の出版動向を包括的に分析した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:45:49 GMT)
Forecasting from Clinical Textual Time Series: Adaptations of the Encoder and Decoder Language Model Families [6.9] テキスト時系列からの予測問題として,LDMを用いたアノテーションパイプラインを用いてタイムスタンプによる臨床所見を抽出する手法を提案する。
我々は、細調整されたデコーダベースの大規模言語モデルやエンコーダベースのトランスフォーマーなど、多様なモデル群を評価する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:48:56 GMT)
Benchmarking 3D Human Pose Estimation Models Under Occlusions [6.9] 本稿では,既存の3次元人物姿勢推定モデル(HPE)の強靭性と感度を,咬合,カメラ位置,行動変動性に対して解析する。
新たな合成データセットであるBlendMimic3Dを用いて、いくつかの最先端モデルの特定のテストを行う。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:00:25 GMT)
GNN-ACLP: Graph Neural Networks based Analog Circuit Link Prediction [6.8] これらの課題に対処するための3つの革新を特徴とするグラフニューラルネットワーク(GNN)ベースのフレームワークを提案する。
まず、SEAL(Subgraphs, Embeddings, Attributes for Link Prediction)フレームワークを導入し、回路リンク予測においてポートレベルの精度を実現する。
第2に,大言語モデル(LLM)を用いた検索拡張生成(RAG)を利用したネットリストフォーマット変換ツールであるNetlist Babel Fishを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:02:09 GMT)
Efficient Generative Model Training via Embedded Representation Warmup [6.8] 拡散モデルは高次元データを生成するのに優れるが、自己教師付き手法に比べて訓練効率と表現品質に劣る。
トレーニング中に高品質で意味豊かな表現を不活用すること。
本稿では,Embeded Representation Warmup (ERW)を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:43:17 GMT)
FeNeC: Enhancing Continual Learning via Feature Clustering with Neighbor- or Logit-Based Classification [6.7] FeNeC(Feature Neighborhood)とFeNeC-Log(FeNeC-Log)を導入する。
提案手法は,クラスタリングによって既存の概念を一般化し,クラス内変動を増大させる。
タスクの同一性が不明なシナリオでは,2つのFeNeC変種が競合性能を発揮することを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:20:57 GMT)
Computation and Communication Efficient Lightweighting Vertical Federated Learning for Smart Building IoT [6.7] IoTデバイスは、ディープラーニングタスクに積極的に参加するために、基本的なデータ収集とコントロールを越えて進化している。
本稿では,計算効率と通信効率を協調的に最適化する軽量垂直統合学習フレームワークを提案する。
画像分類タスクの実験結果から,LVFLは競合学習性能を維持しつつ,資源需要を効果的に軽減することを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:22:21 GMT)
Global and Local Mamba Network for Multi-Modality Medical Image Super-Resolution [6.6] マルチモーダル医療画像超解像のためのグローバルでローカルなMambaネットワーク(GLMamba)を提案する。
グローバルマンバブランチは低解像度入力における長距離関係をキャプチャし、局所マンバブランチは高解像度参照画像における短距離詳細に焦点を当てる。
変調器は、グローバルおよびローカルのMambaブロックの変形可能な機能をさらに強化するために設計されている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:14:24 GMT)
A Personalised 3D+t Mesh Generative Model for Unveiling Normal Heart Dynamics [6.6] 心臓の形状と運動パターンの分布を学習するために,条件付き生成モデルであるMeshHeartを開発した。
MeshHeartは、年齢、性別、体重、高さなどの臨床的要因を考慮して、3D+t心筋メッシュ配列を生成することができる。
本稿では,個人化規範パターンから実際の心臓の偏差を定量化する,新しい距離測定式潜時デルタを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:07:55 GMT)
Towards Low-Latency Event-based Obstacle Avoidance on a FPGA-Drone [6.5] 本研究は,FPGA加速器における衝突回避行動予測のための従来のRGBモデルに対して,イベントベースビジョンシステム(EVS)の性能を定量的に評価する。
EVSモデルは、RGBモデルと比較して、はるかに高い有効フレームレート(1kHz)、低時間時間(-20ms)、空間予測誤差(-20mm)を達成する。
これらの結果は、リアルタイム衝突回避のためのイベントベースのビジョンの利点を浮き彫りにして、リソース制約のある環境に展開する可能性を示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:51:10 GMT)
Tailoring Adversarial Attacks on Deep Neural Networks for Targeted Class Manipulation Using DeepFool Algorithm [6.5] 敵対的攻撃に対するディープニューラルネットワーク(DNN)の感受性は、多くのアプリケーションにまたがる信頼性を損なう。
このアルゴリズムは,所望の誤分類対象の指定を容易にするだけでなく,最小限の信頼スコアも組み込む。
我々の実証的研究は、画像の整合性を維持する上で、この洗練されたアプローチが優れていることを示すものである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:22:56 GMT)
A User's Guide to Sampling Strategies for Sliced Optimal Transport [6.5] 本稿では,スライスされた最適輸送のための戦略をサンプリングするためのユーザガイドとして機能する。
本稿では, 建設方法, 生成時間の複雑さ, 理論的保証, および各戦略の条件について詳述する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:04:59 GMT)
Uncertainty Propagation in the Fast Fourier Transform [6.4] 本稿では,信念の伝播と期待の伝播を用いたベイズ近似の効率的な枠組みを提案する。
提案手法は, 高精度な平均および分散推定値による安定収束を実現する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:47:42 GMT)
IEA-Plugin: An AI Agent Reasoner for Test Data Analytics [6.4] 本稿では,Intelligent Engineering Assistant (IEA) の新しいフロントエンドとして開発された新しいAIエージェントベースの推論モジュール IEA-Plot を紹介する。
IEA-Plotの主な目的は、大規模言語モデル(LLM)の高度な推論とコーディング能力を活用することである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:01:58 GMT)
Adam Exploits $\ell_\infty$-geometry of Loss Landscape via Coordinate-wise Adaptivity [6.3] 好ましくは $ell_infty$-geometry が SGD であるのに対して、Adam は影響を受けていない。
我々の実験は、好ましくは $ell_infty$-geometry が SGD であるのに対して、Adam が影響を受けていない場合、さらに悪化することを確認した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:20:54 GMT)
MARTSIA: Safeguarding Data Confidentiality in Blockchain-Driven Process Execution [6.3] 相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ
MARTSIAは、ユーザ定義ポリシーと認証宣言属性を組み合わせることで、メッセージ部分レベルでの詳細な読み取りアクセス制御を提供する。
このアーキテクチャは、パブリックブロックチェーン固有の透明性と、機密性の高いアプリケーションに必要なプライバシとを効果的にバランスさせる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:36:36 GMT)
Towards Scalable Bayesian Optimization via Gradient-Informed Bayesian Neural Networks [6.2] 局所勾配情報を用いた関数観測を効果的に増強するBNNトレーニングのための勾配インフォームド損失関数を提案する。
このアプローチの有効性は、改良されたBNN予測とより高速なBO収束の観点から、よく知られたベンチマークで実証されている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:21:08 GMT)
Optimizing Data Distribution and Kernel Performance for Efficient Training of Chemistry Foundation Models: A Case Study with MACE [6.1] グラフニューラルネットワーク(GNN)を利用する化学基礎モデル(CFM)は、3次元分子グラフ構造で動作する。
本稿では,CFMトレーニングにおける2つの重要なフェーズ,すなわちデータ分散とモデルトレーニングの最適化について述べる。
本稿では,効率的なデータ分散を実現するために,高効率で高速かつ実用的な手法を提供する反復アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:48:19 GMT)
GlyTwin: Digital Twin for Glucose Control in Type 1 Diabetes Through Optimal Behavioral Modifications Using Patient-Centric Counterfactuals [6.1] GlyTwinは、グルコース調節のための最適処理をシミュレートするために、対実的説明を用いた新しいデジタルツインフレームワークである。
GlyTwinは高血糖を予防する行動療法の提案を生成する。
結果は、GlyTwinが最先端のカウンターファクト法を上回り、76.6%が有効で、86%が効果的な介入を生んでいることを示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:32:39 GMT)
CROSSAN: Towards Efficient and Effective Adaptation of Multiple Multimodal Foundation Models for Sequential Recommendation [6.0] MFM(Multimodal Foundation Models)は、様々な生のモダリティを表現できる。
シーケンシャルレコメンデーションにおけるMFMの応用は、まだほとんど解明されていない。
シーケンシャルレコメンデーションタスクに複数の (>2) MFM を効率的に適用できるかどうかは不明だ。
プラグアンドプレイ型クロスモーダルサイドアダプタネットワーク(CROSSAN)を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:14:59 GMT)
The Security of Quantum Computing in 6G: from Technical Perspectives to Ethical Implications [5.9] 本稿では、信頼性の高い量子サービスプロバイダの重要性と、デジタル主権に関する倫理的側面への影響について論じる。
我々は、信頼され、倫理的で、包括的な量子エコシステムを生み出すために、協調、協調、協力に基づくパートナーシップモデルを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:42:16 GMT)
Psychological Health Knowledge-Enhanced LLM-based Social Network Crisis Intervention Text Transfer Recognition Method [5.9] 本研究では,大規模言語モデル(LLM)を用いたソーシャル・ネットワーク危機介入のためのテキスト・トランスファー認識手法を提案する。
本稿では、BERTを用いた転帰学習を取り入れた多段階フレームワークを提案し、メンタルヘルス知識、感情分析、行動予測技術を統合する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:47:33 GMT)
A Nonparametric Approach with Marginals for Modeling Consumer Choice [5.8] 限界分布モデル(MDM)は、ランダムユーティリティモデル(RUM)における同様の特徴付けの有用性に着想を得たものである。
我々は,MDMがRUMやパラメトリックモデルと比較して,競争力と予測性能を示すことを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:27:12 GMT)
Multimodal Representation Learning Techniques for Comprehensive Facial State Analysis [5.8] マルチモーダル顔状態解析のための包括的パイプラインを提案する。
本稿では,アクション・ユニット(AU)と感情認識に適した,新しいマルチレベル・マルチモーダル・フェイス・ファンデーション・モデル(MF2)を提案する。
実験は、AUと感情検出タスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:00:57 GMT)
Revisiting the attacker's knowledge in inference attacks against Searchable Symmetric Encryption [5.8] 最近の攻撃では、インデックス化されたデータに類似したデータを含むアタッカーの知識が仮定された。
本論文は,データ類似性に対する感度を解析するために,任意の攻撃に使用できる新しい統計ツールを提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:04:25 GMT)
HELIOS: Adaptive Model And Early-Exit Selection for Efficient LLM Inference Serving [5.7] 初期のLLMは、後のモデルレイヤをスキップすることで、このトレードオフ空間を効率的にナビゲートします。
現在のフレームワークでは、ユーザタスクのモデルが静的に選択され、入力クエリの性質の変化に適応する能力が制限されます。
まず、HELIOSショートリストは、候補LLMの集合をリストし、プロンプトのサブセットを用いて評価し、テレメトリデータをリアルタイムで収集する。
第2に、HELIOSはこれらの評価から得られた早期出口データを使用して、選択したモデルを限られた数の層に限定的にロードする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:30:43 GMT)
Turn-taking annotation for quantitative and qualitative analyses of conversation [5.4] ターンテイクは2つのレイヤ、IPU(Inter-Pausal Units)とPCOMP(point of potential completion)にアノテートされた。
IPUアノテーションの一致がほぼ完全であることを示す。
このシステムは、言語学および技術応用のための様々な会話データに適用することができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:45:04 GMT)
Automated Testing of COBOL to Java Transformation [5.4] 我々はIBM Watsonx Code Assistant for Z (WCA4Z) [5] のテストフレームワークを開発した。
私たちのフレームワークはシンボリックな実行を使用して、外部呼び出しをモックし、それらをJUnitテストに変換して、翻訳されたJavaでセマンティックな等価性を検証します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:53:30 GMT)
Summarization of Multimodal Presentations with Vision-Language Models: Study of the Effect of Modalities and Structure [5.3] 視覚言語モデル(VLM)は、視覚情報とテキスト情報を複数のフォーマットで処理することができる。
テキストの多いマルチモーダル文書から要約を生成するための費用対効果戦略を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:55:01 GMT)
You've Changed: Detecting Modification of Black-Box Large Language Models [4.8] 大規模言語モデル(LLM)はAPIを通じてサービスとして提供されることが多いため、開発者は振る舞いの変化を検出することが難しい。
生成したテキストの言語的特徴と心理言語学的特徴の分布を比較することで,変化に対するLLMの監視手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:16:43 GMT)
Energy Matching: Unifying Flow Matching and Energy-Based Models for Generative Modeling [4.6] 生成モデルは、しばしばフローやスコアの一致によってデータにノイズをマッピングするが、これらのアプローチは部分的な観測や追加の事前を組み込むのに難しくなる。
ワッサースタイン勾配流の最近の進歩に触発されて,エネルギーモデル(EBM)の柔軟性とフローベースアプローチを統一するフレームワークであるEnergy Matchingを提案する。
我々は、このダイナミクスを、1つの時間非依存スカラー場でパラメータ化し、逆問題の効率的な正則化のために、強力な生成器と柔軟な先行器の両方として機能する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:10:58 GMT)
ELT-Bench: An End-to-End Benchmark for Evaluating AI Agents on ELT Pipelines [4.6] ELT-BenchはAIエージェントがExtract-Load-Transformパイプラインを構築する能力を評価するためのエンドツーエンドベンチマークである。
ELT-Benchは、さまざまなドメインにわたる835のソーステーブルと203のデータモデルを含む100のパイプラインで構成されている。
ELT-Bench上の6つの人気のあるLarge Language Model(LLM)を用いて、Spider-AgentとSWE-Agentの2つの代表的なコードエージェントフレームワークを評価する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:46:56 GMT)
Probing the Quantum Capacitance of Rydberg Transitions of Surface Electrons on Liquid Helium via Microwave Frequency Modulation [4.6] 本稿では,液体ヘリウム上の表面電子のリドベルク転移に伴う量子容量を求める方法を提案する。
ライドベルク状態への励起は、容量結合された電極上での画像電荷の再分配を誘導する。
この感度は0.38aF/$sqrtmathrmHz$で、単一の電子のリドベルク転移を解く。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:33:35 GMT)
A Graph-Based Model for Vehicle-Centric Data Sharing Ecosystem [4.5] 我々は、現代の車両が異なる当事者間のデータ交換をどのように扱うかについての洞察を得るために、概念グラフベースのモデルを開発する。
車両関連データ共有に関するプライバシーに関する洞察を発見することの有用性と有効性を示すために、2つの現実的な例が開発された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:03:48 GMT)
Words and Action: Modeling Linguistic Leadership in #BlackLivesMatter Communities [4.4] 我々は#BlackLivesMatter運動に関連するコミュニティ間のセマンティックリーダーシップをモデル化する手法について述べる。
我々は、BLM活動家や進歩主義者の指導的役割と黒人有名人の実質的な証拠を見出した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:38:57 GMT)
A Tale of Two Learning Algorithms: Multiple Stream Random Walk and Asynchronous Gossip [4.4] 我々はまず、複数のストリーム(ウォーク)を用いたランダムウォークベース学習アルゴリズムの設計と解析を行う。
本稿では,MW w.r.t (計算),ウォールクロック時間,通信の収束解析について述べる。
また、「非同期ゴシップ」に対する収束解析を行い、その収束の包括的解析が欠如していることに注目した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:34:22 GMT)
TianQuan-Climate: A Subseasonal-to-Seasonal Global Weather Model via Incorporate Climatology State [4.4] 我々は,世界平均予測を最大45日間に設定する新しい機械学習モデルであるClimate Furnace Subseasonal-to-Seasonal(TianQuan-Climate)を提案する。
提案したTianQuan-Climateには2つの利点がある: 1) 長期のサブシーズン予測におけるシステムエラーの影響を低減するためにマルチモデル予測戦略を利用する。
本研究では,15~45日間の気象予報および気象予報のベンチマークにおけるTianQuan-Climateの有効性を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:02:34 GMT)
STaRFormer: Semi-Supervised Task-Informed Representation Learning via Dynamic Attention-Based Regional Masking for Sequential Data [4.4] トランスフォーマーベースのアプローチであるSTaRFormerは、シーケンシャルモデリングのための普遍的なフレームワークとして機能する。
STaRFormerは、動的注意に基づく領域マスキングスキームと半教師付きコントラスト学習を組み合わせて、タスク固有の潜在表現を強化する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:03:19 GMT)
AutoML Benchmark with shorter time constraints and early stopping [4.4] Automated Machine Learning (AutoML)は、データ上に機械学習(ML)モデルを自動的に構築する。
AutoML Benchmark (AMLB)は、104タスクにわたる1時間と4時間の時間予算を使用してAutoMLフレームワークを評価することを提案した。
この研究は、ベンチマークで使用される全体的な計算を減らし、より少ない時間制約と早期停止の使用という2つの方法を検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 23:15:34 GMT)
GIScience in the Era of Artificial Intelligence: A Research Agenda Towards Autonomous GIS [4.3] 本稿は、GISが従来から自律的な理由づけ、導出、革新、地球空間的ソリューションの推進を超えて、グローバルな課題を推し進める未来を構想する。
本稿では,GIScienceのパラダイムシフトの基盤を築き,GISが従来から自律的な理由づけ,導出,革新,地空間的ソリューションの先進化によって世界的課題を推し進める未来を構想する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:21:34 GMT)
Time-varying EEG spectral power predicts evoked and spontaneous fMRI motor brain activity [4.3] 脳波-fMRI同時記録は、fMRI信号と脳波信号の相補的な高空間分解能と高時間分解能をそれぞれ利用することにより、脳活動の研究にますます利用されている。
本稿では,Sparse Group Lasso正則化を用いた個別被験者を対象とした解釈モデルを用いて,運動脳ネットワークのタスク誘発信号と自発fMRI信号の両方を予測できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:54:41 GMT)
LLM4FS: Leveraging Large Language Models for Feature Selection and How to Improve It [4.0] 現状のDeepSeek-R1, GPT-o3-mini, GPT-4.5の特徴選択法について検討した。
従来のデータ駆動手法とLCMを統合したLSM4FSと呼ばれる新しいハイブリッド戦略を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:31:18 GMT)
SeeTree -- A modular, open-source system for tree detection and orchard localization [4.0] SeeTreeは,木幹検出と果樹園のローカライゼーションのためのオープンソースの組込みシステムである。
商業用果樹園でのフィールド実験の間、システムは800回の試験で99%の時間で正しい位置に収束した。
採用と将来の研究開発を支援するため、私たちのデータセット、設計ファイル、ソースコードをコミュニティに無償で提供します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 23:39:14 GMT)
Toward Aligning Human and Robot Actions via Multi-Modal Demonstration Learning [4.0] 本稿では,Voxelized RGB-D空間におけるロボットデモを用いて,RGBビデオから人間デモを明示的にモデル化するフレームワークを提案する。
本稿では,人間の意図モデリングのためのResNetベースの視覚符号化と,ボクセルに基づくロボット行動予測のためのPerceiver Transformerを組み合わせる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:14:51 GMT)
A Primer on Variational Inference for Physics-Informed Deep Generative Modelling [3.9] 変分推論(VI)は、近似ベイズ推論のための計算効率が高くスケーラブルな方法論である。
ベイズ正規化と柔軟性が組み込まれているため、生成モデリングと反転タスクが優れている。
本論文は,不確実性定量化を重視した物理学に基づく問題の解決を目指す,一般科学読者を対象としたものである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:44:36 GMT)
AgentBreeder: Mitigating the AI Safety Impact of Multi-Agent Scaffolds via Self-Improvement [3.8] 大規模言語モデル(LLM)をマルチエージェントシステムに置き換えることによって、複雑なタスクのパフォーマンスが向上することが多い。
しかし、そのような足場による安全性への影響は十分に調査されていない。
我々は,足場上での多目的自己改善進化探索のためのフレームワークであるAgentBreederを紹介する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:39:33 GMT)
Will AI shape the way we speak? The emerging sociolinguistic influence of synthetic voices [3.8] 我々は、AI生成音声の社会的な影響は注意を喚起し、学際研究の焦点となるべきであると論じる。
我々は、AI生成音声の社会的な影響は注意を喚起し、学際研究の焦点となるべきであると論じる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:04:32 GMT)
The stellar decomposition of Gaussian quantum states [3.8] 光子計数測定により生成した非ガウス状態の特徴付け手法である恒星分解を導入する。
純粋状態に対して、物理対(G_core, T)が常にG_core純かつTユニタリであることを証明する。
混合状態に対しては、(G_core, T) がガウス混合状態およびガウスチャネルとなるために必要な十分条件を確立する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:41:54 GMT)
Regularized stress tensor of vector fields in de Sitter space [3.7] ゲージ固定 (GF) 項が $frac12zeta (Amu,_;;, mu)2$ であるような巨大なベクトル場であるド・シッター空間のシュテッケルベルク場を研究する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:16:20 GMT)
PestMA: LLM-based Multi-Agent System for Informed Pest Management [3.7] PestMAは、信頼性とエビデンスに基づく害虫管理アドバイスを生成するために設計されたマルチエージェントシステムである。
PestMAの初期精度は86.8%であり,検証後92.6%に向上した。
結果は、意思決定の精錬と検証において、協調的なエージェントベースの合成の価値を裏付ける。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:53:59 GMT)
GenTe: Generative Real-world Terrains for General Legged Robot Locomotion Control [3.6] GenTeは、汎用的な移動ポリシーをトレーニングするために、物理的に現実的で適応可能な地形を生成するためのフレームワークである。
視覚言語モデルの関数呼び出し技術と推論機能を活用することで、GenTeは複雑で文脈的に関係のある地形を生成する。
両足歩行ロボットにおける一般化とロバスト性の向上実験
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:01:44 GMT)
Ride-pool Assignment Algorithms: Modern Implementation and Swapping Heuristics [3.5] 本稿では,車間ルーティングやリバランシングなどの関連コンポーネントとともに,いくつかの重要な配車プール割り当てアルゴリズムを含む配車プールシミュレータを提案する。
また,新しいアルゴリズムの拡張を容易にするために設計された,高度に最適化されたモジュール化されたC++もオープンソースとして公開しています。
マンハッタンの大規模な実世界のデータセットの実験では、選択された全てのアルゴリズムが互換性を持って実行されているが、新たに提案されたMulti-Round Linear Assignment with Cyclic Exchangeは、計算時間を大幅に短縮した最先端のサービスレートを達成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:01:47 GMT)
Who Speaks for Ethics? How Demographics Shape Ethical Advocacy in Software Development [3.5] 本研究は,ソフトウェア開発における倫理的懸念を考察し,その認識,優先順位付け,そして,人口統計学的に異なる実践者による対処に焦点をあてる。
以上の結果から,女性,BIPOC,障害者など辺縁的な集団は高い頻度で倫理的懸念を訴える傾向がみられた。
これらの洞察は、多様な視点を中心としたソフトウェア教育と開発プロセスの急激な改革の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:43:57 GMT)
Toward Effective PBFT Consensus Service under Software Aging in Dynamic Scenarios [3.5] 本稿では,PBFTコンセンサスサービスにおいて,ソフトウェア老化シナリオ下でのコンセンサス処理時間とメンテナンスコストを削減する方法について検討する。
まず,3つのサブシステム,1つのアクティブノードサブシステム,1つのスタンドバイノードサブシステム,および1つの修復サブシステムからなるPBFTシステムを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:41:53 GMT)
Better Coherence, Better Height: Fusing Physical Models and Deep Learning for Forest Height Estimation from Interferometric SAR Data [3.5] SAR(Synthetic Aperture Radar)の画像から森林の高さを推定することは、しばしば伝統的な物理モデルに依存している。
対照的に、ディープラーニング(DL)アプローチは物理的な洞察を欠いている。
我々は,両世界の長所を兼ね備えたエンドツーエンドフレームワークであるCoHNetを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:44:08 GMT)
Explanation-Driven Interventions for Artificial Intelligence Model Customization: Empowering End-Users to Tailor Black-Box AI in Rhinocytology [3.5] 本稿では、ブラックボックスAIモデルのための新しいエンドユーザー開発(EUD)アプローチを提案する。
提案手法はHuman-Centered AI(HCAI)を進化させ,人間と適応型ユーザカスタマイズ型AIシステムとの共生関係を促進する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:21:20 GMT)
Transfer Learning Assisted XgBoost For Adaptable Cyberattack Detection In Battery Packs [3.5] 敵は送信中に電圧センサデータを破損させ、局所的に大規模な破壊を引き起こす可能性がある。
安全なEV充電を確保するためには,センサによるサイバー攻撃をリアルタイムで検出することが不可欠である。
本稿では,電圧予測と残差発生に使用する限られたパックレベルデータを用いたXgBoostベースのセルレベルモデルの微調整を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:15:32 GMT)
Benchmarking Practices in LLM-driven Offensive Security: Testbeds, Metrics, and Experiment Design [3.1] 大きな言語モデル(LLM)は、攻撃的な浸透テストツールを駆動するための強力なアプローチとして現れています。
本稿では,Large Language Model (LLM) による攻撃の評価に使用される方法論とベンチマーク手法について分析する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:21:33 GMT)
Seeking Consistent Flat Minima for Better Domain Generalization via Refining Loss Landscapes [3.1] ドメインの一般化は、複数のトレーニングドメインからモデルを学び、それを見えないテストドメインに一般化することを目的としています。
最近の理論では、損失ランドスケープの平坦なミニマムにパラメータを持つ深層モデルを求めることは、領域外一般化誤差を著しく減少させることが示されている。
既存の手法は、異なる領域における損失ランドスケープの整合性を無視することが多く、結果として、全ての領域において最適な平坦なミニマに同時に存在しないモデルが生じる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:22:48 GMT)
Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems [3.1] 非ホロノミック制約を持つ制御アフィン系を安定化する新しい制御理論フレームワークを提案する。
後ろ向きのプロセスでノイズを除去することで、我々のアプローチは、機械学習に基づくdenoisingメソッドのより実践的な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:04:48 GMT)
Enhancing Document Retrieval for Curating N-ary Relations in Knowledge Bases [3.0] バイオメディカル知識基盤のカリキュラムは、文献から正確な多義性関係事実を抽出することに依存している。
本稿では、KBキュレーションを支援するために、欠落した関係論を補うための文書を識別するニューラルネットワークモデルを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:11:53 GMT)
An Empirical Evaluation of White-box and Black-box Test Case Prioritization Techniques in CPSs Modeled in Simulink [3.0] 本研究は,Simulinkモデルにおけるテストケース優先順位付け手法に関する最大の実証的研究である。
ホワイトボックスとブラックボックステストケースの優先順位付け手法の性能を比較した。
ホワイトボックステストケース優先順位付けの文脈では、全体欲求アプローチはより大きなモデルで追加の欲求的手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:22:12 GMT)
Conditional Distribution Compression via the Kernel Conditional Mean Embedding [3.0] Kernel Herding (KH) のような既存の分散圧縮法は、元来、ラベルのないデータのために開発された。
本稿では,条件分布を比較するための自然な指標である平均条件平均離散性(AMCMD)を紹介する。
我々はKHのアイデアを拡張して,AMCMDを対象とする圧縮集合を構成する線形時間グリードアルゴリズムであるAverage Conditional Kernel Herding (ACKH)を開発した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:53:29 GMT)
LLM-based AI Agent for Sizing of Analog and Mixed Signal Circuit [3.0] 大規模言語モデル (LLM) は様々な分野において大きな可能性を証明している。
本研究では,AMS回路設計のためのLLMベースのAIエージェントを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:18:16 GMT)
Constructing Micro Knowledge Graphs from Technical Support Documents [3.0] 本稿では,これらのWebページ毎にマイクロ知識グラフ(マイクログラフ)を作成する手法を提案する。
マイクログラフはページ内のすべてのエンティティとアクションを格納し、ページの構造を利用する。
これらのマイクログラフは、技術支援アプリケーションによって追加の知識源として利用することができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:57:49 GMT)
Efficient Multi-Task Modeling through Automated Fusion of Trained Models [3.0] マルチタスク学習はインテリジェントサービスに広く応用されている。
従来のマルチタスクモデリング手法は、特定のタスクの組み合わせに基づいてカスタマイズされた設計を必要とすることが多い。
本稿では,異なる構造とタスクを持つ訓練済みシングルタスクモデルを自動的に融合してマルチタスクモデルを生成する,効率的なマルチタスクモデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:21:45 GMT)
On the Rational Degree of Boolean Functions and Applications [2.9] 有理次数として知られるブール関数の自然複雑性測度について検討する。
量子コンピュータの場合、選択後エラーと境界エラーはブラックボックスモデルにおけるリソースであることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:19:24 GMT)
Communication-aware Hierarchical Map Compression of Time-Varying Environments for Mobile Robots [2.9] 本研究では,動的確率的占有グリッドの時系列圧縮のためのフレームワークを開発する。
圧縮マップの品質と記述サイズとのバランスをとる多分解能階層エンコーダを探索する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:54:29 GMT)
EthosGPT: Mapping Human Value Diversity to Advance Sustainable Development Goals (SDGs) [2.8] EthosGPTは、大規模言語モデル(LLM)のマッピングと評価のためのオープンソースのフレームワークを導入することで、価値均質化の課題に対処する。
トレーニングデータの多様化や、AIシステムの表現を保証するために絶滅危惧文化遺産の保存など、包括的LLMを開発するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:14:13 GMT)
DUE: A Deep Learning Framework and Library for Modeling Unknown Equations [2.8] Deep Unknown Equations (DUE)は、未知の方程式のデータ駆動モデリングを容易にするために設計された、オープンソースのソフトウェアパッケージである。
ディープラーニングを用いた未知方程式のデータ駆動モデリングのための体系的フレームワークを提案する。
DUEは教室で教える教育ツールとして機能し、生徒や新入生が微分方程式でハンズオン体験を得られるようにしている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:20:55 GMT)
Beyond the Classroom: Bridging the Gap Between Academia and Industry with a Hands-on Learning Approach [2.8] 自己適応型ソフトウェアシステムは、ソフトウェア設計と運用に重要な焦点をあてている。
実践者の調査では、知識のある個人が不足しているため、業界における採用が妨げられている。
我々は、理論知識とハンズオン学習を産業関連技術と統合した自己適応型ソフトウェアシステムでコースを教える経験を提示する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:32:25 GMT)
TinyverseGP: Towards a Modular Cross-domain Benchmarking Framework for Genetic Programming [2.8] 遺伝的プログラミング(GP)は複数の問題領域に対処することができる。
我々は、TinyverseGPと呼ばれる統合フレームワークを提案し、複数の表現と問題領域をサポートする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:14:27 GMT)
Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization [2.7] CVGL(Cross-View Geo-Localization)は、最もよく似たGPSタグ付き衛星画像を取得することで、ドローン画像のローカライゼーションを決定する。
既存の手法は、モデルの性能を改善する際に、計算と記憶の要求が増大する問題をしばしば見落としている。
マルチレベル・エンベディング・アライメント・ネットワーク(MEAN)と呼ばれる軽量なアライメント・ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:54:46 GMT)
Pay Attention to What and Where? Interpretable Feature Extractor in Vision-based Deep Reinforcement Learning [2.7] 説明可能な深層強化学習における現在のアプローチは、視覚入力中の物体に注意マスクが変位する制限がある。
本研究では,エージェントが空間領域に集中している「何」と「どこに」の両方を正確に表現するために,正確な注意マスクを生成するための解釈可能な特徴外的アーキテクチャを提案する。
得られたアテンションマスクは、人間によって一貫性があり、空間次元が正確であり、視覚入力における重要な物体や位置を効果的に強調する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:18:34 GMT)
Mining for Lags in Updating Critical Security Threats: A Case Study of Log4j Library [2.6] パッチ更新の適用の遅れにより、クライアントシステムはエクスプロイトに晒される可能性がある。
更新遅延に影響する要因を特定し,バージョン分類に基づいて分類する。
結果は遅延が存在することを示しているが、より高いリリースサイクルのプロジェクトはより迅速に深刻なセキュリティ問題に対処する傾向にある。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:02:16 GMT)
Finite Correlation Length Scaling of Disorder Parameter at Quantum Criticality [2.6] 二重図では、障害パラメータは実際に高次の対称性のSSBを検出する。
本研究では,非局所的障害パラメータを無限に投影された絡み合ったペア状態を用いて有用かつ効率的に評価できることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:45:38 GMT)
Ctrl-Z: Controlling AI Agents via Resampling [2.5] マルチステップシステム管理タスクに挑戦する257のデータセットであるBashBenchを構築した。
各種安全対策により、敵に構築されたAIエージェントが悪意のあるコードを秘密裏にダウンロードして実行することを防ぐことができるかどうかを評価する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:22:11 GMT)
Towards Simple Machine Learning Baselines for GNSS RFI Detection [2.5] 最先端のディープラーニングモデルでは、RFI検出の文脈において、単純で巧妙な機械学習手法を上回りません。
我々はスイス空軍とスイス空軍が収集した独自の大規模なデータセットを活用している。
簡単なベースラインモデルでは、RFIの検出において91%の精度が得られ、より複雑なディープラーニングモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:59:33 GMT)
A Multi-Layered Research Framework for Human-Centered AI: Defining the Path to Explainability and Trust [2.5] 人間中心型AI(HCAI)は人間の価値観との整合性を強調し、説明可能なAI(XAI)はAI決定をより理解しやすくすることで透明性を高める。
本稿では,HCAI と XAI を橋渡し,構造的説明可能性パラダイムを確立する新しい3層フレームワークを提案する。
我々の発見は、透明性、適応性、倫理的に整合したAIシステムを育成するHCXAI(Human-Centered Explainable AI)を前進させた。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:29:30 GMT)
Measuring Casimir Force Across a Superconducting Transition [2.5] カシミールの力は超伝導遷移の中でどのように振る舞うかは未解明のままである。
この問題は、電子物理学、量子重力、高温超伝導に影響を及ぼす。
ここでは、これらの課題を克服するオンチップ超伝導プラットフォームを実演する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:00:01 GMT)
Machine Learning and Transformers for Thyroid Carcinoma Diagnosis: A Review [2.4] 本稿では, 甲状腺癌(TC)の診断におけるAIベースのアプローチ, 特にトランスフォーマーを用いたアプローチについて概説する。
人工知能(AI)アルゴリズム,フレームワークの目標,使用するコンピューティング環境に基づく,これらの手法の新しい分類システムを導入する。
この論文は、教師なし、教師なし、または混在したアプローチを通じて、TCの診断と治療を支援するためのAI機器の重要性を強調している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:10:31 GMT)
IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling [2.3] 正書法データセットを一貫した音韻表現に変換するツールであるG2P+を紹介する。
また、31言語にまたがる子育て音声の音声データセットであるIPA CHILDESを提示する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:18:43 GMT)
BabyLM's First Words: Word Segmentation as a Phonological Probing Task [2.3] 単語分割が音韻探索のタスクとしてどのように使われるかを示す。
本研究では,31言語にまたがる児童指向音声で学習した音素ベース言語モデルから学習した表現について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:12:17 GMT)
Epistemic Uncertainty-aware Recommendation Systems via Bayesian Deep Ensemble Learning [2.3] より堅牢で信頼性の高い予測を生成するために,アンサンブルに基づくスーパーモデルを提案する。
また,ユーザとアイテムの埋め込みに対して,解釈可能な非線形マッチング手法を導入する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 23:04:35 GMT)
Investigation of Rare-Earth Ion-Photon Interaction and Strong Coupling in Optical Microcavities [2.3] マイクロキャビティに希土類イオンを結合してオンチップ量子ネットワークを実現する手法を提案する。
このアプローチの拡張として、結合系は局所およびフライングキュービットの量子絡み合いを効率的に達成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:19:17 GMT)
Expressivity of Representation Learning on Continuous-Time Dynamic Graphs: An Information-Flow Centric Review [2.3] 本稿では,連続時間動的グラフ(CTDG)モデルにおけるグラフ表現学習(GRL)について概観する。
本稿では,情報フロー(IF)レンズを用いてCTDGモデルの表現性を解析する新しい理論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:21:49 GMT)
Leveraging Deep Operator Networks (DeepONet) for Acoustic Full Waveform Inversion (FWI) [2.3] フルウェーブフォーム・インバージョン(FWI)は地下特性予測において重要な手法である。
FWIは、地震データから高解像度の地球内部モデルを予測する逆問題を解決する。
本研究では,Deep Operator Networks (DeepONet) を利用してFWIの効率性と精度を向上させる手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:24:43 GMT)
A Piece of QAICCC: Towards a Countermeasure Against Crosstalk Attacks in Quantum Servers [2.3] 量子コンピューティングは、古典コンピューティングよりも指数関数的に高速な情報処理を可能にする。
攻撃者と被害者のキュービット間のクロストークは、セキュリティ攻撃をマウントするために利用される。
回路間クロストークを最小限に抑えるために,ユーザ間でキュービットを割り当てるQAICCC手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:55:07 GMT)
GeOT: A spatially explicit framework for evaluating spatio-temporal predictions [2.3] 空間的評価基準と損失関数として最適輸送(OT)を提唱した。
提案手法は,予測誤差に関連する輸送コストを定量化し,予測モデルの性能を評価する。
自転車シェアリング、充電ステーション、交通データセットによる実験では、空間コストは非空間誤差メトリクスの限界変化によって大幅に削減されている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:54:19 GMT)
HyRRT-Connect: Bidirectional Motion Planning for Hybrid Dynamical Systems [2.3] 本稿では,ハイブリッドシステムの動作計画問題を解くために,双方向の高速探索ランダムツリー (RRT) アルゴリズムを提案する。
提案アルゴリズムはHyRRT-Connectと呼ばれ,前後の伝搬結果の重なりが検出されるまで,ハイブリッド時間で前方方向と後方方向の両方を伝搬する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:46:54 GMT)
On the utility of the switching theorem for adiabatic state preparation [2.2] 断熱量子計算はハミルトンのゆっくりとした進化に依存する。
本稿では, 単純な低次元状態における断熱と過断熱の遷移について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:02:26 GMT)
Towards Fairness for the Right Reasons: Using Saliency Maps to Evaluate Bias Removal in Neural Networks [2.2] ニューラルネットワークの公平性向上と有害バイアス除去の関係について検討する。
モデル焦点を保護属性から切り離して, モデル焦点を系統的にリダイレクトする手法が成功していることを示す。
これらの発見は、モデルが正しい理由で公正であることを保証することの重要性を強調し、より倫理的で信頼できるAIシステムの開発に寄与する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:34:51 GMT)
PASS-FC: Progressive and Adaptive Search Scheme for Fact Checking of Comprehensive Claims [2.2] PASS-FCは、クレーム強化、適応的質問生成、反復的検証を通じて問題に対処する新しいフレームワークである。
我々はPASS-FCを6つの多様なデータセットで評価し、一般知識、科学知識、実世界、多言語事実チェックタスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:24:37 GMT)
Small Object Detection with YOLO: A Performance Analysis Across Model Versions and Hardware [2.1] 本稿では,ONNX や OpenVINO などの人気ライブラリを用いて,Intel と CPU の高速化と検出精度について検討する。
画像内のオブジェクトサイズに対するこれらのYOLOモデルの感度を分析し、画像の総面積の1%、2.5%、5%を占めるオブジェクトを検出する際の性能を調べる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:49:31 GMT)
ESCT3D: Efficient and Selectively Controllable Text-Driven 3D Content Generation with Gaussian Splatting [1.9] 本稿では, 自己最適化のための GPT-4V を提案する。
トレーニング中、多視点深度、マスク、特徴、画像を含む多視点情報を効果的に統合し、3Dコンテンツ生成における一般的なJanus問題に対処する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:25:21 GMT)
On the Contractivity of Stochastic Interpolation Flow [1.9] 本稿では,拡散モデルと多くの類似点を有する高次元サンプリングフレームワークについて検討する。
ベース分布と強い対数目標分布に対して、フローマップは、最適輸送写像に対するカファレッリの定理と一致する鋭い定数を持つリプシッツであることを示す。
さらに、非ガウス分布間のリプシッツ輸送写像を構築することができ、関数的不等式を確立するための輸送方法に関する文献における最近の研究を一般化することができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:10:22 GMT)
XY-Cut++: Advanced Layout Ordering via Hierarchical Mask Mechanism on a Novel Benchmark [1.9] XY-Cut++は、事前マスク処理、多粒度セグメンテーション、およびクロスモーダルマッチングを統合するレイアウト順序付け手法である。
最先端のパフォーマンス(全体の98.8BLEU)を達成し、シンプルさと効率性を維持している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:19:57 GMT)
Joint Action Language Modelling for Transparent Policy Execution [1.9] 政策学習の問題を言語生成問題に変換することにより,透明な行動を直接学習プロセスに挿入することを目指す。
結果として得られたモデルは透明な自然言語文を生成し、その後に長期的タスクを解決するための特定のアクションを表すトークンが続く。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:57:37 GMT)
Accelerating large-scale linear algebra using variational quantum imaginary time evolution [1.8] 変動量子想像時間進化に基づくグラフ分割問題に対する量子的アプローチ(VarQITE)を提案する。
我々は、AnsysのLS-DYNAシミュレーションソフトウェアでVarQITEを用いて、有限要素解析(FEA)を高速化するハイブリッド量子/古典的手法を開発した。
本研究では,VarQITE が LS-DYNA に影響を及ぼす可能性を示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:28:38 GMT)
Investigating the Role of Bilateral Symmetry for Inpainting Brain MRI [1.7] 近年, 医療画像データ解析において, インペイントは有用かつ興味深い技術として注目されている。
塗布された脳構造と主観的条件情報量との統計的関係について検討した。
塗布プロセスの条件付けにおいて,いくつかの構造が対称性の強い影響を示すことを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:41:47 GMT)
A Computational Cognitive Model for Processing Repetitions of Hierarchical Relations [1.6] 我々は、シーケンシャルデータ内の階層的関係の反復から生じる構造的反復、パターンに焦点を当てる。
このような構造的反復を人間が検出し、理解する方法の候補計算モデルを開発する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:08:28 GMT)
Data-Driven Safety Verification using Barrier Certificates and Matrix Zonotopes [1.6] ノイズの多いデータから直接システムの安全性を検証するための,データ駆動型安全性検証フレームワークを提案する。
1つの信頼できないモデルを信頼するのではなく、観測されたデータと整合する一連のモデルを構築します。
このモデル集合は行列ゾノトープを用いてコンパクトに表現され、効率的な計算と不確実性の伝播を可能にする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:30:27 GMT)
Predicting Crack Nucleation and Propagation in Brittle Materials Using Deep Operator Networks with Diverse Trunk Architectures [1.6] 我々は分岐ネットワークとトランクネットワークからなるディープニューラル演算子(DeepONet)を用いて脆性破壊問題を解決する。
最初のアプローチでは,2段階のDeepONetの有効性を示す。
第2のアプローチでは、物理インフォームドされたDeepONetを用いて、エネルギーの数学的表現をトランクネットワークの損失に統合し、物理的一貫性を強制する。
第3のアプローチでは、トランク内のニューラルネットワークをコルモゴロフ・アルノルドネットワークに置き換え、物理損失なしにトレーニングする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:01:43 GMT)
Synthetic Biology meets Neuromorphic Computing: Towards a bio-inspired Olfactory Perception System [1.6] 本稿では,3つの重要な特徴を有する合成感覚ニューロンのハイブリッドシステムについて検討する。
この研究は、超感度で特異的でエネルギー効率の良い匂い検出のためのプラットフォームを開発することを目指している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:57:20 GMT)
Quantifying Privacy Leakage in Split Inference via Fisher-Approximated Shannon Information Analysis [1.5] 分割推論(SI)は、ディープニューラルネットワークを分散サブモデルに分割することで、プライバシ保護による協調学習を可能にする。
敵の攻撃防御ゲームに関する広範な研究にもかかわらず、プライバシーリスクの基本的な分析には欠点が残っている。
本稿では,情報理論を用いたプライバシー漏洩定量化の理論的枠組みを確立し,これを敵の確実性として定義し,平均ケースと最悪のエラー境界の両方を導出する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:19:06 GMT)
Language and Knowledge Representation: A Stratified Approach [1.5] この論文は、いくつかの解成分の観点で表現の不均一性の問題に対するトップダウンの解法を推し進めている。
この論文には2つの国際研究プロジェクトのために開発された言語と知識表現の概念実証も含まれている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:18:10 GMT)
Data Augmentation Through Random Style Replacement [1.4] スタイル拡張とランダム消去の利点を組み合わせた新しいデータ拡張手法を提案する。
提案手法はまず,まずトレーニング画像にランダムなスタイル転送を適用し,次に,これらの画像の中から選択された領域を,スタイル変換されたバージョンから派生したパッチでランダムに置き換える。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:46:32 GMT)
Multipartite entanglement based on realignment moments [1.4] 密度行列の配向モーメントに基づいて,二部および多部状態のパラメータ化エンタングルメント基準について検討した。
我々の基準は、有界な絡み合い状態だけでなく、二部量子系に対する非正の部分転位絡み合い状態も検出できる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:02:58 GMT)
FuzzSense: Towards A Modular Fuzzing Framework for Autonomous Driving Software [1.3] 本研究は,多様なADファジリングツールをアンサンブルするために設計された,モジュール式でブラックボックスな突然変異ベースのファジリングフレームワークであるFuzzSenseを提案する。
FuzzSenseの実用性を検証するために、プラグインとしてLiDARセンサーファザが開発され、新しいADシミュレーションプラットフォームであるAWSIMとAutoware.Universe ADソフトウェアプラットフォームでファザが実装された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:17:46 GMT)
Structured Graph Representations for Visual Narrative Reasoning: A Hierarchical Framework for Comics [1.3] 本稿では,漫画に焦点をあて,視覚的物語の構造的理解のための階層的知識グラフフレームワークを提案する。
それは、意味的、空間的、時間的関係をキャプチャする統合知識グラフを通してそれらを表現する。
パネルレベルでは、文字、オブジェクト、アクションなどの視覚要素と、対話やキャプションを含む対応するテキストコンポーネントをリンクするマルチモーダルグラフを構築する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:42:19 GMT)
Investigating Syntactic Biases in Multilingual Transformers with RC Attachment Ambiguities in Italian and English [1.3] 本研究は,イタリア語と英語の相対的節付きあいまいさの例として,単言語・多言語LLMが人間的嗜好を示すか否かを考察する。
また、これらの嗜好が、構文的・意味的関係に関する微妙な制約に結びついていることが示されている語彙的要因によって調節できるかどうかを検証した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:19:23 GMT)
RealHarm: A Collection of Real-World Language Model Application Failures [1.3] 我々は、AIエージェントとの注釈付き問題相互作用のデータセットであるRealHarmを紹介する。
我々は、特にデプロイ者の視点から、害、原因、危険を分析します。
我々は,現状のガードレールとコンテンツモデレーションシステムを評価し,そのようなシステムが事故を防いだかどうかを調査した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:44:41 GMT)
Beyond the Generative Learning Trilemma: Generative Model Assessment in Data Scarcity Domains [1.3] 深層生成モデル(Deep Generative Models, DGM)は、生成学習のトリレムマを満たす合成データを生成する。
現実のシナリオにおけるDGMの適用性を確保する上で重要な要素である、実用性、堅牢性、プライバシを含むように、トライレンマを拡張します。
本研究は、生成学習トリレンマの範囲を広げ、それを現実世界の要求と整合させ、特定のアプリケーションに適したDGMを選択するための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:15:44 GMT)
Dynamic-Dark SLAM: RGB-Thermal Cooperative Robot Vision Strategy for Multi-Person Tracking in Both Well-Lit and Low-Light Scenes [1.3] RGBとサーマルカメラを併用した協調MPTシステムを提案する。
評価実験により、サーマルトラッカーは明るい環境と暗い環境の両方で堅牢に機能することが示された。
暗黒環境における人間の熱認識性を組み合わせた画像変化パターン認識(ICPR)手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:26:36 GMT)
Visual anemometry of natural vegetation from their leaf motion [1.2] 天気予報や気象モデルの精度を向上させるためには,高解像度・近地風速データが必要である。
風による植生の動きは、その構造と機械的特性に複雑な方法で依存していることが広く認識されている。
本研究では, 葉の移動が葉の枝と支持構造から切り離され, 風速が低く, 風速が変化していることを明らかにする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:00:02 GMT)
Towards Accurate Forecasting of Renewable Energy : Building Datasets and Benchmarking Machine Learning Models for Solar and Wind Power in France [1.2] 本研究は、フランスの国規模で太陽光発電と風力発電を予測するための総合的な方法論を提案する。
2012年から2023年にかけて、RTEから毎日の電力生産データを使用してデータセットが構築されている。
空間的に解決された気象データを扱うための3つのモデリング手法について検討した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:30:54 GMT)
"It Listens Better Than My Therapist": Exploring Social Media Discourse on LLMs as Mental Health Tool [1.2] 大きな言語モデル(LLM)は、会話の流布、共感シミュレーション、可用性の新機能を提供する。
本研究では,1万件以上のTikTokコメントを分析し,LLMをメンタルヘルスツールとして利用する方法について検討した。
その結果、コメントの20%近くが個人利用を反映しており、これらのユーザーは圧倒的に肯定的な態度を示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:37:32 GMT)
SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging [1.2] 本稿では,マルチモーダル医療画像アシスタントSilVar-Medを紹介する。
提案する推論データセットを用いて,医学的異常予測の背景にある推論の解釈に焦点をあてる。
この研究は、より透明でインタラクティブで、臨床的に実行可能な診断支援システムを育むことで、医療AIの分野を前進させると信じています。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:51:37 GMT)
Cooperative squeezing of internal and collective spins in an atomic ensemble [1.2] ルビジウム原子を用いた熱原子アンサンブルにおける内部および集合スピンのスクイーズを実験的に実証した。
我々のアプローチは、原子アンサンブルの量子状態に固有の自由度を完全に活用する新しい視点を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:55:36 GMT)
EthCluster: An Unsupervised Static Analysis Method for Ethereum Smart Contract [1.2] スマートコントラクトのSolidityソースコードの脆弱性を特定するために、教師なし学習を使用してモデルをトレーニングする。
実世界のスマートコントラクトに関連する課題に対処するため、トレーニングデータは実際の脆弱性サンプルから導出します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:36:21 GMT)
Who's the (Multi-)Fairest of Them All: Rethinking Interpolation-Based Data Augmentation Through the Lens of Multicalibration [1.1] また,Fair Mixupの4つのバージョンを,最大81個の辺縁化グループを持つ2つの構造化データ分類問題に対してストレス試験を行った。
ほぼすべての実験において、Fair Mixupはベースラインのパフォーマンスとフェアネスを基準にしていますが、単純なバニラMixupはFair Mixupとベースラインの両方をパフォーマンスします。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:40:08 GMT)
Generalization analysis of quantum neural networks using dynamical Lie algebras [1.0] 本稿では、動的リー代数に基づく量子ニューラルネットワークの一般化について述べる。
量子ニューラルネットワークにおいて、トレーニング可能なパラメータの数の上界を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:27:30 GMT)
$\mathcal{PT}$-symmetric mapping of three states and its implementation on a cloud quantum processor [1.0] 我々は、$N = 3$純量子状態のマッピングのための新しい$mathcalPT$-symmetricアプローチを開発する。
提案アルゴリズムは,従来の最小誤差,最大信頼度,最大相互情報戦略と同一の3状態QKDプロトコルに対する攻撃率を有する。
我々の研究は、量子通信、コンピューティング、暗号に$mathcalPT$対称性を適用するための新しい経路を開く。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:36:55 GMT)
Using Large Language Models for Template Detection from Security Event Logs [0.9] イベントログ分析技術は、サイバー攻撃のタイムリーな検出と、過去のセキュリティインシデントの分析でセキュリティ専門家を支援するために不可欠である。
構造化されていないテキストイベントログから行パターンやテンプレートを検出することは、イベントログ分析の重要なタスクとして認識されている。
本稿では,構造化されていないセキュリティイベントログからテンプレートを教師なし検出するためのLarge Language Models (LLMs) の適用について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:33:32 GMT)
Towards safe Bayesian optimization with Wiener kernel regression [0.7] 本稿では、最近提案されたWienerカーネル回帰に基づいて、新しいエラー境界を提案する。
比較的穏やかな仮定の下では、提案された誤差境界は、文献に記録された境界よりも厳密であることを示す。
提案手法の有効性を示す数値的な例を挙げる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:36:12 GMT)
How does the entanglement entropy of a many-body quantum system change after a single measurement? [0.6] 一次元自由ディラックフェルミオンに対しては、エンタングルメントエントロピーの変化の確率分布を計算する。
量子ジャンプと射影測定プロトコルについて、ガウス性からの明確な偏差を観測する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:59:55 GMT)
Phase transitions in a non-Hermitian Su-Schrieffer-Heeger model via Krylov spread complexity [0.6] 我々は,Krylov拡散複雑性とKrylovフィリティを介し,想像上の化学ポテンシャルを持つ非エルミートSu-Schrieffer-Heeger(SSH)モデルの相転移について検討した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:05:53 GMT)
Explainable and Class-Revealing Signal Feature Extraction via Scattering Transform and Constrained Zeroth-Order Optimization [0.6] 機械学習モデルから識別可能かつ説明可能な特徴を抽出する新しい手法を提案する。
興味のあるクラスのクラス確率を最大化する入力パターンを探索するために、ゼロ階最適化アルゴリズムを採用する。
本稿では,合成時系列分類問題を用いて提案手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:23:21 GMT)
Physical Scales Matter: The Role of Receptive Fields and Advection in Satellite-Based Thunderstorm Nowcasting with Convolutional Neural Networks [0.4] 最近の研究は、機械学習のバリューチェーンに対流を組み込むことで、レーダベースの降水流のスキルが向上したことを示している。
本研究は,衛星による雷雨の流星群への接近を初めて調査し,一般性について検討する。
本質的に、アドベクションは、流し込みに関連する雷雨パターンが長いリード時間で受容野に含まれることを保証している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:57:59 GMT)
"All Roads Lead to ChatGPT": How Generative AI is Eroding Social Interactions and Student Learning Communities [0.4] 生成型AIが社会的相互作用、ピアラーニング、教室のダイナミクスに与える影響について検討する。
我々の知見は、現在ヘルプ検索要求は、しばしば生成AIによって仲介されていることを示唆している。
学生たちは、彼らが依存する社会サポートシステムが崩壊し始めるにつれ、ますます孤立し、廃れつつあると感じていると報告した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:40:58 GMT)
Universality, Robustness, and Limits of the Eigenstate Thermalization Hypothesis in Open Quantum Systems [0.4] マルコフ開量子系のリンドブラディアン作用素の固有基底における可観測物の統計的性質について検討する。
いくつかの物理モデルの広範囲な数値シミュレーションにより,リンドブラディアンETHアンザッツの有効性を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:25:11 GMT)
The Future of MLLM Prompting is Adaptive: A Comprehensive Experimental Evaluation of Prompt Engineering Methods for Robust Multimodal Performance [0.4] MLLM(Multimodal Large Language Models)は、機械がどのように処理し、人間のような応答を生成するかを変換するために設定される。
本研究は,オープンソースMLLM13に対して,24タスクで適用した7つのプロンプトエンジニアリング手法の総合的実験評価である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:31:39 GMT)
Nanoscale engineering and dynamical stabilization of mesoscopic spin textures [0.4] 我々は、メソスコピックに大規模なスピンのアンサンブルにおいて、構造量子状態の工学と安定化に熱化を利用する能力を示す。
具体的には、ダイヤモンド中の13mathrmC$の核スピンと相互作用する「殻のような」スピンテクスチャを生成し、制御し、安定させ、読み取る能力を紹介します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:52:45 GMT)
Niche Dynamics in Complex Online Community Ecosystems [0.4] 本稿では,5年間に1,919の高ユーザオーバラップを抱えるRedditコミュニティ8,806を大規模に調査した。
その結果、相互主義のエピソードは、競争のエピソードよりも長く、わずかに頻度が高いことが判明した。
競合する生態的相互作用はトピックやユーザの重複を減少させるが、このようなニッチな重複を減少させる変化は相互主義に繋がらない。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:13:02 GMT)
Quantum Natural Language Processing: A Comprehensive Review of Models, Methods, and Applications [0.3] 量子コンピューティングの原理、アーキテクチャ、計算アプローチに基づいてQNLPモデルを分類することを提案する。
本稿では,この領域の最先端をマッピングすることで,量子が言語にどのように適合するかを調査する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:09:26 GMT)
Noise2Ghost: Self-supervised deep convolutional reconstruction for ghost imaging [0.3] 本稿では,自己教師型深層学習に基づくゴーストイメージング(GI)再構成手法を提案する。
ノイズの多い買収のために、非並列的な再構築パフォーマンスを提供する。
彼らの応用には、生体サンプルと電池のin-vivoおよびin-operandoケーススタディが含まれる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:58:19 GMT)
Working with Large Language Models to Enhance Messaging Effectiveness for Vaccine Confidence [0.3] ワクチンヘシタシーと誤報は、広範囲にわたるワクチン接種率を達成するための重要な障壁である。
本稿では,ChatGPTを付加したメッセージがワクチン接種への信頼を高める可能性について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 04:06:46 GMT)
EDCA - An Evolutionary Data-Centric AutoML Framework for Efficient Pipelines [0.3] この作業では、Evolutionary Data Centric AutoMLフレームワークであるEDCAを紹介します。
データ品質は通常、AutoMLの見過ごされている部分であり、手作業と時間を要するタスクであり続けています。
EDCAは、AutoMLベンチマークのトップの2つのフレームワークであるFLAMLとTPOTと比較された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:57:26 GMT)
Achieving Optimal Tissue Repair Through MARL with Reward Shaping and Curriculum Learning [0.3] バイオエージェントを用いた組織修復プロセスの最適化のための多エージェント強化学習フレームワークを提案する。
分子シグナリングをモデル化した反応拡散システム,(2)ヘビアン可塑性を用いた神経様電気化学通信,(3)化学勾配追跡,神経同期,堅牢なペナルティを組み合わせた生体情報報酬関数。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:57:03 GMT)
Paging Dr. GPT: Extracting Information from Clinical Notes to Enhance Patient Predictions [0.3] GPT-4o-mini (ChatGPT) による患者に対する簡単な臨床質問に対する回答が患者レベルの死亡予測にどう役立つかを検討する。
MIMIC-IV Noteデータセットにおける14,011件の初診データや心血管集中治療ユニットのデータを用いて,GPT応答をロジスティック回帰モデルにおける入力特徴として用いた透明なフレームワークを実装した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:41:45 GMT)
Who is More Bayesian: Humans or ChatGPT? [0.0] 我々は,El-Gamal,Grether,Holt,Smithらが実施した実験から収集した被験者の選択を再検討した。
全体として、ベイズルールは人間の選択を予測する唯一の最良のモデルであるが、被験者は異質である。
また,ChatGPTは最適下決定を下すバイアスも伴うことを示した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:37:54 GMT)
Vision based driving agent for race car simulation environments [0.0] 本稿では, レーストラック上での時間最適運転の課題を, 深層強化学習問題として定式化した。
その結果,最大タイヤグリップ電位を利用した人間的な学習と運転行動が示された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:29:37 GMT)
Uncovering Branch specialization in InceptionV1 using k sparse autoencoders [0.0] 以前の研究により、SAEはInceptionV1の初期のレイヤから解釈可能な特徴を抽出する有効なツールであることが示されている。
混合4a-4e枝の各層,5x5枝および1x1枝で発生する枝の特殊化の様々な例を示す。
また、ブランチの特殊化はレイヤ間で一貫性があり、モデル全体で同様の機能は各レイヤで同じ畳み込みサイズのブランチにローカライズされる、と主張する証拠も提供します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:16:39 GMT)
Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA [0.0] CheckboxQAは、チェックボックス関連タスクのモデルパフォーマンスの評価と改善を目的としたデータセットである。
現行のモデルの限界を明らかにし、文書理解システムを前進させる貴重なツールとして機能する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:06:59 GMT)
Un marco conceptual para la generación de requerimientos de software de calidad [0.0] 自然言語処理タスクを強化するために,大規模言語モデル (LLM) が登場した。
この研究は、これらのモデルを使用して自然言語で書かれたソフトウェア要件の品質を改善することを目的としている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:12:18 GMT)
Tumor likelihood estimation on MRI prostate data by utilizing k-Space information [0.0] 本研究は,前立腺癌推定におけるk-Spaceの有用性を示す。
コイル圧縮に高いアンダーサンプリング率と簡単な主成分分析(PCA)を用いることで,再構成に必要な時間を短縮する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:28:26 GMT)
Trapping potentials and quantum gates for microwave-dressed Rydberg atoms on an atom chip [0.0] 静電場のリドベルク原子は永久双極子モーメントを持つ。
バイアス電場を適用して所望のRydberg状態と適切な周波数のマイクロ波場を結合することにより、原子のトラップ電位を生成できることが示される。
そのような原子の閉じこもったリドベルク状態のペアは、量子ビットを表すことができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:59:35 GMT)
Towards Scenario- and Capability-Driven Dataset Development and Evaluation: An Approach in the Context of Mapless Automated Driving [0.0] 本稿では,自動走行における環境認識のためのデータセット開発プロセスに焦点を当てる。
本稿では,データセット開発におけるシナリオと能力に基づくアプローチを提案する。
この方法論を、既存のレーン検出データセットの幅広い範囲に適用することにより、現在のデータセットにおける重要な制限を特定します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:26:03 GMT)
Thermodynamic limit in learning period three [0.0] 周期 3 の連続した一次元写像はすべての周期を含む。
周期軌道は3つのデータポイントのみを学習することで得られるか?
ほぼ全ての学習期間が不安定であり、各ネットワークには固有のアトラクションがあることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:44:36 GMT)
Thermal quantum information capacity in a topological insulator [0.0] 1次元Su-Schrieffer-Hegger(SSH)トポロジカル絶縁体の温度効果について検討した。
熱アンサンブルのための量子情報処理(QIP)能力に着目した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:58:19 GMT)
The renormalized stress-energy tensor for scalar fields in the Boulware state with applications to extremal black holes [0.0] ブールウェア真空中のスカラー場に対する再正規化応力エネルギーテンソル(RSET)を計算した。
RSETの極端地平線における正則性に関する数値的な証拠は,磁場の質量とその結合によらず見いだされる。
我々は、RSETの数値結果を用いて半古典的アインシュタイン方程式を導出し、RSETを静的摂動と見なす場合、ブラックホールを非過渡化するか、あるいは地平線のない物体に変換するかを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:39:38 GMT)
The Voynich Codex Decoded: Statistical Symbolism and Scroll-Wide Logic [0.0] 本稿では,Voynich Manuscriptのための構造化復号化フレームワークを提案する。
記号を音声で解釈するのではなく、構造的役割と空間的ペーシングによってデコードする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:41:30 GMT)
The Foliage Partition: An Easy-to-Compute LC-Invariant for Graph States [0.0] 本稿では,グラフ状態に対する計算容易なLC不変量である葉分割について紹介する。
グラフの葉にインスパイアされた我々の不変量は、葉、軸、双生児という観点で自然な図形表現を持つ。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:37:30 GMT)
Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks [0.0] 階層型タスクメモリツリー(TMT)を用いてタスク実行を追跡する軽量で構造化されたメモリモジュールを提案する。
TMEはグラフ対応に設計されており、再利用可能なサブステップ、タスクパスの収束、依存関係の共有をサポートする。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:38:19 GMT)
TWSSenti: A Novel Hybrid Framework for Topic-Wise Sentiment Analysis on Social Media Using Transformer Models [0.0] 本研究では,感情分類の精度と頑健性を改善するために,トランスフォーマーモデルを組み合わせたハイブリッドフレームワークについて検討する。
このフレームワークは、ノイズの多いデータ、コンテキストのあいまいさ、さまざまなデータセット間の一般化といった課題に対処する。
この研究は、ソーシャルメディアのモニタリング、顧客感情分析、世論の追跡など、現実世界のタスクへの適用性を強調している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 05:44:11 GMT)
SmartGSN: an online tool to semi-automatically manage assurance cases [0.0] 我々は,大規模言語モデルに依存する革新的なオンラインツールであるSmartGSNを導入し,GSNに準拠した保証ケースの管理を(半)自動化する。
SmartGSNの評価は、複数のアプリケーションドメインにまたがる5つのシステムで手作業で作成された保証ケース内の保証ケースパターンを検出する強力な能力を示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:33:44 GMT)
Simulating near-infrared spectroscopy on a quantum computer for enhanced chemical detection [0.0] 近赤外分光法(英: Near-infrared spectroscopy、NIR)は、化学濃度を測定するための非侵襲的、低コスト、試薬無し、迅速技術である。
量子コンピュータ上でのNIRスペクトルのシミュレーション手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:02:48 GMT)
Simulating lattice fermion doubling with a Floquet drive [0.0] 最近発見された格子フェルミオンのスペクトルと周期的に駆動される量子系のスペクトルとの数学的対応を考察する。
私たちはそれを2つのシステム間の赤外線同値にします。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:01:40 GMT)
Sidecar: A Structure-Preserving Framework for Solving Partial Differential Equations with Neural Networks [0.0] 既存のニューラルネットワークソルバの精度と物理的整合性を高める新しいフレームワークであるSidecarを提案する。
ベンチマークPDEによる実験結果は,既存のニューラルネットワークソルバの改良を実証している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:40:11 GMT)
Siamese Network with Dual Attention for EEG-Driven Social Learning: Bridging the Human-Robot Gap in Long-Tail Autonomous Driving [0.0] 本研究では脳波信号の分類を行う脳-コンピュータインタフェース(BCI)フレームワークを提案する。
タイムリーかつモチベーションの高いコロボティックエンジニアリングアプリケーションとして、準自律ロボット運転における危険事象を警告するために、人間とループのシナリオをシミュレートする。
本稿では,脳波を符号化した信号表現を生成するために,ダイナミック・タイム・ワーピング・バリーセンタ平均化手法と組み合わせた二重アテンション・シームズ畳み込みネットワークを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:06:17 GMT)
Session-based Recommender Systems: User Interest as a Stochastic Process in the Latent Space [0.0] 本稿では,セッションベースレコメンデータシステムにおけるデータ不確実性,人気バイアス,露出バイアスの問題に対処する。
項目埋め込みとレコメンデーションの両方において,このバイアスの症状について検討した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:08:40 GMT)
Sequence models for by-trial decoding of cognitive strategies from neural data [0.0] 本稿では,脳波データから認知戦略を復号化するための新しい機械学習手法を提案する。
試行レベルでの認知操作をうまくモデル化することにより、意思決定戦略における動的変動の実証的証拠を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:33:02 GMT)
Restoring the second law to classical-quantum dynamics [0.0] 線形で完全正の古典量子力学を研究する。
これらのダイナミクスがどのように構築されるかを示します。
我々は断熱に基づく熱処理を数値的に示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:00:04 GMT)
Relativistic Quantum Simulation of Hydrogen Sulfide for Hydrogen Energy via Hybrid Quantum-Classical Algorithms [0.0] 本稿では,水素エネルギー応用に関連する硫化水素(H2S)分解をモデル化するための相対論的量子シミュレーションフレームワークを提案する。
このアプローチは、ディラック・クーロン相対論的量子化学と変分量子固有解法(VQE)を統合し、ハイブリッド量子古典アーキテクチャー上に実装する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:15:02 GMT)
ROSFD: Robust Online Streaming Fraud Detection with Resilience to Concept Drift in Data Streams [0.0] ストリーミングデータの連続生成は、タイムリーな不正検出を必要とする。
伝統的なバッチ処理手法は、しばしば急速に進化する不正行為のパターンを捉えるのに苦労する。
本稿では,効果的な不正検出のためのストリーミングデータ処理の重要性を強調した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:50:23 GMT)
Quantum-Classical Comparison of B-cell Epitope Prediction Using QSVM and VQC [0.0] 我々は、古典的サポートベクトルマシン(SVM)とその量子対応である量子サポートベクトルマシン(QSVM)について検討する。
VQCはパラメータ化量子回路に基づく完全量子モデルである。
我々は,VQCが大規模で高次元のデータセットでよく動作するのに対して,QSVMは小型でノイズのないデータセットでより安定した精度を維持していることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:19:33 GMT)
Quantum theory from classical mechanics near equilibrium [0.0] 我々は、一般化されたモータ=p$と一般化された座標が消える時点において、非退化最小値を持つハミルトニアヌス$H(p,q)$によって記述された古典理論を考える。
一般化モータの平方と一般化座標の和は運動の積分であると仮定する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:14:41 GMT)
Quantum chaos on the separatrix of the periodically perturbed Harper model [0.0] 位相空間上のトーラス上の古典的周期ハミルトニアン系と関連する離散量子系との関係について検討する。
量子系に対するフロケプロパゲータの固有状態を数値計算する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:25:23 GMT)
Quantum Squeezing Effects in Coupled van der Pol Oscillators [0.0] 2つの結合ファンデルポル振動子にスキーズするハミルトニアンを導入することは、非古典効果を高め、量子相関を高め、同期力学のロバスト性を向上させることを示す。
これはウィグナー関数とパワースペクトルの分析を通じて証明され、スクイージングのないシステムと比較して著しく改善された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:33:05 GMT)
Performance of Large Language Models in Supporting Medical Diagnosis and Treatment [0.0] AI駆動システムは、膨大なデータセットを分析し、臨床医が病気を特定し、治療を推奨し、患者の結果を予測するのを支援する。
本研究は,2024年のポルトガル国立試験場において,オープンソースモデルとクローズドソースモデルの両方を含む,現代LLMの性能評価を行った。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:53:59 GMT)
Patch and Shuffle: A Preprocessing Technique for Texture Classification in Autonomous Cementitious Fabrication [0.0] パッチとシャッフル」技術は、入力画像を小さなパッチに分割し、シャッフルし、分類する前にジャンブルイメージを再構築する。
本稿では,ResNet-18 ベースのアーキテクチャを用いて,押出セメント画像のデータセット上で本手法を評価する。
パッチとシャッフルのモデルは90.64%の精度で、ベースラインは72.46%であった。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:03:21 GMT)
Out-of-equilibrium dynamics across the first-order quantum transitions of one-dimensional quantum Ising models [0.0] 逆場$g$における一次元量子イジングモデルの平衡外ダイナミクスについて検討する。
近傍のIsing鎖は周期的境界条件を持つサイズが$L$である。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:00:27 GMT)
Out of the box approach to Black hole Information paradox [0.0] ブラックホール情報損失パラドックスは半古典的な議論から生じる。
量子重力の完全な理論では、ブラックホールに崩壊する可能性のある領域は、既に混合状態によって記述されるべきである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:19:57 GMT)
Optimising Intrusion Detection Systems in Cloud-Edge Continuum with Knowledge Distillation for Privacy-Preserving and Efficient Communication [0.0] 本稿では,クラウドエッジ侵入検知における通信オーバーヘッドを低減するための知識蒸留について検討する。
実験は最先端の手法よりも大幅に改善された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:45:05 GMT)
Operatorial formulation of crimo-taxis phenomena in a street [0.0] 本稿では、量子力学の典型的なラグ演算子を用いて、クリモタキシャルと呼ばれるモデルの演算バージョンを構築する。
古典的な枠組みでは、クリモタキシーモデルは反応拡散偏微分方程式によって記述される。
1次元設定における数値シミュレーションの結果を提示し,考察した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:03:13 GMT)
Online Convex Optimization and Integral Quadratic Constraints: A new approach to regret analysis [0.0] 我々は,厳密な凸とリプシッツ・スムース目的に対する一階制約付きオンライン凸最適化アルゴリズムの動的後悔を分析した。
我々は、オンラインアルゴリズムに対する後悔の保証を提供する半確定的なプログラムを導出する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:12:29 GMT)
On the representation of stack operators by mathematical morphology [0.0] 本稿では,2値イメージを2値イメージにマップし,横断的に平均通勤するグレースケールイメージスタック演算子について紹介する。
スタック作用素は集合作用素の1-リプチッツ拡張であり、特徴的集合作用素を画像の断面と和に応用して表現できることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:14:52 GMT)
Non-Hermitian expander obtained with Haar distributed unitaries [0.0] 我々は、$d$独立およびHaar分散な$N$次元ユニタリを選択することで得られるランダムな量子チャネルを考える。
これは特異値と固有値の両方の観点からランダムな量子展開器を構築したことを示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:35:30 GMT)
Modeling and solving an integrated periodic vehicle routing and capacitated facility location problem in the context of solid waste collection [0.0] 本稿では,2つの共通廃棄物管理システム最適化問題に対処する統一最適化モデルを提案する。
これら2つの問題の統合は、それぞれがすでに大きな計算課題となっているため、文献では普通ではない。
数学的プログラミングに基づく2つの改良された正確な定式化と遺伝的アルゴリズム(GA)が提案された統一最適化モデルを解決するために提供される。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:01:12 GMT)
Maximal Magic for Two-qubit States [0.0] 古典的シミュラビリティとは最も異なる最大マジックを持つ2量子状態について検討する。
我々は、魔術と絡み合いの間の顕著な相互作用を明らかにし、最大魔術状態の絡み合いは2つの可能な値に制限される。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:12:33 GMT)
MESA: Text-Driven Terrain Generation Using Latent Diffusion and Global Copernicus Data [0.0] 我々は、手続き的な地形モデリングに代わる新しいデータ中心のMESAを提案する。
MESAはグローバルリモートセンシングデータを用いてテキスト記述から高品質な地形サンプルを生成する。
このモデルの能力は広範な実験を通じて実証され、現実的で多様な地形を生成する能力を強調している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:25:41 GMT)
Loss Functions and Metrics in Deep Learning [0.0] 本稿では,ディープラーニングにおける損失関数と性能指標の総合的なレビューを行う。
タスク固有の課題に対処するために、異なる損失関数と評価指標がどのように組み合わせられるかを示す。
経験的な振る舞いとドメインの制約に基づいて損失とメトリクスを選択したり組み合わせたりするためのベストプラクティスを強調します。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:48:47 GMT)
Laser-induced spectral diffusion and excited-state mixing of silicon T centres [0.0] ナノフォトニクスを結合した個々のシリコンT中心におけるスペクトルのゆらぎのダイナミクスについて検討した。
共振チェック方式を用いて,エミッタのリニア幅を110MHzに35倍縮小することを示した。
励起状態におけるレーザー誘起スピンミキシングを報告し、両方の現象に共通するポテンシャルメカニズムについて議論する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:09:17 GMT)
LITERA: An LLM Based Approach to Latin-to-English Translation [0.0] 本稿では,ラテン文字翻訳の課題に対処するために,LLMをベースとしたラテン-英語翻訳プラットフォームを提案する。
LITERAはラテン語の解釈と翻訳を英語に翻訳し、研究支援を行うためのモデルである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:21:20 GMT)
JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention [0.0] 残基の変化がタンパク質の安定性にどのように影響するかを理解することは 機能的なタンパク質を設計するのに重要である。
タンパク質言語モデル(PLM)の最近の進歩は、計算タンパク質分析に革命をもたらした。
我々は PLM 由来の埋め込みと双方向のクロスアテンショントランスフォーマアーキテクチャを利用するディープラーニングフレームワーク JanusDDG を紹介する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:11:58 GMT)
Ising Models with Hidden Markov Structure: Applications to Probabilistic Inference in Machine Learning [0.0] 隠れた$pm 1$スピン間のIsing相互作用と、隠れた変数と観測された変数を結合するデータ依存項を組み込んだハミルトニアンについて検討する。
具体的には、ケイリー木上のこのハミルトン多様体の変換不変ギブズ測度(TIGM)を探索する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:18:23 GMT)
Investigating cybersecurity incidents using large language models in latest-generation wireless networks [0.0] Gemma-7bモデルは、Precision = 0.89、Recall = 0.89、F1-Score = 0.89に従って、最高の結果を示す。
ネットワーク脅威のバイナリ分類器と統合された大規模言語モデルは、サイバーセキュリティインシデント調査の分野における実践的応用に大きな可能性を秘めている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:57:20 GMT)
Intrinsic Phononic Dressed States in a Nanomechanical System [0.0] 本報告では,本態性メソスコピックな振動状態の観察を行った。
我々の研究は、メソスコピック力学に関する長期にわたる洞察を提供し、量子計測にナノ力学を利用するための新しい方向性を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:15:28 GMT)
Integrating Vision and Location with Transformers: A Multimodal Deep Learning Framework for Medical Wound Analysis [0.0] 深層学習(DL)は創傷診断の強力なツールである。
位置データを提供するためにボディマップも作成され、傷の専門医が傷の場所をより効果的にラベル付けるのに役立つ。
提案モデルでは,画像データを用いた精度0.8123,画像データと創傷位置を組み合わせた精度0.8007を実現した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:39:18 GMT)
Inferring the Hubble Constant Using Simulated Strongly Lensed Supernovae and Neural Network Ensembles [0.0] 強いレンズを持つ超新星はハッブル定数の独立した測定値を得るための有望な新しいプローブである。
本研究では、重力レンズを用いたIa型超新星(glSNe Ia)を用いて、機械学習パイプラインのトレーニングを行う。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:43:18 GMT)
Improving Tropical Cyclone Forecasting With Video Diffusion Models [0.0] 熱帯サイクロン(TC)予測は,災害対策と緩和に不可欠である。
本稿では,時間的依存関係を付加的な時間的階層を通じて明示的にモデル化する,TC予測のためのビデオ拡散モデルの新たな適用法を提案する。
提案手法により,複数のフレームを同時に生成し,サイクロンの進化パターンをよりよく捉えることができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:10:57 GMT)
Improved approximation algorithms for the EPR Hamiltonian [0.0] EPRハミルトニアン(EPR Hamiltonian)は、キングによって導入された2局所量子ハミルトニアン(arXiv:2202589)の族である。
EPRハミルトニアンの基底エネルギーを計算するための時間$frac1+sqrt54$-approximationアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:08:40 GMT)
Implementing and benchmarking dynamically corrected gates on superconducting devices using space curve quantum control [0.0] 我々はIBMハードウェア上で動的に修正されたシングルキュービットゲートを設計、実験、ベンチマークする。
我々のゲートは、減衰とパルス振幅の両方のノイズを抑えるように設計されており、ゲート時間は88 nsである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 00:19:23 GMT)
Image Current Detection of Electrons in a Room-Temperature Paul Trap [0.0] マイクロ波帯における室温ポールトラップ中の電子の電流検出について報告する。
この実験を低温で実施することで、ポールトラップ内の単一電子のイメージ電流の検出と基底状態の冷却が可能になる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 01:03:15 GMT)
Holographic complexity and the Hubble tension: a quantum gravity portrayal for the large scale structure of the cosmos [0.0] 本稿では、ハッブル・レメイトル定数(H_0$)と、量子重力における時空の出現に関連するホログラフィック複雑性の関係について述べる。
このような結果は、宇宙観測のための量子重力の視点を導入することで、ハッブル宇宙の張力を理解するための重要なステップを示すことができる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:46:47 GMT)
Heat operator approach to quantum stochastic thermodynamics in the strong-coupling regime [0.0] 真空状態に関するモーメントが熱浴と交換される熱のモーメントに対応する「熱演算子」を同定する。
このことは、熱統計の統計を標準のユニタリ時間進化問題として再考する。
熱力学貯水池のチェーンマッピングを利用して, オーミックスピンボソンモデルにおける熱揺らぎを計算した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:26:45 GMT)
Hatred Stems from Ignorance! Distillation of the Persuasion Modes in Countering Conversational Hate Speech [0.0] 本研究は、説得モードを理性、感情、信頼性に蒸留する。
クローズド(複数ターン)とオープン(単ターン)の2つのタイプの会話において、人種差別、セクシズム、宗教的偏見に関する使用を評価している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:35:50 GMT)
HalluSearch at SemEval-2025 Task 3: A Search-Enhanced RAG Pipeline for Hallucination Detection [0.0] HalluSearchは、LLM(Large Language Model)出力で生成されたテキストスパンを検出するために設計されたパイプラインである。
14の異なる言語で特定およびローカライズするために、検索強化された検証と、きめ細かい事実分割を結合する。
実証的な評価によると、HaluSearchは競争力があり、英語(トップ10%)とチェコ語の両方で4位となっている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:22:30 GMT)
Function Alignment: A New Theory of Mind and Intelligence, Part I: Foundations [0.0] 本稿では,心と知性の新たな理論である機能アライメントを紹介する。
意味、解釈、類推が階層表現間の相互作用からどのように現れるかを明確にモデル化する。
それはしばしば、計算アーキテクチャ、心理学理論、さらには禅のような観念的伝統を結びつけて、規律を分割する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:44:55 GMT)
From Vulnerabilities to Remediation: A Systematic Literature Review of LLMs in Code Security [0.0] 大規模言語モデル(LLM)は、様々なプログラミングタスクを自動化する強力なツールとして登場した。
LLMはプログラマが知らない脆弱性を導入する可能性がある。
コードを解析する際には、明確な脆弱性を見逃したり、存在しない脆弱性を通知する可能性がある。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 10:36:33 GMT)
Frequency Is What You Need: Word-frequency Masking Benefits Vision-Language Model Pre-training [0.0] 視覚言語モデル(VLM)は、トレーニングセットのサイズを小さくできれば、より効率的にトレーニングすることができる。
最近の研究は、様々なアプローチを用いたVLMトレーニングにおけるテキストマスキングの利点を示している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:55:19 GMT)
Frame-dependent coherence of a quantum state [0.0] POVMベースのコヒーレンスの定義はよく研究されている。
キュービット系とマルチキュービット系のコヒーレンスをフレーム不変で定義する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:41:51 GMT)
Flexibility of German gas-fired generation: evidence from clustering empirical operation [0.0] 我々は、その経験的柔軟性に基づいて、ドイツの国民ガス発生量の60%以上(100MWp以上の世代単位)をクラスタリングする。
我々は,2019年から2023年にかけて,新しい深層学習手法を用いて,サンプル単位の時間分割処理を行った。
我々は,ピークユニットの2つのクラスタと非ピークユニットの2つのクラスタを同定する。
サンプルの約半数である非話者ユニットは、ピークよりも実験的に柔軟性が低く、サンプルの83%以上を生産する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:04:01 GMT)
Exact simulation of realistic Gottesman-Kitaev-Preskill cluster states [0.0] 本稿では,現実的なGottesman-Kitaev-Preskill(GKP)クラスタ状態をシミュレーションし,特徴付ける手法について述べる。
キャット状態の育種による単一モードGKP状態の生成と,線形光回路およびホモダイン測定による多モードGKPクラスター状態の形成について検討する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:05:06 GMT)
Enhancing Ultra-Low-Bit Quantization of Large Language Models Through Saliency-Aware Partial Retraining [0.0] トレーニング後の量子化は、精度の低下を犠牲にして、モデルサイズを効率的に削減する。
量子化学習(quantization-aware training)は、精度を向上するが、リソース集約である。
本稿では,ApiQ上に構築した超低ビット量子化手法を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 19:31:21 GMT)
Enhancing Image Restoration through Learning Context-Rich and Detail-Accurate Features [0.0] 本稿では,空間領域と周波数領域の知識をシームレスに統合し,競合する目的を最適にバランスさせるマルチスケール設計を提案する。
具体的には、空間領域からのマルチスケール情報をキャプチャするだけでなく、周波数領域における画像復元のための最も有用なコンポーネントを選択するハイブリッドスケール周波数選択ブロック(HSFSBlock)を開発する。
我々のモデルは、最先端のアルゴリズムに匹敵するパフォーマンスレベルを達成する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:46:10 GMT)
Energy-time and time-bin entanglement: past, present and future [0.0] 絡み合いは多くの量子情報処理において重要なリソースである。
本稿では、エネルギー時間と時間ビンの絡み合いの始まりを概説する。
次に、今後の量子ネットワークにおいて、エネルギー時間と時間ビンの絡み合いが持つ重要な場所について論じる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:40:04 GMT)
Encryption scheme based on Automorphism Group of Hermitian Function Field with Homomorphic Encryption [0.0] 我々は,Hermitian関数フィールドベースの暗号方式を,同型暗号機能で拡張する。
攻撃の複雑さと暗号化されたメッセージサイズは、グループの順序と直接相関する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:39:40 GMT)
Emotional Strain and Frustration in LLM Interactions in Software Engineering [0.0] 大規模言語モデル(LLM)は、ソフトウェア工学における日々のタスクにますます統合されています。
フラストレーションは、ストレスとバーンアウトにエスカレートした場合、エンジニアの生産性と幸福に悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 09:55:47 GMT)
Efficient High-Dimensional Entangled State Analyzer with Linear Optics [0.0] 線形光干渉計と補助フォトニック状態を用いて, 効率的な高次元交絡状態解析器を実現する方法を示す。
補助状態の絡み合いの度合いは、指数的に小さなシュミットランクによって定量化される以前のプロトコルよりもはるかに小さい。
これは、現在のハードウェアで実験的なデモを行う道を開くものだ。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:57:16 GMT)
Efficient Brain Tumor Segmentation Using a Dual-Decoder 3D U-Net with Attention Gates (DDUNet) [0.0] がんは世界中で死亡する主要な原因の1つであり、その多くの形態の中で、脳腫瘍は特に悪名高い。
人工知能の最近の進歩は、正確な腫瘍分割を行う医療専門家を支援することに大きな期待を示している。
本稿では,MRI スキャンによる脳腫瘍の分節化に特化して設計された,アテンションゲート型スキップ接続により拡張された新しいデュアルデコーダ U-Net アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:45:33 GMT)
Dynamically assisted Klein tunneling in the Furry picture [0.0] 時間的に振動する電場下での相対論的フェルミオンの波束の1次元散乱について論じる。
いわゆるクライン領域が存在しない場合でも、正周波の入射波が電位ステップ以下の負周波領域を貫通することができることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 06:25:07 GMT)
Demo: ViolentUTF as An Accessible Platform for Generative AI Red Teaming [0.0] ViolentUTFは、技術分野の専門家や学生を技術分野の専門家と一緒に支援することを目的としている。
ViolentUTFは、米国政府の大部門でLLMベースのフラッグシップ製品の評価に使用されている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 18:03:25 GMT)
Deciphering scrolls with tomography: A training experiment [0.0] 本稿では,古代美術品の獲得とバーチャルリカバリの過程をシミュレートする教育実験室を提案する。
我々は, 可視光を使って有害なX線を代替する実験装置を開発し, 学生がプリントされたテキストで巻いたシートを仮想的に再構築できる, 実用的ソフトウェアパイプラインを開発した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:20:21 GMT)
Cryptographic Strengthening of MST3 cryptosystem via Automorphism Group of Suzuki Function Fields [0.0] 本稿では,鈴木関数場の自己同型群に基づくMST3暗号系の実装について述べる。
暗号解析の複雑さと暗号化用メッセージのサイズは、鈴木グループのMST3暗号システムよりも大きい。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:53:21 GMT)
Cross-talk in superconducting qubit lattices with tunable couplers - comparing transmon and fluxonium architectures [0.0] 量子ビット間のクロストークは、超伝導量子プロセッサをスケーリングする上で大きな課題の1つである。
アイドル状態のキュービットを分離するために設計された調整可能なカプラを含む、異なるアーキテクチャを比較します。
成層圏外におけるトランスモン量子ビットについて, 調整可能なC-シャントフラックスカップラは, 調整可能なトランスモンよりもZZ相互作用を緩和する上で, 極めて効率的であることが確認された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:07:35 GMT)
Convergence of the denoising diffusion probabilistic models for general noise schedules [0.0] 本研究は,拡散確率モデル(DDPM)のオリジナルの定式化に関する理論的解析である。
離散時間DDPMサンプリングアルゴリズムの分布と対象データ分布との間の全変動距離に対して、明示的な上限を導出する。
サンプリングシーケンスは、有限時間間隔での逆時間微分方程式(SDE)の指数積分器型近似として現れる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:36:15 GMT)
Contribute to balance, wire in accordance: Emergence of backpropagation from a simple, bio-plausible neuroplasticity rule [0.0] 我々は,脳にBPを実装するための潜在的なメカニズムを提供する新しい神経可塑性規則を導入する。
我々は,我々の学習規則が階層型ニューラルネットワークのBPを近似なしで正確に再現できることを数学的に証明した。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:34:26 GMT)
Continual learning for rotating machinery fault diagnosis with cross-domain environmental and operational variations [0.0] この研究は、時間とともに構造を共有するドメイン間で学習できる連続的なディープラーニングアプローチを提案する。
破滅的な忘れ物、塑性の欠如、前方移動、後方移動の4つの課題に対処する。
実験では、平均的なドメイン精度(88.96%まで)が、インクリメンタルな環境よりも低い。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:02:32 GMT)
Container-level Energy Observability in Kubernetes Clusters [0.0] 我々は、特定のユースケースシナリオに対するKeplerの代替としてKubeWattを開発します。
我々は、ケプラーが提示したエネルギー利用指標が満足のいくレベルには達していないと結論づける。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 20:50:34 GMT)
Comment on "Consequences of the single-pair measurement of the Bell parameter" [0.0] ベル-CHSHの不等式はベルパラメータ全体に基づいていないので、これらの実験は経験的実験とは無関係である。
ベルパラメータ全体を測定するこれらの新しい実験の物理的意味は、異なる解釈が可能であることを指摘している。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:50:30 GMT)
Collective Superradiance: Estimating the Peak Emission Rate and Time [0.0] 我々は,初期完全励起量子エミッタアンサンブルのピーク放出速度と時間を評価するための,コンパクトで解析的な式を提案する。
これらの公式は、実対称$N×N$行列の固有値の分散にのみ依存する。
本研究では, 自由空間, 固体, 導波路貯水池など, 様々な環境におけるこれらの結果の汎用性を実証する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:51:42 GMT)
Characterising quantum measurement through environmental stochastic entropy production in a two spin 1/2 system [0.0] 量子状態拡散は、その環境との相互作用の結果、量子系の固有状態への連続的および漸進的な崩壊と表現できる枠組みである。
単粒子測定または全zスピン成分S_zの測定を行う2つのスピン1/2粒子の系を考える。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 12:25:20 GMT)
Characterisation of a quantum bus between two driven qubits [0.0] 我々は、$sqrtimathrmSWAP$-gateを実装するために、駆動量子ビットを高調波発振器に結合する。
我々は、高調波発振器の共振周波数のシフトを検出することにより、量子ビット読み出し機構を解析する。
本研究は,実験装置における高忠実度量子ゲートの実現を導くものである。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:25:23 GMT)
Cat states carrying long-range correlations in the many-body localized phase [0.0] 強相関の強いスピン対が系全体を横断する稀な非定型事象について検討した。
予想外の強い障害、すなわち、標準的な推定値が不安定性の検出に失敗する体制で発生する。
本稿では, システムスパンニングの絡み合いを示す新しい固有状態のクラスについて, 単純で汎用的な解析的記述を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:56:04 GMT)
Can LLMs Assist Expert Elicitation for Probabilistic Causal Modeling? [0.0] 本研究では,構造化因果知識を抽出するための人間専門家の勧誘の代替として,Large Language Models (LLMs) の可能性について検討する。
LLMは因果構造、特にベイズネットワーク(BN)を生成し、従来の統計手法と比較した。
LLMが生成したBNは、専門家によって導かれ統計的に生成されたBNよりも低いエントロピーを示し、予測の信頼性と精度が示唆された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 16:45:52 GMT)
Building Trustworthy Multimodal AI: A Review of Fairness, Transparency, and Ethics in Vision-Language Tasks [0.0] 本稿では,マルチモーダル人工知能(AI)システムの信頼性について概説する。
これらのシステムにおける公平性、透明性、倫理的影響に関連する課題に対処する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 21:10:25 GMT)
Beyond Poincaré Stresses: A Modern Quantum Field Theory Take on Hydrogen's Electromagnetic Mass [0.0] 我々は、現代の量子場理論の観点から、長年の電磁質量問題を再考する。
有効電磁質量は従来の関係である$E/c2$から逸脱することを示す。
我々は、量子場理論の結果とシュル・オーディンガー方程式の高精度な予測とを対比する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 03:27:37 GMT)
Artificial Neural Network for Estimation of Physical Parameters of Sea Water using LiDAR Waveforms [0.0] フルウェーブフォームLiDARのポテンシャルは、単なる高さ推定や3D再構成よりもはるかに大きい。
既存のLiDARデータ解析の分野では、逆モデリングによる深さ推定や対数強度の回帰、減衰係数の近似のための深さ推定などがある。
本研究では,LIDARデータ解析におけるパラメータ推定のためのニューラルネットワークに基づく新しい解を提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 15:58:10 GMT)
Anchors no more: Using peculiar velocities to constrain $H_0$ and the primordial Universe without calibrators [0.0] 超新星型Iaデータを用いたハッブルパラメータ$H_0$と原始パワースペクトル$A_mathrms$を制約する新しい手法を開発した。
これにより、距離アンカーのないSNIaデータに基づく大規模構造の新しい独立プローブが得られる。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 17:40:18 GMT)
Analyzing reduced density matrices in SU(2) Chern-Simons theory [0.0] 我々は、$T_p,p$トーラスリンクに関連する量子状態に焦点を当てる。
これらの還元密度行列の特性は有理係数のモニックであることが示される。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 11:04:30 GMT)
Adaptive Sensor Steering Strategy Using Deep Reinforcement Learning for Dynamic Data Acquisition in Digital Twins [0.0] 本稿では,デジタル双生児の予測精度と意思決定支援能力を高めるために,深層強化学習に基づくセンサステアリング手法を提案する。
提案手法は、デジタルツインパラダイム内のセンサ配置に適応的なフレームワークを提供することにより、この制限に対処する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 14:11:00 GMT)
AMBER -- Advanced SegFormer for Multi-Band Image Segmentation: an application to Hyperspectral Imaging [0.0] 本稿では,マルチバンド画像セグメンテーション用に設計された高度なSegFormerであるAMBERを紹介する。
AMBERは3次元の畳み込み、カスタムカーネルサイズ、Funnelizerレイヤを組み込むことで、オリジナルのSegFormerを強化している。
PRISMA衛星の3つのベンチマークデータセットとデータセットを用いて行った実験により、AMBERは、全体的な精度、Kappa係数、平均精度で従来のCNNベースの手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:21:38 GMT)
A Practical Framework for Assessing the Performance of Observable Estimation in Quantum Simulation [0.0] 本稿では,量子シミュレーションアルゴリズムの性能を評価するためのフレームワークを提案する。
我々のフレームワークはアルゴリズム最適化のエンドツーエンドのデモを提供する。
パウリ群法による27.1%の誤差低減と,最適化されたショット分布戦略による37.6%の改善を示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 02:23:01 GMT)
A Monte Carlo Tree Search approach to QAOA: finding a needle in the haystack [0.0] 変分量子アルゴリズム(VQA)は、短期量子ハードウェアの限られた能力に対応するために設計された、ハイブリッド量子古典法の一種である。
本稿では,正規パラメータパターンの活用が決定木構造に深く影響し,フレキシブルかつノイズ耐性のある最適化戦略を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 08:52:04 GMT)
A Benchmarking Environment for Worker Flexibility in Flexible Job Shop Scheduling Problems [0.0] 生産スケジューリングにおいて、フレキシブルジョブショップスケジューリング問題(FJSSP)は、一連の操作を最適化し、それぞれの処理時間を異なるマシンに割り当てることを目的としている。
結果として生じる問題はFlexible Job Shop Scheduling Problem with Worker Flexibility (FJSSP-W)と呼ばれる。
本稿では、一般に受け入れられているFJSSPインスタンス402のコレクションを示し、労働者の柔軟性で拡張するアプローチを提案する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 13:54:04 GMT)
"Thinking Quantum": Lectures on Quantum Theory [0.0] 講義は完全に自己完結しており、必要な数学的背景はすべて含んでいる。
量子論、量子ビット、重ね合わせ、絡み合い、不確実性原理、量子ゲート、ユニタリ変換、進化などのトピックをカバーしている。
講義には163の計算演習と証明に基づく問題も含まれている。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 07:34:06 GMT)
$q$-Heisenberg Algebra in $\otimes^{2}-$Tensor Space [0.0] テンソル積空間 $otimes2$ に$q$-ハイゼンベルク代数を導入する。
我々の結果は、$q$の変形代数における既知の構成を拡張し、非可換な設定における函数解析に関する新しい洞察を提供する。
論文参考訳(メタデータ) (Mon, 14 Apr 2025 22:26:09 GMT)