Impact of Noisy Supervision in Foundation Model Learning [91.6] 本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:07:00 GMT)
Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model [90.9] 本技術報告は,映像生成基盤モデルをトレーニングするための費用効率のよい戦略を提示する。
約70億のパラメータを持つ中規模の研究モデルであるSeaweed-7Bを,665,000 H100 GPU時間を用いてスクラッチからトレーニングした。
適度な計算資源で訓練されているにもかかわらず、Seaweed-7Bは高い競争力を発揮している。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:31:30 GMT)
BLAB: Brutally Long Audio Bench [90.2] Brutally Long Audio Bench (BLAB) は、音像定位、時間推定、感情、計数タスクについて、音声のLMを評価するロングフォームオーディオベンチマークである。
BLABは833時間以上の多様なフル長の音声クリップで構成されており、それぞれに人間の注釈付き、テキストベースの自然言語の質問と回答が組み合わされている。
BLAB 上で6つのオープンソースおよびプロプライエタリなオーディオ LM を評価し,Gemini 2.0 Pro や GPT-4o などの先進的なモデルを含む,すべてのタスクが苦労していることを確認した。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:28:53 GMT)
LUSIFER: Language Universal Space Integration for Enhanced Multilingual Embeddings with Large Language Models [89.1] LUSIFERは,LLMをベースとした多言語タスクの埋め込みモデルに,多言語監視を必要とせずに適用可能なゼロショット方式である。
LUSIFERのアーキテクチャは多言語エンコーダを組み、言語ユニバーサル学習者として機能し、埋め込み固有のタスクに最適化されたLLMベースの埋め込みモデルと組み合わせている。
5つの主要な埋め込みタスク、123の多様なデータセット、14言語にわたるカバレッジを含む新しいベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:01:36 GMT)
APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay [86.0] APIGen-MTは検証可能で多様なマルチターンエージェントデータを生成するフレームワークである。
xLAM-2-fc-r 級数で 1B から 70B のパラメータを持つモデル群を訓練する。
我々のモデルは、$tau$-benchとBFCLベンチマークでGPT-4oやClaude 3.5のようなフロンティアモデルより優れている。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:54:13 GMT)
Learning 3D Persistent Embodied World Models [84.4] 我々は、以前に生成されたコンテンツの明示的なメモリを備えた、新しい永続的エンボディド・ワールドモデルを導入する。
映像拡散モデルでは, 映像拡散モデルにより, エージェントの今後の観察のRGB-D映像が予測される。
この生成は、環境の永続的な3Dマップに集約される。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:17 GMT)
Direct Retrieval-augmented Optimization: Synergizing Knowledge Selection and Language Models [83.9] 本稿では,2つの主要コンポーネントのエンドツーエンドトレーニングを可能にするDROという,直接検索拡張最適化フレームワークを提案する。
DROは、 (i) 文書置換推定と (ii) 再重み付けされ、段階的に改善されたRAGコンポーネントの2つのフェーズの間で交代する。
理論解析により,DROは強化学習における政策段階的な手法に類似していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:54:53 GMT)
RM-R1: Reward Modeling as Reasoning [81.5] Reward Reasoning Models (ReasRMs) を新たに導入する。
我々は推論指向のトレーニングパイプラインを提案し、ReasRMのファミリーであるRM-R1を訓練する。
本モデルでは,複数のベンチマークにおいて,生成型RMの最先端あるいは近近性能を実現する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:11:12 GMT)
BrushEdit: All-In-One Image Inpainting and Editing [76.9] BrushEditは、インペイントベースの命令誘導画像編集パラダイムである。
本研究では,MLLMとデュアルブランチ画像の描画モデルを統合することで,自由形式の命令編集を可能にするシステムを提案する。
本フレームワークは,MLLMとインパインティングモデルを効果的に組み合わせ,7つの指標で優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:31:12 GMT)
MetaScenes: Towards Automated Replica Creation for Real-world 3D Scans [76.4] EAI(Embodied AI)の研究は、スキル獲得、シミュレート・トゥ・リアル・トランスファー、一般化をサポートするために、高品質で多様な3Dシーンを必要とする。
既存のデータセットは、このプロセスがアーティスト主導の設計に大きく依存していることを示している。
実世界のスキャンから構築した大規模でシミュレート可能な3DシーンデータセットであるMetaScenesを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:13:25 GMT)
Tevatron 2.0: Unified Document Retrieval Toolkit across Scale, Language, and Modality [74.6] このデモペーパーでは、Tevatronツールキットの重要な特徴、学界と産業の橋渡しについて取り上げている。
強い多言語・多モーダルな有効性を実現するための密集型検索器について紹介する。
私たちはOmniEmbedもリリースしています。私たちの知る限り、テキスト、画像ドキュメント、ビデオ、オーディオ検索を統一する最初の埋め込みモデルです。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:52:49 GMT)
ParaICL: Towards Parallel In-Context Learning [74.4] 大規模言語モデル(LLM)が自然言語処理の標準となっている。
インコンテキスト・ラーニング(ICL)は、いくつかの実演例の選択に依存している。
パラレルインコンテキスト学習(ParaICL)という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:49:56 GMT)
NTIRE 2025 Challenge on UGC Video Enhancement: Methods and Results [73.2] 本稿では,NTIRE 2025 Challenge on Video Enhancementについて概説する。
このチャレンジは、ユーザー生成した150のコンテンツビデオのセットを構築した。
参加者の目標は、このような映像の視覚的品質を向上させるアルゴリズムを開発することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:06:11 GMT)
LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models [71.8] LMMS-EVALは50以上のタスクと10以上のモデルを持つ統一的で標準化されたマルチモーダルベンチマークフレームワークである。
LMMS-EVAL LITEは、カバー範囲と効率の両方を重視したプルーニング評価ツールキットである。
マルチモーダルなLIVEBENCHは、ニュースやオンラインフォーラムを継続的に更新し、野生におけるモデルの一般化能力を評価する。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:48:45 GMT)
Aguvis: Unified Pure Vision Agents for Autonomous GUI Interaction [69.6] Aguvisは、自律的なGUIエージェントのためのビジョンベースのフレームワークである。
クロスプラットフォームのインタラクションを標準化し、内部モノローグによる構造化推論を取り入れている。
オフラインおよび実世界のオンラインベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:17:20 GMT)
Active Data Curation Effectively Distills Large-Scale Multimodal Models [66.2] 知識蒸留(KD)は、大規模モデルをより小さなものに圧縮するデファクトスタンダードである。
本研究では, 対照的なマルチモーダル事前学習のための効果的な蒸留法として, 能動的データキュレーションの代替として, 簡単なアプローチを探求する。
我々の単純なオンラインバッチ選択方法であるACIDは、さまざまなモデル、データ、計算構成において、強力なKDベースラインよりも優れています。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:25:01 GMT)
SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning [62.2] MCIT (Multimodal Continual Instruction Tuning) は,Multimodal Large Language Models (MLLM) が,悲惨なことを忘れずに,新たなタスクを段階的に学習できるようにすることを目的としている。
表面的な忘れは、モデルの知識が真に失われるのではなく、以前のタスクに対する応答が期待されたフォーマットから逸脱している場合を指す。
対照的に、本質的な忘れは、モデルが正しくフォーマットされているが、事実的に不正確な答えを提供し、真の知識の喪失を示す状況を指す。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:09:41 GMT)
No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves [59.8] 自己表現アライメント(Self-Representation Alignment, SRA)は, 自己蒸留法により表現指導を得る単純な方法である。
実験結果から,SRAをDiTsおよびSiTsに適用すると一貫した性能向上が得られた。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:58:05 GMT)
An Efficient Hybrid Key Exchange Mechanism [59.0] textscCHOKEは、コードベースのハイブリッドキーカプセル化機構(KEM)である
我々は,各KEMを少なくとも1回は使用しなければならないという要件の下で,構築の通信コストが最適であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:28:46 GMT)
ForesightNav: Learning Scene Imagination for Efficient Exploration [57.5] 人間の想像力と推論に触発された新しい探索戦略であるForesightNavを提案する。
提案手法は,ロボットエージェントに,未探索領域の占有状況や意味的詳細などの文脈情報を予測する能力を備える。
本研究では,Structured3Dデータセットを用いた想像力に基づくアプローチの有効性を検証し,シーン形状の予測において,正確な占有率予測と優れた性能を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:53:10 GMT)
SoK: Stealing Cars Since Remote Keyless Entry Introduction and How to Defend From It [57.2] 本稿では、RKE(Remote Keyless Entry)とPKES(Passive Keyless Entry and Start)に関するSOK(Systematization of Knowledge)を提供する。
我々の知る限り、これはRKEシステムに関する初めての総合的なSOKであり、そのようなシステムの進化とセキュリティ状態を理解するための特定の研究課題に対処する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:07:23 GMT)
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning [56.0] 我々は(蒸留に頼らずに)強化学習による視覚言語モデルの遅い思考能力の向上を目指す。
我々は、RLトレーニングにおけるロールアウトの最後に再考トリガートークンを付加し、自己回帰推論ステップを明示的に実施する強制再考(Forced Rethinking)を導入する。
我々のモデルであるVL-Rethinkerは、MathVista、MathVerseの最先端スコアを80.4%、63.5%に向上させています。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:49:32 GMT)
Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias [55.7] 本稿では,線形系を解くためにエントロピックミラー降下を適用することに焦点を当てる。
収束解析の主な課題は、領域の非有界性に起因する。
制限的な仮定を課さずにこれを克服するために、Polyak型階段の変種を導入する。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:33:18 GMT)
Task-Oriented Semantic Communication in Large Multimodal Models-based Vehicle Networks [55.3] LMMに基づく車両用AIアシスタントLarge Language and Vision Assistant(LLaVA)について検討する。
計算要求を減らし、応答時間を短縮するため、LLaVAの画像スライシングを最適化し、ユーザにとって最も関心のある領域に選択的にフォーカスする。
交通シナリオに対する視覚質問応答(VQA)データセットを構築し,有効性を評価する。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:18:47 GMT)
Generating Narrated Lecture Videos from Slides with Synchronized Highlights [55.2] 本稿では,静的スライドをビデオ講義に変換するプロセスを自動化するエンド・ツー・エンドシステムを提案する。
このシステムは、動的視覚ハイライトと正確に同期されたAI生成ナレーションを特徴とするビデオ講義を合成する。
そこで本研究では,1000個のサンプルを手動でアノテートしたスライドデータセットを用いた技術評価により,システムの有効性を実証する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:51:53 GMT)
Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing [55.2] 本研究では、AI-Polished-Text Evaluationデータセットを用いて、12の最先端AIテキスト検出器を体系的に評価する。
我々の発見によると、検出器は、最小限に洗練されたテキストをAI生成としてフラグ付けし、AIの関与度を区別し、古いモデルや小さなモデルに対するバイアスを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:57:24 GMT)
Towards Dataset Copyright Evasion Attack against Personalized Text-to-Image Diffusion Models [52.9] データセットのオーナシップ検証(DOV)を損なうよう特別に設計された最初の著作権回避攻撃を提案する。
CEAT2Iは, 試料検出, トリガー同定, 効率的な透かし除去の3段階からなる。
実験の結果,CEAT2I はモデル性能を保ちながら DOV 機構を効果的に回避できることがわかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:51:55 GMT)
Automatic Proficiency Assessment in L2 English Learners [51.7] 英語の第二言語習熟度(L2)は通常、英語の教師や専門家の評価者によって知覚的に評価される。
本稿では, 音声信号と対応文字の双方に対処し, 総合的なL2習熟度評価のための深層学習手法について検討する。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:36:03 GMT)
T2S: High-resolution Time Series Generation with Text-to-Series Diffusion Models [51.1] 自然言語と時系列のギャップを埋める拡散ベースのフレームワークであるText-to-Series (T2S)を紹介した。
T2Sは長さ適応型変分オートエンコーダを用いて、様々な長さの時系列を一貫した潜伏埋め込みに符号化する。
我々は、T2Sを複数の長さでインターリーブされたパラダイムで訓練し、任意の所望の長さのシーケンスを生成する。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:22:54 GMT)
VAEmo: Efficient Representation Learning for Visual-Audio Emotion with Knowledge Injection [50.6] 本稿では,外部知識注入を用いた感情中心型VA表現学習のための効率的なフレームワークであるVAEmoを提案する。
VAEmoは、コンパクトな設計で最先端のパフォーマンスを実現し、統合されたクロスモーダルエンコーディングと感情認識のセマンティックガイダンスの利点を強調している。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:00:51 GMT)
How Does Audio Influence Visual Attention in Omnidirectional Videos? Database and Model [50.2] 本稿では,全方向ビデオ(ODV)における音声・視覚的注意を主観的視点と客観的視点の両方から包括的に検討する。
AVS-ODVデータベースに基づく新たなベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:18:50 GMT)
Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras [49.8] ハイパーコンプレックス画像処理は、代数的および幾何学的原理を含む統一パラダイムで従来の手法を拡張している。
このワークル平均は、自然・生体画像解析のための四元数と2次元平面(四元数 - ピクセルを表す - を2次元平面に分割する)を分割する。
提案手法は、画像の自動処理パイプラインの一部として、カラー外観(例えば、代替リフレクションやグレースケール変換)と画像コントラストを規制することができる。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:20:22 GMT)
Variational diffusion transformers for conditional sampling of supernovae spectra [49.2] 本報告では,光曲線観測に基づく拡散モデルであるDiTSNe-Iaを導入し,SNe Iaのスペクトルの多様性を再現する訓練を行った。
放射光伝達シミュレーションによる現実的な光曲線とスペクトルの実験において、DiTSNe-Iaは広く使用されているSALT3テンプレートよりもはるかに正確な再構成を行う。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:52:32 GMT)
How Transformers Learn Regular Language Recognition: A Theoretical Study on Training Dynamics and Implicit Bias [48.9] 我々は「偶対」と「パリティチェック」と呼ばれる正規言語認識のカテゴリにおける2つの代表的タスクに焦点をあてる。
我々のゴールは、注意層と線形層からなる一層トランスフォーマーが、これらの課題をいかに解決するかを探求することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:08:55 GMT)
Recursive Decomposition with Dependencies for Generic Divide-and-Conquer Reasoning [48.8] 本稿では,Recursive Decomposition with Dependencies (RDD)を提案する。
RDDは、タスク固有のガイダンスがなくても、新しい問題クラスに直接適用することができる。
提案手法は,それぞれ6つの難易度を持つ2つのベンチマークと,コンテキスト内の2つの設定で評価する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:24:20 GMT)
LMME3DHF: Benchmarking and Evaluating Multimodal 3D Human Face Generation with LMMs [48.5] LMME3DHFは3DHFの評価基準として,品質および信頼性スコア予測,歪み認識型視覚質問応答,歪み認識型サリエンシ予測を提案する。
実験結果から, LMME3DHFは, 従来の手法を上回り, 人間の顔の精度を正確に予測できることがわかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:07:30 GMT)
The Art of Repair: Optimizing Iterative Program Repair with Instruction-Tuned Models [48.1] 複数出力の生成と複数ラウンドの反復のバランスをとるAPRパイプラインについて検討する。
3つのサイズ(1K, 30K, 65K)と2つのテクニック(フルファインチューニングとLoRA)を持つAPRデータセット上で各モデルを微調整する。
その結果,微調整データセットのごく一部(1%)しか使用せず,最大78%の改善が達成できた。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:06:51 GMT)
Incentivizing Inclusive Contributions in Model Sharing Markets [47.7] 本稿では,包括的でインセンティブの高い個人化フェデレーション学習(iPFL)を提案する。
iPFLは、データを公開せずにパーソナライズされたモデルを協調的にトレーニングするために、さまざまな目的でデータホルダーにインセンティブを与える。
11のAIタスクに関する実証研究は、iPFLが常に最高の経済効果を達成していることを示している。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:45:26 GMT)
Caught in the Web of Words: Do LLMs Fall for Spin in Medical Literature? [47.4] 出版インセンティブは、実験結果が同等であっても、研究者に「ポジティブ」な発見を提示することを奨励する。
スピンは臨床医のエビデンス解釈に影響を与え、患者のケア決定に影響を及ぼす可能性がある。
本研究は,大規模言語モデルによる試験結果の解釈がスピンに影響しているかどうかを問うものである。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:11:20 GMT)
NeurCross: A Neural Approach to Computing Cross Fields for Quad Mesh Generation [46.5] 計算機支援設計・工学における数値シミュレーションにおいて,四面体メッシュ生成は重要な役割を担っている。
高品質な四角形を作るには、通常4つの重要な基準を満たす必要があります。
クロスフィールドとニューラル符号距離関数を同時に最適化する新しいフレームワークNeurCrossを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:01:46 GMT)
LISAT: Language-Instructed Segmentation Assistant for Satellite Imagery [45.9] 複雑なリモートセンシングシーンを記述した視覚言語モデルであるLISAtを紹介する。
我々は、9,205枚の画像に27,615個のアノテーションを付加した新しいジオ空間推論・セグメンテーションデータセット、GRESでLISAtをトレーニングした。
LISAtは、セグメンテーションタスクを143.36%(gIoU)の精度で、最先端のオープンドメインモデルより優れている
論文参考訳(メタデータ) (Mon, 05 May 2025 17:56:25 GMT)
Bridging wire and gate cutting with ZX-calculus [45.2] 理想的大域的ユニタリの分解は、ZX-計算を拡大して図式的に得られることを示す。
我々は、マルチキュービット制御Z(MCZ)ゲートの分解を、任意の数のキュービットとパーティションに対して$3$に等しい1$ノルムで改善した。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:24:44 GMT)
Scaling of Stochastic Normalizing Flows in $\mathrm{SU}(3)$ lattice gauge theory [45.0] 非平衡マルコフ連鎖モンテカルロシミュレーションは、ターゲット確率分布からのサンプルに対するジャージンスキーの等式に基づくよく理解されたフレームワークを提供する。
平衡外進化はフローベースアプローチの同じ枠組みを共有しており、自然に正規化フロー(SNF)と呼ばれる新しいアーキテクチャに結合することができる。
4次元における$mathrmSU(3)$の格子ゲージ理論に対するSNFの最初の実装は、非平衡モンテカルロ更新の間にゲージ同変層を導入することで定義される。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:01:32 GMT)
Non-Hermitian topology and skin modes in the continuum via parametric processes [45.0] エルミート的非局所パラメトリックペアリング法は非エルミート的トポロジーやスキンモードを誘導できることを示す。
局所散逸により安定化された本モデルでは, 分散に傾斜したダイアボリックラインを生じる例外的な点を明らかにする。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:38:20 GMT)
AutoLibra: Agent Metric Induction from Open-Ended Feedback [44.9] AutoLibraは、オープンな人間のフィードバックを変換するエージェント評価のためのフレームワークである。
より具体的なエージェント評価指標を誘導するAutoLibraの能力を実験的に示す。
AutoLibraが引き起こすメトリクスは、タスクの成功率よりもプロンプトエンジニアリングの目標として役立ちます。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:47:49 GMT)
Easy-access online social media metrics can foster the identification of misinformation sharing users [41.9] 高いツイート頻度は共有コンテンツの事実性の低さと正に関連しているのに対し、アカウント年齢はそれと負に関連していることがわかった。
以上の結果から,これらのソーシャル・ネットワークの指標を頼りにすることで,誤情報を拡散しやすいユーザを早期に識別する,低障壁なアプローチが実現する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:03:05 GMT)
Assessing non-Gaussian quantum state conversion with the stellar rank [41.9] 状態変換は量子情報処理における基本的なタスクである。
本稿では,ガウス状態変換を近似的に評価するためのフレームワークを提案する。
近似的条件と確率的条件の両方の下でガウス状態変換のバウンダリを導出する。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:37:51 GMT)
RGS-DR: Reflective Gaussian Surfels with Deferred Rendering for Shiny Objects [40.8] RGS-DRは光沢・反射性オブジェクトを再構成・描画するための新しい逆レンダリング手法である。
フレキシブルなリライトとシーン編集をサポートする。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:14:51 GMT)
Hypothesis testing and Stein's lemma in general probability theories with Euclidean Jordan algebra and its quantum realization [40.4] スタインの補題が持つ数学的最小構造について検討する。
EJA が生成する任意の GPT モデルにおいて,スタインの補題が証明される。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:11:47 GMT)
SSTFormer: Bridging Spiking Neural Network and Memory Support Transformer for Frame-Event based Recognition [40.1] 本稿では,RGBフレームとイベントストリームを同時に融合してパターンを認識することを提案する。
RGB-Eventベースの分類データセットが不足しているため、大規模なPokerEventデータセットも提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:01:35 GMT)
Ensemble Kalman filter for uncertainty in human language comprehension [39.8] 文理解のためのベイズ的枠組みを提案し,不確実性を定量化するためにアンサンブルカルマンフィルタ(EnKF)の拡張を適用した。
ベイジアン逆問題として言語理解をフレーミングすることにより、不確実性の表現に関して人文処理を反映するSGモデルの能力を向上する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:56:12 GMT)
Firewalls to Secure Dynamic LLM Agentic Networks [39.3] 本稿では,適応性,セキュリティ,プライバシのバランスをとる制約付きLLMエージェントネットワークの実用設計を提案する。
我々のフレームワークは、以前のシミュレーションからタスク固有のルールを自動で構築し、更新し、ファイアウォールを構築します。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:50:10 GMT)
Ming-Lite-Uni: Advancements in Unified Architecture for Natural Multimodal Interaction [39.0] Ming-Lite-Uniは、統一されたビジュアルジェネレータとマルチモーダル自動回帰モデルを備えたオープンソースのフレームワークである。
Ming-Lite-Uniはアルファ段階にあり、間もなく改良される。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:56:12 GMT)
KG-Retriever: Efficient Knowledge Indexing for Retrieval-Augmented Large Language Models [38.9] KG-Retrieverと呼ばれる階層的な知識検索機能を備えた新しい知識グラフベースのRAGフレームワークを提案する。
グラフ構造の結合性は、ドキュメント内およびドキュメント間接続性を強化するために完全に活用されている。
近隣の文書からの粗粒度の協調情報と知識グラフからの簡潔な情報により、KG-Retrieverは5つの公開QAデータセットに対して顕著な改善を達成している。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:26:24 GMT)
Quaternion Multi-focus Color Image Fusion [38.5] 多焦点カラー画像融合とは、複数の部分焦点カラー画像を統合することで、単一のオールインフォーカスカラー画像を作成することである。
既存の手法は、色情報や複雑なテクスチャを扱うのに制限があるため、複雑な現実のシナリオに苦しむ。
本稿では,四元系領域における高品質なカラー画像融合を実現するために,四元系多焦点カラー画像融合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:08:33 GMT)
Teaching Models to Understand (but not Generate) High-risk Data [38.3] SLUNG(Selective Loss to Understand but not Generate)を紹介する。
SLUNGは、モデルが高リスクデータを生成せずに理解することを学ぶための事前学習パラダイムである。
SLUNGは、生成を増大させることなく、モデルによる高リスクデータの理解を一貫して改善することを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:24:06 GMT)
Pauli crystal superradiance [38.0] パウリ結晶は、フェルミ統計と閉じ込めからのみ現れる、相互作用しないフェルミオンのユニークな幾何学構造である。
我々は、キャビティと結合すると、パウリ結晶の縮退が超輝度へのゼロ閾値遷移を引き起こすことを解析的に示す。
この超放射は、原子密度が周期的に相互作用する真の量子結晶状態の出現を伴う。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:58 GMT)
Vision-based 3D Semantic Scene Completion via Capture Dynamic Representations [37.6] 動的表現のキャプチャによる視覚に基づくロバストなセマンティックなシーンコンプリートを提案する。
マルチモーダルな大規模モデルを用いて2次元的意味論を抽出し,それらを3次元空間に整列させる。
シーン情報を動的・静的な特徴に分離するために,単眼・立体的深度の特徴を利用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:33:12 GMT)
Towards Combinatorial Interpretability of Neural Computation [36.5] 本稿では,ネットワークの重みとバイアスのシグネチャベース分類における計算構造を解析し,ニューラルネットワークを理解する手法である解釈可能性を紹介する。
ニューラルネットワークがブール表現をどう計算するかを説明する理論であるフィーチャーチャネルコーディングを通じて、そのパワーを実証する。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:19:37 GMT)
Scenethesis: A Language and Vision Agentic Framework for 3D Scene Generation [36.4] Scenethesisはテキストベースのシーンプランニングと視覚誘導レイアウトの改良を統合したフレームワークである。
多様な、現実的で、物理的に妥当な3Dインタラクティブなシーンを生成し、仮想コンテンツの作成、シミュレーション環境、そしてAI研究に価値がある。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:58 GMT)
Improving Model Alignment Through Collective Intelligence of Open-Source LLMS [34.2] モデルアライメントのための高品質なデータを提供するために,様々な言語モデルの集合的強みを活用するMOAAを導入する。
その結果,アリーナ・ハードでは19.5から48.3,アルパカ・エスバル2では22.33から57.23に,LLaMA-3.1-8B-インストラクトでは勝利率を向上させることができた。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:40:23 GMT)
MIGC++: Advanced Multi-Instance Generation Controller for Image Synthesis [33.5] マルチインスタンス生成(MIG)タスクを導入し、単一のイメージ内で複数のインスタンスを生成することに焦点を当てる。
MIGは、インスタンス間の属性リークを避けること、多様なインスタンス記述をサポートすること、反復生成における一貫性を維持することの3つの大きな課題に直面している。
これらの手法を評価するためにCOCO-MIGとMultimodal-MIGベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:03:50 GMT)
Finger Pose Estimation for Under-screen Fingerprint Sensor [33.1] 画面下指紋ポーズ推定のための新しいデュアルモーダル入力ベースネットワークを提案する。
本手法は,スクリーン下指紋センサによる隆起パッチから抽出したテクスチャの詳細と,タッチスクリーンから得られた容量画像から得られた粗い輪郭を効果的に統合する。
本手法は従来のSOTA法よりも優れており,指紋認識アルゴリズムの認識能力を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:05:47 GMT)
GraphMaster: Automated Graph Synthesis via LLM Agents in Data-Limited Environments [32.9] GraphMasterは、データ制限された環境でグラフデータ合成用に特別に設計された最初のマルチエージェントフレームワークである。
我々は6つの標準グラフベンチマークの「サブ」変種を新たに開発し、現実的な制約下での合成能力を試験するために特別に設計した。
また,人間の評価とグラスマン多様体に基づく解析を併用した新しい解釈可能性評価フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:57:12 GMT)
CFBench: A Comprehensive Constraints-Following Benchmark for LLMs [32.5] CFBenchは大規模言語モデルのベンチマークに従う大規模な包括的制約である。
200以上の実生活シナリオと50以上のNLPタスクをカバーする1,000のキュレートされたサンプルがある。
CFBenchは実世界の命令から厳密に制約をコンパイルし、制約型のための革新的な体系的なフレームワークを構築する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:06:42 GMT)
Clients Collaborate: Flexible Differentially Private Federated Learning with Guaranteed Improvement of Utility-Privacy Trade-off [31.7] 我々は、厳格なプライバシー保証を備えた新しいフェデレーション学習フレームワーク、FedCEOを紹介した。
スペクトル空間における高周波成分を柔軟に切り離す能力を示す。
我々は、異なるプライバシー設定の下で、大幅なパフォーマンス改善と厳格なプライバシー保証を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:50:42 GMT)
A Sharper Global Convergence Analysis for Average Reward Reinforcement Learning via an Actor-Critic Approach [31.3] 本研究は,一般政策パラメトリゼーションによる平均回帰強化学習について検討する。
マルチレベルモンテカルロをベースとしたNatural Actor-Critic (MLMC-NAC)アルゴリズムを提案する。
我々の研究は、平均回帰マルコフ決定過程に対して$tildemathcalO (1/sqrtT)$のグローバル収束率を達成した最初のものである。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:24:22 GMT)
HSplitLoRA: A Heterogeneous Split Parameter-Efficient Fine-Tuning Framework for Large Language Models [30.3] 大規模言語モデル(LLM)は、自然言語処理領域などに革命をもたらし、目覚ましいブレークスルーを達成した。
膨大なパラメータサイズのため、様々な下流タスクのためのプライベートデータでこれらのモデルを微調整することが主流になっている。
本研究では,分割学習(SL)と低ランク適応(LoRA)に基づくフレームワークであるHSplitLoRAを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:09:19 GMT)
Generative Trajectory Stitching through Diffusion Composition [30.0] CompDiffuserは、これまで見てきたタスクから短い軌跡を合成的に縫い合わせることで、新しいタスクを解決できる新しい生成的アプローチである。
我々は,さまざまな環境サイズ,エージェント状態次元,軌道タイプ,データ品質のトレーニングなど,さまざまな課題のベンチマークタスクについて実験を行い,CompDiffuserが既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:26:30 GMT)
A Survey of Slow Thinking-based Reasoning LLMs using Reinforced Learning and Inference-time Scaling Law [29.8] 本調査は「スロー思考」を模倣した大規模言語モデル(LLM)の最近の進歩を考察する。
LLMは、数学の推論、視覚的推論、診断、マルチエージェントの議論などの複雑なタスクの間、動的に計算資源をスケーリングすることに焦点を当てている。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:14:59 GMT)
Quantitative Analysis of Performance Drop in DeepSeek Model Quantization [29.7] DeepSeek-R1とV3のパフォーマンスは、量子化後にどうなるのかは不明だ。
本技術報告では,DeepSeekモデルスペクトル全体にわたるマルチビット幅量子化の定量的評価を行った。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:25:20 GMT)
3D Vision-Language Gaussian Splatting [29.0] マルチモーダルな3Dシーン理解は、ロボット工学、自律運転、バーチャル/拡張現実において重要な応用である。
本稿では,視覚的・意味的な相違点を適切に扱えるソリューションを提案する。
また、既存のビュー間のセマンティック一貫性を改善するために、カメラビューブレンディング技術を採用している。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:00:03 GMT)
Artificial Intelligence in Reactor Physics: Current Status and Future Prospects [28.7] 原子炉物理学は中性子物性の研究であり、中性子と原子炉の物質間の相互作用をモデルで調べることに焦点を当てている。
人工知能(AI)は、例えば運転シミュレーション、安全設計、リアルタイム監視、コア管理、保守において、原子炉物理学に多大な貢献をしている。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:35:01 GMT)
OAC: Output-adaptive Calibration for Accurate Post-training Quantization [28.7] 大規模言語モデル(LLM)を圧縮するPTQ(Post-training Quantization)技術が開発されている。
ほとんどのPTQは、モデル出力を無視した層ワイドユークリッド損失に基づいて量子化誤差を定式化する。
キャリブレーションプロセスにモデル出力を組み込むために,出力適応量子化(OAC)を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:38:59 GMT)
TWIST: Teleoperated Whole-Body Imitation System [28.6] 全身動作模倣によるヒューマノイド遠隔操作システムTWISTについて述べる。
我々は,強化学習と行動クローニングを組み合わせた,頑健で適応的で応答性の高い全身制御装置を開発した。
TWISTは、現実世界のヒューマノイドロボットが、前例のない、多目的で、調整された全身運動能力を達成できるようにする。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:03 GMT)
SiMHand: Mining Similar Hands for Large-Scale 3D Hand Pose Pre-training [28.6] In-the-wild hand image を用いた3次元手ポーズ推定の事前学習のためのフレームワークを提案する。
特徴空間に類似したペアを埋め込む新しいコントラスト学習法を提案する。
実験により,本手法が従来のコントラスト学習手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:16:10 GMT)
A Survey on Personalized Alignment -- The Missing Piece for Large Language Models in Real-World Applications [28.2] 大きな言語モデル(LLM)は目覚ましい能力を示しているが、現実のアプリケーションへの移行には限界がある。
本稿では、パーソナライズされたアライメントに関する最初の包括的調査を示す。
本稿では、優先メモリ管理、パーソナライズされた生成、フィードバックに基づくアライメントを含む統合されたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:21:53 GMT)
Token Coordinated Prompt Attention is Needed for Visual Prompting [28.0] 本稿では,Token Coordinated Prompt Attention (TCPA)モジュールを提案する。
我々はこれらのプロンプトをCLS PromptsとImage Promptsに切り離し、注意機構を通じてCLSトークンや画像トークンとのみ対話する。
異なる画像トークンは異なる画像パッチに対応し、多様な情報を含むので、一致したプロンプトを個別のトークンに自動的に割り当てる。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:59:26 GMT)
RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference [27.7] RetroInferは、長文推論を加速するために固有の注意空間を利用する新しいシステムである。
KVキャッシュがCPUメモリに拡張された場合、GPUメモリリミット内では4.5倍のスピードアップと、スムーズなアテンションベースライン上で最大10.5倍のスピードアップを示します。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:01:17 GMT)
Recent Advances in Out-of-Distribution Detection with CLIP-Like Models: A Survey [27.5] Out-of-distriion Detection (OOD)は、テスト中のIDデータと分散的に異なるサンプルを識別するようモデルを訓練する現実世界のアプリケーションにとって重要なタスクである。
近年のAIの進歩、特にCLIPのようなビジョンランゲージモデル(VLM)は、従来の単モード画像検出器からマルチモーダル画像テキスト検出器にシフトすることで、OOD検出に革命をもたらした。
CLIPのクロスモーダルな性質に合わせて,画像とテキストの両方に根ざした新たな分類フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:22:38 GMT)
Advances in Automated Fetal Brain MRI Segmentation and Biometry: Insights from the FeTA 2024 Challenge [27.5] FeTA Challenge 2024は胎児脳MRI解析を進歩させた。
組織セグメンテーションと並行して新しい課題としてバイオメトリ予測を導入した。
今回は、新しいローフィールド(0.55T)MRIデータセットからのデータを含む、多様なマルチ中心テストセットを初めて紹介しました。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:54:04 GMT)
Evaluating Fairness Metrics Across Borders from Human Perceptions [27.2] 我々は,意思決定シナリオにおける様々な公正度指標に対する一般の認識を評価するために,国際調査を実施している。
我々は,中国,フランス,日本,アメリカ各地の1,000人の参加者から回答を収集し,合計4,000人の参加者を集めた。
本研究は,個人属性と公正度尺度の選択との関係を考察し,国家的文脈の重大な影響を明らかにするものである。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:14:04 GMT)
Detect, Classify, Act: Categorizing Industrial Anomalies with Multi-Modal Large Language Models [27.0] 本稿では,異常分類のための新しいパイプラインであるVELMを提案する。
我々は、広く使われているMVTec-ADとVisA-ACデータセットの洗練されたバージョンであるMVTec-ACとVisA-ACを紹介する。
提案手法は,MVTec-ADで80.4%,MVTec-ACで84%の精度を達成し,VELMの有効性を示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:08:25 GMT)
One Transformer for All Time Series: Representing and Training with Time-Dependent Heterogeneous Tabular Data [26.0] 異種時間依存データを表すトランスフォーマーアーキテクチャを提案する。
数値的特徴は周波数関数の集合を用いて表現され、ネットワーク全体が一意の損失関数で一様に訓練される。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:20:58 GMT)
34 Examples of LLM Applications in Materials Science and Chemistry: Towards Automation, Assistants, Agents, and Accelerated Scientific Discovery [26.0] 大規模言語モデル(LLM)は、材料科学と化学研究の多くの側面を再構築している。
最近の進歩は、最新のモデルのクラスが構造化データと非構造化データを統合することができることを示している。
第2回Large Language Model Hackathon for Applications in Materials Science and Chemistryで開発された34のプロジェクトを通して,LLMの応用を概観する。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:08:37 GMT)
When Pre-trained Visual Representations Fall Short: Limitations in Visuo-Motor Robot Learning [26.0] トレーニング済みの視覚表現を視覚運動ロボット学習に統合することは、視覚エンコーダをゼロから訓練するための有望な代替手段として登場した。
PVRは、時間的絡み合いや、小さなシーンの摂動があっても一般化できないなど、政策学習の文脈において重要な課題に直面している。
本研究は、これらの欠点を特定し、対処するための解決策を提案する。まず、時間的知覚とタスク完了の感覚でPVR機能を増強し、効果的に時間内にそれらを切り離す。
第2に,タスク関連ローカル機能への選択的参加を学習するモジュールを導入し,アウト・オブ・ディストリビューション(out-of-distribution)の評価においてロバスト性を高める。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:42:27 GMT)
SuperEdit: Rectifying and Facilitating Supervision for Instruction-Based Image Editing [25.8] 既存のデータセットは通常、さまざまな自動化手法を使って構築され、ノイズの多い監視信号に繋がる。
近年の取り組みは、高品質な編集画像の生成、認識タスクの事前訓練、視覚言語モデル(VLM)の導入による編集モデルの改善を試みているが、この根本的な問題を解決するには至らなかった。
本稿では,与えられた画像対に対してより効率的な編集命令を構築することで,新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:19:40 GMT)
Reward-free World Models for Online Imitation Learning [25.3] 本研究では,報酬のない世界モデルを活用したオンライン模倣学習手法を提案する。
提案手法は, 復元を伴わない潜在空間における環境力学を学習し, 効率的かつ高精度なモデリングを可能にする。
DMControl,myoSuite, ManiSkill2 など,様々なベンチマークを用いて本手法の評価を行い,既存手法と比較して優れた実証性能を示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:33:37 GMT)
Text to Image Generation and Editing: A Survey [25.3] テキスト・ツー・イメージ・ジェネレーション(Text-to-image Generation, T2I)は、高品質な画像のテキスト誘導生成である。
本調査では,2021年から2024年にかけて実施された141作品について概観した。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:08:31 GMT)
AOR: Anatomical Ontology-Guided Reasoning for Medical Large Multimodal Model in Chest X-Ray Interpretation [25.1] 胸部X線検査 (CXRs) は, 臨床現場で最も頻度の高い画像検査である。
大規模マルチモーダルモデル(LMM)の最近の進歩により、自動CXR解釈が可能となり、診断精度と効率が向上した。
現在の医療用LMM(MLMM)は,(1)地域レベルでの理解と相互作用が不十分なこと,(2)単一段階の推論による限定的な解釈可能性の2つの課題に直面している。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:57:07 GMT)
Towards Cross-Modality Modeling for Time Series Analytics: A Survey in the LLM Era [25.0] 大規模言語モデル(LLM)が時系列分析の新しいパラダイムとして登場した。
LLMはテキストコーパスで事前訓練されており、本質的に時系列に最適化されていない。
この調査は、LLMベースの時系列モデリングに関心のある専門家、研究者、実践者向けに設計されている。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:35:33 GMT)
Using Knowledge Graphs to harvest datasets for efficient CLIP model training [25.0] 高品質のCLIPモデルのトレーニングは通常、膨大なデータセットを必要とする。
知識グラフで強化されたスマートWeb検索戦略を利用することで、堅牢なCLIPモデルをスクラッチからトレーニングできることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:56:25 GMT)
A Survey on Progress in LLM Alignment from the Perspective of Reward Design [24.5] 人間の価値観と意図を持つ大規模言語モデル(LLM)は、AI研究における中核的な課題である。
本研究では,LLMアライメントにおける報酬機構の体系的理論的枠組みによる包括的検討を行う。
本研究は、報酬モデリングの進化的傾向を明らかにする体系的な分類枠組みを確立する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:15:02 GMT)
Bayes-Nash Generative Privacy Against Membership Inference Attacks [24.3] メンバーシップ推論攻撃(MIA)は、個人のデータがデータセットにあるかどうかを判断することで、重大なプライバシーリスクを露呈する。
本研究では,MIAのプライバシ保護をディフェンダーとアタッカー間のベイズゲームとしてモデル化するゲーム理論フレームワークを提案する。
そこで我々は,ベイズ・ナッシュ生成プライバシ(BNGP)を得たディフェンダーのデータ共有ポリシーを呼んだ。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:00:50 GMT)
Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identfication [24.2] 擬似ラベルノイズ(PLN)を考慮した新しい学習パラダイムを提案する。
PLNはノイズオーバーフィット、エラー蓄積、ノイズの多いクラスタ対応の3つの主要な課題によって特徴づけられる。
UVI-ReIDのためのロバスト・デュナリティ学習フレームワーク(RoDE)を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:36:52 GMT)
Uncertainty-aware Human Mobility Modeling and Anomaly Detection [24.2] 生のGPSデータを連続的静止点イベントとしてモデル化した人間の行動における異常検出を定式化する。
提案したモデルUSTADとアレータティック不確実性推定を併用する。
実験の結果,USTADは産業規模データのベースライン以上でAUCROCの異常検出を3%-15%改善することがわかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:42:32 GMT)
Flow-based Domain Randomization for Learning and Sequencing Robotic Skills [24.2] 強化学習におけるドメインランダム化は、シミュレーションで訓練された制御ポリシーの堅牢性を高めるための確立された手法である。
本稿では,ニューラルサンプリング分布のエントロピー規則化報酬によるサンプリング分布の自動検出について検討する。
このアーキテクチャは、より単純でパラメータ化されたサンプリング分布を学習する既存のアプローチよりも柔軟であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:40:42 GMT)
Un-Straightening Generative AI: How Queer Artists Surface and Challenge the Normativity of Generative AI Models [24.0] 13人のクイアアーティストを対象にワークショップを行い、GPT-4とDALL-E 3へのアクセスを参加者に提供した。
参加者は、デザインにさまざまな規範的価値が埋め込まれているため、これらのモデルの使用に苦労していました。
本稿では,「最先端」モデルの概念化の意義を論じ,FAccT研究者がキー代替品をどのようにサポートするかを検討する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:07:07 GMT)
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities [23.7] 近年,マルチモーダル理解モデルと画像生成モデルの両方が顕著に進歩している。
これらのタスクを統合する統合フレームワークの開発に対する関心が高まっている。
今後の研究を導くための総合的な調査を行う。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:18:03 GMT)
Beyond Single Concept Vector: Modeling Concept Subspace in LLMs with Gaussian Distribution [23.6] 本稿では,特定の概念を表す部分空間を近似する手法を提案する。
我々は,GCSの有効性を,複数の大規模言語モデルにまたがる忠実度と妥当性を計測することによって実証する。
また、感情ステアリングなどの実世界の応用において、表現介入タスクを用いてその効果を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:17:46 GMT)
Efficient Classical Algorithms for Simulating Gaussian Boson Sampling on Graphs [23.4] 我々は,無向非重み付きグラフ上でGBSをシミュレートするマルコフ連鎖モンテカルロアルゴリズムを提案する。
我々の主な貢献はグラウバー力学の二重ループ変種であり、その定常分布はGBS分布と一致する。
数値計算では,従来の GBS 実験や古典シミュレーションのスケールよりも 256 のグラフ上で実験を行う。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:13:57 GMT)
Structure-agnostic Optimality of Doubly Robust Learning for Treatment Effect Estimation [23.4] 平均処理効果推定は因果推論において最も中心的な問題であり、多くの分野に適用できる。
我々は最近導入された統計的下界の構造非依存の枠組みを採用し、ニュアンス関数に構造的特性を生じさせない。
平均治療効果 (ATE) と平均治療効果 (ATT) の両方に対して, 有意かつ広く用いられている2重頑健性評価器の統計的最適性を証明する。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:30:17 GMT)
Acoustic Side-Channel Attacks on a Computer Mouse [23.3] 本稿では,通常のマウスを用いた音響信号によるセキュリティ漏洩について考察する。
制御環境下では,4つのマウスの動きを97%の精度で分類する概念実証攻撃を提示することにより,このような攻撃の可能性を確認する。
そして、スマートフォンを使って12種類のマウスの動きを識別し、実験を記録します。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:26:29 GMT)
Extending Asynchronous Byzantine Agreement with Crusader Agreement [23.3] 多値BAから二値BAへの新たな削減を提案する。
削減には多値CAを用いるため、$ell$-bit入力のための2つの情報理論CAプロトコルも設計する。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:56:44 GMT)
CAD-NeRF: Learning NeRFs from Uncalibrated Few-view Images by CAD Model Retrieval [23.1] 多視点画像からの再構成は3次元視覚における長年の問題である。
CAD-NeRF(CAD-NeRF)を提案する。
CAD-NeRFは, 得られたCADモデルから大きな変形を伴って, 精度の高い密度の学習に成功していることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:58:07 GMT)
Short Video Segment-level User Dynamic Interests Modeling in Personalized Recommendation [23.1] 短いビデオの成長は、進化する好みに合わせてユーザーとコンテンツをマッチングする効果的なレコメンデーションシステムを必要としている。
現在のビデオレコメンデーションモデルは、主に各ビデオ全体を扱い、特定のビデオセグメントでユーザーの好みの動的な性質を見渡す。
本稿では,ハイブリッド表現モジュール,マルチモーダルなユーザビデオエンコーダ,セグメント関心デコーダを統合した革新的なモデルを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:51:21 GMT)
R1-Reward: Training Multimodal Reward Model Through Stable Reinforcement Learning [22.2] マルチモーダル・リワードモデル(MRM)は、マルチモーダル大言語モデル(MLLM)の性能向上に重要な役割を果たす。
本稿では,既存のRL手法のトレーニング損失,利点推定戦略,報酬設計を改良したStableReinforceアルゴリズムを提案する。
我々の報酬モデルであるR1-Rewardは、このデータセット上でStableReinforceアルゴリズムを使用してトレーニングされ、マルチモーダル報酬モデリングベンチマークのパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:50 GMT)
Voila: Voice-Language Foundation Models for Real-Time Autonomous Interaction and Voice Role-Play [21.9] Voilaは応答遅延をわずか195ミリ秒で達成し、平均的な人間の応答時間を上回る。
その階層的なマルチスケールトランスフォーマーは、大規模言語モデルの推論機能を統合する。
Voilaは、100万以上のプレビルドされた音声をサポートし、短いオーディオサンプルから10秒で新しい音声を効率的にカスタマイズする。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:05:01 GMT)
Rewriting Pre-Training Data Boosts LLM Performance in Math and Code [21.6] Llama 3.3 Community Licenseの下でリリースされた2つのデータセットを導入し、大きな言語モデル(LLM)のパフォーマンスを大幅に向上させる。
SwallowCodeはPythonスニペットを,構文検証,ピリントベースのスタイルフィルタリング,2段階の書き換えプロセスという,新しい4段階のパイプラインを通じて洗練する。
We show that continual pre-training of Llama-3.1-8B with SwallowCode boosts pass@1 by +17.0 on HumanEval and +17.7 on HumanEval+ than Stack-Edu。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:38:43 GMT)
An Arbitrary-Modal Fusion Network for Volumetric Cranial Nerves Tract Segmentation [21.2] そこで我々は,CNTSeg-v2と呼ばれる,体積性頭蓋神経(CNs)の領域分割のための新しい任意モード核融合ネットワークを提案する。
我々のモデルは、他の補助モーダルから情報的特徴を効果的に抽出するために設計されたArbitrary-Modal Collaboration Module (ACM)を含んでいる。
我々のCNTSeg-v2は最先端のセグメンテーション性能を達成し、競合するすべての手法より優れています。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:00:41 GMT)
SIMPLEMIX: Frustratingly Simple Mixing of Off- and On-policy Data in Language Model Preference Learning [21.1] オンラインおよびオフラインのデータは、優先最適化において相補的な長所を提供することを示す。
SIMPLEMIXを導入する。これは、オン・ポリティクスとオフ・ポリティクス・プライオリティ・ラーニングの相補的な強みを組み合わせたアプローチである。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:54:44 GMT)
Recursive Inference Scaling: A Winning Path to Scalable Inference in Language and Multimodal Systems [21.0] 本稿では,言語およびマルチモーダルシステムにおける推論時間をスケールするための補完的なプラグインレシピとして,Recursive Inference Scaling (RINS)を紹介した。
RINS はモバイル LLM の最近の "repeat-all-over" (RAO) 戦略など、他の55種類よりも大幅に優れている。
軽量アダプタでは、RINSは非レグレット戦略を提供するため、RINS対応プレトレーニングにより言語モデリングのパフォーマンスが向上する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:19:53 GMT)
Position: Enough of Scaling LLMs! Lets Focus on Downscaling [20.6] 我々は,大規模言語モデル(LLM)の開発におけるダウンスケーリングへのパラダイムシフトを提唱する。
本稿では,資源需要を大幅に削減しつつ,性能の維持を図るLLMをダウンスケールするための総合的なフレームワークを提案する。
本稿では,従来のスケーリングパラダイムから切り離すための実践的戦略について概説する。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:30:12 GMT)
Tele-LLMs: A Series of Specialized Large Language Models for Telecommunications [20.4] 我々は,通信に適した1Bパラメータから8Bパラメータまで,最初の言語モデルであるTele-LLMsを開発し,オープンソース化した。
評価の結果、これらのモデルは、テレ・エバルおよび通信関連文献タスクにおける汎用的タスクよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:44:30 GMT)
Optimizing Chain-of-Thought Reasoners via Gradient Variance Minimization in Rejection Sampling and RL [20.2] チェーン・オブ・シント(CoT)推論は、モデルが中間的推論ステップを生成する必要がある潜在変数問題として形式化することができる。
反復的な報酬ランクの微調整のような以前のアプローチは、難易度と収束挙動の変動を考慮しない。
本稿では,計算予算制約下での勾配分散を最小限に抑えるために,プロンプト固有の動的サンプル割当戦略であるGVMRAFTを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:26:00 GMT)
Exploration on Real World Assets and Tokenization [20.1] この研究は、流動性を高め、資産管理のプラクティスを洗練することを目的として、ブロックチェーン上の実世界の資産(RWA)のトークン化について検討する。
本研究は,既存の展開の事例研究を包括的に分析し,従来の資産管理パラダイムを再構築する上でのブロックチェーン技術のメリット,ハードル,将来的な進歩を評価する。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:18:09 GMT)
Integrating Column Generation and Large Neighborhood Search for Bus Driver Scheduling with Complex Break Constraints [20.0] バスドライバスケジューリング問題(バスドライバスケジューリング問題、BDSP)は、事前配置されたバスツアーをカバーするためのシフトの設計を目標とする最適化問題である。
本研究は,B&P法とLarge Neighborhood Search (LNS) フレームワークの両方を網羅的に検討した。
さらに、B&PとLNSのより深い統合を提案し、LNSサブプロブレムから生成されたカラムを保存し、他のサブプロブレムに再利用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:08:25 GMT)
CreoPep: A Universal Deep Learning Framework for Target-Specific Peptide Design and Optimization [19.8] コノトキシンのような標的特異的ペプチドは、イオンチャネルや受容体に対する例外的な結合親和性と選択性を示す。
本稿では, プログレッシブマスキング手法とマスク言語モデリングを統合し, 高親和性ペプチド変異体を設計する, 深層学習に基づく条件生成フレームワークであるCreoPepについて述べる。
ニコチン性アセチルコリン受容体を標的としたコノトキシン阻害剤を設計し, 電気生理学的試験においてサブミクロモル活性を達成することにより, このアプローチを検証した。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:56:39 GMT)
Towards Quantifying the Hessian Structure of Neural Networks [19.7] ニューラルネットワーク(NN)のヘッセン行列は、ほぼブロック対角構造を示すと実証研究が報告した。
建築設計に根ざした静的力」と「動的力」という,ヘッセン構造を形成する2つの力を明らかにする。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:34:57 GMT)
Less is More: Efficient Weight Farcasting with 1-Layer Neural Network [18.8] 本稿では,長期時系列予測技術を活用することによって,従来の手法から切り離された新たなフレームワークを提案する。
提案手法は,初期および最終重み付けのみに着目し,複雑なモデルアーキテクチャに対する合理化された代替手段を提供する。
大規模言語モデルであるDistilBERTを含む,合成重みシーケンスと実世界のディープラーニングアーキテクチャに関する実証評価により,本手法の優位性を実証した。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:10:20 GMT)
From Human Judgements to Predictive Models: Unravelling Acceptability in Code-Mixed Sentences [18.5] Clineは、イングリッシュ・ヒンディー語(en-hi)のコード混合テキストに対する人間の受容性を含むデータセットである。
Clineは16,642の文で、合成生成されたコードミックステキストとオンラインソーシャルメディアから収集されたサンプルという2つのソースからのサンプルで構成されている。
我々の分析は、CMIやスイッチポイント数、Burstinesなどの一般的なコード混合メトリクスは、コード混合コーパスをフィルタリング/コンパイルするのに使われ、人間の受け入れ可能性との相関が低く、データセットの必要性の基盤となっていることを証明している。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:51:58 GMT)
How May U.S. Courts Scrutinize Their Recidivism Risk Assessment Tools? Contextualizing AI Fairness Criteria on a Judicial Scrutiny-based Framework [18.5] 我々は、主要な法的根拠において、公正な表面の技術的AI概念化がどうあるかを特定するために、法的研究を行う。
本稿では,人口統計に関する法的調査概念と技術的公正度基準を統合する新たな枠組みを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:59:57 GMT)
Localizing Before Answering: A Hallucination Evaluation Benchmark for Grounded Medical Multimodal LLMs [18.4] LMMのローカライズ能力とロバスト性を評価するためのベンチマークであるHEAL-MedVQAを紹介する。
そこで本研究では,LMMが関心のある対象領域をローカライズするためのLobA(Lobize-before-Answer)フレームワークを提案する。
実験の結果, HEAL-MedVQA ベンチマークでは, バイオメディカル LMM よりも有意に優れていた。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:30:17 GMT)
Multi-View Learning with Context-Guided Receptance for Image Denoising [18.2] 写真や自動運転などの低レベルの視覚アプリケーションでは、画像のデノイングが不可欠である。
既存の手法では、現実のシーンで複雑なノイズパターンを識別し、重要な計算資源を消費する。
本研究では、マルチビュー機能統合と効率的なシーケンスモデリングを組み合わせた、コンテキスト誘導型Receptance Weighted Key-Value(M)モデルを提案する。
このモデルは、複数の実世界の画像復号化データセットで検証され、既存の最先端の手法を定量的に上回り、推論時間を最大40%削減する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:57:43 GMT)
HAINAN: Fast and Accurate Transducer for Hybrid-Autoregressive ASR [18.0] 本稿では,音声認識のためのハイブリッド・オートレグレッシブ推論Transducers(HAINAN)を提案する。
HAINANは、すべてのネットワークコンポーネントによる自己回帰推論と、予測子を使わずに非自己回帰推論の両方をサポートする。
HAINANは非自己回帰モードではCTC, 自己回帰モードではTDTと効率が同等であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:20:01 GMT)
FormalMATH: Benchmarking Formal Mathematical Reasoning of Large Language Models [17.9] 本稿では,高校のオリンピアード問題から学部レベルの定理まで,5,560の公証問題からなる大規模Lean4ベンチマークであるFormalMATHを提案する。
本稿では,文の自動形式化,セマンティック検証,否定に基づく無防備なフィルタリング戦略を統合した,新たなオートフォーマル化パイプラインを提案する。
現状のLSMに基づく定理証明器の評価は, 重大な限界を呈する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:37:00 GMT)
CHOSEN: Contrastive Hypothesis Selection for Multi-View Depth Refinement [17.4] CHOSENは柔軟で堅牢で効果的なマルチビュー深度改善フレームワークである。
既存のマルチビューステレオパイプラインでも使用できる。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:35:26 GMT)
Regulating Algorithmic Management: A Multi-Stakeholder Study of Challenges in Aligning Software and the Law for Workplace Scheduling [17.4] ソフトウェアと法律の整合性に関する既存の作業は、コンプライアンスをAMを規制するプロセス全体の1つに減らします。
我々は、職場スケジューリング法を施行または遵守することに関わる主要なステークホルダーにインタビューを行った。
それらの信念と経験に基づいて,ソフトウェアスケジューリングが職場スケジューリング法に対する信念やコンプライアンスにどのように影響するかを説明する。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:56:28 GMT)
Physics-Informed Weakly Supervised Learning for Interatomic Potentials [17.2] 機械学習型原子間ポテンシャル(MLIP)のトレーニングのための物理インフォームド・弱教師付きアプローチを導入する。
我々は、様々なベースラインモデルとベンチマークデータセットに対して、エネルギーと力の誤差を(しばしば2倍以下に)減らすことを示した。
我々のアプローチは、スパースで高精度なアブ・イニシアチブデータに基づく基礎モデルの微調整を改善する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:57:16 GMT)
GIF: Generative Inspiration for Face Recognition at Scale [16.8] 本稿では,スカラーラベルを構造化IDコードで置換する簡易かつ効果的な手法を提案する。
結果として、関連する計算コストは、対数的なw.r.t.のアイデンティティの数になる。
IJB-BとIJB-Cでは,TAR@FAR$=1e-4$で1.52%,TAR@FAR$=1e-4$で0。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:23:14 GMT)
Corr2Distrib: Making Ambiguous Correspondences an Ally to Predict Reliable 6D Pose Distributions [16.7] Corr2DistribはRGB画像から6Dカメラのポーズ分布を推定する最初の対応方式である。
Corr2Distribは、RGB画像からのポーズ分布推定とシングルポーズ推定の両方において、最先端のソリューションよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:29:32 GMT)
FairPO: Robust Preference Optimization for Fair Multi-Label Learning [16.7] マルチラベル分類における公平性の促進を目的とした新しいフレームワークであるFairPOを提案する。
私たちのフレームワークでは、ラベルのセットは特権グループと非特権グループに分割されています。
学習問題をグループに対するロバストな最適化とすることで、より低いパフォーマンスを持つグループに対するトレーニングの重点を調整できる。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:58:54 GMT)
Invertible Fourier Neural Operators for Tackling Both Forward and Inverse Problems [16.6] 本稿では,前方および逆問題に対処するための可逆フーリエニューラル演算子 (iFNO) を提案する。
そこで我々は,モデルパラメータを共有し,情報を交換し,双方向タスクの学習を相互に規則化するために,潜在チャネル空間に一連の非可逆ブロックを開発した。
我々は,入力空間内の固有構造を捕捉し,後部推論を可能にする変分自動エンコーダを統合した。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:32:19 GMT)
Joint-Embedding Masked Autoencoder for Self-supervised Learning of Dynamic Functional Connectivity from the Human Brain [16.6] グラフニューラルネットワーク(GNN)は、人間の脳ネットワークと表現型を区別するための動的機能接続の学習において、有望であることを示している。
本稿では,計算機ビジョンにおけるJEPA(Joint Embedding Predictive Architecture)からインスピレーションを得た,時空間連成型自動エンコーダ(ST-JEMA)について紹介する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:29:25 GMT)
Unlearning vs. Obfuscation: Are We Truly Removing Knowledge? [16.0] 難読化と難読化を正式に区別し,探索に基づく評価フレームワークを導入する。
自動生成された複数質問に対するモデル予測分布をフラット化する新しい未学習手法であるDF-MCQを提案する。
実験の結果,DF-MCQは90%以上の拒絶率とランダムな選択レベルの不確実性で未学習を実現することがわかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:21:08 GMT)
Non-Stationary Bandit Learning via Predictive Sampling [15.9] 非定常環境ではトンプソンサンプリングが不十分であることを示す。
本稿では,有効性を急速に失う情報を優先的に抽出するアルゴリズムである予測サンプリングを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:46:42 GMT)
Colombian Waitresses y Jueces canadienses: Gender and Country Biases in Occupation Recommendations from LLMs [15.8] 本研究は,多言語交叉国とジェンダーバイアスに関する最初の研究である。
25の国と4つの代名詞セットを用いて、英語、スペイン語、ドイツ語でプロンプトのベンチマークを構築した。
モデルが性別や国ごとに同性を示す場合であっても、国と性別の両方に基づく交叉的職業バイアスが持続することがわかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:40:51 GMT)
MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation [15.6] 拡散モデルはテキスト・画像生成において優れた性能を示した。
複雑なシーンに対するテキスト・画像生成のための多エージェント協調型合成拡散法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:50:03 GMT)
Variational OOD State Correction for Offline Reinforcement Learning [15.6] 我々は,OOD状態修正のためのDASP(dendentity-Aware Safety Perception)という新しい手法を提案する。
提案手法は,データ密度の高い結果につながる行動の優先順位付けをエージェントに促し,その操作を促進させるか,あるいは非流通(安全)領域への復帰を促す。
オフラインの MuJoCo および AntMaze スイート上での広範囲な実験評価により,提案手法の有効性と妥当性を検証した。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:00:10 GMT)
The Illusion of Role Separation: Hidden Shortcuts in LLM Role Learning (and How to Fix Them) [15.5] 微調整された大言語モデルは、しばしば役割識別のために2つのプロキシに依存することを示す。
モデル入力エンコーディングにおけるトークンワイドキューを調整し,役割境界をマークするエンフィン変分信号の強化を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:29:08 GMT)
Lazy But Effective: Collaborative Personalized Federated Learning with Heterogeneous Data [15.2] フェデレートラーニング(Federated Learning)では、単一のグローバルモデルが個々のクライアントにとって最高のパフォーマンスを持っていない。
本稿では,計算効率のよい影響近似を用いたパーソナライズド・フェデレーション・ラーニング・フレームワーク(pFedLIA)を提案する。
提案手法は, 合成および実世界の様々な環境における非IID-Lazynessにより, グローバルモデルの性能低下を回復することに成功した。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:26:35 GMT)
Single-Sample and Robust Online Resource Allocation [15.0] 本稿では,オンラインリソースアロケーションのための新しい指数価格アルゴリズムを提案する。
外れ値モデルと値拡張モデルにおける汚職に対して堅牢である。
アイテムの価格設定にオンライン学習アルゴリズムを使用する従来のアプローチから運用されている。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:48:11 GMT)
MUSAR: Exploring Multi-Subject Customization from Single-Subject Dataset via Attention Routing [14.9] MUSARは、シングルオブジェクトのトレーニングデータのみを必要としながら、堅牢なマルチオブジェクトのカスタマイズを実現するためのフレームワークである。
シングルオブジェクト画像からディップチッチトレーニングペアを構築し、マルチオブジェクト学習を容易にするとともに、ディップチッチ構築によって導入された分布バイアスを積極的に補正する。
実験によると、MUSARは既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:50:24 GMT)
GRAPHITE: Graph-Based Interpretable Tissue Examination for Enhanced Explainability in Breast Cancer Histopathology [14.8] GRAPHITEは、乳がん組織マイクロアレイ(TMA)解析のために設計された、ポストホックな説明可能なフレームワークである。
140個の腫瘍TMAコアと4個の良性スライド画像から140個の良性サンプルを作成し,53個の病理組織学的TMAサンプルで試験した。
平均平均精度(mAP)は0.56、受信機動作特性曲線(AUROC)は0.94、しきい値ロバスト性(ThR)は0.70である。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:44:07 GMT)
CaRe-Ego: Contact-aware Relationship Modeling for Egocentric Interactive Hand-object Segmentation [14.8] エゴセントリック・インタラクティブ・ハンドオブジェクト・セグメンテーション(EgoIHOS)は補助システムにおける人間の行動を理解する上で重要である。
従来の手法では、視覚的特徴のみに基づいて、手とオブジェクトの相互作用を別個の意味圏として認識していた。
本稿では,2つの側面から手と物体の接触を強調するCaRe-Egoを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:15:18 GMT)
Improved Dimensionality Reduction for Inverse Problems in Nuclear Fusion and High-Energy Astrophysics [14.7] 逆問題は通常、測定パラメータが逆になっていることと、基礎となる物理モデル自体において、大きな不確実性を伴う。
モンテカルロサンプリングは、オートエンコーダや多様体学習のような現代の非線形次元削減技術と組み合わせることで、パラメータ空間のサイズを大幅に削減することができる。
数値アルゴリズムの形式的検証手法の開発における最近の進歩を生かしたハイブリッドアプローチの採用を提唱する。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:34:12 GMT)
fastabx: A library for efficient computation of ABX discriminability [14.6] fastabxは、ABX識別タスクを構築するための高性能なPythonライブラリである。
ABXは、自己教師付き音声表現における音声識別性を評価するために広く使用されている。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:43:01 GMT)
TeDA: Boosting Vision-Lanuage Models for Zero-Shot 3D Object Retrieval via Testing-time Distribution Alignment [14.5] テスト時間分布アライメント(TeDA)は、テスト時に未知の3次元オブジェクトの検索に事前訓練された2次元視覚言語モデルCLIPを適用する新しいフレームワークである。
TeDAは3Dオブジェクトをマルチビューイメージに投影し、CLIPを使って機能を抽出し、3Dクエリの埋め込みを洗練する。
4つのオープンセットの3Dオブジェクト検索ベンチマークの実験により、TeDAは最先端の手法を大幅に上回ることを示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:47:07 GMT)
Modeling Spatial Extremes using Non-Gaussian Spatial Autoregressive Models via Convolutional Neural Networks [14.4] 本稿では,空間的自己回帰モデリングフレームワークを提案する。このフレームワークは,位置とその近傍の観測を独立確率変数にマッピングする。
特に,SARモデルと一般化極値分布の革新について検討し,中心格子位置での観測と近傍の観測を組み合わせた。
本モデルを用いて,ERA-Interim-driven Weather Research and Forecasting (WRF) シミュレーションによる年間降水量の分析を行った。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:26:02 GMT)
Moneros Decentralized P2P Exchanges: Functionality, Adoption, and Privacy Risks [14.2] 分散取引所(DEX)はピアツーピア(P2P)ネットワークを活用し、安全で匿名の資産取引を約束する。
これらのプラットフォームは一般にピアツーピア(P2P)ネットワークを活用し、安全で匿名の資産取引を約束する。
本稿では,モネロ生態系における分散ピアツーピア交換の現況の早期体系化について述べる。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:27:37 GMT)
Semantic Volume: Quantifying and Detecting both External and Internal Uncertainty in LLMs [14.0] 大規模言語モデル (LLM) は、膨大な事実知識を符号化することで、様々なタスクにまたがる顕著な性能を示した。
彼らはまだ幻覚を起こす傾向があり、誤った情報や誤解を招く情報を生み出し、しばしば高い不確実性を伴う。
LLMにおける外部不確実性と内部不確実性の両方を定量化する新しい尺度であるSemantic Volumeを紹介する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:13:30 GMT)
ReplaceMe: Network Simplification via Layer Pruning and Linear Transformations [13.9] ReplaceMeは、大規模言語モデルのトレーニング不要な深度解析手法である。
低圧縮比で高い性能を維持しつつ、変圧器ブロックを線形演算に置き換える。
ReplaceMeを実装したオープンソースのライブラリを,最先端のプルーニング技術とともに提供している。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:47:42 GMT)
Uncertainty-Weighted Image-Event Multimodal Fusion for Video Anomaly Detection [13.9] Image-Event Fusion for Video Anomaly Detection (IEF-VAD)は、RGBビデオから直接イベント表現を合成するフレームワークである。
IEF-VADは、複数の実世界の異常検出ベンチマークにまたがって、新しい技術状態を設定する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:33:20 GMT)
MORE: Mobile Manipulation Rearrangement Through Grounded Language Reasoning [13.5] MOREはゼロショットモバイル操作計画タスクを解決するための言語モデルの能力を高めるための新しいアプローチである。
BEHAVIOR-1Kベンチマークから81の多様な再配置タスクに対してMOREを評価し,ベンチマークのかなりの割合をうまく解決するための最初のアプローチとなる。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:26:03 GMT)
Temporal Robustness in Discrete Time Linear Dynamical Systems [13.3] いくつかの問題では、システムが実行する時間的地平線について不確実性がある。
これにより、システム停止時の状態分布に基づくコスト(または報酬)の不確実性が発生する。
確率単純度上の離散時間マルコフ連鎖と大域安定時間(GAS)離散時間線形力学系との等価性を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:02:33 GMT)
GAME: Learning Multimodal Interactions via Graph Structures for Personality Trait Estimation [13.1] ショートビデオからの明瞭なパーソナリティ分析は、視覚的、聴覚的、およびテキスト的手がかりの複雑な相互作用のため、重要なチャルレンジを呈する。
本稿では,グラフ拡張型マルチモーダル進化法であるGAMEを提案する。
ビジュアルストリームのために、顔グラフを構築し、グラフ畳み込みネットワーク(GCN)と畳み込みニューラルネットワーク(CNN)を組み合わせたデュアルブランチGeo Two-Stream Networkを導入する。
時間的ダイナミクスを捉えるために、フレームレベルの特徴はBiGによって処理される
論文参考訳(メタデータ) (Mon, 05 May 2025 13:48:09 GMT)
Self-reflecting Large Language Models: A Hegelian Dialectical Approach [13.0] 哲学的なレンズによるNLPの探索は、計算手法と古典的な哲学の学派を結びつけることで、研究者の目を引くようになった。
本稿では,LLMのテクスト自己回帰に対するヘーゲル弁証法に触発された哲学的アプローチを紹介する。
提案手法は, 新たなアイデアの創出と, 問題解決におけるLCMの推論能力の向上に有効であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:39:02 GMT)
Can We Recycle Our Old Models? An Empirical Evaluation of Model Selection Mechanisms for AIOps Solutions [13.0] 既存のAIOpsソリューションは通常、定期的なトレーニングを通じてコンセプトドリフトに対してAIOpsモデルをメンテナンスする。
最適なAIOpsモデルを選択する際の能力を評価することにより、いくつかのモデル選択メカニズムを評価する。
また,既存モデル選択法と理論上界との相違点も明らかにした。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:47:18 GMT)
Deep learning of personalized priors from past MRI scans enables fast, quality-enhanced point-of-care MRI with low-cost systems [12.9] 低磁場MRIは安価なデバイスで手頃な画像を提供する。
低信号-雑音比(SNR)や組織コントラストを含む、長い走査と劣化した画像品質によって妨げられる。
我々は,過去の高磁場MRIスキャンから個人化された特徴を抽出するために深層学習を用いる新しい医療パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:55:14 GMT)
Uncertainty in Repeated Implicit Feedback as a Measure of Reliability [12.4] 暗黙的かつ明示的なフィードバックは、人間の相互作用の変動によってノイズを引き起こす。
協調フィルタリングでは、これらの信号がユーザとアイテムの類似性を決定するため、相互作用信号の信頼性が重要となる。
我々は,反復パターンがユーザの関心に影響を及ぼす重要な要因とどのように交わるかを分析し,関連する不確実性を定量化する手法を開発した。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:18:47 GMT)
How do Humans and Language Models Reason About Creativity? A Comparative Analysis [12.4] 評価を用いた例を含む2つの実験が創造性評価にどのように影響するかを検討した。
研究1では、フォーマルな科学や工学のトレーニングで72人の専門家の創造性評価を分析した。
研究2では、最先端のLCMを用いた並列解析により、モデルが独創性を評価する際に、アイデアの非日常性と遠隔性を優先していることが判明した。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:47:32 GMT)
DPNet: Dynamic Pooling Network for Tiny Object Detection [12.3] 画像の縮小は、特に小さなオブジェクトにおいて、検出精度を改善するための一般的な戦略である。
本稿では,これらの問題を緩和する小型物体検出のための動的プールネットワーク(DPNet)を提案する。
TinyCOCOとTinyPersonのデータセットの実験では、DPNetはそれぞれ35%と25%のGFLOPを節約できる。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:13:35 GMT)
An End-to-End Model For Logits Based Large Language Models Watermarking [12.1] 既存の透かし法は、修正されていないコンテンツに効果があるが、テキストが修正されると、大幅な性能低下を被る。
LLM生成テキストの透かしのための新しいエンドツーエンドロジット手法を提案する。
提案手法は, パラフレージングで37~39%, 平均17.2%, 歪みのない手法より優れたロバスト性を実現する。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:50:28 GMT)
FolAI: Synchronized Foley Sound Generation with Semantic and Temporal Alignment [11.8] ビデオから時間的コヒーレントかつ意味論的に制御可能な音響効果を生成する2段階生成フレームワークであるFolAIを紹介する。
その結果、我々のモデルは、時間的に視覚運動に整合し、意味的にユーザ意図と整合し、知覚的にリアルな音声を確実に生成することがわかった。
これらの知見は、FolAIがプロと対話的な環境でスケーラブルで高品質なフォーリー音声合成のための、制御可能でモジュラーなソリューションとしての可能性を強調している。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:55:53 GMT)
Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models [11.8] Generalizable tumorは、さまざまな解剖学的領域にまたがるゼロショット腫瘍セグメンテーションのための単一のモデルを訓練することを目的としている。
DiffuGTSはテキストプロンプトに基づいて、異常対応のオープン語彙アテンションマップを生成する。
4つのデータセットと7つの腫瘍カテゴリの実験により,本手法の優れた性能が示された。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:05:37 GMT)
q-Learning in Continuous Time [11.7] エントロピー規則化探索拡散過程の定式化による強化学習(RL)におけるQ-ラーニングの連続的対応について検討した。
我々は、時間離散化とは無関係なq-函数に関するq-ラーニング理論を開発する。
我々は、根底にある問題を解決するために、異なるアクター批判アルゴリズムを考案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:40:52 GMT)
Impact Analysis of Inference Time Attack of Perception Sensors on Autonomous Vehicles [11.7] 自動運転車の予測時間攻撃に基づく影響分析を提案する。
我々は,エゴ車両と他の交通機関の双方の安全を脅かすために,そのような推定時間攻撃をシミュレーションシステムで実証する。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:00:27 GMT)
TabKAN: Advancing Tabular Data Analysis using Kolmogorov-Arnold Network [11.7] 本稿では,Kolmogorov-Arnold Networks (KANs) を用いた表型データモデリングを支援する新しいフレームワークであるTabKANを紹介する。
Kansは、エッジ上で学習可能なアクティベーション関数をレバージし、解釈可能性とトレーニング効率の両方を改善する。
さまざまな公開データセットの広範なベンチマークを通じて、TabKANは教師付き学習において優れたパフォーマンスを示しながら、トランスファー学習シナリオにおける古典的およびトランスフォーマーベースのモデルを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:59:16 GMT)
Proper Name Diacritization for Arabic Wikipedia: A Benchmark Dataset [11.2] 我々は、英語のウィキペディアと同等の用語で、様々な起源のアラビア語の固有名称を手作業で分類したデータセットを導入する。
GPT-4oは、アラビア語と英語の未分類形態を考慮し、完全発音を回復する作業についてベンチマークを行った。
我々の結果は、タスクの難しさと改善されたモデルとリソースの必要性の両方を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:03:22 GMT)
SAM2MOT: A Novel Paradigm of Multi-Object Tracking by Segmentation [11.2] Segment Anything 2 (SAM2)は、セグメンテーションを使った堅牢な単一オブジェクト追跡を可能にする。
本稿では,多目的追跡のための新しいトラッキング・バイ・パラダイムであるSAM2MOTを提案する。
SAM2MOTはセグメンテーションマスクから直接トラッキングボックスを生成し、検出精度への依存を減らす。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:24:49 GMT)
Large Language Models as Robust Data Generators in Software Analytics: Are We There Yet? [11.2] 敵攻撃は、ソフトウェアシステムの信頼性とセキュリティを損なう可能性がある。
LLM(Large Language Model)が生成したデータと人書きデータとがどのように比較されるかは明らかでない。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:01:36 GMT)
Learning and Online Replication of Grasp Forces from Electromyography Signals for Prosthetic Finger Control [10.4] 部分的手切断は個人の身体的および精神社会的幸福に著しく影響を及ぼす。
筋電図(EMG)信号によって活性化される力制御義指を開発した。
ニューラルネットワークに基づくモデルが実装され、EMG入力から指先力を推定し、義指の握力のオンライン調整を可能にした。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:23:51 GMT)
RouthSearch: Inferring PID Parameter Specification for Flight Control Program by Coordinate Search [10.0] 飛行制御プログラムは、UAV飛行行動を管理するために、ユーザ設定可能なP、Integral(I)パラメータ、デリバティブ(D)パラメータを備えたPID制御モジュールを使用する。
ユーザはPIDパラメータを誤って設定し、期待されるパスからの逸脱、コントロールの喪失、クラッシュなどの危険な状態を引き起こす。
これまではファジングのようなランダムなテストが用いられていたが、これらはPIDパラメータの3次元探索空間では有効ではない。
RouthSearchは原則として3次元PIDパラメータの有効範囲を決定する。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:38:48 GMT)
SymbioticRAG: Enhancing Document Intelligence Through Human-LLM Symbiotic Collaboration [9.8] 我々は,人間と機械の双方向学習関係を確立することにより,検索・拡張生成(RAG)システムを再構築する新しいフレームワークであるtextbfSymbioticRAGを提案する。
現在のRAGシステムにおける2つの重要な課題に対処する: 関連性決定の人間中心の性質と、クエリの定式化における「無意識の非能力」からのユーザの進歩である。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:24:38 GMT)
DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction [9.6] スパースビュー再構成は、画質を維持しながらX線投影を少なくすることで放射線を低減させる。
既存の手法では、高い計算要求や異なるデータセットに対する一般化性の欠如といった課題に直面している。
マルチビュー2次元特徴とマルチスケール3次元特徴を統合した新しいネットワークであるDiCEを特徴とする,スパースビューCBCT再構成のための最初の基盤モデルであるDeepSparseを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:14:49 GMT)
RobSurv: Vector Quantization-Based Multi-Modal Learning for Robust Cancer Survival Prediction [9.5] 多モード医用画像を用いた癌生存予測は腫瘍学において重要な課題である。
最近のアプローチでは、異種CTおよびPET画像から一貫した特徴を抽出し、臨床応用性を制限している。
レジリエントなマルチモーダル機能学習にベクトル量子化を活用する,堅牢なディープラーニングフレームワークであるRobSurvを紹介する。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:10:03 GMT)
Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology [9.3] 強力な機械学習性能(例:87% mAP)を持つモデルでさえ、専門家由来のデータと比較して、アバンダンス推定に矛盾をもたらすデータが得られることを示す。
これらの知見に触発され,生態・生物学的データセットにアプリケーション固有の指標を統合するよう研究者に呼びかけた。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:51:56 GMT)
Adaptive Anomaly Detection in Network Flows with Low-Rank Tensor Decompositions and Deep Unrolling [9.2] 異常検出(AD)は、将来の通信システムのレジリエンスを確保するための重要な要素として、ますます認識されている。
この研究は、不完全測定を用いたネットワークフローにおけるADについて考察する。
本稿では,正規化モデル適合性に基づくブロック帰属凸近似アルゴリズムを提案する。
ベイズ的アプローチに触発されて、我々はモデルアーキテクチャを拡張し、フローごとのオンライン適応とステップごとの統計処理を行う。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:23:02 GMT)
Unveiling the Mechanisms of Explicit CoT Training: How CoT Enhances Reasoning Generalization [9.2] 大規模言語モデルの学習における明示的連鎖理論(CoT)の統合は、その推論能力を向上させるが、CoTが一般化を強化するメカニズムはいまだよく理解されていない。
本研究は,(1)テキストショーCoTトレーニングが内部モデル表現を再評価し,(2)テキストトウハウは分布内(ID)と分布外(OOD)の両方を一般化する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:01:06 GMT)
Entropy-Guided Sampling of Flat Modes in Discrete Spaces [9.1] 既存のサンプリングアルゴリズムは、しばしばモードボリュームを見落とし、フラットモードを効果的に捉えるのに苦労する。
本研究では, 局所エントロピーを連続的補助変数によるサンプリングプロセスに組み込んだEmphEntropic Discrete Langevin Proposal (EDLP)を提案する。
局所対数対数離散分布におけるEDLPの非漸近収束保証を提供する。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:12:34 GMT)
Generative Sign-description Prompts with Multi-positive Contrastive Learning for Sign Language Recognition [9.0] 本稿では,GSP-MC法を提案する。
GSP-MC法はまた、二重エンコーダアーキテクチャを用いて、階層的なスケルトン特徴と複数のテキスト記述を双方向にアライメントする。
実験では、中国のSLR500(97.1%)とトルコのAUTSLデータセット(97.07%の精度)の既存の手法に対する最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:57:57 GMT)
Sim2Real in endoscopy segmentation with a novel structure aware image translation [9.0] 本研究は,シミュレートされた内視鏡画像に現実的なテクスチャを加える新しい画像翻訳モデルである。
大腸内視鏡画像における折り畳み分割の課題に対するアプローチを実証する。
新しいデータと新しいEMメタデータがリリースされ、さらなる研究が進められています。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:56:59 GMT)
IntelliCardiac: An Intelligent Platform for Cardiac Image Segmentation and Classification [8.8] 我々は4次元心臓画像の自動分割と疾患分類のためのWebベースのプラットフォームであるIntelliCardiacを紹介した。
IntelliCardiacはディープラーニングベースのセグメンテーションモデルと2ステップの分類パイプラインを組み合わせる。
この分類モジュールは、セグメンテーションされた心臓構造から得られる特徴に基づいて訓練され、5つのカテゴリで98%の精度を達成している。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:09:31 GMT)
Which exceptional low-dimensional projections of a Gaussian point cloud can be found in polynomial time? [8.7] 反復アルゴリズムのクラスで実現可能な分布のサブセット$mathscrF_m,alpha$について検討する。
統計物理学の非厳密な手法は、一般化されたパリの公式の言葉で$mathscrF_m,alpha$の間接的な特徴づけを与える。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:01:13 GMT)
Overparametrized linear dimensionality reductions: From projection pursuit to two-layer neural networks [8.7] 我々は$mathbbRd$の$nデータポイントのクラウドを考え、$mathbbRd$の$m$次元部分空間上のすべての射影を考える。
この確率分布の集まりは、$n,d$が大きくなるとどのように見えるか?
Kullback-Leibler の発散と R'enyi の情報次元の点で鋭い境界を証明している。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:05:14 GMT)
Memorization or Interpolation ? Detecting LLM Memorization through Input Perturbation Analysis [8.7] 大規模言語モデル(LLM)は,大規模なデータセットのトレーニングを通じて,優れたパフォーマンスを実現する。
LLMは、真の一般化ではなく、トレーニングデータの冗長な再現のような振る舞いを示すことができる。
本稿では, LLMにおける暗記検出のための新しい手法であるPEARLを紹介する。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:42:34 GMT)
Energy-Efficient Flying LoRa Gateways: A Multi-Agent Reinforcement Learning Approach [8.7] 無人航空機(UAV)に搭載された空飛ぶLoRaゲートウェイを配置し、LoRaのエンドデバイスからデータを収集し、それを中央サーバに送信する。
我々の主な目的は、送信電力、拡散係数、帯域幅、ユーザアソシエーションの合同最適化により、無線LoRaネットワークのグローバルシステムエネルギー効率を最大化することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:46:29 GMT)
Liver Cirrhosis Stage Estimation from MRI with Deep Learning [8.6] マルチシーケンスMRIを用いた肝硬変自動ステージ推定のためのエンドツーエンドディープラーニングフレームワークを提案する。
本手法は,肝硬変進行段階の微妙な組織変化を捉えるために,多段階的特徴学習とシーケンス特異的注意機構を統合した。
我々の最良のモデルは、T1Wで72.8%、T2Wで63.8%の精度を達成し、従来のラジオミクスベースのアプローチよりも大幅に優れている。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:25:33 GMT)
FissionVAE: Federated Non-IID Image Generation with Latent Space and Decoder Decomposition [8.4] フェデレートされた学習により、分散化されたクライアントは、すべてのトレーニングデータをローカルに保ちながら、共有モデルを共同で学習することができる。
本稿では,異なるタイプの複数の画像群を特徴とする非IIDデータ環境の課題に対処する。
本稿では、潜在空間を分離し、個々のクライアントグループに適したデコーダブランチを構築するFissionVAEを紹介する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:51:42 GMT)
Developing A Framework to Support Human Evaluation of Bias in Generated Free Response Text [8.4] 本稿では,自由テキスト応答のための半自動バイアス評価フレームワークの開発に向けての道程について述べる。
我々は、パイプラインの自動化を支援するバイアスの運用定義と、複数の選択を越えてバイアスを分類する方法論をどのように開発したかについて議論した。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:26:55 GMT)
Enhancing Chemical Reaction and Retrosynthesis Prediction with Large Language Model and Dual-task Learning [8.4] 大規模言語モデル(LLM)は、多くの領域において可能性を示している。
ChemDualは正確な化学合成のための新しいフレームワークである。
ChemDualは反応の予測とレトロ合成の両方において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:31:36 GMT)
End-to-end fully-binarized network design: from Generic Learned Thermometer to Block Pruning [8.3] 本稿では、バイナリニューラルネットワーク(BNN)の入力データ表現を改善する符号化技術であるジェネリック学習温度計(GLT)を紹介する。
我々は,GLTが本質的にグローバルトーンマッピングを行うことで,BNNに汎用性をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:50:29 GMT)
ReeM: Ensemble Building Thermodynamics Model for Efficient HVAC Control via Hierarchical Reinforcement Learning [8.3] 熱力学モデルの構築は、潜在的HVAC制御操作下でのリアルタイム屋内温度変化を予測する。
これらのモデルは、しばしば広範囲なデータ収集期間を必要とし、専門家の知識に大きく依存し、モデリングプロセスを非効率にし、モデルの再利用可能性を制限する。
本稿では,既存のモデルを用いたモデルアンサンブルの視点について検討する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:09:36 GMT)
Quantum Codes with Addressable and Transversal Non-Clifford Gates [8.2] 我々は、$textitaddressable$ logical gateを誘導するゲートをサポートするコードを研究する。
我々は、$textitaddressable と $ell neq 2$ gates で量子コードを構築するフォーマリズムを開発する。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:28:45 GMT)
Conformal Predictive Programming for Chance Constrained Optimization [8.2] 本稿では,確率変数の関数である制約を持つ最適化問題を解くために,共形予測プログラミング(CPP)を提案する。
量子化再構成のトラクタブルな解を実現するために、混合整数計画法(CPP-MIP)エンコーディング、二レベル最適化戦略(CPP-Bilevel)、サンプリング・アンド・破棄最適化戦略(CPP-Discarding)を提案する。
一連のケーススタディにおいて、上記のアプローチの有効性を示し、CPP-MIP、CPP-Bilevel、およびCPP-Discardingを比較し、シナリオと比較してCPPの利点を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:42:41 GMT)
Parameter-Efficient Fine-Tuning with Attributed Patch Semantic Graph for Automated Patch Correctness Assessment [8.0] 自動プログラム修復(APR)は、人間の介入なしにプログラムエラーを自動的に修復することを目的としている。
多くの研究がAPCA(Automatic patch correctness Assessment)に費やされている。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:15:53 GMT)
Quaternion Wavelet-Conditioned Diffusion Models for Image Super-Resolution [8.0] 本稿では、第4次ウェーブレット前処理フレームワークと遅延拡散モデルを統合する新しいSRフレームワークResQuを紹介する。
提案手法は,四元系ウェーブレットの埋め込みを利用して,様々な段階で動的に統合される条件付けプロセスを強化する。
提案手法は,多くの場合において,知覚品質および標準評価指標における既存手法よりも優れる,優れたSR結果が得られる。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:20:23 GMT)
Sim2Real Transfer for Vision-Based Grasp Verification [7.9] 本稿では,ロボットグリップが物体の把握に成功しているかどうかを判断するために,視力に基づく検証手法を提案する。
本手法は,ロボットのグリップを検知し,検出するための,最初のYOLOに基づく物体検出モデルである2段階アーキテクチャを用いている。
実世界のデータキャプチャの限界に対処するために,多様な把握シナリオをシミュレートする合成データセットであるHSR-Grasp Synthを導入する。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:04:12 GMT)
Geometric Knowledge-Guided Localized Global Distribution Alignment for Federated Learning [7.9] 本研究では,グローバルな埋め込み分布を局所的にシミュレートすることに焦点を当てた幾何学誘導型データ生成手法を提案する。
まず,埋め込み分布の幾何学的形状の概念を紹介する。
そして、プライバシー制約の下でグローバルな幾何学的形状を得るという課題に対処する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:38:40 GMT)
Joint Problems in Learning Multiple Dynamical Systems [7.8] 時系列のクラスタリングはよく研究されている問題であり、代謝物濃度から得られる代謝の定量的にパーソナライズされたモデルから、量子情報理論における状態判別まで幅広い応用がある。
我々は,一組のトラジェクトリと複数のパーツを与えられた場合,各パーツのトラジェクトリと線形力学系(LDS)モデルを共同で分割し,全てのモデルにおける最大誤差を最小化するために検討する。
本稿では,グローバル収束法とEMを,有望な計算結果とともに提示する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:49:12 GMT)
Sailing AI by the Stars: A Survey of Learning from Rewards in Post-Training and Test-Time Scaling of Large Language Models [7.8] 大規模言語モデル(LLM)の最近の発展は、事前学習のスケーリングから後学習のスケーリングへと移行している。
これらの開発全体において、重要な統一パラダイムが生まれている。
報奨からの学習のパラダイムを概観する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:33:49 GMT)
Knowledge-guided machine learning for county-level corn yield prediction under drought [7.8] リモートセンシング(RS)技術は、広範囲の地上観測を非接触で取得することを可能にし、収穫量の予測に有用なツールである。
従来のプロセスベースのモデルは、大量のRSデータを組み込むのに苦労している。
機械学習(ML)モデルは、その限定的な解釈可能性のため、しばしば「ブラックボックス」として批判される。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:01:27 GMT)
"Trust me on this" Explaining Agent Behavior to a Human Terminator [7.8] 人間の介入数を最適化するための説明可能性スキームを提案する。
本稿では、この設定を形式化し、人間の介入数を最適化するための説明可能性スキームを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:48:40 GMT)
Inference-friendly Graph Compression for Graph Neural Networks [7.7] グラフニューラルネットワーク(GNN)は,グラフ解析において有望な性能を示した。
本稿では、GNNの推論を高速化するために、IFGC(inference- friendly graph compression)を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:06:16 GMT)
Urban Forms Across Continents: A Data-Driven Comparison of Lausanne and Philadelphia [7.7] 本研究では,地理的・文化的に異なる都市間での都市型を識別・比較するためのデータ駆動型枠組みを提案する。
ローザンヌ市,スイス市,フィラデルフィア市において,地形,多様性,緑地,興味点に関連する多次元的特徴を抽出した。
その結果, 規模, 密度, 文化状況の相違にもかかわらず, 両都市にまたがるクラスタタイプが出現している。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:13:22 GMT)
A Cognitive-Mechanistic Human Reliability Analysis Framework: A Nuclear Power Plant Case Study [7.6] 本研究では,IDHEAS-ECA方法論を強化する認知機械的枠組み(COGMIF)を提案する。
ACT-Rベースのヒューマンデジタルツイン(HDT)とTimeGAN強化シミュレーションを統合している。
TimeGANはACT-R生成時系列データに基づいてトレーニングされ、高忠実な合成演算子挙動データセットを生成する。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:28:11 GMT)
Towards One-shot Federated Learning: Advances, Challenges, and Future Directions [7.5] ワンショットFLは、1ラウンドでの協調トレーニングを可能にし、反復的なコミュニケーションの必要性を排除します。
ワンショットFLは、データローカリティを維持しながらシングルラウンドモデルアグリゲーションを可能にすることで、リソース制限デバイスをサポートする。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:46:21 GMT)
REPLAY: Modeling Time-Varying Temporal Regularities of Human Mobility for Location Prediction over Sparse Trajectories [7.5] 位置予測のための時間変化の時間的規則性を把握するための一般RNNアーキテクチャ学習であるREPLAYを提案する。
特に、REPLAYは、情報の隠された過去の状態を探すために、スパース軌跡の距離を利用するだけでなく、時間変化の時間的規則性も許容する。
その結果、REPLAYは、位置予測タスクにおいて、最先端の手法を7.7%-10.5%向上させる。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:48:08 GMT)
Learning-Guided Fuzzing for Testing Stateful SDN Controllers [7.4] SeqFuzzSDNは、ステートフルなSDNコントローラをテストするための学習誘導ファジリング手法である。
本稿では,SeqFuzzSDNを3種類の最先端(SOTA)メソッド拡張と比較する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:06:44 GMT)
6D Pose Estimation on Spoons and Hands [7.2] 本稿では,食事中のビデオフィードを定常的に分析するシステムを実装した。
6次元ポーズ推定を用いて手とスプーンの動きを追跡し、空間的位置と向きを捉える。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:15:12 GMT)
UCSC at SemEval-2025 Task 3: Context, Models and Prompt Optimization for Automated Hallucination Detection in LLM Output [7.1] SemEval 2025 Task 3, Mu-SHROOM: Shared-task on Hallucinations and Related Observable Overgeneration misstakes, is a recent efforts in this direction。
本稿では,UCSC システムを共有 Mu-SHROOM タスクに適用する。
まず、関連するコンテキストを検索し、次に回答から偽のコンテンツを特定し、最終的にLLM出力のスパンにマップするフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:15:40 GMT)
Truncated LinUCB for Stochastic Linear Bandits [7.1] LinUCBアルゴリズムは、関連する線形帯域に最適に近い最小値である。
LinUCBのtruncatedバージョンが提案され、Tr-LinUCBと呼ばれている。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:13:21 GMT)
A Rate-Quality Model for Learned Video Coding [7.1] 我々は、RQNetと呼ばれるニューラルネットワークを学習し、ビデオの内容とコーディングコンテキストによる品質レベルの関係を特徴付ける。
従来の手法と比較して,提案手法はR-Q関係を正確に推定し,モデルパラメータのオンライン適応を可能にする。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:19:18 GMT)
Dual Prompting for Diverse Count-level PET Denoising [7.0] 本稿では,PETを分割・縮小的に誘導する2つのプロンプトを提案する。
不均一なプロンプトを統一するために新規なプロンプト融合モジュールが開発された。
プロンプトは、ノイズ条件付き遮音処理を動的に導くことができる。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:27:23 GMT)
Dynamic Importance in Diffusion U-Net for Enhanced Image Synthesis [6.9] U-Net内のTransformerブロックの出力を再重み付けすることは、サンプリングプロセス中に信号対雑音比を改善する「フリーランチ」である。
そこで本稿では,トランスフォーマーブロックの重要性の動的シフトを明らかにし,定量化するためのImportance Probeを提案する。
我々は、特定の画像生成および編集タスクに適した適応的重要度に基づく再重み付けスケジュールを設計する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:32:15 GMT)
M3-Jepa: Multimodal Alignment via Multi-directional MoE based on the JEPA framework [6.9] M3-Jepaはスケーラブルなマルチモーダルアライメントフレームワークであり、専門家の多方向混合によって実装された予測器を備えている。
我々は,M3-Jepaが様々なモダリティやタスクの最先端性能を達成でき,未知のデータセットやドメインに一般化でき,学習や推論において計算効率がよいことを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:48:19 GMT)
Bayesian Analysis for Over-parameterized Linear Model via Effective Spectra [6.9] 我々は,データ適応型ガウス前処理を導入し,その環境次元よりもデータ固有の複雑さを目標とした。
我々は、スペクトルの質量が予測誤差境界にどのように影響するかを明らかにするために、対応する後部分布の収縮率を確立する。
ベイジアン法は,非スパース,高次元の設定において,データのスペクトル情報を利用した推定に有効であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:41:41 GMT)
A Unifying Framework to Enable Artificial Intelligence in High Performance Computing Workflows [6.9] 最近のトレンドは、大規模科学応用が密結合されたHPC/AIハイブリッドである未来を示唆している。
私たちは、HPCとAI/MLが効率的に連携できるシームレスでスケーラブルなフレームワークの開発に、緊急に投資する必要があります。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:44:23 GMT)
Model-agnostic clean-label backdoor mitigation in cybersecurity environments [6.9] 近年の研究では、セキュリティ分類タスク用に設計されたモデルにバックドアを注入する、一連の悪質な訓練時間攻撃が表面化している。
我々は、サイバーセキュリティ脅威モデルの洞察を活用して、これらのクリーンラベル中毒攻撃を効果的に軽減する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:25:13 GMT)
Dance of Fireworks: An Interactive Broadcast Gymnastics Training System Based on Pose Estimation [6.9] ダンス・オブ・ファイアワークス(Dance of Fireworks)は、放射性カリセニクスにおけるエンゲージメントを高めることで、鎮静的健康リスクに対処するために設計されたインタラクティブなシステムである。
このシステムは、ボディキーポイントを抽出し、関節角を計算し、それらを標準化されたモーションと比較し、リアルタイムな修正フィードバックを提供する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:41:06 GMT)
A probabilistic view on Riemannian machine learning models for SPD matrices [6.8] 我々は,SPD(Symmetric Positive Definite)行列の$mathcalP_d$の異なる機械学習ツールが,確率的フレームワークの下でどのように統合できるかを示す。
これらのディストリビューションが$mathcalP_d$で使用されるツールで広く使われていることを示すことで、他の機械学習ツールを$mathcalP_d$に拡張できるようにします。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:50:06 GMT)
Radio: Rate-Distortion Optimization for Large Language Model Compression [6.7] 大規模言語モデル(LLM)の圧縮は、リソース制限されたデバイスへのLLM展開を促進する上で重要な問題となっている。
簡単な速度歪み最適化に基づく量子化手法を提案する。
我々の手法は、数十億の重みパラメータを含むモデルにスケールし、ユーザーが指定したモデルサイズや精度にモデルを圧縮する柔軟性を提供する。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:17:14 GMT)
Enhancing LLMs' Clinical Reasoning with Real-World Data from a Nationwide Sepsis Registry [6.7] 実世界の臨床データを活用することで,大規模言語モデル(LLM)の臨床推論能力を向上させることを提案する。
強化学習を用いて, セプシスレジストリとPhi-4を微調整し, 推論集約的な質問文を構築した。
C-Reasonは、定量測定と専門家評価の両方で証明されているように、ドメイン内テストセットに強力な臨床推論能力を示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:23:47 GMT)
EMORL: Ensemble Multi-Objective Reinforcement Learning for Efficient and Flexible LLM Fine-Tuning [6.7] 個別の目的を持つ複数のモデルを微調整するEnsemble Multi-Objective RL (EMORL) フレームワークを提案する。
本手法は,複数の目的からコンテキスト情報を組み込んで,各モデルの最後に隠された状態を収集する最初の方法である。
PAIR と Psych8k データセットの実験において,EMORL の既存のベースラインに対する利点を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:30:46 GMT)
Unsupervised training of keypoint-agnostic descriptors for flexible retinal image registration [6.6] 我々はキーポイント検出に依存しない新しい教師なし記述子学習法を開発した。
これにより、結果として生じるディスクリプタネットワークは、登録推論中に使用されるキーポイント検出器に非依存となる。
提案手法は, 教師付き手法と比較して, 性能損失を発生させることなく, 正確な登録を行うことを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:02:13 GMT)
Unsupervised Deep Learning-based Keypoint Localization Estimating Descriptor Matching Performance [6.6] カラーファンドス画像のための新規な教師なし登録パイプラインを提案する。
我々のアプローチは、特異な記述子を持つ位置が信頼できるキーポイントを構成するという原則に基づいている。
4つのホールドアウトデータセットの包括的評価により,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:46:32 GMT)
Beyond Flatland: A Geometric Take on Matching Methods for Treatment Effect Estimation [6.5] 本稿では,既存の因果機構によって誘導される内在データ幾何を考慮した治療効果を推定するマッチング手法を提案する。
我々は、GeoMatchingがより効果的に治療効果を推定できることを示す、合成および実世界のシナリオにおける理論的洞察と実証結果を提供する。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:50:26 GMT)
Catastrophic Overfitting, Entropy Gap and Participation Ratio: A Noiseless $l^p$ Norm Solution for Fast Adversarial Training [6.4] 我々は,破滅的オーバーフィッティング(CO)を緩和するために,$lp$のトレーニング規範を制御する新しいソリューションを提案する。
我々の研究は、COが$l2$ノルムよりも$linfty$ノルムでより広く見られるという経験的観察によって動機づけられている。
参加率とエントロピー測定による勾配濃度の定量化により、勾配情報に基づいてトレーニング基準を自動的に調整する適応的な$lp$-FGSMを開発する。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:41:21 GMT)
LLM-3D Print: Large Language Models To Monitor and Control 3D Printing [6.3] 産業4.0は、デジタル化を推進し、添加性製造(AM)へのパラダイムシフトによって製造に革命をもたらした。
重要なAM技術であるFDMは、層間押出による最小限の材料廃棄物による、高度にカスタマイズされたコスト効率の高い製品の作成を可能にする。
本稿では,3Dプリンタとともに学習済みのLarge Language Models(LLM)を利用して,印刷欠陥の検出と対処を行うプロセス監視・制御フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:53:58 GMT)
Improving Code Reviewer Recommendation: Accuracy, Latency, Workload, and Bystanders [6.3] 文献でよく使われている特徴に基づいた新しいレコメンデーターを開発した。
2022年春の82k差分におけるA/Bテストでは、新しい推奨値の方が正確で、レイテンシが低かった。
2023年春に12.5kの著者を対象にA/B試験を行い,推奨個人を指定した場合の差分処理に要する時間を大幅に削減した。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:23 GMT)
CleAR: Robust Context-Guided Generative Lighting Estimation for Mobile Augmented Reality [6.3] 没入型モバイル拡張現実(AR)体験を実現するためには,高品質な環境照明が不可欠である。
異なる種類のプロンプトから高品質な画像を生成することができる生成AIの最近の進歩は、高品質な照明推定の潜在的解決策を示す。
我々は、高品質で多様な環境マップを作成できるCleARと呼ばれるジェネレーティブ照明推定システムの設計と実装を行った。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:58:02 GMT)
Probing mixed-state phases on a quantum computer via Renyi correlators and variational decoding [6.3] 我々はQuantinuumのH1量子コンピュータ上で混合状態相を実験的に探索し特徴付ける。
我々の研究は、混合状態相の量子シミュレーションとキャラクタリゼーションのための概念実証である。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:00:01 GMT)
Adaptive Scoring and Thresholding with Human Feedback for Robust Out-of-Distribution Detection [6.2] 機械学習(ML)モデルは、ID(In-distriion)データに基づいてトレーニングされるが、デプロイ中にOOD(out-of-distriion)入力に遭遇することが多い。
最近の研究は、OODの不確実性を定量化するためのスコアリング関数の設計に重点を置いている。
我々は,実世界のOOD入力に基づいて,フライ時のスコアリング機能としきい値の両方を即時更新するヒューマン・イン・ザ・ループ・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:25:14 GMT)
Efficient Continual Learning in Keyword Spotting using Binary Neural Networks [6.2] キーワードスポッティング(KWS)はユビキタススマートデバイスとのインタラクションを可能にする重要な機能である。
リソース制限されたデバイスでは、KWSモデルは多くの場合静的であり、追加のキーワードのような新しいシナリオに適応できない。
バイナリニューラルネットワーク(BNN)上に構築したKWSに対する連続学習(CL)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:54:19 GMT)
SCFormer: Structured Channel-wise Transformer with Cumulative Historical State for Multivariate Time Series Forecasting [6.2] 累積履歴状態を持つ構造化チャネルワイド変圧器(SCFormer)を提案する。
SCFormerは、クエリ、キー、値行列を含むすべての線形変換と、Transformer内の完全に接続されたレイヤに時間的制約を導入する。
複数の実世界のデータセットの実験では、SCFormerがメインストリームのベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:59:55 GMT)
Hard-Constrained Neural Networks with Universal Approximation Guarantees [6.0] HardNetは、モデルキャパシティを犠牲にすることなく、本質的に厳しい制約を満たすニューラルネットワークを構築するためのフレームワークである。
ニューラルネットワークの普遍近似能力はHardNetが保持していることを示す。
我々は,HardNetを,断片的制約による学習,最適化解法の学習,安全クリティカルシステムにおける制御ポリシの最適化,航空機システムに対する安全な決定ロジックの学習など,さまざまなアプリケーションで実証する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:58:28 GMT)
Large Language Model Partitioning for Low-Latency Inference at the Edge [6.0] 自動回帰に基づく大規模言語モデル(LLM)では、デコーダのみのトランスフォーマーがテキストを1つずつ生成し、トークンは個々のテキスト単位を表す。
この反復的プロセスは、メモリと計算要求を着実に増加させるため、リソース制約のあるエッジ環境における層ベースのパーティショニングは、しばしばメモリ過負荷や高い推論遅延をもたらす。
本稿では,トークン生成時に一定間隔で分割決定を更新するリソース対応トランスフォーマーアーキテクチャ分割アルゴリズムを提案する。
当社のアプローチでは,アテンションヘッドレベルでデコーダを分割し,各アテンションヘッドとキーバリューキャッシュを同時配置し,リソースが密着するたびに動的マイグレーションを可能にする。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:16:16 GMT)
Gone With the Bits: Revealing Racial Bias in Low-Rate Neural Compression for Facial Images [6.0] 本稿では,ニューラルネットワーク圧縮モデルにおけるバイアス評価のための汎用的,構造化された,スケーラブルなフレームワークを提案する。
従来の歪み指標は, ニューラル圧縮モデルにおけるバイアスの捕捉に有効でないことを示す。
さらに、圧縮モデルバイアスと分類モデルバイアスに起因するバイアスを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:27:11 GMT)
DELTA: Dense Depth from Events and LiDAR using Transformer's Attention [5.9] 本稿では,深度マップを推定するために,イベントとLiDARデータを融合するニューラルネットワークに基づく新しい手法を提案する。
我々のアーキテクチャであるDELTAは、イベントとLiDARデータの空間的および時間的関係をモデル化するために、自己および横断的意図の概念を利用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:59:53 GMT)
Constructive Approach to Bidirectional Influence between Qualia Structure and Language Emergence [5.9] 本稿では,言語出現と主観的経験の構造の双方向的影響について考察する。
分布意味論を持つ言語の出現は、経験によって形成される内部表現の協調と関連していると仮定する。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:26:36 GMT)
An Empirical Study on the Performance and Energy Usage of Compiled Python Code [5.8] Pythonは、学習の容易さと広範なライブラリで知られる人気のあるプログラミング言語である。
性能とエネルギー効率を比較した分析は限られている。
本研究では,コンパイルがPythonコードの性能とエネルギー消費に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:01:56 GMT)
Evaluating the Impact of AI-Powered Audiovisual Personalization on Learner Emotion, Focus, and Learning Outcomes [5.8] 我々は、LLMを用いてパーソナライズされたマルチ感覚学習環境を生成するAIシステムを導入する。
本研究は,パーソナライズされた視覚要素の組み合わせが学習者の認知負荷とエンゲージメントに与える影響について考察する。
本研究の目的は、感情に反応する教育技術を進化させ、マルチモーダル LLM を自己指向学習の感覚次元に応用することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:19:50 GMT)
Resolving Memorization in Empirical Diffusion Model for Manifold Data in High-Dimensional Spaces [5.7] 慣性拡散モデル(Inertial diffusion model)は、新しいデータサンプルを生成する一般的な計算ツールである。
我々は、慣性拡散モデルサンプル分布を選択することは、次元$d$の$C2$多様体上のデータ分布の$Oleft(n-frac2d+4right)$Wasserstein-1近似であることを示す。
注目すべきは、この上界が周囲空間次元から完全に解放されることである。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:40:41 GMT)
Adaptive Budgeted Multi-Armed Bandits for IoT with Dynamic Resource Constraints [5.7] モノのインターネットシステムは、変動するリソース制約を管理しながら、デバイスがリアルタイムで応答しなければならない環境でますます運用される。
動的動作制限のあるIoTアプリケーションに適した,新しいBudgeted Multi-Armed Banditフレームワークを提案する。
このモデルでは,学習過程の早い段階で制限された制約違反を許容し,時間とともに厳格なコンプライアンスを徐々に実施する,崩壊する違反予算を導入している。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:33:39 GMT)
Estimating Commonsense Scene Composition on Belief Scene Graphs [5.6] この研究は、Belief Scene Graphsの拡張に焦点を当てたコモンセンスシーンコンポジションの概念を確立している。
特に、コモンセンスシーン構成能力は、シーン内の関連オブジェクト間の空間的関係を理解することを指す。
このフレームワークは、シミュレーションデータによる複数の実行と、実際の屋内環境を通じて検証されている。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:55:59 GMT)
LAMeD: LLM-generated Annotations for Memory Leak Detection [5.5] 機能固有のアノテーションを自動的に生成する新しいアプローチであるLAMeDを提案する。
Cooddyのようなアナライザと統合すると、LAMeDはメモリリークの検出を大幅に改善し、パスの爆発を低減する。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:34:33 GMT)
Experimental demonstration of the Bell-type inequalities for four qubit Dicke state using IBM Quantum Processing Units [5.4] 我々は,IBM量子処理ユニット(QPU)上の2ビットおよび4ビットディック状態を用いたベル型不等式違反の理論的,実験的検討を行った。
2ビットの場合、我々はCHSHの不等式に明らかな違反を示し、最も高い観測値であるベルパラメータはM3誤差緩和を用いて2.821 pm 0.0019$に達した。
4ビットの場合、我々はディック状態に適したベル式不等式を採用し、追加の緩和を必要とせずに最大2.607 pm 0.029$の違反を達成する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:49:24 GMT)
Economic Security of Multiple Shared Security Protocols [5.3] 我々は、多重SSP問題を形式化し、2つのアーキテクチャを解析する。
Model $mathbbM$と呼ばれる独立した断片化モデルと、Model $mathbbS$と呼ばれる共有統一モデルが研究されている。
以上の結果から,Model $mathbbM$はデプロイの柔軟性を提供するが,最小コストの攻撃脆弱性を継承する一方で,Model $mathbbS$は単一のバリデータセットと集約スラッシュロジックを通じて,より厳密なセキュリティ保証を実現することがわかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:40:16 GMT)
Efficient State Space Model via Fast Tensor Convolution and Block Diagonalization [5.3] 本稿では,マルチインプットマルチアウトプットSSMに基づく新しい状態空間層,すなわち効率的なSSMを提案する。
我々のeSSMは、マルチインプットおよびマルチインプット(MIMO)SSMの畳み込み表現に基づいて構築されている。
モデル効率ベンチマークでは、eSSMのパラメータはLSTMの12.89%、Mambaの13.24%に過ぎなかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:20:07 GMT)
Unveiling the Landscape of LLM Deployment in the Wild: An Empirical Study [5.2] 大規模言語モデル(LLM)は、オープンソースおよび商用フレームワークを通じてますますデプロイされ、個人や組織が高度なAI機能を自己ホストできるようになる。
安全でないデフォルトと設定ミスはしばしばLLMサービスをパブリックインターネットに公開し、セキュリティとシステムエンジニアリングの重大なリスクを生じさせる。
本研究は、大規模実証研究を通じて、野生における公共のLLM展開の現況を明らかにすることを目的としている。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:30:19 GMT)
DAGNet: A Dual-View Attention-Guided Network for Efficient X-ray Security Inspection [5.2] 我々は、効率的なX線セキュリティ検査(DAGNet)のためのデュアルビュー注意誘導ネットワークを提案する。
本研究は,共有重み付きバックボーンネットワークを基盤として,協調動作する3つの重要なモジュールを構築した。
DAGNetは、複数のバックボーンアーキテクチャにまたがる既存の最先端アプローチよりも優れていることを示す実験結果が得られた。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:31:11 GMT)
JTCSE: Joint Tensor-Modulus Constraints and Cross-Attention for Unsupervised Contrastive Learning of Sentence Embeddings [5.2] 我々は,新しい textbfJoint textbfTensor representation modulus constraint と textbfCross-attention unsupervised contrastive learning textbfSentence textbfEmbedding representation framework JTCSE を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:09:21 GMT)
Invoke Interfaces Only When Needed: Adaptive Invocation for Large Language Models in Question Answering [5.1] 本研究では,AttenHScoreと呼ばれる実用的な呼び出し評価指標を提案する。
小さなLMの生成過程における幻覚の蓄積と伝播を計算する。
検出しきい値を動的に調整することにより、大きなLMのより正確なリアルタイム実行を実現する。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:45:56 GMT)
Connecting Thompson Sampling and UCB: Towards More Efficient Trade-offs Between Privacy and Regret [5.1] DP-TS-UCBは,プライバシと後悔の交換を可能にする,新しいパラメタライズドプライベートバンディットアルゴリズムである。
DP-TS-UCBは、トンプソンサンプリングに基づくアルゴリズムにおいて、ガウス分布の反集中境界とリンク探索機構に依存している。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:48:52 GMT)
SafeMate: A Model Context Protocol-Based Multimodal Agent for Emergency Preparedness [5.0] 我々は、一般的なユーザーに正確なコンテキスト認識ガイダンスを提供する検索強化AIアシスタントであるSafeMateを紹介する。
Model Context Protocol (MCP) 上に構築されたSafeMateは、ユーザクエリを動的にドキュメント検索、チェックリスト生成、構造化要約のためのツールにルーティングする。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:09:02 GMT)
Knowing You Don't Know: Learning When to Continue Search in Multi-round RAG through Self-Practicing [4.9] RAGは、言語モデルの知識を高め、AI生成幻覚を減らす強力な能力を示した。
現在のマルチラウンドRAGシステムは、十分な情報が既に取得されている場合でも検索を続けることができる。
本稿では,RAGシステムの自己認識とマルチラウンド検索機能を強化するための新しいフレームワークである textbfSIM-RAG を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:39:35 GMT)
Neural operators struggle to learn complex PDEs in pedestrian mobility: Hughes model case study [4.9] ヒューズモデル(Hughes model)は、群衆力学の1次双曲保存法体系である。
ニューラル作用素は、初期状態における不連続性の少ない簡単なシナリオでよく機能する。
彼らは複数の初期不連続性と動的境界条件を持つ複雑なシナリオで苦労する。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:05:20 GMT)
Large Language Model with Region-guided Referring and Grounding for CT Report Generation [4.8] 既存の方法は主にボリューム全体のグローバルな特徴についてのみ考慮する。
我々は,CTレポート生成のための第1の領域誘導参照およびグラウンドディングフレームワークであるReg2RGを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:18:33 GMT)
Learning Memory and Material Dependent Constitutive Laws [4.8] ヘテロジニアス材料に対するメモリおよび材料ミクロ構造に依存した法則を学習するための演算子フレームワークについて検討する。
提案フレームワークは,マルコフ再帰およびニューラル演算子を用いて,メモリおよびマイクロ構造弾性の相同化法則をモデル化する。
数値実験により, 提案する学習フレームワークは, 記憶および微細構造に依存した粘弾性モデルとエラストビコプラスティックモデルとを正確に学習することを示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:13:15 GMT)
AKD : Adversarial Knowledge Distillation For Large Language Models Alignment on Coding tasks [4.8] 本稿では, 大規模モデルの能力を, より小さく, より効率的なものに蒸留するために, AKD (Adversarial Knowledge Distillation) を導入する。
AKDはモデルの堅牢性、信頼性、セキュリティを向上し、パラメータ効率を向上させるためのフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:41:19 GMT)
A Wireless Collaborated Inference Acceleration Framework for Plant Disease Recognition [4.8] 植物病は農業生産に影響を及ぼす重要な要因である。
従来の手動認識手法は、低い精度、高いコスト、非効率など、重大な欠点に直面している。
深層学習技術は植物の病気を識別する上で大きな利点を示してきたが、推論遅延や高エネルギー消費といった課題に直面している。
本稿では,エッジデバイスとクラウドサーバ間の植物病を認識し,推論速度を向上させるための協調推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:17:32 GMT)
i-QLS: Quantum-supported Algorithm for Least Squares Optimization in Non-Linear Regression [4.7] 繰り返し量子支援最小二乗(i-QLS)最適化法を提案する。
従来の量子最小二乗アプローチのスケーラビリティと精度の限界を克服する。
実験では、i-QLSにより、短期量子ハードウェアが精度とスケーラビリティを改善して回帰タスクを実行できることを確認した。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:02:35 GMT)
Transfer Learning of CATE with Kernel Ridge Regression [4.6] カーネルリッジ回帰(KRR)を用いた条件平均処理効果(CATE)の重畳適応変換学習法を提案する。
我々は, 弱い重なり合いとCATE関数の複雑さの両方に対する適応性を強調した, 急激な非漸近的MSE境界による手法の理論的正当性を提供する。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:32:48 GMT)
Rapid yet accurate Tile-circuit and device modeling for Analog In-Memory Computing [4.6] 低レベルの歪みやノイズの影響を定量化し,アナログタイルにマッピングした乗算積演算(MAC)の数学的モデルを開発する。
単純なガウス雑音を用いたハードウェアの微調整は、ADC量子化やPCMリードノイズ効果に対してレジリエンスをもたらすが、IR-dropに対しては効果が低いことを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:56:49 GMT)
Commitment Attacks on Ethereum's Reward Mechanism [4.5] コンセンサスの合意機構の中核となる LMD GHOST に対する一連のコミットメント攻撃を示す。
我々は,提案者権限に対するチェックとして,有権者の役割を回復する新たな報酬機構を導入する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:33:41 GMT)
Automating Automotive Software Development: A Synergy of Generative AI and Formal Methods [4.5] 我々は、GenAIとモデル駆動エンジニアリングを組み合わせることで、自動車ソフトウェア開発を自動化することを提案する。
提案手法では,LLMを用いて自由文要求をイベントチェーン記述に変換し,プラットフォームに依存しないソフトウェアコンポーネントを生成する。
提案手法の実装には GPT-4o を用い, ROS2 を用いた CARLA シミュレーション環境で実験を行った。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:29:13 GMT)
Automated Hybrid Reward Scheduling via Large Language Models for Robotic Skill Learning [4.4] 大規模言語モデル(LLM)に基づく自動ハイブリッドリワードスケジューリングフレームワークを提案する。
このパラダイムは、ポリシー最適化プロセスを通して、各報酬成分の学習強度を動的に調整する。
実験により、AHRS法は複数の高自由度ロボットタスクにおいて平均6.48%の性能向上を達成することが示された。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:06:17 GMT)
Social Biases in Knowledge Representations of Wikidata separates Global North from Global South [4.4] リンク予測(LP)は知識グラフの不完全性の問題に対処するため、知識グラフにとって重要な下流タスクである。
これまでの研究では、しばしば(半)自動的な方法で作成された知識グラフは、社会的バイアスのないものではないことが示されている。
これらのバイアスは下流の応用に有害な影響を及ぼし、特に少数派に対する不公平な行動を引き起こす。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:21:12 GMT)
The non-Hermitian skin effect: A perspective [4.4] 非ヘルミチアン(NH)の皮膚効果は、システムの境界線上に、皮膚状態として知られる状態の蓄積として表される。
この効果を高次元および多体系で研究する最近の発展が注目されている。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:14:20 GMT)
MSA-UNet3+: Multi-Scale Attention UNet3+ with New Supervised Prototypical Contrastive Loss for Coronary DSA Image Segmentation [4.3] 冠状DSA画像分割のためのマルチスケールアテンション拡張UNet3+アーキテクチャ MSA-UNet3+を提案する。
マルチスケールDilated Bottleneck(MSD-Bottleneck)とコンテキスト注意融合モジュール(CAFM)を組み合わせたフレームワーク
プライベート冠DSAデータセットで行った実験は、MSA-UNet3+が最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:30:03 GMT)
Understanding the analysis of wave function [4.3] 我々は、rho$ の位数と、パワーローポテンシャルを持つ波動関数のタイプ $sigma$ を得る。
同時に、波動関数の満足度関係が$psi(r)=f(r)exp[g(r)]$ は$rho$ の次数に過ぎないことに注意する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:38:04 GMT)
Generalizing the exact quantization rule to multiple real turning points [4.3] 我々は、異なるエネルギーレベルの波動関数をとるとき、2つの隣接する旋回点の間に安定であり、常にpiの整数倍であることを示した。
2乗井戸ポテンシャルとバイハーモニックポテンシャルを調べることにより,正確な量子化則の有効性を検証した。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:42:10 GMT)
Threat Me Right: A Human HARMS Threat Model for Technical Systems [4.1] 従来の脅威モデリング手法とその欠点について論じる。
我々は,非技術的・人的要因を識別する新たな脅威モデリングフレームワーク(HARMS)を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:47:41 GMT)
Rethinking Federated Graph Learning: A Data Condensation Perspective [4.0] フェデレートグラフ学習(FGL)は、マルチクライアントグラフによるグラフニューラルネットワーク(GNN)の協調トレーニングを促進する。
本稿では、FGLデータの不均一性に対処する新しい最適化キャリアとして、凝縮グラフの概念を導入する。
具体的には、一般化された凝縮グラフのコンセンサスを用いて、分散グラフから包括的な知識を集約する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:23:29 GMT)
Predicting Movie Hits Before They Happen with LLMs [4.0] われわれは、大規模なエンターテイメントプラットフォーム上での映画のコールドスタート問題に取り組むことに重点を置いている。
我々の第一の目的は,映画メタデータを活用したLarge Language Models (LLMs) を用いたコールドスタート映画の人気を予測することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:43:20 GMT)
Machine-Learning-Powered Neural Interfaces for Smart Prosthetics and Diagnostics [4.0] 我々は、AI駆動型デコーディングアルゴリズムと次世代小型ニューラルデバイスのためのエネルギー効率の高いSystem-on-Chipプラットフォームの最近の進歩についてレビューする。
これらのイノベーションは、インテリジェントなニューラルネットワークの開発の可能性を強調し、スケーラビリティ、信頼性、解釈可能性、ユーザ適応性といった重要な課題に対処する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:49:13 GMT)
Testing SSD Firmware with State Data-Aware Fuzzing: Accelerating Coverage in Nondeterministic I/O Environments [3.9] Solid-State Drive(SSD)ファームウェアは、フラッシュメモリのメンテナンスを含む複雑な内部状態を管理する。
従来のテスト手法は、広範囲なI/O蓄積を必要とするファームウェアコード領域のカバレッジを迅速に達成するのに苦労している。
SSDファームウェアの内部状態を利用して、非決定論的I/O条件下での入力生成を誘導する状態データ認識ファジリング手法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:52:21 GMT)
Local Off-Grid Weather Forecasting with Multi-Modal Earth Observation Data [3.9] 森林火災の管理と再生可能エネルギーの発生は、地球表面付近の正確な局部的な天気予報を必要とする。
機械学習モデルや数値天気予報システムによって生成された予測は、通常、大規模な正規グリッド上で生成される。
本稿では,マルチグラニュアルトランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:43:49 GMT)
Minimax Strikes Back [3.9] 深層強化学習は多くの完全な情報ゲームにおいてレベルレベルに達する。
別のアプローチとして、Ath'enanは、Descentと呼ばれる、Minimaxベースの検索アルゴリズムを使っている。
複数のゲームにおいて、AlphaZero: Polygamesの再実装よりもはるかに効率的であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:07:35 GMT)
Kubrick: Multimodal Agent Collaborations for Synthetic Video Generation [3.8] 視覚大言語モデル(VLM)エージェントの協調に基づく自動合成ビデオ生成パイプラインを提案する。
ビデオの言語記述が与えられた後、複数のVLMエージェントが生成パイプラインの様々なプロセスを指示する。
彼らは、与えられた記述に従ってビデオをレンダリングするBlenderスクリプトの作成に協力する。
サブプロセスごとに、Programmerエージェントは関数の合成とAPI呼び出しに基づいたPythonベースのBlenderスクリプトを生成する。
レビューエージェントは、ビデオレビュー、キャラクターの動き座標、中間スクリーンショットの知識を持ち、プログラマエージェントにフィードバックを提供する。
私たちの生成したビデオは、ビデオ上の5つの指標で商用ビデオ生成モデルよりも品質が良い
論文参考訳(メタデータ) (Mon, 05 May 2025 07:38:45 GMT)
CoCoB: Adaptive Collaborative Combinatorial Bandits for Online Recommendation [3.8] 本稿では,CoCoBの適応的組合せ帯域幅アルゴリズムを提案する。
CoCoBは革新的な二面バンディットアーキテクチャを採用し、ユーザーとアイテムの両方にバンディットの原則を適用している。
3つの実世界のデータセットの実験では、CoCoBの有効性が示され、最先端の手法よりも平均2.4%のF1スコアが向上した。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:41:16 GMT)
The Human Labour of Data Work: Capturing Cultural Diversity through World Wide Dishes [3.8] 本稿では、コミュニティメンバーが研究プロセスの設計を指導し、クラウドソースされたデータセットに貢献する参加型データセット作成の例を示す。
このアプローチは,コミュニティからの分散型コントリビューションを支援する,キュレートされた高品質なデータをもたらす可能性があることを示す。
我々は,参加型データセット構築に不可欠な参加型仲介者による労働の3次元を探索する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:29:14 GMT)
Targeted Fuzzing for Unsafe Rust Code: Leveraging Selective Instrumentation [3.7] Rustは、ユーザビリティとセキュリティに焦点を当てた、有望なプログラミング言語である。
プログラマは、厳格なRustセキュリティポリシーに従わない、安全でないコードを書くことができる。
ファジィアが注目すべきプログラムのどの部分にフォーカスするかを決定するために、安全で安全なコードコンポーネントを自動的に検出する手法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:48:42 GMT)
Context-Aware Input Orchestration for Video Inpainting [3.7] 入力データの構成を変更することでメモリ使用量を最適化する革新的な手法を提案する。
我々の焦点は、入力フレームの割合の変動が、インペイントされたビデオの品質にどのように影響するかを調べることである。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:42:56 GMT)
El Agente: An Autonomous Agent for Quantum Chemistry [3.7] El Agente Qは、自然言語のユーザプロンプトから量子化学を生成し、実行するマルチエージェントシステムである。
El Agente Qは6つの大学レベルのコース演習と2つのケーススタディでベンチマークされ、堅牢な問題解決性能を示している。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:07:22 GMT)
MSFNet-CPD: Multi-Scale Cross-Modal Fusion Network for Crop Pest Detection [3.5] 農薬の正確な識別は、作物の保護に不可欠である。
ディープラーニングには先進的な害虫検出があるが、既存のアプローチのほとんどは、低レベルの視覚的特徴にのみ依存している。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:10:22 GMT)
Identifying Critical Dependencies in Large-Scale Continuous Software Engineering [3.4] 継続的ソフトウェアエンジニアリング(CSE)は業界で広く採用されており、継続的インテグレーションや継続的デプロイメント(CI/CD)といったプラクティスを統合している。
大規模な製品開発におけるこれらのアクティビティの調整には、複数の利害関係者が関与し、複雑さが増します。
本研究は,大規模CSEにおける重要な依存関係を特定し解析することで,この複雑さに対処することを目的とする。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:18:09 GMT)
Database-Agnostic Gait Enrollment using SetTransformers [3.3] オープンセット歩行学習のためのトランスフォーマーベースのフレームワークを提案する。
提案手法は,データセット非依存と認識-アーキテクチャ非依存の両方である。
提案手法はフレキシブルで,異なるシナリオでの登録を正確に行うことができ,従来の手法と比較してデータによるスケーリングが優れていることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:42:27 GMT)
EntroLLM: Entropy Encoded Weight Compression for Efficient Large Language Model Inference on Edge Devices [3.3] 大きな言語モデル(LLM)は、様々なタスクにまたがる例外的なパフォーマンスを示すが、その大きなストレージと計算要求は、エッジデバイスへのデプロイメントを制限している。
本稿では,エントロピー符号化と混合量子化を統合した新しい圧縮フレームワークEntroLLMを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:42:14 GMT)
A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs [3.2] 本稿では,視覚言語モデル(VLM)における知覚推論インタフェースを識別するための構造化評価フレームワークを提案する。
本稿では,人間の問題解決戦略を反映した3つの評価パラダイムを提案する。
このフレームワークを適用したCAは、リッチで独立に生成された記述を推論するために強力な言語モデルを活用し、新しい最先端(SOTA)パフォーマンスを実現することを実証する。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:58:38 GMT)
Attestable builds: compiling verifiable binaries on untrusted systems using trusted execution environments [3.2] attestableビルドは、ソフトウェアアーティファクトに強力なソース対バイナリ対応を提供する。
私たちは、ソースコードと最終バイナリアーティファクトの間の信頼を切断する不透明なビルドパイプラインの課題に取り組みます。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:00:04 GMT)
New affine invariant ensemble samplers and their dimensional scaling [3.2] 本稿では,既存のアルゴリズムの構築と改良が容易な新しいアフィン不変アンサンブルサンプリング手法を提案する。
具体的には,textttemceeパッケージの一般的なサンプルよりも好適に機能する,デリバティブフリーアンサンブルサイド移動サンプリング器を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:33:48 GMT)
Singular transport in non-equilibrium strongly internal-coupled 1D tilted field spin-1/2 chain [3.2] 本研究は、傾斜磁場に浸漬された一次元非平衡イジング鎖を研究する。
すべてのスピンは、散逸系の環境相互作用でボソン貯水池に接触する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:45:48 GMT)
A Theoretical Analysis of Compositional Generalization in Neural Networks: A Necessary and Sufficient Condition [3.1] 本稿では,ニューラルネットワークの合成一般化に必要かつ十分な条件を導出する。
概念的には、計算グラフは(i)真の構成構造と一致し、(ii)コンポーネントはトレーニングで十分な情報をエンコードする必要がある。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:13:46 GMT)
landmarker: a Toolkit for Anatomical Landmark Localization in 2D/3D Images [2.9] landmarkerは、ランドマークローカライゼーションアルゴリズムの開発と評価のためのPythonパッケージである。
ランドマーク識別の精度を高め、研究と開発プロセスを合理化し、さまざまなイメージフォーマットと前処理パイプラインをサポートする。
ランドマークは、既存の汎用ポーズ推定ツールで適切に満たされていないランドマークのローカライゼーションタスクにおいて、精度とカスタマイズの重要なニーズに対処する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:41:55 GMT)
Probing Vortex Dynamics in 2D Superconductors with Scanning Quantum Microscope [2.9] 本研究では、走査型量子顕微鏡を用いて、2次元超伝導体2H-NbSe2の局所磁気応答を探索する。
本技術は, 超伝導渦を高感度で, 空間分解能を30nmまで高感度で静的かつ動的に検出することを可能にする。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:02:35 GMT)
Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery [2.9] VGLDは、記述とともに対応する画像から高レベルな意味情報を組み込むことで、テキスト情報の影響を安定化する。
このアプローチはテキストの曖昧さを解消し、線形変換パラメータ(スカラー)の集合を強く出力する。
以上の結果から,VGLDは複数のデータセットでトレーニングした場合に共通アライメントモジュールとして機能し,ゼロショットシナリオにおいても高い性能を達成できることが示された。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:57:16 GMT)
Antifragility of RIS-assisted Communication Systems under Jamming Attacks [2.9] 本稿では,リコンフィグタブル・インテリジェント・サーフェス (RIS) を用いた通信システムにおいて,ジャミング攻撃の影響を受ける反脆弱性の概念を紹介する。
本研究では,無線経路がソースノード,RIS,宛先ノード,盗聴/ジャミングノードを含む2つのホップシステムの反フラジリティを解析する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:13:01 GMT)
Grasp the Graph (GtG) 2.0: Ensemble of GNNs for High-Precision Grasp Pose Detection in Clutter [2.8] 本稿では,仮説とテストのロボティクス把握フレームワークであるGrasp the Graph 2.0 (GtG 2.0)を紹介する。
ポイントクラウドデータからの効率的な幾何学的推論には、グラフニューラルネットワークのアンサンブルを使用する。
GtG 2.0は、仮説とテスト、グラフニューラルネットワークベースの手法と比較して、GraspNet-1Billionベンチマークの平均精度が35%向上している。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:14:32 GMT)
Evaluating Contrastive Feedback for Effective User Simulations [2.8] 本研究は, ユーザシミュレーションのプロンプトエンジニアリング分野において, コントラッシブトレーニング技術の根底にある原則が有効に応用できるかどうかを考察する。
本研究の主な目的は,コンテキスト情報の異なるモーダル性がユーザシミュレーションの有効性に与える影響を分析することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:02:31 GMT)
SynQ: An Embedded DSL for Synchronous System Design with Quantitative Types [2.8] SynQは、完全な同期仮説に従うシステムの設計を目的とした組み込みドメイン仕様言語(EDSL)である。
形式的な仕様と検証、モデリング、シミュレーション、コード生成など、セマンティックに一貫性のある設計プロセスを可能にする。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:44:13 GMT)
More Optimal Fractional-Order Stochastic Gradient Descent for Non-Convex Optimization Problems [2.6] 本稿では,FOSGDとFOSGDを統合した2FOSGD法を提案する。
感度と有効次元性を追跡することにより、2SEDFOSGDは指数を動的に変調し、スラグ振動と急収束を緩和する。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:27:36 GMT)
Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity [2.5] 本研究では、予算制約のある入札者が、その累積支払額を最大化するために、繰り返し第1価格のオークションに適応的に入札することを学ばなければならないかを検討する。
本稿では, 入札者が予算を消費するときに, 予算制約の2変数を維持できる, 単純二段階入札方式を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:13:02 GMT)
From Course to Skill: Evaluating LLM Performance in Curricular Analytics [2.5] 大規模言語モデル(LLM)は、大規模で非構造化のカリキュラムデータを扱うことを約束している。
我々は,LLMや従来のNLP法に基づく4つのテキストアライメント戦略を体系的に評価した。
本研究は, 簡潔かつ抽象的なカリキュラム文書の分析において, LLMsが持つ可能性を明らかにするとともに, その性能がモデル選択やプロンプト戦略に大きく依存することを明らかにする。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:46:23 GMT)
Refining Fuzzed Crashing Inputs for Better Fault Diagnosis [2.5] DiffMinは、ファジドクラッシュ入力を洗練して、与えられたパス入力と大きな類似性を得る技術である。
Magmaベンチマークによるパイロットスタディでは、DiffMinは、クラッシュとパス入力の違いを効果的に最小化することを示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:58:16 GMT)
Optimism, Expectation, or Sarcasm? Multi-Class Hope Speech Detection in Spanish and English [2.4] 英語とスペイン語で3万以上の注釈付きツイートからなる多言語できめ細かな希望音声データセットであるPolyHope V2を紹介する。
このリソースは、Generalized、Realistic、Unrealistic、Sarcasticの4つのサブタイプを区別し、Sarcasticインスタンスを明示的にラベル付けすることで既存のデータセットを強化する。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:30:02 GMT)
Time-delayed collective dynamics in waveguide QED and bosonic quantum networks [2.4] この研究は、非マルコフ環境における量子エミッタの集合力学をモデル化するための理論的枠組みを導入する。
これらの方程式は線形(ボソニック)および非線形(2レベル)エミッターアレイの力学を捉える。
本研究は,光円錐制限伝搬と遠方エミッタ間の光子放出の増大を特徴とする,カスケード型超放射・準放射効果を明らかにする。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:39:06 GMT)
Exploring Design Choices for Autoregressive Deep Learning Climate Models [2.4] 本研究では,ERA5再解析データに基づく3つのDL-MWPアーキテクチャの長期安定性を5.625degで定量的に比較した。
参照データセットの統計特性を保存しながら,安定した10年間のロールアウトを可能にする構成を同定する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:37:58 GMT)
Spectator-Aware Frequency Allocation in Tunable-Coupler Quantum Architectures [2.3] 本稿では,SNAILをベースとした超伝導量子モジュールの設計制約について述べる。
モジュールの半径が増加するにつれて,周波数群集がゲートの忠実度に与える影響を解析する。
我々は、オブザーバによるエラーを最小限に抑えるスケーラブルな周波数割り当て戦略を実証する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:27:34 GMT)
Rethinking Multimodal Sentiment Analysis: A High-Accuracy, Simplified Fusion Architecture [2.3] 本稿では,発話レベルの感情分類に適した,軽量かつ効果的な融合型ディープラーニングモデルを提案する。
我々のアプローチは、注意深く機能エンジニアリングとモジュール設計を行うことで、より単純な融合戦略がより複雑なモデルより優れているか、あるいは一致しているかを示します。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:31:11 GMT)
An Explainable Anomaly Detection Framework for Monitoring Depression and Anxiety Using Consumer Wearable Devices [2.2] ウェアラブルデバイスによる行動と生理の継続的なモニタリングは、うつ病や不安を早期に検出するための、新しい客観的な方法を提供する。
本稿では,一般消費者のウェアラブルデータを用いて,症状の重症度が臨床的に有意に上昇することを示す,説明可能な異常検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:41:05 GMT)
Fabrication of low-loss Josephson parametric devices [2.2] GHz帯で動作する低損失ジョセフソンパラメトリックデバイスの作製と特性について報告する。
これらの低損失デバイスは、高性能量子回路の実現において重要な一歩を踏み出した。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:54:13 GMT)
NeuroSim V1.5: Improved Software Backbone for Benchmarking Compute-in-Memory Accelerators with Device and Circuit-level Non-idealities [2.1] 本稿では,デバイスレベルおよび回路レベルの非理想性において重要な進歩をもたらすNeuroSim V1.5を提案する。
NeuroSim V1.5は次世代のACIMアクセラレータの設計と検証を推進している。
NeuroSimのすべてのバージョンはhttps://github.com/neurosim/NeuroSimでオープンソース公開されている。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:07:04 GMT)
Backpropagation through space, time, and the brain [2.1] 我々は、ニューロンの物理的、動的ネットワークにおける完全局所的時間的クレジット割り当てのための計算フレームワークであるGeneral Latent Equilibriumを紹介する。
特に、GLEは樹状樹の形態を利用して、単一ニューロンのより複雑な情報保存と処理を可能にしている。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:43:33 GMT)
RepliBench: Evaluating the Autonomous Replication Capabilities of Language Model Agents [2.1] RepliBenchは、自律レプリケーション機能を測定するために設計された評価スイートである。
我々は5つのフロンティアモデルをベンチマークし、それらが現在、自己複製の信頼できる脅威を生じていないことを発見した。
我々が評価した最良のモデル(Claude 3.7 Sonnet)は、15/20タスクファミリで50%パス@10スコア、最も難しい亜種で9/20ファミリーで50%パス@10スコアである。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:52:36 GMT)
Sparse Ellipsoidal Radial Basis Function Network for Point Cloud Surface Representation [2.1] 本稿では,点雲の符号付き距離関数(SDF)を近似する機械学習手法を提案する。
空間性と近似精度のバランスをとるために,動的多目的最適化戦略を導入する。
複数のベンチマークデータセットの実験により,提案手法が従来の表現手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:16:16 GMT)
Schmidt number criterion via symmetric measurements [2.0] 対称測定から得られた相関行列のトレースノルムに基づいてシュミット数基準を導出する。
我々は、シュミット数基準が既存の基準よりも有効であり、より詳細な例によって優れていることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:12:51 GMT)
Robustly Invertible Nonlinear Dynamics and the BiLipREN: Contracting Neural Models with Contracting Inverses [2.0] 本研究では, 非線形力学系の可逆性について, 収縮解析と漸進安定性解析の観点から検討する。
本稿では,新しい可逆的リカレントニューラルモデルBiLipRENを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:27:52 GMT)
I Know What You Did Last Summer: Identifying VR User Activity Through VR Network Traffic [2.0] VRアプリケーションのセキュリティとプライバシに関する懸念と、それらがユーザに与える影響に関する懸念が持ち上がっている。
我々はMeta Quest Proヘッドセット上で動作する25のVRアプリケーションからネットワークトラフィックデータを収集し、生成されたネットワークトラフィックの特徴を特定する。
以上の結果から,MLモデルを用いて,92.4%の精度で使用されているVRアプリケーションと,91%の精度で実施されているVRユーザアクティビティを識別できることが示唆された。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:48:49 GMT)
Helping Large Language Models Protect Themselves: An Enhanced Filtering and Summarization System [2.0] 大規模言語モデルは、敵の攻撃、操作プロンプト、悪意のある入力のエンコードに弱い。
本研究は,LSMが敵対的あるいは悪意的な入力を自力で認識し,フィルタリングし,防御することのできる,ユニークな防御パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:46:48 GMT)
The USRA Feynman Quantum Academy: If You Give a Student a Quantum Internship [2.0] 我々は過去8年間のUSRA Feynman Quantum Academy Internship Programの軌跡を概観する。
私たちは、将来の量子労働力を準備する現在の取り組みの文脈にそれを置きます。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:18:48 GMT)
Integrating Symbolic Execution into the Fine-Tuning of Code-Generating LLMs [1.9] 本稿では,コード生成型大規模言語モデル(LLM)の微調整について検討する。
我々は,シンボル実行手法の助けを借りて,報酬モデルのトレーニングデータを強化する。
このデータセットを微調整した報奨モデルでは、ベースラインであるCodeRLよりも大幅に改善されていることが示されています。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:56:16 GMT)
Giving Simulated Cells a Voice: Evolving Prompt-to-Intervention Models for Cellular Control [1.7] 大規模言語モデル(LLM)は、AIシステムにおける解釈可能な制御のためのインタフェースとして自然言語を可能にした。
本稿では,自然言語のプロンプトをシミュレートされたセル集合を誘導できる空間ベクトル場に変換する機能パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:21:46 GMT)
A New Approach to Backtracking Counterfactual Explanations: A Causal Framework for Efficient Model Interpretability [1.7] 対実的な説明は、異なる出力を生成する代替入力を特定することによって解釈可能性を高める。
伝統的な手法は因果関係を無視することが多く、非現実的な例に繋がる。
本稿では,因果推論を組み込んだバックトラック・カウンティファクトに基づく効果的な手法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:01:56 GMT)
Navigating Privacy and Trust: AI Assistants as Social Support for Older Adults [1.6] 高齢者は、ユーザビリティ、データプライバシ、およびパーソナルエージェンシー間のトレードオフをナビゲートする必要がある。
本稿では,AIアシスタント機能を形成する上で,高齢者を積極的な意思決定者と位置づける参加型デザインアプローチを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:00:14 GMT)
HeAL3D: Heuristical-enhanced Active Learning for 3D Object Detection [1.6] HeAL(Heuristical-enhanced Active Learning for 3D Object Detection)を導入し、モデルのトレーニングに最も貢献するサンプルを提供する。
従来の研究とは対照的に,本手法では,不確実性を推定するために,対象距離や点量などの達成的特徴を統合している。
KITTI を用いた評価では,HeAL は 最先端の mAP と完全教師付きベースラインと同じ mAP を,サンプルの 24% しか持たない。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:20:54 GMT)
AI Standardized Patient Improves Human Conversations in Advanced Cancer Care [1.6] SOPHIEはAIを利用した患者シミュレーションと自動フィードバックシステムである。
医療学生と専門職とのランダム化コントロールスタディでは、SOPHIEユーザは、3つの重要なSICドメイン(Empathize、Be Explicit、Empower)で大幅に改善した。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:44:17 GMT)
Aerodynamic and structural airfoil shape optimisation via Transfer Learning-enhanced Deep Reinforcement Learning [1.5] 本稿では,任意の翼の形状を最適化できる移動学習,多目的,深部強化学習(DRL)手法を提案する。
本手法を実証するために,翼の構造的整合性を保ちながら,昇降抵抗比$C_L/C_D$を最大化する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:26:11 GMT)
Optimizing LLMs for Resource-Constrained Environments: A Survey of Model Compression Techniques [1.5] 大規模言語モデル(LLM)は、人工知能(AI)の多くの領域に革命をもたらしたが、その相当なリソース要件は、モバイルおよびエッジデバイスへのデプロイメントを制限する。
本稿では,資源制約環境下での効率的な推論を実現するため,LLMの圧縮技術について概観する。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:27:47 GMT)
Concatenate codes, save qubits [1.4] フォールトトレラント量子計算のためのフォールトトレラントプロトコルを提案する。
モジュールアーキテクチャ設計において、一定のスペースオーバーヘッド、高いしきい値、柔軟性を実現する。
その結果,コード結合手法は,FTQCの実現において,量子ビットを著しく節約する方法を開放することを示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:36:07 GMT)
Agentic Neurodivergence as a Contingent Solution to the AI Alignment Problem [1.4] AIアライメント問題は、人工知能(AI)システムが人間の価値観に従って行動することを保証することに重点を置いている。
狭義のAIからAI(Artificial General Intelligence, AGI)やスーパーインテリジェンス(Superintelligence, 超知能)への進化に伴い、制御に対する恐怖と現実的なリスクがエスカレートした。
本稿では、述語論理と計算可能性の基礎に根ざした数学的原理により、完全な整合性を達成することは本質的に達成不可能であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:33:18 GMT)
Towards Effective Issue Assignment using Online Machine Learning [1.4] ソフトウェアプロジェクトの進化する特性に適応するオンライン機械学習手法を提案する。
我々のシステムは課題をデータストリームとして処理し、新しいデータから動的に学習し、チーム構成やプロジェクト要件の変更に対してリアルタイムで調整します。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:05:13 GMT)
A Deep Learning approach for Depressive Symptoms assessment in Parkinson's disease patients using facial videos [1.4] パーキンソン病(英: Parkinson's disease、PD)は、運動性および非運動性症状を呈する神経変性疾患である。
うつ病の症状はPDで多く、最大45%の患者に影響を及ぼす。
本研究では, 深層学習モデル(ViViT, Video Swin Tiny, 3D CNN-LSTM)に着目し, 抑うつ症状の存在と重症度を評価する。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:58:39 GMT)
AI-based particle track identification in scintillating fibres read out with imaging sensors [1.3] 本研究では,SPADアレイセンサによって生成された実データから,信号を含むフレームを効率よくフィルタリングし,識別する可変オートエンコーダ(VAE)を提案する。
我々のVAEモデルは、背景雑音から粒子トラックを含むフレームを識別する能力を示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:25:31 GMT)
Iterative Resolution of Prompt Ambiguities Using a Progressive Cutting-Search Approach [1.3] 生成AIシステムは、自然言語ベースのコーディングと問題解決を可能にすることによって、人間のインタラクションに革命をもたらした。
しかし、自然言語の本質的な曖昧さは、しばしば不正確な指示を導き、ユーザに反復的にテスト、修正、再提出を強制する。
本稿では,これらのあいまいさを体系的に絞り込む反復的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:31:18 GMT)
Privacy Risks and Preservation Methods in Explainable Artificial Intelligence: A Scoping Review [1.3] 我々は、プライバシーと説明可能性の相違について詳細を求めるため、既存の文献のスコーピングレビューを実施している。
2019年1月から2024年12月までの1,943件の調査結果から57項目を抽出した。
我々は,XAIにおけるプライバシリスクと保存手法を分類し,プライバシ保護の説明の特徴を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:53:28 GMT)
Prediction-powered estimators for finite population statistics in highly imbalanced textual data: Public hate crime estimation [1.3] 変圧器エンコーダニューラルネットワークからの予測と,モデル予測を補助変数として用いたよく確立されたサーベイサンプリング推定器を組み合わせる。
この適用性はスウェーデン警察の報告に基づくスウェーデンのヘイト犯罪統計で実証されている。
提案手法は,ラベル付きトレーニングデータが利用可能であれば,手作業のアノテーションに費やした時間を削減して,極めて効率的な推定を行うことができると結論付けた。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:39:24 GMT)
A Typology of Synthetic Datasets for Dialogue Processing in Clinical Contexts [1.2] 本稿では、医療領域における対話関連タスクにおいて、合成データセットの作成、評価、利用方法の概要について述べる。
そこで本研究では,データ合成のタイプや度合いを分類するために,比較と評価を容易にする新しいタイプ分類法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:58:08 GMT)
PAC Learning is just Bipartite Matching (Sort of) [1.2] この記事の主目的は、読者であるあなた、Probably Aquatrect (PAC)モデルにおける教師付き学習が、すべて -- バイパーティイトマッチング – と密接に関連していることを、読者に納得させることです。
学習の特定の帰納的モデルと関連する一包含グラフについて概説し、レクリエーション数学でよく見られるいくつかの帽子パズルの一般化と見なすことができる。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:54:44 GMT)
Enhancing person re-identification via Uncertainty Feature Fusion Method and Auto-weighted Measure Combination [1.2] 人物再識別(Re-ID)は、監視システムにおいて、異なるカメラビューで同一人物を特定することを含む、困難なタスクである。
本稿では,不確定特徴融合法(UFFM)と自動重み付け器(AMC)によるReIDモデルの能力を向上する新しい手法を提案する。
本手法は,人物の再識別データセットで評価した場合のランク@1精度と平均精度(mAP)を大幅に改善する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:24:48 GMT)
Completing Spatial Transcriptomics Data for Gene Expression Prediction Benchmarking [1.2] 26の公開データセットからなるデータベースであるSpaREDと、最先端のトランスフォーマーに基づく遺伝子発現補完モデルであるSpaCKLEを紹介する。
我々の貢献は、これまででもっとも包括的な組織像からの遺伝子発現予測のベンチマークとなっている。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:17:29 GMT)
Platelet enumeration in dense aggregates [1.0] 血小板変動の緩和における畳み込み核の役割について検討する。
単一血小板凝集体と血小板凝集体に特化する別のアプローチを提案する。
実験の結果,血小板の同定に有意な改善が認められた。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:05:13 GMT)
Advanced Clustering Framework for Semiconductor Image Analytics Integrating Deep TDA with Self-Supervised and Transfer Learning Techniques [1.0] 本稿では,深部トポロジカルデータ分析(TDA)と自己教師あり・伝達学習技術を統合した高度なクラスタリングフレームワークを提案する。
このフレームワークは、欠陥パターンとプロセスのバリエーションに整合したクラスタをうまく識別する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:53:03 GMT)
Entangled-photon time- and frequency-resolved optical spectroscopy [1.0] 量子光による時間分解分光は測定時間を犠牲にすることなく行うことができることを示す。
この結果から,超高速光分光法が提案され,実世界の日光照明に匹敵する条件下で実験が実施される。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:17:00 GMT)
Automatic Input Feature Relevance via Spectral Neural Networks [0.9] 機械学習の実践では、より効率的な数値処理のためのコンパクトデータセットを得るために、関連する入力特徴を特定するのが有用であることが多い。
本稿では,ディープニューラルネットワークにおける入力成分の相対的重要性を推定する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:48:02 GMT)
A distance function for stochastic matrices [0.9] Bhattacharyya角は、マルコフ連鎖の列から始めて、短周期と長期のマルコフ連鎖の実行を比較する自然なツールとして提唱されている。
マルコフ列上のバタチャリア角や新しい行列距離を考えると、モデル間の距離は同じである。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:21:46 GMT)
Local Markov Equivalence and Local Causal Discovery for Identifying Controlled Direct Effects [0.9] 対象変数に対して定義されたグラフのクラスを記述し、d-セパレーションの特定の部分集合を共有する。
次に,観測分布からLEGを復元する新しいアルゴリズムであるLocPCを提案する。
本稿では,CDEを同定するのに十分なアルゴリズムであるLocPC-CDEを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:47:29 GMT)
Quantum-assited anomaly detection with multivariate Gaussian distribution [0.8] ガスの異常検出は、データマイニングと機械学習において顕著な問題である。
位相推定のないGADのための新しい量子アルゴリズムを提案する。
我々の量子アルゴリズムは低次元データセットを扱う際に非常に効率的である。
論文参考訳(メタデータ) (Mon, 05 May 2025 02:21:11 GMT)
Non-Markovianity and memory enhancement in Quantum Reservoir Computing [0.8] 非マルコフ力学は制限を克服し、拡張メモリ保持を可能にする。
我々はマルコフから非マルコフ進化への制御された遷移を可能にする埋め込みアプローチを導入する。
本研究では,量子機械学習アーキテクチャにおけるメモリ向上のための重要なリソースとして,量子非マルコビアン性(quantum non-Markovianity)を確立した。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:17:08 GMT)
Auditing a Dutch Public Sector Risk Profiling Algorithm Using an Unsupervised Bias Detection Tool [0.8] 本稿では,人口集団のデータが利用できない場合,教師なしクラスタリングツールを用いたバイアス検出について検討する。
我々はオランダ教育庁と協力し、大学生にリスクスコアを割り当てるアルゴリズムを監査した。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:52:08 GMT)
Timing Is Everything: Finding the Optimal Fusion Points in Multimodal Medical Imaging [0.8] マルチモーダルディープラーニングは、MRIシーケンスなどの様々な画像モダリティを利用して、医療画像の診断精度を高める。
重要な課題は、これらのモダリティを個別に統合する最適なタイミングを決定し、融合モジュールを挿入すべきネットワーク層を特定することである。
本稿では,マルチモーダルネットワークの異なる層で逐次的に融合モジュールを活性化し,評価する逐次フォワード探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:53:21 GMT)
Lesion-Aware Generative Artificial Intelligence for Virtual Contrast-Enhanced Mammography in Breast Cancer [0.8] Contrast-Enhanced Spectral Mammography (CESM) は、ヨウ素化コントラスト剤の投与により病変の視認性を向上させる。
CESMは、標準的なマンモグラフィーと比較して診断精度が優れているが、その使用には放射線照射と潜在的な副作用が伴う。
本稿では,CESMにおける仮想コントラスト拡張のための生成的ディープラーニングフレームワークであるSeg-CycleGANを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:41:30 GMT)
Low-Loss Space in Neural Networks is Continuous and Fully Connected [0.8] 2つの異なるミニマを、損失の少ない中間点からなる経路に接続できることを示す。
また、モデル一般化を改善するための新しい可視化手法や機会も提供しています。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:16:55 GMT)
LLMs for Extremely Low-Resource Finno-Ugric Languages [0.8] 本稿では,Voro,Livonian,Komiに着目し,そのギャップに対処する。
データ収集からチューニング,評価に至るまで,LLM作成のサイクルのほとんどを網羅する。
本研究は,NLPの進歩によって,低リソースの言語が恩恵を受けることを保証するため,言語多様性を促進することを目的としている。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:26:14 GMT)
Multimodal Deep Learning for Stroke Prediction and Detection using Retinal Imaging and Clinical Data [0.7] 本研究は、脳卒中検出とリスク予測に網膜画像と臨床データを活用することの影響について検討する。
光コヒーレンス・トモグラフィ(OCT)と赤外反射性網膜スキャンを処理するマルチモーダルディープニューラルネットワークを提案する。
実験により,急性脳梗塞に伴う網膜の持続的影響の検出において,考慮すべきモダリティの予測能力が確立された。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:22:58 GMT)
tPARAFAC2: Tracking evolving patterns in (incomplete) temporal data [0.7] 進化因子のスムーズな時間的正規化を利用する t(emporal)PARAFAC2 を導入する。
tPARAFAC2は、ノイズや欠落したデータの存在下で、最先端技術と比較して、より正確に進化するパターンを抽出できることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:35:36 GMT)
Distributed Quantum Circuit Cutting for Hybrid Quantum-Classical High-Performance Computing [0.7] 量子回路切断のための分散およびフレキシブルなライブラリであるQdislibを紹介する。
Qdislibは、ハイブリッド量子古典的高性能コンピューティングシステムとシームレスに統合される。
本稿では、Qdislibが異種コンピューティングリソース間で量子回路の分散実行を可能にしていることを示す概念実証について述べる。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:43:29 GMT)
FairTranslate: An English-French Dataset for Gender Bias Evaluation in Machine Translation by Overcoming Gender Binarity [0.7] 大規模言語モデル(LLM)は、翻訳タスクにますます活用されているが、包括的言語を翻訳する際にはしばしば不足する。
本稿では、英語からフランス語への機械翻訳システムにおいて、非二項性バイアスを評価するために設計された、完全に人間による注釈付きデータセットを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:19:32 GMT)
Coverage Biases in High-Resolution Satellite Imagery [0.7] 地中サンプリング距離が10m未満の光学衛星画像を提供する主要衛星コンステレーションのカバレッジバイアスについて検討した。
赤道から遠く離れた場所は、通常、研究中の星座によってより頻繁に再検討される。
歴史的衛星画像の可用性は、地上の社会経済的要因に影響されていることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:30:01 GMT)
Engineering CSS surgery: compiling any CNOT in any code [0.6] 我々はCSSスタイルの量子誤り訂正符号に論理を実装するためのフレームワークを導入する。
本手法は手術プロトコルの設計と解析のための体系的な方法論を提供する。
我々は,2つの論理量子ビット間の論理的CNOTゲートを実装した格子手術にインスパイアされた手術プロトコルを開発する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:16:49 GMT)
RADLADS: Rapid Attention Distillation to Linear Attention Decoders at Scale [0.6] RADLADSは、ソフトマックスアテンション変換器を線形アテンションデコーダモデルに迅速に変換するためのプロトコルである。
我々の変換プロセスでは350~700万のトークンしか必要とせず、オリジナルの教師モデルを訓練するのに使われるトークンの0.005%以下である。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:03:28 GMT)
Momentum-SAM: Sharpness Aware Minimization without Computational Overhead [0.6] 本稿では,蓄積された運動量ベクトルの方向にパラメータを摂動させ,計算オーバーヘッドやメモリ要求を伴わずに低シャープ性を実現するMomentum-SAMを提案する。
我々は、MSAMを詳細に評価し、NAG、SAM、MSAMの分離可能なメカニズムの学習最適化と一般化に関する知見を明らかにする。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:05:45 GMT)
SDA-GRIN for Adaptive Spatial-Temporal Multivariate Time Series Imputation [0.5] 空間的および時間的依存関係は、欠落したサンプルをインプットするために利用できます。
本研究では,空間依存の動的変化を捉えることのできる空間動的グラフリカレントインプットネットワーク(SDA-GRIN)を提案する。
実世界の4つのデータセット上でSDA-GRINを評価する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:55:16 GMT)
Dynamic Graph-based Fingerprinting of In-browser Cryptomining [0.5] 暗号ジャックは 盗まれたコンピューター資源を使って 暗号通貨を採掘する
ブラウザ内暗号ジャックマルウェアはWebAssemblyなどのWeb技術を利用して、ブラウザ内で直接暗号通貨をマイニングする。
本稿では,命令レベルのデータフローグラフを用いて暗号化動作を検出することを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:21:58 GMT)
Controlled Displacement of Stored Light at Room Temperature [0.4] 空間的に1光波長を超える距離で室温で蓄積された光パルスを変換する。
干渉計方式により、この線形翻訳の平均速度を計測し、センサ応用のための停止光実験を利用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:37:18 GMT)
Study of the influence of a biased database on the prediction of standard algorithms for selecting the best candidate for an interview [0.4] 外部(差別)と内部バイアス(自己検閲)を模倣するデータを生成する
ファイルの匿名化が予測品質に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:24:31 GMT)
Formal verification in Solidity and Move: insights from a comparative analysis [0.4] SolidityとMoveは、異なる設計と検証アプローチを備えた2つのコントラクト言語である。
本稿では,2つの言語が検証にどのように影響するか,また2つの言語に対する検証ツールの現状について検討する。
我々の調査は、CertoraとAptos Move Proverで実施された検証タスクのオープンデータセットによって支援されている。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:37:06 GMT)
An Adaptive Data-Resilient Multi-Modal Framework for Hierarchical Multi-Label Book Genre Identification [0.4] 本稿では,ジャンル分類の複雑さに対処するフレームワークであるIMAGINEを紹介する。
IMAGINEは複数のモーダルからロバストな特徴表現を抽出し、データ可用性に基づいて最も情報性の高い情報源を動的に選択する。
フレームワークの重要な特徴は、不完全データに対するレジリエンスであり、テキスト、画像、メタデータなどの特定のモダリティが欠落している場合や不完全である場合でも、正確な予測を可能にする。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:25:08 GMT)
Predicting The Evolution of Interfaces with Fourier Neural Operators [0.3] AIの最近の進歩は、偏微分方程式の進化を予測する強力なツールとして神経演算子を確立している。
この研究は、ニューラル演算子に基づく予測の時間スケールがマルチフェーズアプリケーションの時間スケールに匹敵することを示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:35:23 GMT)
Taskmaster Deconstructed: A Quantitative Look at Tension, Volatility, and Viewer Ratings [0.3] タスクマスター』(Taskmaster)は、イギリスのテレビ番組。
ランクボラティリティ、ポイントスプレッド、リードチェンジ、勝者の優位性を定量化するために、エピソードレベルの15のメトリクスを使用しました。
いずれの指標も, シリーズ効果のコントロール後においてもIMDb評価と有意な相関は認められなかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:46:32 GMT)
Engineering a multi-level bath for transmons with three-wave mixing and parametric drives [0.3] 調整可能な浴温度を持つ量子系は、量子シミュレーターにさらなる自由度を与える。
ここでは、トランスモン量子ビットを損失型超伝導非対称誘導型eLementモードに結合することにより、量子ビットモードのチューニング可能な浴を実験的に作成する。
この浴槽の有効温度は正の値から正の値まで正確に制御できる。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:25:31 GMT)
Uncovering Population PK Covariates from VAE-Generated Latent Spaces [0.2] 本稿では,変分オートエンコーダ(VAE)深層学習モデルとLASSOレグレッションを統合したデータ駆動型モデルフリーフレームワークを提案する。
VAEは高次元のPK信号を構造化潜在空間に圧縮し、平均絶対パーセンテージ誤差(MAPE)を2.26%で正確に再構成する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:47:39 GMT)
Marker-Based Extrinsic Calibration Method for Accurate Multi-Camera 3D Reconstruction [0.2] 本稿では,3次元マーカーによる幾何学的制約を利用した反復的外在的キャリブレーション手法を提案する。
本手法は,Tech4Dietプロジェクトにおいて,制御された環境と実際の実環境の両方において総合的に検証する。
実験の結果,アライメント誤差が大幅に減少し,高精度で信頼性の高い3次元再構成が可能となった。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:21:41 GMT)
Testing the Wineland Criterion with Finite Statistics [0.2] ワインランドパラメータは、全角モーメントの期待と分散からスピンスクイーズ状態と呼ばれる、気象学的に有用な絡み合った状態を検出することを目的としている。
スピンスクイージングの検出を仮説テスト問題として定式化し,非スピンスクイージング状態によって実験データを説明できると仮定する。
複数の実験で得られたデータに統計的テストを適用することで、ほとんどの場合、非スピン圧縮状態がp値5%以下で測定されたという仮説を否定できない。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:39:10 GMT)
Mapping the Italian Telegram Ecosystem: Communities, Toxicity, and Hate Speech [0.2] 2023年に収集された13,151件のチャットから1億8600万件のメッセージのデータセットを活用することで、イタリアのテレグラム圏を大規模に分析する。
ネットワーク分析,大規模言語モデル,毒性検出ツールを用いて,異なるテーマ・コミュニティがいかに形成し,イデオロギー的に整列し,有害な談話を行うかを検討する。
イタリアでは、主に黒人、ユダヤ人、ゲイの個人を対象としている。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:35:11 GMT)
A Slicing-Based Approach for Detecting and Patching Vulnerable Code Clones [0.2] srcVulは、プログラムスライシングとLocality-Sensitive Hashingを組み合わせて、脆弱なコードクローンを特定する、スケーラブルで正確な検出方法である。
srcVulは、既知の脆弱性プログラムとその対応するパッチを分析して、脆弱性関連スライスデータベースを構築する。
クローン検出中、srcVulはターゲットプログラムからのスライシングベクターとデータベース内のベクターを効率的にマッチングし、類似性を識別するパッチを推奨する。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:15:55 GMT)
Physics-Learning AI Datamodel (PLAID) datasets: a collection of physics simulations for machine learning [0.2] PLAIDは物理シミュレーションのデータセットを表現および共有するためのフレームワークである。
PLAIDはシミュレーションデータを記述するための統一標準を定義する。
PLAID標準の下で,構造力学と計算流体力学を網羅した6つのデータセットをリリースする。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:59:17 GMT)
Robustness questions the interpretability of graph neural networks: what to do? [0.1] グラフニューラルネットワーク(GNN)は、グラフベースのデータ分析の基盤となっている。
本稿では,GNNの解釈可能性に対する各種要因の影響を系統的に解析するベンチマークを提案する。
我々は,GCN,SAGE,GIN,GATの6つのGNNアーキテクチャを,2つの異なるドメインの5つのデータセットで評価した。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:14:56 GMT)
Quantum simulation of one-dimensional fermionic systems with Ising Hamiltonians [0.1] 本研究では, 局所的横場を持つ単純イジング型ハミルトニアンを用いて, 1次元におけるスピンレスフェルミオン系の時間進化をシミュレートする手法を提案する。
提案手法により, アナログ量子ハードウェア上でのフェミオン多体系のシミュレーションが可能となる。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:03:13 GMT)
Technical Report: Evaluating Goal Drift in Language Model Agents [0.1] 本稿では,言語モデル(LM)におけるゴールドリフトの分析手法を提案する。
我々の実験では、エージェントはまずシステムプロンプトを通じて明示的に目標を与えられ、その後環境圧力によって競合する目標に晒される。
目標ドリフトは、コンテキスト長が大きくなるにつれてパターンマッチング行動に対するモデルの感受性が増大するのと相関する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:06:09 GMT)
Token-Efficient RL for LLM Reasoning [0.0] 本稿では,大規模言語モデル (LLM) において,厳密なメモリと計算限界下での推論に適した強化学習戦略を提案する。
メモリ使用率の低減とトレーニングの安定化を図るため,出力トークンの小さな情報サブセットで動作する批判フリーな手法を設計する。
提案手法は,SVAMPベンチマークの精度を46%から70%以上に向上し,マルチ桁乗算において高い性能を示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:36:15 GMT)
YARE-GAN: Yet Another Resting State EEG-GAN [0.0] We implement a Wasserstein GAN with Gradient Penalty (WGAN-GP) to generate multi-channel resting-state EEG data。
本結果は,実際の脳波データの統計的特徴とスペクトル特性を効果的に捉えていることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:16:31 GMT)
When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger [0.0] N2M-RSI(Nono-to-Meaning Recursive Self-Improvement)
我々は、AIエージェントが入力として出力を返却し、明示的な情報統合しきい値を超えた場合、その内部複雑さは、私たちの仮定に縛られることなく増大することを示す最小の形式モデルを示す。
安全性上の理由から、システム固有の実装の詳細を省略し、Appendix Cでモデルに依存しない短いプロトタイプのみをリリースする。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:03:07 GMT)
What is a Gaussian channel, and when is it physically implementable using a multiport interferometer? [0.0] 量子ガウスチャネルは連続可変量子システムにおける通信と情報処理の基本的なモデルである。
この研究は、基礎的な側面とこれらのチャネルの物理的実装経路の両方に対処する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:20 GMT)
What Is AI Safety? What Do We Want It to Be? [0.0] 研究プロジェクトは、AIシステムによって引き起こされる害を防ぎ、軽減しようとする場合にのみ、AIの安全性の見地に入る。
その単純さと魅力にもかかわらず、私たちは、AI安全研究者と組織がAI安全について考え話し合う方法に関して、少なくとも2つのトレンドと緊張関係にあると主張している。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:55:00 GMT)
Unified exact WKB framework for resonance -- Zel'dovich and complex-scaling regularizations [0.0] 我々は、正確なWKB法を用いて量子力学的共鳴を解析するための統一的なフレームワークを開発する。
ラ・ゼルドビッチによる様々な確立された正則化の同値性と相補性、およびこの枠組みにおける複雑なスケーリングについて検討する。
この結果は、不安定な量子系における正確な WKB 法の非摂動精度を具体的に示すものである。
論文参考訳(メタデータ) (Mon, 05 May 2025 00:41:23 GMT)
The use of Artificial Intelligence for Intervention and Assessment in Individuals with ASD [0.0] 特に、高度な機械学習技術とデータ分析を利用して、早期診断におけるAIの役割に焦点を当てている。
本稿では、AIを活用した介入技術について検討し、教育ロボットと適応通信ツールを強調した。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:58:32 GMT)
The Multimodal Paradox: How Added and Missing Modalities Shape Bias and Performance in Multimodal AI [0.0] マルチモーダル学習は、高い意思決定において、単調な学習よりも優れていることが証明されている。
パフォーマンス向上は、マルチモーダルシステムを評価するためのゴールドスタンダードのままだが、バイアスやロバスト性に関する懸念はしばしば見過ごされている。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:42:44 GMT)
The Effectiveness of Large Language Models in Transforming Unstructured Text to Standardized Formats [0.0] 本研究では,非構造化テキストを構造化形式に変換する大規模言語モデルの能力を体系的に評価する。
実験により、数発のプロンプトを持つGPT-4oがブレークスルー性能を達成することが明らかとなった。
これらの発見は、様々な領域にまたがる自動構造化データ生成の新たな可能性を開く。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:25:44 GMT)
The Cognitive Foundations of Economic Exchange: A Modular Framework Grounded in Behavioral Evidence [0.0] マルチエージェントAIにおける重要な課題は、現実的な行動制約の下で社会協力をモデル化することである。
本稿では,認知的最小限の3つのメカニズムからなる概念的枠組みを提案する。
この枠組みは信頼を段階的な認知期待として再設定し、人工エージェントの相互交換のシミュレーション可能な基盤を提供する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:21:53 GMT)
Teaching the social media generation: rethinking learning without sacrificing quality [0.0] この世代は、短くて視覚的な素材と迅速なフィードバックを好むが、焦点、批判的思考、ディープラーニングに苦しむ。
本研究は,オランダの大学における1年目の技術コースをブレンドラーニングで再設計することである。
結果は有望なものだった: 出席率は50%近く増加し、定期的に出席する学生はどれも試験に失敗しなかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:31:10 GMT)
Surrogate modeling of Cellular-Potts Agent-Based Models as a segmentation task using the U-Net neural network architecture [0.0] U-Netアーキテクチャを用いた畳み込みニューラルネットワーク(CNN)サロゲートモデルを開発した。
このモデルを用いて,機械的セル・ポッツモデルの評価を高速化する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:26:29 GMT)
Stabilizing and Solving Unique Continuation Problems by Parameterizing Data and Learning Finite Element Solution Operators [0.0] 境界条件が不明な非線形偏微分方程式 (PDE) に対する解の再構成を含む逆問題を考える。
この集合データを活用するために、まず、線形展開において適切な分解(POD)を用いて境界データを圧縮する。
次に,低次元潜在空間におけるデータセットのパラメトリゼーションを提供するオートエンコーダを用いて,拡張係数の非線形低次元構造を同定する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:50:28 GMT)
Stabilizer-Accelerated Ground-State Estimation of Quantum Many-Body Systems [0.0] 本研究では,多体形状の集合性の出現を説明するために,安定体形式,特に高絡み状態の安定化体をどう扱うかを検討する。
対応する安定化器基底状態は、グラフ状態と安定化器表法を用いて効率的に調製される。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:01:20 GMT)
Spontaneous symmetry emergence in a Hermitian system of coupled oscillators without symmetry [0.0] 系状態がハミルトニアン系に固有の対称性を得られることを示す。
対称性の出現は系力学の変化として現れ、対称性に欠けるエルミート系の相転移と解釈できる。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:31:02 GMT)
Slow decay rate of correlations induced by long-range extended Dzyaloshinskii-Moriya interactions [0.0] DM相互作用の強度と異方性が一致したとき, ギャップレスキラル相からギャップ付き相への遷移が生じることを示す。
非平衡条件下では、古典的相関の緩和力学、全相関の崩壊速度、およびエンタングルメントエントロピーの成長速度を用いて、初期状態に対応するハミルトンとハミルトンがギャップを持つかギャップのないかを明らかにすることができる。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:26:34 GMT)
Single atom optical gate and single photon source based on magnetooptical effects in a waveguide [0.0] 導波路内に閉じ込められた原子アンサンブルの光学特性に磁場が異常に強い影響があることを発見した。
そこで本研究では,その効果に基づいて,真の単一光子源の新たなスキームを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:45:51 GMT)
Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks [0.0] ディープニューラルネットワークでうまく一般化することは、依然として重要な課題である。
Sharpness-Aware Minimization (SAM) の簡易かつ効果的な拡張である ZSharp を提案する。
ZSharpは、統計的に重要な勾配成分のみを保持するために、階層的にZスコア正規化を行い、パーセンタイルベースのフィルタリングを行う。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:13:12 GMT)
Sequential Generation of Two-dimensional Super-area-law States with Local Parent Hamiltonian [0.0] 我々は、$d+1$次元のプロセスと$d+1$次元の量子状態の対応を利用して、高度に絡み合った2次元状態の例を構築する。
これらの状態の絡み合い構造は、明示的に計算し、領域法則、サブボリューム法則、体積法則の間で調整することができる。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:00:10 GMT)
Sensing Birefringence and Diattenuation with Undetected Light [0.0] 我々は、量子イメージング装置において、尋問光の制御可能な偏光を導入する。
非検出光による複屈折・拡張を同時に検出する非線形干渉計の可能性を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:33:07 GMT)
Scoring the European Citizen in the AI Era [0.0] 社会的スコアリングは、AI法で禁止されているAIプラクティスの1つである。
この記事では、この禁止はフレキシブルな方法で起草されている、と論じます。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:04:25 GMT)
Schrodinger's Field Equation [0.0] 水素原子中の電子状態のポテンシャルエネルギーは、シュロディンガー非相対論的方程式の演算子形式を用いて決定された。
すべての運動エネルギーとポテンシャルエネルギーはよく知られた1/n2則に合致した。
論文参考訳(メタデータ) (Mon, 05 May 2025 23:03:33 GMT)
Running a Data Integration Lab in the Context of the EHRI Project: Challenges, Lessons Learnt and Future Directions [0.0] EHRIプロジェクトは、この問題を軽減するために、アーカイブ、研究者、デジタル実践者の超国家的ネットワークを構築した。
主な成果の1つは、ホロコースト関連考古学資料の1つの中心的なプラットフォーム記述に集結する「仮想観測所」であるEHRIポータルの創設である。
Portalを構築するには強力なデータ識別と統合の努力が必要であり、EHRI-3データ統合ラボの創設でプロジェクトの第3フェーズに到達した。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:39:18 GMT)
Revisiting the relaxation of constraints in gauge theories [0.0] 近年、ゲージ理論の経路積分量子化は必然的にラグランジュ的制約の緩和を必要とすると主張する研究がある。
この緩和は、ラグランジアン理論において作用原理のレベルでゲージを固定するときに通常起こるものであることを示す。
すなわち、ゲージ理論を定量化する方法の1つは、拡張ハミルトニアン(英語版)を構築し、それを第二級系にするなど、手で新しい条件を加えることである。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:53:44 GMT)
Reinforcement Learning and Life Cycle Assessment for a Circular Economy -- Towards Progressive Computer Science [0.0] 本研究の目的は,循環型経済における強化学習によるライフサイクルアセスメントの可能性を検討することである。
コンピュータチェスにおける強化学習(Reinforcement Learning)の応用について説明する。
本稿の最終部では、経済パラダイムを持続可能性に転換するコンピュータサイエンス関連の課題について論じる。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:53:39 GMT)
Real-World Gaps in AI Governance Research [0.0] 9,439件のAI生成論文(2020年1月から2025年3月)から1,178件の安全性と信頼性に関する論文を引用し、主要なAI企業や大学の研究成果を比較した。
企業AI研究は、モデルアライメントとテストと評価という、デプロイ前領域にますます集中していることに気付きました。
医療、金融、誤情報、説得力と中毒性の特徴、幻覚、著作権など、リスクの高い展開領域に重要な研究ギャップが存在する。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:12:46 GMT)
RGBX-DiffusionDet: A Framework for Multi-Modal RGB-X Object Detection Using DiffusionDet [0.0] RGBX-DiffusionDetはDiffusionDetモデルを拡張するオブジェクト検出フレームワークである。
適応型マルチモーダルエンコーダにより、不均一な2Dデータ(X)をRGB画像と融合する。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:39:51 GMT)
Quasiprobability as a resource for memory reduction in stochastic process modeling [0.0] プロセスのシミュレーションには、過去と未来の間で共有されているものよりも多くの情報を現在に保存する必要があります。
衝突エントロピー測度の下では、そのようなモデルの最小メモリは余剰エントロピーを等しくすることができることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 05:41:42 GMT)
Quantum simulation of interacting bosons with propagating waveguide photons [0.0] 本研究では,光子数選択位相ゲートを用いて,チューニング可能なオンサイト相互作用をシミュレートできることを示す。
本稿では,Bose-Hubbard と FQH Hamiltonian を正確にシミュレートできる回路を提案する。
我々の手法は導波路フォトニックシミュレーションプラットフォームを強く相互作用する量子多体状態に拡張する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:38:36 GMT)
Quantum mechanics of inverted potential well -- Hermitian Hamiltonian with imaginary eigenvalues, quantum-classical correspondence [0.0] 逆ポテンシャル井戸における粒子の量子化について検討する。
ハミルトニアンはエルミートであり、ポテンシャルは下界を持たない。
量子古典対応は虚固有値系に存在する。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:03:23 GMT)
Quantum Monte Carlo and Stabilizer States [0.0] SSE(Series Expansion)として知られる量子-モンテカルロ法は、重要な非分岐状態に依存している。
安定化状態がSSE手法の拡張を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:56:30 GMT)
Quantum Many-Body Scars beyond the PXP model in Rydberg simulators [0.0] QMBSは、多体ハミルトニアンスペクトルの典型的な固有状態と共存する非熱的に励起された固有状態である。
ここで報告されたQMBSは、長距離リドベルク封鎖の状況下で、ライドベルク原子シミュレータを用いて実験的に調査される可能性がある。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:10:40 GMT)
Quantum Information Geometry Meets DMRG: Uhlmann Gauge Improvements in Computational Methods [0.0] 本稿では,密度行列再正規化群 (DMRG) と行列積状態 (MPS) 技術を組み合わせた新しいアプローチを提案し,体系的に検討する。
我々は、Uhlmannゲージ強化計算法の幅広い可能性について、精度と信頼性の大幅な向上を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 03:26:07 GMT)
Prediction of Delirium Risk in Mild Cognitive Impairment Using Time-Series data, Machine Learning and Comorbidity Patterns -- A Retrospective Study [0.0] 軽度認知障害(MCI)患者の死亡率と死亡率を特徴とする臨床的懸念
本研究は,MCIに関連する共生パターンを解析し,縦断的予測モデルを構築し,デリリウムの関連リスク要因について検討した。
このモデルではAUROCは0.93、AUPRCは0.92と頑健な予測能力を示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:21:31 GMT)
Predicting potentially abusive clauses in Chilean terms of services with natural language processing [0.0] 本研究は, 消費者契約における情報非対称性の増大に対する懸念に対処するものである。
我々はこのギャップに対処する新しい方法論と実質的なデータセットを導入する。
4つのカテゴリと合計20のクラスを持つ新しいアノテーションスキームを提案し、チリで使用される50のオンラインサービス用語に適用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:02:07 GMT)
Point Cloud Recombination: Systematic Real Data Augmentation Using Robotic Targets for LiDAR Perception Validation [0.0] 仮想シミュレーションでは、制御された条件下で任意のシーンを生成することができるが、物理的なセンサー特性は欠如している。
実世界のデータは真のセンサーリアリズムを提供するが、影響要因の制御は少ない。
既存のアプローチでは、シーン間でオブジェクトを転送することで、現実のポイントクラウドデータの増大によってこの問題に対処している。
制御された実験室で測定された物理的対象物から取得した点雲を統合することにより,捕獲された点雲シーンを体系的に増強する点雲再結合を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:00:16 GMT)
Partons from stabilizer codes [0.0] フェルミオン粒子から構築された射影波動関数は、位相秩序を持つように厳密に示すことができることを示す。
我々の研究は、グッツウィラー予想の深い影響と、計画されていない状態からのみ量子スピン液体の特性を推測することへの注意を裏付けるものである。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:32:19 GMT)
Partial Wavefunction Collapse Under Repeated Weak Measurement of a non-Conserved Observable [0.0] 量子非分解(QND)測定の2つの目印は、測定可能な$A$の期待値のアンサンブルレベルの保存である。
一つのサイト上での局所的な測定により,システム全体のスペクトルに関する情報が明らかになることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:33:37 GMT)
Parameter estimation for land-surface models using machine learning libraries [0.0] 本研究では, 観測された土壌温度時系列を用いて, 信頼性の高いパラメータ推定を行うことは不可能であることを示す。
米国フェニックスの都市フラックスタワーデータに逆モデルを適用し, 熱伝導率, 体積熱容量, 複合感熱伝達係数を確実に推定できることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:08:15 GMT)
Orbital Entanglement and The Double $d$-Shell Effect in Binary Transition Metal Molecules [0.0] 我々は,3d$および4d$遷移金属分子水和物および酸化物の周期列における相関波動関数の情報エントロピーを解析した。
これらの量子情報技術は、これらの種の微妙な電子構造に関するユニークな洞察を与える。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:06:20 GMT)
Optimal control in phase space applied to minimal-time transfer of thermal atoms in optical traps [0.0] 1次元アレイに配置された光ツイーザにおける超低温中性熱原子の輸送を最適制御する手法を提案する。
粒子力学はまず、リウヴィル方程式による古典的アプローチと量子ウィグナー方程式による量子効果を含む古典的手法を用いてモデル化される。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:17:40 GMT)
On the hydrogen atom in an spherical box [0.0] 我々は、不透明な壁を持つ箱の中の水素原子のいくつかの性質を導出する。
条件付き解決可能な条件から生じるいくつかの根は、モデルパラメータの臨界値に向かって収束しているように見える。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:15:43 GMT)
Observation of Lie algebraic invariants in Quantum Linear Optics [0.0] ボーソンサンプリングの文脈に適用したリー代数の役割を実験的に検討した。
サンプリング実験はリー代数構造によってもたらされる制約を実際に満たしていることを示す。
これにより、光子ベースの量子コンピューティングプロトコルの検証ツールとして代数的に着想を得た手法を使うための新たな道が開かれる。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:02:12 GMT)
Observability conditions for neural state-space models with eigenvalues and their roots of unity [0.0] 本研究では,ニューラル状態空間モデルとMambaアーキテクチャの文脈における可観測性の概念について検討する。
我々は,学習コンテキストに合わせて,可観測性を強制する戦略を開発する。
本手法は,可観測性を有する場合の計算効率を向上する。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:05:05 GMT)
ONERA's CRM WBPN database for machine learning activities, related regression challenge and first results [0.0] 本稿では, ONERAで開発された新しい計算流体力学データベースについて, 空力場予測のための機械学習技術の進歩を支援する。
これは、NASA/Boeing Common Research Modelのウィングボディ・ボディ・パイロン・ナセル構成で実施されたスパラート・オールマラス乱流モデルを用いて、レイノルズ平均ナビエ・ストークスの468個のシミュレーションを含んでいる。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:40:15 GMT)
Moving From Monolithic To Microservices Architecture for Multi-Agent Systems [0.0] モノリシックからアーキテクチャへの移行は、スケーラビリティと保守性を改善して、ソフトウェア開発に革命をもたらした。
この記事では、モノリシックなアーキテクチャから、マルチエージェントシステムの特定のコンテキストにおけるアーキテクチャへの進化について説明する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:10:46 GMT)
Modeling the Impact of Group Interactions on Climate-related Opinion Change in Reddit [0.0] ソーシャルメディアプラットフォーム上での会話スレッドに固有のグループダイナミクスを捉えた時間的ハイパーグラフモデルを提案する。
このモデルは、個々のユーザーレベルでの気候問題に対する姿勢の時間的変化を予測する。
その結果,ハイパーグラフによるグループ間相互作用のモデル化は,意見形成の微視的ダイナミクスの予測に優れていた。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:35:25 GMT)
Modeling AI-Human Collaboration as a Multi-Agent Adaptation [0.0] タスクの関数としてAIと人間のコラボレーションを形式化するエージェントベースのシミュレーションを開発する。
モジュラータスクでは、AIが人間の代わりになることが多いことを示します。
また、記憶や構造が欠如している「幻覚的」AIでさえ、ローカルオプティマから逃れることによって、低能力な人間を増強することで、結果を改善することも示しています。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:26:02 GMT)
Model-agnostic basis functions for the 2-point correlation function of dark matter in linear theory [0.0] 幅広い種類の宇宙モデルにおいて、バリオン音響振動特性の近傍に$xi_rm lin(r)$を記述する基底 $mathcalB$ を求める。
モデルに依存しないBAO解析における基礎関数の使用は、統計的に有意な利益をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:48:17 GMT)
Many-Body Quantum Optics in a Bose-Hubbard Waveguide [0.0] 本研究では,1次元Bose-Hubbard導波路に結合した量子エミッタの集合減衰とコヒーレント相互作用について検討する。
我々は、光子-光子相互作用だけで、エミッタ間隔と遷移周波数によらず、超ラジカルバーストを発生させることができることを示した。
我々の研究は、多体物理学と導波路QEDを橋渡しし、フォトニック多体状態がエミッタの動力学をどのように行うかを明らかにする。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:00:00 GMT)
Mallows-type model averaging: Non-asymptotic analysis and all-subset combination [0.0] 最適全サブセットMAリスクを達成するには,基本的限界が存在することを示す。
本稿では,次元適応型$C_p$基準に基づく新しいMallows型MAプロシージャを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:30:17 GMT)
MONOVAB : An Annotated Corpus for Bangla Multi-label Emotion Detection [0.0] 感性分析(SA)と感情認識(ER)は、バングラ語でますます人気が高まっている。
しかし、この言語は構造的に複雑であるため、この領域は正確な方法で感情を抽出することが困難である。
本研究では,Facebookから抽出したデータに基づいて注釈付きコーパスを構築するための徹底的な手法を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:39:20 GMT)
MNT Elliptic Curves with Non-Prime Order [0.0] 一般化されたMNT曲線を生成する方法を提案する。
そのようなペアリーな曲線の順序は、2つの素数の積である。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:20:21 GMT)
Lumped-element broadband SNAIL parametric amplifier with on-chip pump filter for multiplexed readout [0.0] 本稿では,SNAILをベースとしたパラメトリック増幅器を提案する。
複数のデバイスで最大250MHzの帯域で1dB未満のフラットな20dBゲインプロファイルを測定する。
変調生成物は1dBゲイン圧縮点においても信号音に対して23dB以上抑制されていることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:45:51 GMT)
Long-Range Interacting Many-Body Systems in the Irrep Basis [0.0] 無限範囲で均質なオール・ツー・オール相互作用を特徴とする多体スピンモデルを効率的に記述することができる。
しかし、長いが有限範囲の相互作用など、系の置換不変性が弱くなると、これらのツールは数学的に無効になる。
ここでは、これらのシナリオを、対称部分空間への結合の階層構造に従って追加の多体部分空間を考えることによって概説する。
我々は、これらの余剰部分空間を定義して、近似の各順序でそれらの次元を最小化する「既約蒸留」という手順を提唱した。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:52:03 GMT)
Logits-Constrained Framework with RoBERTa for Ancient Chinese NER [0.0] 本稿では,古代中国の名前付きエンティティ認識(NER)のためのロジッツ制約フレームワークを提案する。
我々の2段階モデルは、文脈符号化のためのGujiRoBERTaと、有効なBMESラベル遷移を強制するための識別可能な復号機構を統合している。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:23:16 GMT)
Light-based Chromatic Aberration Correction of Ultrafast Electron Microscopes [0.0] 超高速電子顕微鏡において,色収差を補償する手法を提案し,理論的に実証する。
この技術は、形状のパルスピエロレンズとの相互作用を用いたパルス電子ビームの空間運動と時間依存性の位相変調に基づいている。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:22:38 GMT)
Light Weight CNN for classification of Brain Tumors from MRI Images [0.0] 本研究では,脳腫瘍のマルチクラス分類のための畳み込みニューラルネットワーク(CNN)に基づくアプローチを提案する。
グリオーマ,髄膜腫,下垂体腫瘍,腫瘍の4つの分類に分類したMRI画像を含む公開データセットを用いて検討した。
実験により, 本モデルが98.78%の分類精度を達成し, 臨床現場での診断支援の可能性を示した。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:00:46 GMT)
Leveraging Atom Loss Errors in Fault Tolerant Quantum Algorithms [0.0] 量子ビット損失に関連する誤差は、多くの量子ハードウェアシステムにおいて重要なノイズ源となっている。
我々はこれらの誤りを論理アルゴリズムで処理するための理論的枠組みを開発し、復号化手法と回路レベルの最適化を取り入れた。
我々は,小角合成のための玩具モデルを含むテレポーテーションに基づくアルゴリズムをシミュレートし,損失率の増加に伴い論理誤差率を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:31:46 GMT)
Learning simple heuristic rules for classifying materials based on chemical composition [0.0] 本研究では, 材料が金属であるか否かを化学組成に基づいて分類するための簡単なルールを開発するために, 機械学習の利用について検討する。
化学インフォームドインダクティブバイアスを組み込むことで、所定のレベルのテスト精度に達するのに必要なトレーニングデータの量を削減できることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:46:41 GMT)
Learning Quantum Processes with Quantum Statistical Queries [0.0] 量子統計クエリから量子プロセスを学ぶ研究を開始する。
本稿では,予測可能な観測値の数に対して,ほぼ一致した下界を持つ効率的な平均ケースアルゴリズムを提案する。
本稿では,古典可読量子物理関数を用いた認証プロトコルに対する学習アルゴリズムの適用について述べる。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:08:09 GMT)
Latent optical nonclassicality of conditionally prepared states [0.0] 本研究では, 2モード状態の他のモードの測定により, 条件付き単一モード量子状態の制限を克服する手法を開発した。
このタスクは、量子エンタングルメントと量子不協和を超えた相関のクラスである潜在非古典性のステアリングをテストすることで実行される。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:01:26 GMT)
Large Language Models as Carriers of Hidden Messages [0.0] 単純な微調整は、隠されたテキストを大きな言語モデル(LLM)に埋め込むことができる。
我々の研究は、隠れたテキストを微調整で埋め込むことが、膨大な数のトリガーによって安全であるように見えるが、抽出に弱いことを実証している。
我々は,LLMの語彙からトークンを反復的に供給し,高いトークン確率を持つシーケンスを明らかにするunconditional Token Forcing (UTF)と呼ばれる抽出攻撃を導入し,隠れテキスト候補を示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:57:34 GMT)
Large Language Models Understanding: an Inherent Ambiguity Barrier [0.0] 世界を理解する能力に関して、LLM(Large Language Models)の出現以来、活発に議論が続いている。
議論と反論は、思考実験、LLMと人間との逸話会話、統計的言語分析、哲学的考察などに基づいて提案されている。
本稿では, 思考実験と半形式的考察に基づいて, 内在的あいまいさの障壁に繋がる反論を提示する。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:14:14 GMT)
LLaSA: A Multimodal LLM for Human Activity Analysis Through Wearable and Smartphone Sensors [0.0] 生のIMUデータに基づいた質問に何でも答えられるコンパクトな13BモデルであるLLaSAを紹介する。
LLaSAは会話型、文脈対応推論をサポートし、センサ検出行動の原因を説明する。
SensorCaps、OpenSQA、Tune-OpenSQAの3つの大規模なデータセットをリリースしています。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:54:48 GMT)
LLM4FTS: Enhancing Large Language Models for Financial Time Series Prediction [0.0] 従来の機械学習モデルは、制限されたモデル容量に制約された予測タスクに制限を示す。
我々は、学習可能なパッチセグメンテーションと動的ウェーブレット畳み込みモジュールによる時間的シーケンスモデリングを強化する新しいフレームワークLLM4FTS$を提案する。
実世界の金融データセットの実験は、このフレームワークの有効性を実証し、複雑な市場パターンを捉える上で優れたパフォーマンスを示し、ストックリターン予測の最先端結果を達成する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:48:34 GMT)
LGIN: Defining an Approximately Powerful Hyperbolic GNN [0.0] Lorentzian Graph Isomorphic Network (LGIN) は、双曲空間のローレンツモデル内での識別能力を向上するために設計された。
LGINは、最先端のハイパーボリックとユークリッドのGNNを一貫して上回るか、マッチする。
我々の知る限りでは、LGINは双曲空間における強力なGNNの背後にあるフレームワークを研究する最初の研究である。
論文参考訳(メタデータ) (Mon, 05 May 2025 20:07:37 GMT)
Kohn-Sham inversion with mathematical guarantees [0.0] 正確なモロー・ヨシダ正規化定式化を用いて周期系の交換相関ポテンシャルを得る。
厳密な数学的原理と効率的な数値的実装との深い関係を明らかにする。
我々は,代表的バルク材料に対して,数学的に厳密な逆変換アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:13:40 GMT)
Knowledge Graphs for Enhancing Large Language Models in Entity Disambiguation [0.0] 我々は、ゼロショットエンティティ曖昧化(ED)のためのLarge Language Models(LLM)を強化するために知識グラフを使用します。
我々は、KG内のエンティティのクラスを階層的に表現することで、候補空間とエンティティの記述を訓練し、入力プロンプトを追加の事実知識で強化する。
一般的なEDデータセットを用いた評価の結果,提案手法は非強化および記述専用拡張LDMよりも優れており,タスク固有モデルよりも適応性が高いことがわかった。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:40:24 GMT)
Investigating the Impact of Personalized AI Tutors on Language Learning Performance [0.0] サンタやデュオリンゴのような言語学習プラットフォームで、34人の学生を対象に、ペア化されたサンプルtテストを行い、AIチューターの使用後、準実験を行います。
パーソナライズされた言語学習体験において、学生のエンゲージメント、学業成績、学生の満足度との関係について検討する。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:11:20 GMT)
Interpretable Dynamic Graph Neural Networks for Small Occluded Object Detection and Tracking [0.0] 本稿では,動的グラフニューラルネットワーク(DGNN)とYOLO11を統合し,制約に対処する新しいフレームワークであるDGNN-YOLOを紹介する。
標準のGNNとは異なり、DGNNはグラフ構造をリアルタイムで動的に更新する優れた能力のために選択される。
このフレームワークはグラフ表現を構築し、定期的に更新し、ノードとしてオブジェクトをキャプチャし、エッジとして相互作用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:28:03 GMT)
Hyperinductance based on stacked Josephson junctions [0.0] スーパーインダクタンス(Superinductances)は、新しい量子回路アーキテクチャの鍵となる実装である。
垂直重積ジョゼフソン接合に基づく超インダクタンスを実現するための2つの製法を提案する。
本結果は,次世代量子回路のための拡張性,堅牢性,フレキシブルなプラットフォームとして,ジャンクション・スタックリングを確立した。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:20:14 GMT)
Hole-spin qubits in germanium beyond the single-particle regime [0.0] 我々はゲルマニウムの3ホール量子ビットを調査し、その性能が1ホールの量子ビットと比較できることを示した。
特に、わずかに長めの量子ドットでは、ゲーティング時間の2桁の増大が得られている。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:23:15 GMT)
Hierarchical Reinforcement Learning in Multi-Goal Spatial Navigation with Autonomous Mobile Robots [0.0] 階層的強化学習(HRL)は、疎い報酬スキームを持つロボット学習における固有の階層を活用できると仮定されている。
HRLの特徴として,サブゴールと終端関数を生成できる能力について評価した。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:21:55 GMT)
Graph Neural Network-Based Reinforcement Learning for Controlling Biological Networks: The GATTACA Framework [0.0] 複雑な生物学的システムのネットワークモデルを制御するために, 深層強化学習(DRL)の利用について検討する。
セルリプログラミングにおける非同期更新モード下でのブールネットワークモデルに対する新しい制御問題を定式化する。
生体システムの構造を活用するため,DRLエージェントが学習した行動値関数のための人工ニューラルネットワーク近似器に,グラフ畳み込みを伴うグラフニューラルネットワークを組み込んだ。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:07:20 GMT)
Geometrical Amplitude factors in the the adiabatic evolution [0.0] 最初はn番目の固有状態にある量子系において、ハミルトニアンの断熱的進化は、相因子を取得しながら対応する瞬時固有状態にあることを保証する。
本研究では、虚固有値を持つエルミート・ハミルトニアンの文脈における幾何振幅の概念を探求する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:33:26 GMT)
Genuine quantum non-Gaussianity and metrological sensitivity of Fock states prepared in a mechanical resonator [0.0] 高オーバトンバルク波共振器(HBAR)における高フォック状態の生成
我々は,マルチフォノンコントリビューションを明らかにするために,真の量子非ガウス性(QNG)の基準を用いて,実験により実現された状態を特徴付ける。
本結果は,HBARデバイスを用いた量子センシングとシミュレーションに即時に適用できる。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:23:51 GMT)
From Spaceborn to Airborn: SAR Image Synthesis Using Foundation Models for Multi-Scale Adaptation [0.0] 本研究では,衛星SAR画像を空中SAR表現に変換するため,基礎モデル内の空間条件付け技術を利用した新しいアプローチを提案する。
提案手法は,SARイメージング技術の進歩におけるAIのキーとなる応用を探求する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:33:06 GMT)
Finite-Speed-of-Light Effects in Atom Interferometry: Diffraction Mechanisms and Resonance Conditions [0.0] 我々は原子干渉計における有限速光効果の理論を開発する。
解析の結果,その大きさは回折機構と特定の干渉計形状に大きく依存していることが判明した。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:28:47 GMT)
Fermion-to-qubit encodings with arbitrary code distance [0.0] 本研究では,1次元と2次元の局所フェルミオン・量子ビット符号化の符号距離を安定化器の重みを増大させることなく拡張できるフレームワークを提案する。
これは、トポロジ的欠陥の形で、低距離エンコーディングを表面コードに埋め込むことによって達成される。
我々の戦略は、LEを6.6.6カラーコードに明示的に埋め込むことによって、他のトポロジコードにも拡張可能であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:00:14 GMT)
Fast initialization of Bell states with Schrödinger cats in multi-mode systems [0.0] 猫の状態は特定の種類のノイズに対して保護されており、猫の量子ビットは量子コンピューティングの有望な候補となる。
我々は,アディバティック・ダイアバティック・スイッチングによる多モード猫状態の効率的な変換を実証した。
これらの変換は、ネコをエンタングルド・ベル状態から初期化するのに対して、ネコをエンタングルド・フォック状態として直接初期化するのに用いられる。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:26:16 GMT)
Faithful and secure distributed quantum sensing under general-coherent attacks [0.0] 分散センシングのための単方向と二方向のプロトコルを理論的に導入し、理論的に解析し、実験的に実証する。
提案手法は,低雑音の場合にプロトコルを進行させ,理想的な推定手順に関する潜在的な改ざんを定量化する安全閾値機構を提案する。
我々は,このプロトコルをフォトニクスに基づく実装で実証し,推定バイアスの観点から,安全閾値の保証の可能性はかなりの価格で得られることを確認した。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:48:41 GMT)
Eye Movements as Indicators of Deception: A Machine Learning Approach [0.0] 本研究では,2つのデータセットにまたがる偽情報検査におけるAIモデルの有効性について検討した。
XGBoostは二分分類タスクで最大74%、より困難な三分分類タスクで49%の精度を達成した(Revealing vs. Concealing)。
論文参考訳(メタデータ) (Mon, 05 May 2025 13:50:12 GMT)
Exponential improvement in quantum simulations of bosons [0.0] デジタル量子コンピュータ上のボソンのハミルトン量子シミュレーションでは、ヒルベルト空間を有限次元に切り離す必要がある。
ヤン=ミルズ理論やQCDのような格子量子論では、いくつかのハミルトンの定式化と対応するトランケーションが近年進行している。
3人の著者によって提唱された普遍的枠組みは、回路複雑性の指数的スケーリングを$Q$で解決する自然な方法であることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 10:48:52 GMT)
Escaping the Krylov space during finite precision Lanczos [0.0] 有限精度算術における固有ベクトルの数値列は、正確なランツォスベクトルで表される真のベクトル空間から逃れることを示す。
これは作用素成長仮説の解釈に真の脅威をもたらす。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:19:04 GMT)
Ergodiscord: An Operational and Distinct Notion of Quantumness of Correlations [0.0] 本稿では,多部量子状態における相関関係の量子性を探究する枠組みを提案する。
エルゴディコード(ergodiscord)と呼ばれる非古典性の演算量化器を導入する。
混合非古典状態は、対応する系の最大絡み合う状態よりも多くの作業をロックできることが示される。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:10:32 GMT)
Entanglement islands in 1D and 2D lattices with defects [0.0] 1次元系では絡み合いは欠陥の近くに集中する傾向にあり、2次元では橋梁状および放射対称領域を観察する。
この結果から,TDQMCは実空間量子情報解析のためのスケーラブルで物理的に透過的なフレームワークを提供することが示された。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:30:12 GMT)
English Please: Evaluating Machine Translation with Large Language Models for Multilingual Bug Reports [0.0] 本研究は,バグ報告における機械翻訳(MT)性能の総合評価としては初めてである。
私たちは、DeepL、AWS Translate、ChatGPT、Claude、Gemini、LLaMA、Mistralといった大規模言語モデルの性能を分析します。
我々は, BLEU, BERTScore, COMET, METEOR, ROUGE-Allongsideの分類指標(精度, 精度, リコール, F1スコア)を含むMT評価指標を多用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:32:08 GMT)
Engineering protected cavity-QED interactions through pulsed dynamical decoupling [0.0] 低周波雑音により2レベルシステムと単一ボソニックモードの結合が著しく劣化する条件下で, 汎用空洞QED構成について検討した。
我々は、個々のサブシステム間で励起のコヒーレントな交換を可能にしながら、ノイズの影響を抑えるパルス動的疎結合戦略を同定する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:05:58 GMT)
Encrypted Federated Search Using Homomorphic Encryption [0.0] 本稿では、法執行機関が暗号化された犯罪データベース上でクエリを実行できるプライバシー保護フェデレーション検索システムを提案する。
ここでの重要なイノベーションは、データの復号化なしに、分散データベース間で暗号化されたクエリを実行できることだ。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:03:30 GMT)
Enabling Local Neural Operators to perform Equation-Free System-Level Analysis [0.0] ニューラルネットワーク(NO)は、物理法則を含む計算のための強力なフレームワークを提供する。
我々は、Krylov部分空間における(局所的な)NOと高度な反復的数値法を統合するフレームワークを提案し、実装する。
3つの非線形PDEベンチマークを通して、我々のフレームワークを説明します。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:17:18 GMT)
Emergent Hydrodynamic Mode on SU(2) Plaquette Chains and Quantum Simulation [0.0] 準1次元プラケット鎖上の2+1$D SU(2)格子ゲージ理論のハミルトン力学における創発的流体力学モードを探索する。
Umklapp過程のため、エネルギー拡散のモードしか見つからない。
量子コンピュータ上で対称相関器を計算するための量子アルゴリズムを導入し,その結果が正確な対角化と一致していることを見出した。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:04:56 GMT)
Efficient and high-fidelity entanglement in cavity QED without high cooperativity [0.0] 本稿では,効率的な絡み合い生成を実現するため,ステートカルビングプロトコルの簡単な修正を提案する。
0.999の高忠実度は34の空洞協調性で達成できる。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:56:54 GMT)
Early Prediction of Sepsis: Feature-Aligned Transfer Learning [0.0] セプシス(Sepsis)は、体が感染に対して極度に反応した場合に起こる、生命を脅かす医療疾患である。
現在の診断法は、しばしば大きな損傷が既に発生した後にのみ敗血症を同定する。
本研究の目的は、早期の敗血症を予測する機械学習ベースのシステムを開発することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 17:59:34 GMT)
Diagnostic Uncertainty in Pneumonia Detection using CNN MobileNetV2 and CNN from Scratch [0.0] 本研究では,教師付き学習手法であるCNNを提案する。
MobileNetV2をResNet101V2アーキテクチャの事前トレーニングとして使用し、スクラッチモデルから構築されたKeras APIを使用して、特に肺炎の肺疾患を識別する。
論文参考訳(メタデータ) (Mon, 05 May 2025 06:40:08 GMT)
Deaf in AI: AI language technologies and the erosion of linguistic rights [0.0] 本稿では,AI言語技術の相互作用,手話解釈,言語アクセスについて考察する。
それは、公平で包括的で信頼に値するAIシステムを育むための、聴覚障害者主導のアプローチを求めている。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:58:59 GMT)
Data-driven Hamiltonian correction for qubits for design of gates [0.0] 交差共鳴においてマイクロ波によって駆動される2つのトランモンの標準ハミルトニアンの補正項を得る。
データは実際のトランスモンシステム、すなわちIBM量子プラットフォーム上のibm kyivから取得される。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:26:36 GMT)
Data Augmentation With Back translation for Low Resource languages: A case of English and Luganda [0.0] 本稿では,英語とルガンダ語を併用したニューラル機械翻訳モデルを構築するための半教師付き手法として,バック翻訳の適用について検討する。
提案手法では,公開データとウェブクローリングデータの両方を用いて独自のNMTモデルを構築し,反復および増分バック翻訳手法を適用した。
その結果,英ラガンダ対の翻訳性能は,全翻訳方向の10点以上のBLEUスコアユニットで過去のベンチマークを上回った。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:47:52 GMT)
Cooperative Bayesian and variance networks disentangle aleatoric and epistemic uncertainties [0.0] 実世界のデータは、不完全な測定やデータ生成プロセスに関する不完全な知識から生じる、アレラトリックな不確実性を含んでいる。
平均分散推定(MVE)ネットワークは、このような不確実性を学ぶことができるが、過度な適合を避けるためには、アドホックな正規化戦略を必要とする。
ベイズニューラルネットワークを用いて分散ネットワークを訓練し、その結果のモデルが平均推定を改善しつつ、アレタリックおよびてんかんの不確かさを解き放つことを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:50:52 GMT)
Controlling Schwinger tunneling via engineering of virtual particle phases in vacuum [0.0] 真空トンネル法は電磁ポテンシャル変調により効果的に制御できることを示す。
このことは、シュウィンガー過程の排他的支配を局所的なフフェルト強度に起因する従来のパラダイムに挑戦する。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:51:47 GMT)
Constrained Adversarial Learning for Automated Software Testing: a literature review [0.0] この文献レビューは、敵の学習やソフトウェアテストに適用される制約付きデータ生成アプローチの現状に焦点を当てている。
ホワイトボックス,グレイボックス,ブラックボックステストに特化したテストの利点と限界を分析した。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:59:59 GMT)
Computational Irreducibility as the Foundation of Agency: A Formal Model Connecting Undecidability to Autonomous Behavior in Complex Systems [0.0] 本研究では,潜在的チューリング完全環境内で動作する「最小エージェント」の形式モデルを提案する。
エージェント-環境相互作用の固有の不決定性と計算不可能性は、予測不可能性と新しい情報生成につながると論じる。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:24:50 GMT)
Comparing classical and quantum conditional disclosure of secrets [0.0] 秘密の条件開示(CDS)設定は、暗号学で研究されている最も基本的なプリミティブの一つである。
本稿では,暗号における量子資源のパワーを明らかにすることを目的として,量子CDSと古典CDSの違いについて検討する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:14:18 GMT)
Coherent states of an accelerated particle [0.0] 我々は、既知の粒子と新しい粒子の両方の加速粒子の量子状態を表す。
加速粒子に対する非定常状態の完全な集合を得る。
我々は異なる表現を見つけ、Fock空間を座標し、これらの表現に入力される全てのパラメータを詳細に分析した。
論文参考訳(メタデータ) (Mon, 05 May 2025 11:21:46 GMT)
Closed-Form Expressions for Unitaries of Spin-Adapted Fermionic Operators [0.0] スピン適応作用素の数学的構造を解析し、一重項スピン適応一般化単項励起と二重励起により生成されるユニタリに対する閉形式表現を導出する。
これらの結果は、量子シミュレーションにおけるスピン対称性の経済的適用に向けた大きな進歩を示している。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:27:06 GMT)
Chiral Gain-Induced Time-Reversal Symmetry Breaking in Quantum Systems [0.0] 我々は、構造化ゲイン環境と相互作用する量子ビットの力学を記述するための理論的枠組みを開発する。
キラルゲインは時間反転対称性を破り、非相反特性を持つ対称性に破れた定常状態に向かってシステムを駆動することができることを示す。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:17:42 GMT)
ChatGPT for automated grading of short answer questions in mechanical ventilation [0.0] 大規模言語モデル(LLM)は会話言語をシミュレートし、構造化されていない自由テキスト応答を解釈する。
215名の学生のデータを用いて,ChatGPT 4o の評価を行い,SAQ の評価を行った。
論文参考訳(メタデータ) (Mon, 05 May 2025 19:04:25 GMT)
Characterization of a quantum bus between two driven qubits [0.0] 我々は、$sqrtimathrmSWAP$-gateを実装するために、駆動量子ビットを高調波発振器に結合する。
我々は、高調波発振器の共振周波数のシフトを検出することにより、量子ビット読み出し機構を解析する。
本研究は,実験装置における高忠実度量子ゲートの実現を導くものである。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:52:25 GMT)
Bye-bye, Bluebook? Automating Legal Procedure with Large Language Models [0.0] アメリカ合衆国では、『The Bluebook: A Uniform System of Citation』より複雑であるものはほとんどない。
大規模言語モデル(LLM)がそのような複雑なシステムの手順に準拠できるかどうかを評価するため,OpenAI, Anthropic, Google, Meta, DeepSeek の 866 Bluebook タスクとテストフラグシップ LLM のデータセットを構築した。
これらのモデルが完全に準拠するBluebookの引用を生成するのは69%-74%に過ぎず、Bluebookの基本的なルールシステムにおけるコンテキスト内学習は精度を77%に向上させる。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:18:07 GMT)
Beyond the model: Key differentiators in large language models and multi-agent services [0.0] DeepSeek、Manus AI、Llama 4といった基礎モデルのローンチによって、大規模言語モデル(LLM)がもはや生成AIの唯一の決定要因ではないことが明らかになった。
このレビュー記事は、現代のAIサービスが効率的で利益を上げられるように、これらの重要な差別化要因を掘り下げている。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:15:31 GMT)
Beyond the Monitor: Mixed Reality Visualization and AI for Enhanced Digital Pathology Workflow [0.0] 病理学者は、がんなどの疾患を診断するために、ギガピクセル全体の画像(WSI)を頼りにしている。
現在のデジタル診断ツールは診断を妨げている。
PathVisはApple Vision Pro用の複合現実可視化プラットフォームである。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:46:53 GMT)
Bemba Speech Translation: Exploring a Low-Resource African Language [0.0] 本稿では,国際音声言語翻訳会議(IWSLT 2025)へのシステム提出について述べる。
我々はWhisperとNLLB-200をベースとしたカスケード音声翻訳システムを構築し,バックトランスレーションなどのデータ拡張技術を採用した。
論文参考訳(メタデータ) (Mon, 05 May 2025 09:51:56 GMT)
Balancing Security and Liquidity: A Time-Weighted Snapshot Framework for DAO Governance Voting [0.0] 投票の重みとしてトークンを使用することで、ハッカーがフラッシュローンを通じて投票結果を操作する機会がもたらされる。
本研究では,フラッシュローン攻撃に対する防御機構について検討した。
本稿では,新たな修正構造を提案し,事例に適用する。
論文参考訳(メタデータ) (Mon, 05 May 2025 22:14:15 GMT)
Are Colors Quanta of Light for Human Vision? A Quantum Cognition Study of Visual Perception [0.0] 我々は、光子が光波の物理的測定のための光量子であるのと同じように、色が人間の視覚知覚のための光量子であることを示す。
この結果は,人間の知覚に特徴的なワープ機構の量子計測プロセス自体の同定に依存する。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:35:00 GMT)
Applying LLMs to Active Learning: Towards Cost-Efficient Cross-Task Text Classification without Manually Labeled Data [0.0] 本稿では,大規模言語モデル(LLM)をアクティブな学習フレームワークに統合し,高いタスク間テキスト分類性能を実現する手法を提案する。
本手法は,計算時間と金銭的コストの約6%しか必要とせず,分類性能の93%以上を維持している。
これらの結果から,テキスト分類作業におけるLLMと能動的学習アルゴリズムの有効利用に関する新たな知見が得られた。
論文参考訳(メタデータ) (Mon, 05 May 2025 12:48:49 GMT)
Angular Momentum-Dependent Spectral Shift in Chiral Vacuum Cavities [0.0] 有界状態のスペクトルにおける角運動量依存的なシフトが興味深い。
私たちのアプローチは、従来の摂動的手法を超越する可能性を示しています。
本研究で明らかになった異常スペクトルシフトは、基本的および実用的意義の両方を有する。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:19:10 GMT)
An Automated LLM-based Pipeline for Asset-Level Database Creation to Assess Deforestation Impact [0.0] 欧州連合森林伐採規制(EUDR)は、企業が森林伐採に寄与していないことを証明しなければならない。
現在のデータベースには必要な詳細が欠けており、広範な財務メトリクスと手動のデータ収集に大きく依存している。
本研究では,LLMを用いて構造化データベースの作成,クリーン化,検証を行う,エンドツーエンドの自動データ抽出パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 15:17:27 GMT)
Adversarial Robustness Analysis of Vision-Language Models in Medical Image Segmentation [0.0] アドリアックはコンピュータビジョンと視覚言語モデルのためにかなり研究されている。
2次元医用画像に対する対角攻撃に対する視覚言語セグメンテーションモデル(VLSM)の堅牢性を検討した。
以上の結果から,DSCとIoUスコアは有意に低下した。
論文参考訳(メタデータ) (Mon, 05 May 2025 18:54:41 GMT)
Advancing Email Spam Detection: Leveraging Zero-Shot Learning and Large Language Models [0.0] 本研究では,メールスパム検出におけるFLAN-T5とBERTなどの高度自然言語処理(NLP)技術を用いたゼロショット学習の有効性について検討した。
提案手法は,従来のスパム検出システムの限界に対処することを目的としている。
FLAN-T5とBERTの統合により、広範なラベル付きデータセットや頻繁な再トレーニングに頼ることなく、堅牢なスパム検出が可能になる。
論文参考訳(メタデータ) (Mon, 05 May 2025 04:48:20 GMT)
Activation Space Interventions Can Be Transferred Between Large Language Models [0.0] モデル間での安全介入は、共有活性化空間の学習されたマッピングを通して伝達可能であることを示す。
このアプローチは、バックドアの除去と有害なプロンプトの拒絶という、確立された2つのAI安全タスクに対して実証する。
また、バックドアに関連付けられた知識を組み込むために、モデルに微調整を施した新しいタスク、textitcorrupted機能を提案する。
論文参考訳(メタデータ) (Mon, 05 May 2025 16:39:22 GMT)
A Systematic Literature Review on Safety of the Intended Functionality for Automated Driving Systems [0.0] 自動走行は、車両の外部環境と内部環境の両方を感知することに依存する。
ISO 21448は、ADSが意図した機能内で安全に動作することを保証することを目的とした、Intended Functionality (SOTIF)の標準である。
この課題は、SOTIFに関する広範囲かつ体系的な文献が限られているにもかかわらず、車両の安全性を確保することである。
論文参考訳(メタデータ) (Mon, 05 May 2025 07:19:50 GMT)
A Note on Statistically Accurate Tabular Data Generation Using Large Language Models [0.0] 本研究は,大規模言語モデル(LLM)を用いて条件分布を推定する確率駆動的プロンプト手法を提案する。
その結果, LLM生成表データの統計的忠実度を高めるため, 確率分布の促進の可能性を強調した。
論文参考訳(メタデータ) (Mon, 05 May 2025 14:05:15 GMT)
A New Perspective To Understanding Multi-resolution Hash Encoding For Neural Fields [0.0] Instant-NGPは近年、ニューラルネットワークの最先端アーキテクチャである。
このようなハッシュグリッド構造がニューラルネットワークの能力をこれほど大きなマージンで改善する理由と理由は不明である。
論文参考訳(メタデータ) (Mon, 05 May 2025 21:53:09 GMT)
A Fast Multiplication Algorithm and RLWE-PLWE Equivalence for the Maximal Real Subfield of the $2^r p^s$-th Cyclotomic Field [0.0] 導体$n = 2r ps$ でシクロトミック場の最大実部分体に対する RLWE-PLWE 同値性を証明する。
また、これらの実部分体の整数環における高速乗法アルゴリズムについても述べる。
論文参考訳(メタデータ) (Mon, 05 May 2025 08:51:24 GMT)
A Comparative Benchmark of a Moroccan Darija Toxicity Detection Model (Typica.ai) and Major LLM-Based Moderation APIs (OpenAI, Mistral, Anthropic) [0.0] 本稿では,Typica.aiのカスタムモロッコDarija毒性検出モデルの性能を評価するベンチマークを提案する。
我々は、暗黙の侮辱、皮肉、文化的に特異的な攻撃など、文化的に根ざした有毒な内容に焦点を当てる。
OMCD_Typica.ai_Mixデータセットから得られたバランステストセットを用いて、精度、リコール、F1スコア、精度を報告する。
論文参考訳(メタデータ) (Mon, 05 May 2025 01:28:04 GMT)