FlexOlmo: Open Language Models for Flexible Data Use [184.9] 我々は、データ共有なしで分散トレーニングをサポートする新しい言語モデル(LM)であるFlexOlmoを紹介します。
FlexOlmoはエキスパートの混成アーキテクチャを採用しており、各専門家はクローズドデータセットで独立して訓練される。
我々は、公開データで訓練された一般専門家と、他のデータ所有者から独立した訓練を受けた専門家とを効果的に組み合わせることができることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:54:21 GMT)
Cosmos World Foundation Model Platform for Physical AI [136.1] 私たちは、開発者が物理AIセットアップのためにカスタマイズされた世界モデルを構築するのを助けるために、Cosmos World Foundation Model Platformを紹介します。
我々のプラットフォームは、ビデオキュレーションパイプライン、事前訓練された世界ファンデーションモデル、事前訓練された世界ファンデーションモデルのポストトレーニング例、ビデオトークン化ツールをカバーしています。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:35:31 GMT)
Spatial-Temporal Graph Mamba for Music-Guided Dance Video Synthesis [135.4] 音楽誘導ダンスビデオ合成作業のための空間時間グラフMamba(STG-Mamba)を提案する。
音楽からスケルトンへの翻訳では、入力された音楽からスケルトン配列を効率的に構築する新しい時空間グラフMambaブロックを導入する。
そこで本研究では,スケルトンからビデオへの翻訳のために,生成した骨格を条件付き画像とともにダンスビデオに翻訳する,自己教師付き正規化ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:33:23 GMT)
Decoder-Hybrid-Decoder Architecture for Efficient Reasoning with Long Generation [129.5] 我々は、レイヤ間の効率的なメモリ共有のためのシンプルで効果的なメカニズムであるGated Memory Unit(GMU)を紹介した。
これは、GMUを組み込んでSambaベースのセルフデコーダからメモリ読み出し状態を共有するデコーダ・ハイブリッド・デコーダアーキテクチャである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:27:00 GMT)
A Survey on Long-Video Storytelling Generation: Architectures, Consistency, and Cinematic Quality [108.9] ビデオ生成モデルは5~16秒間のビデオしか生成できないが、しばしば「ロングフォームビデオ」とラベル付けされる。
16秒を超えるビデオは、物語全体を通して一貫したキャラクターの外観とシーンレイアウトを維持するのに苦労する。
近年の研究では、複数のキャラクター、物語のコヒーレンス、高忠実度の詳細を特徴とする長編ビデオの制作が試みられている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:20:33 GMT)
Optimas: Optimizing Compound AI Systems with Globally Aligned Local Rewards [95.2] 複合システムの効率的な最適化のための統一的なフレームワークであるOptimasを提案する。
各イテレーションにおいて、Optimasはローカルリワード関数(LRF)を効率よく適用し、各コンポーネントのローカル報酬を最大化しながら、この特性を維持する。
我々は,5つの実世界の化合物システムに対して広範な評価を行い,オプティマスが11.92%の平均的な改善によって強いベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:47:51 GMT)
Robust Multimodal Large Language Models Against Modality Conflict [94.1] マルチモーダル大言語モデル(MLLM)は、現実のシナリオにおいて幻覚を起こす傾向がある。
我々は、MLLMをジレンマに配置し、幻覚に直接導く異なるモダリティからの入力における固有の矛盾について研究する。
モダリティ衝突による幻覚を緩和する3つの方法が提案されている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:18:38 GMT)
Do Larger Language Models Imply Better Generalization? A Pretraining Scaling Law for Implicit Reasoning [89.2] 本研究では,実世界の大規模知識グラフの構造と分布を再現する合成マルチホップ推論環境を提案する。
我々の推論タスクは、グラフの欠落したエッジを補完することであり、これは高度なマルチホップ推論を必要とし、現実世界の推論シナリオを模倣する。
特定の知識グラフに対して最適なモデルサイズを予測するために,知識グラフ探索エントロピーを最適モデルサイズに線形にマッピングする経験的スケーリングを求める。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:08:34 GMT)
An Optimisation Framework for Unsupervised Environment Design [88.3] 非教師なし環境設計(UED)は、エージェントの全般的な堅牢性を最大化することを目的としている。
ゼロサム設定において、証明可能な収束アルゴリズムを提供する。
提案手法の有効性を実証的に検証する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:50:34 GMT)
A Neural Representation Framework with LLM-Driven Spatial Reasoning for Open-Vocabulary 3D Visual Grounding [79.0] Open-vocabulary 3D visual groundingは、自由形式の言語クエリに基づいてターゲットオブジェクトをローカライズすることを目的としている。
既存の言語フィールド手法は、言語クエリにおける空間的関係を利用してインスタンスを正確にローカライズするのに苦労する。
本研究では,大規模言語モデル(LLM)に基づく空間推論を用いたニューラル表現に基づく新しいフレームワークであるSpatialReasonerを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:20:38 GMT)
ReCamMaster: Camera-Controlled Generative Rendering from A Single Video [72.4] ReCamMasterは、カメラ制御された生成ビデオの再レンダリングフレームワークである。
これは、新しいカメラ軌道における入力ビデオのダイナミックなシーンを再現する。
また,ビデオの安定化,超高解像度化,画質向上に有望な応用を見出した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:09:06 GMT)
Small Batch Size Training for Language Models: When Vanilla SGD Works, and Why Gradient Accumulation Is Wasteful [72.0] 従来の知恵では、小さなバッチサイズは言語モデルを事前訓練し、微調整を不安定にし、モチベーションを増進させる。
本研究では,バッチサイズからバッチサイズまで,小さなバッチサイズを再検討し,Adamハイパーパラメータを小さなバッチサイズにスケールするためのルールを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:57:36 GMT)
UniConv: Unifying Retrieval and Response Generation for Large Language Models in Conversations [71.8] 会話における大規模言語モデルに対する高密度検索と応答生成の統一方法を示す。
目的の異なる共同微調整を行い、不整合リスクを低減するための2つのメカニズムを設計する。
5つの対話型検索データセットの評価は、我々の統合モデルがタスクを相互に改善し、既存のベースラインより優れていることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:02:40 GMT)
VisualTrap: A Stealthy Backdoor Attack on GUI Agents via Visual Grounding Manipulation [68.3] この研究は、GUI要素に対するGUIエージェントをマッピングするテキストプランの視覚的基盤が脆弱性をもたらすことを明らかにしている。
視覚的接地を目的としたバックドア攻撃では、適切なタスク解決計画が与えられた場合でもエージェントの行動が損なわれる可能性がある。
そこで我々は,エージェントが意図したターゲットではなく,意図した位置をトリガーするテキストプランを見つけることをミスリードすることで,グラウンドディングをハイジャックできるVisualTrapを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:36:00 GMT)
A Comprehensive Survey of Contamination Detection Methods in Large Language Models [68.1] 近年のLarge Language Models(LLM)の台頭に伴い、多くの新しい機会が生まれつつありますが、新たな課題もあります。
LLMの性能は、データへの以前の露出のために、少なくとも部分的には高性能である可能性があるため、もはや信頼性が低い可能性がある。
この制限は、NLPの分野での実際の能力向上を阻害するが、汚染を効率的に検出する方法が不足している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:56:02 GMT)
Diffusion-Driven Semantic Communication for Generative Models with Bandwidth Constraints [66.6] 本稿では,帯域制限付き生成モデルのための,高度なVAEベースの圧縮を用いた拡散駆動型セマンティック通信フレームワークを提案する。
実験の結果,ピーク信号対雑音比 (PSNR) などの画素レベルの指標と,LPIPS (Learning Perceptual Image patch similarity) のような意味的指標が大幅に改善された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:10:57 GMT)
DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [66.4] スペクトルからの分子構造解明は化学の基礎的な問題である。
従来の手法は専門家の解釈に大きく依存し、拡張性に欠ける。
マルチモーダルスペクトルデータから2次元および3次元分子構造を直接推定する生成フレームワークであるDiffSpectraを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:57:20 GMT)
PointVDP: Learning View-Dependent Projection by Fireworks Rays for 3D Point Cloud Segmentation [66.0] 本稿では,ポイントクラウドのセグメンテーションを容易にするために,ビュー依存プロジェクション(VDP)を提案する。
VDPは3Dポイント分布からデータ駆動プロジェクションを生成する。
フレームワークを最適化するために色規則化を構築します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:44:00 GMT)
Ambiguity-aware Point Cloud Segmentation by Adaptive Margin Contrastive Learning [65.9] 本稿では,ポイントクラウド上のセマンティックセマンティックセグメンテーションのための適応的マージン比較学習法を提案する。
まず,両立度推定フレームワークにコントラスト学習を組み込んだAMContrast3Dを設計する。
共同トレーニングの洞察に触発されて、並列にトレーニングされた2つのブランチとAMContrast3D++を統合することを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:00:32 GMT)
Video-RTS: Rethinking Reinforcement Learning and Test-Time Scaling for Efficient and Enhanced Video Reasoning [65.9] Video-RTSは、データ効率を大幅に改善したビデオ推論機能を改善するための新しいアプローチである。
出力ベースの報酬を伴う効率的な純RLトレーニングを採用しており、追加のアノテーションや広範囲の微調整は必要ありません。
提案手法を複数のビデオ推論ベンチマークで検証し,既存のビデオ推論モデルに平均2.4%の精度で超えることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:06:13 GMT)
AXLearn: Modular Large Model Training on Heterogeneous Infrastructure [64.3] AXLearnは大規模ディープラーニングモデルのスケーラブルで高性能なトレーニングを容易にする生産用ディープラーニングシステムである。
他の最先端のディープラーニングシステムと比較して、AXLearnはモジュール性と異種ハードウェアインフラストラクチャのサポートにユニークな重点を置いている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:10:51 GMT)
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language Model [63.7] 本研究は,地震モニタリングにクロスモーダル転送を利用する最初の基礎モデルであるSeesMoLLMを提示する。
5つの重要なタスクでDiTingとSTEADデータセットの最先端のパフォーマンスを実現する。
優れたパフォーマンスに加えて、SeesMoLLMはトレーニングと推論の両方において軽量モデルに匹敵する効率を維持している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:08:00 GMT)
4KAgent: Agentic Any Image to 4K Super-Resolution [63.0] 我々は、任意の画像を4K解像度にスケールアップするために設計された超高解像度のジェネラリストシステムである4KAgentを提示する。
4KAgentは,(1)ベズークのユースケースに基づいて4KAgentパイプラインをカスタマイズするモジュールであるプロファイリング,(2)画像品質評価の専門家とともに視覚言語モデルを活用して入力画像を分析し,調整された復元計画を作成するパーセプションエージェント,(3)各ステップの最適出力を選択するための品質駆動混合ポリシーに従って計画を実行するリカバリエージェント,の3つのコアコンポーネントから構成される。
われわれは4kagentを厳格に評価する
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:59:19 GMT)
From Images to Signals: Are Large Vision Models Useful for Time Series Analysis? [62.6] トランスフォーマーベースのモデルは、時系列研究において注目を集めている。
分野がマルチモダリティに向かって進むにつれ、LVM(Large Vision Models)が有望な方向として現れつつある。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:13:37 GMT)
HyperGCT: A Dynamic Hyper-GNN-Learned Geometric Constraint for 3D Registration [60.0] HyperGCTは、柔軟でダイナミックなHyper-GNNによる幾何学的制約である。
動的ハイパーグラフから3次元登録のための堅牢な幾何学的制約を抽出する。
3DMatch, 3DLoMatch, KITTI-LC, ETH の実験により, HyperGCT が最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:48:54 GMT)
Teaching LLMs According to Their Aptitude: Adaptive Reasoning for Mathematical Problem Solving [55.9] 大規模な言語モデルによる数学的推論への既存のアプローチは、一般化可能性(英語版)にはChain-of-Thought(英語版)(CoT)、正確な計算にはTool-Integrated Reasoning(英語版)(TIR)に依存している。
本稿では, LLM が自然に推論戦略をパーソナライズできる適応型フレームワークである TATA (Teaching LLMs according their Aptitude) を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:50:21 GMT)
Multi-task Offline Reinforcement Learning for Online Advertising in Recommender Systems [54.7] 現在のオフライン強化学習(RL)手法は、スパース広告シナリオに適用した場合、重大な課題に直面している。
MTORLは,2つの主要な目標を対象とする,新しいマルチタスクオフラインRLモデルである。
我々はマルチタスク学習を用いて行動と報酬をデコードし、同時にチャネルレコメンデーションと予算配分に対処する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:50:43 GMT)
Physics-Grounded Motion Forecasting via Equation Discovery for Trajectory-Guided Image-to-Video Generation [54.4] 物理グラウンド映像予測のためのシンボル回帰と軌跡誘導映像(I2V)モデルを統合する新しいフレームワークを提案する。
提案手法は,入力ビデオから運動軌跡を抽出し,検索に基づく事前学習機構を用いて記号回帰を向上し,運動方程式を発見し,物理的に正確な将来の軌跡を予測する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:28:42 GMT)
Exploiting Edge Features for Transferable Adversarial Attacks in Distributed Machine Learning [54.3] この研究は、分散ディープラーニングシステムにおいて、これまで見過ごされていた脆弱性を探究する。
中間的特徴をインターセプトする敵は、依然として深刻な脅威となる可能性がある。
本稿では,分散環境に特化して設計されたエクスプロイト戦略を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:09:00 GMT)
Frontier LLMs Still Struggle with Simple Reasoning Tasks [53.5] この研究は、フロンティア言語モデルの性能を、幅広い「容易」推論問題に対して研究する。
計算,一階述語論理,証明木,旅行計画など,手続き的に生成された単純な推論タスクのスイートを作成します。
最先端の思考モデルでさえ、このような問題や同様の理由で一貫して失敗することを示します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:22:49 GMT)
A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive [53.1] 大規模言語モデル(LLM)は、自律的な意思決定にますます活用されている。
このサンプリング行動が人間の意思決定と類似していることが示される。
統計的ノルムから規範的成分へのサンプルの偏りは、様々な現実世界の領域にまたがる概念に一貫して現れることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:29:19 GMT)
QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning [52.2] 本稿では,不均衡な活性化分布を量子化困難の原因として同定する。
我々は,これらの分布を,より量子化しやすいように微調整することで調整することを提案する。
本手法は3つの高解像度画像生成タスクに対して有効性を示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:25:08 GMT)
Medical Red Teaming Protocol of Language Models: On the Importance of User Perspectives in Healthcare Settings [51.7] 本稿では,患者と臨床医の両方の視点で医療領域に適した安全評価プロトコルを提案する。
医療用LLMの安全性評価基準を3つの異なる視点を取り入れたレッドチームで定義した最初の研究である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:38:58 GMT)
ClipGS: Clippable Gaussian Splatting for Interactive Cinematic Visualization of Volumetric Medical Data [51.1] 医用データのインタラクティブなシネマティック可視化のためのクリッピングプレーンを備えた革新的なガウススプレイティングフレームワークであるClipGSを紹介した。
本手法を5つのボリューム医療データで検証し,平均36.635 PSNRレンダリング品質を156 FPS,16.1MBモデルサイズで達成した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:24:28 GMT)
Planted in Pretraining, Swayed by Finetuning: A Case Study on the Origins of Cognitive Biases in LLMs [51.0] 大型言語モデル(LLM)は認知バイアスを示す。
これらのバイアスはモデルによって異なり、命令チューニングによって増幅することができる。
これらのバイアスの違いが事前学習、微調整、あるいはランダムノイズに起因するかどうかは不明だ。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:01:14 GMT)
WatchWitch: Interoperability, Privacy, and Autonomy for the Apple Watch [50.9] Apple Watchのワイヤレスプロトコルをリバースエンジニアリングします。
WatchWitchでは、Appleの囲われた庭から抜け出しました。
したがって、スマートウォッチエコシステムにおける消費者の選択肢を増やす道を開いたのです。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:33:58 GMT)
Beyond the ATE: Interpretable Modelling of Treatment Effects over Dose and Time [50.5] 本研究では, 治療効果トラジェクトリを線量および時間とともに滑らかな表面としてモデル化する枠組みを提案する。
本研究は, 臨床的に有意な特性の特定から, 軌道形状の推定を分離する。
本手法は, 処理力学の精度, 解釈可能, 編集可能なモデルを生成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:33:33 GMT)
LCFO: Long Context and Long Form Output Dataset and Benchmarking [50.4] LCFO(Long Context and Form Output)ベンチマークは、段階的な要約と要約拡張機能を評価するための新しいフレームワークである。
LCFOは、長さの異なる3つの要約を持つ長い入力文書(平均長5k語)から構成される。
GPT-4o-miniは,要約処理と要約処理の両方において,自動システム間で最高の人間のスコアを得る。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:25:55 GMT)
A Wireless Foundation Model for Multi-Task Prediction [50.2] 多様な予測区間をサポートする無線ネットワークにおけるマルチタスク予測のための統合基盤モデルを提案する。
大規模データセットをトレーニングした後、提案した基礎モデルは、新しいタスクにおいて、目に見えないシナリオとゼロショットのパフォーマンスに強力な一般化を示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:45:07 GMT)
Developing and Maintaining an Open-Source Repository of AI Evaluations: Challenges and Insights [45.0] 本稿では,70以上のコミュニティに分散したAI評価のオープンソースリポジトリである$_evals$の8ヶ月間の実践的洞察を紹介する。
AI評価の実装とメンテナンス、ソリューション開発における重要な課題を特定します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:30:45 GMT)
Rethinking Verification for LLM Code Generation: From Generation to Testing [45.0] 大規模言語モデル(LLM)は最近、HumanEvalやLiveCodeBenchといったコード生成ベンチマークで顕著な成功を収めた。
本稿では,テストスーツの厳密な定量化を目的とした新しい多次元メトリクスを提案する。
実験の結果、SAGAは90.62%、検証器の精度はTCGBenchで32.58%に達することがわかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:58:47 GMT)
Boosting Parameter Efficiency in LLM-Based Recommendation through Sophisticated Pruning [44.7] この研究は、レコメンデーション品質を維持しながら効率を向上させるために刈り取りを探求する。
層内および層内プルーニングの両方を統合したよりきめ細かいプルーニング手法を提案する。
提案手法は,非埋め込みパラメータの95%以上を刈り取りながら,元のモデルの性能の88%を平均的に達成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:26:10 GMT)
Rankers, Judges, and Assistants: Towards Understanding the Interplay of LLMs in Information Retrieval Evaluation [44.6] 大規模言語モデル(LLM)は、情報検索(IR)、ランキング、評価、AI支援コンテンツ作成にますます不可欠なものになっている。
本稿では,既存の研究を合成し,LLMに基づくローダとアシスタントがLLMベースの審査員にどのように影響するかを探求する新しい実験設計を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:09:49 GMT)
Reconstructing Satellites in 3D from Amateur Telescope Images [44.2] 本稿では,ハイブリッド画像前処理パイプラインを統合することで,障害を克服する新しい計算イメージングフレームワークを提案する。
我々は,中国の江東宇宙ステーションと国際宇宙ステーションの合成衛星データセットとオンスキー観測の両方にアプローチを検証した。
我々のフレームワークは地球からの高忠実度3D衛星監視を可能にし、宇宙状況認識のためのコスト効率の良い代替手段を提供する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:16:17 GMT)
Impacts of Mainstream-Driven Algorithms on Recommendations for Children Across Domains: A Reproducibility Study [43.8] 映画、音楽、書籍ドメインにおける幅広いデータセットの研究を再現し、再現する。
我々は、ドメイン間で一貫性のある子と子の相互作用の相互作用パターンと側面を明らかにする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:15:12 GMT)
Speckle2Self: Self-Supervised Ultrasound Speckle Reduction Without Clean Data [43.6] 画像復調はコンピュータビジョン、特に医用超音波(US)イメージングにおける基本的な課題である。
Speckle2Selfは、単一ノイズによるスペクトル低減のための新しい自己教師型アルゴリズムである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:28:00 GMT)
Token Bottleneck: One Token to Remember Dynamics [42.7] Token Bottleneck(ToBo)は、シーンをボトルネックトークンに絞り込む、自己教師型学習パイプラインである。
ToBoは、最小限のパッチをヒントとして、その後のシーンを予測する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:57:29 GMT)
Underrepresentation, Label Bias, and Proxies: Towards Data Bias Profiles for the EU AI Act and Beyond [42.7] 我々は3つの共通のデータバイアスを示し、アルゴリズムの識別に対する個人的および共同的な影響について研究する。
我々は、特定の種類のバイアスを検出するための専用メカニズムを開発し、それをデータバイアスプロファイル(DBP)と呼ぶ予備構造に組み合わせる。
この初期定式化は、どのように異なるバイアス信号が体系的に文書化されるかという概念の証明となる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:52:11 GMT)
Are They the Same? Exploring Visual Correspondence Shortcomings of Multimodal LLMs [42.6] 我々は,30種類のマルチモーダル大言語モデル (MLLM) に対して,相当なベンチマークを行うベンチマークを構築した。
私たちの知る限り、MLLMコミュニティにとってこれが初めての視覚対応データセットとベンチマークです。
CoLVA-InternVL2-4Bは、GPT-4oと最高のオープンソースMLLMであるQwen2VL-72Bをそれぞれ7.15%、OAは11.72%、MMVMベンチマークで49.80%の精度(OA)を達成した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:04:21 GMT)
SWE-SQL: Illuminating LLM Pathways to Solve User SQL Issues in Real-World Applications [42.0] 本稿では,BIRDCRITICを紹介した。
また、オープンソースのモデル機能を高めるためのトレーニング環境であるSixGymを紹介します。
これらのコンポーネントをオープンソースのエージェントであるBirdFixer-2.5-14Bに統合します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:22:28 GMT)
Kubo-Martin-Schwinger relation for energy eigenstates of SU(2)-symmetric quantum many-body systems [41.9] 非アベリア対称性が従来の熱力学を変化させる可能性があることを示す。
この研究は非平衡物理学に拡張し、非アベリア対称性が従来の熱力学をどのように変化させるかを特定するのに役立つ。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:46:47 GMT)
The User-Centric Geo-Experience: An LLM-Powered Framework for Enhanced Planning, Navigation, and Dynamic Adaptation [41.3] 従来の旅行計画システムはしばしば静的で断片化されており、現実の複雑さを扱うには不適当である。
本稿では,既存サービスプロバイダ間でのユーザエクスペリエンスのフラストレーションの原因となる3つのギャップを明らかにする。
複雑なマルチモーダルなユーザクエリの解決を支援するためにグリッドベースの空間接地とマップ分析を利用する旅行計画エージェントと、各旅行の最終ナビゲーション脚のきめ細かいガイダンスを提供する目的地支援エージェントと、画像埋め込みと検索拡張生成(RAG)を活用して旅行計画の中断を検出し、応答する地域発見エージェントの3つの協力エージェントを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:18:09 GMT)
Self-Supervised Learning at the Edge: The Cost of Labeling [41.1] 従来の教師付き機械学習ソリューションに代わるものとして、コントラスト学習(CL)が登場した。
エッジベースの学習のためのSsl技術は、モデル性能とエネルギー効率のトレードオフに焦点を当てている。
最適化されたSSL戦略は、最大4倍のリソース消費を削減しながら、競争性能を達成することができることを実証する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:03:50 GMT)
Enhancing Food-Domain Question Answering with a Multimodal Knowledge Graph: Hybrid QA Generation and Diversity Analysis [41.1] 本稿では,大規模マルチモーダル知識グラフ(MMKG)と生成AIを組み合わせた統合食品ドメインQAフレームワークを提案する。
MMKGは、13,000のレシピ、13,000の材料、140,000のリレーション、14,000のイメージをリンクします。40のテンプレートとLLaVA/DeepSeek拡張を使って4万のQAペアを生成します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:59:06 GMT)
DAF: An Efficient End-to-End Dynamic Activation Framework for on-Device DNN Training [41.1] システムレベルの最適化を通じて、スケーラブルで効率的なデバイス上でのトレーニングを可能にする動的アクティベーションフレームワーク(DAF)を導入する。
DAFは、主要なシステムのボトルネックに対処することで、メモリと時間効率の動的量子化トレーニングを実現する。
組み込みプラットフォームとモバイルプラットフォームにわたるさまざまなディープラーニングモデルの評価によると、メモリ使用量の削減に22.9倍、スピードアップに32倍の3.2倍となる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:59:30 GMT)
Beyond Complete Shapes: A Quantitative Evaluation of 3D Shape Matching Algorithms [40.9] 3次元形状の対応を見つけることは、コンピュータビジョン、グラフィックスなどにおいて重要な問題である。
我々は、挑戦的な部分的な形状マッチングシナリオの手続き生成のための汎用的で柔軟なフレームワークを提供する。
手動で7つの既存の(完全な幾何学)形状マッチングデータセット間のクロスデータセット対応を作成し、合計2543個の形状を生成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:23:36 GMT)
Towards Reasoning Era: A Survey of Long Chain-of-Thought for Reasoning Large Language Models [39.8] ロングチェーン・オブ・ソート(Long CoT)特性は推論能力を高め、複雑な問題の解決を可能にする。
まず、Long CoTとShort CoTを区別し、現在の推論パラダイムを分類する新しい分類法を導入する。
次に,このような特徴を持つLong CoTの出現や,過度な考察,推論時間スケーリングなどの重要な現象について検討する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:13:24 GMT)
Q2SAR: A Quantum Multiple Kernel Learning Approach for Drug Discovery [39.6] 本研究は、QSAR分類を強化するために、量子多重カーネル学習フレームワークを成功させたことを実証する。
本手法をDYRK1Aキナーゼ阻害剤を同定するためのデータセットに適用する。
古典的なグラディエントブースティングモデルに対してQMKL-SVMをベンチマークすることにより、量子化アプローチがより優れたAUCスコアを達成することを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:09:16 GMT)
Video-Language Understanding: A Survey from Model Architecture, Model Training, and Data Perspectives [38.8] 人間は環境を理解するために複数の感覚を使う。視覚と言語は、私たちの思考を簡単に伝え、周りの世界を知覚できるため、最も重要な感覚の2つだ。
ビデオ言語ペアは、我々の言語媒体と視覚環境の両方を時間的ダイナミクスで模倣できるので、ヒューマンライクな感覚でビデオ言語理解システムを構築することには、多くの関心が寄せられている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:26:18 GMT)
Double-Checker: Enhancing Reasoning of Slow-Thinking LLMs via Self-Critical Fine-Tuning [37.4] Double-Checkerは、ゆっくりと考えられた大きな言語モデルの推論能力を高めるために設計された、原則化されたフレームワークである。
総合的な推論ベンチマークを用いてDouble-Checkerの有効性を検証する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:35:19 GMT)
Real AI Agents with Fake Memories: Fatal Context Manipulation Attacks on Web3 Agents [36.5] 本稿では,ブロックチェーンベースの金融エコシステムにおけるAIエージェントの脆弱性を,現実のシナリオにおける敵対的脅威に曝露した場合に検討する。
保護されていないコンテキストサーフェスを利用する包括的攻撃ベクトルであるコンテキスト操作の概念を導入する。
ElizaOSを使用することで、不正なインジェクションをプロンプトや履歴レコードに注入することで、不正なアセット転送やプロトコル違反が引き起こされることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:38:20 GMT)
Efficient Parametric SVD of Koopman Operator for Stochastic Dynamical Systems [35.2] クープマン作用素は非線形力学系を解析するための原理的なフレームワークを提供する。
VAMPnet と DPNet はクープマン作用素の主特異部分空間を学ぶために提案されている。
クープマン作用素のトップk特異関数をスケーラブルで概念的にシンプルに学習する手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:55:48 GMT)
Quantum control of a single $\mathrm{H}_2^+$ molecular ion [34.8] 2Hzの精度で$mathrmH+$の超微細構造における高分解能マイクロ波分光法を実証した。
その結果,マイクロ波領域と光領域の両方で$mathrmH+$の高精度分光法が得られた。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:41:47 GMT)
Tunable cavity coupling of a single SnV$^{-}$ center in nanodiamond across bad-emitter and bad-cavity regimes [34.3] ダイヤモンド中のIV族空白中心は、そのスペクトル安定性のために有望な候補として浮上している。
ナノダイアモンドにホストされた負電荷のスズ空洞をフルチューニング可能なFabry-Perotマイクロキャビティに制御したクープリナグを実演した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:11:39 GMT)
AblationBench: Evaluating Automated Planning of Ablations in Empirical AI Research [34.2] AblationBenchは、経験的AI研究におけるアブレーション計画タスクのエージェントを評価するためのベンチマークスイートである。
AuthorAblationは、著者がメソッドセクションに基づいてアブレーション実験を提案するのに役立つ。
両方のタスクに対して,自動評価フレームワークとして機能するLMベースの判断器を開発する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:07:38 GMT)
Longitudinal Study of Facial Biometrics at the BEZ: Temporal Variance Analysis [33.7] 生体計測評価センター(bez)における長期生体計測評価
多様な民族、性別、年齢グループを代表する400人以上の参加者が、様々な生体計測ツールや技術を用いて定期的に評価された。
我々は、最先端の顔認識アルゴリズムを用いて、長期比較スコアを分析した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:59:31 GMT)
SpindleKV: A Novel KV Cache Reduction Method Balancing Both Shallow and Deep Layers [33.5] 推定法はKVキャッシュに固有の冗長性を明らかにし、その還元の可能性を示した。
我々は,浅い層と深い層の両方のバランスをとる新しいKVキャッシュ削減手法SpindleKVを提案する。
実験の結果、SpindleKVはベースライン法に比べてKVキャッシュの低減効果が良く、モデル性能も良好であった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:33:44 GMT)
A Survey on Prompt Tuning [32.4] 既存のアプローチを,ダイレクト・プロンプト学習とトランスファー学習の2つのカテゴリに分類する。
それぞれの手法について、手法設計、革新、洞察、利点、欠点を分析します。
トレーニングの堅牢性向上と適用範囲の拡大における今後の方向性について論じる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:59:12 GMT)
Towards Multimodal Understanding via Stable Diffusion as a Task-Aware Feature Extractor [32.3] 本研究では,事前学習したテキスト・画像拡散モデルが,命令認識型ビジュアルエンコーダとして機能するかどうかを検討する。
拡散機能はセマンティクスに富み、強い画像テキストアライメントを符号化できる。
次に,これらの特徴と大規模言語モデルとの整合性について検討し,漏洩現象を明らかにする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:59:47 GMT)
Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact [31.6] 本稿では,人工知能,認知神経科学,心理学,生成モデル,エージェントベースシステムの学際的合成について述べる。
我々は汎用知能のアーキテクチャと認知の基礎を分析し、モジュラー推論、永続記憶、マルチエージェント協調の役割を強調した。
我々は、人工知能への道の鍵となる科学的、技術的、倫理的課題を特定します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:09:25 GMT)
Efficient Implementation of a Single-Qutrit Gate Set via Coherent Control [31.5] 我々はコヒーレント制御による単一量子ゲートセットの効率的な実装のための新しいフレームワークを開発する。
実証実験として、超伝導トランスモンを用いて35nsのアダマールとXゲートを実現し、99.5%の平均忠実度を達成した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:01:23 GMT)
How to Bridge the Sim-to-Real Gap in Digital Twin-Aided Telecommunication Networks [30.9] 通信のための効果的な人工知能モデルを訓練することは、デプロイメント固有のデータが不足しているために困難である。
実際のデータ収集は高価で、利用可能なデータセットは、ネットワーク環境のユニークな運用条件とコンテキスト変数をキャプチャできないことが多い。
デジタルツインニングは、現在のネットワーク展開に合わせてシミュレータがサイト固有のデータを生成して、利用可能なトレーニングデータセットを拡張することにより、この問題に対する潜在的な解決策を提供する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:27:51 GMT)
MCCD: A Multi-Attribute Chinese Calligraphy Character Dataset Annotated with Script Styles, Dynasties, and Calligraphers [30.6] 漢字の書風は、異なる王朝や書家の独特の筆跡を通じて、劇的に進化してきた。
既存の書誌データセットは非常に少なく、ほとんどは文字レベルのアノテーションのみを提供する。
我々は,新しい多属性中国語文字データセット(MCCD)を提案する。
データセットには7,765のカテゴリがあり、合計で329,715の漢字のイメージサンプルがある。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:31:33 GMT)
Transferable Parasitic Estimation via Graph Contrastive Learning and Label Rebalancing in AMS Circuits [30.4] 本稿では,表現分散とラベルリバランシングを統合し,回路グラフ間の転送性を向上させるグラフコントラスト学習フレームワークを提案する。
CircuitGCLは全ての最先端(SOTA)メソッドより優れており、R2$は33.64% sim 44.20%$、F1スコアは92タイム sim 2.1times$である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:31:10 GMT)
Vital Insight: Assisting Experts' Context-Driven Sensemaking of Multi-modal Personal Tracking Data Using Visualization and Human-In-The-Loop LLM [29.7] Vital Insightは、スマートフォンやウェアラブルからのマルチモーダル受動的センシングデータの人間のループ推論(センスメイキング)と可視化を可能にする、新しいLLM支援のプロトタイプシステムである。
我々は、専門家のそれとのインタラクションを観察し、専門家が直接データ表現とAIをサポートする推論の間をどう移動するかを説明する専門家のセンスメイキングモデルを開発する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:14:20 GMT)
DeepTalk: Towards Seamless and Smart Speech Interaction with Adaptive Modality-Specific MoE [29.7] ネイティブマルチモーダル大言語モデル(MLLM)は、単一大言語モデル(LLM)を音声言語モデル(SLM)に再構成する。
DeepTalkは、Mixture of Experts (MoE)アーキテクチャに基づいた適応型モダリティエキスパート学習のためのフレームワークである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:49:42 GMT)
Hierarchical Feature Alignment for Gloss-Free Sign Language Translation [29.5] 手話翻訳は手話動画を音声文に変換する。
既存の手法は、エンドツーエンドの学習において、視覚的表現とテキスト的表現の相違に苦慮する。
我々は,手話の構造に触発された新しい階層的事前学習戦略を導入し,擬似グルースと対照的なビデオ言語アライメントを取り入れた。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:45:50 GMT)
SlimCaching: Edge Caching of Mixture-of-Experts for Distributed Inference [29.5] Mixture-of-Experts (MoE)モデルは、入力ごとに関連する専門家の小さなサブセットだけを活性化する。
MoEモデルのエキスパートネットワークの数が多ければ多いほど、エッジデバイスにはかなりのストレージ負荷が伴う。
本稿では,元の問題を一連のサブプロブレムに分解するグリーディ分解法を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:43:43 GMT)
FluidNexus: 3D Fluid Reconstruction and Prediction from a Single Video [29.4] 現在の方法では、流体再構成のためのマルチビュービデオが必要である。
我々はビデオ生成と物理シミュレーションを橋渡しする新しいフレームワークであるFluidNexusを紹介する。
本手法は, 単一流体映像からの動的新規ビュー合成, 将来予測, 相互作用シミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:43:37 GMT)
Bilateral Collaboration with Large Vision-Language Models for Open Vocabulary Human-Object Interaction Detection [29.2] オープン・ボキャブラリ・ヒューマン・オブジェクト・インタラクション(HOI)検出は、画像に対するすべての人間、動詞、オブジェクト>三つ子を検知する難しいタスクである。
既存のアプローチは通常、大きなビジョンランゲージモデル(VLM)によって生成される出力機能に依存している。
オープン語彙HOI検出のためのバイラテラル協調フレームワーク(BC-HOI)を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:16:39 GMT)
Pre-Columbian Settlements Shaped Palm Clusters in the Sierra Nevada de Santa Marta, Colombia [29.2] 植生シグネチャに基づく考古学的影響領域の新たな研究手法を提案する。
ヤシの樹を識別するために衛星画像に基づいて訓練された深層学習モデルと、ヤシの群集を識別するためのクラスタリングアルゴリズムで構成されている。
結果は、ヤシが大規模なインフラ投資を示す考古学的遺跡付近でどのようにかなり豊富であったかを示している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:31:44 GMT)
Spectral Estimators for Structured Generalized Linear Models via Approximate Message Passing [28.9] 本研究では,高次元一般化線形モデルにおけるパラメータ推定の問題について考察する。
広く使われているにもかかわらず、厳密なパフォーマンス特性とデータ前処理の原則が、構造化されていない設計でのみ利用可能である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:10:08 GMT)
SoftSignSGD(S3): An Enhanced Optimizer for Practical DNN Training and Loss Spikes Minimization Beyond Adam [28.5] Adam氏は、ディープニューラルネットワークのトレーニングに成功しているが、その成功と限界のメカニズムは未解明のままである。
本研究では,Adamの有効性は,安定な変動変動におけるSignSGDとの類似性に大きく起因していることを示す。
我々は,Nesterovの加速勾配(NAG)モジュールをS3に組み込んだ$emphThirdを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:47:37 GMT)
Image Can Bring Your Memory Back: A Novel Multi-Modal Guided Attack against Image Generation Model Unlearning [28.2] Recallは、未学習のIMGの堅牢性を損なうために設計された、新しい敵のフレームワークである。
逆効果、計算効率、意味的忠実性の点で、元のプロンプトで既存のベースラインを一貫して上回ります。
これらの結果は、現在の未学習メカニズムにおける重大な脆弱性を明らかにし、より堅牢なソリューションの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:59:01 GMT)
Optimizing Communication and Device Clustering for Clustered Federated Learning with Differential Privacy [28.1] 本稿では,セキュアで通信効率のよいクラスタ型フェデレーションラーニング(CFL)の設計を提案する。
本モデルでは、不均一なタスクハンドリング機能を持つ複数の基地局(BS)と、非独立で同一に分散された(非IID)データを持つ複数の利用者が共同でCFLトレーニングを行う。
本稿では,分散BSを独立して接続したユーザを識別する,動的ペナルティ関数支援値多エージェント強化学習(DPVD-MARL)アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:44:26 GMT)
The Power of Regularization in Solving Extensive-Form Games [28.0] より弱い仮定かより強い収束保証を条件として,ゲームのファンクションペイオフの正規化に基づく,一連の新しいアルゴリズムを提案する。
我々の知る限り、これらは、非摂動EFGのNEを求める際に、最先端の平均収束率と整合しながら、CFR型アルゴリズムの最終的な収束結果を構成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:58:26 GMT)
On the Hardness of Unsupervised Domain Adaptation: Optimal Learners and Information-Theoretic Perspective [27.9] PTLU(Posterior Target Label Uncertainty)は、ターゲットドメイン内の予測ラベルのエントロピーである。
PTLUは学習者のリスクを低く抑えるのに役立つことを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:11:19 GMT)
LLM Agent for Hyper-Parameter Optimization [27.8] 本稿では,自動ハイパーパラメータチューニングのためのLarge Language Model (LLM) エージェントを設計する。
実験の結果, LLMエージェントを用いて生成した超パラメータによる最小和率は, 人・ランダム生成法ともに有意に高いことがわかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:20:45 GMT)
PBCAT: Patch-based composite adversarial training against physically realizable attacks on object detection [27.8] 敵の攻撃に対する最も効果的な防御として、敵の訓練が認められている。
本稿では, PBCATを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:36:11 GMT)
3DPortraitGAN: Learning One-Quarter Headshot 3D GANs from a Single-View Portrait Dataset with Diverse Body Poses [27.4] 3DGANは,360degPHQデータセットから3Dアバター分布を学習し,ボディポーズの自己学習を行う最初の3D対応ヘッドショット・ポートレート・ジェネレータである。
本モデルでは、全カメラアングルから4分の1のヘッドショット3D表現を用いて、ビュー一貫性のあるポートレート画像を生成することができる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:53:09 GMT)
FRaN-X: FRaming and Narratives-eXplorer [26.9] FRaN-X(Framing and Narratives Explorer)は、物語の参照を自動的に検出し、物語の役割を分類する。
このシステムは5つの言語(ブルガリア語、英語、ヒンディー語、ロシア語、ポルトガル語)と2つのドメイン(ロシア・ウクライナ紛争と気候変動)をサポートしている。
メディアアナリストがさまざまなソースをまたいだフレーミングを探索し比較するためのインタラクティブなWebインターフェースを提供する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:04:51 GMT)
TokenSwift: Lossless Acceleration of Ultra Long Sequence Generation [26.8] TOKENSWIFTは超長周期の生成過程を大幅に高速化するように設計されている。
様々なスケールのモデルで3倍以上のスピードアップを達成する。
これは超長いシーケンス生成のための数時間の節約を意味する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:35:21 GMT)
Go to Zero: Towards Zero-shot Motion Generation with Million-scale Data [26.6] 我々は、ゼロショットの一般化能力を達成するために、テキスト・トゥ・モーションを新しい時代へと押し込む。
これまでに2000時間以上、200万以上の高品質なモーションシーケンスを備えた、人間のモーションデータセットとして最大であるMotionMillionを紹介した。
我々は、ゼロショットモーション生成を評価するための最も包括的なベンチマークであるMotionMillion-Evalを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:52:04 GMT)
On the Robustness of Verbal Confidence of LLMs in Adversarial Attacks [24.0] 本研究は, 対人攻撃による言語信頼の堅牢性に関する最初の総合的研究である。
本稿では,摂動法と脱獄法の両方を用いて,言語信頼度を攻撃するための新しい枠組みを提案する。
本研究は,大規模言語モデルにおいて,信頼性表現のためのより堅牢なメカニズムを設計する緊急の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:19:46 GMT)
SemRaFiner: Panoptic Segmentation in Sparse and Noisy Radar Point Clouds [23.9] スパースレーダ点雲における汎視的セグメンテーションの問題に対処する。
私たちのアプローチはSemRaFinerと呼ばれ、スパースレーダーポイント雲の密度の変化を考慮に入れています。
実験の結果,本手法はレーダ方式のパノプティカルセグメンテーションにおいて,最先端の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:45:18 GMT)
3D-Generalist: Self-Improving Vision-Language-Action Models for Crafting 3D Worlds [23.3] 基礎モデルのトレーニングデータとして利用できる高品質な3D環境を生成するためのスケーラブルな手法を提案する。
提案するフレームワークである3D-Generalistは、ビジョンランゲージモデルを用いて、より迅速な3D環境を生成する。
生成したデータに対して視覚基盤モデルを事前学習することにより,合成データ生成における品質とスケーラビリティを実証する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:00:17 GMT)
USD: A User-Intent-Driven Sampling and Dual-Debiasing Framework for Large-Scale Homepage Recommendations [23.2] 本稿では,大規模なホームページレコメンデーションサンプリングとデバイアスのための統合フレームワークを提案する。
本フレームワークは,(1)不正露光サンプルをフィルタするユーザ意図認識型ネガティブサンプリングモジュール,(2)露光バイアスとクリックバイアスを共同で補正するインテント駆動型デュアルデバイアスモジュールの2つのキーコンポーネントから構成される。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:02:23 GMT)
A Survey on Artificial Noise for Physical Layer Security: Opportunities, Technologies, Guidelines, Advances, and Trends [23.1] 人工ノイズ(AN)は、無線通信の安全性を高めるために、チャネルの空間自由度を利用することができる。
本稿では,ANの開発,基礎,背景について紹介する。
本稿では,様々なANを組み込んだシナリオとANを組み込んだ技術に関する研究の現状を概観する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:54:05 GMT)
Evaluating and Improving Robustness in Large Language Models: A Survey and Future Directions [23.0] 大規模言語モデル(LLM)は,近年,自然言語の理解と生成能力から注目されている。
本稿では,この分野に関する概念や手法の包括的用語を提供し,コミュニティの促進を目的とする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:18:33 GMT)
TIP-I2V: A Million-Scale Real Text and Image Prompt Dataset for Image-to-Video Generation [22.8] TIP-I2Vは、ユーザが提供するテキストと画像プロンプトの大規模なデータセットとしては初めてである。
我々は、5つの最先端画像からビデオまでのモデルから、対応する生成されたビデオを提供する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:40:24 GMT)
Automating IRAC Analysis in Malaysian Contract Law using a Semi-Structured Knowledge Base [22.7] 本稿では,法シナリオ分析のためのベンチマークであるLegalSemiを紹介する。
法律は、マレーシアの契約法(英語版)の包括的なIRAC(Issue, Rule, Application, Conclusion)フレームワークに基づいて、法律専門家によって厳格に注釈付けされた54の法的シナリオで構成されている。
IRAC 解析における LegalSemi の有用性を評価するために, 一連の実験を行った。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:47:59 GMT)
AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework [22.7] Tabular Question Answering (TQA)では、構造化データから意味のある洞察を迅速かつ効率的に抽出することができる。
多くのテーブルはWebソースや実世界のシナリオから派生しており、正確な応答を保証するには精巧なデータ準備(あるいはデータ準備)が必要である。
この質問ウェアデータ作成には、列導出や特定の質問に適したフィルタリングといった特定のタスクが含まれる。
本稿では,マルチエージェントの強みを利用した大規模言語モデル(LLM)に基づくマルチエージェントフレームワークであるAutoPrepを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:24:56 GMT)
UniOD: A Universal Model for Outlier Detection across Diverse Domains [22.7] Outlier Detection(OD)は、完全にラベル付けされていないデータセットにおいて、inlierとoutlierを区別することを目指している。
ラベル付きデータセットを活用する汎用ODフレームワークUniODを提案する。
We evaluate UniOD on 15 benchmark OD datasets against 15 state-of-the-art baselines, showed its effective。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:52:12 GMT)
IntOPE: Off-Policy Evaluation in the Presence of Interference [22.2] オフ・ポリティ・アセスメント(OPE: Off-Policy Evaluation)は、仮説的政策の潜在的影響を評価するために用いられる。
IntIPWはIPWスタイルの推定器で、個々のアクションと隣接するエンティティの影響の両方を考慮し、重要度を極端に統合する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:13:59 GMT)
MS-DPPs: Multi-Source Determinantal Point Processes for Contextual Diversity Refinement of Composite Attributes in Text to Image Retrieval [22.2] 本稿では,CDR-CA (Contextual Diversity Refinement of Composite Attributes) と呼ばれる新しいタスクを提案する。
CDR-CAは、アプリケーションのコンテキストに応じて、複数の属性の多様性を洗練することを目的としている。
本稿では,DPP(Determinantal Point Process)をマルチソースに拡張する,シンプルながら強力なベースラインであるMulti-Source DPPを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:38:46 GMT)
When Context Is Not Enough: Modeling Unexplained Variability in Car-Following Behavior [22.1] 従来の決定論的モデルは、人間の運転における変動性と予測不可能性を完全に捉えるのに失敗することが多い。
本研究では、文脈依存の力学だけでなく、コンテキストが説明できること以外の残差も捉えることができる解釈可能なモデリングフレームワークを提案する。
解釈可能性と精度の統合により、このフレームワークはトラフィック分析と安全クリティカルなアプリケーションのための有望なツールとなる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:42:41 GMT)
Does Data Scaling Lead to Visual Compositional Generalization? [21.2] 構成一般化は単なるデータスケールではなく,データの多様性によってもたらされる。
この構造が効率の鍵であることを証明し、ほとんど観測されていない組み合わせから完全な一般化を可能にする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:59:03 GMT)
A Policy-Gradient Approach to Solving Imperfect-Information Games with Best-Iterate Convergence [21.2] 政策勾配法が自己プレイにおける正規化ナッシュ均衡に証明可能なベストイテレート収束をもたらすことを初めて示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:23:39 GMT)
On the Effect of Uncertainty on Layer-wise Inference Dynamics [21.0] 不確実性は推論力学に影響を与えないことを示す。
我々は、より有能なモデルが不確実性を異なる方法で処理することを学習する証拠を示すことによって、この発見のバランスをとる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:30:09 GMT)
Concept-TRAK: Understanding how diffusion models learn concepts through concept-level attribution [20.9] 我々は,emphConcept-TRAKと呼ばれる新しい手法を用いて,emphConceptレベルの属性を導入する。
概念TRAKは,(1)拡散後サンプリングに基づく拡散訓練損失の修正と,(2)意味的関連性を重視した概念認識報酬関数である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:03:57 GMT)
BarkBeetle: Stealing Decision Tree Models with Fault Injection [20.6] 本稿では,DTモデルの内部構造情報を抽出するためにフォールトインジェクションを利用する新しい攻撃法であるBarkBeetleを提案する。
我々の概念実証実装は、BarkBeetleがクエリを著しく少なくし、以前のアプローチに比べて構造的な情報を復元することを示した。
BarkBeetleが一般的なDTモデルをターゲットにしているため、ツリーベースの幅広いアプリケーションに適用性についても詳細に議論する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:08:58 GMT)
PyPOTS: A Python Toolkit for Machine Learning on Partially-Observed Time Series [20.5] PyPOTSは、データマイニングと分析のためのオープンソースのライブラリである。
5つのタスクに分類される多様なアルゴリズムに簡単にアクセスできる。
PyPOTSはPyPI、Anaconda、Dockerで利用できる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:03:16 GMT)
Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge [20.4] 大規模言語モデル(LLM)と自動音声認識(ASR)は、ユーザのための音声ベースの対話を可能にする強力なパーソナライズされたアシスタントとして機能する。
既存のASR-LLMモデルは、主に高性能コンピューティング環境で訓練され、かなりのモデル重みを生み出す。
エッジデバイスにASRとLLMをブリッジして、パーソナライズされたオーディオ入力を処理するリソース効率の良いクロスモーダルアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:56:53 GMT)
Hallucinating 360°: Panoramic Street-View Generation via Local Scenes Diffusion and Probabilistic Prompting [20.1] 自動運転のための最初のパノラマ生成法Percep360を提案する。
Percep360は、縫合されたパノラマデータに基づく制御信号によるパノラマデータのコヒーレントな生成を可能にする。
生成した画像の有効性を3つの視点から評価した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:01:41 GMT)
Beyond Connectivity: An Open Architecture for AI-RAN Convergence in 6G [20.1] 本稿では、共有インフラストラクチャ上での通信およびAIワークロードのオーケストレーションと管理を統一する、新しい収束型O-RANおよびAI-RANアーキテクチャを提案する。
i) O-RAN Service Management and Orchestration(SMO)を拡張してRANおよびAIワークロード間の統合リソースとアロケーションを可能にするAI-RAN Orchestrator、(ii)分散エッジAIプラットフォームにリアルタイム処理機能を提供するAI-RANサイト。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:49:11 GMT)
Value from Observations: Towards Large-Scale Imitation Learning via Self-Improvement [19.9] Imitation Learning from Observation (IfO)は、大規模に振る舞いを学ぶ強力な方法を提供する。
本稿では,主にバイモーダル品質のデータ分布を用いた理想的なシナリオについて検討し,そのようなデータから学習する方法を提案する。
提案手法は,専門家データと非専門家データ間の情報伝達に値関数を用いて,アクションフリーな実演にRLに基づく模倣学習を適用した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:55:23 GMT)
Oscillation-Reduced MXFP4 Training for Vision Transformers [19.6] FP4の精度で事前学習するトランスフォーマーには、かなりの精度が失われる。
MXFP4データフォーマットのトレーニングは依然として大きな劣化をもたらす。
より正確なFP4トレーニングのための新しいトレーニング手法TetraJetを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:07:28 GMT)
Disa: Accurate Learning-based Static Disassembly with Attentions [19.4] Disaは、マルチヘッド自己アテンション上のスーパーセット命令の情報を使用して、命令の相関関係を学習する、新しい学習ベースの分解アプローチである。
Disaは、関数のエントリポイント識別において、事前のディープラーニングの分解アプローチより優れている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:36:57 GMT)
Adaptive Part Learning for Fine-Grained Generalized Category Discovery: A Plug-and-Play Enhancement [19.4] Generalized Category Discovery (GCD) は、既知のクラスと新しいクラスを区別することで、未知のイメージを既知のクラスと新しいクラスから認識することを目的としている。
既存のGCD法は、表現学習のためにDINOのような自己監督型視覚変換器に依存している。
我々はAPLと呼ばれる適応的な部分探索学習手法を導入し、異なる類似画像間で一貫した対象部分とその対応関係を生成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:10:21 GMT)
Capturing Stable HDR Videos Using a Dual-Camera System [19.4] HDRビデオ再構成では、異なる露光方法による参照画像の露光変動は、しばしばフリッカリングを引き起こす。
本稿では,HDRビデオ取得のためのデュアルカメラシステム(DCS)を提案する。
我々は、より堅牢な結果を得るために、露光適応核融合ネットワーク(EAFNet)を導入する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:09:42 GMT)
From Gradient Clipping to Normalization for Heavy Tailed SGD [19.4] 最近の実証的な証拠は、機械学習の応用が重尾ノイズを伴い、実際に有界分散の標準的な仮定に挑戦していることを示している。
本稿では, 勾配依存型雑音収束問題において, テール雑音下での厳密性を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:01:30 GMT)
Can Input Attributions Explain Inductive Reasoning in In-Context Learning? [19.3] 本稿では,帰納的推論の合成診断タスクを設計する。
問題は、従来の入力属性法がそのような推論過程を追跡できるかどうかである。
実験はいくつかの実用的な発見をもたらす。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:33:14 GMT)
Explainable Artificial Intelligence in Biomedical Image Analysis: A Comprehensive Survey [14.8] 我々はXAI法を体系的に分類し,その基礎となる原理,強度,限界をバイオメディカルな文脈で分析する。
説明可能なバイオメディカルAIにおけるマルチモーダル学習と視覚言語モデルの役割について検討する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:42:14 GMT)
From Pseudorandomness to Multi-Group Fairness and Back [14.8] 予測アルゴリズムの多群公正性に関する最近の文献と、漏洩抵抗性とグラフ正則性の擬似ランダム性の概念の関連を同定し、探索する。
本研究は,統計的距離に基づく新しいマルチキャリブレーションの変種を用いて実施し,結果の不一致の概念に密接に関連している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:56:58 GMT)
Multilayer GNN for Predictive Maintenance and Clustering in Power Grids [14.6] 計画外の停電により、米国経済は年間1500億ドルを超える損失を被った。
本研究では、PdMを強化し、レジリエンスベースのサブステーションクラスタリングを可能にする多層グラフニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:44:51 GMT)
Hysteresis-Aware Neural Network Modeling and Whole-Body Reinforcement Learning Control of Soft Robots [14.0] 外科的応用を目的としたソフトロボットシステムを提案する。
本稿では,ソフトロボットの全身動作を正確に把握し,予測する全身ニューラルネットワークモデルを提案する。
本手法はファントムを用いた手術実験において高い性能を示した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:28:57 GMT)
MADPOT: Medical Anomaly Detection with CLIP Adaptation and Partial Optimal Transport [14.0] 医用画像へのCLIPの適応性を改善するために,視覚的アダプタとPOT(Partial Optimal Transport)とCL(Contentive Learning)を組み合わせた新しいアプローチを提案する。
本手法は, 合成データやメモリバンクを使わずに, 少数ショット, ゼロショット, クロスデータセットのシナリオにおいて, 最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:45:52 GMT)
DriveMRP: Enhancing Vision-Language Models with Synthetic Motion Data for Motion Risk Prediction [14.0] 本研究では,エゴ車,他の車両,環境の3つの側面からリスクをモデル化するために,バードアイビュー(BEV)に基づくモーションシミュレーション手法を提案する。
これにより、ビジョン・ランゲージ・モデルに適したプラグイン・アンド・プレイ高リスクモーションデータを合成できる。
我々は、HDMRP-Agentという、VLMに依存しないモーションリスク推定フレームワークを設計する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:50:51 GMT)
MultiJustice: A Chinese Dataset for Multi-Party, Multi-Charge Legal Prediction [13.9] マルチパーソン・マルチチャージ予測(MPMCP)という新しいデータセットを導入する。
我々は,4つの実効的法的判断シナリオにおいて,いくつかの法的な大規模言語モデル (LLM) の性能を評価することにより,その解を求める。
我々は広範囲な実験を行い、複数の被告と複数の突撃(S4)を含むシナリオが最大の課題となることを発見した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:47:00 GMT)
Free on the Fly: Enhancing Flexibility in Test-Time Adaptation with Online EM [13.9] FreeTTAはトレーニング不要で普遍的に利用できるメソッドであり、仮定はしない。
本研究は,想定しない学習自由かつ普遍的な手法であるFreeTTAを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:03:07 GMT)
Enhancing Diffusion Model Stability for Image Restoration via Gradient Management [13.8] これらの成分の基礎となる勾配のダイナミクスを解析し、重要な不安定性を同定する。
これらの不安定さが生成過程を阻害し,復元性能を損なうことを示す。
本稿では,新しい勾配管理手法である安定化進行勾配拡散法を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:40:46 GMT)
Omni-Video: Democratizing Unified Video Understanding and Generation [13.6] 本報告では,映像理解,生成,および命令ベースの編集のための効率的かつ効果的な統合フレームワークであるOmni-Videoについて述べる。
我々の重要な洞察は、拡散デコーダの入力として使用される連続的な視覚的手がかりを生成するために、既存のマルチモーダル大言語モデル(MLLM)を教えることである。
統合ビデオモデリングシステムの可能性を完全に解き明かすため,いくつかの技術的改善を取り入れた。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:27:27 GMT)
GR-LLMs: Recent Advances in Generative Recommendation Based on Large Language Models [13.6] ジェネレーティブレコメンデーション(GR)は、特にLLM(Large Language Models)の強力なシーケンスモデリングと推論機能を活用して、全体的なレコメンデーション性能を向上させるために、大幅な進歩を遂げている。
LLMをベースとしたGRは、差別的な推奨とは明らかに異なる新しいパラダイムを形成しており、複雑な手作り機能に大きく依存する従来のレコメンデーションシステムを置き換える可能性を示している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:13:08 GMT)
Algebraic States in Continuum in $ d\gt 1$ Dimensional Non-Hermitian Systems [13.2] 単一不純物をもつ2次元非エルミート系の連続スペクトル内に局在固有状態が存在することを報告する。
このような状態を生成するために必要な不純物強度のしきい値条件を解析的に導出する。
注目すべきことに、AICはエルミート系や1次元非エルミート系では禁じられており、2次元以上で非エルミート系に固有のものである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:29:46 GMT)
Knockout LLM Assessment: Using Large Language Models for Evaluations through Iterative Pairwise Comparisons [13.2] 大規模言語モデル(LLM)は、様々な領域にわたる効果的な評価指標であることが示されている。
Knockout Assessment, LLM-asa judge method using a knockout tournament system with iterationerative pairwise comparisons。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:58:38 GMT)
Classification of autoimmune diseases from Peripheral blood TCR repertoires by multimodal multi-instance learning [12.9] EAMilはTCRシークエンシングデータを利用して全身性エリテマトーデス(SLE)と慢性関節リウマチ(RA)の診断を行う多インスタンスディープラーニングフレームワークである
SLEは98.95%,RAは97.76%であった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:33:59 GMT)
A multi-modal dataset for insect biodiversity with imagery and DNA at the trap and individual level [12.8] 本研究は,昆虫標本の自動分類器を訓練するための混合節足類標本同定データセット(MassID45)について述べる。
これは、分類されていないサンプルレベルと、個々の標本の完全なセットの両方で、分子とイメージングのデータを一意に組み合わせている。
AI支援ツールによって支えられた人間のアノテーションは、各節足動物の周囲にセグメンテーションマスクを作成し、17万以上の標本に分類学的ラベルを割り当てるという、バルク画像の2つのタスクを実行した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:03:06 GMT)
Beyond Scale: Small Language Models are Comparable to GPT-4 in Mental Health Understanding [12.7] Small Language Models (SLM) は、Large Language Models (LLM) のプライバシ保護代替品である。
本稿では,現在SLMのメンタルヘルス理解能力について,分類タスクの体系的評価を通じて検討する。
我々の研究は、メンタルヘルス理解におけるSLMの可能性を強調し、センシティブなオンラインテキストデータを分析するための効果的なプライバシー保護ツールであることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:40:02 GMT)
Exploring State-Space-Model based Language Model in Music Generation [12.7] 我々は,マンバをベースとしたテキスト・音楽生成アーキテクチャの可能性を探る。
我々は、もともとMambaベースのエンコーダとして設計されたSiMBAを適用し、シーケンスモデリングのためのデコーダとして機能する。
以上の結果から,SiMBAは,限られた資源設定下でより高速な収束を実現し,真理に近い出力を生成することが示唆された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:05:18 GMT)
One Size Does Not Fit All: Investigating Efficacy of Perplexity in Detecting LLM-Generated Code [12.3] 大規模言語モデル生成コード(LLMgCode)は、人為的なコード(HaCode)よりも品質上の問題が多い
LLMgCodeはコードの変更でHaCodeと混同されることが一般的だが、変更は人間開発者のみによって署名される。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:04:06 GMT)
CULTURE3D: A Large-Scale and Diverse Dataset of Cultural Landmarks and Terrains for Gaussian-Based Scene Rendering [12.3] 現在の最先端の3D再構築モデルは、大規模な屋外シーンを構築する際の限界に直面している。
本稿では,41,006個のドローンによる高解像度空中画像からなる100億点の細粒度データセットを提案する。
既存のデータセットと比較すると、我々は非常に大きなスケールと詳細を提供しており、きめ細かい3Dアプリケーションに特化しています。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:35:04 GMT)
Subgraph Counting under Edge Local Differential Privacy Based on Noisy Adjacency Matrix [12.3] 本稿では、差分プライバシーとグラフの隣接行列を組み合わせたノイズ適応行列(NAM)を提案する。
NAMに基づいて、三角形、四角形、および2つ星の3種類のサブグラフをカウントする5つのアルゴリズムを設計した。
我々は、信頼区間インスパイアされた手法を用いて、ノイズの多いデータに対するエッジLDPを実装し、ランダム化されたデータに対するDP保証を提供する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:13:15 GMT)
Leveraging the Structure of Medical Data for Improved Representation Learning [12.2] 一般化可能な医療AIシステムを構築するには、データ効率とドメイン認識の事前トレーニング戦略が必要である。
本稿では,医療データセットの固有構造を利用した自己教師型フレームワークを提案する。
教師付き目標やベースラインが構造を生かさずにトレーニングされているのに比べ、強いパフォーマンスを示します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:45:03 GMT)
Flexible Readout and Unconditional Reset for Superconducting Multi-Qubit Processors with Tunable Purcell Filters [12.1] 超伝導量子ビットに対する周波数可変非線形パーセルフィルタを用いたスケーラブルなアーキテクチャを提案する。
本プロトコルは, 可変フィルタを用いて, リードアウト共振器の有効線路幅を動的に調整する。
フィルタは光子ノイズとパーセル効果の両方を抑制し、クビットデコヒーレンスを低減する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:11:42 GMT)
Geometric Constraints in Deep Learning Frameworks: A Survey [12.0] Stereoの形状の古典的な幾何学的技法は、シーンとカメラの深層学習の制約を定義するために幾何学を用いて構築されている。
我々は、深度推定やその他の密接な視覚タスクのためのディープラーニングフレームワークに制約を組み込んだ幾何を比較し、対比する。
本稿では、現代のディープラーニングフレームワークで使用される制約を規定する、一般的な幾何学のための新しい分類法を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:27:59 GMT)
Safer or Luckier? LLMs as Safety Evaluators Are Not Robust to Artifacts [11.8] 大規模言語モデル(LLM)は、生成されるコンテンツの安全性を評価するための自動評価器として、ますます採用されている。
本研究は、臨界安全領域にまたがる11のLCM判定モデルの多種多様なセットを評価する。
以上の結果から,LLM審査員のバイアスは,どのコンテンツソースがより安全かという最終判断を著しく歪めることができることがわかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:09:13 GMT)
GNNs Meet Sequence Models Along the Shortest-Path: an Expressive Method for Link Prediction [11.8] SP4LP(Shortest Path for Link Prediction)は、GNNベースのノードエンコーディングと最短経路上のシーケンスモデリングを組み合わせた新しいフレームワークである。
本研究では,SP4LPがリンク予測ベンチマークにおける最先端性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:37:19 GMT)
Derailer-Rerailer: Adaptive Verification for Efficient and Reliable Language Model Reasoning [11.8] Derailer-Rerailerは推論精度と計算効率のバランスをとる新しいフレームワークである。
提案手法は,従来の検証手法に比べて2~3倍の効率を維持しつつ,大幅な精度向上(8~11%)を実現している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:39:59 GMT)
Scaling Towards the Information Boundary of Instruction Set: InfinityInstruct-Subject Technical Report [11.7] 高品質な命令データセットの構築は、モデル性能と一般化可能性の向上に不可欠である。
本稿では,階層的ラベリングシステム,情報的種選択アルゴリズム,モデル欠損診断を統合した系統的命令データ合成フレームワークを提案する。
本稿では,150万の命令を含む高品質なデータセットであるInfinityInstruct-Subjectを構築した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:59:02 GMT)
Breaking PEFT Limitations: Leveraging Weak-to-Strong Knowledge Transfer for Backdoor Attacks in LLMs [11.5] 本稿では,FAKD(Feature Alignment-enhanced Knowledge Distillation)に基づく,弱いから強いへのバックドア攻撃アルゴリズムを提案する。
本研究では,4つの言語モデル,4つのバックドアアタックアルゴリズム,教師モデルの2つの異なるアーキテクチャの分類タスクにおいて,FAKDの優れた性能を示す。
実験の結果,PEFTを標的としたバックドア攻撃では100%に近い成功率を示した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:32:17 GMT)
MoFE-Time: Mixture of Frequency Domain Experts for Time-Series Forecasting Models [11.4] MoFE-Timeは、Mixture of Experts (MoE)ネットワーク内に時間と周波数ドメインの機能を統合する。
MoFE-Timeは最先端のパフォーマンスを新たに達成し、MSEとMAEはTime-MoEよりも6.95%、MAEは6.02%削減された。
本手法は, 実運用におけるMoFE-Timeモデルの有効性を実証し, 本データセットの優れた結果を得る。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:00:56 GMT)
On the Impossibility of Separating Intelligence from Judgment: The Computational Intractability of Filtering for AI Alignment [11.3] 本研究では,安全でない情報の発生を防ぐためのフィルタに着目し,アライメントの課題について検討する。
本研究の主な成果は,プロンプトとアウトプットの両方をフィルタリングする際の計算上の課題である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 23:55:35 GMT)
What Demands Attention in Urban Street Scenes? From Scene Understanding towards Road Safety: A Survey of Vision-driven Datasets and Studies [11.3] この調査は、交通シナリオに注意を必要とする重要な要素を体系的に分類し、利用可能なビジョン駆動タスクとデータセットを包括的に分析する。
孤立した領域に焦点を当てた既存の調査と比較すると、我々の分類学は、注目に値する交通機関を、異常と正常だが重要な2つの主要なグループに分類している。
本調査では、35の視覚駆動タスクの分析と、提案した分類に基づく73のデータセットの総合的な検証と可視化について紹介する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:26:02 GMT)
CHAI for LLMs: Improving Code-Mixed Translation in Large Language Models through Reinforcement Learning with AI Feedback [11.2] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる顕著な機能を示しているが、コード混在(またはコード切替)言語理解に苦慮している。
本稿では,多言語LLMのコード混合言語処理能力を向上させるための新しいフレームワークであるCHAIを提案する。
解析の結果,CHAI を用いた LLM は,コード混在翻訳タスクにおいて,最先端のオープンソース LLM よりも25.66% 向上していることがわかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:40:56 GMT)
Class conditional conformal prediction for multiple inputs by p-value aggregation [11.2] 分類タスクに対する共形予測手法に革新的改良を導入する。
我々のアプローチは、同じ植物や動物の複数の画像が個人によってキャプチャされる市民科学の応用によって動機付けられています。
本手法をシミュレーションおよび実データで評価し,特に著名な市民科学プラットフォームPl@ntNetに着目した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:17:17 GMT)
Cognitive Exoskeleton: Augmenting Human Cognition with an AI-Mediated Intelligent Visual Feedback [11.1] 我々は、深層強化学習を活用し、適応的な時間圧力フィードバックを提供することで、算術的なタスクにおけるユーザパフォーマンスを向上させる。
タイムプレッシャーフィードバックは、ユーザの注意と不安を調節することによって、ユーザパフォーマンスを改善するか、劣化させる可能性がある。
本稿では,他のシミュレーションDRLエージェントと対話してユーザパフォーマンスを制御するために,規制DRLエージェントを訓練するデュアルDRLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:12:14 GMT)
Are They All Good? Evaluating the Quality of CoTs in LLM-based Code Generation [11.1] 大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを示している。
しかし、LLMが生成するチェーン・オブ・シント(CoT)の品質についてはほとんど分かっていない。
本稿では、LCMが不満足なCoTを生成する理由の外部および内部的要因を実験的に検討する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:07:20 GMT)
Dirty Data in the Newsroom: Comparing Data Preparation in Journalism and Data Science [11.0] データジャーナリズムにおけるデータ準備に関する研究はほとんど行われていない。
我々は、汚いデータとインタビューデータに基づいて、汚れたデータ16から汚れたデータ60を合成する。
我々は、ジャーナリストが直面している4つの課題を識別する:ダイアクロニック、地域、断片化、および異種データソース。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:14:57 GMT)
Infrared and visible Image Fusion with Language-driven Loss in CLIP Embedding Space [11.0] Infrared-visible Image fusion (IVIF) は2つの画像の高相性により注目されている。
基底構造融合画像の欠如により、現在のディープラーニングベースの手法の融合出力は、数学的に定義された損失関数に大きく依存する。
本稿では,IVIFの目的を自然言語で表現することを提案する。これは,現在の損失における融合出力の明確な数学的モデリングを回避することができる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:12:24 GMT)
Wrapless: The trustless lending protocol on top of Bitcoin [10.9] Wraplessは、信頼できるラッピング機構を必要とせず、bitcoinの担保化を可能にする貸出プロトコルである。
このプロトコルはビットコインブロックチェーンの"ローンチャネル"を促進し、チューリング完全スマートコントラクトをサポートするブロックチェーン上で発行されるローンの担保としてビットコインをロックできるようにする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:49:58 GMT)
Direct Regret Optimization in Bayesian Optimization [10.7] 本稿では,最適モデルと非明視的獲得を共同で学習する,新たな直訳最適化手法を提案する。
提案手法はBOベースラインを一貫して上回り,より単純な後悔を減らし,より堅牢な探索を示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:09:58 GMT)
CMQCIC-Bench: A Chinese Benchmark for Evaluating Large Language Models in Medical Quality Control Indicator Calculation [10.6] 実世界のタスクMQCICを導入し、オープンソースの中国の電子カルテ(EMR)ベースのデータセット(CMQCIC-Bench)を提案する。
本稿では,臨床事実検証と推論規則推論の動作を阻害する,ルール表現を強化する半自動法と臨床ファクトベース推論規則(CF-IR)法を提案する。
その結果,CF-IRはMQCICタスクにおいてChain-of-Thoughtメソッドよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:26:39 GMT)
GuidedBench: Measuring and Mitigating the Evaluation Discrepancies of In-the-wild LLM Jailbreak Methods [10.6] 2022年以降,37件のジェイルブレイク研究に基づいて,系統的な測定を行った。
既存の評価システムにはケース特化基準が欠如しており,その有効性や安全性に関する誤解を招く結果が得られた。
GuidedBenchは、キュレートされた有害な質問データセット、詳細なケースバイケース評価ガイドライン、これらのガイドラインと統合された評価システムを含む、新しいベンチマークである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:13:12 GMT)
FEVO: Financial Knowledge Expansion and Reasoning Evolution for Large Language Models [10.6] 大規模言語モデル(LLM)のための多段階拡張フレームワークであるFEVO(Financial Evolution)を紹介する。
FEVOは、継続事前学習(CPT)を使用して金融分野の知識を拡大し、構造化された精巧な推論パターンを取り入れ、強化学習(RL)を指導する微調整(SFT)によってLLM性能を体系的に向上させる。
フレームワークを用いて、Qwen2.5-32BからFEVOシリーズ(C32B、S32B、R32B)をトレーニングし、7つのベンチマークで評価を行い、FEVO-R32Bが状態を達成することを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:06:36 GMT)
Intrinsic Training Signals for Federated Learning Aggregation [10.5] フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。
この研究は、既存のトレーニング信号だけで効果的なモデルマージが達成できることを実証している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:03:23 GMT)
OpenDPDv2: A Unified Learning and Optimization Framework for Neural Network Digital Predistortion [10.5] 本稿では,PAモデリング,PD学習,モデル最適化のための統合フレームワークであるOpenDPDv2を提案する。
最適化手法は、2つのエネルギー効率の良い手法と共に、新しいDPDアルゴリズムであるTRes-DeltaGRUを特徴としている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:54:47 GMT)
MCA-RG: Enhancing LLMs with Medical Concept Alignment for Radiology Report Generation [10.4] Medical Concept Aligned Radiology Report Generation (MCA-RG) は、視覚的特徴と異なる医療概念を整合させてレポート生成プロセスを強化する知識駆動型フレームワークである。
MCA-RGは、病変関連知識を含む病理バンクと解剖学的記述を持つ解剖バンクという、2つの治療された概念バンクを使用している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:15:38 GMT)
SynthTextEval: Synthetic Text Data Generation and Evaluation for High-Stakes Domains [10.4] 合成テキストの総合的な評価を行うためのツールキットであるSynthTextEvalを提案する。
我々は、AI開発における合成テキストの生存性の向上と、反転、プライバシー保護の実現を目指している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:05:33 GMT)
Generating Multi-Table Time Series EHR from Latent Space with Minimal Preprocessing [10.4] 我々はRawMedを紹介した。RawMedは、生のEHRによく似たマルチテーブル時系列EHRデータを合成する最初のフレームワークである。
テキストベースの表現と圧縮技術を使用して、RawMedは最小の事前処理で複雑な構造と時間的ダイナミクスをキャプチャする。
また,マルチテーブル時系列合成 EHR のための新たな評価フレームワークを提案し,分布の類似性,テーブル間関係,時間的ダイナミクス,プライバシを評価する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:22:22 GMT)
AI-GenBench: A New Ongoing Benchmark for AI-Generated Image Detection [9.5] Ai-GenBenchは、現実のシナリオにおけるAI生成イメージの堅牢な検出の必要性に対処するために設計された、新しいベンチマークである。
Ai-GenBenchは、明確な評価ルールと制御された拡張戦略を確立することにより、検出方法とスケーラブルなソリューションの有意義な比較を可能にする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:26:53 GMT)
ADPv2: A Hierarchical Histological Tissue Type-Annotated Dataset for Potential Biomarker Discovery of Colorectal Disease [9.5] ADPv2は消化管病理に焦点をあてた新しいデータセットである。
本データセットは,正常な大腸生検スライドから得られた20,004枚の画像パッチを,32種類のHTT3レベルの階層分類で注釈した。
我々のデータセットは、臓器特異的な詳細な研究により、潜在的なバイオマーカーの発見が可能であることを示しています。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:16:20 GMT)
Neuron-Level Differentiation of Memorization and Generalization in Large Language Models [9.5] 本研究では,大言語モデルがニューロンレベルでの記憶と一般化をいかに区別するかを検討する。
ゼロから訓練されたGPT-2モデルとLoRAで微調整されたLLaMA-3.2モデルの両方の実験は、一貫したニューロンレベルの特殊化を示している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:14:46 GMT)
Scalable and Realistic Virtual Try-on Application for Foundation Makeup with Kubelka-Munk Theory [8.9] ファンデーションVTO応用における重要な技術的課題は、ファンデーション-スキントーンカラーブレンディングの正確な合成である。
より高速な画像合成のための確立されたクーベルカ・マンク理論(KM)を近似する新しい手法を提案する。
我々は,電子商取引サイトで利用可能な製品情報にのみ依存して,現実的な基盤構成を実現するためのスケーラブルなエンドツーエンドフレームワークを構築している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 23:19:28 GMT)
MST-Distill: Mixture of Specialized Teachers for Cross-Modal Knowledge Distillation [8.7] MST-Distillは、専門教師が混在する新しいクロスモーダルな知識蒸留フレームワークである。
本稿では,蒸留経路の選択と知識の漂流という,既存のアプローチにおける2つの重要な課題を実証的に明らかにする。
本手法では,マルチモーダル構成とクロスモーダル構成の両方に多様な教師モデルのアンサンブルを用いており,インスタンスレベルのルーティングネットワークと統合されている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:45:28 GMT)
StixelNExT: Toward Monocular Low-Weight Perception for Object Segmentation and Free Space Detection [8.7] 本研究では、Stixel-Worldの概念を活用して、その周囲の中程度の表現を認識する。
我々のネットワークは2次元の多層Stixel-Worldを直接予測し、画像内の複数の重畳されたオブジェクトを認識することができる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:38:35 GMT)
StixelNExT++: Lightweight Monocular Scene Segmentation and Representation for Collective Perception [8.7] StixelNExT++はモノクル認識システムのためのシーン表現の新しいアプローチである。
我々の軽量ニューラルネットワークは、自動的に生成されたLiDARベースの地上真実に基づいて訓練されており、1フレームあたり10ミリ秒の時間でリアルタイムのパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:30:07 GMT)
Towards LLM-based Root Cause Analysis of Hardware Design Failures [8.6] 大規模言語モデル(LLM)は、設計問題と合成とシミュレーション中に明らかになったバグの根本原因を説明することができる。
OpenAIのo3-mini推論モデルは、pass@5スコアの100%の時間で正しい決定に達した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:25:52 GMT)
Judging from Support-set: A New Way to Utilize Few-Shot Segmentation for Segmentation Refinement Process [8.4] セグメンテーションの改良は、セグメンテーションアルゴリズムによって生成された初期粗いマスクを強化することを目的としている。
セグメンテーション改良の成功を判断できる手法は開発されていない。
セグメンテーション・リファインメントの成功を判断する手法であるJFS(Judging From Support-set)を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:40:16 GMT)
FinSphere, a Real-Time Stock Analysis Agent Powered by Instruction-Tuned LLMs and Domain Tools [7.7] 現在の金融大規模言語モデル(FinLLM)は2つの限界に悩まされている。
株価分析レポートの品質評価のための客観的評価指標の欠如と、株価分析の深みの欠如は、彼らのプロフェッショナルグレードの洞察を生み出す能力を妨げている。
本稿では、ストック分析エージェントであるFinSphereと3つの主要な貢献について紹介する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:59:49 GMT)
Do AI tutors empower or enslave learners? Toward a critical use of AI in education [7.7] 論文は、AIは学習を支援することができるが、その未確認使用は認知萎縮につながるかもしれないと論じている。
この論文は、学習者を弱めるのではなく、力を与えるAIの意図的で透明で批判的な利用を提唱している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:15:49 GMT)
On-Device Training of PV Power Forecasting Models in a Smart Meter for Grid Edge Intelligence [7.6] グリッドエッジインテリジェンスのモチベーションとデバイス上でのトレーニングの概念が導入される。
太陽光発電発電予測の課題について事例研究を行った。
実験結果は,既存の先進的な計測インフラを通じて,グリッドエッジインテリジェンスを経済的に実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:45:33 GMT)
From Data-Centric to Sample-Centric: Enhancing LLM Reasoning via Progressive Optimization [7.5] 検証可能な報酬付き強化学習(RLVR)は、最近、大規模言語モデル(LLM)の推論能力を進歩させた。
サンプル中心の観点からRLVRを調査し,プログレッシブ最適化手法の枠組みであるLPPOを導入する。
私たちの仕事は、データボリュームを単にスケールアップするのではなく、小さな信頼性のある高品質なデモを最大限に活用する方法という、重要な問題に対処しています。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:05:28 GMT)
SkyVLN: Vision-and-Language Navigation and NMPC Control for UAVs in Urban Environments [7.3] 無人航空機(UAV)は、移動性と適応性によって、様々な分野にまたがって多用途のツールとして登場した。
本稿では,複雑な都市環境下でのUAV自律性を高めるために,VLNとモデル予測制御(NMPC)を統合した新しいフレームワークであるSkyVLNを紹介する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:38:32 GMT)
From Video to EEG: Adapting Joint Embedding Predictive Architecture to Uncover Visual Concepts in Brain Signal Analysis [7.2] 脳波信号は、高時間分解能と低空間分解能で脳活動を捉え、神経学的診断、認知モニタリング、脳-コンピュータインターフェースなどの応用をサポートする。
本稿では,脳波分類のためのビデオ共同埋め込み予測アーキテクチャ(VJEPA)の新たな適応であるEEG-VJEPAを提案する。
脳波をビデオライクなシーケンスとして扱うことで、EEG-VJEPAは共同埋め込みと適応マスキングを用いて意味的に意味のある表現を学ぶ。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:43:06 GMT)
Dual-Granularity Cross-Modal Identity Association for Weakly-Supervised Text-to-Person Image Matching [7.1] 弱教師付きテキスト対人画像マッチングは、大規模な手動ラベル付きサンプルへのモデル依存を減らすための重要なアプローチである。
本稿では,複雑な一対多の同一性関係を予測するために,二重粒度同一性関連機構を提案する。
実験結果から,提案手法はクロスモーダルマッチングの精度を大幅に向上させることが示された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:59:13 GMT)
Double Supersolid Phase in a Bosonic t-J-V Model with Rydberg Atoms [7.1] Rydberg原子で現在実現されているボソニックt-J-Vモデルについて検討する。
以上の結果から,ボーソニックt-J-Vモデルは,リドベルク原子配列における異方性量子位相を探索するための,有望かつ実験的に利用可能なプラットフォームとして確立された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:38:49 GMT)
Detecting Entanglement by State Preparation and Local Measurements [7.1] 絡み合い証人(英: Entanglement witnesses、EWs)は、分離可能な状態を特徴づける観測可能な物の集合である。
ネットワーク状態として導入した多部交絡状態の固定的な測定設定により,EWを推定可能であることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:20:32 GMT)
An Information-Theoretic Perspective on Multi-LLM Uncertainty Estimation [7.0] 大規模言語モデル(LLM)は入力間で矛盾なく振る舞うことが多く、不確実性を示し、その定量化の必要性を高レベルな設定で動機付けている。
本稿では,MUSE(Multi-LLM Uncertainty via Subset Ensembles)を提案する。
二分予測タスクの実験では、単一モデルとナイーブアンサンブルベースラインと比較してキャリブレーションと予測性能が改善された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:13:25 GMT)
Heterogeneous Graph Neural Networks for Short-term State Forecasting in Power Systems across Domains and Time Scales: A Hydroelectric Power Plant Case Study [6.7] 高精度な短期予測は、現代の電力系統の効率的かつ安定した運用に不可欠である。
現代の電力システムは、モデリングと予測において重要な課題を呈する複数の物理的領域にまたがることが多い。
本稿では,これらの制約に対処するために異種グラフ注意ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:39:14 GMT)
A model-agnostic active learning approach for animal detection from camera traps [6.5] 本稿では,カメラトラップが捉えた動物検出のためのモデルに依存しない能動学習手法を提案する。
提案手法は,オブジェクトベースと画像ベースの両方のサンプルの不確実性と多様性を,アクティブな学習サンプル選択プロセスに統合する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:36:59 GMT)
Evaluating Large Multimodal Models for Nutrition Analysis: A Benchmark Enriched with Contextual Metadata [6.5] 本稿では,公開予定の食品画像データセットであるACETADAを紹介する。
本研究は、文脈メタデータの解釈が、重要な栄養価を推定する際のLMM性能をいかに向上させるかを検討する。
実験結果から, 即時的プロンプト戦略によりメタデータをインテリジェントに統合すると, 栄養価の予測値において, 平均絶対誤差 (MAE) と平均絶対誤差 (MAPE) が著しく減少することが示された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:10:33 GMT)
Reinforcement Learning-based Feature Generation Algorithm for Scientific Data [6.4] 特徴生成(FG)は、高次特徴の組み合わせを構築し、冗長な特徴を取り除くことにより、元のデータの予測可能性を高めることを目的としている。
本稿では、マルチエージェント特徴生成(MAFG)フレームワークを提案する。具体的には、マルチエージェントは、協調的に数学的変換方程式を構築し、高情報コンテンツを禁止した特徴組合せを合成し、識別し、強化学習機構を利用して戦略を進化させる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:30:58 GMT)
Automating Evaluation of Diffusion Model Unlearning with (Vision-) Language Model World Knowledge [6.4] マシン・アンラーニング(英: Machine Unlearning、MU)は、基本的な拡散モデルから望ましくない情報(概念、バイアス、パターン)を浄化するコスト効率の良い方法である。
拡散モデルにおける未学習を徹底的に評価するために(ビジョン-)言語モデルを活用する自動ツールであるautoeval-dmunを導入する。
対象とする概念が与えられたとき、オートエスバル・ダンは言語モデルから構造化された関連する世界知識を抽出し、未学習によって損傷を受けやすい近くの概念を特定する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:51:09 GMT)
Empowering Healthcare Practitioners with Language Models: Structuring Speech Transcripts in Two Real-World Clinical Applications [6.4] 2つの高インパクトNLPタスクは、データの不足と感度のために未探索のままである。
これらの現実の臨床的タスクに対する実践的な解決策は、医療提供者に対するドキュメントの負担を大幅に減らすことができる。
我々は,看護師観察と医療秩序抽出のための最初のオープンソースデータセットであるSynURとSIMORDをリリースする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:53:32 GMT)
Terrier: A Deep Learning Repeat Classifier [6.3] Terrierは反復的なDNA配列を分類するために設計されたディープラーニングモデルである。
97.1%のRepbase配列をRepeatMaskerカテゴリにマッピングし、最も包括的な分類システムを提供している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:48:47 GMT)
Quantum Error Mitigation by Global Randomized Error Cancellation for Adiabatic Evolution in the Schwinger Model [6.2] 我々は、量子エラー軽減(QEM)のためのグローバルランダム化エラーキャンセル(GREC)法を拡張した。
シミュレーション量子デバイス上での格子シュウィンガーモデルにおける固有状態の進化に対して,Adiabatic GREC法を適用した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:19:43 GMT)
Adaptive Elicitation of Latent Information Using Natural Language [6.2] 本稿では,潜在エンティティの不確かさを積極的に軽減する適応型エレクテーションフレームワークを提案する。
我々のフレームワークは,メタ学習言語モデルを用いて将来の観測をシミュレートし,不確実性を予測する。
20の質問ゲーム、動的世論ポーリング、適応的学生評価の実験において、本手法は批判的未知を識別する基準線を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:58:35 GMT)
mmFlux: Crowd Flow Analytics with Commodity mmWave MIMO Radar [6.2] 我々は,mmWaveレーダを用いた群集運動パターン抽出のための新しい枠組みを提案する。
我々は、コモディティmmWaveレーダを用いて、3つのエリアにまたがる最大20人の群衆に対して21の実験を行う。
本フレームワークは,複雑な群集パターンであっても,基礎となるフロー構造の高忠実度グラフ再構成を実現する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 23:11:14 GMT)
Efficient First-Principles Framework for Overdamped Phonon Dynamics and Anharmonic Electron-Phonon Coupling in Superionic Materials [6.2] 超イオン導体における局所障害、無調波性、電子-フォノン結合を記述するために、ab initio準静電多相構造を導入する。
提案手法は,超イオン結晶における電子構造計算を効率よく行うことで,その高次量化を解明する手法である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:51:55 GMT)
Multi-dynamic deep image prior for cardiac MRI [5.7] Multi-Dynamic Deep Image Prior (M-DIP) は、リアルタイム心磁図の高速化のための新しい教師なし再構成フレームワークである。
M-DIPは、生理的動きとフレーム間コンテンツの変化を同時に捉え、幅広い動的応用に適用できる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:11:37 GMT)
InvestAlign: Overcoming Data Scarcity in Aligning Large Language Models with Investor Decision-Making Processes under Herd Behavior [5.7] 高品質なSupervised Fine-Tuningデータセットを構築するフレームワークであるInvestAlignを提案する。
理論的解析により,実ユーザデータよりも高速なパラメータ収束を実現することが示唆された。
これは、当社が提案したInvestAlignを、複雑な最適投資問題に対処する可能性のある、有望なアプローチとして強調します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:07:22 GMT)
Less can be more for predicting properties with large language models [5.6] 本稿では,座標分類データの座標情報から学習できる大規模言語モデルの限界について報告する。
LLMはカテゴリパターンに長けながら座標情報の取得に一貫して失敗していることがわかった。
本研究は, 構造効果に支配される材料特性予測タスクにおける即時的な実践的意味を示唆するものである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:37:23 GMT)
ViDove: A Translation Agent System with Multimodal Context and Memory-Augmented Reasoning [5.5] ViDoveはマルチモーダル入力用に設計された翻訳エージェントシステムである。
長文自動サブタイリングと翻訳のための新しいベンチマークであるDoveBenchを紹介する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:05:46 GMT)
Privacy-Utility-Fairness: A Balanced Approach to Vehicular-Traffic Management System [5.5] 位置情報に基づく車両交通管理は、機密性の高い地理的データを保護する上で大きな課題に直面している。
既存の最先端ソリューションは、リンク攻撃や人口統計バイアスに対して要求されるレベルの保護を満たさないことが多い。
本稿では,位置に基づく車両交通管理システムにおけるプライバシ,ユーティリティ,公平性のバランスに関する課題に対処する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:49:13 GMT)
Empowering Bridge Digital Twins by Bridging the Data Gap with a Unified Synthesis Framework [5.5] 本稿では,3次元ブリッジデータを生成するための体系的枠組みを提案する。
コンポーネントレベルのインスタンスアノテーション、高忠実度カラー、正確な正規ベクトルを特徴とするポイントクラウドを自動的に生成できる。
実世界のブリッジセマンティックセマンティックセグメンテーションにおいて,合成データを用いてトレーニングしたPointNet++モデルにより,平均的なmIoU(Intersection over Union)が84.2%に達することを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:13:38 GMT)
Are NFTs Ready to Keep Australian Artists Engaged? [5.4] 非Fungible Tokens(NFT)は、オーストラリアや先住民の芸術家の著作権を保護するための有望なメカニズムを提供する。
我々は、NFTがアーティストとプロダクションオーナーの両方の著作権をどう表現しているか、そしてデジタルアートアートの価値の保護や保護を目的としているかを示す。
残念ながら、この評価の最終結果は、NFTがオーストラリアや先住民の芸術家の著作権を保護する準備ができていないことを示している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:07:17 GMT)
Foundation Model Self-Play: Open-Ended Strategy Innovation via Foundation Models [5.4] Foundation-Model Self-Play(FMSP)は、コード生成機能とファンデーションモデル(FM)の膨大な知識を活用して、ポリシー空間におけるローカルな最適性を飛び越えることで、課題を克服する新しい方向性である。
Gandalfでは、攻撃者がLLMの防御をジェイルブレイクしようとする単純なAI安全シミュレーションである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:58:19 GMT)
DIFFUMA: High-Fidelity Spatio-Temporal Video Prediction via Dual-Path Mamba and Diffusion Enhancement [5.3] 我々は,半導体ウェハダイシングプロセスに特化した最初の公開時空間画像データセットであるChip Dicing Laneデータセット(CHDL)をリリースする。
このような微細なダイナミクスに特化して設計された、革新的なデュアルパス予測アーキテクチャであるDIFFUMAを提案する。
実験の結果、DIFFUMAは既存の手法よりも優れており、平均二乗誤差(MSE)を39%削減し、類似性(SSIM)を0.926から0.988に改善した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:51:54 GMT)
Divergence-Based Similarity Function for Multi-View Contrastive Learning [5.3] 本稿では,各拡張ビューの集合を分布として表現することにより,結合構造を捉える分散型類似関数(DSF)を提案する。
大規模な実験により、DSFはkNN分類や線形評価など、様々なタスクにおけるパフォーマンスを一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:28:31 GMT)
Open Source Planning & Control System with Language Agents for Autonomous Scientific Discovery [5.3] cmbagentは、科学研究タスクの自動化のためのマルチエージェントシステムである。
エージェントワークフローをオーケストレーションするためのプランニングとコントロールの戦略を実装している。
このシステムはHuggingFace上にデプロイされ、クラウド上で利用できるようになる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:03:30 GMT)
Robust and Safe Traffic Sign Recognition using N-version with Weighted Voting [5.1] N-version machine learning (NVML) フレームワークを提案する。
本手法では、FMEA(Failure Mode and Effects Analysis)を用いて、潜在的な安全性リスクを評価し、アンサンブル出力に動的で安全性に配慮した重みを割り当てる。
実験により,NVML手法は,対向条件下での交通標識認識システムの堅牢性と安全性を著しく向上させることが示された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:46:31 GMT)
FOLC-Net: A Federated-Optimized Lightweight Architecture for Enhanced MRI Disease Diagnosis across Axial, Coronal, and Sagittal Views [5.0] FOLC-Netは、MRI疾患の診断のための単一の解剖学的視点と組み合わせた分析のパフォーマンスを向上させるように設計されている。
このアーキテクチャには、約1.217万のパラメータと0.9MBのストレージ要件を備えた、新しいフェデレーション最適化軽量アーキテクチャが組み込まれている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:40:41 GMT)
Beyond Accuracy: Metrics that Uncover What Makes a 'Good' Visual Descriptor [4.8] デクリプタは視覚モデル(VLM)を用いた視覚概念の発見と画像分類に使用される
我々は,(1)表現能力,(2)VLM事前学習データとの関係の2つの重要な側面に沿って,記述子の品質を体系的に解析する。
表現アライメントと言語理解のアイデアに触発されて,2つのアライメントベースのメトリクス – グローバルアライメントとCLIP類似性 – を導入する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:01:23 GMT)
Learning Japanese with Jouzu: Interaction Outcomes with Stylized Dialogue Fictional Agents [4.7] 本研究では,マルチモーダル言語学習環境において,音声エージェントがいかにユーザインタラクションを形成するかを検討する。
我々は,大規模言語モデルと表現型音声合成を用いたアニメインスピレーション文字と対話する54人の被験者を対象に,混合手法による評価を行った。
その結果,エージェントデザイン,特に音声,ペルソナ,言語スタイルが,ユーザエクスペリエンス,モチベーション,戦略に大きく影響したことが明らかとなった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:57:58 GMT)
Representative Ranking for Deliberation in the Public Sphere [4.7] アルゴリズムのランク付けは、正当な視点の可視性を低下させる。
これらの方法に表現の保証を導入する。
JR の実施は,多様な視点を取り入れることにつながることが判明した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:22:44 GMT)
Gradientsys: A Multi-Agent LLM Scheduler with ReAct Orchestration [4.7] 次世代マルチエージェントスケジューリングフレームワークであるGradientsysを紹介する。
型付きモデルコンテキストプロトコル(MCP)とReActベースの動的計画ループを使用して、さまざまなAIエージェントを協調する。
GAIA General-Asistantベンチマークの実験によると、Gradientsysはレイテンシの低減とAPIコストの低減により、タスクの成功率の向上を実現している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:40:56 GMT)
Extending Forrelation: Quantum Algorithms Related to Generalized Fourier-Correlation [4.7] 本稿では,Walsh-Hadamard,相互相関,自己相関など,ブール関数の異なる暗号学的に重要なスペクトルについて検討する。
Deutsch-Jozsaアルゴリズムの最も一般化されたバージョンを示す。
また、2つの曲がった(あるいは負の)関数間のシフトを特定の修正で識別する量子アルゴリズムについても論じる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:06:46 GMT)
Exploring Fairness Interventions in Open Source Projects [4.6] 機械学習モデルのバイアスは、刑事司法や医療などの分野に悪影響を及ぼす可能性がある。
バイアスを緩和し、より公平なモデルの作成を促進することを目的として、機械学習フェアネスの介入が開発されている。
これらの介入が利用可能になっているにもかかわらず、現実世界のアプリケーションでの採用は制限されている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:57:59 GMT)
Reducing Reasoning Costs: The Path of Optimization for Chain of Thought via Sparse Attention Mechanism [4.6] この研究は、いくつかの関連するトークンにのみ焦点をあてるスパースアテンションメカニズムを使うことを提案する。
この実験は、MIT OpenCourseWareの線形代数テスト問題の解法において、このモデルの推論時間、正当性スコア、思考長の連鎖とo1プレビューを比較して比較した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:21:45 GMT)
HLSTester: Efficient Testing of Behavioral Discrepancies with LLMs for High-Level Synthesis [4.5] 高レベル合成(HLS)における行動の相違をテストする既存の方法はまだ未熟である。
本研究では,大規模言語モデル(LLM)を用いたテストフレームワークHLSTesterを提案する。
LLMの幻覚を緩和するために、オリジナルのC/C++プログラムのテストベンチを利用して、LS互換のテストベンチを生成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:19:34 GMT)
Efficient Sampling for Pauli Measurement-Based Shadow Tomography in Direct Fidelity Estimation [4.5] ランダムなクリフォード測定の定数により、古典的なシャドウプロトコルは高精度で直接忠実度推定(DFE)を行うことができる。
同様の戦略は古典的な影から導き出すことができる。
具体的には,GHZ,W,Dicke状態を用いてDFEを行うために,局所的なパウリ測定のみを用いた効率的な手法について述べる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:44:16 GMT)
Multi-parameter Control for the $(1+(λ,λ))$-GA on OneMax via Deep Reinforcement Learning [4.5] 我々は、最先端の深層強化学習技術がいかに優れた制御ポリシーを近似できるかを示す。
我々は、既定理論推奨設定を一貫して上回る単純な制御ポリシーを導出する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:18:09 GMT)
Assessing Small Language Models for Code Generation: An Empirical Study with Benchmarks [4.4] 小型言語モデル(SLM)は、大規模言語モデル(LLM)の軽量で費用対効果の高い代替手段を提供する。
本研究では,5つのコード関連ベンチマークにおいて,0.4Bから10Bまでの20個のオープンソースSLMの総合的評価を行った。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:49:35 GMT)
The Impact of Background Speech on Interruption Detection in Collaborative Groups [4.4] 単一会話と複数グループ対話設定における割り込み検出を解析する。
そして、重なり合う音声に対して頑健な割り込み識別のための最先端の手法を作成する。
我々の研究は、グループ間相互作用における割り込みがどのように現れるかについて、意味のある言語的・韻律的な情報に焦点を当てている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:57:55 GMT)
Investigating the Robustness of Retrieval-Augmented Generation at the Query Level [4.3] 推論中に外部知識を動的に組み込むソリューションとして、検索拡張生成(RAG)が提案されている。
その約束にもかかわらず、RAGシステムは実際的な課題に直面し、特に、正確な検索のために入力クエリの品質に強く依存する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:39:17 GMT)
Fast Equivariant Imaging: Acceleration for Unsupervised Learning via Augmented Lagrangian and Auxiliary PnP Denoisers [4.3] 地磁気データを使わずにディープイメージングネットワークを効率的に訓練するための,新しい教師なし学習フレームワークであるFast Equivariant Imaging (FEI)を提案する。
FEIは、バニラ同変イメージングのパラダイムよりも効率と性能が優れている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:47:06 GMT)
Segmentation Regularized Training for Multi-Domain Deep Learning Registration applied to MR-Guided Prostate Cancer Radiotherapy [4.2] MR誘導適応放射線治療における輪郭伝播と線量蓄積には正確な変形性画像登録(DIR)が必要である。
本研究は, ドメイン不変MR-MR登録のためのディープラーニングDIR法を訓練し, 評価した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:55:32 GMT)
Can LLMs Play Ô Ăn Quan Game? A Study of Multi-Step Planning and Decision Making [3.8] 我々は,ベトナムのボードゲーム「O uAn Quan」のレンズを通して,大規模言語モデル(LLM)を計画し,意思決定する能力について検討する。
具体的には,攻撃的から防御的まで多岐にわたるエージェントペルソナを開発し,O uAn Quan ゲームを様々な戦略で LLM 性能を評価するテストベッドとして利用する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:09:05 GMT)
ZKTorch: Compiling ML Inference to Zero-Knowledge Proofs via Parallel Proof Accumulation [3.8] 本稿では,MLモデルをベース暗号演算にコンパイルするエンドツーエンドの証明システムを提案する。
ZKTorch は Mira 累積法の新たな並列拡張の上に構築されており、最小の累積オーバーヘッドで簡潔な証明を可能にする。
これらのコントリビューションにより、ZKTorchは、特殊なプロトコルと比較して、少なくとも3倍の証明サイズ削減を実現し、汎用ZKMLフレームワーク上での証明時間の最大6倍のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:03:21 GMT)
MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments [3.7] 局所流れ場計測を取り入れることによって,問題の性質が根本的に変化し,解決不可能なナビゲーションシナリオがトラクタブルなものに変換されることを示す。
センサ融合のための空間的注意と時間的注意を統合したトランスフォーマーベースのポリシーアーキテクチャであるtextbfMarineFormer を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 23:40:31 GMT)
Spectral Bounds on Entropy and Ergotropy via Statistical Effective Temperature in Classical Polarization and Quantum Thermal States [3.6] 有限次元古典および量子系の統計有効温度(SET)を統一的に定義する。
SETフレームワークは、純粋で非退化状態に近い逆温度のばらつきを自然に記述し、第三法則と整合する。
エントロピーとSETの関数としてエルゴトロピーのスペクトル境界を導出し、受動的制約下での最大抽出可能な作業量を定量化する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:23:51 GMT)
Description of the Training Process of Neural Networks via Ergodic Theorem : Ghost nodes [3.6] 本稿では、訓練勾配降下(SGD)による深層ニューラルネットワークの理解と加速のための統一的な枠組みを提案する。
我々は,安定剤に対する真の収束を識別する,最も大きなリャプノフ指数の実用診断,実行推定を導入する。
本稿では,補助的なゴースト出力ノードを付加した標準分類器のゴーストカテゴリ拡張を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:03:57 GMT)
Exploring Public Perceptions of Generative AI in Libraries: A Social Media Analysis of X Discussions [3.6] 本研究では,X(旧Twitter)の投稿を大規模に分析し,図書館における生成人工知能(GenAI)の一般認識について検討する。
本稿では、時間的傾向分析、感情分類、ソーシャルネットワーク分析を組み合わせた混合手法を用いて、GenAIと図書館に関する公的な言論が時間とともにどのように発展してきたかを考察する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:10:06 GMT)
Quantum state preparation without coherent arithmetic [3.6] 本稿では、いくつかの既知の関数によって振幅が与えられる量子状態を作成するための汎用的な方法を紹介する。
テンプレート量子固有値変換回路を用いて、正弦関数の低コストブロック符号化を所望の関数に変換する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:08:56 GMT)
Multi-Agent Pathfinding Under Team-Connected Communication Constraint via Adaptive Path Expansion and Dynamic Leading [3.5] チームは、すべてのムーブメントにおいて、他のチームと接続されたコミュニケーションチャネルを持つ必要があります。
標準のマルチエージェントパス探索アプローチは、開始時の設定と目標が異なる場合に失敗する。
本稿では,2つの手法を統合した新しい2レベルマルチエージェントパスフィンディングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:41:02 GMT)
A Survey of Classification Tasks and Approaches for Legal Contracts [3.5] 自動法定契約分類(LCC)は、法定契約の分析方法に革命をもたらす。
LCCは速度、精度、アクセシビリティを大幅に改善する。
本調査では、自動LCCの課題と、重要なタスク、データセット、方法論の詳細な調査について述べる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:22:42 GMT)
From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution [3.5] 空中物体検出は、小さな物体の大きさ、高密度クラスタリング、距離や動きのぼかしによる画質劣化などの課題を提示する。
B2BDetは、推論中にドメイン固有の超解像を適用し、拡張されたYOLOv5アーキテクチャを使って検出する2段階のフレームワークでこの問題に対処する。
このアプローチは、航空最適化SRGAN微調整とEAM(Efficient Attention Module)やCLFPN(Cross-Layer Feature Pyramid Network)といったアーキテクチャ革新を組み合わせる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:14:26 GMT)
Generating Heterogeneous Multi-dimensional Data : A Comparative Study [3.4] ランダムサンプリング,タブラリ変分オートエンコーダ,標準生成逆数ネットワーク,条件付きタブラリ生成逆数ネットワーク,拡散確率モデルなどの手法について検討した。
このギャップに対処するために、消防ドメインに合わせて調整されたドメイン固有のメトリクスの組み合わせを用いて、合成データ品質の評価を行う。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:32:12 GMT)
What Has a Foundation Model Found? Using Inductive Bias to Probe for World Models [3.4] 本研究では,合成データセットへの適応性を評価する基礎モデルの評価手法を開発した。
基礎モデルはトレーニングタスクに優れるが、新しいタスクに適応すると、基礎となる世界モデルに対する帰納的バイアスを発生させることができない。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:36:15 GMT)
Vectorised Hashing Based on Bernstein-Rabin-Winograd Polynomials over Prime Order Fields [3.3] AXUハッシュ関数deBRWHashはBernsteinRabin-Winograd(BRW)に基づいている
4-decBRWHashは、数百バイトのメッセージではより高速で、数キロバイトのメッセージ長で約16%のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:27:33 GMT)
PINN-Obs: Physics-Informed Neural Network-Based Observer for Nonlinear Dynamical Systems [2.9] 本稿では,非線形システムにおける状態推定のための新しい適応物理インフォームドニューラルネットワークベースオブザーバ(PINN-Obs)を提案する。
明示的なシステム変換や線形化を必要とする従来のモデルベースオブザーバとは異なり、提案フレームワークはシステムダイナミクスとセンサデータを物理インフォームド学習プロセスに直接統合する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:09:45 GMT)
Designing Robust Software Sensors for Nonlinear Systems via Neural Networks and Adaptive Sliding Mode Control [2.9] 本稿では,非線形力学系のためのソフトウェアセンサの設計手法を提案する。
明示的な変換や線形化に依存する従来のモデルベースオブザーバとは異なり、提案フレームワークはニューラルネットワークと適応スライディングモード制御(SMC)を統合している。
トレーニング手法は、物理に基づく制約としてシステムの制御方程式を活用することで、基底構造軌道にアクセスせずにオブザーバ合成を可能にする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:06:58 GMT)
Cons-training Tensor Networks: Embedding and Optimization Over Discrete Linear Constraints [2.9] 我々は,制約行列積状態(MPS)と呼ばれるテンソルネットワークの新たなファミリーを導入する。
MPSは、不等式を含む正確に任意の離散線型制約をスパースブロック構造に組み込む。
これらのネットワークは、特に、可能空間上で厳密にサポートされた分散をモデル化するために調整されている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:36:21 GMT)
Neural Networks for Tamed Milstein Approximation of SDEs with Additive Symmetric Jump Noise Driven by a Poisson Random Measure [2.8] 本稿では,非パラメトリック関数近似器として使用されるニューラルネットワークに,Tamed-Milsteinスキームを統合したフレームワークを提案する。
提案手法は、L'evyプロセスによって駆動される状態依存ノイズと不連続性を持つシステムにおける推論の柔軟な代替手段を構成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:33:51 GMT)
A Language-Driven Framework for Improving Personalized Recommendations: Merging LLMs with Traditional Algorithms [2.8] 大規模言語モデル(LLM)は、自然言語処理の最も有望なツールの1つである。
本研究は、親しい友人が個人の好みの知識に基づいて、いかにアイテムを推薦するかを模倣する新しい枠組みを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:48:33 GMT)
Non-Gaussian Phase Transition and Cascade of Instabilities in the Dissipative Quantum Rabi Model [2.8] オープン量子ラビモデルは、調和振動子に結合された2レベル系を記述する。
非平衡定常状態に対するガウス相転移は、ボゾンモードが柔らかく減衰しているときに予測されている。
発振器の脱落は関連する摂動であり、これは非ガウス相転移と$k$-次ボソニック作用素に対する興味深い不安定なカスケードをもたらす。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:51:20 GMT)
Large Language Model for Extracting Complex Contract Information in Industrial Scenes [2.8] GPT-4とGPT-3.5は、元の契約データから鍵情報を抽出するために使用される。
大規模言語モデルは高品質なデータセットに基づいて微調整される。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:46:31 GMT)
Towards Trustworthy Sentiment Analysis in Software Engineering: Dataset Characteristics and Tool Selection [2.8] 5つのプラットフォームから10の開発者コミュニケーションデータセットの言語的特徴と統計的特徴を分析した。
本稿では,新しいデータセットに対して適切な感情分析ツールを推奨するマッピング手法とアンケートを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 23:22:02 GMT)
Towards Enterprise-Ready Computer Using Generalist Agent [2.7] 本稿では,企業用汎用エージェントシステム(CUGA)の開発に向けて,現在進行中の取り組みについて述べる。
最先端のエージェントAI技術と、反復的評価、分析、改善のための体系的なアプローチを統合することで、我々は、迅速かつ費用対効果の高いパフォーマンス向上を実現した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:52:32 GMT)
Two-color laser control of photocurrent and high harmonics in graphene [2.7] グラフェンモデルにおける2色レーザー駆動光電流と高調波発生(HHG)について検討した。
我々は,HHGスペクトルをレーザ電場によって追跡される実空間経路を調整することにより,劇的に変化させることができることを示した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:47:33 GMT)
HARMONIC: Cognitive and Control Collaboration in Human-Robotic Teams [2.7] 本稿では,人間ロボットチーム(HRT)に適用された汎用ロボット制御システムと,OntoAgent認知フレームワークを統合した認知ロボティックアーキテクチャについて述べる。
Harmonicはメタ認知、意味のある自然言語通信、HRTの相互信頼開発に必要な説明可能性を備えている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:58:34 GMT)
Distribution-free inference for LightGBM and GLM with Tweedie loss [2.6] コンフォーマル予測推論は、予測の不確実性を定量化するための一般的な分布のないアプローチとして生まれてきた。
本研究では,GLM型損失を考慮したGLMとGBMの非整合性対策を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:58:54 GMT)
Google Search Advertising after Dobbs v. Jackson [2.6] 危機妊娠センター(CPC)は広告の47%を占め、中絶クリニックは30%を占めていた。
アリゾナは、中絶クリニックやその他の前向きな団体から最も多く広告を返却し、ミネソタは最も少なかった。
我々の発見は、米国内における正確な医療情報へのアクセスに関する疑問を提起する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:10:53 GMT)
Connecting the Unconnected -- Sentiment Analysis of Field Survey of Internet Connectivity in Emerging Economies [2.5] 本稿ではネパール・カトマンズ地方における地域人口調査について述べる。
この調査は、市内の一部地域でのインターネットの断続的な混雑によって引き起こされた。
調査では、回答者の大きな願望として、高速、低コスト、信頼性、セキュアなインターネットが挙げられた。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:23:52 GMT)
Wasserstein Gradient Flows of MMD Functionals with Distance Kernel and Cauchy Problems on Quantile Functions [2.3] 最大平均離散関数のワッサーシュタイン勾配流について述べる: $mathcal F_nu := textMMD_K2(cdot, nu)$。
ある$mathcal F_nu$-flowsに対して、これは初期点測度がすぐに絶対連続となり、時間とともにそれを維持することを意味する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:47:59 GMT)
Measuring how changes in code readability attributes affect code quality evaluation by Large Language Models [2.3] コード可読性はコード品質の主要な側面の1つであり、識別子名、コメント、コード構造、標準への準拠といった様々な特性に影響を受けています。
本稿では,Large Language Models (LLMs) を用いて,その可読性に関連するコード品質特性を標準化され再現可能で一貫した方法で評価する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:24:41 GMT)
How to Elicit Explainability Requirements? A Comparison of Interviews, Focus Groups, and Surveys [2.3] 本研究は,焦点グループ,インタビュー,オンライン調査の3つの方法の有効性と有効性について検討した。
その結果,インタビューは最も効率的であり,参加者毎のニーズを最も多く捉えることができた。
効率とカバレッジのバランスをとるために、調査とインタビューを組み合わせたハイブリッドアプローチを推奨します。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:13:26 GMT)
PenTest2.0: Towards Autonomous Privilege Escalation Using GenAI [2.3] PenTest++は、自動化と倫理的ハッキングをサポートする生成AIを組み合わせたAI拡張システムである。
PenTest2.0は、Large Language Model推論によって完全に駆動される自動特権エスカレーションをサポートする。
動作方法を説明し、概念実証のプロトタイプを提示し、その利点と限界について議論する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:56:32 GMT)
Non-asymptotic confidence regions on RKHS. The Paley-Wiener and standard Sobolev space cases [2.2] ランダムな設計で観測された未知の関数に対して,大域的,確率的,非漸近的信頼領域を構築することの問題点を考察する。
この構造は未知関数の RKHS ノルムを正確に推定できることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:41:39 GMT)
Few-shot Learning on AMS Circuits and Its Application to Parasitic Capacitance Prediction [2.2] グラフ表現学習は、アナログ/混合信号(AMS)回路などのグラフ構造化データから特徴を抽出する強力な手法である。
本稿では,AMS回路における寄生効果予測のための数発の学習手法であるCircuitGPSを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:42:18 GMT)
Welcome to the Dark Side: Analyzing the Revenue Flows of Fraud in the Online Ad Ecosystem [2.1] 悪質な俳優たちは、制限を回避し、Webサイトを好ましくない、あるいは違法なコンテンツでサポートできる相当な収入を生み出す方法を見つけた。
広告収入を吸収し、広告主のブランドの安全性を危険にさらすために、影の俳優がいかに広告収入を吸収するかを示す。
我々は、サプライチェーンの透明性とパブリッシャーと広告ネットワーク間のビジネス関係を向上するWebモニタリングサービスを公開する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:57:17 GMT)
Before & After: The Effect of EU's 2022 Code of Practice on Disinformation [2.1] 広告ネットワークは、ほとんどビジターがいない不人気な偽情報サイトから撤退している。
広告ネットワークは、偽情報コンテンツの横にある正当な企業の広告を引き続き掲載していることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:29:19 GMT)
Foundation models for time series forecasting: Application in conformal prediction [2.0] 時系列基礎モデル(TSFM)は古典モデルよりも信頼性の高い共形予測間隔を提供する。
キャリブレーションにより多くのデータが使用されるため、キャリブレーションプロセスはより安定している。
その結果、時系列アプリケーションにおけるコンフォメーション予測の信頼性を向上させる基礎モデルの可能性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:41:54 GMT)
CL-Polyp: A Contrastive Learning-Enhanced Network for Accurate Polyp Segmentation [2.0] CL-Polypを提案する。
これは、Kvasir-SEGとCVC-ClinicDBデータセット上で、IoUメトリックを0.011と0.020改善する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:07:45 GMT)
Fundamental precision limits in finite-dimensional quantum thermal machines [2.0] 開量子熱機械の相対的分散と可観測物の期待に関する力学非依存境界を導出する。
本研究は,量子熱機械の精度に関する基礎的限界について考察した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:40:47 GMT)
SPEAR: Subset-sampled Performance Evaluation via Automated Ground Truth Generation for RAG [1.9] 本稿では,サブセットサンプリング手法を用いて評価データの課題に対処するSEARAを提案する。
本手法は,実際のユーザクエリに基づいて,完全自動検索を低コストで実現する。
我々は,知識に基づくQ&Aシステムや検索に基づく旅行アシスタントなど,従来のRAGアプリケーションにまたがる手法を検証する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:13:09 GMT)
Causal Inference Isn't Special: Why It's Just Another Prediction Problem [1.9] 因果推論は予測モデリングとは異なるものとして描かれることが多い。
しかし、中核では、因果推論は単に分布シフトの下での予測の構造化例である。
この観点は因果推定をよく知られた一般化問題として再定義する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:00:04 GMT)
Energy Spectra of Compressed Quantum States [1.8] 本稿では,Silvester,Careo,Whiteの実験的発見について,行列積状態のエネルギースペクトルが指数関数的に崩壊しないことを示す。
また、ハミルトニアンの固有状態のエネルギーと絡み合うプロファイルに対する量子的優位性の問題を減らしている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:02:41 GMT)
Learning from Sparse Point Labels for Dense Carcinosis Localization in Advanced Ovarian Cancer Assessment [1.8] スパースラベルから学ぶことは、医療分野において共通の課題である。
この研究は、数点のアノテーションからキーポイントローカライゼーションの密集した予測タスクを学ぶという課題に取り組む。
効率的な学習のための新しい損失関数 Crag and Tail loss を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:14:46 GMT)
Benchmarking Waitlist Mortality Prediction in Heart Transplantation Through Time-to-Event Modeling using New Longitudinal UNOS Dataset [1.7] 23,807人の患者を77変数で訓練し,生存予測と識別を1年間の地平線で評価した。
主要な予測者は、既知のリスク要因と整合し、新しい関連を明らかにする。
心移植決定における緊急評価と政策改善を支援することができる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 23:51:31 GMT)
Steps Adaptive Decay DPSGD: Enhancing Performance on Imbalanced Datasets with Differential Privacy with HAM10000 [1.7] SAD-DPSGDを提案する。これはノイズとクリッピング閾値に線形減衰機構を用いる。
実験の結果、SAD-DPSGDはHAM10000でAuto-DPSGDより優れ、精度は2.15%向上した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:46:29 GMT)
AdaDPIGU: Differentially Private SGD with Adaptive Clipping and Importance-Based Gradient Updates for Deep Neural Networks [1.7] 本稿では,ディープニューラルネットワークに適した重要度に基づく勾配更新を備えた,新たな微分プライベートなSGDフレームワークを提案する。
AdaDPIGUは$(varepsilon, delta)$-differential privacyを満足し、収束保証を保持する。
MNISTでは、プライバシー予算が$epsilon = 8$である場合、テスト精度は99.12%に達し、非プライベートモデルとほぼ一致する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:53:03 GMT)
Can adversarial attacks by large language models be attributed? [1.2] 本研究では,Large Language Models (LLM) のクラスは,出力のみから識別できないことを示す。
近年では, 与えられた出力に対して, 可算モデル起源数の爆発を定量化している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 02:35:36 GMT)
EduCoder: An Open-Source Annotation System for Education Transcript Data [1.2] EduCoderは、教育対話の発話レベルアノテーションをサポートするように設計されたドメイン特化ツールである。
研究者やドメインの専門家が、観測データに基づいたコードブックを共同で定義するためのプラットフォームを提供する。
分類的およびオープンなアノテーションタイプと文脈的素材を取り入れている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:40:00 GMT)
Leveraging LLMs for Semantic Conflict Detection via Unit Test Generation [1.2] 我々は、Code Llama 70Bをベースとした新しいテスト生成ツールSMATを提案し、統合する。
SMATはユニットテストの生成と実行に依存している: テストがベースバージョンで失敗し、開発者の修正バージョンをパスするが、他の開発者の変更とマージした後に再び失敗すると、セマンティックコンフリクトが示される。
その結果,LLMベースのテスト生成は複雑なシナリオでは困難であり,計算コストも高いが,セマンティックコンフリクト検出の改善には有望な可能性があることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:38:53 GMT)
Tissue Concepts v2: A Supervised Foundation Model For Whole Slide Images [1.2] 組織概念v2(TCv2)と呼ばれる全スライド画像への教師付き基礎モデルである組織概念の拡張について紹介する。
TCv2は、スライドレベルのラベルで教師付きエンドツーエンドのマルチタスク学習を使用する。
提案モデルでは,癌サブタイプベンチマークにおけるSSLトレーニングモデルよりも優れたパフォーマンスを示し,フリーで利用可能なデータで完全にトレーニングされている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:30:33 GMT)
Semi-fragile watermarking of remote sensing images using DWT, vector quantization and automatic tiling [1.1] 木構造ベクトル量子化手法を用いて,リモートセンシング画像にマークを埋め込む手法を提案する。
マルチスペクトルまたはハイパースペクトル画像のシグネチャは、そのマークを埋め込むために使用される。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:47:40 GMT)
Medical Image Segmentation Using Advanced Unet: VMSE-Unet and VM-Unet CBAM+ [1.1] 医用画像のセグメンテーションを強化するために,VMSE U-Net と VM-Unet CBAM+ モデルを提案する。
我々のアプローチは、従来のVM U-NetフレームワークにSqueeze-and-Excitation(SE)とConvolutional Block Attention Module(CBAM)技術を統合する。
どちらのモデルも、複数のデータセットにわたるベースラインVM-Unetよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:27:07 GMT)
VerilogDB: The Largest, Highest-Quality Dataset with a Preprocessing Framework for LLM-based RTL Generation [1.1] 大規模言語モデル(LLM)は、特にレジスタ転送レベル(RTL)コード生成を通じて、ハードウェア設計自動化において人気が高まっている。
データベース(DB)の作成と管理を含む3段階の自動化プロセスを通じて,ロバストなVerilogデータセットを構築した。
得られたデータセットは、20,392のVerilogサンプルと751MBのVerilogコードデータからなる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:06:54 GMT)
PromptTea: Let Prompts Tell TeaCache the Optimal Threshold [1.1] 一般的な加速戦略は、一定の間隔でキャッシング機構を介してモデル出力を再利用することである。
本稿では,入力プロンプトから直接推定されるシーンの複雑さに基づいて,再利用しきい値を自動的に調整する手法であるPrompt-Complexity-Aware(PCA)キャッシングを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:53:05 GMT)
Theme-Explanation Structure for Table Summarization using Large Language Models: A Case Study on Korean Tabular Data [1.1] 現在の表要約法は、人間に優しい出力の重要な側面を無視することが多い。
本稿では,Theme-Explanation Structure-based Table Summarization (Tabular-TX) パイプラインを紹介する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:21:40 GMT)
GPT Chatbots for Alleviating Anxiety and Depression: A Pilot Randomized Controlled Trial with Afghan Women [0.9] GPT-4がアフガン女性のメンタルヘルスに及ぼす影響について検討した。
60名を対象にランダム化対照試験を行った。
介入前後の不安・抑うつを計測するために, 病院不安・抑うつ尺度(HADS)が用いられた。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:53:26 GMT)
Signal-SGN: A Spiking Graph Convolutional Network for Skeletal Action Recognition via Learning Temporal-Frequency Dynamics [0.9] スパイキングニューラルネットワーク(SNN)は、スケルトン力学のモデル化に苦慮し、最適以下のソリューションに繋がる。
本稿では,スケルトン配列の時間次元をスパイク時間ステップとして利用するSignal-SGN(Spiking Graph Convolutional Network)を提案する。
3つの大規模なデータセットを対象とした実験では、精度と計算効率において、最先端のSNNベースの手法を超えるSignal-SGNが明らかになった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:57:47 GMT)
Mind the Gap: Navigating Inference with Optimal Transport Maps [0.9] 本稿では, 最適輸送に基づくキャリブレーション手法を提案する。
これは粒子物理学における「適切に校正された基礎モデル」を実現するための重要なステップである。
より広範に、この校正フレームワークは、科学全体にわたる高次元シミュレーションの修正に広く応用されている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:28:21 GMT)
Losing our Tail -- Again: On (Un)Natural Selection And Multilingual Large Language Models [0.9] 言語分布の尾は消えつつあるし、それらとともに、彼らが持っている物語やアイデンティティも消えつつある、と私は主張する。
これは言語的平坦化に抵抗し、NLPを多言語的・言語的多様性と創造性を表現的に促進し、価値を与え、保護する分野として再想像することである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:14:29 GMT)
UWarp: A Whole Slide Image Registration Pipeline to Characterize Scanner-Induced Local Domain Shift [0.9] 種々の条件下でスキャンされた組織学的スライドを整列させる新しい登録ツールであるUWarpをベースとしたドメインシフト解析フレームワークを提案する。
実験により、UWarpは既存のオープンソース登録方法より優れており、中央値のターゲット登録誤差(TRE)は4ピクセル未満であることが示された。
UWarpを用いて、乳がんの病態応答予測のための深層学習モデルであるBreaast-NEOprAIdictの予測において、スキャナによる局所ドメインシフトを特徴付ける。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:57:07 GMT)
Cryptogenic stroke and migraine: using probabilistic independence and machine learning to uncover latent sources of disease from the electronic health record [0.8] Migraineは暗号原性脳卒中(CS)の生存リスクを2倍にする
本研究では, 片頭痛患者に対するCSの10年間のリスク予測モデルを構築し, 確率的に非依存な情報源を電子健康記録データから抽出するためのデータ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:12:12 GMT)
Time Makes Space: Emergence of Place Fields in Networks Encoding Temporally Continuous Sensory Experiences [0.7] 時間的に連続した感覚エピソードを記憶するために訓練されたネットワークに位置細胞が出現することを示す。
プレースフィールドは海馬現象学の重要な側面を再現する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:03:11 GMT)
The Software Landscape for the Density Matrix Renormalization Group [0.7] 密度行列再正規化群 (DMRG) アルゴリズムは、量子多体系を研究するための基礎計算法である。
材料科学、量子化学、量子コンピューティングなどの分野に適用可能であるにもかかわらず、多くの独立した実装が開発されている。
このサーベイは急速に拡大するDMRGソフトウェアの世界をマッピングし、35の既存パッケージの機能を包括的に比較した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:10:15 GMT)
Variational Quantum Simulations of a Two-Dimensional Frustrated Transverse-Field Ising Model on a Trapped-Ion Quantum Computer [0.7] 変分量子固有解法(VQE)を用いて、16のサイト(量子ビット)に対して周期的境界条件を持つ正方格子上の位相を計算する。
我々は、VQEが支配的な磁気相を見つけるのに成功する、このモデルの基底状態相転移に注目した。
実験により, フラストレーションモデルの磁気位相は, 基底状態エネルギー, エネルギー微分, スピン相関関数によってほぼ完全に回復することがわかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:28:49 GMT)
PotentRegion4MalDetect: Advanced Features from Potential Malicious Regions for Malware Detection [0.7] マルウェア開発者は、ほとんどの検出モデルが機能抽出のためにバイナリ全体に焦点を当てているという事実を利用する。
本稿では,潜在的な悪意のある領域から特徴を抽出するPotentRegion4MalDetectという新しいモデルを提案する。
99%以上の精度、精度、リコール、AUC、F1スコア、0.064%のFPRを生成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:32:17 GMT)
Attentions Under the Microscope: A Comparative Study of Resource Utilization for Variants of Self-Attention [0.2] GPT-2アーキテクチャのトレーニングにおいて,トレーニング時間,GPUメモリ使用量,FLOPS,CPU使用量,消費電力など,8つの注意機構をベンチマークした。
その結果、最適化されたカーネル実装による注意機構、例えばFlash Attentionは、最高のエネルギー効率を実現していることがわかった。
本研究は、アテンションデザインにおけるエネルギー認識ベンチマークの重要性を強調し、資源効率のメカニズムを選択するための実践的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:37:23 GMT)
The Dark Side of LLMs Agent-based Attacks for Complete Computer Takeover [0.2] 本稿では,Large Language Model (LLM) エージェントを攻撃ベクトルとして包括的に評価する。
敵は3つの異なる攻撃面(ダイレクト・プロンプト・インジェクション、RAGバックドア・アタック、エージェント間信頼利用)を利用できることを示す。
その結果,全攻撃ベクトルに対する耐性は5.9%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:54:58 GMT)
KAConvText: Novel Approach to Burmese Sentence Classification using Kolmogorov-Arnold Convolution [0.2] 本稿では,Kolmogorov-Arnold Convolution for Text(KAConvText)の文分類への応用について述べる。
静的な設定と微調整された設定の両方において、ランダムと高速テキストの埋め込みを比較して、様々な埋め込み構成について検討する。
その結果、KAConvText-MLPは、ヘイトスピーチ検出に9123%の精度(F1-score = 0.9109)、ニュース分類に92.66%の精度(F1-score = 0.9267)、言語識別に99.82%の精度(F1-score = 0.9982)を達成した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:25:35 GMT)
CLI-RAG: A Retrieval-Augmented Framework for Clinically Structured and Context Aware Text Generation with LLMs [0.2] CLI-RAG (Clinically Informed Retrieval-Augmented Generation) は、構造的および臨床的な基盤となるテキスト生成のためのドメイン固有のフレームワークである。
臨床文書構造を尊重する新しい階層的チャンキング戦略を取り入れ、タスク固有の2段階検索機構を導入する。
本システムを用いて,MIMIC-IIIデータセットから15種類の臨床ノートを作成した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:13:38 GMT)
stCEG: An R Package for Modelling Events over Spatial Areas Using Chain Event Graphs [0.0] stCEGはRパッケージで、ユーザーはデータからチェインイベントグラフ(CEG)モデルを完全に指定できる。
これには、ユーザーがモデルに含めたい空間変数を視覚化する機能が含まれている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:36:37 GMT)
Winning and losing with Artificial Intelligence: What public discourse about ChatGPT tells us about how societies make sense of technological change [0.0] 我々は、AIに関する公的な認識は、関係する人々の経済的関心と文化的価値によって形成されていることを示す。
われわれは2022年にChatGPTが一般公開されたことを受けて、117カ国の1.6億人のユーザーが投稿した380万のツイートを分析した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:15:12 GMT)
What to Keep and What to Drop: Adaptive Table Filtering Framework [0.0] ATFは、列記述、クラスタリング、スパースセンスアライメントスコアを使用して、非形式的な列と行をプルーする。
実験によると、ATFはテーブルセルを70%削減し、ドメイン外のTableQAタスクのパフォーマンスを向上する。
結果は、タスク間で情報性と最小主義を適応的にバランスさせるATFの能力を強調している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:10:56 GMT)
Very fast Bayesian Additive Regression Trees on GPU [0.0] 単一のCPUコアと比較して最大200倍高速なGPU対応のBARTを実装し、XGBoostで実行時にBARTと競合する。
この実装はPythonパッケージのbartzで利用できる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:54:23 GMT)
Variational quantum algorithms with exact geodesic transport [0.0] 変分量子アルゴリズム(VQA)は、量子コンピュータの短期的応用に期待できる候補である。
本稿では,変分量子回路の解析的リーマン最適化を可能にする曲率対応フレームワークVQAを紹介する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:30:36 GMT)
Two-point functions and the vacuum densities in the Casimir effect for the Proca field [0.0] D+1)次元ミンコフスキー時空の背景における2つの平行板の幾何学におけるプロカ場に対する真空状態の性質について検討する。
完全導体(PMC)と完全導体(PEC)の境界条件の高次元一般化に対して,ベクトルポテンシャルと磁場テンソルの2点関数を評価した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:23:50 GMT)
Tuning the probability detection of OAM entangled photons in Helical Ince-Gauss modes [0.0] モードの楕円性パラメータを用いて光子対の確率検出を行う方法を示す。
各HIG対称ベル状態の確率を個別に最大化することは、射影基底の楕円性を調整することで可能である。
観測された特性は,SPDC2光子状態のHIG変調継手確率の測定とベル型不等式違反実験により実験的に確認された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:04:00 GMT)
True and apparent motion of optomechanical resonators, with applications to feedback cooling of gravitational wave detector test masses [0.0] 我々は、真のテスト質量運動の説明を提供するために、2光子形式の中で作業する。
この定式化を、現在および将来の重力波干渉計における減衰実験のフィードバックに適用する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:29:11 GMT)
Transforming graph states via Bell state measurements [0.0] グラフ状態は測定ベースの量子コンピューティングの鍵となるリソースである。
あらゆる種類の回転型II核融合に対してグラフ変換を導出し、5つの異なる融合成功事例が存在することを示す。
導出したグラフ変換規則の応用例を示し、それらがグラフコードの構築や融合ネットワークのシミュレートに利用できることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:48:18 GMT)
Towards relativistic generalization of collapse models [0.0] 自発的崩壊モデルは、量子測定問題に対する可能な、テスト可能な解決策を提供する。
これまでの試みでは、微小な因果関係の違反など、さまざまな障害を解消してきた。
ノイズ相関関数の特定の選択も導入し、議論する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:37:20 GMT)
Towards Robust Surrogate Models: Benchmarking Machine Learning Approaches to Expediting Phase Field Simulations of Brittle Fracture [0.0] フラクチャーモデリングのためのML手法のベンチマークと進歩を目的としたPFMシミュレーションに基づくデータセットを提案する。
このデータセットには3つのエネルギー分解方法、2つの境界条件、合計6,000のシミュレーションのための1000のランダムな初期き裂構成が含まれている。
本研究は, フラクチャーメカニクス研究における機械学習の進歩のためのテストベッドとして, このデータセットの有用性を実証するものである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:14:56 GMT)
Towards Evaluating Robustness of Prompt Adherence in Text to Image Models [0.0] 本稿では,テキスト・ツー・イメージ・モデルのための総合的な評価枠組みを確立することを目的とする。
我々は,入力テキストプロンプトの変動要因に応じた画像を生成する際に,これらのモデルのロバスト性を評価することを目的とした,新しいデータセットを構築した。
その結果、これらのモデルでは、単純な幾何学的形状と位置の2つの要素だけで、単純なバイナリ画像を作成するのに苦労していることが判明した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:40:17 GMT)
Torsion in Persistent Homology and Neural Networks [0.0] 我々は、符号化中にねじれが失われ、潜伏空間で変化し、多くの場合、標準デコーダによって再構成されないことを示す。
本研究は, フィールドベースアプローチの重要な限界を明らかにし, ねじれ情報を保存するアーキテクチャや損失項の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:38:34 GMT)
Time Series Foundation Models for Multivariate Financial Time Series Forecasting [0.0] Time Series Foundation Models (TSFMs) は、様々な時系列コーパスの事前トレーニングを通じて、有望なソリューションを提供する。
本研究は、米国10年債利回りの変化、EUR/USDのボラティリティ、株式拡散予測の3つの財務予測タスクにまたがる2つのTSFMを評価する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:43:06 GMT)
Thermodynamic Prediction Enabled by Automatic Dataset Building and Machine Learning [0.0] 化学と材料科学の新しい発見は、機械学習(ML)が研究効率を加速する上で重要な役割を果たす機会を提供する。
本稿では,(1)自動文献レビューにおける大規模言語モデル(LLM)の利用,(2)化学知識(熱力学パラメータ)を予測するためのMLモデルの訓練について述べる。
この研究は、化学と材料科学の研究を再形成するための統合MLアプローチの変革の可能性を強調している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:33:25 GMT)
Thermalization and hydrodynamic long-time tails in a Floquet system [0.0] 古典的流体力学場理論が多粒子量子系の長時間力学を予測できるかどうかを考察する。
場の理論的解析と対称性の議論に基づいて、スピンモデルの各作用素を流体力学の対応する場にマッピングする。
これらの発見は、隣接する4つの場所で定義できる255個のエルミート作用素の時間発展を研究することによって説明される。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:48:37 GMT)
The quantum Mpemba effect in long-range spin systems [0.0] 量子Mpemba効果(QME)の現れの1つは、傾いた強磁性体が量子クエンチの後にスピン回転対称性の高速な復元を示すことである。
磁化の量子揺らぎは、初期強磁性秩序を溶かして対称性の回復を駆動し、QMEに責任を持つことを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:06:37 GMT)
The effect of partial post-selection on quantum discrimination [0.0] 偏差測定による先行状態工学は, 平均判別性能を向上しないことを示す。
また、条件付き判別が元の最適測定値よりも厳密に低い誤差確率を達成できる特定の選択後の結果も同定する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:44:56 GMT)
The cost of ensembling: is it always worth combining? [0.0] 予測精度と計算コストのトレードオフが極めて関連するトピックとして浮上している。
2つの大規模小売データセットにまたがる10のベースモデルと8つのアンサンブル構成を評価した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:32:09 GMT)
The Quantum Wave Function as a Complex Probability Distribution [0.0] 波動関数とその複素共役は複素確率分布と解釈できることを示す。
量子論におけるプロセスの考え方を受け入れることは、大きな物体に古典的な振る舞いが現れる理由を説明するかもしれないことが示唆されている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:19:11 GMT)
The Flaws of Others: An LLM-driven Framework for Scientific Knowledge Production [0.0] 無効化は、真実からの漂流、自己修復、新鮮な製法、外的検出の4つの危険性を示す。
ドリフトと自己修復のみに支配されるネットワークは、緩やかなエラー率で安定化する。
我々はオープンソースのemphFlaws-of-Others(FOO)アルゴリズムでピアレビューを運用する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:39:56 GMT)
The AI Shadow War: SaaS vs. Edge Computing Architectures [0.0] 最近のブレークスルーは、エッジAIがパフォーマンス上のクラウドシステムに挑戦していることを示している。
エッジAIは1万倍の効率性を持つ。
エッジAI市場は2025年の90億ドルから2030年には496億ドルへと爆発的な成長を予想している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:27:20 GMT)
Text to model via SysML: Automated generation of dynamical system computational models from unstructured natural language text via enhanced System Modeling Language diagrams [0.0] 本稿では,ドメイン知識とエキスパート知識を活用する戦略を提案することによって,エンジニアリング力学系の設計と展開の高速化に寄与する。
システムモデリング言語図(SysML)を使用して、コンポーネントの依存関係、属性、操作に関する正確な情報を抽出する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:44:49 GMT)
TRIP: A Nonparametric Test to Diagnose Biased Feature Importance Scores [0.0] TRIPは最小限の仮定を必要とするテストであり、信頼性の低い置換特徴の重要度を検出することができる。
この結果から, 置換特性の重要度が信頼できない場合に, 確実に検出できることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:49:10 GMT)
Surrogate Model for Heat Transfer Prediction in Impinging Jet Arrays using Dynamic Inlet/Outlet and Flow Rate Control [0.0] 本研究では, 密閉衝突噴流アレイにおけるヌッセルト数分布の予測を目的とした代理モデルを提案する。
我々は,Nusselt分布をリアルタイムで予測できるCNNベースの代理モデルを生成する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:03:54 GMT)
Strategic Alignment Patterns in National AI Policies [0.0] 本稿では,国家人工知能政策における戦略的整合性を評価するための新しい視覚マッピング手法を提案する。
行列に基づく可視化とネットワーク分析を組み合わせた15~20の全国的AI戦略を分析し,アライメントとアライメントのパターンを同定する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:26:35 GMT)
States Violating Both Locality and Noncontextuality Inequalities in Quantum Theory [0.0] CHSHの不等式は、量子論における局所性をテストするために用いられる。
KCBSの不等式は、量子論における非文脈性をテストするために用いられる。
特定の量子状態は、これらの不等式を個々に違反することが知られている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:01:47 GMT)
Speech Tokenizer is Key to Consistent Representation [0.0] 音声のトークン化はデジタル音声処理において重要であり、連続した音声信号を様々な計算タスクのための離散単位に変換する。
本稿では,言語情報と音響情報の両方を同時に符号化し,韻律的・感情的な内容を保存する高度アプローチを提案する。
経験的評価は、追加の訓練を必要とせず、音声符号化、音声変換、感情認識、多モーダル言語モデリングにおいてその効果を示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:43:39 GMT)
Speak2Sign3D: A Multi-modal Pipeline for English Speech to American Sign Language Animation [0.0] 我々は、英語の音声をスムーズでリアルな3D手話アニメーションに変換する完全なパイプラインを導入する。
私たちのシステムはWhisperから始まり、話し言葉をテキストに翻訳します。
そして、MarianMT機械翻訳モデルを用いて、そのテキストをAmerican Sign Language(ASL)用語に翻訳する。
我々はSign3D-WLASLで学習した3Dキーポイントベースのモーションシステムを用いて,翻訳した光沢をアニメーション化する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:13:49 GMT)
Smart IoT Security: Lightweight Machine Learning Techniques for Multi-Class Attack Detection in IoT Networks [0.0] IoT(Internet of Things)は急速に拡大しており、さまざまなサイバー脅威を緩和するためのセキュアなネットワークを持つことが重要になっている。
本研究は、IoTデバイスのマルチクラス攻撃検出の限界に対処し、新しい機械学習ベースの軽量アンサンブル手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:02:16 GMT)
Robust Deep Network Learning of Nonlinear Regression Tasks by Parametric Leaky Exponential Linear Units (LELUs) and a Diffusion Metric [0.0] 非線形データセットの学習には 非線形acfが必須です
ELUやSiLUのようなスムースだが、徐々に変化するアクセルは、性能が限られている。
RELUやLeaky-RELUのような非滑らかなAc.f.は、訓練されたモデルに不連続を付与する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:49:15 GMT)
Relativistic electrodynamics with a universal length scale [0.0] 我々は空間的に4階のクライン=ゴルドン方程式からディラック方程式とパウリ方程式の類似式を導出する。
我々は、Stern-Gerlach実験において、電子ビームの分裂線から理論を実験的に検証する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:15:01 GMT)
Quantum-selected configuration interaction with time-evolved state [0.0] 量子選択構成相互作用(QSCI)は、量子デバイス上の入力量子状態を使用して重要な基底を選択する。
QSCIの入力として,ターゲットハミルトニアンによる時間進化状態を提案する。
提案法により得られた量子化学ハミルトニアンのエネルギーの精度を数値的に検討する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:45:56 GMT)
Quantum theory of nonlinear electromagnetic response [0.0] 松原グリーン関数を用いた非線形電磁応答のシステマティック量子論を提案する。
非線形ホール効果と磁気非線形ホール効果を導出した2次応答に本理論を適用した。
我々の研究は、非線形電磁応答の統一量子理論を示し、新しい現象のさらなる探索の道を開く。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:32:35 GMT)
Quantum simulation of scattering amplitudes and interferences in perturbative QCD [0.0] 量子クロモダイナミックス(QCD)におけるファインマン図とその干渉の計算に量子コンピュータをどのように利用できるかを示す。
我々は、量子コンピュータ上での相互作用の色部分をシミュレートし、キネマティックな部分は、現在、古典的にプリコンパイルされている。
外部粒子のいくつかが同一であるプロセスでは、潜在的な量子優位性の最初のヒントが見つかる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 18:10:25 GMT)
Quantum algorithm for edge detection in digital grayscale images [0.0] 本稿では,デジタルグレースケール画像におけるエッジ検出のための新しい量子アルゴリズムを提案する。
提案手法は,逐次順序付きWalsh-Hadamard変換の量子アルゴリズムを用いて,エッジ検出のための既存の量子技術を大幅に改善する。
エッジ検出に対する我々のアプローチは、N_1times Nのサイズの画像に対して$mathcalO(log_2(N_1N_2)$の計算コスト(ゲート複雑性と量子回路深さの両方)を持つ。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:14:37 GMT)
Quantum Simulation and Optimization of Water Distribution Networks [0.0] 量子コンピューティングアルゴリズムをNewton-Raphson Global Gradient Algorithm(NR-GGA)のサブルーチンとして用いる可能性について検討する。
NR-GGAを改善するために3種類の異なる量子サブルーチンが使用された。
また、量子アニーリングに基づく高階線形回路のシミュレーションを行い、小さな3ノードネットワークのLast-Cost Design(LCD)を決定する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:02:16 GMT)
Pun Intended: Multi-Agent Translation of Wordplay with Contrastive Learning and Phonetic-Semantic Embeddings [0.0] 本研究では,現在最先端の大規模言語モデルとワードプレイ生成のための特化技術を組み合わせることで,句を英語からフランス語に翻訳する新しい手法を提案する。
我々の方法論の主な目的は、単に語彙を重複させるのではなく、原文の語句の言語的創造性とユーモアを捉えることである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:09:14 GMT)
Probing entanglement of a continuous basis system [0.0] 本稿では,理論上は到達不能な量子系における絡み合いを離散的あるいは連続的に探究する手法を提案する。
提案手法は,四部量子系における絡み合い分布の知見を利用する。
本研究は, サブシステム間の絡み合いの再分配において, 維持的流動様挙動が興味深いことを示し, 純粋な複合量子系において絡み合いが保守的な性質を示す可能性が示唆された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:17:57 GMT)
Probing and Steering Evaluation Awareness of Language Models [0.0] 言語モデルは、テストとデプロイメントフェーズを区別することができる。
これは大きな安全性と政策上の意味を持つ。
線形プローブは実世界の評価と展開のプロンプトを分離できることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:46:58 GMT)
Prevention of Overfitting on Mesh-Structured Data Regressions with a Modified Laplace Operator [0.0] 本報告では,メッシュ型データ構造に適用した,データ回帰に対する過度な適合の検出と防止方法について報告する。
メッシュ構造は、雑音のないデータに対して有限差分方式でラプラス演算子二階微分の直接計算を可能にする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:57:52 GMT)
Preliminary Analysis of Construction Work Zone on Roadways in Florida by Crash Severity [0.0] フロリダ州では、特に都市部では、道路建設作業地区の死者と重傷が重要な問題となっている。
2019年から2023年までの分析では、フロリダ州の労働地帯で毎年71人が死亡し、309人が重傷を負っている。
リスクの高い郡としてはオレンジ郡、ブロワード郡、デュバル郡、ヒルズボロ郡、パスコ郡、マイアミ・デイド郡、セミノール郡、マナティー郡、パームビーチ郡、レイク郡がある。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:52:28 GMT)
Plane-selective manipulations of nuclear spin qubits in a three-dimensional optical tweezer array [0.0] 光ツイーザーアレイの3次元構造は、中性原子プロセッサをスケールアップする可能性がある。
量子誤差補正に不可欠なコヒーレント局所演算は、このプラットフォームではまだ検討されていない。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:00:13 GMT)
On the difference between thermalization in open and isolated quantum systems: a case study [0.0] 分離された (IQS) と開 (OQS) の熱化へのアプローチはいまだに不透明である。
ここでは、2つのパラダイムの根本的な違いは、長い時間と熱力学の限界が取られる順序であることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:12:13 GMT)
On the commutator scaling in Hamiltonian simulation with multi-product formulas [0.0] 本稿では,MPFの別のコンピュテータスケーリング誤差を示し,Trotterizationの利点を適切に継承するサイズ効率のコストを導出する。
我々は,MPFによるハミルトンシミュレーションが,システムサイズ依存がトロッタライゼーションに匹敵するコストを確実に達成できることを証明した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 05:25:06 GMT)
Noise tolerance via reinforcement: Learning a reinforced quantum dynamics [0.0] 強化は学習と最適化アルゴリズムの効率を高めるための強力な戦略として登場した。
強化量子力学は雑音環境との相互作用に対して顕著な堅牢性を示すことを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:01:12 GMT)
No physics required! A visual-based introduction to GKP qubits for computer scientists [0.0] 連続変数系に基づく量子誤り訂正の枠組みについて検討する。
本稿では,有名なGottesman-Kitaev-Preskill(GKP)コードを対象とした,自己完結型学習セッションの構築に関するガイドを提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:26:15 GMT)
Multiplexed Control at Scale for Electrode Arrays in Trapped-Ion Quantum Processors [0.0] 1万個のトラップ電極を持つトラップイオン量子コンピュータは、13個のフィールドプログラマブルゲートアレイと104個の高速DACで制御できる。
これは従来の制御法で必要とされる1万の専用DACとは対照的である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:09:16 GMT)
Measurement-Induced Entanglement Phase Transition in Free Fermion Systems [0.0] 測定誘起絡み合い相転移(MIET)は、局所的な測定が量子システムをいかに駆動するかを示す。
本総説では, 単体ホッピングが測定による非ユニタリ性とどのように競合するかに着目し, 自由フェルミオンモデルにおけるMIETについて検討する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 06:39:31 GMT)
Mass-Assisted Local Deconfinement in a Confined $\mathbb{Z}_2$ Lattice Gauge Theory [0.0] 凝縮は凝縮物や高エネルギー物理学において顕著な現象である。
我々は、フェルミオン質量と電場強度の共鳴に近接して、$mathbbZ$ LGTの閉じ込めが局所的に避けられることを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:30:39 GMT)
Machine-Learned Force Fields for Lattice Dynamics at Coupled-Cluster Level Accuracy [0.0] 機械学習力場(MLFF)を近似汎関数理論(DFT)と結合クラスタ(CC)レベルのポテンシャルエネルギー面で訓練する。
DFTと比較すると、CC理論で訓練されたMLFFは光モードに対して高い振動周波数をもたらし、実験によく一致する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 15:11:55 GMT)
Lost in Retraining: Roaming the Parameter Space of Exponential Families Under Closed-Loop Learning [0.0] 指数族に属するモデルに対する閉ループ学習について検討する。
パラメータの最大確率は、マーチンゲール特性に十分な統計量を与えることを示す。
この結果が,地上の真理モデルから生成された少なくとも1つのデータポイントを含む場合,この結果が防止されることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:24:09 GMT)
Generative Lagrangian data assimilation for ocean dynamics under extreme sparsity [0.0] 観測データから海洋力学を再構築することは、空間サンプリングのスパース、不規則、ラグランジアンの性質によって根本的に制限される。
ニューラル演算子と拡散確率モデル(DDPM)を組み合わせて高分解能海洋状態の再構成を行う深層学習フレームワークを利用する。
本手法をベンチマークシステム, 合成フロート観測, 実衛星データで検証し, 厳密な空間サンプリング制限下での頑健な性能を実証した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 01:56:25 GMT)
GMLM: Bridging Graph Neural Networks and Language Models for Heterophilic Node Classification [0.0] グラフ構造とテキスト意味論の効率的かつ効果的な融合を目的としたフレームワークを提案する。
5つのヘテロ親和性ベンチマークの実験は、GMLMが最先端の結果を達成していることを示している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 03:08:21 GMT)
Fuzzy Classification Aggregation for a Continuum of Agents [0.0] 我々は、$mge 3$オブジェクトから$2le ple m$タイプへの個々の分類の連続体の最適で独立でゼロなファジィ分類集約関数が重み付き算術平均でなければならないことを証明した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:41:46 GMT)
From large-eddy simulations to deep learning: A U-net model for fast urban canopy flow predictions [0.0] 本研究では,都市風況の高速かつ正確な予測のためのディープニューラルネットワーク(DNN)手法を提案する。
LESデータに基づいて訓練されたU-Netアーキテクチャを用い、7方向の合成都市構成を252個採用する。
50のテストケースのモデル評価では、全体の平均相対誤差が9.3%、乱流強度が5.2%である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:25:13 GMT)
From Rattle to Roar: Optimizer Showdown for MambaStock on S&P 500 [0.0] MambaStockモデルを用いて,S&P 500指数のリターン予測タスクにおける複数項目の性能評価を行った。
広く使われているアルゴリズムの中では、アダプティブレート(例えばAdamとRMSProp)が最も低いテストエラーをもたらす。
対照的に、Lionは特に高速なトレーニングを提供している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:51:24 GMT)
Fredholm Neural Networks for forward and inverse problems in elliptic PDEs [0.0] 我々は、線形および半線形楕円偏微分方程式の前方および逆問題に取り組むためにフレームワークを拡張した。
提案手法は、固定点反復の反復過程を表現するために設計されたディープニューラルネットワーク(DNN)で構成されている。
提案手法は, 精度と説明可能性の両立を保証し, 領域内における誤差を小さくし, 境界上での機械的精度に近いことを実証する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 13:12:54 GMT)
Formalization of the AADL Run-Time Services with Time [0.0] アーキテクチャ・アナリティクス・アンド・デザイン・ランゲージ(英: Architecture Analysis & Design Language、AADL)は、ソフトウェアによって制御される機械を設計するためのアーキテクチャ記述言語である。
AADL標準であるSAE International AS5506Dは、標準によって定義されたセマンティクスに従ってAADLモデルを実行するための実行時サービス(RTS)を記述する。
本稿では,この形式化をクリプキ構造によって定義されたモーダル論理を用いて拡張・単純化し,時間を含むことを明示する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:17:42 GMT)
Finite Sample Analysis of Distribution-Free Confidence Ellipsoids for Linear Regression [0.0] 最小二乗(LS)推定は線形回帰問題の定型解である。
本稿では,非漸近的に保証された信頼楕円体を構築することができる分布自由符号置換和(SPS)楕円体外近似(EOA)アルゴリズムについて検討する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:03:33 GMT)
Finetuning Vision-Language Models as OCR Systems for Low-Resource Languages: A Case Study of Manchu [0.0] 危険に晒された言語である満州には、現実世界の歴史的文書を扱うことができる効果的なOCRシステムがない。
本研究では,3つのオープンソースビジョン言語モデルを微調整し,高性能なOCRシステムを構築する。
LLaMA-3.2-11Bは98.3%の単語精度と0.0024文字誤り率で優れた性能を達成した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:38:20 GMT)
Field theory for monitored Brownian SYK clusters [0.0] ブラウン・サハデフ・イェ・キタエフ系の複数のクラスターの時間的進化を考察する。
我々は、高次対称性群に対するスピンコヒーレント状態の一般化により、ダイナミクスのコヒーレント状態経路積分を構築する。
定常状態においては,2つの監視されたクラスターが線形-in-Nの絡み合いを示し,その比例係数は単位結合の強さに依存することを示した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:42:34 GMT)
Federated Learning Inspired Fuzzy Systems: Decentralized Rule Updating for Privacy and Scalable Decision Making [0.0] ファジィシステムは、機械、システム、フレームワークが不確実性に対処できるようにする方法である。
機械学習とフェデレーション学習はファジィシステムを改善するために使用できる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:34:24 GMT)
Failure of the conformal-map method for relativistic quantum billiards [0.0] 1984年にロブニクによって導入された非相対論的量子ビリヤードに対する共形写像法は、相対論的ニュートリノビリヤードの量子化には適用できないことを示した。
この結果は、パラメータに依存する非相対論的および相対論的量子ビリヤードの数値結果と相関する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 11:11:40 GMT)
Extrapolation of quantum measurement data [0.0] 我々は、過去のノイズの多い期待値を考えると、量子オブザーバブルの集合の将来の期待値を予測する問題を考える。
将来、$tau$で完全な予測可能性を可能にする非常に問題の多いデータセットが見つかるが、過去の平均値が$tau$で超精密な精度で知られている場合に限られる。
我々は、非関連測定の将来の統計の予測可能性を大幅に向上させる「aha! データセット」を識別する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:49:13 GMT)
Expediting data extraction using a large language model (LLM) and scoping review protocol: a methodological study within a complex scoping review [0.0] レビューのデータ抽出段階はリソース集約である。
研究者たちは、オンライン(大規模言語モデル)のLLMとレビュープロトコルを使用して、データ抽出をエキサイティングにする方法を模索するかもしれない。
複雑なスコープレビュー、オープンレスポンスタイプ、方法論的なアプローチのコンテキストは、欠落したデータや不正なデータによってパフォーマンスに影響を与えました。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:50:55 GMT)
Exact Evaluation of the Accuracy of Diffusion Models for Inverse Problems with Gaussian Data Distributions [0.0] ガウスデータ分布に適用した場合の拡散モデルの精度について検討する。
この制約付き文脈内では、逆問題の理論解と拡散モデルを用いて得られた解との相違を正確に解析することができる。
文献と異なるアルゴリズムの比較が可能である。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:36:51 GMT)
Evidence for Exceptional Points as Topological Defects [0.0] 任意の量子状態が閉じたパラメータループに沿って輸送されるとき、どのように進化するかを検討する。
以上の結果から,非自明なホロノミーは例外的な点が存在する場合に現れることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:54:11 GMT)
Energy-Efficient Supervised Learning with a Binary Stochastic Forward-Forward Algorithm [0.0] 我々は二進数単位に対する前方アルゴリズムを導出する。
提案アルゴリズムを,MNIST,Fashion-MNIST,CIFAR-10データセット上で評価した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 00:29:06 GMT)
Elite Polarization in European Parliamentary Speeches: a Novel Measurement Approach Using Large Language Models [0.0] 本研究は,人工知能を用いたアクターと対象検出による極性偏極の新しい尺度を提案する。
政治家が議会演説でお互いについて言及し、誰が話し、誰に話しかけているかを記入し、これらの評価の背景にある情緒的温度を評価する。
これにより、エリートはそれぞれのアウトパーティを評価し、お互いの対極性、すなわちエリート偏極の指標を作成することができます。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 08:44:29 GMT)
Detection of 2D SPT Order with Partial Symmetries [0.0] 2次元対称性保護位相を識別するために部分対称性を用いる手法を提案する。
この構造は格子の回転対称性を利用して、オンサイトSPT不変量を抽出する。
その堅牢性は、部分対称性をレンズ空間の位相的分割関数を生成するものとして解釈することで示唆される。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 04:41:53 GMT)
Designing Adaptive Algorithms Based on Reinforcement Learning for Dynamic Optimization of Sliding Window Size in Multi-Dimensional Data Streams [0.0] 本稿では,多次元データストリームのスライディングウィンドウサイズを動的に最適化するRLに基づく新しい手法を提案する。
非定常性と高次元性を扱うために、Dueling Deep Q-Network (DQN) を優先的に体験再生する。
我々の手法であるRL-WindowはADWINやCNN-Adaptiveのような最先端の手法よりも、分類精度、ドリフトロバスト性、計算効率が優れている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:40:35 GMT)
Design and Implementation of an OCR-Powered Pipeline for Table Extraction from Invoices [0.0] 本稿では,請求書からの効率的なテーブル抽出のためのOCRパイプラインの設計と開発について述べる。
このシステムは、テキスト認識とカスタム後処理ロジックにTesseract OCRを利用している。
我々のアプローチには、動的前処理、テーブル境界検出、およびノイズや非標準の請求書フォーマットに最適化された行列マッピングが含まれる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:59:00 GMT)
Deep Brain Net: An Optimized Deep Learning Model for Brain tumor Detection in MRI Images Using EfficientNetB0 and ResNet50 with Transfer Learning [0.0] 本稿では,脳腫瘍検出性能の最適化を目的とした新しい深層学習システムであるDeep Brain Netを提案する。
このモデルは、EfficientNetB0とResNet50の2つの高度なニューラルネットワークアーキテクチャの長所を統合する。
公開されているMRIデータセットで実施された大規模な実験により、Deep Brain Netは、分類精度、精度、リコール、計算効率の点で、最先端の手法の既存の状態を一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 16:42:26 GMT)
Contextuality of the probability current in quantum mechanics [0.0] 我々は、局所現実理論に関するハーディ・サイトハーディ-1(英語版)によって提案された議論を再考する。
構成空間における確率流体の運動のフラックス線の驚くべき特性を強調した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:50:48 GMT)
Civil Society in the Loop: Feedback-Driven Adaptation of (L)LM-Assisted Classification in an Open-Source Telegram Monitoring Tool [0.0] AIツールは、有害なコンテンツを大規模に検出し、監視するのに役立つ。
AIモデルとソーシャルメディア監視インフラストラクチャをシームレスに統合するオープンソースツールはほとんどない。
この研究は、Telegram上での反民主運動のAI支援オープンソースの監視ツールにCSOが有意義に関わり得る方法を探る。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:46:58 GMT)
Challenges learning from imbalanced data using tree-based models: Prevalence estimates systematically depend on hyperparameters and can be upwardly biased [0.0] 不均衡二項分類問題は、多くの研究分野において発生する。
モデルのトレーニングのための(より)バランスのとれたデータセットを作成するために、多数派のクラスをサブサンプルするのが一般的です。
このバイアスを説明する一つの方法は、多数派クラスのサンプリング率に基づいて、結果の予測結果を新しい値に解析的にマッピングすることである。
この方法で無作為林を校正することは、上向きに偏りのある有病率推定を含む、意図しない負の結果をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 19:32:05 GMT)
Bridging the Plausibility-Validity Gap by Fine-Tuning a Reasoning-Enhanced LLM for Chemical Synthesis and Discovery [0.0] 大規模言語モデルはしばしば科学的に妥当だが、実際は無効な情報を生成する。
本稿では, このギャップを埋める手法として, 専門的な科学アシスタントを開発する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 23:05:23 GMT)
Batch Normalization in Cytometry Data by kNN-Graph Preservation [0.0] Time-of-Flight(CyTOF)データによる高次元サイトメトリーにおけるバッチ効果は、比較分析の課題である。
従来のバッチ正規化法は、細胞集団に固有の複雑なトポロジカル構造を保存できない可能性がある。
本稿では,CyTOFデータのバッチ正規化に特化した,残差ニューラルネットワークを用いたポイントセット登録手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:41:42 GMT)
Autonomy by Design: Preserving Human Autonomy in AI Decision-Support [0.0] 我々は、AI意思決定支援システムがドメイン固有の自律性の2つの重要な構成要素にどのように影響するかを分析する。
我々は自律型AI支援システムの構築フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:55:27 GMT)
Asymmetric two-photon response of an incoherently driven quantum emitter [0.0] 量子エミッタは、レーザーパルスによって励起されると、高い確率で正確に1つの光子を放出することを約束する。
レーザーパルス中の再励起は、2つの光子の連続放出を引き起こすため、単一光子の純度は制限される。
ここでは,フォノン支援励起によるプロセスの質的差異を示す。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:44:41 GMT)
Approximating Euler Totient Function using Linear Regression on RSA moduli [0.0] RSA暗号システムのセキュリティは、大整数 n に対するオイラーのトジェント関数 phi(n) の計算の難しさに基づいている。
本研究では,線形回帰モデルを用いてオイラーのトジェント関数 phi を近似する機械学習手法について検討する。
予備的な結果は、phiが小さな相対誤差範囲内で近似可能であることを示唆しており、特定のRSA攻撃のクラスに役立つ可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 10:01:25 GMT)
Analytic toolkit for the Anderson model with arbitrary disorder [0.0] 1次元アンダーソンモデル(英: Anderson model in one dimension)は、近傍のホッピングとランダムなオンサイトポテンシャルを持つサイトの離散的な連鎖上の量子粒子である。
超対称性に基づく手法は、解が状態密度を制御する明示的な線形積分方程式を与えるために用いられる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:43:11 GMT)
An alternative explicit circuit diagram for the quantum search algorithm by implementing a non-unitary gate [0.0] グロバー探索アルゴリズムの最終量子状態はグラマーシュミット過程から正規化されたマーク付き量子状態であるため、非単位ゲートを用いてこのベクトルを生成することができる。
非ユニタリ行列の平方根とGram-Schmidt過程を模倣したユニタリ行列を用いて、複数の明示的なユニタリ実装を提案する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 07:32:37 GMT)
An AI Approach for Learning the Spectrum of the Laplace-Beltrami Operator [0.0] 本稿では,LB(Laplace-Beltrami)スペクトルを予測するためのディープラーニングフレームワークを提案する。
提案されたグラフニューラルネットワークアーキテクチャは、ガウス曲率、平均曲率、主曲率など、豊富な部分メッシュ機能を使用する。
実験の結果,LBスペクトルの計算時間を線形FEMの約5倍削減できることがわかった。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:31:18 GMT)
Almost Sure Convergence for the Last Iterate of Stochastic Gradient Descent Schemes [0.0] 定数運動量$beta in (0, 1)$(FFw_t) - F_* = O(tp-1)$ を目的に対してほぼ確実に証明する。
また、(0, 1)$(FFw_t) - F_* = O(tp-1)$ の運動量を持つ Slog が目的に対してほぼ確実に成り立つことを証明している。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 20:59:23 GMT)
AdeptHEQ-FL: Adaptive Homomorphic Encryption for Federated Learning of Hybrid Classical-Quantum Models with Dynamic Layer Sparing [0.0] フェデレートラーニング(FL)は、モデルパフォーマンス、プライバシ保護、通信効率のバランスをとる上で、固有の課題に直面します。
本稿では,CNN-PQCアーキテクチャを統合した分散古典量子FLフレームワークであるAdeptHEQ-FLを紹介する。
我々は、正式なプライバシー保証を確立し、収束分析を提供し、CIFAR-10、SVHN、Fashion-MNISTデータセットに関する広範な実験を行う。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 22:29:02 GMT)
A statistical approach to latent dynamic modeling with differential equations [0.0] 通常の微分方程式(ODE)は、プロセスの時間的局所的な変化の力学モデルを提供することができる。
本稿では,各観測結果を初期値として利用して,複数のローカルODEソリューションを得る方法を提案する。
脊髄性筋萎縮症に対するアプローチとそれに対応するシミュレーション研究について述べる。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 09:34:24 GMT)
A Survey on Event Prediction Methods from a Systems Perspective: Bringing Together Disparate Research Areas [0.0] 事象予測手法は過去の出来事の特徴と将来の出来事の関係を学習する。
新たに観測されたイベントに適用し、ユーザの希望する将来状態に対して評価される対応する将来のイベントを予測する。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 14:22:25 GMT)
A Robust, Open-Source Framework for Spiking Neural Networks on Low-End FPGAs [0.0] スパイキングニューラルネットワーク(SNN)は、ますます電力を消費するニューラルネットワークの潜在的な解決策として登場した。
本稿では、ロバストなSNNアクセラレーションアーキテクチャと、PytorchベースのSNNモデルコンパイラからなるフレームワークを提案する。
このアーキテクチャはローエンドFPGAをターゲットにしており、非常に少ない(6358 LUT、40.5 BRAM)リソースを必要とする。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 21:08:28 GMT)
A Novel Hybrid Deep Learning Technique for Speech Emotion Detection using Feature Engineering [0.0] 提案したDCRF-BiLSTMモデルは,中立,幸福,悲しみ,怒り,恐怖,嫌悪,驚きという7つの感情を認識するために用いられる。
このモデルは、RAVDESSの97.83%を含む個々のデータセットで高い精度を達成する。
組み合わせた(R+T+S)データセットでは、98.82%の精度を達成し、以前報告された結果を上回っている。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:07:45 GMT)
A Note on the Walsh Spectrum of Power Residue S-Boxes [0.0] そのようなS-ボックスはゼロ知識に優しいハッシュ関数 Grendel と Polocolo に対して提案されている。
我々はポロコロ S-ボックスの予想相関を証明した。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 12:57:15 GMT)
5C Prompt Contracts: A Minimalist, Creative-Friendly, Token-Efficient Design Framework for Individual and SME LLM Usage [0.0] 大きな言語モデル(LLM)は、ミッションクリティカルなアプリケーションにますます組み込まれています。
明示的で体系的なだけでなく、実用的で広くアクセス可能なほど最小限のフレームワークが求められている。
提案する5C Prompt Contractは,迅速な設計をフォールバックおよび出力最適化ディレクティブに蒸留するフレームワークである。
論文参考訳(メタデータ) (Wed, 09 Jul 2025 17:07:39 GMT)