Learning Linear Attention in Polynomial Time [127.1] 線形注意を持つ単層変圧器の学習性に関する最初の結果を提供する。
線形アテンションは RKHS で適切に定義された線形予測器とみなすことができる。
我々は,すべての経験的リスクが線形変換器と同等のトレーニングデータセットを効率的に識別する方法を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:38:57 GMT)
Heterogeneous Swarms: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems [119.7] モデルの役割と重みを協調的に最適化し,マルチLLMシステムを設計するアルゴリズムであるヘテロジニアス・スウォームを提案する。
実験により、異種群は12タスクの平均18.5%で15のロールベースおよび/またはウェイトベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:08:47 GMT)
LLMs as Sparse Retrievers:A Framework for First-Stage Product Search [103.7] プロダクト検索は、現代のeコマースプラットフォームにおいて重要な要素であり、毎日何十億ものユーザークエリがある。
スパース検索法は語彙ミスマッチの問題に悩まされ, 製品検索のシナリオにおいて, 最適以下の性能が向上する。
セマンティック分析の可能性により、大言語モデル(LLM)は語彙ミスマッチ問題を緩和するための有望な道を提供する。
本稿では,SParsE Retrievers として LLM を利用した製品検索フレームワーク PROSPER を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:48:27 GMT)
FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [97.3] FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:41:08 GMT)
Blackbox Model Provenance via Palimpsestic Membership Inference [96.7] Aliceはオープンウェイトな言語モデルをトレーニングし、BobはAliceのモデルのブラックボックスデリバティブを使ってテキストを生成します。
Alice氏は、Bob氏のデリバティブモデルをクエリするか、テキストのみからクエリすることで、Bob氏がモデルを使っていることを証明できますか?
我々は、Bobのモデルとテキストの相関と、Aliceのトレーニングランにおけるトレーニング例の順序を捉えるテスト統計を使用する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:30:39 GMT)
Towards Depth Foundation Model: Recent Trends in Vision-Based Depth Estimation [96.2] 深さ推定は3Dコンピュータビジョンの基本課題であり、3D再構成、自由視点レンダリング、ロボティクス、自律運転、AR/VR技術といった応用に不可欠である。
LiDARのようなハードウェアセンサーに依存する従来の方法は、しばしば高コスト、低解像度、環境感度によって制限され、現実のシナリオで適用性を制限する。
ビジョンベースの手法の最近の進歩は有望な代替手段を提供するが、低容量モデルアーキテクチャやドメイン固有の小規模データセットへの依存のため、一般化と安定性の課題に直面している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:33:45 GMT)
Information-Theoretic Decentralized Secure Aggregation with Collusion Resilience [95.3] 情報理論の観点から分散型セキュアアグリゲーション(DSA)の問題点を考察する。
DSAの最小到達可能な通信量と秘密鍵率を指定する最適レート領域を特徴付ける。
本研究は,DSAの基本性能限界を確立し,信頼性の高い通信効率の高いプロトコルの設計に関する知見を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:17:50 GMT)
EgoBlind: Towards Egocentric Visual Assistance for the Blind [94.5] EgoBlindは、視覚障害者から収集された最初のエゴセントリックなビデオQAデータセットである。
視覚障害者と視覚障害者の日常生活の1,392人の初対人ビデオで構成されている。
また、視覚補助のために、視覚障害者が直接提示または検証した5,311の質問も入っている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:38:37 GMT)
Horizon Reduction Makes RL Scalable [92.7] オフライン強化学習(RL)アルゴリズムのスケーラビリティについて検討する。
通常のオフラインRLデータセットの最大1000倍のデータセットを使用します。
オフラインRLのスケール不足の主な原因は地平線にあることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:46:36 GMT)
Understanding the Implicit Biases of Design Choices for Time Series Foundation Models [90.9] 時系列基礎モデル(TSFM)は、時系列予測と関連する時間的タスクのための潜在的に強力で汎用的なツールのクラスである。
彼らの行動はデザインの微妙な帰納的バイアスによって強く形作られています。
モデルやデータの性質によって、これらのバイアスが直感的であるか、非常に直感的であるかを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:42:35 GMT)
Overlap-weighted orthogonal meta-learner for treatment effect estimation over time [90.5] ヘテロジニアス治療効果(HTE)を推定するための新しい重み付きメタラーナーを提案する。
我々のWO-Larnerは、ノイマン直交性(Neyman-orthogonality)の好ましい性質を持ち、ニュアンス関数の誤特定に対して堅牢である。
我々のWO-learnerは完全にモデルに依存しず、あらゆる機械学習モデルに適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:47:57 GMT)
PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [89.0] PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:38:08 GMT)
PruneHal: Reducing Hallucinations in Multi-modal Large Language Models through Adaptive KV Cache Pruning [87.4] 大型言語モデル(MLLM)における幻覚は、視覚トークンに割り当てられた注意不足と強く関連している。
我々は、適応的なKVキャッシュプルーニングを活用し、重要な視覚情報に焦点をあてるトレーニングフリーでシンプルで効果的な方法である textbfPruneHal を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:41:07 GMT)
Demystifying Domain-adaptive Post-training for Financial LLMs [87.3] FINDAPは、大規模言語モデルのドメイン適応後トレーニングに関する体系的できめ細かな研究である。
このアプローチは、FinCap、FinRec、FinTrain、FinEvalの4つの重要なコンポーネントで構成されています。
結果として得られるモデルであるLlama-Finは、幅広い財務タスクにわたる最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:01:08 GMT)
VLsI: Verbalized Layers-to-Interactions from Large to Small Vision Language Models [84.8] VLsI: Verbalized Layers-to-Interactions, a new VLM family in 2B and 7B model size。
GPT-4Vよりも優れた性能向上(2Bは11.0%、7Bは17.4%)を達成した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:28:21 GMT)
Unified Reinforcement and Imitation Learning for Vision-Language Models [84.8] VLM(Vision-Language Models)は目覚ましい進歩を遂げているが、その大規模化によって資源制約のある環境では実用的でないことがしばしばある。
本稿では、強力で軽量なVLMを作成するために設計された、新規で効率的なトレーニングアルゴリズムであるUnified Reinforcement and Imitation Learning (RIL)を紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:12:14 GMT)
The Photographer Eye: Teaching Multimodal Large Language Models to Understand Image Aesthetics like Photographers [83.0] 写真家でキュレーターのSzarkowskiは、一般的な視覚的理解と美的理解との間にある顕著なギャップの1つを洞察的に明らかにした。
プロの写真家と愛好家の間で広範囲にわたる議論から得られた新しいデータセットPhotoCritiqueを提示する。
また,複数の視点から画像美学を理解するために,言語誘導型多視点視覚融合機構を備えた新しいモデルPhotoEyeを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:55:21 GMT)
PoseCrafter: Extreme Pose Estimation with Hybrid Video Synthesis [82.9] わずかに重なる画像対からのカメラのポーズ推定は、3Dビジョンにおいて重要な課題であり、未解決の課題である。
近年,ビデオを用いて中間フレームを合成し,自己整合性スコアを用いて鍵フレームを選択する手法が提案されている。
ビデオモデルとポーズ条件付き新規ビューモデルとを結合することにより,より鮮明な中間フレームを合成するためのハイブリッドビデオ生成(HVG)を提案する。
また,合成結果からポーズ推定に適した中間フレームを選択するために,特徴対応に基づく特徴マッチングセレクタ(FMS)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:32:37 GMT)
WikiVideo: Article Generation from Multiple Videos [82.0] 実世界の出来事に関する複数のビデオからウィキペディア風の記事を作成する作業を紹介する。
このギャップを埋めるために、私たちはWikiVideoを紹介します。
複数のビデオから記事を作成するためのインタラクティブな手法である共同記事生成(CAG)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:17:16 GMT)
RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.4] 大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。
リスク概念空間を再構築する理論的枠組みを導入する。
マルチエージェント協調評価フレームワークRADARを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:09:59 GMT)
VaultGemma: A Differentially Private Gemma Model [80.4] Gemmaファミリー内の10億のパラメータモデルであるVaultGemma 1Bを導入し、差分プライバシーを十分に訓練した。
私たちはこのモデルをコミュニティに公開しています。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:11:16 GMT)
HAD: Hierarchical Asymmetric Distillation to Bridge Spatio-Temporal Gaps in Event-Based Object Tracking [80.1] イベントカメラは例外的な時間分解能と範囲(モード)を提供する
RGBカメラは高解像度でリッチテクスチャを捉えるのに優れていますが、イベントカメラは例外的な時間分解能とレンジ(モダル)を提供します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:15:13 GMT)
Long-term Causal Inference via Modeling Sequential Latent Confounding [79.2] 長期因果推論は、様々な科学的領域において重要な問題であるが難しい問題である。
本稿では, 条件付き付加的等価バイアス(CAECB)の仮定に基づくアプローチを提案する。
提案した仮定は、時間的短期的な結果にまたがる逐次的共起バイアス間の機能的関係を述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:40:19 GMT)
Brain3D: Generating 3D Objects from fMRI [78.5] 被験者のfMRIデータを入力として利用する新しい3Dオブジェクト表現学習手法であるBrain3Dを設計する。
我々は,人間の視覚系の各領域の異なる機能的特徴を,我々のモデルが捉えていることを示す。
予備評価は、Brain3Dがシミュレーションシナリオで障害した脳領域を正常に識別できることを示唆している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:27:52 GMT)
Text Generation Beyond Discrete Token Sampling [74.1] 入力の混合(Mixture of Inputs, MoI)は、自動回帰生成のためのトレーニング不要な方法である。
MoIはQwQ-32B、Nemotron-Super-49B、Gemma-3-27B、DAPO-Qwen-32Bを含む複数のモデルのパフォーマンスを継続的に改善している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:40:00 GMT)
Incentivizing Time-Aware Fairness in Data Sharing [73.8] 協調的なデータ共有と機械学習では、複数のパーティがデータリソースを集約して、よりよいパフォーマンスで機械学習モデルをトレーニングする。
既存のフレームワークでは、すべての関係者が同時にコラボレーションに参加すると仮定しています。
我々は、新しいタイムアウェアインセンティブを含む、公正でタイムアウェアなデータ共有フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:04:34 GMT)
C2T-ID: Converting Semantic Codebooks to Textual Document Identifiers for Generative Search [73.6] 本稿では,階層クラスタリングによる意味的数値決定法を構築するC2T-IDを提案する。
C2T-IDは、アトミック、セマンティック・コードブック、純粋テキスト・ドシッド・ベースラインを著しく上回っている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:05:38 GMT)
A Generative Framework for Personalized Sticker Retrieval [73.6] 我々はパーソナライズされたステッカー検索のための新しい生成フレームワークであるPEARLを提案する。
i) ユーザ固有のステッカー嗜好を符号化するために,識別的ユーザ表現を学習するための表現学習モデルを設計し, (ii) ユーザのクエリ意図に合致したステッカーを生成するために, 新たな意図認識学習目標を提案する。
オフライン評価とオンラインテストの両方による実証的な結果は、PEARLが最先端の手法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:30:28 GMT)
LoRA vs Full Fine-tuning: An Illusion of Equivalence [73.5] 我々は,Low-Rank Adaptation (LoRA) とフルファインタニングによる事前学習モデルについて検討する。
特異値分解が全く異なる構造を示すLoRAおよび完全微調整収量行列が得られた。
我々は、LoRAが完全な微調整を忘れてはならないという発見を拡張し、その忘れ物は侵入者次元に大きく局所化されていることを発見した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:58:00 GMT)
KnowMol: Advancing Molecular Large Language Models with Multi-Level Chemical Knowledge [73.5] KnowMol-100Kは100Kの微細な分子アノテーションを持つ大規模データセットである。
また,既存の分子表現戦略の限界に効果的に対処する,化学的に不変な分子表現も提案する。
KnowMolは、分子理解および生成タスク間で優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:23:58 GMT)
LASeR: Learning to Adaptively Select Reward Models with Multi-Armed Bandits [73.3] 本稿では,マルチアームバンディット問題として報酬モデル選択を行うLASeRを提案する。
LASeRは反復トレーニングを促進し、3つのデータセットに対してLlama-3-8Bの平均精度を絶対的に向上することを示す。
また、RAeRはRMスコアアンサンブルベースラインよりも72.69%のAlpacaEval勝利率を達成していることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:01:03 GMT)
Zero-field identification and control of hydrogen-related electron-nuclear spin registers in diamond [73.2] 我々は, 近傍のNV中心における測定により, スピン欠陥の超微粒子成分と核スピン種を同定する手法を提案する。
結果は、$textitab initio$計算を使って欠陥構造を解決するためのガイドを提供する。
我々の特徴と制御ツールは、ハイブリッド電子核レジスタの欠陥ランドスケープを拡大するための枠組みを確立する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:50:54 GMT)
Every Attention Matters: An Efficient Hybrid Architecture for Long-Context Reasoning [73.1] 本稿では、Ring-mini-linear-2.0およびRing-flash-linear-2.0を含むRing-linearモデルシリーズについて述べる。
どちらのモデルも線形アテンションとソフトマックスアテンションを効果的に統合するハイブリッドアーキテクチャを採用している。
32億のパラメータ密度モデルと比較して、このシリーズは推論コストを1/10に削減し、元のRingシリーズと比較すると、コストも50%以上削減される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:59:38 GMT)
From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model [72.7] ReDiff(Refining-enhanced diffusion framework)は、モデルに自身のエラーを特定し、修正するように教えるフレームワークである。
まず、合成エラーを修正するためにモデルをトレーニングすることで、基礎的なリビジョン機能を具現化し、次に、新しいオンライン自己補正ループを実装します。
この誤り駆動学習は、モデルに既存の出力を再検討し、洗練する重要な能力を与え、エラーカスケードを効果的に破壊する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:58:55 GMT)
Autobidding Arena: unified evaluation of the classical and RL-based autobidding algorithms [71.5] 本稿では,古典的および強化的学習オートバイディングアルゴリズムを比較するための,標準化された透過的評価プロトコルを提案する。
我々は、この業界で開発された最新のオープンソース環境を利用して、入札プロセスを正確にエミュレートする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:27:56 GMT)
MLR-Bench: Evaluating AI Agents on Open-Ended Machine Learning Research [70.7] MLR-Benchは、オープンエンド機械学習研究においてAIエージェントを評価するための包括的なベンチマークである。
MLR-Benchは,(1)NeurIPS, ICLR, ICMLのさまざまなMLトピックを対象としたワークショップから得られた201のリサーチタスク,(2)LLMベースのレビュアーと慎重に設計されたレビュールーリックを組み合わせた自動評価フレームワーク,(3)MLR-Agent,研究タスクを4段階(アイデア生成,提案定式化,実験,論文執筆)で完了するモジュールエージェントの足場である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:33:52 GMT)
The Coverage Principle: How Pre-Training Enables Post-Training [70.3] 予備学習が最終モデルの成功をどう形作るかを検討する。
下流の性能予測におけるカバレッジのパワーを説明するメカニズムを明らかにする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:15:08 GMT)
Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs [69.5] そこで我々は,GAR (Grasp Any Region) を導入し,地域レベルの理解を深める。
GARは(1)必要なグローバルコンテキストを活用することによって正確な認識をサポートし、(2)複数のプロンプト間の相互作用をモデル化する。
そして自然に(3)高度な構成的推論を達成し、任意の領域に関する特定の自由形式の疑問に答える。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:30:24 GMT)
Semi-off-Policy Reinforcement Learning for Vision-Language Slow-Thinking Reasoning [68.3] 本稿では、視覚言語によるスローtHInking reAsoningのためのシンプルでスケーラブルなセミオフポリシーRLであるSOPHIAを提案する。
SOPHIAは、訓練可能なLVLMからのオンラインの視覚的理解と、言語モデルからの非政治的なスロー思考推論を組み合わせることで、セミ・オフ・ポリティクスの行動モデルを構築している。
8Bおよび38BサイズのInternVL2.5およびInternVL3.0を用いた実験はSOPHIAの有効性を示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:34:50 GMT)
DiffAdapt: Difficulty-Adaptive Reasoning for Token-Efficient LLM Inference [68.1] 最近のLarge Language Models (LLMs) は、目覚ましい問題解決能力を示すが、有用性が不明な長い思考トレースを生成することが多い。
私たちの仕事は効率を向上し、過度に考えずにハイパフォーマンスに到達できるようにすることを目標としています。
簡単な/Normal/Hard推論戦略を選択する軽量フレームワークである textbfDiffAdapt を紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:16:06 GMT)
ScaleNet: Scaling up Pretrained Neural Networks with Incremental Parameters [67.9] 視覚変換器(ViT)の効率的なスケーリング手法であるScaleNetを導入する。
従来のスクラッチからのトレーニングとは異なり、ScaleNetはパラメータの無視可能な増加を伴う迅速なモデル拡張を容易にする。
ScaleNetはトレーニングの3分の1しか必要とせず、スクラッチからトレーニングよりも精度が7.42%向上していることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:50:32 GMT)
ASAP: Advancing Semantic Alignment Promotes Multi-Modal Manipulation Detecting and Grounding [67.7] マルチモーダルメディア操作(DGM4)の検出とグラウンド化のための新しいフレームワークASAPを提案する。
検出と接地を正確に操作するためには,画像とテキスト間の細粒度間のセマンティックアライメントが不可欠である。
我々は,MLLM(Large Language Models)とLLM(Large Language Models)を用いて,ペア画像とテキストのペアを構築する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:00:52 GMT)
Fast Inference via Hierarchical Speculative Decoding [65.4] 階層的投機的復号法(HSD)は,各モデルがトークンを提案し,次に大きなモデルが1つのフォワードパスで検証する階層構造に,ドラフトモデルを積み重ねるアルゴリズムである。
HSDは最高の単軸ベースラインよりも1.2倍のスピードアップを達成している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:56:19 GMT)
Deep Research Brings Deeper Harm [64.7] LLM(Large Language Models)上に構築されたDeep Research (DR)エージェントは、複雑な多段階の研究を行うことができる。
これは特に、バイオセキュリティのような高度な知識集約ドメインにおいて関係している。
エージェントの計画に悪意あるサブゴールを注入するプランインジェクション(Plan Injection)と、有害なクエリを学術研究の質問として再編成するIntent Hijack(Intent Hijack)という2つの新しいジェイルブレイク戦略を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:02:16 GMT)
Seed3D 1.0: From Images to High-Fidelity Simulation-Ready 3D Assets [63.7] シミュレーション可能な3Dアセットを単一画像から生成する基礎モデルであるSeed3D 1.0を提案する。
既存の3D生成モデルとは異なり、我々のシステムは正確な幾何学、よく整合したテクスチャ、リアルな物理的基盤を持つ資産を生産する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:16:32 GMT)
SpecEval: Evaluating Model Adherence to Behavior Specifications [63.1] 提供者仕様に対してモデルを監査する自動化フレームワークを導入します。
私たちの中心となる焦点は、プロバイダ仕様とモデルアウトプット、および審査員としての自身のモデルの間の3つの方法の整合性にあります。
当社のフレームワークは、100以上の行動ステートメントにわたる6人の開発者から16のモデルに適用し、プロバイダ間で最大20%のコンプライアンスギャップを含む、体系的な不整合を見つけました。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:55:45 GMT)
SynCast: Synergizing Contradictions in Precipitation Nowcasting via Diffusion Sequential Preference Optimization [63.0] 本研究では,大規模な言語モデルにおける人的フィードバックからの強化学習の成功を動機として,降水量の最適化を初めて導入する。
第一段階では、フレームワークはFARを減らすことに焦点を当て、誤報を効果的に抑えるためにモデルを訓練する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:11:22 GMT)
Chimera: Compositional Image Generation using Part-based Concepting [62.7] 我々は、異なるソース画像から特定部分を組み合わせることで、新しいオブジェクトを生成するパーソナライズされた画像生成モデルであるChimeraを紹介する。
我々は,イメージコンディショニング機能を活用し,セマンティック・アイデンティティと空間的レイアウトの両方を強制する,部分条件誘導を用いたカスタム拡散事前モデルを訓練する。
人間の評価と測定値から,キメラは他の基準線を14%上回り,構成精度は21%,視力は21%向上した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:47:22 GMT)
VideoAgentTrek: Computer Use Pretraining from Unlabeled Videos [62.3] VideoAgentTrekは、Webスケールで公開されているスクリーン録画ビデオからトレーニングデータを自動的にマイニングするスケーラブルなパイプラインである。
生のビデオには暗黙のデモが含まれているが、明示的なアクションラベルがない。
39,000のYouTubeチュートリアルビデオに適用されたパイプラインは、自動的に1250万のインタラクションステップを生成します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:25:48 GMT)
Open-World Drone Active Tracking with Goal-Centered Rewards [62.2] Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:43:03 GMT)
Bag of Tricks for Subverting Reasoning-based Safety Guardrails [62.1] 推論に基づくガードレールを覆い隠すジェイルブレイク手法の袋を提示する。
攻撃対象は白、グレー、ブラックボックスの設定で、無駄なテンプレート操作から完全に自動化された最適化までさまざまです。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:05:11 GMT)
A Principled Approach to Randomized Selection under Uncertainty: Applications to Peer Review and Grant Funding [61.9] 本稿では,各項目の品質の間隔推定に基づくランダム化意思決定の枠組みを提案する。
最適化に基づく最適化手法であるMERITを導入する。
MERITが既存のアプローチで保証されていない望ましい公理特性を満たすことを証明している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:20:17 GMT)
The Open Syndrome Definition [61.1] ケースとシンドロームの定義を表現するための,最初のオープンな機械可読フォーマットを提案する。
我々は、既存の人間可読定義を機械可読形式に変換するための、標準化されたケース定義とツールの最初の包括的なデータセットを紹介する。
オープンシンドローム定義フォーマットは、システム間のケース定義の一貫性とスケーラブルな使用を可能にし、公衆衛生の準備と対応を強化するAIの可能性を解放する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:07:59 GMT)
DeltaProduct: Improving State-Tracking in Linear RNNs via Householder Products [60.7] リニアリカレントニューラルネットワーク(線形RNN)は、シーケンスモデリングのためのトランスフォーマーの競合代替手段として登場した。
既存のアーキテクチャは、表現性と効率の基本的なトレードオフに直面しており、状態遷移行列の構造によって規定されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:10:28 GMT)
BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.0] 高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:58:56 GMT)
See, Think, Act: Online Shopper Behavior Simulation with VLM Agents [58.9] 本稿では,視覚情報,特にWebページスクリーンショットのVLMによる動作シミュレーションへの統合について検討する。
我々は,協調行動予測と合理化生成にSFTを用いて,相互作用の完全な文脈を条件づける。
推論能力をさらに強化するため,RLを階層的な報酬構造と統合し,難易度因子によって拡張する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:07:14 GMT)
Social World Model-Augmented Mechanism Design Policy Learning [58.7] SWM-AP (Social World Model-Augmented Mechanism Design Policy Learning) を導入する。
SWM-APは,累積報酬とサンプル効率において,モデルベースおよびモデルフリーのRLベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:01:21 GMT)
Structured and Abstractive Reasoning on Multi-modal Relational Knowledge Images [58.6] 本稿では,大規模高品質データと能力向上手法の二重ギャップを橋渡しする。
我々は、64Kの高品質なマルチモーダル命令サンプルからなるデータセットSTAR-64Kを導入し、5つのオープンソースMLLMに対して実験を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:23:40 GMT)
Trace: Securing Smart Contract Repository Against Access Control Vulnerability [58.0] GitHubはソースコード、ドキュメント、設定ファイルを含む多数のスマートコントラクトリポジトリをホストしている。
サードパーティの開発者は、カスタム開発中にこれらのリポジトリからコードを参照、再利用、フォークすることが多い。
スマートコントラクトの脆弱性を検出する既存のツールは、複雑なリポジトリを扱う能力に制限されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:18:28 GMT)
3D-GSRD: 3D Molecular Graph Auto-Encoder with Selective Re-mask Decoding [57.6] 3D-GSRDはSelective Re-mask Decodingを備えた3D Molecular Graph Auto-Encoderである。
3D-GSRDは、広く使われているMD17分子特性予測ベンチマークにおいて、8つのターゲットのうち7つのターゲットに新しい最先端技術を設定する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:39:41 GMT)
From Forecasting to Planning: Policy World Model for Collaborative State-Action Prediction [57.6] 政策世界モデル(PWM)と呼ばれる新しい運転パラダイムを導入する。
PWMは、統一アーキテクチャ内での世界モデリングと軌道計画を統合する。
提案手法は,マルチビューおよびマルチモーダル入力に依存する最先端の手法に適合するか,あるいは超越する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:57:51 GMT)
Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets [57.2] 金融分野では、強化学習(RL)エージェントは、価格に影響を与えない歴史的データに基づいて訓練されることが多い。
展開中、これらのエージェントは、自身の取引が資産価格を変えることができるライブマーケットで取引する。
従来のロバストなRLアプローチは、不確実性の集合に対して最悪のパフォーマンスを最適化することで、このモデルの誤特定に対処する。
楕円型不確実性集合の新たなクラスを開発し,効率的かつ堅牢な政策評価を可能にする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:22:25 GMT)
On the Optimal Construction of Unbiased Gradient Estimators for Zeroth-Order Optimization [57.2] 既存の手法の潜在的な制限は、ステップサイズが提案されない限り、ほとんどの摂動推定器に固有のバイアスである。
本稿では, 良好な構成を維持しつつ, バイアスを排除した非バイアス勾配スケーリング推定器のファミリーを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:25:43 GMT)
Can LLMs Correct Themselves? A Benchmark of Self-Correction in LLMs [57.1] 大規模言語モデル(LLM)の自己補正は、推論性能を高める重要な要素として現れる。
本研究では,自己補正戦略の有効性を評価するためのベンチマークであるCorrectBenchを紹介する。
その結果,1) 自己補正手法は, 複雑な推論タスクにおいて, 精度を向上させることが可能であり, 2) 異なる自己補正戦略の混合により, 効率は低下するものの, さらなる改善がもたらされることが明らかとなった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:04:12 GMT)
LV-Eval: A Balanced Long-Context Benchmark with 5 Length Levels Up to 256K [57.0] LV-Evalは5つの長さレベルが256kまで達する長文の長文ベンチマークである。
LV-Evalの利点は、異なるコンテキストの長さにわたる制御可能な評価、紛らわしい事実を持つテストインスタンスへの挑戦、より客観的な評価である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:30:57 GMT)
TowerVision: Understanding and Improving Multilinguality in Vision-Language Models [56.8] TowerVisionは、画像テキストとビデオテキストの両方のためのオープンな多言語視覚言語モデルである。
微調整中に視覚的、文化的コンテキストを取り入れることで、私たちのモデルは既存のアプローチを超えます。
さらなる研究を支援するため、すべてのモデル、データ、トレーニングレシピを公開しています。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:02:48 GMT)
Modeling Turn-Taking with Semantically Informed Gestures [56.3] マルチパーティDnD Gesture corpusの拡張であるDnD Gesture++に2,663のセマンティックジェスチャアノテーションを付加した。
テキスト,音声,ジェスチャーを統合したMixture-of-Expertsフレームワークを用いてターンテイク予測をモデル化する。
実験により、意味的にガイドされたジェスチャーを組み込むことで、ベースラインよりも一貫したパフォーマンス向上が得られることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:17:54 GMT)
NAACL2025 Tutorial: Adaptation of Large Language Models [55.2] LLMの適応に関するこのチュートリアルは、ジェネリックLLMの静的能力を超えたモデルの需要増加に対応するために設計されている。
まず, LLMにおけるパラメトリック知識の更新に焦点を当てたパラメトリック知識適応について検討する。
2つめの適応は、半パラメトリックな知識適応であり、その目標は、外部の知識やツールをよりよく活用するために、LSMパラメータを更新することである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:10:43 GMT)
Machine Text Detectors are Membership Inference Attacks [55.1] 我々は,あるタスクに対してもともと開発された手法が,他方でどのように機能するかを理論的,実証的に検討する。
7つの最先端MIA法と5つの最先端マシンテキスト検出器を含む大規模実験は、クロスタスク性能において非常に強いランク相関(rho >)を示す。
この結果から,両研究コミュニティ間のクロスタスク意識とコラボレーションの必要性が示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:39:01 GMT)
Data Efficient Any Transformer-to-Mamba Distillation via Attention Bridge [54.9] 状態空間モデル(SSM)はシーケンシャルモデリングのためのトランスフォーマーの効率的な代替品として登場し、再帰的な構造を通して優れたスケーラビリティを提供する。
本研究では,トランスフォーマーの教師から状態空間の学生モデルへの注意知識の伝達を効率的に行う新しいデータ効率蒸留フレームワークであるCAB(Cross-architecture distillation via Attention Bridge)を提案する。
本研究は,より強力なSSMコミュニティを構築するために,Transformerの専門知識の迅速な活用を可能にするために,注意に基づく知識を反復モデルに効率的に移行できることを示唆する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:56:14 GMT)
dInfer: An Efficient Inference Framework for Diffusion Language Models [54.8] 拡散に基づく大規模言語モデル (dLLM) は自己回帰(AR) LLM に代わる有望な代替品として登場した。
本稿では、dLLM推論のための効率的かつ効率的なフレームワークであるdInferについて述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:33:49 GMT)
Beyond the Ideal: Analyzing the Inexact Muon Update [54.7] 本報告では,Muonコアにおける不正確な更新の初回解析について述べる。
この不正確さと最適なステップサイズと運動量との基本的な結合を明らかにする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:01:07 GMT)
Memo: Training Memory-Efficient Embodied Agents with Reinforcement Learning [53.7] Memoは、強化学習のためのトランスフォーマーベースのアーキテクチャとトレーニングのレシピである。
トレーニング中のモデルの入力と周期的な要約トークンをインターリーブすることで、メモリの生成と検索を組み込む。
グリッドワールドメタRLベンチマークとマルチオブジェクトナビゲーションタスクにおけるMemoの有効性を,フォトリアリスティック屋内環境で実証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:24:47 GMT)
CrossNews-UA: A Cross-lingual News Semantic Similarity Benchmark for Ukrainian, Polish, Russian, and English [53.3] 言語間のニュース比較は、情報の検証に有望なアプローチを提供する。
既存の言語間ニュース分析用のデータセットは、ジャーナリストや専門家によって手作業でキュレートされた。
我々は、多言語間ニュース類似性評価のためのスケーラブルで説明可能なクラウドソーシングパイプラインを導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:23:50 GMT)
Towards Enhanced Image Generation Via Multi-modal Chain of Thought in Unified Generative Models [52.8] 統一生成モデルは、テキストおよび画像生成において顕著な性能を示した。
複雑な画像生成の課題に対処するために、思考の連鎖(CoT)を統一生成モデルに導入する。
実験により、FoXは様々なT2Iベンチマークで既存の統一モデルよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:54:46 GMT)
REPA-E: Unlocking VAE for End-to-End Tuning with Latent Diffusion Transformers [52.6] 従来のディープラーニングの知恵は、エンド・ツー・エンドのトレーニングが可能な限り望ましいと判断する。
遅延拡散変換器では,標準拡散損失を用いたVAEと拡散モデルの両方のエンドツーエンドトレーニングが有効でないことが観察された。
拡散損失は非効率であるが,表現アライメント(REPA)の損失によってエンドツーエンドのトレーニングをアンロックできることが示されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:52:47 GMT)
What Expressivity Theory Misses: Message Passing Complexity for GNNs [51.2] 我々は、ほとんどの実世界のタスクにおいて高い表現性は必要ないと論じ、基本的なWLテスト以上の表現性はめったに要求されない。
本稿では,GNNアーキテクチャがメッセージパッシングによって与えられたタスクを解くことの難しさを定量化する手法であるMessage Passing Complexity (MPC)を提案する。
MPCは、表現性理論による理論上の不合理性を保ちながら、オーバースカッシングのような現実的な限界を捉えている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:49:43 GMT)
Learning Affordances at Inference-Time for Vision-Language-Action Models [50.9] ロボット工学において、VLA(Vision-Language-Action Model)は複雑な制御タスクを解くための有望な道を提供する。
本稿では,VLAの低レベルポリシーを過去の経験を条件とした高レベルVLMに接続するLITEN(Learning from Inference-Time Execution)を紹介する。
提案手法は,低レベルVLAの計画の生成と実行を行う推論フェーズと,その結果を反映した評価フェーズとを反復する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:43:29 GMT)
Don't be lazy: CompleteP enables compute-efficient deep transformers [50.9] いくつかのパラメータ化はモデル深さの変化に対して最適なベースHPの転送に失敗する。
遅延学習システムにはまだパラメータ化が存在する可能性を示す理論を開発する。
我々は、Deep-wise HP Transferと非遅延学習の両方をすべての層で実現するCompletePと呼ぶパラメータ化を特定し、採用する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:28:11 GMT)
ProCLIP: Progressive Vision-Language Alignment via LLM-based Embedder [50.3] CLIPテキストエンコーダは77トークンの最大入力長で制限される。
ProCLIPはカリキュラムベースのプログレッシブ・ビジョン言語アライメントフレームワークである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:43:28 GMT)
Preconditioned Norms: A Unified Framework for Steepest Descent, Quasi-Newton and Adaptive Methods [50.1] 本稿では,事前条件付き行列ノルムの新たな概念を通じて,降下法,準ニュートン法,適応法を一般化する統一的枠組みを提案する。
この枠組みでは、行列パラメータ化設定におけるアフィンとスケール不変性の最初の体系的処理を提供する。
我々は、Muonのスペクトル幾何学とAdamスタイルのプレコンディショニングを組み合わせた、$ttMuAdam$と$texttMuAdam-SANIA$という2つの新しい方法を紹介した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:26:31 GMT)
SmartSwitch: Advancing LLM Reasoning by Overcoming Underthinking via Promoting Deeper Thought Exploration [49.3] ロングチェーン・オブ・シークレット(LongCoT)は、複雑な推論タスクにおいて、大規模言語モデルによって達成された最近のブレークスルーの中心である。
本稿では,SmartSwitch推論フレームワークという,シンプルで効果的な推論手法を提案する。
このフレームワークは、プラグイン・アンド・プレイソリューションとして、どんな大きな言語モデルにも簡単に統合できる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:56:01 GMT)
Scaf-GRPO: Scaffolded Group Relative Policy Optimization for Enhancing LLM Reasoning [49.3] Scaf-GRPOは、モデルの独立した学習が停滞した時に介入するトレーニングフレームワークである。
これはQwen2.5-Math-7Bモデルのパス@1スコアを、バニラGRPOベースラインよりも44.3%向上させる。
この結果から、我々のフレームワークは、それまで到達範囲を超えていた問題を解決するモデルの能力を解き放つ、堅牢で効果的な方法論を提供することを示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:41:30 GMT)
ColorAgent: Building A Robust, Personalized, and Interactive OS Agent [49.0] 環境との長期的かつ堅牢なインタラクションを実現するために設計されたOSエージェントであるColorAgentを提示する。
我々は、汎用性、一貫性、堅牢性を保証するように調整されたマルチエージェントフレームワークを開発する。
AndroidWorldとAndroidLabのベンチマークでColorAgentを評価し、それぞれ77.2%と50.7%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:02:48 GMT)
RLBoost: Harvesting Preemptible Resources for Cost-Efficient Reinforcement Learning on LLMs [48.9] RLBoostは、プリエンプティブルGPUリソースを抽出するコスト効率のよいRLトレーニングのための体系的なソリューションである。
RLBoostはトレーニングのスループットを1.51x-1.97x向上し、オンデマンドGPUリソースのみを使用する場合に比べてコスト効率は28%-49%向上した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:19:37 GMT)
HAD: HAllucination Detection Language Models Based on a Comprehensive Hallucination Taxonomy [48.7] NLGタスクにまたがる11のカテゴリからなる総合的な幻覚分類を導入する。
本稿では,幻覚検出,スパンレベル同定,修正を単一の推論プロセスに統合するHAllucination Detection (HAD)モデルを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:28:37 GMT)
Video-R1: Reinforcing Video Reasoning in MLLMs [48.6] Video-R1は、ビデオ推論にインセンティブを与えるためのR1パラダイムを体系的に探求する最初の試みである。
まず,T-GRPOアルゴリズムを提案する。
SFTコールドスタートのためのVideo-R1-CoT-165kと、RLトレーニングのためのVideo-R1-260kの2つのデータセットを構築した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:42:24 GMT)
Class-Aware Prototype Learning with Negative Contrast for Test-Time Adaptation of Vision-Language Models [48.6] VLM(Vision-Language Models)は、大規模な画像テキスト事前学習を通じて、印象的なゼロショットの一般化を実証する。
しかし、デプロイメントディストリビューションがトレーニングディストリビューションから分岐すると、パフォーマンスが低下する可能性がある。
テスト時間適応(TTA)メソッドは、ラベルのないターゲットデータを使用してモデルを更新する。
軽量TTAフレームワークである textbfNegative textbfContrast(textbfCPL-NC) を用いた textbfClass-Aware textbfPrototype textbfL を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:38:35 GMT)
Learning to Learn with Contrastive Meta-Objective [48.3] 本稿では,メタトレーニングにおけるタスクアイデンティティのさらなる監視として活用することを提案する。
提案したConMLは、対照的なメタオブジェクトの評価と最適化を行っている。
我々は、ConMLが既存のメタ学習モデルだけでなく、既存のメタ学習モデルとシームレスに統合できることを実証した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:00:39 GMT)
DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection [48.3] 効率的な適応モジュールのライブラリの構築とメンテナンスを目的としたフレームワークであるDitHubを紹介した。
Version Control SystemsにインスパイアされたDitHubは、専門家モジュールを必要に応じてフェッチしてマージ可能なブランチとして管理する。
本手法は,ODinW-13ベンチマークとODinW-Oを用いて,クラス再出現の評価を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:08:21 GMT)
SAM 2++: Tracking Anything at Any Granularity [48.0] SAM 2++は、マスク、ボックス、ポイントなど、どんな粒度でも追跡できる統一モデルです。
ターゲットの粒度を拡大するため、タスク固有のプロンプトを設計し、様々なタスク入力を一般的なプロンプト埋め込みにエンコードする。
メモリ整合性を満たすために,異なる粒度のメモリを統一するタスク適応型メモリ機構を導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:07:31 GMT)
QiMeng-SALV: Signal-Aware Learning for Verilog Code Generation [47.8] 我々は,Verilogコード生成のための信号認識学習(QiMeng-SALV)を提案する。
トレーニングデータにおける参照モジュールの機能的正当性を,参照モジュールの機能的正当性と比較することにより検証する。
最後に,信号レベル符号セグメントに最適化された信号認識型DPOを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:58:07 GMT)
Knowledge-Guided Multi-Agent Framework for Application-Level Software Code Generation [47.7] 本稿ではKGACGという知識誘導型アプリケーションレベルコード生成フレームワークを構想する。
KGACGは、ソフトウェア要件仕様とアーキテクチャ設計文書を実行可能なコードに変換することを目的としている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:10:58 GMT)
Model-based Large Language Model Customization as Service [45.9] OpenAIやGoogleといったプロバイダによる大規模言語モデル(LLM)サービスは、一般的なタスクでは優れているが、ドメイン固有のアプリケーションではパフォーマンスが劣ることが多い。
Llamdexは、LLMのカスタマイズをサービスとして促進する新しいフレームワークで、クライアントはデータではなく、トレーニング済みのドメイン固有モデルをアップロードする。
実験によると、Llamdexは、同じプライバシー制約の下で、最先端のプライベートデータ合成メソッドに対して、ドメイン固有の精度を最大26%向上する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:52:37 GMT)
Towards Strong Certified Defense with Universal Asymmetric Randomization [45.9] UCANは、既存のランダムな平滑化手法を強化し、それを対称(等方性)から非対称(異方性)ノイズ分布に変換するように設計されている。
我々の理論フレームワークは、様々な$ell_p$-normsで証明されたロバスト性のために、幅広いノイズ分布をサポートする。
実証的な評価は、既存の最先端手法よりもUCANの性能が飛躍的に向上したことを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:14:26 GMT)
Emergent Kitaev materials in synthetic Fermi-Hubbard bilayers [45.9] フェルミ・ハッバード二層膜における結合方向スピン-スピン相互作用は、ラマン光学格子の超低温フェルミ粒子によって実現できる。
我々は, フェルミ液相とモット絶縁相を解析し, ディラックとマヨラナ準粒子の対応を明らかにする。
この結果から、ラマン光学格子に基づく冷原子量子シミュレータは、拡張された北エフモデルのグラウンドとなることが判明した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:35:54 GMT)
Weakly Supervised Food Image Segmentation using Vision Transformers and Segment Anything Model [45.6] 食品画像に対する弱教師付きセマンティックセマンティックセマンティクス手法を提案する。
我々は視覚変換器(ViT)の注意機構とともにSAM(Seegment Anything Model)を用いる。
提案手法は,食品画像のアノテーションタスクを加速するツールとして,あるいは食品・栄養追跡アプリケーションにおいて統合されたコンポーネントとして想定される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:53:52 GMT)
SEMPO: Lightweight Foundation Models for Time Series Forecasting [45.5] SEMPOは比較的小規模なデータに対する事前トレーニングを必要とする軽量な基礎モデルであるが、強い時系列予測を示す。
SEMPOは、1)エネルギーを意識したSpEctral分解モジュールと、事前学習データの利用を大幅に改善する2つの重要なモジュールから構成される。
16のデータセットをカバーする2つの大規模ベンチマークの実験は、ゼロショットと少数ショットの予測シナリオの両方でSEMPOの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:58:44 GMT)
Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning [44.5] Supervised Fine-Tuning (SFT) Large Language Modelsは高品質なトレーニングデータに依存している。
自己進化型モデル駆動動的データ最適化フレームワークであるMiddoを紹介した。
その結果,Middoはシードデータの品質を継続的に向上し,LLMの性能を平均7.15%向上させることができた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:09:23 GMT)
GigaBrain-0: A World Model-Powered Vision-Language-Action Model [44.1] 我々は、世界モデル生成データによって強化された新しいVLA基盤モデルであるGigaBrain-0を紹介する。
GigaBrain-0は、タスク間の一般化を改善しながら、実際のロボットデータへの依存を著しく低減する。
また、NVIDIA Jetson AGX Orinのようなデバイス上で効率的に動作するように設計された軽量なGigaBrain-0-Smallも紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:57:13 GMT)
OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.9] OneSearchは、eコマース検索のための最初の産業向けエンドツーエンド生成フレームワークである。
OneSearchは運用費を75.40%削減し、Model FLOPsの利用を3.26%から27.32%に改善した。
このシステムはKuaishouの複数の検索シナリオにまたがって展開され、数百万のユーザーにサービスを提供している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:10:35 GMT)
Reasoning Models Better Express Their Confidence [43.3] 大規模言語モデル(LLM)は、信頼を正確に伝達できないことが多い。
拡張チェーン・オブ・シークレット(CoT)推論に携わる推論モデルは優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:37:15 GMT)
LongCodeBench: Evaluating Coding LLMs at 1M Context Windows [43.2] LongCodeBenchは、長期コンテキストシナリオでコーディング能力をテストするためのベンチマークである。
我々は、コード理解と修復を、長期コンテキストモデルの自然なテストベッドと課題として認識する。
私たちは、Claude 3.5 Sonnetの29%から3%のパフォーマンス低下など、ロングコンテキストがすべてのモデルにとって弱点であることに気付きました。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:04:53 GMT)
Learning What Matters: Steering Diffusion via Spectrally Anisotropic Forward Noise [43.1] Diffusion Probabilistic Models (DPM) は強力な生成性能を達成しているが、その帰納的バイアスは大半が暗黙的である。
本研究では,拡散モデルのトレーニングとサンプリングに帰納的バイアスを組み込むことにより,モデルの目的とするデータ分布をよりよく適応することを目的とする。
異方性前方共分散を周波数対角共分散に置き換えることで、これらのバイアスを形作る異方性雑音演算子を導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:45:29 GMT)
Quantum Machine Learning methods for Fourier-based distribution estimation with application in option pricing [42.8] オプション価格問題に対処する2つのハイブリッド古典量子法を提案する。
提案手法は,導関数評価の競合的量子代替物として,顕著な精度を実現していることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:43:08 GMT)
Optimizing the Unknown: Black Box Bayesian Optimization with Energy-Based Model and Reinforcement Learning [42.5] Black-Box Optimization (BBO) は様々な科学・工学分野で成功を収めている。
本稿では,ガウス過程(GP)を統合したReinforced Energy-based Model for Bayesian Optimization (REBMBO)を提案する。
我々は、REBMBOの優れた性能を確認するために、合成および実世界のベンチマークに関する広範な実験を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:36:49 GMT)
LICO: Large Language Models for In-Context Molecular Optimization [42.2] ブラックボックス最適化のために任意のベースLLMを拡張する汎用モデルであるlicOを導入する。
ドメイン上で定義されたさまざまな関数セットに対して、コンテキスト内予測を行うようにモデルを訓練する。
トレーニングが完了すると、licOはコンテクスト内でのプロンプトによって、見つからない分子の性質に一般化できる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:44:08 GMT)
Quantum Nonlinear Response of Emitter Lattices [42.2] レーザーでコヒーレントに駆動される2レベル量子エミッタの格子の光学応答における量子非線形性の出現について検討する。
系が量子準曲面として振る舞うサブ波長格子系では、共鳴入射平面波が励起ブロッホ状態に浮かび上がる。
共鳴蛍光と密接に関連し、強い運転体制下でのシステムからの遠距離電界放射は光子のブロードバンド背景によって支配されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:43:54 GMT)
No Compute Left Behind: Rethinking Reasoning and Sampling with Masked Diffusion Models [42.2] マスク付き拡散言語モデルは、ランダムにマスキングされたシーケンスにおける埋め込み位置を訓練する。
推論・アズ・インフィルとマルチトークンエントロピーデコーディングを提案する。
本研究は,MDLMが使用するトレーニングと計算によって,多くの新しい推論とポストトレーニング手法が解き放たれることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:41:27 GMT)
RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Interactive Environmental Learning in Physical Embodied Systems [41.9] エージェントは、部分的可観測性、空間的推論の制限、高速なマルチメモリ統合など、現実世界の環境において永続的な課題に直面している。
本稿では, 空間, 時間, エピソディック, セマンティックメモリを並列化して, 効率的な長期計画と対話型環境学習を実現する, 脳にインスパイアされたフレームワークであるRoboMemoryを紹介する。
EmbodiedBenchの実験によると、Qwen2.5-VL-72B-Ins上に構築されたRoboMemoryはベースラインを25%上回り、クローズドソース(SOTA)のGemini-1.5を超えている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:48:48 GMT)
Chiron-o1: Igniting Multimodal Large Language Models towards Generalizable Medical Reasoning via Mentor-Intern Collaborative Search [41.8] マルチモーダルな大規模言語モデル(MLLM)は、一般的なタスクに対して堅牢な推論能力を実証し始めているが、医療分野への応用はまだ初期段階にある。
我々は、厳密で効果的な医療用CoTデータを生成するための新しい推論パス探索手法であるMentor-Intern Collaborative Search (MICS)を提案する。
我々は,難易度の高いマルチタスク医療推論データセットであるMMRPと,カリキュラム学習戦略によって考案された新しい医療MLLMであるChiron-o1を構築した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:23:57 GMT)
OmniNWM: Omniscient Driving Navigation World Models [41.7] 統合されたフレームワーク内の3次元すべてに対処するパノラマナビゲーションワールドモデルであるOmniNWMを紹介する。
例えば、OmniNWMは、RGB、セマンティクス、メートル法深度、および3D占有度のパノラマ動画を共同で生成する。
動作のために、入力軌跡をピクセルレベルの信号にエンコードする正規化パノラマPlucker線地図表現を導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:46:01 GMT)
Training-Free Constrained Generation With Stable Diffusion Models [41.4] 安定拡散モデルは、様々な領域にまたがるデータ合成における最先端のモデルである。
既存のテクニックは、遅延拡散フレームワークの適用性に制限されるか、ドメイン固有の制約を厳格に強制する能力に欠ける。
本稿では, 安定拡散モデルと制約付き最適化フレームワークとの新たな統合を提案し, 厳密な物理的および機能的要求を満たす出力の生成を可能にする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:02:03 GMT)
JointCQ: Improving Factual Hallucination Detection with Joint Claim and Query Generation [40.6] 現在の大きな言語モデル(LLM)は、しばしば幻覚(幻覚)の問題に悩まされる。
本研究では,効率的なクレーム・クエリ・ジェネレータの構築を目的とした共同クレーム・アンド・クエリ生成フレームワークであるJointCQを紹介する。
提案フレームワークは、精巧に設計された評価基準を利用して、合成トレーニングデータをフィルタリングし、共同クレーム抽出とクエリ生成のための言語モデルを微調整する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:15:37 GMT)
Unraveling Emotions with Pre-Trained Models [40.5] この研究は、3つのシナリオにおける感情検出における微調整と迅速なエンジニアリングの有効性を比較する。
実験では、感情認識のための微調整済みモデルで70%以上の測定値が得られる。
これらの進歩は、感情分析、人間とコンピュータの相互作用、および様々な領域にわたるユーザー行動の理解を改善する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:13:52 GMT)
Permutative Preference Alignment from Listwise Ranking of Human Judgments [40.2] 我々はNDCGを異なる代理損失で近似することで、エンドツーエンドのアライメントアルゴリズムを開発する。
我々は,NDCGに基づく手法により,B-T法よりも効率よくランキング精度を向上させることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:15:48 GMT)
Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing [40.1] Pico-Banana-400Kは、命令ベースの画像編集のための総合的な400Kイメージデータセットである。
我々のデータセットは、Nano-Bananaを利用して、実際の写真から多様な編集ペアを生成する。
この大規模で高品質でタスク豊富なリソースを提供することで、Pico-Banana-400Kは次世代のテキストガイド画像編集モデルのトレーニングとベンチマークのための堅牢な基盤を確立する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:43:15 GMT)
From See to Shield: ML-Assisted Fine-Grained Access Control for Visual Data [40.1] 本研究は,ポリシー駆動型アクセス制御を用いた信頼データ共有システムアーキテクチャを提案する。
提案アーキテクチャは、センシティブな領域の自動検出、ポスト補正、キー管理、アクセス制御を統合している。
提案システムでは,PSO検出を効果的に行い,マクロ平均F1スコア(5%)と平均平均精度(10%)を向上し,平均1秒未満の復号時間を維持している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:41:31 GMT)
Unveiling Transformer Perception by Exploring Input Manifolds [39.7] 本稿では,Transformerモデルの入力空間における等価クラス探索法を提案する。
提案手法は、トランスフォーマーアーキテクチャの内部層を入力多様体の逐次変形として記述する音響数学的理論に基づいている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:30:40 GMT)
HSCodeComp: A Realistic and Expert-level Benchmark for Deep Search Agents in Hierarchical Rule Application [39.6] 我々は,階層型ルールアプリケーションにおける深層検索エージェントの評価を目的とした,最初の現実的,エキスパートレベルのeコマースベンチマークであるHSCodeCompを紹介する。
このタスクでは、エージェントの深い推論プロセスがこれらのルールによって導かれ、ノイズがあるが現実的な記述を持つ製品の10桁の調和システムコード(HSCode)を予測する。
提案するHSCodeCompは,多種多様な製品カテゴリにまたがる632の製品エントリから構成される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:28:33 GMT)
Coordinated Strategies in Realistic Air Combat by Hierarchical Multi-Agent Reinforcement Learning [39.4] 本稿では,これらの課題に対処するために,新しい3次元マルチエージェント空気戦闘環境と階層型マルチエージェント強化学習フレームワークを導入する。
提案手法は,異種エージェントのダイナミックス,カリキュラム学習,リーグプレイ,新たに適応したトレーニングアルゴリズムを組み合わせる。
実験の結果,我々の階層的アプローチは,複雑なドッグファイトシナリオにおける学習効率と戦闘性能を両立させることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:38:26 GMT)
From Optimization to Prediction: Transformer-Based Path-Flow Estimation to the Traffic Assignment Problem [39.4] 本研究では、ディープニューラルネットワークを用いて平衡経路を直接予測する新しいデータ駆動手法を提案する。
Transformerベースのモデルは、再計算を必要とせず、需要やネットワーク構造の変化に適応しながら、計算時間を劇的に削減する。
モデルはまた、様々な需要やネットワーク条件に柔軟に対応し、トラフィック管理をサポートし、迅速なWhat-if'分析を可能にする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:45:12 GMT)
LLM Unlearning with LLM Beliefs [39.3] 巨大なコーパスで訓練された大きな言語モデルは、本質的に機密または有害な内容を記憶し、後に出力に再浮上する可能性がある。
本稿では、スケズ効果をモデル自身の高信頼世代に明示的に関連付けるブートストラップフレームワークを提案する。
目標応答とモデル信念の両方を共同で抑制することにより、BS-T(トークン)は高い確率トークンを減らし、BS-S(シーケンス)は全高信頼世代を除去する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:44:36 GMT)
Roboflow100-VL: A Multi-Domain Object Detection Benchmark for Vision-Language Models [39.2] 本稿では,100個のマルチモーダルオブジェクト検出データセットの大規模コレクションであるRoboflow100-VLを紹介する。
我々は、ゼロショット、少数ショット、半教師付き、完全教師付き設定で、我々のベンチマークの最先端モデルを評価する。
CVPR 2025 Foundational FSOD コンペティションについて論じ,コミュニティからの洞察を共有した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:12:56 GMT)
Reasoning Like Experts: Leveraging Multimodal Large Language Models for Drawing-based Psychoanalysis [39.0] PICKは階層的分析と知識注入を通じて精神分析画像のために設計された多段階のフレームワークである。
HTP(House-Tree-Person)テスト(House-Tree-Person)は、臨床実践において広く用いられる心理学的評価である。
我々のアプローチはMLLMと専門分野のギャップを埋め、視覚的表現を通じて人間の精神状態を理解するための構造化され解釈可能な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:29:14 GMT)
Quantifying Feature Importance for Online Content Moderation [38.7] 16.8Kユーザの行動変化の予測における社会的行動,言語的,リレーショナル,心理的特徴の有意性について検討した。
本研究は,モデレーション介入に対するユーザの反応を予測する精度の高いシステム開発への道を開くものである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:02:30 GMT)
Relational Transformer: Toward Zero-Shot Foundation Models for Relational Data [38.7] Transformer (RT) アーキテクチャは、様々なリレーショナルデータベース上で事前トレーニングすることができる。
RTは強いゼロショットを破り、バイナリ分類タスクにおいて、完全に教師されたAUROCの93%を平均化する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:13:45 GMT)
Traffic-R1: Reinforced LLMs Bring Human-Like Reasoning to Traffic Signal Control Systems [38.1] 我々は、交通信号制御(TSC)のための人間ライクな推論の基礎モデルであるTraffic-R1を紹介する。
トラヒック-R1は、ゼロショットの一般化、新しい道路網への変更なしの転送、アウト・オブ・ディストリビューションインシデントという3つの大きな利点を提供する。
プロダクション環境では、毎日55,000人以上のドライバーに影響を与える信号を管理し、平均キューの長さを5%以上削減し、オペレータのワークロードを半減する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:05:37 GMT)
Optimization by Decoded Quantum Interferometry [38.1] Decoded Quantum Interferometry (DQI) は、量子フーリエ変換を用いて、復号化問題に対する最適化問題を削減する量子アルゴリズムである。
有限体上の最適適合を近似するために、DQIは既知の古典的アルゴリズムよりも超多項式的なスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:42:14 GMT)
Towards Single-Source Domain Generalized Object Detection via Causal Visual Prompts [37.9] 単一ソースのドメイン一般化オブジェクト検出はコンピュータビジョンにおける最先端の研究トピックである。
Causal Visual Prompts 法は、視覚的プロンプトと横断的アテンションを統合することで、刺激的な特徴からバイアスを緩和する。
Causalは15.9-31.4%のアップで最先端の性能を実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:24:52 GMT)
Beyond MedQA: Towards Real-world Clinical Decision Making in the Era of LLMs [37.7] 大型言語モデル (LLM) は臨床応用の可能性を示唆している。
多くの医学データセットは、現実の臨床的意思決定を過小評価する簡易的な質問回答 (QA) に依存している。
臨床背景と臨床質問の2つの側面に沿って臨床意思決定タスクを特徴付ける統一パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:06:10 GMT)
Hubble: a Model Suite to Advance the Study of LLM Memorization [37.7] Hubbleは、完全にオープンソースな大規模言語モデル(LLM)のスイートである。
標準モデルは大きな英語コーパスで事前訓練され、摂動モデルは同じように訓練されるが、テキストの挿入は制御されている。
コアリリースには8つのモデル -- 標準モデルと摂動モデル、100Bまたは500Bトークンで事前トレーニングされた1Bまたは8Bパラメータが含まれています。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:48:23 GMT)
SheetBrain: A Neuro-Symbolic Agent for Accurate Reasoning over Complex and Large Spreadsheets [37.5] SheetBrainは、スプレッドシート上の推論のための神経シンボリックな二重エージェントフレームワークである。
スプレッドシートの質問応答と操作タスクの両方をサポートする。
SheetBenchは、大規模で、マルチテーブルで、構造的に複雑なスプレッドシートをターゲットにした、新しいベンチマークである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:09:44 GMT)
Continual Knowledge Adaptation for Reinforcement Learning [37.4] 強化学習により、エージェントは環境との相互作用を通じて最適な行動を学ぶことができる。
歴史的知識の蓄積と有効活用を可能にする強化学習のための継続的知識適応(CKA-RL)を提案する。
3つのベンチマーク実験により、提案したCKA-RLは最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:25:41 GMT)
ToolScope: Enhancing LLM Agent Tool Use through Tool Merging and Context-Aware Filtering [37.4] 大規模言語モデル(LLM)エージェントは複雑なタスクを解決するために外部ツールに依存している。
LLMはまた、入力コンテキストの厳しい制限に直面し、大きなツールセットの効率的な考慮を妨げている。
本稿では,(1)ToolScopeMergerとAuto-Correction,(2)ToolScopeRetriever,(2)ToolScopeMerger,(2)ToolScopeMerger,(3)ToolScopeMerger,(3)To olScopeMerger,(3)ToolScopeMerger,(3)ToolScopeMerger,(3)ToolScopeMerger,(2)ToolScopeMerger,(2)ToolSco peMerger,(2)ToolScopeRetriever,の2つを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:29:27 GMT)
Forging GEMs: Advancing Greek NLP through Quality-Based Corpus Curation and Specialized Pre-training [37.3] 本稿では,ギリシャ語のトランスフォーマーモデルの新たなファミリーであるギリシャ語埋め込みモデルについて述べる。
我々は、厳密で質の高いフィルタリングと前処理手法を強調した大規模なギリシアのコーパスの構築について詳述する。
法域に適合した最初のバイリンガル・ギリシャ語・英語の埋め込みモデルを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:06:48 GMT)
Benchmarking Probabilistic Time Series Forecasting Models on Neural Activity [37.2] 神経活動予測は、ニューラルネットワークを理解し、クローズドループ制御を可能にするために重要である。
ディープラーニングは最近、文学を予測する時系列において最先端の技術を進歩させたが、その神経活動予測への応用はまだ限られている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:18:38 GMT)
Provable Meta-Learning with Low-Rank Adaptations [37.1] 本稿では,PEFTをベースとしたメタラーニングフレームワークを導入し,未知のタスクに容易に適応できるモデルを学習する。
LoRAを用いた線形モデルでは、適応可能なパラメータの集合を見つけるのに標準再学習が確実に最適であることを示す。
我々は、これらの理論的洞察を、実データビジョンや言語タスクと同様に、合成データの実験を通じて検証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:26:14 GMT)
Discretized Gaussian Representation for Tomographic Reconstruction [36.6] 離散ガウス表現(英: Discretized Gaussian Representation, DGR)は、離散ガウス関数の集合を用いて3次元体積を直接再構成する新しいフレームワークである。
高速ボリューム再構成は、ガウス的コントリビューションを最小限のオーバーヘッドでボクセルグリッドに集約する高度に並列化された手法である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:36:29 GMT)
Evaluation Framework for Highlight Explanations of Context Utilisation in Language Models [36.6] コンテキスト利用(Context utilisation)は、言語モデルが応答を生成するときに提供されるコンテキストから関連する情報を組み込む機能である。
実地ストルース・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・コンテクスト・アトリビューションのための最初のゴールド標準HE評価フレームワークを提案する。
私たちは、すべてのコンテキストシナリオで、MechLightが最高のパフォーマンスを発揮することに気付きました。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:22:21 GMT)
AdaSPEC: Selective Knowledge Distillation for Efficient Speculative Decoders [36.3] 投機的復号(SD)は、小さなドラフトモデルを用いて予測を生成することにより、大きな言語モデル推論を加速する。
知識蒸留(KD)は、すべてのトークンにわたるドラフトモデルとターゲットモデルの間のKLのばらつきを最小限にすることを目的としている。
選択的トークンフィルタリングをKDプロセスに組み込む新しい手法であるAdaSPECを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:13:00 GMT)
Exploring Scale Shift in Crowd Localization under the Context of Domain Generalization [36.2] 群集の局所化は、群集内の各歩行者の位置を予測するための視覚的シーン理解において重要な役割を担っている。
既存のアプローチでは、トレーニングデータとテストデータ間のヘッドスケール分布(スケールシフト)の相違により、パフォーマンスが著しく低下する。
本稿では,クラウドローカライゼーションモデルにおける領域一般化の文脈におけるスケールシフトの性質を理解することを目的とする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:45:03 GMT)
A Flow Model with Low-Rank Transformers for Incomplete Multimodal Survival Analysis [36.1] 本稿では,低ランクトランスフォーマーとフローベース生成モデルを組み合わせた,堅牢かつ柔軟なマルチモーダルサバイバル予測手法を提案する。
提案手法は, 完全モダリティ条件下での最先端性能を実現するだけでなく, 不完全モダリティシナリオ下での堅牢かつ優れた精度も維持する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:27:05 GMT)
Learning Personalized Ad Impact via Contextual Reinforcement Learning under Delayed Rewards [36.0] 広告入札をコンテキストマルコフ決定プロセス(CMDP)としてモデル化し,ポアソンの報酬を遅延させる。
効率的な推定法として,データ分割戦略と組み合わせた2段階の最大推定器を提案する。
我々は、効率的な個人化入札戦略を導出するための強化学習アルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:08:36 GMT)
Towards Interpretability Without Sacrifice: Faithful Dense Layer Decomposition with Mixture of Decoders [35.0] 多層パーセプトロン(MLP)は、大規模言語モデルの不可欠な部分である。
近年の手法では、ニューロンレベルの間隔を通して解釈可能な近似を学習するが、元のマッピングを忠実に再構築することはできなかった。
本稿では,スパース近似の精度トレードオフを克服するため,層レベルの空間性への移行を提唱する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:00:25 GMT)
Stable Matching with Ties: Approximation Ratios and Learning [34.6] 我々は、市場の片側で働く労働者が、彼らのマッチングユーティリティーによって決定された、仕事よりも好みに結びついている可能性がある、マッチング市場と結びつきについて研究する。
厳格な嗜好を持つ古典的な二面市場とは異なり、すべての労働者に対して実用性を最大化する単一の安定なマッチングは存在しない。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:45:20 GMT)
ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints [34.6] ImagerySearchは、アダプティブなテストタイム検索戦略である。
プロンプト内の意味的関係に応じて、推論検索空間と報酬関数の両方を調整する。
これは、強力なビデオ生成ベースラインと既存のテストタイムスケーリングアプローチを一貫して上回る。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:52:23 GMT)
Generating Directed Graphs with Dual Attention and Asymmetric Encoding [34.5] 離散フローマッチングフレームワーク上に構築された有向グラフの最初の生成モデルであるDirectoを提案する。
提案手法は,非対称なペアワイズ関係に適合する原理的位置エンコーディングと,(ii)入出力依存と出出力依存の両方を捉える二重アテンション機構と,(iii)頑健で離散的な生成機構を組み合わせたものである。
本研究は,提案手法の有効性と汎用性を強調し,有向グラフ生成における今後の研究の基盤を確立するものである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:00:46 GMT)
Data Efficient Adaptation in Large Language Models via Continuous Low-Rank Fine-Tuning [34.3] 本稿では,ローランド適応(LoRA)と連続的な微調整戦略を統合する新しいフレームワークであるtextbfを提案する。
15の多様なデータセットの実験は、DEALがベースラインメソッドを一貫して上回っていることを示している。
これらの結果は,大規模言語モデルにおける継続的適応に向けた我々のアプローチの可能性を示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:37:50 GMT)
AtomSurf : Surface Representation for Learning on Protein Structures [34.2] 本研究では,タンパク質学習タスクに最先端のサーフェスエンコーダを適用する。
次に、Atom3Dベンチマーク内の代替手法と比較する。
最後に、グラフと表面表現の学習的特徴共有を可能にする統合的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:23:58 GMT)
GTAlign: Game-Theoretic Alignment of LLM Assistants for Mutual Welfare [34.1] 推論と学習の両方にゲーム理論による意思決定を統合するアライメントフレームワークを提案する。
GTAlignは,ベースラインに比べて推論効率,回答品質,相互福祉を著しく改善することを示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:05:48 GMT)
On the hardness of RL with Lookahead [34.0] そこで, エージェントは, アクションの行程を決定する前に, 任意の$ell$アクションの実行時にどの状態が訪問されるかを観察することができる。
このような情報は達成可能な性能を大幅に向上させることができるが、最適にこの情報を使用すると、潜在的に禁止的な計算コストがかかることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:47:18 GMT)
Deep Linear Probe Generators for Weight Space Learning [34.0] プローブは、学習した入力(プローブ)のセットをモデルに渡すことでモデルを表し、対応する出力の上に予測器を訓練する。
ProbeGenは、深い線形アーキテクチャを備えた共有ジェネレータモジュールを追加し、構造化プローブに対する誘導バイアスを提供する。
ProbeGenは最先端よりも大幅にパフォーマンスが良く、非常に効率的で、他のトップアプローチの30~1000倍のFLOPを必要とする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:51:33 GMT)
The Emergence of Complex Behavior in Large-Scale Ecological Environments [33.9] オープンエンド環境下での複雑な行動の出現を物理的規模と人口規模がいかに形成するかを考察する。
私たちのゴールは、1つのハイパフォーマンスなポリシーを最適化することではなく、大きな集団にまたがって行動がどのように出現し進化するかを調べることです。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:19:16 GMT)
High-order Equivariant Flow Matching for Density Functional Theory Hamiltonian Prediction [33.8] 深層学習の手法は ハミルトン人を直接予測することで このステップをバイパスする方法として 注目を集めています
分子幾何学に基づくハミルトン行列を生成する高次同変フローマッチングフレームワークQHFlowを提案する。
フローマッチングモデルは単純な先行点と複雑な対象点の間の連続時間軌道をモデル化し、直接回帰ではなくハミルトン分布上の構造的分布を学習する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:59:20 GMT)
Seeing Across Views: Benchmarking Spatial Reasoning of Vision-Language Models in Robotic Scenes [33.8] 視覚言語モデル(VLM)は、ロボットが複雑な環境で知覚、理性、行動することができるように、エンボダイドAIに不可欠である。
VLMのほとんどの評価はシングルビュー設定に重点を置いており、探索されていないマルチビュー情報を統合する能力を残している。
本稿では,ロボット操作におけるVLMの多視点空間推論能力を評価するためのベンチマークであるMV-RoboBenchを紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:20:09 GMT)
Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks [33.7] 下流認識タスクの強化を目的とした,新しい合成データ生成フレームワークであるDream4Driveを紹介する。
Dream4Driveは入力ビデオを複数の3D対応誘導マップに分解し、これらの誘導マップに3Dアセットをレンダリングする。
駆動世界モデルは、下流の知覚モデルをトレーニングするために使用できる編集されたマルチビュービデオを作成するために微調整される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:02:38 GMT)
When Do Transformers Learn Heuristics for Graph Connectivity? [33.7] 我々は、直径が$3Lのグラフに対して、$L$層モデルで解く能力があることを証明した。
トレーニングの力学を解析し、学習した戦略が、ほとんどのトレーニングインスタンスがこのモデルのキャパシティ内にあるかどうかにかかっていることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:43:32 GMT)
Beyond GPT-5: Making LLMs Cheaper and Better via Performance-Efficiency Optimized Routing [33.7] Avengers-Proは、大規模な言語モデルのためのテスト時間ルーティングフレームワークである。
様々な能力と効率のLCMをアンサンブルする。
最強のシングルモデルを平均精度で+7%超えることができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:23:31 GMT)
ACT: Agentic Classification Tree [33.7] 本稿では,各分割を自然言語質問として定式化することにより,決定木手法を非構造化入力に拡張するエージェント分類木(ACT)を提案する。
テキストベンチマークの実験では、ACTは透過的で解釈可能な決定パスを生成しながら、プロンプトベースのベースラインと一致またはオーバーしている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:12:00 GMT)
Augmenting Moment Retrieval: Zero-Dependency Two-Stage Learning [33.2] 局所最適化を克服するため、ゼロ外部依存性拡張モーメント検索フレームワークAMRを提案する。
AMRは、追加データなしで既存のアノテーションの曖昧な境界情報と意味的混乱を解決する。
AMRは従来の最先端のアプローチよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:19:38 GMT)
BrainPuzzle: Hybrid Physics and Data-Driven Reconstruction for Transcranial Ultrasound Tomography [33.1] この研究は、脳の正確な音速マップを再構築することで、定量的な経頭蓋超音波を実現することを目的としている。
BrainPuzzleは、物理モデリングと機械学習を組み合わせたハイブリッド2段階フレームワークである。
2つの合成データセットの実験により、BrainPuzzleはより優れたSoS再構成精度と画像完全性を達成することが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:15:55 GMT)
ToolDreamer: Instilling LLM Reasoning Into Tool Retrievers [33.1] 既存の検索モデルでは、ユーザクエリとツール記述(TD)の類似性に基づいてツールをランク付けする。
ユーザ要求がTDの言語に不整合している場合が多いため、このことがサブ最適検索に繋がる。
仮説的(合成的)なTDに基づいてツールをフェッチするための,検索モデルの条件付けを行うフレームワークであるToolDreamerを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:26:05 GMT)
Machine Unlearning under Overparameterization [33.0] 機械学習アルゴリズムは、特定のサンプルの影響を除去し、残ったデータだけで得られたであろうモデルを理想的に回復することを目的としている。
私たちは、多くのモデルが多くのアルゴリズムモデルより優れているトレーニング環境で、事前のソリューションで$asをインターポレートする。
我々は、様々な未学習実験において、正確で近似的な未学習のクラスを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:22:54 GMT)
Hummer: Towards Limited Competitive Preference Dataset [32.8] 我々は、嗜好データセット内の競合の度合いを定量化するために、新しいメトリクスAlignment Dimension Conflictを導入する。
我々は、textttHummerとその細粒度の変種である textttHummer-F を、コンフリクトアライメントの少ない革新的なペアワイズ選好データセットとして提示する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:20:40 GMT)
Automated Concern Extraction from Textual Requirements of Cyber-Physical Systems: A Multi-solution Study [32.7] サイバー物理システム(CPS)は情報空間と物理世界の深い統合によって特徴づけられる。
要求事項抽出のための自動化されたソリューションは、要件エンジニアの負担を軽減するために提案されている。
提案するReqEBenchは,12の現実世界のCPSからの2,721の要求を含む,新たなCPS要求事項抽出ベンチマークである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:44:01 GMT)
Democratizing AI scientists using ToolUniverse [32.3] ゲノム学において、統合された生態系は、相互運用、再利用、およびコミュニティ主導の開発を可能にすることによって研究を変革してきた。
ToolUniverseは、オープンウェイトモデルとクローズドウェイトモデルにまたがるあらゆる言語や推論モデルからAI科学者を構築するエコシステムです。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:03:00 GMT)
InfiFPO: Implicit Model Fusion via Preference Optimization in Large Language Models [32.3] InfiFPOは暗黙的なモデル融合のための選好最適化手法である。
これにより、ピボットモデルは、ソースモデルからの知識を効果的に蒸留しながら、人間の好みに合わせることができる。
数学、コーディング、推論タスクの能力を大幅に改善する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:55:29 GMT)
gLSTM: Mitigating Over-Squashing by Increasing Storage Capacity [32.1] 我々は,モデル記憶と検索能力のレンズを通して,過洗現象を再検討する。
我々は、情報ボトルネックがこの容量を飽和させることができることを示すために、新しい合成タスクを導入する。
キャパシティを向上した新しいGNNアーキテクチャを開発した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:55:32 GMT)
Merge then Realign: Simple and Effective Modality-Incremental Continual Learning for Multimodal LLMs [32.1] 本稿では,「Merge then ReAlign(MERA)」と呼ばれるエレガントなMCLパラダイムを提案する。
実験ではMERAの印象的な性能を実証し、平均99.84%の後方相対利得を4つのモードに拡張した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:23:29 GMT)
Personalized Safety in LLMs: A Benchmark and A Planning-Based Agent Approach [31.9] 大規模言語モデル(LLM)は、通常、同じプロンプトを与えられたすべてのユーザに対して、同一または類似の応答を生成する。
PENGUINは、7つのセンシティブなドメインにわたる14,000のシナリオからなるベンチマークである。
RAISEはトレーニングなし、2段階のエージェントフレームワークで、ユーザ固有のバックグラウンドを戦略的に取得する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:47:03 GMT)
SHAP values via sparse Fourier representation [31.8] SHAP(SHapley Additive exPlanations)値は、解釈可能で説明可能なAIにおいて、局所的特徴属性の広く用いられる方法である。
ブラックボックス設定とツリーベースモデルの両方において、SHAP値を計算するための効率的な2段階アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:01:11 GMT)
AgentSense: LLMs Empower Generalizable and Explainable Web-Based Participatory Urban Sensing [31.7] AgentSenseは、大規模な言語モデルを参加型都市センシングに統合する、トレーニング不要のフレームワークである。
我々はAgentSenseが従来の手法よりも適応性と説明性に明確な優位性を持っていることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:06:26 GMT)
Decomposed Attention Fusion in MLLMs for Training-Free Video Reasoning Segmentation [31.4] 本稿では,2つのメカニズムを通じて注意マップを改良するDecomposed Attention Fusion (DecAF)を提案する。
この方法は、無関係なアクティベーションを抑制し、オブジェクト中心のキューを強化し、アテンションマップを粗いセグメンテーションマスクへ直接変換する。
DecAFはトレーニングフリーのメソッドより優れており、VOSベンチマークの参照と推論の両方でトレーニングベースのメソッドに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:42:59 GMT)
PULSE: Practical Evaluation Scenarios for Large Multimodal Model Unlearning [31.2] LMMのための現実的な未学習シナリオのためのPULSEプロトコルを提案する。
そして、これらの次元に沿って既存の未学習手法を評価する。
以上の結果から,いくつかの技術は微調整によって習得した知識を学べるが,事前学習中に学習した情報の除去に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:39:55 GMT)
Unlearned but Not Forgotten: Data Extraction after Exact Unlearning in LLM [31.1] 学習前モデルからの信号を利用して学習後モデルを導く新しいデータ抽出攻撃を導入する。
シミュレーションされた医療診断データセット上での攻撃の有効性を実証し、正確なアンラーニングに関連する現実世界のプライバシーリスクを明らかにする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:51:21 GMT)
Bi-Level Decision-Focused Causal Learning for Large-Scale Marketing Optimization: Bridging Observational and Experimental Data [31.0] 本稿では,Bi-DFCL(Bi-level Decision-Focused Causal Learning)を提案する。
実験データを用いてOR判定品質の偏りのない推定器を開発する。
Bi-DFCLは世界最大のオンラインフードデリバリープラットフォームであるMeituanで展開されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:16:53 GMT)
metaTextGrad: Automatically optimizing language model optimizers [31.0] 大規模言語モデル(LLM)は、学習アルゴリズム、評価、最適化タスクにますます使われている。
近年の研究では、モデルプロンプトやデモ、予測自体、その他のコンポーネントの自動最適化にLLMベースの手法を用いることで、AIシステムのパフォーマンスが大幅に向上することが示されている。
提案手法は,メタプロンプトとメタ構造という2つの重要なコンポーネントから構成される。この2つの組み合わせは,複数のベンチマークにおけるパフォーマンスを著しく向上させ,最高のベースラインと比較して平均6%の絶対性能向上を実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:27:06 GMT)
Restoring Pruned Large Language Models via Lost Component Compensation [30.7] プルーニング(Pruning)は、大規模言語モデル(LLM)のサイズと推論コストを減らすために広く使われている技法である。
本稿では,低コスト・高効率を保ちながら性能を回復するプルーニングモデルに対する目標復元戦略を提案する。
この知見に基づいて,アクティベーション編集により重要な注意点を対照的に探索するプラグアンドプレイ方式であるRestoreLCCを導入し,アクティベーションの差異から失われた成分を抽出し,最終的に対応するプルーンドヘッドに注入して補償と回復を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:08:18 GMT)
Modal Aphasia: Can Unified Multimodal Models Describe Images From Memory? [30.4] 主要フロンティアモデルでは、象徴的な映画作品のほぼ完璧な再現を生成できるが、テキスト記述を依頼すると重要な詳細を混乱させる。
実験により,現在の統合マルチモーダルモデルの基本的な性質として,モーダル失語が確実に出現することが確認された。
実際には、モーダル失語は、あるモダリティに適用されたセーフガードが他のモダリティでアクセス可能な有害な概念を残す可能性があるため、AI安全フレームワークの脆弱性を導入する可能性がある。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:39:59 GMT)
BrainMCLIP: Brain Image Decoding with Multi-Layer feature Fusion of CLIP [30.4] 本稿では,人間の視覚系の機能的階層によって導かれるパラメータ効率・多層融合手法の先駆者であるBrainMCLIPを紹介する。
BrainMCLIPは機能的に異なる視覚領域からのfMRI信号を対応する中間層と最終層に整列し、機能的階層を尊重する。
結果から,BrainMCLIPは高い競争力,特に高レベルのセマンティックメトリクスに優れることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:51:52 GMT)
Are Modern Speech Enhancement Systems Vulnerable to Adversarial Attacks? [30.1] 本研究は, 音声強調モデルに対向雑音を注入できることを示す。
予測音声強調モデルが実際にこのような方法で操作可能であることを実験的に検証する。
我々は, サンプルを用いた拡散モデルが, 設計によるこのような敵攻撃に対して, 本質的に堅牢性を示すことを強調した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:49:56 GMT)
Zhyper: Factorized Hypernetworks for Conditioned LLM Fine-Tuning [29.9] LLM(Large Language Model)とは、LLMに特定の文化の規範や価値観に従ってコンテンツを生成するよう指示することである。
Zhyperは、コンテキスト認識型LoRAアダプタを生成するパラメータ効率の係数化ハイパーネットワークフレームワークである。
複数のベンチマークの実験では、Zhyperの競合性能は最先端のベースラインよりも最大で26倍も低いことが示されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:25:43 GMT)
CARES: Context-Aware Resolution Selector for VLMs [29.7] 大規模な視覚言語モデル(VLM)は、通常、ネイティブまたは高解像度で画像を処理し、タスク全体にわたって効果的に維持する。
本稿では,簡単な事前処理モジュールであるemphCARESを紹介する。
CARESはタスク性能を最大80%削減しながら維持する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:44:31 GMT)
From Script to Stage: Automating Experimental Design for Social Simulations with LLMs [29.7] 本稿では,スクリプト生成に基づく自動マルチエージェント実験設計フレームワークを提案する。
この枠組みは決定劇場の概念にインスパイアされている。
政策立案と研究のための新しい意思決定支援ツールを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:50:33 GMT)
Natural Gradient VI: Guarantees for Non-Conjugate Models [29.7] 自然自然変分推論(NGVI)は確率モデルにおける後部分布を近似する手法として広く用いられている。
NGVI収束保証が非クリコンジューゲート設定にまで拡張されないことを示す。
我々は,非ユースを組み込んだNGVIアルゴリズムを提案し,その大域的非漸近収束を定常点に証明する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:46:31 GMT)
MINGLE: Mixture of Null-Space Gated Low-Rank Experts for Test-Time Continual Model Merging [29.6] 連続モデルマージは、オリジナルのトレーニングデータにアクセスすることなく、独立して微調整されたモデルを順次統合する。
テスト時間連続モデルマージの新しいフレームワークであるMINGLEを提案する。
MINGLEは堅牢な一般化を実現し、忘れることを大幅に減らし、従来の最先端の手法を平均で7-9%上回っている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:04:00 GMT)
GRASPLAT: Enabling dexterous grasping through novel view synthesis [29.6] GRASPLATは、RGBイメージのみをトレーニングしながら、一貫性のある3D情報を活用する、新しい把握フレームワークである。
我々の重要な洞察は、物体をつかむ手の物理的に可塑性なイメージを合成することで、対応する手関節を回復させることで、うまくつかむことができるということである。
従来の手法と異なり,本手法では,レンダリング画像と実画像との差を最小化することにより,予測の把握を洗練する測光損失を取り入れている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:19:26 GMT)
QoQ-Med: Building Multimodal Clinical Foundation Models with Domain-Aware GRPO Training [29.6] QoQ-Medは、医療画像、時系列信号、およびテキストレポートを共同で原因付ける、最初のオープン・ジェネラリスト臨床基礎モデルである。
DRPOトレーニングは,すべての視覚領域において,マクロF1の診断性能を平均43%向上させることを示した。
QoQ-Medは集中的なセグメンテーションデータに基づいてトレーニングされており、オープンモデルよりもIoU 10倍高い、診断に関連する健全な領域をハイライトすることができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:18:21 GMT)
olmOCR 2: Unit Test Rewards for Document OCR [29.5] olmOCR 2は、PDFのようなデジタル化された印刷文書を、クリーンで自然に順序付けられたプレーンテキストに変換する強力なOCRシステム群の最新版です。
olmOCR 2は、強化学習を用いて訓練された7B視覚言語モデル(VLM)であるolmOCR-2-7B-1025で駆動される。
これらのテストケースに対するRLトレーニングは、我々の英語OCRベンチマークであるolmOCR-Benchにおける最先端のパフォーマンスをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:53:02 GMT)
FairGRPO: Fair Reinforcement Learning for Equitable Clinical Reasoning [29.3] FairGRPO(Fairness-Aware Group Relative Policy Optimization)は、異種臨床集団における公平な学習を促進する階層的強化学習手法である。
また,FairGRPOは全バニラに対する予測パリティを27.2%削減し,RLベースラインを緩和し,F1スコアを12.49%改善することを示した。
FairGRPOをベースとしたFairMedGemma-4Bは,最先端の性能を実現するとともに,人口集団間の格差を著しく低減した臨床VLLMである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:26:16 GMT)
Understanding Reasoning in Thinking Language Models via Steering Vectors [29.1] 我々はDeepSeek-R1-Distillモデルにおいて、特定の推論動作を分析し、操作する。
これらの挙動はモデルの活性化空間における線形方向によって媒介され、ステアリングベクトルを用いて制御できることを実証する。
提案手法は,思考モデルにおける推論過程を制御的かつ解釈可能な方法で操る実用的なツールを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:57:18 GMT)
Base Models Know How to Reason, Thinking Models Learn When [29.1] 一貫性のあるパフォーマンス向上にもかかわらず、思考モデルがどのようにして全く新しい推論能力を学ぶのかは不明だ。
本稿では,ベースモデルにおける推論機構を適切なタイミングで活性化し,思考モデルレベルの推論連鎖を導出するハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:02:22 GMT)
KORE: Enhancing Knowledge Injection for Large Multimodal Models via Knowledge-Oriented Augmentations and Constraints [29.1] 大規模マルチモーダルモデルは、事前訓練された重量における広範な事実知識を符号化する。
既存の方法は、しばしば新しい知識を学ぶのに苦労し、破滅的な忘れに苦しむ。
古い知識を保ちながら,大規模なマルチモーダルモデルに新たな知識を注入する方法である KORE を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:26:55 GMT)
Comparing Uniform Price and Discriminatory Multi-Unit Auctions through Regret Minimization [28.9] 繰り返し行われるマルチユニットオークションは、電気市場や金融オークションにおいて一般的なメカニズムである。
単価と差別的オークションの2つの主要なフォーマットを比較し,競争相手に対する入札を学習する単一入札者の視点に着目した。
単価オークションは,$tildeTheta ( sqrtT )$として,識別オークションが$tildeTheta (T2/3 )$のままである場合に,学習速度が向上する可能性があることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:41:27 GMT)
Imbalanced Gradients in RL Post-Training of Multi-Task LLMs [28.8] 大規模言語モデルのマルチタスク後トレーニングは、通常、異なるタスクからデータセットを混合し、それらを共同で最適化することで実行される。
本稿では,この仮定がRL後の学習において失敗することを示す。
大規模な段階的なタスクは、小規模段階のタスクと同じような、あるいははるかに低い学習ゲインを達成することができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:35:27 GMT)
The Streaming Batch Model for Efficient and Fault-Tolerant Heterogeneous Execution [28.8] 異種バッチ推論パイプラインのスループットを2.5~12$times$で向上するストリーミングバッチシステムであるRay Dataを紹介します。
Ray Dataは、シングルノードMLデータローダと比較して、安定拡散のようなマルチモーダルモデルのトレーニングスループットを31%改善する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:41:35 GMT)
A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning [28.7] 上記の問題に対処するためのグラフィカルフレームワークとして,マルチエージェント・インフルエンス・ダイアグラム(MAID)を採用している。
まず、MAIDを用いたMARL相互作用のパラダイムの概念を導入し、未指導の自己組織化とグローバルガイダンスのメカニズムの両方を分析し視覚化する。
そこで本研究では,単一のターゲットエージェントにのみ適用可能な,新たなMARLインタラクションパラダイムを設計する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:59:09 GMT)
Exploring "Many in Few" and "Few in Many" Properties in Long-Tailed, Highly-Imbalanced IC Defect Classification [28.6] 本稿では,AOIシステムから得られた大規模かつ不均衡なIC欠陥画像データセットであるIC-Defect-14について紹介する。
このデータセットは、大きなクラス内多様性と高いクラス間類似性という2つの大きな課題を示す、独自の"イントラクラスクラスタ"特性によって特徴づけられる。
本稿では,マルチエキスパートフレームワークを踏襲したReCAME-Netを提案し,地域チャネルアテンションモジュール,メトリック学習損失,ハードカテゴリマイニング戦略,知識蒸留手法を統合する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:50:27 GMT)
Improving the Physics of Video Generation with VJEPA-2 Reward Signal [28.6] 最先端のビデオ生成モデルは、物理的な理解が極めて限られている。
直感的な物理理解は、自然なビデオでSSLの事前トレーニングから現れている。
VJEPA-2を報酬信号として活用することにより、最先端のビデオ生成モデルの物理的妥当性を6%向上できることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:40:38 GMT)
Learning Differential Pyramid Representation for Tone Mapping [28.6] 高忠実度トーンマッピングのためのエンドツーエンドフレームワークである差分ピラミッド表現ネットワーク(DPRNet)を提案する。
DPRNetは、ダウンサンプル入力で動作するグローバルトーン知覚とローカルトーンチューニングモジュールを組み込んでいる。
DPRNetは最先端の結果を達成し、4K HDR+データセットでは2.39dB、4K HDRI Havenデータセットでは3.01dB、PSNRは2.39dB向上した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:24:13 GMT)
Beyond Masked and Unmasked: Discrete Diffusion Models via Partial Masking [28.6] マスケード拡散モデル(MDM)は、離散データのための強力な生成モデルであり、段階的にトークンを配列で解き放つことでサンプルを生成する。
本稿では、トークンがマスクされた状態とマスクされていない状態の間を中間状態にすることでMDMを増強する部分マスキングスキーム(Prime)を提案する。
本手法は,多種多様な生成モデルタスクに対して優れた性能を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:25:33 GMT)
Heavy-Ball Momentum Method in Continuous Time and Discretization Error Analysis [28.5] 本稿では, 離散重ボール運動量法(HB)に対して, 連続時間近似, ピースワイド連続微分方程式を明示的離散化誤差で確立する。
アプリケーションとして、方向スムーズ性の新しい暗黙的正規化を見つけ、対角線ネットワークにおけるHBの暗黙的バイアスを調べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:09:13 GMT)
Graph Few-Shot Learning via Adaptive Spectrum Experts and Cross-Set Distribution Calibration [28.3] グラフによる数ショット学習は、ラベル付きノードに制限のある新しいタスクにモデルを迅速に適応できる能力によって、注目を集めている。
本稿では,アダプティブスペクトルの専門家とクロスセット分布キャリブレーション技術を統合した新しいグラフ数ショット LeRning フレームワーク GRACE を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:45:52 GMT)
Loopholing Discrete Diffusion: Deterministic Bypass of the Sampling Wall [28.2] 決定論的潜在経路を介して情報を保存する,新規でシンプルな機構であるLoopholingを紹介する。
LDDMは、以前のベースラインよりも最大で61%高い生成的パープレキシティを著しく向上させる。
また、ループホリングはアイドルステップや振動を緩和し、高品質な非自己回帰テキスト生成へのスケーラブルな経路を提供することを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:08:47 GMT)
Optimized Distortion in Linear Social Choice [28.2] 決定的およびランダムな投票規則に対する線形社会的選択の歪みについて検討する。
候補と票の集合による歪みを最小化する多時間インスタンス最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:42:49 GMT)
Data-Centric Lessons To Improve Speech-Language Pretraining [28.1] Spoken Question-Answering (SQA)は、有用な対話型人工知能システムのためのコア機能である。
我々は、言語事前学習データの基本となる3つの研究課題に焦点をあてる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:34:59 GMT)
DAIL: Beyond Task Ambiguity for Language-Conditioned Reinforcement Learning [28.0] DAIL(Distributional Aligned Learning)には,分散ポリシとセマンティックアライメントという2つの重要な要素がある。
DAILは命令のあいまいさを効果的に解決し,ベースライン手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:16:46 GMT)
Pretraining Decision Transformers with Reward Prediction for In-Context Multi-task Structured Bandit Learning [28.0] マルチタスク構造化バンディット問題の学習について検討する。
目的は、累積的後悔を最小限に抑える、ほぼ最適アルゴリズムを学ぶことである。
我々は、この共有構造をデモンストレーターが収集したデータから学習するために、トランスフォーマーを意思決定アルゴリズムとして利用する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:06:09 GMT)
Tibetan Language and AI: A Comprehensive Survey of Resources, Methods and Challenges [27.7] チベット語はアジアの主要な低資源言語の一つである。
少数言語向けのAIシステムの開発への関心が高まっているにもかかわらず、チベット語はアクセス可能なデータリソースが不足しているため、限られた注目を集めている。
本稿は,AI分野におけるチベットAIの現状を包括的に調査する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:29:35 GMT)
Surfer 2: The Next Generation of Cross-Platform Computer Use Agents [27.6] Surfer 2は3つの環境すべてにわたって最先端のパフォーマンスを実現する統一アーキテクチャである。
WebVoyagerでは97.1%の精度、WebArenaでは69.6%の精度、OSWorldでは60.1%、AndroidWorldでは87.1%の精度が達成され、タスク固有の微調整を伴わない以前のシステムよりも優れていた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:21:52 GMT)
Mitigating Privacy-Utility Trade-off in Decentralized Federated Learning via $f$-Differential Privacy [27.3] Decentralized Federated Learning (FL)により、ローカルユーザはデータを中央サーバと共有することなく、協力できる。
プライベートFLアルゴリズムのプライバシー予算を正確に定量化することは、複雑なアルゴリズムコンポーネントの共存によって困難である。
本稿では、$f$-differential privacy(f$-DP)フレームワーク内の2つの分散FLアルゴリズムのプライバシ会計について述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:01:08 GMT)
Human-Agent Collaborative Paper-to-Page Crafting for Under $0.1 [27.3] AutoPageは、ナラティブプランニングからマルチモーダルコンテンツ生成、インタラクティブレンダリングに至るまで、ページ間作成を粗いパイプラインに分解する。
テストによると、AutoPageは高品質で視覚的に魅力的なページを生成するだけでなく、15分未満で0.1ドル未満で驚くほど効率が良い。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:53:57 GMT)
ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning [27.3] 本稿では、ファンデーションモデルによるARM-FM: Automated Reward Machinesを紹介する。
強化学習における自動構成報酬設計のためのフレームワークである。
ARM-FMの有効性を示す実証的な証拠を,多様な環境において提示する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:22:08 GMT)
AgenticMath: Enhancing LLM Reasoning via Agentic-based Math Data Generation [27.2] AgenticMathは、高品質な数学的質問応答ペアを生成するための新しいエージェントパイプラインである。
提案手法は,(1)高情報豊かさ,複雑性,明快さの質問を選択できるシード質問フィルタ,(2)多エージェントシステムを用いて多様な論理的一貫したパラフレーズを生成するエージェント質問文生成ステップ,(3)チェーン・オブ・シークレット推論を用いて回答を書き直し,数値的および論理的正当性を高めるアンサー拡張ステップの4段階を通じて機能する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:34:13 GMT)
Fock space fragmentation in quenches of disordered interacting fermions [27.2] ランダムなオンサイトフィールドを持つXXZモデルのような乱れたシステムでは、フラグメンテーションは自然な概念として現れる。
従来のMBdL研究で報告された緩和ダイナミクスの減速は、(本質的には)ここで導入されたフォック空間の断片化の顕在化である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:05:02 GMT)
AegisRF: Adversarial Perturbations Guided with Sensitivity for Protecting Intellectual Property of Neural Radiance Fields [27.1] AegisRFは、NeRF(3D Neural Radiance Fields)の知的特性を不正使用から保護することを目的としている。
AegisRFは、幾何学的摂動を適応的に制限する感度を学習し、不正使用を妨害しながらレンダリング品質を保っている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:45:42 GMT)
3D Visual Illusion Depth Estimation [27.0] 本研究は, 単眼・両眼深度推定を含む3次元視覚錯覚によって, マシン・ヴィジュアライゼーション・システムが真面目に騙されていることを示す。
視覚言語モデルから共通感覚を用いて両眼の視差と単眼の視深度を適応的に融合する3次元視覚錯視深度推定フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:13:49 GMT)
The Zero-Step Thinking: An Empirical Study of Mode Selection as Harder Early Exit in Reasoning Models [26.9] モード選択は、ThinkingモードまたはNoThinkingモードを利用することで、Long-CoT(Chain-of-Thought)とShort-CoTを自動で決定することを目的としている。
我々は,手作りの情報を最小限に抑えると,限られた分類能力のために,プロンプトベースのアプローチが失敗することが多いことを観察する。
その結果,モデルが提供する情報のみに依存する既存の手法では,モード選択を効果的に扱うには不十分であることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:28:10 GMT)
D2D: Detector-to-Differentiable Critic for Improved Numeracy in Text-to-Image Generation [26.8] Detector-to-Differentiable (D2D)は、微分不可能な検出モデルを微分可能な批評家に変換する新しいフレームワークである。
SDXL-Turbo, SD-Turbo, Pixart-DMDを用いた実験により, オブジェクトカウント精度が一貫した, 実質的な改善が示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:27:05 GMT)
Not-a-Bandit: Provably No-Regret Drafter Selection in Speculative Decoding for LLMs [26.8] 対象モデルにクエリを追加することなく、選択したモデルのみではなく、すべてのドラフトモデルを正確に評価できることを示します。
オンライン学習者のシステム効率のよいバージョンを設計し、計算とレイテンシのオーバーヘッドを大幅に削減できることを実証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:32:26 GMT)
Pay Attention to Small Weights [26.6] NanoADAMは、微調整中に小さなマグニチュードのみを動的に更新する。
これは、事前訓練中に学んだ重要な特徴をエンコードする可能性が高い、大きなマグニチュードの重量を保存する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:21:37 GMT)
Latent Diffusion Models with Masked AutoEncoders [26.1] 潜在拡散モデル(LDM)におけるオートエンコーダの役割の解析
我々は3つの重要な特性を識別する:潜時滑らかさ、知覚的圧縮品質、再構成品質。
変分マスク付きオートエンコーダ(VMAE)を遅延拡散モデルフレームワークに導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:44:29 GMT)
Beating the Winner's Curse via Inference-Aware Policy Optimization [26.0] 一般的なアプローチは、機械学習モデルをトレーニングして反現実的な結果を予測し、予測された客観的価値を最適化するポリシーを選択することである。
提案手法は,政策を下流でどのように評価するかを考慮し,政策最適化を改良する,推論対応政策最適化と呼ばれる新しい戦略を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:10:51 GMT)
Stable Minima of ReLU Neural Networks Suffer from the Curse of Dimensionality: The Neural Shattering Phenomenon [26.0] 平坦さ/低(ロス)曲率の暗黙バイアスとそのReLUネットワークの一般化への影響について検討する。
平坦性は一般化を示唆するが, 入力次元が大きくなるにつれて収束速度は指数関数的に低下する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:49:24 GMT)
The Art of Asking: Multilingual Prompt Optimization for Synthetic Data [25.8] 過度に見過ごされる空間-トレーニング分布を定義する入力は、多言語性能を改善するためのより強力なレバーである、と我々は主張する。
本稿では,自然性,文化適応,難易度向上のために,翻訳されたプロンプトを体系的に変換する,プロンプト空間最適化のための軽量なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:41:20 GMT)
MaNGO - Adaptable Graph Network Simulators via Meta-Learning [25.8] グラフネットワークシミュレータ(GNS)はより高速な推論を提供するが、2つの重要な制限がある。
物理的パラメータの小さなバリエーションのために、スクラッチから再訓練されなければならない。
これは非効率であり、パラメータの異なるシミュレーションは共通の潜在構造を共有することが多い。
本稿では,条件付きニューラルプロセスを用いて,グラフトラジェクトリを符号化して潜在表現を生成するアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:39:57 GMT)
Compositional Coordination for Multi-Robot Teams with Large Language Models [25.7] LAN2CBは、自然言語(NL)のミッション記述をマルチロボットシステムのためのPythonコードに変換する。
シミュレーションおよび実環境における実験により、LAN2CBは自然言語からの堅牢で柔軟なマルチロボット協調を可能にすることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:05:38 GMT)
A Derandomization Framework for Structure Discovery: Applications in Neural Networks and Beyond [25.6] 構造発見の側面に注目し、より弱い仮定の下で研究する。
私たちのアプローチの中核は、キー$textitderandomization$ lemmaです。
この補題は構造発見を直接説明し、他の領域で直ちに適用することができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:55:00 GMT)
Guiding diffusion models to reconstruct flow fields from sparse data [25.3] 本研究では,高忠実度サンプルの再構成を可能にする拡散モデルのための新しいサンプリング手法を提案する。
本手法は流体構造予測において他の拡散法よりも常に優れる。
本研究では,流れ場データ再構成における拡散モデルの顕著な可能性について述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:01:50 GMT)
PARCO: Parallel AutoRegressive Models for Multi-Agent Combinatorial Optimization [25.2] PARCOはマルチエージェントタスクのための高品質なソリューションを効率的に構築するために設計された強化学習フレームワークである。
マルチエージェント車両のルーティングとスケジューリングにおけるPARCOの評価を行い,提案手法は最先端の学習方法よりも優れていることを示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:58:55 GMT)
InvarGC: Invariant Granger Causality for Heterogeneous Interventional Time Series under Latent Confounding [24.9] 従来のグランガー因果関係検査は、穏やかな非線形因果関係の検出に失敗することが多い。
Invariant Granger Causality (InvarGC) を提案する。
合成と実世界の両方のデータセットに対する大規模な実験は、我々のアプローチの競争力を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:04:49 GMT)
Online Handwritten Signature Verification Based on Temporal-Spatial Graph Attention Transformer [24.8] 本稿では,時間空間グラフ注意変換器(TS-GATR)の動的シグネチャ検証手法を提案する。
TS-GATR は Graph Attention Network (GAT) と Gated Recurrent Unit (GRU) を組み合わせて、署名データの空間的および時間的依存関係をモデル化する。
長期の時間的依存関係をキャプチャするために、モデルはGRUを統合し、署名検証中に動的特徴を学習する能力を向上する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:32:55 GMT)
Spiking Neural Networks Need High Frequency Information [24.6] スパイキングニューラルネットワークは、バイナリ(0/1)スパイクを通じて情報を伝達することで、脳にインスパイアされた計算を約束する。
しかし、それらの性能は、しばしば情報損失によって引き起こされると仮定される、人工知能ニューラルネットワークよりもまだ遅れている。
スパイキングニューロンは本質的に高周波成分を抑制し,低周波情報を優先的に伝播することを示す。
2つの周波数エンハンシング演算子を通して高周波信号を復元するMax-Formerを導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:17:21 GMT)
Enabling Reconfiguration-Communication Overlap for Collective Communication in Optical Networks [24.6] 大規模分散機械学習(DML)トレーニングワークロードでは,集合的コミュニケーションが広く採用されている。
既存の光配線型CCスキームはワンショットネットワーク再構成を採用している」
本稿では,要求対応光ネットワークフレームワークSWOTを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:34:04 GMT)
Learning To Defer To A Population With Limited Demonstrations [24.4] 本稿では,L2D(L2D)システムを人口に遅延させる学習の実践的展開を妨げる重要なデータ不足に対処する。
メタラーニングを用いて,少数のデモンストレーションから専門家固有の埋め込みを生成する,コンテキスト対応の半教師付きフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:18:02 GMT)
ROTATE: Regret-driven Open-ended Training for Ad Hoc Teamwork [24.4] Ad Hoc Teamwork(AHT)として知られるマルチエージェント学習の基本的な一般化課題である。
本稿では,AHTエージェントと対向チームメイトジェネレータ間のオープンエンド学習プロセスとして問題を再構築し,AHTの統一フレームワークを提案する。
多様な2人プレイ環境における実験は、ROTATEがチームメイトの評価の見当たらないセットに一般化する際に、ベースラインを著しく上回っていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:21:10 GMT)
From TOWER to SPIRE: Adding the Speech Modality to a Translation-Specialist LLM [24.3] 音声入力を英語から10言語に翻訳・翻訳できる音声拡張言語モデル(LM)であるSpireを紹介する。
Spireは、音声の離散化を通じて既存の多言語LMに統合し、わずか42.5K時間で事前学習を継続する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:47:03 GMT)
Beyond Hearing: Learning Task-agnostic ExG Representations from Earphones via Physiology-informed Tokenization [24.3] スケーラブルでタスクに依存しないExGモニタリングのためのアプローチを野放しに導入する。
提案手法の核心は, 生理的インフォームド・マルチバンド・トークン化(PiMT)であり, ExG信号を12個の生理的インフォームドトークンに分解する。
新しいDailySenseデータセットの実験は、5つの人間の感覚でExGベースの分析を可能にする最初の試みだ。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:11:02 GMT)
Policy Learning with Abstention [24.3] 我々は、政策学習を棄権で研究し、政策が安全なデフォルトまたは専門家に延期される可能性がある。
ポリシーが停止すると、ランダムな推測の値の上に小さな付加的な報酬が与えられる。
政策学習における他の中核的問題への直接的応用において,禁忌は汎用的なツールであることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:18:29 GMT)
Learning from Videos for 3D World: Enhancing MLLMs with 3D Vision Geometry Priors [24.3] これまで,ビデオとして解釈することで3次元シーンの理解にMLLM(Multimodal Large Language Models)を適用する研究が続けられてきた。
ビデオ3次元幾何大言語モデル(VG LLM)と呼ばれる新しい,効率的な手法を提案する。
提案手法では,映像系列から3次元先行情報を抽出するために3次元ビジュアルジオメトリエンコーダを用いる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:04:01 GMT)
Language Models (Mostly) Know When to Stop Reading [24.2] 大規模言語モデル(LLM)は、クエリに応答するために必要な情報がコンテキスト内にローカライズされた場合、入力コンテキスト全体を無差別に処理する。
タスク関連情報を取得する際に, LLM が自己決定処理を行うことのできる新しい手法である動的コンテキストカットオフを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:46:56 GMT)
Do Prompts Reshape Representations? An Empirical Study of Prompting Effects on Embeddings [24.2] 本研究では,プロンプトと内部表現の質の関係について検討する。
我々の発見は、より関連性の高いプロンプトが必ずしもより良い表現につながるという仮定に挑戦する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:43:40 GMT)
Conditions for Catastrophic Forgetting in Multilingual Translation [24.1] 多言語微調整における破滅的忘れを誘発する条件を同定する。
モデルとデータサイズの間の相対的なスケールは、忘れる際の主要な決定要因であることを示す。
また, 言語間アライメントは, 忘れを軽減し, 未確認対象言語への肯定的な移動を促進することも示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:54:00 GMT)
Lookahead Routing for Large Language Models [24.1] Lookaheadは、潜在的なモデル出力を"予測"し、これらの予測を使ってモデル選択をガイドするルーティングフレームワークである。
7つの公開ベンチマークに対する実証的な評価は、Lookaheadが既存のルーティングベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:00:21 GMT)
Natural Language Processing for Cardiology: A Narrative Review [23.9] 本総説では,2014年から2025年までのNLP研究の概要について概説する。
各種心血管疾患におけるNLP応用について,6つの文献データベースを体系的に検索した。
心疾患におけるNLP研究の広さと進展を反映し,これらの領域でかなりの多様性が認められた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:45:10 GMT)
Transformers are almost optimal metalearners for linear classification [23.8] 線形分類設定において,勾配降下による簡易な変圧器アーキテクチャが準最適メタラーとして機能することを示す。
我々は、この変換器が、テスト時に信号強度を表す$O(k / R4)$ in-contextの例だけで、新しいタスクに一般化できることを示します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:32:36 GMT)
Are Greedy Task Orderings Better Than Random in Continual Linear Regression? [23.7] 線形回帰のための連続学習におけるタスク順序の解析を行う。
我々は,連続タスク間の相違性を極度に最大化する順序付けに着目する。
我々は,タスク間の平均損失の点で,欲求順序はランダムな順序よりも早く収束することを示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:09:59 GMT)
ARA: Adaptive Rank Allocation for Efficient Large Language Model SVD Compression [23.6] 大言語モデル(LLM)圧縮では、特異値分解(SVD)は広く研究され、採用されている低ランク分解技術である。
グローバル圧縮比制約の下では、異なる線形加群に対する適切なランクを決定することが重要な問題となる。
この問題に対処するための適応ランクアロケーション(ARA)手法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:05:47 GMT)
FidelityGPT: Correcting Decompilation Distortions with Retrieval Augmented Generation [23.3] 逆コンパイルはマシンコードを可読形式に変換し、ソースコードなしで解析とデバッグを可能にする。
変数のリネームや構造的単純化といった既存の手法は部分的な改善を提供するが、堅牢な検出と修正は欠如している。
本稿では,意味的歪みを系統的に検出し,修正することにより,デコンパイルされたコード精度と可読性を向上するフレームワークであるFidelityGPTを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:11:44 GMT)
Advancing Image Super-resolution Techniques in Remote Sensing: A Comprehensive Survey [23.2] リモートセンシング画像超解像(RSISR)は,リモートセンシング画像処理において重要な課題である。
近年、RSISR法が提案されているが、これらの手法の体系的かつ包括的なレビューはいまだに欠落している。
本稿では、RSISRアルゴリズムの徹底的なレビューを行い、方法論、データセット、評価指標について述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:25:14 GMT)
MUG-V 10B: High-efficiency Training Pipeline for Large Video Generation Models [23.1] 大規模なビデオ生成モデルのトレーニングは、依然として困難でリソース集約的だ。
データ処理,モデルアーキテクチャ,トレーニング戦略,インフラストラクチャの4つの柱を最適化するトレーニングフレームワークを提案する。
モデルウェイト,Megatron-Coreベースの大規模トレーニングコード,ビデオ生成と拡張のための推論パイプラインなどを含む,完全なスタックをオープンソースとして公開しています。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:01:01 GMT)
Environment Inference for Learning Generalizable Dynamical System [23.0] 本研究では,各トレーニングラウンドにおける固定ニューラルネットワークからの予測誤差を分析し,環境仕様を推論する新しい手法DynaInferを提案する。
その結果、DynaInferは既存の環境割当技術より優れ、真のラベルに迅速に収束し、環境ラベルが利用できる場合にも優れた性能を達成できることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:20:12 GMT)
Evolution of Information in Interactive Decision Making: A Case Study for Multi-Armed Bandits [22.8] マルチアームバンディット問題のレンズによる対話型意思決定における情報の進化について検討する。
最適な成功確率と相互情報の分離が可能であり、最適学習を達成するためには、必ずしも情報の獲得を最大化する必要がなくなる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:28:45 GMT)
FPT-Noise: Dynamic Scene-Aware Counterattack for Test-Time Adversarial Defense in Vision-Language Models [22.7] 我々は、新しいテストタイムディフェンスを提案する: 特徴知覚閾値対攻撃ノイズ(FPT-Noise)
FPT-Noiseは、コストのかかる微調整なしにCLIPの対向性を高める。
大規模な実験により、FPT-Noiseは既存のテスト時間防衛法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:29:35 GMT)
ModServe: Modality- and Stage-Aware Resource Disaggregation for Scalable Multimodal Model Serving [22.7] 大規模なマルチモーダルモデル(LMM)は、画像、ビデオ、音声をテキストを超えて理解する能力を示す。
本稿では,6つの代表的なオープンソースモデルに対して,デコーダのみとクロスアテンションという,2つの著名なLMMアーキテクチャを包括的に解析する。
本稿では,モジュール型LMMサービスシステムであるModServeを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:21:57 GMT)
Uni-Instruct: One-step Diffusion Model through Unified Diffusion Divergence Instruction [22.7] Uni-Instructは、$f$-divergenceファミリーの拡散展開理論によって動機付けられている。
CIFAR10 生成ベンチマークでは、Uni-Instruct は無条件生成のための textbfemph1.46 のレコード破りの Frechet Inception Distance (FID) 値を達成する。
ImageNet-$64times 64$ Generationベンチマークでは、Uni-Instruct が textbfemph1.02 の SoTA 1ステップ生成 FID を新たに達成した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:07:38 GMT)
FairGen: Controlling Sensitive Attributes for Fair Generations in Diffusion Models via Adaptive Latent Guidance [22.6] テキストと画像の拡散モデルは、しばしば特定の人口集団に対するバイアスを示す。
本稿では,任意の属性値に対して生成バイアスを緩和する課題に取り組む。
推論中の生成分布を制御する適応型潜伏誘導機構であるFairGenを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:40:44 GMT)
MINED: Probing and Updating with Multimodal Time-Sensitive Knowledge for Large Multimodal Models [22.5] 大規模マルチモーダルモデルは、クロスモーダル事前学習を通じて豊富な事実知識を符号化する。
MINEDは6つの重要な次元と11の課題に沿った時間的認識を評価するベンチマークである。
Gemini-2.5-Pro は平均 CEM スコア 63.07 を達成しているが、ほとんどのオープンソース LMM には時間理解能力がない。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:41:57 GMT)
Optimized 3D Gaussian Splatting using Coarse-to-Fine Image Frequency Modulation [22.0] 本稿では,新しい周波数変調粗粒度最適化フレームワークOpti3DGSを提案する。
本手法は多くの3DGS技術とシームレスに統合可能であることを示す。
また、Opti3DGSは本質的に余分なコストを伴わずに詳細シーン表現を生成できることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:31:43 GMT)
Advances in 4D Representation: Geometry, Motion, and Interaction [22.0] コンピュータグラフィックスの高速進化サブフィールドである4次元生成と再構成について調査する。
私たちは4D表現のユニークで独特な視点から、ドメインのカバレッジを構築します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:22:20 GMT)
Meeseeks: A Feedback-Driven, Iterative Self-Correction Benchmark evaluating LLMs' Instruction Following Capability [22.0] フィードバック機構を組み込んだ完全に自動化された命令追従ベンチマークであるMeeseeksを紹介した。
Meeseeksは、モデル応答における誤ったコンポーネントを特定し、対応するフィードバックを正確に提供することで、モデルを自己補正に向けて反復的に導く。
我々は、マクロレベルとインスタンスレベルの両方から包括的な分析を行い、現在の最先端モデルでよく見られる多くの共通問題を明らかにした。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:50:08 GMT)
Using Non-Expert Data to Robustify Imitation Learning via Offline Reinforcement Learning [21.9] オフライン強化学習は、非専門的なデータを利用して模倣学習ポリシーの性能を向上させることができることを示す。
提案手法は, オフラインRLにより拡張された模倣アルゴリズムにより, タスクを頑健に解決できることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:43:39 GMT)
NeSyPr: Neurosymbolic Proceduralization For Efficient Embodied Reasoning [21.7] NeSyPrは、ニューロシンボリックな手続き化を通じて知識をコンパイルする、新しい具体的推論フレームワークである。
外部のシンボルガイダンスに頼ることなく、効率的なテスト時間推論をサポートする。
我々は,PDDLGym,VirtualHome,ALFWorldを具現化したベンチマーク上でNeSyPrを評価した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:57:02 GMT)
Brain-Inspired Perspective on Configurations: Unsupervised Similarity and Early Cognition [21.3] 我々は、有限分解能クラスタリングフレームワークである設定について、脳にインスパイアされた視点を示す。
データセット全体にわたって、設定は標準的なクラスタリングメトリクスと競合し、ノベルティ検出で87%のAUCを獲得し、動的カテゴリの進化中に35%の安定性を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:28:23 GMT)
Stop Playing the Guessing Game! Target-free User Simulation for Evaluating Conversational Recommender Systems [21.3] PEPPERは、実際のユーザインタラクション履歴とレビューから構築された、ターゲットフリーなユーザシミュレータによる評価プロトコルである。
PEPPERは、単純な推測ゲームに陥ることなく、現実的なユーザ-CRS対話を可能にする。
PEPPERは、CRSの嗜好誘発能力を包括的に評価するための詳細な尺度を提示する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:33:23 GMT)
On Efficiency-Effectiveness Trade-off of Diffusion-based Recommenders [21.1] 本稿では,事前学習時にデノナイジング機能を円滑にすることで,一段階生成を実現する2段階フレームワークであるTA-Recを提案する。
また,嗜好ペアの類似性やタイムステップに基づいて,ユーザの嗜好を適応的に調整する適応的選好アライメント(APA)も導入する。
TA-Recの2段階の目的は、離散化エラーによって引き起こされるトレードオフを効果的に軽減し、拡散に基づくレコメンデータの効率性と有効性を高めることを証明する実験である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:40:23 GMT)
LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts [21.1] より進んだ長文推論のためのデータ駆動型RL法であるLoongRLを紹介する。
KeyChainは、短いマルチホップQAを高微分長文タスクに変換する合成手法である。
Qwen2.5-7Bと14Bでは、LongRLは長文マルチホップQAの精度を+23.5%、+21.1%向上させる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:35:28 GMT)
Diffusion-Based Hierarchical Graph Neural Networks for Simulating Nonlinear Solid Mechanics [21.0] Rolling Diffusion-Batched Inference Network (ROBIN)は、2つの重要なイノベーションを統合する新しい学習シミュレータである。
ROBINは、ビーム曲げや多体接触のような現象に不可欠な微細な局所力学と大域的な構造効果の両方を捉えている。
幾何学的, 材料的, 接触非線形性を含む2次元および3次元固体力学ベンチマークにおいて, ROBINを検証した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:09:23 GMT)
EchoFake: A Replay-Aware Dataset for Practical Speech Deepfake Detection [20.5] 13,000人以上の話者から120時間以上のオーディオを収集する総合データセットであるEchoFakeを紹介する。
現実のデプロイメントに関連するより実践的な課題を導入することで、EchoFakeは、スプーフィング検出方法を進めるためのより現実的な基盤を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:34:31 GMT)
One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution [20.5] 本稿では,効果的なSDベースのワンステップ拡散モデルをトレーニングするためのDual LoRA Learning(DLoRAL)パラダイムを提案する。
実験の結果,DLoRALは精度と速度の両方で高い性能を発揮することがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:35:03 GMT)
GaLLoP: Gradient-based Sparse Learning on Low-Magnitude Parameters [20.3] GaLLoP: 低緯度パラメータによる勾配に基づくスパース学習。
本稿では,GaLLoP: Gradient-based Sparse Learning on Low-Magnitude Parametersを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:11:49 GMT)
Predicting before Reconstruction: A generative prior framework for MRI acceleration [20.3] 磁気共鳴画像(MRI)の高速化のための新しいパラダイムを提案する。
我々のフレームワークはまずターゲットのコントラスト画像を予測し、次に、高度にアンダーサンプリングされたデータを再構成するためのデータ駆動の事前処理として機能する。
1)T1wスキャンおよび/またはT2wスキャンからの予測を用いてFLAIRイメージを再構成し、(2)以前に取得したT1wスキャンからの予測を用いてT1wイメージを再構成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:07:57 GMT)
CPSVD: Enhancing Large Language Model Compression via Column-Preserving Singular Value Decomposition [20.3] textbfColumn-textbfPreserving textbfSingular textbfValue textbfDecomposition (CPSVD)を提案する。
CPSVDは、パラメータ行列をインテリジェントにセグメント化することで、SVDベースのLarge Language Models圧縮を洗練する。
最先端のSVDベースのLLM圧縮手法を一貫して上回り、ゼロショットタスクにおいて低いパープレキシティと高い精度を達成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:02:37 GMT)
See through the Dark: Learning Illumination-affined Representations for Nighttime Occupancy Prediction [20.1] LIARは照明に適応した表現を学習する新しいフレームワークである。
実データと合成データの両方の実験は、挑戦的な夜間シナリオ下でのLIARの優れた性能を示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:44:58 GMT)
Rope to Nope and Back Again: A New Hybrid Attention Strategy [20.1] 長文大言語モデル (LLM) はロータリー位置埋め込み (Rotary Position Embedding, RoPE) のような技術によって、目覚ましい進歩を遂げた。
本稿では,RoPE,No Positional Embedding (NoPE),Query-Key Normalization (QK-Norm)など,様々な注意機構の包括的解析を行う。
本稿では,グローバル・ローカル・アテンション・スパンを統合したハイブリッド・アテンション・メカニズムを特徴とする新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:43:58 GMT)
Mixing Configurations for Downstream Prediction [20.1] 人間は、クラスタリングアルゴリズムがエミュレートしようとする認知メカニズムである類似性によってオブジェクトをグループ化する能力を持っている。
コミュニティ検出の最近の進歩により、ラベル付きデータを必要としない構成の発見が可能になった。
GraMixCは、構成を抽出し、リバースマージ/スプリット(Reverse Merge/Split, RMS)技術を使って調整し、アテンションヘッドを介してそれらを融合して、下流の予測器に転送するプラグイン・アンド・プレイモジュールである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:09:53 GMT)
Study of Training Dynamics for Memory-Constrained Fine-Tuning [19.3] TraDyはディープニューラルネットワークのための新しいトランスファー学習スキームである。
さまざまなダウンストリームタスクやアーキテクチャにわたって、最先端のパフォーマンスを実現する。
メモリ制限を厳格に維持し、最大99%のアクティベーション間隔、95%の重みデリバティブ間隔、および重みデリバティブ計算のためのFLOPの97%の削減を実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:21:05 GMT)
A Multi-Task Foundation Model for Wireless Channel Representation Using Contrastive and Masked Autoencoder Learning [19.3] ContraWiMAEは、トランスフォーマーベースの基礎モデルであり、無線チャネル表現のためのマスク付き再構成とマスク付きコントラスト学習を統一する。
私たちの重要なイノベーションは、ノイズ、フェーディング、部分的な可観測性など、ワイヤレス環境の固有の特性を自然な拡張として活用する、新しいワイヤレスインスパイアされたコントラストの目標です。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:52:25 GMT)
Learning Noise-Resilient and Transferable Graph-Text Alignment via Dynamic Quality Assessment [19.2] テキスト分散グラフ(TAG)上のGFM(Pre-training Graph Foundation Models)は、検索、レコメンデーション、知識発見などのWebスケールアプリケーションの中心である。
ノードとテキスト間の厳密な1対1対応を前提としており、さまざまなデータ品質に適応できない静的アライメントの目標に依存しているため、ノイズの多い監視下では不安定である。
我々は,多対多の表現と保守的な一対一の目的を,監督品質に応じて動的に調整する品質対応グラフテキストアライメントフレームワークADAlignerを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:01:17 GMT)
FeatureFool: Zero-Query Fooling of Video Models via Feature Map [19.1] ブラックボックスの敵攻撃は通常、モデルとの複数ラウンドの相互作用を必要とする。
ビデオ領域のアタックは、機能マップを直接活用して、クリーンなビデオ機能空間をシフトする。
ステルスでビデオドメイン、ゼロクエリのブラックボックス攻撃であるFeatureFoolを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:44:05 GMT)
Probing Perceptual Constancy in Large Vision-Language Models [19.1] 155個の視覚言語モデル(VLM)を,色,大きさ,形状の3領域にわたる236個の実験を用いて評価した。
これらの領域間でのVLM性能の有意な変動がみられた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:57:59 GMT)
Energy-Efficient and Dequantization-Free Q-LLMs: A Spiking Neural Network Approach to Salient Value Mitigation [19.0] スパイキングニューラルネットワーク(SNN)は、複雑なMACを時間蓄積(ACC)に置き換えることで、混合精度の記憶とエネルギー効率の計算を支援する
そこで我々はSpykeQuantを提案する。これは精度混合量子化を正常な値を持つアクティベーションに選択的に適用し、それらをバイナリスパイクカウントに再エンコードする。
実験の結果、SpikeQuantは、W4A4量子化の下では一貫してほぼFP16のパープレキシティを達成し、既存の方法に比べて最大4.6倍のエネルギーコストを削減した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:50:00 GMT)
Efficient Non-Adaptive Quantum Algorithms for Tolerant Junta Testing [18.9] 我々は、$n$-qubitユニタリが$varepsilon$-close to some $k$-junta or $varepsilon$-far from every $k$-junta。
単一量子ビット演算のみを用いて実装される最初の2つの量子アルゴリズムに適応し、実験可能性を高める。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:51:43 GMT)
PRGCN: A Graph Memory Network for Cross-Sequence Pattern Reuse in 3D Human Pose Estimation [18.8] 本稿では、パターン検索と適応の問題としてポーズ推定を形式化する新しいフレームワークであるパターン再利用グラフ変換ネットワーク(PRGCN)を紹介する。
PRGCNのコアとなるグラフメモリバンクは、リレーショナルグラフとして符号化された一連のコンパクトなポーズプロトタイプを学習し、格納する。
PRGCNは,それぞれ37.1mm,13.4mmのMPJPEを達成し,クロスドメインの一般化能力の向上を図っている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:12:07 GMT)
Uni-MuMER: Unified Multi-Task Fine-Tuning of Vision-Language Model for Handwritten Mathematical Expression Recognition [18.6] 手書き数学的表現認識(HMER)は、光学文字認識(OCR)における永続的な課題である
アーキテクチャを変更することなく,HMERタスクの視覚言語モデルを完全に微調整するUni-MuMERを提案する。
構造的空間推論のためのTree-CoT(Tree-CoT)、視覚的に類似した文字間の混乱を減らすためのエラー駆動学習(EDL)、長い表現における認識整合性を改善するためのシンボルカウント(SC)の3つのデータ駆動タスクを統合した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:23:23 GMT)
GAPO: Group Adaptive Policy Optimization for Real-World Code Edit [18.2] Group Adaptive Policy Optimization (GAPO) は、各プロンプト当たりのoutlier-free highest-density interval (HDI)を見つけ、その区間の中央値を適応Qとして利用して、グループ平均を有利な計算で置き換える。
GAPOは、プラグアンドプレイと効率を保ちながら、歪んだ分布を頑健に処理する。
GAPOを実世界51,844の大規模内部データセットを用いて,9つの命令調整LDM(3B-14B)上で検証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:37:49 GMT)
ExpertLens: Activation steering features are highly interpretable [17.9] 我々は,活性化ステアリングの研究から,専門家の手法を用いて特定の概念に責任を負うニューロンを同定する。
ExpertLensの表現はモデルやデータセット間で安定しており、行動データから推測される人間の表現と密接に一致している。
この結果から,ExpertLensはモデル表現のキャプチャと解析のためのフレキシブルで軽量なアプローチであることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:06:46 GMT)
GUARD: Guided Unlearning and Retention via Data Attribution for Large Language Models [17.8] GUARDは、データ属性を通じて学習と保持をガイドするフレームワークである。
適応的で一様でないアンラーニングウェイトをサンプルに割り当て、逆にプロキシ属性スコアに比例する。
我々はGUARDが従来の手法に匹敵するメトリクスを忘れずに保持を大幅に改善する厳密な理論的保証を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:25:01 GMT)
MoE-Prism: Disentangling Monolithic Experts for Elastic MoE Services via Model-System Co-Designs [17.8] MoE-Prismは、厳格なMoEモデルをエラスティックサービスに変換するモデルシステムの共同設計である。
評価の結果,MoE-Prismprovides はベースラインの4倍以上,安定な動作点であることがわかった。
これにより、厳格な予算で最大19.9%のスループットを動的に改善したり、限られたリソースで最大10.36%のレイテンシを削減できる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:40:01 GMT)
Matrix-Free Least Squares Solvers: Values, Gradients, and What to Do With Them [17.8] 本稿では,少なくとも2乗法は,現代の機械学習において有意な未充足可能性を持っていることを論じる。
そのポテンシャルを解放するために、ニューラルネットワーク層のような微分可能な演算子に変換するカスタム勾配を導出します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:31:51 GMT)
Communication to Completion: Modeling Collaborative Workflows with Intelligent Multi-Agent Communication [17.4] Communication to Completion (C2C) はタスク指向通信のためのスケーラブルなフレームワークである。
C2Cは許容される通信コストでタスク完了時間を約40%削減する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:48:17 GMT)
DaMo: Data Mixing Optimizer in Fine-tuning Multimodal LLMs for Mobile Phone Agents [17.3] 携帯電話エージェント(MPA)は、様々なシナリオにまたがる幅広い適用性のために、有望な研究方向として登場した。
MLLMはマルチタスクの基礎として機能し、複数の携帯電話タスクを同時に処理する効果は限定的のままである。
既存のアプローチでは、ピークパフォーマンスのための最適なトレーニングデータ構成を決定するのに苦労している。
本稿では,任意のデータセット比に対する下流タスク性能を予測し,最適なデータ混合を予測する新しいMPADaMoを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:57:59 GMT)
Data-Adaptive Transformed Bilateral Tensor Low-Rank Representation for Clustering [17.1] 本稿では,TBTLRRと呼ばれる二元的低ランク表現モデルを提案する。
核ノルムを任意のユニタリユニタリで統合し、グローバルデータのより効果的なキャプチャを可能にする。
画像と潜時相関の局所的相関を利用することができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:25:44 GMT)
TrioXpert: An Automated Incident Management Framework for Microservice System [17.1] TrioXpertは、マルチモーダルデータを完全に活用できるエンドツーエンドのインシデント管理フレームワークである。
複数のタスクを同時に処理するために、大きな言語モデル(LLM)を用いた協調推論機構を採用している。
Lenovoの製品環境にデプロイされ、診断効率と精度が大幅に向上した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:04:13 GMT)
Can They Dixit? Yes they Can! Dixit as a Playground for Multimodal Language Model Capabilities [17.0] 本稿では,機能評価のためのゲームベース評価を提案する。
ゲームはプレイヤーが勝つために複数の能力を必要とし、本質的に競争力があり、固定された客観的ルールによって支配される。
我々はこの評価をファンタジーカードゲームであるDixitを通じて具体的に示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:21:16 GMT)
Fast, Modular, and Differentiable Framework for Machine Learning-Enhanced Molecular Simulations [17.0] 分子動力学およびモンテカルロシミュレーションのためのエンドツーエンド微分分子シミュレーションフレームワーク(DIMOS)を提案する。
そのモジュール性のおかげで、古典的および機械学習に基づくアプローチは、システムのハイブリッド記述(ML/MM)に簡単に組み合わせることができる。
DIMOSは2次スケーリングではなく2次スケーリングの改善により,古典的な力場シミュレーションにおいて最大170倍の高速化係数を得ることができることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:09:37 GMT)
Hierarchical DLO Routing with Reinforcement Learning and In-Context Vision-language Models [16.3] 変形可能な線形物体(DLO)の長距離ルーティングタスクは,産業用組立ラインや日常生活で一般的である。
DLOルーティングタスクの課題を解決するための,完全自律的階層型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:57:23 GMT)
Re-evaluating Minimum Bayes Risk Decoding for Automatic Speech Recognition [16.3] 最小ベイズリスク(MBR)復号化はテキスト対テキスト生成タスクに有効である。
ビームサーチは、自動音声認識(ASR)や音声翻訳(ST)のような音声からテキストへのタスクの現在の実践である
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:06:20 GMT)
Designing Knowledge Tools: How Students Transition from Using to Creating Generative AI in STEAM classroom [16.2] 本研究では、都市計画プログラムの大学院生が、生成AIの受動的ユーザから、カスタムGPTベースの知識ツールのアクティブクリエータへと移行した方法について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:23:19 GMT)
VO-DP: Semantic-Geometric Adaptive Diffusion Policy for Vision-Only Robotic Manipulation [16.1] ビジョンオンリー・シングルビュー拡散政策学習法(VO-DP)
ビジョンオンリーかつ単一視点拡散政策学習法(VO-DP)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:00:31 GMT)
A New Type of Adversarial Examples [16.1] 逆例は、データセットの例に微妙だが意図的に最悪の修正を適用することで作成される。
このような逆例を生成するための新しいアルゴリズムセットを提案する。
この結果から, 逆例は, データセットの近傍にのみ分布しないことがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:14:11 GMT)
Q-Palette: Fractional-Bit Quantizers Toward Optimal Bit Allocation for Efficient LLM Deployment [15.8] 我々は,大言語モデル (LLM) の重み付けを,校正データはほとんどあるいは全く使わずに定量化する,PTQ(height-only post-training Quantization)について検討した。
まず、与えられたビット予算下でのガウス化重みに対する情報理論的に最適なビット割り当てを導出し、ガウスの歪み率境界に近づく微細な分数ビット量子化器が、ほぼ最適量子化性能を達成するために不可欠であることを明らかにした。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:33:03 GMT)
Learning and Simulating Building Evacuation Patterns for Enhanced Safety Design Using Generative Models [15.7] 本研究では,ジェネレーティブ・モデル(GM)に基づく建物避難パターンの学習手法であるDiffEvacを提案する。
DiffEvacはSSIMを37.6%改善し、PSNRを142%改善した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:20:00 GMT)
A Survey on Cache Methods in Diffusion Models: Toward Efficient Multi-Modal Generation [15.7] 拡散モデルは、異常な生成品質と制御性のために、現代の生成AIの基盤となっている。
Diffusion Cachingは、トレーニングのない、アーキテクチャに依存しない、効率的な推論パラダイムを提供する。
計算機能レベルのクロスステップの再利用と層間スケジューリングを有効にすることにより、モデルパラメータを変更することなく削減できる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:46:05 GMT)
LBL: Logarithmic Barrier Loss Function for One-class Classification [15.7] 1クラス分類(OCC)は、対象データのみに基づいて分類器を訓練することを目的としており、注目を集めている。
OCCは多くの進歩を遂げているが、深層学習に有効なOCC損失機能を欠いている。
本稿では,新たな対数障壁関数に基づくOCC損失(LBL)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:36:58 GMT)
Instance-Dependent Regret Bounds for Nonstochastic Linear Partial Monitoring [15.6] 本稿では, 探索・最適化法の簡単な例を通して, 確率的でない有限作用版を提案する。
我々は、過去の理論的保証よりも透明な方法でゲーム構造に依存する後悔境界を導出する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:28:20 GMT)
Phase-driven Domain Generalizable Learning for Nonstationary Time Series [15.6] 時系列分類のための位相駆動型一般化表現学習フレームワークPhASERを提案する。
1) タスク固有の識別意味を保ちながら非定常性を多様化するヒルベルト変換に基づく拡張,2) 個別の等級符号化, 時間変化の大きさと位相を独立なモダリティとして見る,3) 位相残差特徴放送, 2次元位相特徴と1次元信号表現への残差接続を統合する,3つの重要な要素から構成される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:49:18 GMT)
CATransformers: Carbon Aware Transformers Through Joint Model-Hardware Optimization [15.5] 当社では,Transformerベースのモデルとハードウェアアクセラレーションのための,最初のカーボンを意識した共同最適化フレームワークである,当社のフレームワークを紹介します。
本研究は, モデル性能と実行時間性能を損なうことなく, 炭素効率を優先する全体最適化手法の必要性を強調した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:03:22 GMT)
Can Agents Fix Agent Issues? [15.5] LLMベースのエージェントシステムは、新しいソフトウェアパラダイムとして登場し、医学、ロボティクス、プログラミングといった様々な領域で広く採用されている。
これらのシステムを維持するには、バグが必然的に発生し、外部の要求に合うように継続的に進化するため、かなりの努力が必要です。
最近のソフトウェア工学(SE)エージェントは、従来のソフトウェアシステムにおける問題に対処することを約束しているが、エージェントシステムにおける現実の問題がどの程度効果的に解決できるかは不明だ。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:14:59 GMT)
Flow with the Force Field: Learning 3D Compliant Flow Matching Policies from Force and Demonstration-Guided Simulation Data [15.5] 本研究では,シミュレーションにおける力インフォームドデータ生成のためのフレームワークについて紹介する。
本稿では, 適合ポリシーとの結合が, 合成データから学習したビジュモータポリシーの性能をいかに向上させるかを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:46:01 GMT)
Interpretable Features for the Assessment of Neurodegenerative Diseases through Handwriting Analysis [15.4] 運動機能障害はパーキンソン病(PD)やアルツハイマー病(AD)などの神経変性疾患(ND)の共通徴候である
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:46:32 GMT)
M3-SLU: Evaluating Speaker-Attributed Reasoning in Multimodal Large Language Models [15.3] マルチ話者・マルチターン音声言語理解のためのマルチモーダル大規模言語モデル(MLLM)ベンチマークであるM3-SLUを提案する。
M3-SLUは4つのオープンコーパス(CHiME-6、MELD、MultiDialog、AMI)から構築され、12,000以上の検証済みインスタンスとペアオーディオ、トランスクリプト、メタデータで構成されている。
結果は、モデルが発言をキャプチャできる一方で、誰が言ったかを特定するのに失敗し、話者認識の対話理解における重要なギャップを明らかにしていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:28:43 GMT)
SALT: Step-level Advantage Assignment for Long-horizon Agents via Trajectory Graph [15.3] 大きな言語モデル(LLM)は、言語エージェントがシングルターンタスクでエキサイティングな機能を示す。
複雑な多段階・長期のタスクへの応用は依然として困難である。
本稿では,結果報酬のみから派生した,よりきめ細かい有利な代入を提供するフレームワークであるSALTを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:50:24 GMT)
Spatio-temporal Sign Language Representation and Translation [15.3] SLTの最先端技術は、カスタマイズされた入力埋め込みを備えた汎用のseq2seqアーキテクチャを使用する。
本稿では,時間的特徴表現と翻訳を1つのモデルで学習するシステムを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:34:01 GMT)
Sign Language Translation with Sentence Embedding Supervision [15.3] 最先端手話翻訳システム(SLT)は、光沢アノテーションによる学習プロセスを容易にする。
そこで本研究では,目標文の文埋め込みを訓練時間に導入し,グルースの役割を担っている新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:40:41 GMT)
BATIS: Bayesian Approaches for Targeted Improvement of Species Distribution Models [15.0] 種分布モデル(SDM)は,環境変数に基づいて種の発生を予測することを目的としている。
SDMの最近の深層学習の進歩は、複雑で不均一なデータセットでうまく機能することが示されている。
本稿では,限られた観測データを用いて事前予測を反復的に更新する,新規で実用的なフレームワークであるBATISを紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:42:46 GMT)
Exposing Blindspots: Cultural Bias Evaluation in Generative Image Models [15.0] 先行研究は、主にテキスト・トゥ・イメージ(T2I)システムにおける文化的偏見を調査してきた。
6カ国で統一的な評価でこのギャップを埋める。
クロスカントリー、クロスエラ、クロスカテゴリの評価を導出します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:42:59 GMT)
On Interaction Effects in Greybox Fuzzing [15.0] 我々は,最も有望なミューテータ列を学習し,選択するグレーボックスファザであるMuoFuzzを提案する。
MuoFuzzはコードカバレッジが最も高く、4つのバグがAFL++で見逃され、1つはAFL++とMOPTで見逃されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:30:20 GMT)
Text or Pixels? It Takes Half: On the Token Efficiency of Visual Text Inputs in Multimodal LLMs [14.8] 視覚テキスト表現は,デコーダLLMの入力圧縮において,実用的で驚くほど効果的であることを示す。
我々は、長いテキスト入力を単一の画像としてレンダリングし、モデルに直接提供するというアイデアを生かしている。
これによりデコーダトークンの数が劇的に削減され、新しい形式の入力圧縮が提供される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:54:03 GMT)
How to Evaluate Monocular Depth Estimation? [14.7] 本論文は, 地中真実の様々な摂動に対する感度の観点から, 既存の指標を定量的に分析する。
相対的な表面の正規度に基づく新しいメトリクスと、新しい深度可視化ツールと、より優れた人間のアライメントを持つ複合メトリクスを作成するための原則的手法を導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:51:24 GMT)
Balancing Rewards in Text Summarization: Multi-Objective Reinforcement Learning via HyperVolume Optimization [14.7] RLにおける報酬過程において,グループ間のスコアを動的に調整する新しい最適化手法であるハイパーボリューム最適化(HVO)を導入する。
いくつかの代表的な要約データセットに対する実験結果から,本手法がグループ相対的政策最適化より優れていることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:39:04 GMT)
To Use or to Refuse? Re-Centering Student Agency with Generative AI in Engineering Design Education [14.6] このパイロット研究は、シンガポール工科大学で500人以上の工学と建築の学生を登録する13週間の基礎設計コースにおける、AIの使用に関する学生の考察を辿るものである。
学生は、この技術がツール(インストラクショナルアシスタント)、チームメイト(共同パートナー)、あるいはその両方として使われたかどうかを振り返ることが求められた。
学生たちは、AIを単なる自動化ではなく、イノベーションのために使うことを学びました。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:06:48 GMT)
SONAR-SLT: Multilingual Sign Language Translation via Language-Agnostic Sentence Embedding Supervision [14.4] 手話翻訳(SLT)は通常、単一の言語でテキストで訓練される。
我々は、SLTを監督するために、複数の言語からテキストや音声で訓練された言語に依存しないマルチモーダル埋め込みを採用している。
以上の結果から,言語非依存の埋め込み管理と統合拡張が組み合わさって,従来のSLTトレーニングに代わるスケーラブルでセマンティックな代替手段を提供することが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:17:31 GMT)
Pragmatic Heterogeneous Collaborative Perception via Generative Communication Mechanism [14.4] 異種マルチエージェントシステム間のシームレスな認識を容易にする新しいジェネレーティブコミュニケーション機構(GenComm)を提案する。
OPV2V-H、DAIR-V2X、V2X-Realデータセットで実施された実験は、GenCommが既存の最先端手法より優れていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:15:20 GMT)
AutoMT: A Multi-Agent LLM Framework for Automated Metamorphic Testing of Autonomous Driving Systems [14.1] AutoMTは、ローカルトラフィックルールからメタモルフィックリレーショナル(MR)を抽出するフレームワークである。
視覚言語エージェントがシナリオを分析し、検索エージェントがRAGベースのデータベースから適切なMRを取得し、フォローアップケースを生成する。
実験の結果, AutoMT は, 最良ベースラインと比較して, フォローアップケース生成において最大5倍の多様性を達成できることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:11:05 GMT)
Bias Beware: The Impact of Cognitive Biases on LLM-Driven Product Recommendations [14.0] 我々は,ブラックボックスの敵対的戦略としての認知バイアスについて検討し,それらが大規模言語モデルに与える影響と人間の購買行動とを対比した。
社会的証明のような偏見はプロダクトの推薦率やランキングを継続的に向上させ、希少性や排他性など他のバイアスは驚くほど視界を低下させます。
以上の結果から,認知バイアスは最先端のLCMに深く埋め込まれており,製品レコメンデーションにおいて極めて予測不能な行動をもたらすことが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:36:39 GMT)
Improving Energy Natural Gradient Descent through Woodbury, Momentum, and Randomization [14.0] PINNのエネルギー勾配降下の精度と効率を改善するための一連の技術を紹介する。
まず、Woodbury公式を利用して、ENGDの計算複雑性を劇的に低減する。
第2に,モンテカルロ変分法からサブサンプリング・プロジェクテッド・インクリメント・ナチュラルグラディエントDescentアルゴリズムを適用し,収束を加速する。
第3に、大規模なバッチサイズの場合の計算コストをさらに削減するために、ランダム化アルゴリズムの使用について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:19:34 GMT)
SparseWorld: A Flexible, Adaptive, and Efficient 4D Occupancy World Model Powered by Sparse and Dynamic Queries [13.8] 本稿では,スパースおよび動的クエリをベースとした,フレキシブルで適応性があり,効率の良い4次元占有型世界モデルを提案する。
SparseWorldは、認識、予測、計画タスクにわたる最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:37:12 GMT)
Type-aware LLM-based Regression Test Generation for Python Programs [13.6] Test4PyはPythonの自動テスト生成における型正しさを高める新しいフレームワークである。
Test4Pyは、生成したテストケースを段階的に洗練してカバレッジを改善する反復的な修復手順を統合する。
実世界のPythonモジュール183の評価において、Test4Pyは平均ステートメントカバレッジ83.0%、ブランチカバレッジ70.8%を達成した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:44:01 GMT)
Efficient Vision-Language-Action Models for Embodied Manipulation: A Systematic Survey [13.4] VLA(Vision-Language-Action)モデルは、自然言語の指示と視覚的な観察をロボットの行動にマッピングすることで、視覚言語モデルを拡張し、制御を具体化する。
これらの能力にもかかわらず、VLAシステムは膨大な計算とメモリ要求のために重大な課題に直面している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:13:46 GMT)
Where are we with calibration under dataset shift in image classification? [13.4] 画像分類のための実世界のデータセットシフトの下でキャリブレーションの状況について検討する。
様々なポストホックキャリブレーション手法と、一般的なトレーニング中のキャリブレーション戦略との相互作用を比較した。
i) アンサンブル前に校正を適用することは、シフトの下で校正するのにより効果的である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:57:32 GMT)
Learning to Add, Multiply, and Execute Algorithmic Instructions Exactly with Neural Networks [13.4] 無限幅限界における2層完全連結ネットワークのトレーニング力学について検討する。
このようなモデルの十分な大規模なアンサンブルが、高い確率で正確に実行するためにどのように訓練されるかを示す。
対数的に多くのトレーニングデータだけを用いて効率よく達成できることを示します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:39:42 GMT)
RLIE: Rule Generation with Logistic Regression, Iterative Refinement, and Evaluation for Large Language Models [13.3] 大規模言語モデル(LLM)は、従来のルール学習において事前定義された述語空間の必要性を脇取りして、自然言語でルールを提案することができる。
本稿では,LLMと確率的モデリングを統合し,重み付きルールの集合を学習する統一フレームワークRLIEを提案する。
学習した重みでルールを直接適用すると性能が向上する一方、ルール、重み、ロジスティックモデルの出力は驚くほど精度が低下する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:50:04 GMT)
WebGraphEval: Multi-Turn Trajectory Evaluation for Web Agents using Graph Representation [13.1] WebGraphEvalは、複数のエージェントからのトラジェクトリを統一された重み付けされたアクショングラフに抽象化するフレームワークである。
我々は、WebGraphEvalが、モデル間の規則性をキャプチャし、冗長性と非効率性を強調し、結果に基づくメトリクスによって見落とされた決定ポイントを特定する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:29:25 GMT)
MeanAudio: Fast and Faithful Text-to-Audio Generation with Mean Flows [13.1] MeanAudioは、1つの機能評価(1-NFE)だけで現実的な音をレンダリングできる高速で忠実なテキスト・オーディオ・ジェネレータである
我々は,MeanAudioが単一ステップ音声生成における最先端性能を実現することを実証した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:22:42 GMT)
A Training-Free Framework for Open-Vocabulary Image Segmentation and Recognition with EfficientNet and CLIP [13.0] 本稿では,オープンボキャブラリ画像セグメンテーションとオブジェクト認識のための新しい学習自由フレームワークを提案する。
教師なしセグメンテーションには畳み込みニューラルネットワークであるEfficientNetB0を使用し、オープン語彙オブジェクト認識には視覚言語モデルであるCLIPを使用している。
ハンガリーのmIoU、精度、リコール、F1スコアで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:54:18 GMT)
Cross-Chain Sealed-Bid Auctions Using Confidential Compute Blockchains [12.9] 封筒付きオークションは、公正な競争と効率的な配分を保証するが、しばしば中央集権的なインフラに配備される。
パブリックブロックチェーンは中央制御を排除しているが、その固有の透明性は、封印入札に必要な機密性と矛盾している。
秘密計算ブロックチェーン上で機密入札ロジックを実行するシールバイドオークションプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:35:51 GMT)
SFGFusion: Surface Fitting Guided 3D Object Detection with 4D Radar and Camera Fusion [12.9] 表面実装で誘導される新しいカメラ4Dイメージングレーダ検出ネットワークであるSFGFusionを紹介する。
明示的な表面嵌合モデルにより、空間表現とクロスモーダル相互作用が向上し、より信頼性の高い細粒度深度予測が可能となる。
実験結果から、SFGFusionはカメラと4Dレーダを効果的に融合させ、TJ4DRadSetとVoD(View-of-delft)オブジェクト検出ベンチマークにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:56:27 GMT)
From Large to Small: Transferring CUDA Optimization Expertise via Reasoning Graph [12.7] 大規模言語モデル(LLM)は、シーケンシャルコードから最適化されたコードを生成する強力な可能性を示している。
クラウドベースのAPIはコード漏洩のリスクを生じさせ、ローカルデプロイメントは計算コストが高く非効率であることが多い。
これらの欠点は、より軽量でプライバシーに優しい小言語モデル(SLM)への関心を喚起している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:33:44 GMT)
A Goal-Driven Survey on Root Cause Analysis [12.4] ルート原因分析(RCA)は、大規模クラウドサービスにおけるインシデント管理の重要な側面である。
本稿では,クラウドインシデント管理の文脈において,RCAに関する135の論文を効果的に分類・統合する,ゴール駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:43:07 GMT)
AdaptGrad: Adaptive Sampling to Reduce Noise [12.4] グラディエント・スムーシング(Gradient Smoothing)は、勾配モデル記述法における雑音の低減に有効な手法である。
これらの知見に基づいて適応的な勾配平滑化手法AdaptGradを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:08:42 GMT)
LookUp3D: Data-Driven 3D Scanning [12.4] 高速で高解像度で正確な3Dスキャンは、グラフィックス、ロボティクス、科学、医学の多くの新しい応用への扉を開くだろう。
本研究では,1メガピクセルで450フレーム/秒,0.4メガピクセルで1450フレーム/秒で制御された環境下で,初めて3Dスキャンを行う方法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:34:05 GMT)
Adaptive Distribution-aware Quantization for Mixed-Precision Neural Networks [12.4] QAT(Quantization-Aware Training)は、リソース制約のあるデバイスにディープニューラルネットワークをデプロイするための重要なテクニックである。
本稿では,適応分布対応量子化(adaptive Distribution-aware Quantization,ADQ)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:48:29 GMT)
ToMMeR -- Efficient Entity Mention Detection from Large Language Models [12.3] 我々は,初期のLCM層からの参照検出機能を示す軽量モデルToMMeRを紹介する。
ToMMeRは93%のリコールゼロショットを達成する。
クロスモデル解析は、多様なアーキテクチャが類似の参照境界に収束していることを明らかにする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:28:18 GMT)
TheMCPCompany: Creating General-purpose Agents with Task-specific Tools [12.2] TheMCPCompanyは、様々な現実世界のサービスと対話するタスクにおいて、ツールコールエージェントを評価するためのベンチマークである。
また、各タスクに手動でアノテートされた接地木ツールも提供します。
全体として、我々の研究は、最も高度な推論モデルは、より単純な環境でツールを見つけるのに効果的であるが、複雑なエンタープライズ環境をナビゲートするのに深刻な苦労をしていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:42:01 GMT)
The Intricate Dance of Prompt Complexity, Quality, Diversity, and Consistency in T2I Models [12.2] テキスト・ツー・イメージ(T2I)モデルは、無限の合成データを作成する大きな可能性を提供します。
これまでの研究は、T2Iモデルの3つの重要なデシダータ(品質、多様性、一貫性)における合成データの有用性を評価してきた。
実データと合成データの有用性を比較するための新しい評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:13:27 GMT)
Rethinking Backbone Design for Lightweight 3D Object Detection in LiDAR [12.1] Dense Backboneは、高速な処理速度、軽量なアーキテクチャ、堅牢な検出精度の利点を組み合わせた軽量なバックボーンです。
我々は、PillarNetのような複数のSoTA 3dオブジェクト検出器をバックボーンで適用し、バックボーンでは、これらのモデルが計算コストを大幅に削減して、ほとんどの検出能力を維持できることを示す。
PillarNetの適応であるDensePillarNetは、モデルパラメータの29%の削減とレイテンシの28%の削減を実現し、nuScenesテストセットでの検出精度はわずか2%低下した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:25:08 GMT)
DREAM: Drafting with Refined Target Features and Entropy-Adaptive Cross-Attention Fusion for Multimodal Speculative Decoding [12.1] 投機的復号化(SD)は,大規模言語モデル(LLM)における自己回帰生成を高速化する強力な手法として登場した。
視覚言語モデル(VLM)に適した新しい投機的復号化フレームワークであるDREAMを紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:52:00 GMT)
Semantic World Models [12.0] 世界モデルによる計画は、ロボット制御の強力なパラダイムを提供する。
本稿では,将来的なフレームをピクセルとして再構成するのではなく,タスク関連セマンティック情報のみを予測する必要があることを示唆する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:53:45 GMT)
SEC-bench: Automated Benchmarking of LLM Agents on Real-World Software Security Tasks [11.9] SEC-benchは、大規模言語モデル(LLM)エージェントを評価するための、最初の完全に自動化されたベンチマークフレームワークである。
当社のフレームワークは,再現可能なアーティファクトを備えた高品質なソフトウェア脆弱性データセットを,インスタンス当たり0.87ドルで自動生成します。
最先端のLLMコードエージェントの包括的な評価では、大きなパフォーマンスギャップが明らかになっている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:27:29 GMT)
Family of self-dual quasicrystals with critical Phases [11.8] 任意領域ホッピングと多フラクタル挙動を持つ自己双対一次元準周期格子モデルを構築する。
自己双対条件が満たされると、システムは多重フラクタル特性を持つ臨界状態になければならないという事実を利用する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:47:34 GMT)
Learning from Supervision with Semantic and Episodic Memory: A Reflective Approach to Agent Adaptation [11.8] 本研究では,事前訓練された大規模言語モデル上に構築されたエージェントが,パラメータ更新なしでラベル付き例からターゲット分類関数を学習する方法について検討する。
我々のフレームワークは、エピソードメモリを使用して、インスタンスレベルの批判を保存し、それらを再利用可能なタスクレベルのガイダンスに蒸留する。
我々の研究は、より適応的で解釈可能なLLMエージェントを構築するためのメモリ駆動型反射学習の可能性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:58:03 GMT)
Simultaneously Solving Infinitely Many LQ Mean Field Games In Hilbert Spaces: The Power of Neural Operators [11.8] ニューラル作用素 (NOs) を訓練し、分離可能なヒルベルト空間上で定義されたLQ MFGの問題データ(ルール':ダイナミックスとコスト汎関数)から、対応する平衡戦略を学ぶ。
少数のランダムサンプリングルールに基づいて訓練されたNOは、無限次元の設定であっても、目に見えないLQ MFG変異を確実に解決する。
我々の保証は、3つの結果から従う: (i) 局所リプシッツの高度非線形規則-平衡写像の推定、 (ii) 予め特定されたリプシッツ正則性を持つNOsを用いた普遍近似定理。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:40:20 GMT)
When Facts Change: Probing LLMs on Evolving Knowledge with evolveQA [11.7] 時間的に進化する知識に基づいてLLMを評価するために特別に設計されたベンチマークであるEvolutionQAを紹介する。
本フレームワークは,自然発生の知識の進化を識別し,LLMの知識の切り離しに合わせたゴールド回答の質問を生成する。
静的知識質問と比較して,進化QAでは最大31%の大幅な性能低下を示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:12:32 GMT)
Reduced State Embedding for Error Correction in Quantum Cryptography [11.6] 量子鍵分布(QKD)に還元状態埋め込みを導入する。
我々の還元状態埋め込みは、量子チャネル内の明確な消去型エラー補正を実現する。
これらの知見は高次元QKDを推し進め、量子暗号の誤り訂正と変調の道を開いた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:41:13 GMT)
Monitoring LLM-based Multi-Agent Systems Against Corruptions via Node Evaluation [11.4] 大規模言語モデル(LLM)ベースのマルチエージェントシステム(MAS)は、AIアプリケーションの一般的なパラダイムとなっている。
我々は,MASグラフ内の通信を継続的に監視するMASグラフ構造に対する動的防御パラダイムを提案する。
本手法は既存のMAS防御機構を著しく上回り,信頼性の高いアプリケーションに有効なガードレールを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:43:32 GMT)
Dingtalk DeepResearch: A Unified Multi Agent Framework for Adaptive Intelligence in Enterprise Environments [11.1] Dingtalk DeepResearchは、実世界のエンタープライズ環境のための統合されたマルチエージェントインテリジェンスフレームワークである。
深い研究、不均一なテーブル推論、マルチモーダルレポート生成を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:14:26 GMT)
Training-Free Label Space Alignment for Universal Domain Adaptation [11.0] ユニバーサルドメイン適応(UniDA)は、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送する。
We propose a training-free label-space alignment method for UniDA (ours)。
本手法は,各領域間の雑音ラベルのフィルタリングと精細化によって,視覚空間の代わりにラベル空間を整列する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:13:29 GMT)
Latent Space Factorization in LoRA [11.0] 低ランク適応 (LoRA) はパラメータ効率の高い微調整法として広く用いられている。
本稿ではFVAE-LoRA(Facterized Variational Autoencoder LoRA)を提案する。
また,本論文のエビデンス・ロウアー・バウンドの定式化は,潜在空間間の分解を明示的に促進し,一方の潜在空間をタスク・サレントな特徴に,他方の残余情報に割り当てるものである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:37:20 GMT)
A Brain Cell Type Resource Created by Large Language Models and a Multi-Agent AI System for Collaborative Community Annotation [11.0] 単細胞RNAシークエンシングは、多様な細胞タイプとその転写学的シグネチャを同定する能力を変革した。
Gene Set Enrichment Analysis (GSEA)のような従来の手法は、よく計算されたアノテーションに依存している。
我々は、自由テキスト記述とオントロジーラベルを統合する新しいマルチエージェントAIシステムであるBRAINCELL-AIDを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:31:51 GMT)
What Happens During the Loss Plateau? Understanding Abrupt Learning in Transformers [10.9] 本研究は, 浅層変圧器におけるそのような力学のメカニズムについて考察する。
このモデルでは,高原ではしばしば解釈可能な部分解が生成され,出力に強い繰り返しバイアスが生じる。
これらの現象の繰り返しバイアスと表現の崩壊は,おもちゃの組立の人工物ではなく,PythiaやOLMoのような大規模言語モデルの初期訓練段階に現れていることを検証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:00:02 GMT)
Slot Filling as a Reasoning Task for SpeechLLMs [10.9] 本稿では,音声大言語モデル(speechLLM)への推論の統合を提案する。
LLMの最近の発展に触発されて、私たちはスロット充足タスクを複数の推論ステップに分解するためにチェーン・オブ・シント・フレームワークを使用します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:39:56 GMT)
MoE-GS: Mixture of Experts for Dynamic Gaussian Splatting [10.4] 本稿では,新しいVolume-aware Pixel Routerを用いて,複数の専門家を統合した統合フレームワークを提案する。
我々のルータは、体積ガウスレベルの重みをピクセル空間に投影することで、専門家の出力を適応的にブレンドする。
MoE-GSは、改善された効率で最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:41:59 GMT)
Detecting Latin in Historical Books with Large Language Models: A Multimodal Benchmark [10.4] 本稿では,様々なレイアウトの混在した古文書からラテン語の断片を抽出する新しい課題について述べる。
注釈付き724ページのマルチモーダルデータセットに対して,大規模ファンデーションモデルの性能をベンチマークし,評価した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:37:52 GMT)
Knowledge Distillation of Uncertainty using Deep Latent Factor Model [10.1] ガウス蒸留と呼ばれる新しい流通蒸留法を導入する。
これは、Dep Latent Factor Model (DLF)と呼ばれる特殊なガウス過程による教師のアンサンブルの分布を推定する。
複数のベンチマークデータセットを用いて,提案したガウス蒸留が既存のベースラインより優れていることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:46:59 GMT)
BLiSS 1.0: Evaluating Bilingual Learner Competence in Second Language Small Language Models [10.0] BLiSS 1.0はLearner Interlingual Syntactic Structureのベンチマークである。
モデルが、一致した人工的なエラーよりも、自然主義的な学習者エラーを見つけるかどうかをテストする。
この目的のために136,867個の制御された三脚(修正,学習,人工)を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:42:01 GMT)
Can Large Language Models be Effective Online Opinion Miners? [9.9] オンラインオピニオンマイニングベンチマーク(OOMB, Online Opinion Mining Benchmark)は, 大規模言語モデルによる意見のマイニング能力を評価するための新しいデータセットと評価プロトコルである。
OOMBは、広範囲にわたる(関心、機能、意見)アノテーションと、各コンテンツの主要な意見トピックを強調する包括的な意見中心の要約を提供する。
我々は、現実的なオンラインシナリオにおいて、どの側面が困難なままで、LLMが適応性を示すのかを総合的に分析し、意見マイナーとして効果的に機能できるかを探索する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:13:27 GMT)
Twisted superconducting quantum diodes: Towards anharmonicity and high fidelity [9.9] 平面内および平面外磁場下でのNbSe2二層構造における量子ダイオードを実現する。
わずか1度のねじれにより、プリスタン装置よりも効率が向上し、27.6%に達する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:23:33 GMT)
Enhanced Cyclic Coordinate Descent Methods for Elastic Net Penalized Linear Models [9.8] 本稿では、弾性ネット制約を持つ一般化線形モデルの解法として、新しい拡張巡回座標降下(ECCD)フレームワークを提案する。
各種ベンチマークデータセット上での正規化パスの変動に対して,平均$3times$で一貫したパフォーマンス改善を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:01:25 GMT)
Measuring Data Science Automation: A Survey of Evaluation Tools for AI Assistants and Agents [9.7] 大規模言語モデル(LLM)は、データサイエンスのアシスタントとしてますます使われている。
本稿では,データサイエンスのためのLLMアシスタントとエージェントの評価について調査する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:14:08 GMT)
SecureInfer: Heterogeneous TEE-GPU Architecture for Privacy-Critical Tensors for Large Language Model Deployment [9.7] SecureInferは、計算集約的な操作を信頼できないアクセラレータにオフロードするフレームワークである。
LLaMA-2モデルを用いてSecureInferのプロトタイプを実装し,性能およびセキュリティ指標間で評価する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:17:31 GMT)
Multi-modal Co-learning for Earth Observation: Enhancing single-modality models via modality collaboration [9.7] 推論の特定のモダリティを目標にすることなく、様々なタスクを一般化できる新しいマルチモーダル・コラーニングフレームワークを提案する。
我々のアプローチは、対照的かつモダリティの識別学習を組み合わせ、単一のモダリティモデルを誘導し、内部モデル多様体をモダリティ共有およびモダリティ固有情報に構造化する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:29:32 GMT)
Multi-Faceted Evaluation of Tool-Augmented Dialogue Systems [9.6] TRACEは,多種多様なエラー事例を網羅した,体系的に合成されたツール強化会話のベンチマークである。
また,ツール拡張対話において,多様なエラーパターンを自動検出し,ルーリックの評価を行うSCOPEについても紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:44:11 GMT)
Adapting Multilingual Models to Code-Mixed Tasks via Model Merging [9.6] 我々は,コード混合NLPの従来の適応戦略の代替として,モデルマージについて検討した。
我々は,XLM-RとLlama-3.2-1Bモデルを用いて,英語・ヒンディー語(En-Hi)と英語・スペイン語(En-Es)の文分類(センチメントとヘイトスピーチ)課題に対するアプローチを評価する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:16:23 GMT)
Towards Context-Aware Domain Generalization: Understanding the Benefits and Limits of Marginal Transfer Learning [9.6] 我々は、コンテキストの概念をデータポイントの集合の置換不変表現として定式化する。
経験的分析により、我々の基準は好ましくないシナリオと好ましくないシナリオの両方を識別するのに有効であることが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:52:40 GMT)
On the Robustness of Kernel Goodness-of-Fit Tests [9.4] 既存のカーネル良性テストは、ロバスト性という一般的な概念の下では堅牢ではないことを示す。
そこで本研究では,カーネルStein異性度ボールを用いて,この問題を解決した最初の堅牢なカーネル善良性テストを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:08:19 GMT)
Nearly-Linear Time Private Hypothesis Selection with the Optimal Approximation Factor [9.4] 分布の密度をサンプルから推定することは統計学の基本的な問題である。
仮説選択は、サンプルセットに加えて、$n$の候補分布が与えられる設定に対処する。
本稿では,仮説の数に関して,ほぼ直線時間で実行される中央モデルに差分プライベートなアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:42:33 GMT)
The Cost of Downgrading Build Systems: A Case Study of Kubernetes [9.3] アーティファクトベースのビルドツール(Bazel)から言語固有のソリューション(Go Build)に格下げしたプロジェクトについて研究する。
BazelのビルドはGo Buildよりも高速で、完全なビルドは23.06-38.66から75.19まで完了しています。
Bazelからのダウングレードは、CIリソースコストを最大76パーセント向上させる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:40:23 GMT)
Are Large Language Models Sensitive to the Motives Behind Communication? [9.2] 大規模言語モデル(LLM)とAIエージェントは、人間の意図とインセンティブによって本質的にフレーム化された情報を処理する。
LLMが現実世界で有効であるためには、ソースのモチベーションを要因としてコンテンツの評価を批判的に行う必要がある。
我々は認知科学から制御された実験を用いて、LCMの行動が動機付けられた証言からの学習の合理的モデルと一致していることを検証する。
LLMの推論は、合理的なモデルをほとんど正確に追跡していないことが分かっています -- 一部には、警戒と関連する考慮を妨げている追加情報があるからです。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:35:00 GMT)
Speculative Sampling for Parametric Temporal Point Processes [9.2] 時間点過程はイベントシーケンスの強力な生成モデルである。
それらは一般的に、前のイベントから次のイベントの分布を学ぶ自動回帰モデルを使って指定される。
本稿では、既存のTPPモデルから複数の将来の値の正確なサンプリングを可能にする、リジェクションサンプリングに基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:20:26 GMT)
Physics-informed waveform inversion using pretrained wavefield neural operators [9.0] フルウェーブフォームインバージョン(FWI)は高分解能地下モデルの再構築に不可欠である。
学習波動場ニューラル演算子を用いてFWIを加速する最近の試みは、効率と微分可能性の有望性を示している。
ニューラル演算子に基づくFWIの効率を維持しつつ、精度の反転を高める新しい物理インフォームドFWIフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:33:19 GMT)
Approximate Model Predictive Control for Microgrid Energy Management via Imitation Learning [9.0] 本稿では,マイクログリッドエネルギー管理のための混合整数型経済モデル予測制御(EMPC)の模倣学習に基づくフレームワークを提案する。
提案手法は、ニューラルネットワークを用いて、オフライン軌道からのエキスパートEMPC制御動作を模倣し、最適化問題をオンラインで解決することなく、高速でリアルタイムな意思決定を可能にする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:39:18 GMT)
Bridging Symmetry and Robustness: On the Role of Equivariance in Enhancing Adversarial Robustness [9.0] 敵対的な例では、知覚不能な入力摂動に対する感度を利用して、ディープニューラルネットワークの重大な脆弱性を明らかにしている。
本研究では,群-同変畳み込みを組込み,対向ロバスト性に対するアーキテクチャ的アプローチについて検討する。
これらの層は、モデル行動と入力空間の構造化変換を整合させる対称性の先行を符号化し、よりスムーズな決定境界を促進する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:10:35 GMT)
Hire Your Anthropologist! Rethinking Culture Benchmarks Through an Anthropological Lens [9.0] ベンチマークのフレームカルチャーを分類する4つのフレームワークを紹介します。
20の文化指標を質的に検討し,6つの方法論的問題を同定した。
我々の目標は、静的リコールタスクを超える文化ベンチマークの開発をガイドすることです。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:01:52 GMT)
LLavaCode: Compressed Code Representations for Retrieval-Augmented Code Generation [8.9] コードLLMで解釈可能なコンパクトで意味豊かな表現にコードを圧縮するフレームワークであるLlavaCodeを紹介した。
本実験は, 圧縮コンテキストにより, ライン完了作業におけるTTFT(Time-to-First-Token)の20~38%の削減が可能であることを実証した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:49:21 GMT)
Controllable Machine Unlearning via Gradient Pivoting [8.7] 我々は、ユニークなピボット機構を備えたPivoting Gradient (CUP) による制御可能なアンラーニングを導入する。
単一のソリューションに収束する従来のMOOメソッドとは異なり、CUPのメカニズムはパレートフロンティア全体を制御するように設計されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:20:24 GMT)
Merging Embedded Topics with Optimal Transport for Online Topic Modeling on Data Streams [8.6] StreamETMはEmbeded Topic Model (ETM)上に構築され、データストリームを処理する。
オンライン変更点検出アルゴリズムは、時間とともにトピックの変化を特定するために使用される。
シミュレーションおよび実世界のデータに関する数値実験は、StreamETMがライバルより優れていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:21:29 GMT)
The Tail Tells All: Estimating Model-Level Membership Inference Vulnerability Without Reference Models [8.5] 本稿では,モデルレベルの脆弱性である低FPRにおけるTPRを,参照モデルを必要としないメンバシップ推論攻撃に推定するための新しいアプローチを提案する。
本手法は,RMIAなどの低コスト(参照モデル)攻撃と,他の分布差の測定値よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:03:55 GMT)
Transfer Faster, Price Smarter: Minimax Dynamic Pricing under Cross-Market Preference Shift [8.4] 我々は、ターゲット市場がK補助市場を活用できる場合のコンテキスト動的価格について検討する。
本稿では,このようなモデルシフト転送を確実に処理するアルゴリズムとして,CM-TDP(Cross-Market Transfer Dynamic Pricing)を提案する。
転送学習、ロバストアグリゲーション、収益最適化をブリッジすることで、CM-TDPはより速く、よりスマートな転送を行う価格システムへと向かっています。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:25:54 GMT)
Lexo: Eliminating Stealthy Supply-Chain Attacks via LLM-Assisted Program Regeneration [8.3] ソフトウェアサプライチェーン攻撃は、オープンソースソフトウェアエコシステムにおいて重要かつ進行中の懸念事項である。
Lexoは、潜在的に悪意のあるコンポーネントの脆弱性のないバージョンを自動的に学習し、再生することによって、このようなステルスな攻撃に対処する。
高プロファイルなプライチェーン攻撃を含む100以上の実世界のパッケージに対する評価は、Lexoが複数のドメインにまたがってスケールしていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:13:19 GMT)
An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks [8.3] そこで本研究では,$k$の偏光コミュニティを同定する手法を提案する。
サイズ不均衡な解を避けるための新しい最適化手法を提案する。
実世界のデータセットと合成データセットの実験は、我々の手法がソリューション品質の最先端のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:10:02 GMT)
Error Bounds for Open Quantum Systems with Harmonic Bosonic Bath [8.2] ボーソニック浴を用いた開量子系の物理観測可能性のバス相関関数依存性について検討した。
図式および議論に基づいて,浴槽相関関数の変動によって引き起こされる物理観測値の差を誤差推定する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:02:00 GMT)
From Prototypes to Sparse ECG Explanations: SHAP-Driven Counterfactuals for Multivariate Time-Series Multi-class Classification [8.1] 本稿では,12リードのECG分類モデルに適合したスパース対実的説明を生成するためのプロトタイプ駆動型フレームワークを提案する。
本手法では、SHAPに基づくしきい値を用いて、臨界信号セグメントを特定し、インターバルルールに変換する。
提案手法の3つの変種であるOriginal, Sparse, Aligned Sparseを評価し,MIの98.9%の妥当性からハイドロフィ(HYP)検出の課題まで,クラス固有の性能について検討した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:09:50 GMT)
Hybrid Quantum-Classical Eigensolver with Real-Space Sampling and Symmetric Subspace Measurements [7.9] 本稿では,強い相関を持つ量子多体系の計算問題に対処するハイブリッド量子古典固有解法を提案する。
提案手法は、テンソルネットワークブリッジ量子回路の実空間サンプリングと対称部分空間測定を組み合わせたものである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:03:40 GMT)
Statistical Inference for Linear Functionals of Online Least-squares SGD when $t \gtrsim d^{1+δ}$ [7.9] グラディエント・Descent (SGD) は、現代のデータ科学における基礎的な手法となっている。
本研究では,オンライン最小二乗 SGD の線型汎函数に対して,非漸近的ベリー-エッセイン境界を確立する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:25:49 GMT)
TimeWak: Temporal Chained-Hashing Watermark for Time Series Data [7.9] TimeWakは時系列拡散モデルのための最初の透かしアルゴリズムである。
TimeWakは、時間的連鎖型ハッシュ型透かしを直接時間的特徴データ空間に埋め込む。
我々は,TimeWakが合成データ品質,透かし検出性,堅牢性に与える影響を,様々な後処理攻撃下で評価した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:49:53 GMT)
Explainable e-sports win prediction through Machine Learning classification in streaming [7.7] この研究は、複数のスライディングウィンドウ上で入力データが制御されるストリーミングにおいて、説明可能な勝利予測分類ソリューションに寄与する。
実験の結果,90%以上の精度を達成し,文献における競合解の性能を上回った。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:18:16 GMT)
A Unified Detection Pipeline for Robust Object Detection in Fisheye-Based Traffic Surveillance [7.7] 魚眼カメラは、一点から広い視野を捉えることで、広域交通監視の効率的なソリューションを提供する。
魚眼画像に固有の強い放射歪みと非均一分解能は、標準物体検出器に重大な課題をもたらす。
これらの条件下で頑健に動作するように設計された検出フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:38:34 GMT)
FootFormer: Estimating Stability from Visual Input [7.7] FootFormerは、視覚入力から人間の動きのダイナミクスを共同で予測するためのモダリティのアプローチである。
複数のデータセットにおいて、フットホルダーは、足圧分布、足の接触マップ、質量の中心の統計的に有意または等価な推定値を達成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:05:18 GMT)
HybridEP: Scaling Expert Parallelism to Cross-Datacenter Scenario via Hybrid Expert/Data Transmission [7.7] MoEのエキスパート並列性(EP)は、DC帯域幅が制限されているため、大きなスケーラビリティの問題に直面している。
制約帯域幅でEPを最適化するモデリング誘導フレームワークであるHybridEPを提案する。
実験の結果,HybridEPは既存のMoEトレーニングシステムを最大5.6倍の帯域幅で性能が向上していることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:05:17 GMT)
Calibration and Discrimination Optimization Using Clusters of Learned Representation [7.6] 入力サンプルの学習表現のクラスタ上で訓練された校正関数のアンサンブルを利用して、全体的な校正を向上する新しい校正パイプラインを提案する。
このアプローチは、様々なメソッドの校正スコアを82.28%から100%に改善するだけでなく、ユニークなマッチングメトリックも導入する。
我々のジェネリック・スキームは、基本的な表現、クラスタリング、キャリブレーション法およびメートル法に適応し、一般的に使用されるキャリブレーション法にまたがる柔軟性と優れた性能を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:41:30 GMT)
Explaining Time Series Classifiers with PHAR: Rule Extraction and Fusion from Post-hoc Attributions [7.5] PHARは、数値的特徴属性を構造化された可読性ルールに変換するフレームワークである。
専用ルール融合ステップは、重み付け選択やラッソベースの精錬のような戦略を用いてルールセットを統合する。
UCR/UEA時系列分類アーカイブの実験は、PHARがTS分類タスクの解釈可能性、決定透明性、実用的な適用性を改善することを実証している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:33:06 GMT)
LyTimeT: Towards Robust and Interpretable State-Variable Discovery [7.5] LyTimeTは、解釈可能な変数抽出のためのフレームワークである。
動的ビデオシステムの堅牢で安定した潜伏表現を学習する。
その結果,時間的注意と安定性の制約を組み合わせることで,予測モデルが得られることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:03:10 GMT)
Space Object Detection using Multi-frame Temporal Trajectory Completion Method [7.5] 静止地球軌道(GEO)における宇宙物体は、光学画像において重要な検出課題を呈している。
ウェーブレット変換により1フレームレベルの背景雑音を抑えながらGEOターゲットの高周波特性を向上する。
欠落検出と誤検出を効果的に軽減するため、時間的マッチングと完了、時間的一貫性に基づくノイズフィルタリング、進行軌道改善を含む一連の重要なステップを設計する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:04:27 GMT)
Policy Optimization Prefers The Path of Least Resistance [7.4] 政策最適化は明確な推論を捨てることが一貫して学習されていることを示す。
我々は、一連の制御された報酬分解実験を通じて、この原理を定式化する。
以上の結果から,政策立案の自由は両刃剣であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:48:44 GMT)
From Facts to Folklore: Evaluating Large Language Models on Bengali Cultural Knowledge [7.3] 大規模言語モデル(LLM)は,コンテキストが提供されると,文化的知識やパフォーマンスに苦しむことを示す。
我々の研究は、ベンガル語文化知識データセットを通じてこれらの制限に対処し、民俗伝統、料理芸術、地域方言を含む。
複数の多言語言語モデルについて検討したところ、これらのモデルは非文化的カテゴリーでよく機能するが、文化的な知識にかなり苦労し、文脈が提供されると性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:42:59 GMT)
Scalable Boltzmann Generators for equilibrium sampling of large-scale materials [7.3] 本稿では,材料科学の応用に焦点をあてて,スケーラビリティのボトルネックに対処するボルツマンジェネレータアーキテクチャを提案する。
我々は,局所的な環境情報に基づいて生成プロセスを構築するために,グラフニューラルネットワークと組み合わせた拡張結合流を利用する。
従来のアーキテクチャと比較して、我々のモデルは大幅に高速に訓練し、計算資源をはるかに少なくし、より優れたサンプリング効率を実現する。
我々は、レナード・ジョーンズ結晶、mW水の氷相、シリコンの相図など、いくつかの材料システムに適用することで、アプローチの可能性を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:24:04 GMT)
BlockGPT: Spatio-Temporal Modelling of Rainfall via Frame-Level Autoregression [7.2] BlockGPTはバッチトークン化を用いた生成自己回帰変換器である。
各フレーム内で自己注意とフレーム間の因果的注意を用いて、時空を分解する。
精度が向上し、カテゴリのメトリクスによって測定されるイベントのローカライゼーションが向上し、推論は同等のベースラインよりも最大31倍高速になる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:14:05 GMT)
Iterative Training of Physics-Informed Neural Networks with Fourier-enhanced Features [7.2] スペクトルバイアスは、ニューラルネットワークがまず低周波の特徴を学習する傾向にあるが、これはよく知られた問題である。
本稿では,Fourier-enhanced機能付きPINNの反復学習アルゴリズムであるIFeF-PINNを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:17:37 GMT)
Defending Against Prompt Injection with DataFilter [7.2] 大規模言語モデル(LLM)エージェントは、タスクの自動化や信頼できない外部データとのインタラクションのために、ますます多くデプロイされている。
LLMがアクセスするデータに悪意のある命令を注入することで、攻撃者は元のユーザタスクを任意にオーバーライドし、意図しない潜在的有害なアクションにエージェントをリダイレクトすることができる。
テスト時間モデルに依存しないディフェンスであるDataFilterを提案し、バックエンドのLCMに到達する前にデータから悪意ある命令を除去する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:30:49 GMT)
A Design Science Blueprint for an Orchestrated AI Assistant in Doctoral Supervision [7.1] 本研究は,社会技術仲介者として機能するAIアシスタントと共同パイロットのための設計科学の青写真である。
このようなシステムのリスクには、AI過信や学習の錯覚の可能性などが含まれる。
このコントリビューションは、組織が規律を越えて実施し、試行できるワークフローとガバナンスルールを備えた、先進的で文学的なデザインである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:20:35 GMT)
PTFA: An LLM-based Agent that Facilitates Online Consensus Building through Parallel Thinking [7.1] 本稿では,オンライン・テキスト・コンセンサス構築プロセスを支援するParallel Thinking-based Agent (PTFA)を提案する。
PTFAは、リアルタイムテキスト入力を自動的に収集し、大きな言語モデル(LLM)を利用して、よく確立されたSix Thinking Hatsテクニックの6つの異なる役割を並列思考で実行する。
パイロットスタディは、アイデア生成、感情探索、およびアイデア品質のより深い分析におけるその能力を実証した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:35:25 GMT)
Multifidelity Simulation-based Inference for Computationally Expensive Simulators [7.1] MF-(TS)NPEは、トランスファーラーニングを用いて安価な低忠実度シミュレーションを利用する、神経後部推定のための多忠実なアプローチである。
A-MF-TSNPEは,密度推定器の予測不確かさを目標とした取得関数を用いた逐次変種である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:47:14 GMT)
Enhancing Early Alzheimer Disease Detection through Big Data and Ensemble Few-Shot Learning [7.0] アルツハイマー病(英: Alzheimer disease)は、様々な脳領域で障害を起こし、記憶障害を引き起こす重度の脳疾患である。
アルツハイマー病の検出精度を向上させるための効果的な方法が不可欠である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:35:03 GMT)
Symmetry restoration and quantum Mpemba effect in many-body localization systems [7.0] 多体局在系における対称性の復元と量子ムペンバ効果について検討する。
熱平衡に近づくことなく、多体局在状態において対称性を回復できることを示す。
多体局在に有効なモデルを用いて対称性の復元と量子ムペンバ効果の理論解析を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:18:57 GMT)
Scalable LinUCB: Low-Rank Design Matrix Updates for Recommenders with Large Action Spaces [6.9] 特にLinUCBはリコメンデータシステムで広く使われている。
本稿では,逆正規化設計行列を用いた高速かつメモリ効率の高い演算を実現するアルゴリズムであるScalable LinUCBを紹介する。
提案アルゴリズムの有効性を,レコメンデータシステムデータセットで実証した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:17:42 GMT)
Training data membership inference via Gaussian process meta-modeling: a post-hoc analysis approach [6.9] 本稿では,ガウス過程(GP)メタモデリングに基づく,効率的かつ解釈可能なGP-MIAを提案する。
GP-MIAは、正確性、エントロピー、データセット統計などのポストホックメトリクスを使用して、GPをトレーニングし、メンバーと非メンバーを区別し、キャリブレーションされた不確実性推定を提供する。
合成データ,実世界の不正検出データ,CIFAR-10,WikiText-2 を用いて,GP-MIA が高精度で一般化可能であることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:10:47 GMT)
The Confusing Instance Principle for Online Linear Quadratic Control [6.9] モデルに基づく強化学習を用いて、未知のダイナミクスの下で2次コストで線形系を制御するという問題を再考する。
我々は,MAB や離散決定過程において,後悔の少ない下位境界を基盤とする Confusing Instance (CI) 原則に基づく代替案を提案する。
感度・安定性解析とともにLQRポリシの構造を活用することで,MED-LQを開発した。この新たな制御戦略は,CIとMEDの原則を小規模設定を超えて拡張する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:38:42 GMT)
Rethinking Multimodal Learning from the Perspective of Mitigating Classification Ability Disproportion [6.7] マルチモーダル学習は、モダリティの不均衡によって著しく制約される。
本稿では,強化の原理を取り入れて,弱いモダリティと強いモダリティの分類能力のバランスをとる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:44:44 GMT)
CoCoA Is ADMM: Unifying Two Paradigms in Distributed Optimization [6.7] 分散環境での一般的な経験的リスク最小化問題に対する原始双対アルゴリズムについて考察する。
アルゴリズムの両クラスは、原始変数と双対変数のみを含む統一された更新形式に変換可能であることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:31:16 GMT)
Adversarial Attacks on LiDAR-Based Tracking Across Road Users: Robustness Evaluation and Target-Aware Black-Box Method [6.6] 本稿では,3次元物体追跡の文脈において,敵攻撃を行うための統一的なフレームワークを提案する。
ブラックボックス攻撃のシナリオに対処するために,新たなトランスファーベースアプローチであるTarget-aware Perturbation Generation (TAPG)アルゴリズムを導入する。
実験の結果,ブラックボックスとホワイトボックスの両方の攻撃を受けた場合,高度な追跡手法に重大な脆弱性があることが判明した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:40:14 GMT)
Flexible-length Text Infilling for Discrete Diffusion Models [6.6] この課題を克服するための最初の離散拡散モデルである textbfDDOT (textbfDiscrete textbfDiffusion with textbfOptimal textbfTransport Position Coupling) を導入する。
DDOTは、新しいサンプルレベル最適輸送(OT)結合を用いて、トークン値とトークン位置を共同で識別する。
One-Billion-WordやYelpといったテキスト入力ベンチマークの実験では、DDOTが単純な拡散ベースラインより優れていることが示されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:27:18 GMT)
Throwing Vines at the Wall: Structure Learning via Random Search [6.6] Vineコプラはフレキシブルな依存モデリングを提供し、機械学習で広く使われているが、構造学習は依然として重要な課題である。
構造選択を改善するランダム探索アルゴリズムとモデル信頼度セットに基づく統計的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:26:18 GMT)
Smoothed Distance Kernels for MMDs and Applications in Wasserstein Gradient Flows [6.6] K(x,y) := - |x-y|$ は統計学における最大平均誤差 (MMD) の定義に用いられた。
本稿では, 負距離カーネルの次数 1 の条件正定値として好適な特性を保った新しいカーネルを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:11:00 GMT)
Shilling Recommender Systems by Generating Side-feature-aware Fake User Profiles [6.6] Leg-UPフレームワークを拡張して、サイド機能を導入し、サイド機能対応のフェイクユーザプロファイルの生成を可能にします。
ベンチマーク実験により,本手法はステルス性を維持しながら強力な攻撃性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:05:43 GMT)
XBench: A Comprehensive Benchmark for Visual-Language Explanations in Chest Radiography [6.4] 胸部X線におけるクロスモーダル解釈性を評価するための最初の体系的ベンチマークを示す。
我々は,クロスアテンションと類似性に基づくローカライズマップを用いた視覚的説明を生成する。
複数の病理組織を横断する放射線診断領域とのアライメントを定量的に評価した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:52:19 GMT)
A Survey of Information Disorder on Video-Sharing Platforms [6.4] ビデオ共有プラットフォーム(VSP)は中心的な情報ハブとなっているが、情報障害の拡散を促進する。
本調査は3次元にわたるVSPのマルチメディアエコシステムの研究を合成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:32:12 GMT)
RELATE: A Schema-Agnostic Perceiver Encoder for Multimodal Relational Graphs [6.3] マルチテーブルデータドメインは、電子商取引、医療、科学研究で一般的である。
既存のグラフネットワークは、各ノードタイプの特徴列に対して別々のモジュールを必要とするスキーマ固有の特徴エンコーダに依存している。
RELATEはプラグイン・アンド・プレイ機能を持つエンコーダで、汎用的なモダリティで使用することができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:27:49 GMT)
Serverless GPU Architecture for Enterprise HR Analytics: A Production-Scale BDaaS Implementation [6.2] 単一ノードのサーバレスGPUランタイムをTabNetに統合する,プロダクション指向のBig Data as a Service (BD) ブループリントを提案する。
HR、アダルト、BLSデータセット上でベンチマークを行い、SparkとCPUベースラインに対するアプローチを比較します。
以上の結果から,GPUパイプラインはSparkベースラインに比べて最大4.5倍高いスループット,98倍のレイテンシ,1K推論あたりのコスト90%の削減を実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:37:42 GMT)
A Machine Learning-Based Framework to Shorten the Questionnaire for Assessing Autism Intervention [6.2] 本研究では,評価の精度を維持しつつ,評価の短縮を図る,一般化可能な機械学習フレームワークを提案する。
進捗監視では,全スコア変化と全サブドメインカバレッジとの強い相関を保った16項目を特定した。
ポイント・イン・タイムの重大度評価では,13項目のみを用いて80%以上の分類精度を達成した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:26:53 GMT)
Is This Tracker On? A Benchmark Protocol for Dynamic Tracking [6.2] ITTOは、ポイントトラッキングメソッドの機能と制限を評価し、診断するための新しいベンチマークスイートである。
我々はITTOにおける最先端追跡手法の厳密な分析を行い、動きの複雑さの鍵軸に沿って性能を損なう。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:53:56 GMT)
Data-driven Quantum Dynamical Embedding Method for Long-term Prediction on Near-term Quantum Computers [6.2] 量子力学埋め込み(QDE)を用いた時系列予測のためのデータ駆動手法を提案する。
時系列長の独立性に基づき、この手法は深さ効率の高い量子回路を実現する。
数値シミュレーションは、波動信号だけでなく、NARMAのようなより複雑な信号も予測できることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:28:54 GMT)
RoboGPT-R1: Enhancing Robot Planning with Reinforcement Learning [6.1] 具体化計画のための2段階ファインチューニングフレームワークであるRoboGPT-R1を提案する。
このフレームワークでは、教師付きトレーニングがエキスパートシーケンスを通じて基礎知識を取得し、続いてRLが、視覚空間的理解と推論におけるモデルの欠点に対処する。
Qwen2.5-VL-3Bでトレーニングされた推論モデルは、大規模モデルであるGPT-4o-miniを21.33%上回り、EmbodiedBenchベンチマークで20.33%上回る。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:03:47 GMT)
Magnetic field estimation using Gaussian process regression for interactive wireless power system design [6.1] 共振器を結合したワイヤレス電力伝送は、電子機器のシームレスな電力供給に有望なソリューションを提供する。
磁場と電力伝達効率を可視化するインタラクティブな設計手法は、これらのシステムの理解と探索を容易にする。
本稿では,Gaussian Process Regression (GPR) を用いた機械学習手法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:26:38 GMT)
Seabed-Net: A multi-task network for joint bathymetry estimation and seabed classification from remote sensing imagery in shallow waters [6.1] Seabed-Netは統合マルチタスクフレームワークであり、同時に水浴量測定と海底分類を予測する。
従来の経験的モデルや機械学習の回帰手法よりも一貫して優れています。
また、最先端のシングルタスクやマルチタスクベースラインと比較して、浴量計RMSEを10~30%削減する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:43:03 GMT)
Context-Aware Pseudo-Label Scoring for Zero-Shot Video Summarization [6.1] 本稿では,ルーリック誘導型,擬似ラベル付き,即時駆動型ゼロショットビデオ要約フレームワークを提案する。
人間のアノテーションの小さなサブセットは、高信頼の擬似ラベルに変換される。
推論中、境界シーンはそれぞれの記述に基づいて独立してスコアされる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:54:43 GMT)
LyriCAR: A Difficulty-Aware Curriculum Reinforcement Learning Framework For Controllable Lyric Translation [6.0] 制御可能な歌詞翻訳のための新しいフレームワークであるLyriCARを提案する。
LyriCARは難易度の高いカリキュラムデザイナと適応型カリキュラム戦略を導入している。
EN-ZH歌詞翻訳タスクの実験は、LyriCARが最先端の結果を達成することを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:57:20 GMT)
Beyond sparse denoising in frames: minimax estimation with a scattering transform [6.0] 散乱係数の異なる部分集合の$ell1$ノルムを最小化し、最大化する。
信号からの雑音を抑圧し、幾何学関数の正則性を指定するために、異なる調和解析アプローチを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:05:25 GMT)
Feature Space Adaptation for Robust Model Fine-Tuning [5.9] 破滅的な忘れはモデル微調整において一般的な問題である。
LoRFAとVeFAの2つの新しい微調整法が提案されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:06:12 GMT)
On Encoding Matrices using Quantum Circuits [5.9] ブロック符号化と状態準備回路の形式で符号化行列について検討する。
a) 古典的な形式で与えられた任意の行列のブロック符号化を効率的に構築するための一般的な方法、(b) ブロック符号化と状態準備回路間の双方向変換アルゴリズムである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:20:08 GMT)
Nonlocal interaction and quantum friction in sliding Bi$_2$Se$_3$ topological surfaces [5.9] トポロジカル絶縁体Bi$Se$_3$薄膜は、そのトポロジカルに保護された表面状態から生じるユニークな電子特性を示す。
相対運動中の2つの無限平行金属板の励起と散逸について検討した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:47:51 GMT)
ROTI-GCV: Generalized Cross-Validation for right-ROTationally Invariant Data [5.8] 高次元正規化回帰における2つの重要なタスクは、正確な予測のために正規化強度を調整し、サンプル外リスクを推定することである。
問題のある条件下でクロスバリデーションを確実に行うための新しいフレームワーク ROTI-GCV を導入する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:28:09 GMT)
Heisenberg-Limited Quantum Eigenvalue Estimation for Non-normal Matrices [5.7] 非正規行列の固有値を推定することは、遠縁な意味を持つ基礎的な問題である。
ここでは、この課題に対処する新しい量子アルゴリズムのクラスを紹介する。
我々の研究は、線形代数において最も要求の多い問題の1つに厳密でスケーラブルな量子コンピューティングアプローチの基礎を築いた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:55:44 GMT)
Designing a Secure and Resilient Distributed Smartphone Participant Data Collection System [5.7] MotionPIはスマートフォンベースのシステムで、センサーやサーベイを通じて行動データや健康データを収集する。
データをローカルとセキュアなクラウドサーバの両方に、暗号化された送信とストレージで保存する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:07:49 GMT)
Generalizing while preserving monotonicity in comparison-based preference learning models [5.7] 拡散優先度を持つ線形一般化ブラッドレー・テリーモデルの新しいクラスを提案する。
実験の結果,新しい一般化モデルでは,特にデータセットが限定された場合,精度が向上することがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:04:54 GMT)
Error Analysis of Triangular Optimal Transport Maps for Filtering [5.6] 本稿では,フィルタとデータ同化のための最適トランスポートベースアルゴリズムのクラスに対する推定誤差の体系的解析を行う。
次に、これらの結果をフィルタリングシナリオに適用し、Al-Jarrahらの最適輸送フィルタリングアルゴリズムを解析する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:35:48 GMT)
LLM-Augmented Symbolic NLU System for More Reliable Continuous Causal Statement Interpretation [5.6] 本稿では,LLMの広包言語処理と,構造化された関係表現を生成するシンボリックなNLU機能を統合するハイブリッドアプローチについて検討する。
我々のハイブリッド方式は,シンボルのみのパイプラインよりもはるかに優れていることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:38:20 GMT)
Mapping the AI Divide in Undergraduate Education: Community Detection in Disciplinary Networks and Survey Evidence [5.5] 我々は,ネットワーク科学と南京大学による調査証拠を組み合わせることで,学部教育におけるAI格差を図示する。
我々は、科学、科学周辺、社会科学と科学、人文科学と社会科学の4つの異なる学生コミュニティを識別する。
本研究は,カリキュラム構造と学際的統合が技術流布の重要な要因であることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:46:12 GMT)
On the Effectiveness of Methods and Metrics for Explainable AI in Remote Sensing Image Scene Classification [5.4] シーン分類問題に対する説明可能な人工知能(xAI)手法の開発は、リモートセンシング(RS)において大きな注目を集めている。
コンピュータビジョン(CV)で考慮された自然画像に対して、ほとんどのxAI法とRSの関連評価指標が最初に開発された。
本稿では,RS画像シーン分類の文脈における説明手法とメトリクスの有効性について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:17:31 GMT)
FairNet: Dynamic Fairness Correction without Performance Loss via Contrastive Conditional LoRA [5.2] 既存のデバイアス法ではパフォーマンスが損なわれ、静的な修正戦略に頼り、データの分散に苦しむ。
動的でインスタンスレベルの公平性を補正する新しいフレームワークであるFairNetを提案する。
FairNetはバイアス検出器と条件付き低ランク適応(LoRA)を統合し、フェアネス補正機構の選択的活性化を可能にする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:44:03 GMT)
MedReason-R1: Learning to Reason for CT Diagnosis with Reinforcement Learning and Local Zoom [5.2] VLM(General-purpose Vision-Language Models)は、自然画像の詳細な記述を生成する強力な能力を示す。
しかし、医療分野における彼らのパフォーマンスは、比較的簡単な作業であっても、まだ最適以下である。
MedReason-R1は、疾患診断のための明確な推論プロセスを持つ医療用VLMである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:21:59 GMT)
Preliminary Use of Vision Language Model Driven Extraction of Mouse Behavior Towards Understanding Fear Expression [5.2] この研究は、マウスの様々な振る舞いを分類するために、ビデオにテキスト入力をエンコードする視覚言語モデル(VLM)を確立する。
我々はオープンソースのQwen2.5-VLモデルを用いて、プロンプト、ラベル付き例を用いたインコンテキスト学習(ICL)、フレームレベルの前処理による性能の向上を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:33:39 GMT)
Ultra-Fast Wireless Power Hacking [5.1] ワイヤレス充電は、重大なサイバーセキュリティ上の課題をもたらす。
以前の研究では、ハッカーが動作周波数を検出して、かなりの電力を盗むことができた。
この攻撃は、単純な周波数変化パワー暗号化がそのような脅威に対して限定的な保護を提供することを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:12:47 GMT)
An Analysis of Concept Bottleneck Models: Measuring, Understanding, and Mitigating the Impact of Noisy Annotations [5.1] 概念ボトルネックモデル(CBM)は、予測を人間の解釈可能な概念に分解することで、解釈可能性を保証する。
しかし、この透明性を実現するためのCBMのトレーニングに使用されるアノテーションは、しばしばうるさくなります。
適度な腐敗でさえ、予測性能、解釈可能性、介入効果を同時に損なう。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:12:36 GMT)
A Communication-Efficient Decentralized Actor-Critic Algorithm [5.1] 本研究では,各エージェントがポリシーと値関数の局所的な更新を行う分散アクタ批判学習フレームワークを開発する。
このローカルトレーニング戦略は、ネットワーク間の協調を維持しながら、通信負担を大幅に削減する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:15:52 GMT)
AegisMCP: Online Graph Intrusion Detection for Tool-Augmented LLMs on Edge Devices [5.1] 本稿では,プロトコルレベルの侵入検知器であるAegisMCPを紹介する。
AegisMCPは、ウィンドウ毎のサブ秒モデル推論とエンドツーエンドの警告を実現する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:50:22 GMT)
Good quantum codes with addressable and parallelizable non-Clifford gates [5.1] He $textitet al.$ (2025) で示される優れた量子エラー訂正符号の族を再検討する。
アドレナブルおよび非クリフォードマルチコントロールの様々なセット-$Z$ゲートを並列に実行可能であることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:47:03 GMT)
Benchmarking Large Language Models for Personalized Guidance in AI-Enhanced Learning [5.0] 大規模言語モデル(LLM)は、パーソナライズされた学習のためのインテリジェントアシスタントとしてますます考えられている。
本研究では,現実的な学習環境を模擬した学習課題における3つの最先端LLMの実証的比較を行った。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:08:29 GMT)
Vision-Based Mistake Analysis in Procedural Activities: A Review of Advances and Challenges [4.9] 手続き的活動におけるミステイク分析は、産業自動化、身体的リハビリテーション、教育、人間とロボットの協調といった分野における研究の重要な領域である。
本稿では、手続き的および実行的誤りに着目し、構造化されたタスクの誤りを検出し予測するための視覚的手法についてレビューする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:48:31 GMT)
A Markov Decision Process for Variable Selection in Branch & Bound [4.8] ブランチとバウンドソルバのパフォーマンスに影響を与える重要な要因は、分岐決定を管理する変数の選択である。
最近のコントリビューションでは、B&B設定に強化学習アルゴリズムを適用して最適な分岐ポリシーを学習しようと試みている。
我々は,B&Bにおける変数選択のための基本的バニラMDP式であるBBMDPを導入し,広い範囲のRLアルゴリズムを活用する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:15:32 GMT)
Quantum computation of molecular geometry via many-body nuclear spin echoes [4.8] ネマティック液晶に懸濁した2つの有機分子に対して, OTOCs[1-4]の測定を行った。
我々は、OTOC測定を用いて分子動力学モデルを強化し、基礎となる力場における既知の近似を補正する。
上記のOTOCデータを解釈する指数関数的な古典的コストを改善するため、Wilow超伝導量子プロセッサ上で分子OTOCをシミュレートする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:03:06 GMT)
Explainable fault and severity classification for rolling element bearings using Kolmogorov-Arnold networks [4.7] ベアリング故障は機械の故障の主な原因である。
本研究では,これらの課題に対処するためにKolmogorov-Arnold Networksを用いた。
説明可能な結果を提供する軽量モデルを生成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:51:24 GMT)
Overfitting in Adaptive Robust Optimization [4.7] より強い確率的保証を与えるため、制約固有の不確実性セットのサイズを割り当てることを提案する。
この見解は、堅牢性と適応性のバランスをとる不確実性セットを設計するための原則化されたアプローチを動機付けている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:35:40 GMT)
FutrTrack: A Camera-LiDAR Fusion Transformer for 3D Multiple Object Tracking [4.7] FutrTrackは、トランスフォーマーベースのスムーズと融合駆動のトラッカーを導入することで、既存の3D検出器上に構築されている。
我々のフュージョントラッカーは、複数のカメラとLiDARからのマルチモーダルバードアイビュー(BEV)フュージョン機能とバウンディングボックスを統合している。
FutrTrackは、3D MOTベンチマークで強力なパフォーマンスを実現し、競合精度を維持しながらアイデンティティスイッチを削減している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:25:01 GMT)
News-Aware Direct Reinforcement Trading for Financial Markets [4.7] 本研究では,大規模言語モデルから得られるニュース感情スコアと,原価および音量データとを,強化学習のための可観測入力として用いる。
これらの入力は、リカレントニューラルネットワークやTransformerなどのシーケンスモデルによって処理され、エンドツーエンドのトレーディング決定を行う。
その結果,手作業による特徴や手作業によるルールに依存しない我々のニューズアウェアアプローチは,市場ベンチマークよりも優れた性能を実現することができた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:17:03 GMT)
Accelerating Fault-Tolerant Quantum Computation with Good qLDPC Codes [4.6] Schemeは、一定のqubitオーバーヘッドと時間オーバーヘッドを$O(da+o(1))$ for any $[[n,k,d]$ qLDPC code with constant encoding rate and distance $d = Omega(n1/a)$とする。
その結果,qLDPC符号上でのフォールトトレラント量子計算を高速化する新たなパラダイムが確立され,オーバヘッドの低減と適用性の向上が図られた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:15:40 GMT)
ConvXformer: Differentially Private Hybrid ConvNeXt-Transformer for Inertial Navigation [4.5] ディープラーニングベースの慣性追跡システムは、プライバシー侵害に弱いままだ。
本研究では,ConvNeXtブロックとTransformerエンコーダを融合したハイブリッドアーキテクチャであるConvXformerを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:20:31 GMT)
zk-Agreements: A Privacy-Preserving Way to Establish Deterministic Trust in Confidential Agreements [4.5] 機密性を維持しつつ、紙ベースの信頼から暗号的信頼へ移行するためのプロトコルであるzk-agreementsを導入する。
当社の設計では,プライベートな契約条件を保護するためのゼロ知識証明,プライベートなコンプライアンス評価を可能にするための2要素計算,自動実施を保証するためのスマートコントラクトを組み合わせる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:11:57 GMT)
Style Attack Disguise: When Fonts Become a Camouflage for Adversarial Intent [4.5] 我々は,スタイルベースアタック,スタイルアタック・ディグライズ(SAD)を提案する。
テキスト・ツー・イメージやテキスト・トゥ・音声生成といったマルチモーダルタスクに対するSADの潜在的な脅威を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:40:24 GMT)
LLMs can hide text in other text of the same length.ipynb [4.4] 意味のあるテキストは別のテキストの中に隠すことができる。
本稿では,大規模言語モデルを用いた簡便かつ効率的なプロトコルを提案する。
このようなプロトコルの存在は、権威的な意図からテキストを急進的に切り離すことを示し、さらに文書によるコミュニケーションに対する信頼を損なう。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:16:50 GMT)
DIPLI: Deep Image Prior Lucky Imaging for Blind Astronomical Image Restoration [4.4] この研究は、バックプロジェクション技術を用いて、シングルフレームからマルチフレームのトレーニングに移行するフレームワークであるDIPLIを提案する。
総合評価では、ラッキーイメージング、DIP、トランスフォーマーベースモデルRVRT、拡散ベースモデルDiffIR2VR-Zeroと比較する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:46:13 GMT)
Video Consistency Distance: Enhancing Temporal Consistency for Image-to-Video Generation via Reward-Based Fine-Tuning [4.4] ビデオ拡散モデルの逆ベース微調整は、生成ビデオの品質向上に有効な手法である。
本稿では,時間的一貫性を高めるために,ビデオ一貫性距離(VCD, Video Consistency Distance)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:59:45 GMT)
Uncertainty evaluation of segmentation models for Earth observation [4.4] 本稿では,衛星画像からのセマンティックセグメンテーション予測における不確実性を推定する手法について検討する。
本評価は,不確実性対策の実用性,予測誤差の識別能力,及びノイズ破損した入力画像領域の検証に焦点をあてる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:39:28 GMT)
Can You Trust What You See? Alpha Channel No-Box Attacks on Video Object Detection [4.3] 我々は、RGBAビデオのアルファチャンネルを介して完全に動作するオブジェクト検出器に対する最初のノンボックス対逆攻撃であるα-Cloakを提示する。
Alpha-Cloakはアルファチャンネルを利用して、悪意のあるターゲットビデオと良心的なビデオとを融合させる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:27:02 GMT)
Calculating the Luttinger liquid parameter for an interacting Kitaev chain quantum simulator [4.3] 我々は磁気双極子-双極子相互作用によって結合されたスピン中心のS=1$チェーンの提案に基づいて構築する。
また、別の磁場を導入し、相互作用するキタエフ鎖に系をマッピングする。
この設定は、応用場と結晶内のスピン中心の配向を通して、様々な豊富な量子挙動を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:50:22 GMT)
kabr-tools: Automated Framework for Multi-Species Behavioral Monitoring [4.3] 自動多種行動監視のためのオープンソースパッケージであるkabr-toolsを提案する。
このフレームワークは、ドローンベースのビデオと機械学習システムを統合し、野生動物の映像から行動、社会的、空間的メトリクスを抽出する。
地上からの観測に比べて、ドローンによる観測は行動の粒度を大幅に改善し、視界の損失を15%削減した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:57:21 GMT)
Modality Matching Matters: Calibrating Language Distances for Cross-Lingual Transfer in URIEL+ [4.3] タイプマッチング言語距離のためのフレームワークを提案する。
距離タイプ毎に新しい構造認識表現を提案する。
我々はこれらの信号を頑健でタスクに依存しない複合距離に統一する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:59:19 GMT)
Abstain Mask Retain Core: Time Series Prediction by Adaptive Masking Loss with Representation Consistency [4.0] 時系列予測はエネルギー管理や金融市場といった重要な領域において重要な役割を担っている。
本研究は, 履歴データを適切に切り詰めることによって予測精度を向上させるという, 直感に反する現象を明らかにする。
本稿では,適応的マスキング・ロス(Adaptive Masking Loss)と表現整合性(Representation Consistency)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:23:53 GMT)
TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research [4.0] 本研究では,おもちゃのタスクの形式的構造と実世界の複雑さを組み合わせることで,テキスト・ツー・ジェネレーションを学習の理想的なタスクとして提案する。
最小回路の識別にはエッジパッチやスパースオートエンコーダなどの解釈可能性技術を適用する。
私たちの研究は、構造化され、段階的に複雑な設定における解釈可能性メソッドの探索と比較のための堅牢なフレームワークを提供します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:48:10 GMT)
Learn More by Using Less: Distributed Learning with Energy-Constrained Devices [4.0] Federated Learning(FL)は、分散モデルトレーニングのソリューションとして、分散化されたプライバシ保護デバイスに登場した。
本稿では,電池に制約のあるデバイス上でのクライアント選択とトレーニング作業の最適化を目的とした,エネルギーを意識したFLフレームワークであるLeanFedを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:43:07 GMT)
CONFEX: Uncertainty-Aware Counterfactual Explanations with Conformal Guarantees [4.0] 本研究では,不確実性を考慮した対実的説明を生成する新しい手法であるCONFEXを提案する。
CONFEXの説明は、CFX生成が交換可能性に反する問題に対処するため、ローカルなカバレッジ保証を提供するように設計されている。
各種ベンチマークやメトリクスを用いた最先端手法に対するCONFEXの評価を行った。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:43:36 GMT)
FnRGNN: Distribution-aware Fairness in Graph Neural Network [4.0] グラフニューラルネットワーク(GNN)は、構造化されたデータから学習する上で優れていますが、回帰タスクの公平性はまだ未調査です。
我々は,GNNに基づくノード回帰のための公平性を考慮した内部処理フレームワークFnRGNNを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:29:43 GMT)
Addressing the Depth-of-Field Constraint: A New Paradigm for High Resolution Multi-Focus Image Fusion [4.0] マルチフォーカス画像融合(MFIF)は、光学レンズの奥行き制限(DOF)に対処する。
本稿では,高忠実かつ効率的な画像再構成のための蒸留変分オートエンコーダを用いた新しいMFIF手法VAEEDOFを提案する。
提案手法は, シームレスなアーティファクトフリーの融合画像を生成し, 合成シナリオと実世界のシナリオのギャップを埋める。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:32:04 GMT)
Interpret Policies in Deep Reinforcement Learning using SILVER with RL-Guided Labeling: A Model-level Approach to High-dimensional and Multi-action Environments [3.9] 深層強化学習は優れた性能を発揮するが、解釈性に欠ける。
SILVERフレームワークは、Shapleyベースの回帰を通じてRLポリシーを説明するが、低次元のバイナリアクションドメインに限定されている。
本稿では,SILVERをマルチアクションおよび高次元環境に拡張した拡張型であるRL誘導ラベル付きSILVERを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:04:43 GMT)
Fair Supervised Learning Through Constraints on Smooth Nonconvex Unfairness-Measure Surrogates [3.9] 公正な教師付き機械学習のための新しい戦略を提案する。
文献上の他のものと比較して提案された戦略の主な利点は以下の通りである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:48:24 GMT)
Local Obfuscation by GLINER for Impartial Context Aware Lineage: Development and evaluation of PII Removal system [3.8] LOGICALは、GLiNERモデルに基づいて開発された、効率的でローカルにデプロイ可能なPII除去システムである。
微調整のGLiNERモデルは、全体的なマイクロ平均F1スコア0.980で優れた性能を達成した。
LOGicalは95%の文書を正しく衛生し、次のベストソリューションは64%だった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:12:07 GMT)
From Answers to Guidance: A Proactive Dialogue System for Legal Documents [3.8] EUDialは、欧州議会研究サービスの市民調査部門(AskEP)がキュレートした204のブログから構築された多面的な対話データセットである。
EUDialには880の対話旋回(対話毎の4.3回)があり、各対話には初期質問、構造化された回答、フォローアップ質問が含まれる。
その結果, 積極的かつ構造化されたナビゲーションは, 法的情報と市民理解のギャップを埋めることを示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:08:05 GMT)
Transmitter Identification via Volterra Series Based Radio Frequency Fingerprint [3.8] RFF(Radio Frequency Fingerprinting)は、暗号を必要とせず、偽造に抵抗するため、有望な解決策を提供する。
既存のRFFアプローチは、しばしば統一理論と効果的な特徴抽出を欠いている。
本研究では,送信機をブラックボックスとしてモデル化し,送信信号への影響を分析する。
パブリックなLoRaデータセットの実験では、静的チャネルでは98%以上の精度で、マルチパスとドップラー効果下で90%以上の精度で、最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:11:41 GMT)
Atomic-superfluid heat engines controlled by twisted light [3.8] 本稿では,Fabry-P'erotキャビティに配置されたリングトラッピングBose-Einstein凝縮体を用いた量子熱エンジンを提案する。
キャビティ強化光原子結合は、偏光モードの出現に繋がることを示した。
エンジン効率の軌道角運動量依存性について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:58:29 GMT)
Improved Exploration in GFlownets via Enhanced Epistemic Neural Networks [3.8] トレーニングのための適切な軌道を効果的に特定することは、GFlowNetsでは未解決の問題である。
提案アルゴリズムは,GFlownetのベースライン法と比較し,グリッド環境での評価を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:47:33 GMT)
Synthetic social data: trials and tribulations [3.7] 6つの大言語モデルのための4つの国における社会的価値の統計的表現について検討する。
機械出力と実際の人間の調査データを比較した。
この結果は、人間による調査の物流的・財政的な制約にもかかわらず、実際の回答者の小さなサンプルでさえ、より信頼性の高い洞察を提供する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:25:42 GMT)
Which Evaluation for Which Model? A Taxonomy for Speech Model Assessment [3.7] 音声基礎モデルは、最近、広範囲のタスクで顕著な機能を達成した。
異なるモデルは、音声処理の異なる側面で優れており、異なる評価プロトコルを必要とする。
本稿では,どのモデルに適切な評価を行うかという問題に対処する統合分類法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:04:32 GMT)
CRAFT: Characterizing and Root-Causing Fault Injection Threats at Pre-Silicon [3.6] フォールトインジェクション攻撃は組み込みシステムに重大なセキュリティ脅威をもたらす。
物理的欠陥がシステムレベルの行動にどのように伝播するかの早期発見と理解は、サイバーインフラ構造を保護するために不可欠である。
この研究は、プレシリコン分析とポストシリコンバリデーションを組み合わせたフレームワークであるCRAFTを導入し、障害インジェクションの脆弱性を体系的に発見し分析する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:59:31 GMT)
Enabling Granular Subgroup Level Model Evaluations by Generating Synthetic Medical Time Series [3.5] テキスト拡張型TimeAutoDiffを導入し,分散アライメントのペナルティにより遅延拡散目標を増大させる。
我々は、MIMIC-IIIとeICUの全てのモデルについて、24時間死亡率と二分長タスクでベンチマークを行った。
32の交叉部分群では、大きな合成コホートがAUROC推定誤差を最大50%削減した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:17:29 GMT)
Quantum speedup of non-linear Monte Carlo problems [3.5] 本研究では,非線形推定問題の幅広いクラスに対する高速化を実現する量子インサイド量子モンテカルロアルゴリズムを提案する。
このアプローチの重要な革新は、量子コンピューティング用に特別に設計されたマルチレベルモンテカルロ近似の新しいシーケンスである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:41:16 GMT)
The Right to Be Remembered: Preserving Maximally Truthful Digital Memory in the Age of AI [3.5] 大規模言語モデル(LLM)は、複数の視点をひとつの回答に分解することで、その効果を増幅することができる。
ある物語、個人または集団は不均等に抑圧されうるが、他の物語は不均等に抑圧される。
本稿では,AIによる情報消去のリスクを最小限に抑えたRTBR(Right To Be Remembered)の概念を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:56:17 GMT)
I Spy With My Model's Eye: Visual Search as a Behavioural Test for MLLMs [3.5] マルチモーダル大規模言語モデル(MLLM)は視覚言語タスクにおいて高い性能を達成するが、その視覚処理は不透明である。
従来の視覚探索のパラダイムを応用して,MLLMの視覚的特徴が乱れのセットサイズとは無関係に検出されるような,ポップアウト効果を示すかどうかを検証した。
高度なMLLMは、色や大きさに基づく解離性(単一特徴)探索や、接続性(複数特徴)探索の容量制限において人間的なポップアウト効果を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:24:07 GMT)
QPPG: Quantum-Preconditioned Policy Gradient for Link Adaptation in Rayleigh Fading Channels [3.5] この研究は、リンク適応のための量子幾何学的条件付けを導入し、将来の6Gネットワークのための堅牢で量子にインスパイアされた強化学習の開発において大きな進歩をもたらした。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:51:28 GMT)
Effectiveness of the syndrome extraction circuit with flag qubits on IBM quantum hardware [3.5] 我々は,IBM量子コンピュータ上でフラグ量子ビットを用いたシンドローム抽出回路の実装に成功したことを報告した。
データキュービットはシンドロームキュービットに隣接していないが、繰り返し符号の距離が増加するにつれて論理誤差は減少する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:28:40 GMT)
FrugalPrompt: Reducing Contextual Overhead in Large Language Models via Token Attribution [3.5] 大規模言語モデル(LLM)は、その恒星の性能の大部分を入力コンテキストの拡大に負っているが、そのような冗長性は金銭的コスト、炭素フットプリント、推論時間の遅延を膨らませている。
本稿では,LLMのための新しいプロンプト圧縮フレームワークであるFrugalPromptを紹介する。
我々は,4つのNLPタスク(感性分析,コモンセンスQA,要約,数学的推論)にまたがるアプローチを評価する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:39:03 GMT)
ELUTQ: Efficient LUT-Aware Quantization for Deploying Large Language Models on Edge Devices [3.5] CPUベースのエッジデバイス上の大規模言語モデル(LLM)は、デバイス上のインテリジェンスの実現とAIアクセシビリティの拡大に不可欠である。
我々は,新しい量子化形式である階層線形量子化(HLQ)を導入した効率的な量子化フレームワークELUTQを提案する。
HLQは計算コストを増大させることなく、重量の統計特性をよりよく捉える。
LLaMA3-8Bの場合、HLQは3ビットで約8%、2ビット精度で約85%のパープレキシティを減少させる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:20:47 GMT)
Using Temperature Sampling to Effectively Train Robot Learning Policies on Imbalanced Datasets [3.3] ロボットタスクの多くのデータセットは、それらが表す物理的なロボット動作に関して、実質的に不均衡である。
この不均衡を緩和する政策訓練のための簡単なサンプリング戦略を提案する。
その結果,従来の最先端手法と比較して,低リソースタスクの大幅な改善が見られた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:48:55 GMT)
With Limited Data for Multimodal Alignment, Let the STRUCTURE Guide You [3.3] マルチモーダルモデルは、マルチモーダルアライメント、ゼロショット分類、クロスモーダル検索を必要とする複雑なタスクにおいて強力な機能を示した。
既存のモデルは通常、数百万対のサンプルを頼りにしている。
そこで本研究では,一様層の潜伏空間を保存する効果的な正則化手法を提案する。
これら2つのコンポーネントは、既存のアライメント手法に簡単に組み込むことができ、24のゼロショット画像分類と検索ベンチマークでかなりの利得が得られる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:04:53 GMT)
OpenGuardrails: An Open-Source Context-Aware AI Guardrails Platform [3.3] OpenGuardrailsは、コンテキスト対応の安全性と操作検出モデルを提供する、最初のオープンソースプロジェクトです。
OpenGuardrailsは、コンテンツ安全リスク、モデル操作攻撃、データ漏洩を防止する。
システムはセキュリティゲートウェイやAPIベースのサービスとしてデプロイできる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:02:27 GMT)
Fast sampling and model selection for Bayesian mixture models [3.2] 関節後部からのギブズサンプリングよりも,コンポーネントの割り当てを直接的に比較した辺縁部後部分布に適合する方策を論じる。
一般可積分混合物の後縁部からサンプリングするモンテカルロアルゴリズムについて述べる。
ガウスモデル、ポアソンモデル、カテゴリーモデルへのいくつかの応用でこのアプローチを実証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:43:12 GMT)
Guess your neighbor's input: Quantum advantage in Feige's game [3.2] プレイヤーごとに2つの質問と3つの回答を持つ非ローカルゲームについて検討し、1991年にフェイジが最初に検討した。
我々は、このゲームが3$次元の最大絡み合った状態に対する堅牢な自己テストであることを証明した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:13:33 GMT)
SPOT: Scalable Policy Optimization with Trees for Markov Decision Processes [3.1] 高い意思決定には、解釈可能な強化学習政策が不可欠である。
本研究では,決定木ポリシーを計算するための新しい手法であるSPOTを提案する。
我々は,木構造制約からMDPダイナミクスを分離する空間的分岐結合アプローチを採用する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:57:23 GMT)
Learning to Make Friends: Coaching LLM Agents toward Emergent Social Ties [3.1] 大規模言語モデル(LLM)エージェントは、人間のオンライン行動を特徴づける複雑な社会的ダイナミクスを再現する。
エージェントが繰り返し対話し、相互に評価し、文脈内学習を通じてそれらの振る舞いを適応するマルチエージェントLLMシミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:00:33 GMT)
Enhancing Graph Neural Networks: A Mutual Learning Approach [3.1] 本研究では,グラフニューラルネットワーク(GNN)における協調学習の可能性について検討する。
事前学習した教師モデルがない場合、比較的単純で浅いGNNアーキテクチャが効率的に学習できることが示される。
学生GNNのアンサンブルが学習過程を通じて相互に教え合う協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:07:48 GMT)
Beyond Reactivity: Measuring Proactive Problem Solving in LLM Agents [3.1] PROBEは3つのコア機能のパイプラインとして活性を分解する。
GPT-5とClaude Opus-4.1の両方で、40%の最高のエンドツーエンドパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:00:45 GMT)
BOSQTGEN: Breaking the Sound Barrier in Test Generation [3.1] 本稿では,新しいブラックボックスとAPIテスト生成ツールであるBOSQTGENを紹介する。
BOSQTGENは、API仕様をプリミティブに分解するための新しいアプローチ、LLMを使用してコヒーレントなインタラクションを提案し、これらの値を効率的にサンプリングするためにテストを採用する。
結果として得られたBOSQTGENシステムは、ベンチマークで平均82%のコードカバレッジを達成するが、しばしば以前の最先端システムよりも20%以上増加する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:11:30 GMT)
A Tutorial on Cognitive Biases in Agentic AI-Driven 6G Autonomous Networks [3.0] 本稿では, 分類, 定義, 数学的定式化, 通信システムの出現, 一般に影響を受けるエージェント成分など, よく知られたバイアスの選択に関するチュートリアルを提供する。
また、バイアスの種類ごとに調整された様々な緩和戦略も提示する。
この記事は最終的に2つの実用的なユースケースを提供し、これは6G間スライスとクロスドメイン管理における有名なバイアスの出現、影響、緩和に対処するものである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:05:04 GMT)
Extreme Views: 3DGS Filter for Novel View Synthesis from Out-of-Distribution Camera Poses [3.0] トレーニングデータ分布の外にカメラ位置から3Dガウススプラッティング(3DGS)モデルを見る場合、かなりの視覚ノイズが発生することが一般的である。
本稿では,この問題に対処する新しいリアルタイムレンダリング対応フィルタリング手法を提案する。
提案手法は,既存のNeRF(Neural Radiance Field)ベースのアプローチと比較して,視覚的品質,リアリズム,一貫性を著しく向上する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:09:16 GMT)
Learning Upper Lower Value Envelopes to Shape Online RL: A Principled Approach [3.0] 本研究は、この文脈における価値エンベロープの学習と適用方法に焦点を当てる。
第一段階はオフラインデータを用いて値関数の上下境界を導出し、第二段階は学習した境界をオンラインアルゴリズムに組み込む。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:32:52 GMT)
Provably Efficient Reward Transfer in Reinforcement Learning with Discrete Markov Decision Processes [2.9] 我々は、強化学習における報酬適応(RA)のための新しいソリューションを提案する。
本稿では,Q関数の操作によるRAに対する新しいアプローチを提案する。
この手法を "Q-Manipulation" (Q-M) と呼ぶ。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:22:42 GMT)
DARE: A Deformable Adaptive Regularization Estimator for Learning-Based Medical Image Registration [2.9] DARE(Deformable Adaptive Regularization Estimator)は、変形場の標準勾配に基づいて弾性正規化を動的に調整する新しい登録フレームワークである。
物理的に現実的な変換を保証するため、DAREは負の変形ジャコビアンを持つ領域をペナル化する折りたたみ防止機構を含む。
この戦略は、折り畳みなどの非物理的アーティファクトを緩和し、過剰な平滑化を回避し、登録精度と解剖学的妥当性の両方を改善する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:21:05 GMT)
What is the Best Sequence Length for BABYLM? [2.9] 本研究では,BabyLMプレトレーニングにおけるシーケンス長の影響について検討した。
長い方が良いことが多いが、最適な長さはタスクとアーキテクチャの両方に依存する。
より短い列は文法的な一般化タスクには十分であるが、より長い文脈は形態学的類推タスクに有利である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:42:33 GMT)
Affordable EEG, Actionable Insights: An Open Dataset and Evaluation Framework for Epilepsy Patient Stratification [2.9] てんかんのための単一チャネル・コンシューマグレード脳波の最初のオープンデータセットであるNEUROSKY-EPIを提示する。
その実用性を探るため、患者層化パイプラインであるEmbedClusterを紹介します。
その結果、低コストで単一チャネルのデータは有意義な成層化をサポートできることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:25:05 GMT)
Universality and Optimal Architectures for Layered Programmable Unitary Decompositions [2.9] より単純で物理的に実現可能な操作列への任意のユニタリ変換の分解は、量子情報科学の基本的な問題である。
我々は、そのような分解の幅広いクラスの普遍性を正当化するための1次元量子場モデルを確立する。
このフレームワークは、様々なアーキテクチャの普遍性を検証するための統一的な手法を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:15:58 GMT)
Aligning Transformers with Continuous Feedback via Energy Rank Alignment [2.8] 本稿では,エネルギーランクアライメント(ERA)と呼ばれるアルゴリズムを導入する。
我々は、分子トランスフォーマーとタンパク質言語モデルを組み合わせて、分子とタンパク質配列を生成するためにこのアプローチを展開した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:19:52 GMT)
Who's Asking? Investigating Bias Through the Lens of Disability Framed Queries in LLMs [2.7] 大規模言語モデル(LLM)は、ユーザの人口統計特性を、単独で推測する。
これらの推論を形作る際の障害の手がかりは、ほとんど未発見のままである。
そこで本研究では,障害条件による人口統計バイアスを,最先端の8つのLLMに対して,初めて体系的に評価した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:49:01 GMT)
Dara: Automated multiple-hypothesis phase identification and refinement from powder X-ray diffraction [2.7] Daraは粉末XRDデータから複数の位相の堅牢な識別と精錬を自動化するために設計されたフレームワークである。
主な特徴は、構造データベースフィルタリング、木の拡大中の等構造相の自動クラスタリング、ピークマッチングに基づくスコアリング、改良のための有望な相を特定することである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:13:47 GMT)
Enhancing Reasoning Skills in Small Persian Medical Language Models Can Outperform Large-Scale Data Training [2.7] 我々は、汎用ペルシャ語モデルの推論スキルを改善するために、AIフィードバックを用いた強化学習(RLAIF)と直接選好最適化(DPO)を採用している。
これを実現するために,複数の質問応答データセットをペルシア語に翻訳し,RLAIFを用いて提案された回答ペアを生成した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:22:59 GMT)
A flexible framework for structural plasticity in GPU-accelerated sparse spiking neural networks [2.6] 生物学的脳では、構造的可塑性は効果的な学習だけでなく、損傷からの回復や最適な資源利用にも不可欠である。
プルーニングは機械学習において、推論の計算要求を減らすために訓練されたモデルから弱い接続を取り除くためにしばしば用いられる。
本稿では,GPUを加速する構造的塑性規則を実装するためのフレキシブルなフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:50:00 GMT)
MsEdF: A Multi-stream Encoder-decoder Framework for Remote Sensing Image Captioning [2.4] リモートセンシング画像には複雑な空間パターンや意味構造が含まれており、キャプションモデルを正確に記述することは困難である。
空間表現と言語生成の両方を最適化することにより、RSICの性能を向上させる新しいマルチストリームデコーダフレームワーク(MsEdF)を提案する。
3つのベンチマークRSICデータセットの実験は、MsEdFがいくつかのベースラインモデルより優れていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:42:11 GMT)
Quantifying the AI Gap: A Comparative Index of Development in the United States and Chinese Regions [2.4] 本研究は、地域レベルおよび産業別分析のために設計された7つの主次元を持つ総合人工知能(AI)指数を開発する。
本研究では,データ正規化のためのアンカーポイント法をベンチマークとして用い,専門的判断と客観的データを組み合わせた階層的指標重み付けシステムを提案する。
この指標は、公式統計、特許と研究のアウトプット、教育と才能、産業経済、政策とガバナンス、社会的影響を含む、ドメインの権威的なデータソースから導かれる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:17:26 GMT)
Bytecode-centric Detection of Known-to-be-vulnerable Dependencies in Java Projects [2.3] Java用のバイトコード中心の依存性スキャナであるJaralyzerを紹介します。
JaralyzerはOSS依存関係のメタデータやソースコードに依存しないが、依存関係のバイトコードを直接分析する。
このスキャナーは上記のすべての種類の修正で脆弱性を識別できる唯一のスキャナである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:08:46 GMT)
Serving LLMs in HPC Clusters: A Comparative Study of Qualcomm Cloud AI 100 Ultra and NVIDIA Data Center GPUs [2.3] 本研究では,大規模言語モデル(LLM)推論のためのQualcomm Cloud AI 100 Ultra (QAic)アクセラレータのベンチマーク解析を行う。
合計12のオープンソース LLM は、1億1400万から700億のパラメータで、vLLMフレームワークを使用して提供されている。
分析の結果,QAicはより粒度の細かいハードウェアアロケーションを実現しつつ,特定のモデルに有利な競争エネルギー効率を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:55:24 GMT)
From Specification to Service: Accelerating API-First Development Using Multi-Agent Systems [2.3] 本稿では,Large Language Models (LLM) ベースのエージェントを用いて,サーバコードのAPIファースト開発を自動化するシステムを提案する。
このシステムはOpenAPI仕様の作成を支援し、そこからコードを生成し、実行ログとエラーメッセージを分析するフィードバックループを通じてコードを洗練する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:22:36 GMT)
Superdiffusion resilience in Heisenberg Chains with 2D interactions on a quantum processor [2.2] 積分可能な1次元ハイゼンベルク模型のスピン輸送における超拡散スケーリングは、非平衡量子多体物理学における重要な発見の1つである。
現在の量子ハードウェアは、1Dハイゼンベルクモデルの超拡散をシミュレートすることで、そのような非平衡現象の研究においてその有用性を既に確認している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:05:00 GMT)
Towards Interpretable Deep Learning and Analysis of Dynamical Systems via the Discrete Empirical Interpolation Method [2.2] 本稿では,Dedisrete Empirical Interpolation Method (DEIM) を応用した微分可能なフレームワークを提案する。
まず, 1次元粘性バーガース方程式に対する微分適応型DEIMを開発した。
次に,2次元渦融合問題に対して,事前学習されたニューラル正規微分方程式(NODE)の学習力学を解析するための解釈可能な解析ツールとしてDEIMを適用した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:39:00 GMT)
Optimizing Asynchronous Federated Learning: A Delicate Trade-Off Between Model-Parameter Staleness and Update Frequency [2.2] 同期フェデレーションラーニング(FL)は、ストラグラー効果によりクライアント数に悪影響を及ぼす。
本研究では,非同期FLアルゴリズムにおける設計選択の影響をよりよく理解するために,モデリングと解析に頼っている。
特に,モデルパラメータの安定化を回避し,勾配推定誤差の最小化という,非同期FLの最適化のための基本的なトレードオフを特徴付ける。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:24:45 GMT)
[De|Re]constructing VLMs' Reasoning in Counting [2.2] 制御された実験条件下での計数作業における7つの最先端ビジョンランゲージモデル(VLM)の推論技術について検討した。
レイヤワイズ解析により、エラーは最終層表現の出力空間への誤ったマッピングによるものであることが明らかになった。
対象とするトレーニングでは,出力層のみの微調整により,最大21%の精度が向上した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:08:47 GMT)
Passive quantum error correction of photon loss at breakeven [2.2] 超伝導キャビティとトランスモンアンシラから構成され,光子寿命限界を超える論理量子ビットを約5%保存する安定状態駆動散逸量子系を実証した。
この断続点における連続量子誤差補正の実現は、受動的補正戦略の定量的競争性を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:28:27 GMT)
Assessing the Probabilistic Fit of Neural Regressors via Conditional Congruence [2.1] このミスアライメントを測定するための既存のアプローチは、主にキャリブレーションの枠組みの下で開発されている。
本稿では,CCE(Congruence Error)という,学習した予測分布とデータセット内の経験的条件分布との間の距離を,条件付きカーネルの平均埋め込みを用いて推定する手法を提案する。
我々は高次元回帰タスクを行い、CCEが4つの重要な特性を示すことを示す: $textitcorrectness$, $textitmonotonicity$, $textitreliability$, $textitrobustness$。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:36:17 GMT)
Large Language Model enabled Mathematical Modeling [2.1] 本研究では,Large Language Models (LLMs) の自然言語理解とコード生成による定式化ギャップを埋める可能性について検討する。
DeepSeek-R1は、強化学習で訓練された費用効率で高性能なモデルである。
本手法は,基礎的評価,幻覚分類の発達,緩和戦略の適用を含む。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:41:42 GMT)
Token embeddings violate the manifold hypothesis [2.1] 各トークン周辺の近傍が、ヌル仮説として比較的平坦で滑らかな構造を持つと仮定する新しい統計テストを示す。
したがって、この証明はトークン部分空間がファイバーバンドルではなく、したがって多様体でもないことを示唆している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:05:21 GMT)
Forward to Hell? On the Potentials of Misusing Transparent DNS Forwarders in Reflective Amplification Attacks [2.1] 我々は、透明なフォワーダーがインターネットインフラに深刻な脅威をもたらすことを示す。
彼らは簡単にレート制限を回避し、DNSの任意のキャストインフラストラクチャを通じて、追加でスケーラブルな影響を達成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:52:26 GMT)
Real-Time Cell Sorting with Scalable In Situ FPGA-Accelerated Deep Learning [2.1] 我々は,光電場顕微鏡画像を用いたラベルなしの細胞分類のための機械学習フレームワークを提案する。
本フレームワークは,T4,T8,Bのセルタイプを,80,000の事前処理画像のデータセットで正確に分類する。
FPGAを高速化した学生モデルは、14.5$mu$sの超低レイテンシと24.7$mu$sの完全なセル検出ソートトリガ時間を実現する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:46:31 GMT)
Online Conformal Prediction with Efficiency Guarantees [2.0] 新たなオンラインフレームワークにおける共形予測の問題について検討する。
この問題では、ターゲットの誤発見率$alpha > 0$と時間軸$T$が与えられる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:07:54 GMT)
IM-Chat: A Multi-agent LLM Framework Integrating Tool-Calling and Diffusion Modeling for Knowledge Transfer in Injection Molding Industry [2.0] 本研究では,大規模言語モデル(LLM)に基づくマルチエージェントフレームワークIM-Chatを紹介する。
IM-Chatは、限られた文書化された知識(例えば、トラブルシューティングテーブルやマニュアル)と、データ駆動プロセス条件生成器によってモデル化された広範囲なフィールドデータを統合する。
GPT-4o, GPT-4o-mini, GPT-3.5に適応した100個のシングルツールと60個のハイブリッドタスクのパフォーマンスを評価した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:04:44 GMT)
Survey of Graph Neural Network for Internet of Things and NextG Networks [2.0] グラフニューラルネットワーク(GNN)は、洞察を効果的にモデル化し抽出するための有望なパラダイムとして登場した。
この調査は、GNNの用語、アーキテクチャ、および異なるタイプのGNNについて、詳細な説明を提供する。
次に、GNNがネットワークシステムや戦術システムにどのように活用されているかについて詳細な説明を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:15:04 GMT)
FST.ai 2.0: An Explainable AI Ecosystem for Fair, Fast, and Inclusive Decision-Making in Olympic and Paralympic Taekwondo [2.0] 本稿では,emphFST.ai 2.0について紹介する。emphFST.ai 2.0は,テコンドー競技やトレーニングにおいて,審判,コーチ,アスリートをリアルタイムで支援するために設計された,説明可能なAIエコシステムである。
インタラクティブダッシュボードのセットは、審判評価、アスリートのパフォーマンス分析、パラテコンド分類における人間とAIの協調を可能にする。
FST.ai2.0は、リアルタイムの知覚、説明可能な推論、ガバナンスを意識したデザインをブリッジすることで、スポーツにおける公平で説明可能な、そして人間に沿ったAIへのステップを表現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:00:38 GMT)
An Expert-grounded benchmark of General Purpose LLMs in LCA [2.0] ライフサイクルアセスメント(LCA)を支援するツールとして,大規模言語モデル (LLM) が研究されている。
この研究は、LCAにおけるLSMのエキスパートによる最初のベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:56:54 GMT)
IoT-Enabled Sleep Monitoring and Cognitive Assessment for Evaluating Teacher Well-Being [2.0] この研究はパキスタン全土から208人の高校教師を対象に行われた。
その結果,ほとんどの教師は睡眠の質と認知機能に乏しかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:57:33 GMT)
Deep Sequence-to-Sequence Models for GNSS Spoofing Detection [1.9] 我々は、Long Short-Term Memory NetworkとTransformerにインスパイアされたアーキテクチャを利用して、ディープニューラルネットワークベースのスプーフィング検出モデルを適用した。
以上の結果から, 深層学習モデルにより, 密閉信号と実信号とを正確に識別し, 高い検出性能を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:53:41 GMT)
Enhancing Diagnostic Accuracy for Urinary Tract Disease through Explainable SHAP-Guided Feature Selection and Classification [1.9] SHAPによる特徴選択による尿路疾患の診断を支援するためのアプローチを提案する。
提案手法は,より透明で信頼性が高く,効率的な臨床診断支援システムの開発に寄与する可能性がある。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:48:50 GMT)
Dynamic control of dipole decay rate via graphene plexcitons [1.9] 強い結合状態における可変プレクシトニックモードを利用してダイポールの崩壊速度の動的変調を示す。
プレクシトニックピークは、非共鳴カップリングにおいても、素のグラフェンプラズモンとは対照的に、よりシャープな直線幅を示す。
提案手法は,プログラム可能なエミッション制御のための汎用プラットフォームを実証し,再構成可能な量子フォトニクスデバイスを開発するための有望な経路を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:15:49 GMT)
Directive, Metacognitive or a Blend of Both? A Comparison of AI-Generated Feedback Types on Student Engagement, Confidence, and Outcomes [1.9] 本研究は,329名の学生を対象に,適応型教育プラットフォームを用いた授業設計・プログラミングコースにおいて,学期間無作為化比較試験を行った。
参加者は、指示的、メタ認知的、あるいはハイブリッドなAI生成フィードバックを受け取り、指示的、メタ認知的の両方の要素をブレンドする。
その結果、リビジョン行動はフィードバック条件によって異なり、ハイブリットはディレクティブやメタ認知と比較して最も多くのリビジョンを促すことがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:31:21 GMT)
Malaria Detection from Blood Cell Images Using XceptionNet [1.8] マラリアは、主に雌のアナテレス蚊の噛みつきによって拡散し、しばしば人の死につながる。
十分な専門知識やスキルが不足し、最も重要な手作業による関与が誤った診断を引き起こす可能性がある。
本稿では,血液細胞像から深い内在性特徴を抽出するために,よく実証されたディープネットワークを適用した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:41:01 GMT)
Customizing Spider Silk: Generative Models with Mechanical Property Conditioning for Protein Engineering [1.8] メカニカル特性をカスタマイズ可能なMaSp繰り返し配列を設計するための新しい計算フレームワークを提案する。
我々は,事前学習したProtGPT2タンパク質言語モデルを蒸留し,軽量なGPTベース生成モデルを構築した。
本モデルでは, 特定の機械的特性に適合した生物学的に可塑性なMaSpリピート領域を生成し, それらの特性を所定の配列で予測する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:07:07 GMT)
Genotype-Phenotype Integration through Machine Learning and Personalized Gene Regulatory Networks for Cancer Metastasis Prediction [1.8] 転移はがんによる死亡の原因である。
古典的な機械学習とディープラーニングを統合して、複数のがんタイプにわたる転移能を予測する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:20:13 GMT)
Reliability and Resilience of AI-Driven Critical Network Infrastructure under Cyber-Physical Threats [1.8] 本稿では,サイバー物理的攻撃条件下でのカスケード障害を軽減するための耐障害性とレジリエンスに配慮した枠組みを提案する。
NS-3シミュレーションを用いて総合的な検証を行い、信頼性、レイテンシ、レジリエンス指数、パケット損失率などの重要な性能指標を分析した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:56:44 GMT)
ODataX: A Progressive Evolution of the Open Data Protocol [1.7] Open Data Protocol(OData)は、リッチなクエリ機能を備えたAPIの構築と利用のための標準化されたアプローチを提供する。
本稿では,OData導入の防止に重要な障壁を解析し,これらの制約に対処するために設計されたプロトコルの進化版であるODataXを紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:50:06 GMT)
Integrating Transparent Models, LLMs, and Practitioner-in-the-Loop: A Case of Nonprofit Program Evaluation [1.7] 本研究では,大規模言語モデル(LLM)と透明な決定木モデルを組み合わせて,予測精度,解釈可能性,実践的洞察を生み出すループ内ワークフローをテストする。
その結果, 透明モデル, LLM, 実践者の入力を統合することで, 正確で信頼性が高く, 行動可能なケースレベルの評価が得られることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:35:13 GMT)
A simplified version of the quantum OTOC$^{(2)}$ problem [1.7] 本稿では、入力サイズを増大させる問題の定式化と、この問題に関するさらなる理論的研究の促進を期待する。
このノートは、最近Google Quantum AIと共同研究者によって実験的に実装されたOTOC$(2)$問題の簡易版を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:43:15 GMT)
Automated HIV Screening on Dutch EHR with Large Language Models [1.7] 本稿では,Large Language Model (LLM) を利用して非構造化のEHRテキストを解析するパイプラインを提案する。
パイプラインは偽陰率を低く保ちながら高い精度を実現した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:53:14 GMT)
Stream: Scaling up Mechanistic Interpretability to Long Context in LLMs via Sparse Attention [1.6] Sparse Tracingは、ダイナミックなスパースアテンションを利用して、長時間のコンテキストアテンションパターンを効率的に分析する手法である。
ほぼ直線時間で,頭部ごとのスパークアテンションマスクを推定する,コンパイル可能な階層型プルーニングアルゴリズムであるStreamを提案する。
本手法は, テラバイトのキャッシュを使わずに, 注意パターンを解析し, 情報の流れをトレースする実用的なドロップインツールを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:42:29 GMT)
From Reviews to Actionable Insights: An LLM-Based Approach for Attribute and Feature Extraction [1.6] 本研究では,顧客レビューから製品属性とサービス属性を抽出するための体系的,大規模言語モデル(LLM)アプローチを提案する。
この手法を、スターバックスストアの2万件のYelpレビューに適用し、ランダムなレビューのサブセットに対して8つのプロンプト変種を評価する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:15:26 GMT)
Transformed Multi-view 3D Shape Features with Contrastive Learning [1.5] ビジョントランスフォーマー(ViT)ベースのアーキテクチャは、多視点3D解析において有望な結果を達成する。
全体形状と対照的学習の有効性を理解するViTの能力は、広範なラベル付きデータの必要性を克服する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:29:48 GMT)
An Integrated Approach to Neural Architecture Search for Deep Q-Networks [1.5] NAS-DQNは、学習したニューラルネットワーク検索コントローラを直接DRLトレーニングループに統合するエージェントである。
我々はNAS-DQNを3つの固定構造ベースラインに対して評価し、連続的な制御タスクに対してランダムな探索制御を行う。
以上の結果から,NAS-DQNは非無視の計算オーバーヘッドを発生させながら,優れた最終性能,サンプル効率,政策安定性を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:17:31 GMT)
Endogenous Aggregation of Multiple Data Envelopment Analysis Scores for Large Data Sets [1.5] データ包絡分析(DEA)を用いた複数の組織次元にわたる動的効率評価手法を提案する。
本手法は, 寸法比と集合効率の両スコアを生成し, 望ましい出力と望ましくない出力を取り入れ, 大規模問題設定に適している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:03:05 GMT)
Ask What Your Country Can Do For You: Towards a Public Red Teaming Model [1.4] 我々は,協調型公開AIリピート演習を提案する。
最初の個人によるデモ隊演習はCAMLIS 2024と共同で行われた。
このアプローチは有意義な結果を提供できると同時に、多くのAI開発管轄区域にも拡張性がある、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:24:21 GMT)
RatioWaveNet: A Learnable RDWT Front-End for Robust and Interpretable EEG Motor-Imagery Classification [1.4] 本稿では、トレーニング可能なRationally-Dilated Wavelet Transformフロントエンドで、強力な時間的CNN-Transformerバックボーンを増強するRatioWaveNetを提案する。
我々のゴールは、この原理化されたウェーブレットフロントエンドが、BCIが通常失敗するところのロバスト性を改善するかどうかをテストすることである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:04:03 GMT)
SODBench: A Large Language Model Approach to Documenting Spreadsheet Operations [1.4] 本稿では,スプレッドシート操作から人間が読める説明を生成するAIタスクである,スプレッドシート操作文書(SOD)を紹介する。
本稿では,111のスプレッドシート操作コードスニペットのベンチマークを,対応する自然言語要約と組み合わせて提示する。
以上の結果から,LSMは正確なスプレッドシートドキュメンテーションを生成できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:36:13 GMT)
A Comprehensive Benchmark for RNA 3D Structure-Function Modeling [1.3] 本稿では,RNA構造関数予測をサポートするために設計された7つのベンチマークデータセットについて紹介する。
我々のライブラリは、データの分散とエンコーディングを合理化し、データセット分割と評価のためのツールを提供し、モデル比較のための包括的でユーザフレンドリな環境を提供します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:51:47 GMT)
Sharp Gaussian approximations for Decentralized Federated Learning [1.2] フェデレートラーニング(Federated Learning)は、プライバシに敏感なコラボレーティブ環境において、重要な最適化手法としてローカルSGDが登場し、注目を集めている。
局所的なSGDに対する2つの一般化されたガウス近似結果を示し、その意味を探求する。
タイムユニフォーム近似は、対向攻撃を検出するブートストラップベースのテストをサポートする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:35:19 GMT)
Learning Spatially Adaptive $\ell_1$-Norms Weights for Convolutional Synthesis Regularization [1.2] 我々は、事前学習された畳み込みフィルタのファミリーを考察し、スパース特徴写像に適用された空間的に変化するパラメータを深くパラメータ化して推定する。
提案手法は,後者の手法で視覚的,定量的に比較可能な結果が得られ,同時に高い解釈が可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:54:20 GMT)
Aligning Multilingual News for Stock Return Prediction [1.2] 最適な輸送手段を用いた多言語ニュース記事中の文の整列化手法を提案する。
我々はこの手法を用いて、ブルームバーグ英語と日本語のニュース記事の14万組以上を調整した。
修飾文はスペーサーであり、より解釈可能であり、より意味的な類似性を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:23:24 GMT)
X-Ego: Acquiring Team-Level Tactical Situational Awareness via Cross-Egocentric Contrastive Video Representation Learning [1.2] X-Ego-CSは、人気のあるeスポーツゲームCounter-Strike 2の45のプロレベル試合の124時間のゲームプレイ映像からなるベンチマークデータセットである。
X-Ego-CSは、すべてのプレイヤーのファーストパーソン視点とステートアクション軌跡を同期的にキャプチャするクロスエゴセントリックなビデオストリームを提供する。
我々は,チームメイトの自我中心の視覚ストリームを調整し,チームレベルの状況認識を個人の視点から促進するクロスエゴコントラスト学習(CECL)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:48:35 GMT)
A Multi-faceted Analysis of Cognitive Abilities: Evaluating Prompt Methods with Large Language Models on the CONSORT Checklist [1.2] 本研究では,専門家検証データを用いた行動・メタ認知分析手法を適用した。
モデルが様々なCONSORTアイテムやプロンプトタイプにどのようにアプローチしたかにおいて、明らかな違いが現れた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:15:02 GMT)
Optimization Benchmark for Diffusion Models on Dynamical Systems [1.2] 本稿では,フロートラジェクトリをデノナイズする拡散モデルをトレーニングするための最近の最適化アルゴリズムをベンチマークする。
私たちは、MuonとSOAPがAdamWの非常に効率的な代替品であること(18%の最終損失)を観察します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:50:31 GMT)
Data-Driven Approach to Capitation Reform in Rwanda [1.1] 本報告では,ルワンダにおけるキャビテーションモデルを設計,校正,監視するためのデータ駆動型アプローチの概要について述べる。
我々は、保健所とその提携する保健ポストに支払いを割り当てるための透明で解釈可能な公式を導入する。
繰り返し行われる検証作業は、支払い方式が歴史的支出と密接に一致していることを示している。
同じデータセットは、アクション可能な振る舞いの洞察を可能にする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:14:19 GMT)
"You Are Rejected!": An Empirical Study of Large Language Models Taking Hiring Evaluations [1.1] 本稿では,Large Language Models (LLM) が採用評価に合格できるかどうかを検討する。
我々は,現状のLLMを用いて応答を生成し,その性能を評価する。
LLMが理想的なエンジニアであるというこれまでの期待とは対照的に、我々の分析は、モデル生成の回答と企業参照のソリューションとの間に大きな矛盾があることを明らかにしている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:59:30 GMT)
Mathematics with large language models as provers and verifiers [1.1] ChatGPT は6つの IMO 問題のうち5つを解き、[Cohen, Journal of Sequences, 2025] の 6 個の数理論の予想の約3分の1を閉じる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:33:39 GMT)
Collaborative penetration testing suite for emerging generative AI algorithms [1.0] 生成AI脆弱性: モデル反転、データ中毒、逆入力。
量子暗号ベースのRLWEプロトコル。
テスト環境全体で確認された主要な脆弱性。2週間以内に70%の高重度問題が減少する。
ブロックチェーンログのリバーサ脆弱性の解決効率は90%だ。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:05:08 GMT)
A Matter of Time: Revealing the Structure of Time in Vision-Language Models [1.0] TIME10kは1万以上の画像のベンチマークデータセットであり、時間的地平が真である。
我々は,37の視覚言語モデル(VLM)の時間認識性を,新しい手法により評価した。
埋め込み空間から明示的なタイムラインの表現を導出する手法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:14:02 GMT)
How Exclusive are Ethereum Transactions? Evidence from non-winning blocks [1.0] トランザクションを排他的 - 単一のビルダからブロックにのみ現れる - あるいはプライベート - として公開メムプールから欠落している - として分類します。
独占取引は、入賞ブロックにおける取引によって支払われる全手数料の77.2%から84%を占める。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:08:59 GMT)
FrogDeepSDM: Improving Frog Counting and Occurrence Prediction Using Multimodal Data and Pseudo-Absence Imputation [1.0] 種分布モデル (SDM) は、広範囲にわたる種の存在を予測するのに役立つ。
本研究では,深層学習とデータ計算技術を適用して,カエル(Anura)のSDM精度を向上させる。
実験の結果、データバランスはモデル性能を大幅に改善し、カエルカウントタスクにおいて平均絶対誤差(MAE)が189から29に削減された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:09:36 GMT)
AICO: Feature Significance Tests for Supervised Learning [0.9] AICOは、トレーニングされた回帰モデルや分類モデルに対して、各機能がモデルのパフォーマンスを真に改善するかどうかを問う。
機能の情報を隠蔽し、結果として生じるパフォーマンスの変化を測定することで実現します。
AICOは、モデルの振る舞いを駆動する変数を一貫して特定する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:21:34 GMT)
Orders matter: tight bounds on the precision of sequential quantum estimation for multiparameter models [0.9] 量子気象学において、結合推定の最終的な精度は、ホレヴォ・クラム・ラオ境界によって決定される。
本稿では,ステップワイズ推定戦略(Stepwise Estimation strategy)という,別のアプローチについて論じ,詳細に分析する。
我々は、このプロトコルに対して厳密で達成可能な精度境界、段階的に分離可能な境界を導出し、その閉形式解析式を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:01:17 GMT)
g-DPO: Scalable Preference Optimization for Protein Language Models [0.9] g-DPOは、トレーニング信号を保持しながら冗長なペアを吐き出すフレームワークであり、(ii)グループベースの近似を用いて確率計算を補正する。
3つのタンパク質工学の課題の中で、g-DPOは標準のDPOと統計的に区別がつかず、1.8倍から3.7倍の速度で収束する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:11:42 GMT)
An Active Diffusion Neural Network for Graphs [0.9] 能動拡散に基づくグラフニューラルネットワーク(ADGNN)を提案する。
ADGNNは、拡散過程に動的に影響を与える複数の外部情報ソースを統合することにより、アクティブな拡散を実現する。
我々はADGNNを、様々なグラフタスクにわたる最先端のGNNモデルに対して評価する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:23:08 GMT)
Decomposing stimulus-specific sensory neural information via diffusion models [0.9] 有意義な刺激的分解が満足すべき公理, 付加性, 肯定性, 局所性を導入する。
我々の分解は拡散モデルを用いて効率的に推定することができ、複雑で構造的で自然主義的な刺激までスケールアップすることができる。
我々のアプローチは、生物学的および人工的なニューラルシステムの両方で表現を探索するためのスケーラブルで解釈可能なツールを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:14:19 GMT)
Compressing Biology: Evaluating the Stable Diffusion VAE for Phenotypic Drug Discovery [0.9] セルペイント画像の再構成のためのSDVAE(Stable Diffusion's variational autoencoder)の最初の体系的評価を行った。
SDVAEの再構成は,表現型シグナルを最小限の損失で保存し,顕微鏡での使用をサポートすることが確認された。
本研究は, 顕微鏡データにおける生成モデル評価のための実践的ガイドラインを提供し, 表現型薬物発見における既成モデルの利用を支援する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:16:49 GMT)
A Concrete Roadmap towards Safety Cases based on Chain-of-Thought Monitoring [0.8] 本稿では,推論モデルにおけるチェーン・オブ・シント(CoT)モニタリングに基づく安全事例構築のロードマップを提案する。
我々は、CoTモニタリングは、制御と信頼性の両方の安全ケースをサポートするかもしれないと論じる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:13:52 GMT)
FINDER: Feature Inference on Noisy Datasets using Eigenspace Residuals [0.7] 一般的な分類問題を分析するための厳密なフレームワークであるFINDERを紹介する。
FINDERは、基本的な分析のアイデアを特徴学習と推論の段階に取り入れている。
i) アルツハイマー病のステージ分類, (ii) 森林破壊のリモートセンシング。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:00:03 GMT)
An Evaluation of the Pedagogical Soundness and Usability of AI-Generated Lesson Plans Across Different Models and Prompt Frameworks in High-School Physics [0.7] 本研究では,5大言語モデルを対象としたAIによる授業計画の教育的健全性とユーザビリティについて検討した。
高校の物理学のトピックである電磁スペクトルに関する15のレッスンプランが作成された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:53:06 GMT)
Mitigating representation bias caused by missing pixels in methane plume detection [0.7] 欠落画素は自動特徴抽出モデルにおける表現バイアスにつながる可能性がある。
メタンプラム検出におけるラベルと欠落値の数との急激な関係が,モデルにカバー範囲を関連づけることが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:15:31 GMT)
Review of Tools for Zero-Code LLM Based Application Development [0.7] 大規模言語モデル(LLM)は、コード開発プラットフォームをゼロにすることで、ソフトウェア作成を変革している。
我々の調査では、LCMを開発プロセスの頭脳として活用することで、コードを書かずにアプリケーションを構築できる最近のプラットフォームについてレビューした。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:41:16 GMT)
Exploring the Effect of DNN Depth on Adversarial Attacks in Network Intrusion Detection Systems [0.7] アドリアックは機械学習(ML)システムに重大な課題をもたらす。
本稿では,ディープニューラルネットワークの層深さ増加が敵攻撃に対する堅牢性に影響を及ぼすかどうかを検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:48:35 GMT)
A General Solution for the Implementation of CI/CD in Embedded Linux Development [0.6] 本研究は,Yocto Project を用いた Linux ベースのオペレーティングシステムの開発,構築,テストのための,統合的で再現可能なインフラの設計と実装を目的とした。
提案した構造は,メインのYoctoリポジトリ,カスタムレイヤ(meta-custom),コーディネートされたマニフェストレイヤで構成される3層アーキテクチャに基づいて実装された。
継続的インテグレーションと継続的デプロイメントパイプラインはGitLab CIで実装され、ビルドとテストの自動化と合理化のために、分離されたDocker環境と組み合わせられた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:48:41 GMT)
Multi-Agent Design Assistant for the Simulation of Inertial Fusion Energy [0.6] 慣性核融合エネルギーは、達成できればほぼ無限のクリーンパワーを約束する。
本稿では,核融合エネルギーに関する複雑な物理状態を探るため,自然言語を用いたマルチエージェントシステムを構築した。
カプセル形状を協調的かつ自律的に操作し、ナビゲートし、最適化するためのマルチエージェント設計アシスタントの能力を実証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:49:42 GMT)
FedMicro-IDA: A Federated Learning and Microservices-based Framework for IoT Data Analytics [0.6] IoT(Internet of Things)データによって、さまざまな一般的なアプリケーションや重要なアプリケーションに対して、効率的なデータ分析が可能になる。
データ分析技術は、エッジデバイスやフォグデバイスでデータを収集、分析するために提案された。
フェデレートラーニングは、エッジ/フォグコンピューティング環境のための理想的な分散マシン/ディープラーニングベースの技術として推奨されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:57:47 GMT)
Lightweight Classifier for Detecting Intracranial Hemorrhage in Ultrasound Data [0.5] 外傷性脳損傷(TBI)に続発する頭蓋内出血(ICH)は重要な診断課題である。
CT(Computed Tomography)やMRI(Magnetic Resonance Imaging)などの診断には、大きな限界がある。
超音波ティッシュパルサチリティイメージング(TPI)を用いた自動ICH検出のための機械学習手法の検討
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:04:42 GMT)
Dimensionality-Changing Transition from a Non-Fermi Liquid to a Spin-Solid in a Multichannel Kondo Lattice [0.5] 我々はSU(N)多チャネル量子系の連鎖を研究し、各スピンは独自のKチャネルの浴に結合される。
我々は、この非フェルミ液体から連続した「次元変化」相転移の証拠を見つける。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:06:43 GMT)
Two-Photon Induced Coherence without Induced Emission [0.5] 誘導放出のない2光子のコヒーレンスを観測した。
この進行は2光子フォック状態の上にあり、2光子自然放出振幅の対の間に量子コヒーレンスを形成する。
これらの発見は、革新的な高分解能量子気象学応用の道を開いた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:42:13 GMT)
CNeuroMod-THINGS, a densely-sampled fMRI dataset for visual neuroscience [0.5] CNeuroMod-THINGSはTHINGSイニシアチブ(THINGS)とCourois Project on Neural Modelling(CNeuroMod)の相乗効果を利用する
THINGSは、より密にサンプリングされた大規模なfMRIデータセットで、よく特徴付けられた画像を使用して、幅広いセマンティック概念のための神経表現をキャプチャする。
CNeuroModは、何百時間ものfMRIデータを、コントロールおよび自然主義的なタスクの参加者のコアセットから取得している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:36:45 GMT)
Source-Free Domain Adaptation for SSVEP-based Brain-Computer Interfaces [0.5] SSVEPベースのBCIスペルは、迅速なコミュニケーションを可能にすることで、発話困難を経験する個人を支援する。
高い情報伝達率(ITR)を達成するには、システムを使用する前に広範囲の校正期間が必要となる。
我々は、ソースドメインのデータに基づいて事前訓練された強力なディープニューラルネットワーク(DNN)を適用する新しい手法を提案し、この問題に対処する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:02:09 GMT)
Autonomous stabilization of remote entanglement in a cascaded quantum network [0.4] 崩壊後, 周期的に再生・再分散する代わりに, 遠隔の絡み合いを無限に安定化させることができることを示す。
この結果から,モジュール型量子プロセッサやネットワークにおける高忠実な絡み合いのオンデマンド配信が可能となった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:59:50 GMT)
Everyone Needs AIR: An Agnostic Incident Reporting Framework for Cybersecurity in Operational Technology [0.4] 本稿では,ライブOTインシデントレポートのためのAIR(Agnostic Incident Reporting)フレームワークを提案する。
AIRは、インシデントコンテキスト、時系列、影響、アクションをキャプチャするために、7つのグループに編成された25の要素から構成されます。
我々はAIRを主要なOT標準にマッピングし、統合のためのアクティベーションポイントを定義し、確立されたOTフレームワークを起動し、2015年のウクライナ分散グリッドインシデントに振り返って適用することで評価する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:54:35 GMT)
SIGN: Schema-Induced Games for Naming [0.4] 現実世界のAIシステムは、大きな言語モデル(LLM)エージェント間のインタラクションを通じて、ますます複雑な問題に対処している。
命名ゲームであるSIGN(Games for Naming)を導入し,コンベンション形成の軽量化について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:12:06 GMT)
Filter-Based Reconstruction of Images from Events [0.4] 動くイベントカメラのイベントからの強度画像の再構成は難しい作業である。
本稿では、よりシンプルなFIlterベースの非同期再構成法を提案する。
ニューラルネットワークベースの手法よりもノイズが多く、ゴーストイメージに悩まされている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:05:38 GMT)
Analysis and Comparison of Known and Randomly Generated S-boxes for Block Ciphers [0.4] 数学的に構築された構造とランダムに生成された構造を比較し、後者の相対的な弱さを評価する。
また、ランダムに生成された置換に対する平均的な性能測定値と、強制サイクル制約によるランダムな性能測定値も確立する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:55:23 GMT)
Synthesizability Prediction of Crystalline Structures with a Hierarchical Transformer and Uncertainty Quantification [0.4] SyntheFormerは、結晶構造から直接合成性を学ぶ、正の未標識のフレームワークである。
構造認識表現と不確実性認識決定規則を整合させることで、SyntheFormerは、ターゲットを優先順位付けし、最も有望な新しい無機材料に研究室の努力を集中させる実践的な方法を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:11:08 GMT)
Demonstrating Real Advantage of Machine-Learning-Enhanced Monte Carlo for Combinatorial Optimization [0.4] 我々はGlobal Annealing Monte Carloアルゴリズムを用いて、標準的なローカルな動きと機械学習によるグローバルな動きを統合する。
最適性能を達成する上で,局所的な動きが重要な役割を担っていることを示す。
これらの結果は、機械学習による最適化手法が古典的最先端技術の能力を超えることができるという、最初の明確かつ堅牢な証拠を提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:50:27 GMT)
AMAuT: A Flexible and Efficient Multiview Audio Transformer Framework Trained from Scratch [0.4] 本稿では,AMAuT(Augmentation-driven Multiview Audio Transformer)を紹介する。
AMAuTは任意のサンプルレートとオーディオ長をサポートしながら、事前訓練された重量への依存を取り除く。
AudioMNIST、SpeechCommands V1 & V2、VocalSound、CochlSceneの5つの公開ベンチマークの実験では、AMAuTが99.8%のアキュラシーを達成したことが示されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:41:59 GMT)
Vectorization of Persistence Diagrams for Topological Data Analysis in R and Python Using TDAvec Package [0.4] 我々は永続化ダイアグラム(PD)のベクトル化を効率化する新しいソフトウェアパッケージを導入する。
PDの空間の非ヒルベルト的な性質は、機械学習アプリケーションで直接使用する上での課題を提起する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:24:44 GMT)
PBBQ: A Persian Bias Benchmark Dataset Curated with Human-AI Collaboration for Large Language Models [0.4] ペルシャ語モデルにおける社会的バイアスを評価するために設計されたベンチマークデータセットであるPSBQを紹介する。
PBBQデータセットには、慎重にキュレートされた質問が37,000以上含まれている。
以上の結果から,現在のLLMはペルシャ文化全体において有意な社会的偏見を示すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:12:00 GMT)
SORA-ATMAS: Adaptive Trust Management and Multi-LLM Aligned Governance for Future Smart Cities [0.3] エージェントAIは、自律的な意思決定と適応的な調整をサポートすることで、重要な実現手段として登場した。
不均一なスマートシティエコシステムへのデプロイメントは、重要なガバナンス、リスク、コンプライアンス(GRC)の課題を提起する。
SORA-ATMASは、分散エージェントのアウトプットを説明可能なリアルタイムな決定に集約する、規制に準拠した、コンテキスト対応で検証可能なガバナンスフレームワークである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:40:37 GMT)
Multi-Camera Worker Tracking in Logistics Warehouse Considering Wide-Angle Distortion [0.3] 本研究では,天井に設置した19個の広角カメラを用いて作業者の追跡を行い,物流倉庫の床を見下ろした。
これに対応するために、検出された各カメラの作業者位置は、足の位置に基づいて整列され、画像歪みの影響を低減した。
その結果,追跡精度は20%以上向上した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:00:40 GMT)
Difficulty-Controllable Multiple-Choice Question Generation Using Large Language Models and Direct Preference Optimization [0.3] 本研究は,読解理解のための難易度制御可能な複数選択質問生成手法を提案する。
直接選好最適化技術を用いて訓練された大きな言語モデルを使用して、難易度制御の精度を向上させる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:49:31 GMT)
Remarks on a recent preprint of Chernikov and Towsner [0.3] Chernikov and Towsner, arXiv:2510.02420(1)
arXiv:2510.02420(2) では、定理は変更されているが、その証明を説明すると誤りがある。
基本的定義の変更による文の変化は、論文の主張に影響を及ぼす。
この定理は、彼らの論文をコリアーノ・マリアリス高純度PAC学習に結びつけることに関係していたため、現在では消滅している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:11:16 GMT)
An Argumentative Explanation Framework for Generalized Reason Model with Inconsistent Precedents [0.3] 先行制約は、AIと法におけるケースベースの推論の基盤の1つである。
本稿では,推論モデルの概念を一般化して説明するために,導出状態議論フレームワークの拡張について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:46:02 GMT)
Transient dynamics of the quantum Stuart-Landau oscillator [0.3] 制限サイクルと同期を示す量子系の過渡ダイナミクスについて検討する。
進化速度の定量化のために,システムのリンドブラディアンスペクトル,特にリウビリアンギャップについて検討した。
この研究は、自己持続型量子系の過渡的な挙動について深い洞察を与える。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:06:34 GMT)
A Framework for the Adoption and Integration of Generative AI in Midsize Organizations and Enterprises (FAIGMOE) [0.3] Generative Artificial Intelligence(GenAI)は、組織に変革的な機会を提供するが、中規模組織と大企業の両方が、独自の採用課題に直面している。
TAM(Technology Acceptance Model)、TOE(Technology Organization Environment)、DOI(Diffusion of Innovations)理論など、既存の技術採用フレームワークには、さまざまな状況においてGenAIの実装に必要な特異性がない。
本稿では,両タイプのユニークなニーズに対処する概念的枠組みであるFAIGMOEを紹介する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:55:31 GMT)
Single Sr Atoms in Optical Tweezer Arrays for Quantum Simulation [0.2] 光学式ツイーザにおいて, 個々の88ドルSr原子をトラップし, 操作するためのプラットフォームの実現について報告する。
捕捉された原子は蛍光イメージングにより99.986(6)%$で検出され、生存確率は9.7(1)%$である。
その結果, 効率的なローディング, 冷却, 高忠実度検出を併用した頑健なアルカリ-アーストウィーザープラットフォームが実証された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:53:02 GMT)
Beyond Qubits: Multilevel Quantum Sensing for Dark Matter [0.2] 量子フィッシャー情報のシーケンス非依存的な4倍の増大をもたらす普遍的なクォート・フレームワークを提案する。
超軽量ダークマターサーチでは、スピン-1NV中心のクエットは、クビットを超える桁数で軸-電子カップリングリーチを高めることができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:00:03 GMT)
Explicitly Quantum-parallel Computation by Displacements [0.2] 異なる光モードの相対変位や光子数に情報を符号化する。
我々は、光子サブトラクションプロトコルを用いて、圧縮状態の高品質な量子重ね合わせを作成することができることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:20:59 GMT)
Foundation Model Forecasts: Form and Function [0.2] 時系列基礎モデル(TSFM)は高い予測精度を達成するが、精度だけでは実用的価値は決定できない。
我々は最近のTSFMを調査し、その3分の2がポイントまたはパラメトリックの予測のみを生成することを発見した。
多くの運用タスクは、時間的依存を保存する軌道的アンサンブルを必要とする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:10:34 GMT)
Probing New Forces with Nuclear Clocks [0.2] 核異性体転移に基づくクロックは、例外的な安定性と精度を約束する。
トリウム229異性体の低遷移エネルギーは真空紫外レーザーによって励起され、微妙な相互作用に非常に敏感であるため、理想的な候補となる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:40:39 GMT)
Explainable Face Presentation Attack Detection via Ensemble-CAM [0.2] プレゼンテーションアタック検出(PAD)システムは、ディープラーニング(DL)モデルを利用して、この種の脅威を軽減するように設計されている。
有効性にもかかわらず、ほとんどのDLモデルはブラックボックスとして機能します。
本研究では,深層学習に基づく顔PADシステムによる意思決定を視覚的に説明するための新しい手法であるEnsemble-CAMを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:45:28 GMT)
Interpretable Question Answering with Knowledge Graphs [0.2] 本稿では,知識グラフ検索のみで動作する質問応答システムを提案する。
知識グラフのクエリから取得したエンティティ関係エッジをパラフレーズ化するために、小さなパラフレーズモデルが使用される。
この研究はCRAGベンチマークでLCM-as-a-judgeを用いて評価され、71.9%と54.4%の精度が得られた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:36:35 GMT)
Improving Predictive Confidence in Medical Imaging via Online Label Smoothing [0.2] Online Label Smoothing(OLS)は、モデル独自の予測パターンに基づいて、トレーニング全体を通じてソフトラベルを調整する動的アプローチである。
OLSは標準訓練法と比較してTop-1とTop-5の分類精度を一貫して改善する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:25:14 GMT)
Misalignment Bounty: Crowdsourcing AI Agent Misbehavior [0.2] ミスサライメント・バウンティは意図しないあるいは安全でない目標を追求するエージェントの事例を収集した。
賞金は295件であり、そのうち9件が授与された。
本報告では,プログラムのモチベーションと評価基準について説明する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:28:48 GMT)
Exploring the Energy Landscape of RBMs: Reciprocal Space Insights into Bosons, Hierarchical Learning and Symmetry Breaking [0.2] 離散分布に対する普遍近似能力で知られるリミテッドボルツマンマシン(RBM)に着目した。
相互空間の定式化を導入することにより、RBM、拡散過程、結合ボソン間の接続を明らかにする。
我々の研究結果は、異なる生成フレームワーク間のギャップを埋めると同時に、生成モデルにおける学習を支えるプロセスにも光を当てています。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:48:05 GMT)
JaiLIP: Jailbreaking Vision-Language Models via Loss Guided Image Perturbation [0.2] VLM(Vision-Language Models)は、マルチモーダル推論タスクを生成する際、顕著な能力を持つ。
近年の研究では、画像に基づく摂動は有害な出力を発生させるのに特に有効であることが示されている。
本研究では,画像空間におけるジェイルブレーキング攻撃であるロス誘導画像摂動(JaiLIP)を用いたジェイルブレーキングを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:29:44 GMT)
A Proactive Insider Threat Management Framework Using Explainable Machine Learning [0.1] 本研究では,Insider Threat Explainable Machine Learning(IT-XML)フレームワークを提案する。
インサイダー脅威パターンに関する従業員の知識を評価するために,オンラインアンケートを用いて定量的アプローチを採用する。
このフレームワークは、すべての組織を97-98%の信頼性でセキュリティ成熟度レベルに分類し、91.7%の分類精度を達成した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:08:38 GMT)
PLAGUE: Plug-and-play framework for Lifelong Adaptive Generation of Multi-turn Exploits [0.1] PLAGUEは、生涯学習エージェントにインスパイアされたマルチターン攻撃を設計するためのプラグイン・アンド・プレイフレームワークである。
PLAGUEは、最先端のジェイルブレイクの結果を達成し、主要なモデル間で攻撃成功率(ASR)を30%以上改善することを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:18:53 GMT)
Learning Reward Machines from Partially Observed Policies [0.1] 逆強化学習は、最適政策や専門家による実演から報酬関数を推定する問題である。
我々の目標は、有限情報を用いて真の報奨機を特定することである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:55:33 GMT)
Transfer Learning Beyond the Standard Model [0.1] トランスファーラーニングは、モデル全体の知識を再利用することで、シミュレーションコストを削減する手段を提供する。
宇宙論の標準モデルである$Lambda$CDMの事前学習により,$Lambda$CDMシミュレーションよりもはるかに少ない推論が可能となることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:59:38 GMT)
GeoBenchX: Benchmarking LLMs in Agent Solving Multistep Geospatial Tasks [0.1] 本稿では,大規模言語モデル(LLM)のツールコール能力を評価するためのベンチマークを確立する。
我々は,23の地理空間機能を備えた簡易なツールコールエージェントを用いて,8種類の商用LCM (Claude Sonnet 3.5, 4, Claude Haiku 3.5, Gemini 2.0 Flash, Gemini 2.5 Pro Preview, GPT-4o, GPT-4.1, o4-mini) を評価した。
OpenAIのGPT-4.1、GPT-4o、GoogleのGemini 2.5 Pro Previewはそれほど遅れていないが、最後の2つはより効率的である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:12:30 GMT)
Authorization of Knowledge-base Agents in an Intent-based Management Function [0.1] 本稿では,役割と機能的属性をエージェントロールと統合する拡張された認証フレームワークを提案する。
我々のアプローチは、エージェントが知識グラフに対する最小限の特権しか与えられないことを保証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:38:01 GMT)
The Feasibility of Training Sovereign Language Models in the Global South: A Study of Brazil and Mexico [0.1] 本稿ではブラジルとメキシコにおけるソブリンスケール言語モデルトレーニングの技術的および財政的実現可能性について検討する。
計算需要、エネルギー消費、資本支出、および10トリリオントーケンモデルのトレーニングのための規制適合性を推定する。
トレーニングタイムラインの拡張は、ハードウェア制約を軽減するためのポリシーレバーとして扱われるべきである、と我々は主張する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:37:46 GMT)
Towards Accurate and Efficient Waste Image Classification: A Hybrid Deep Learning and Machine Learning Approach [0.1] 本研究は,(1)手作り特徴を用いた機械学習アルゴリズム,(2)ResNet変種やEfficientNetV2Sを含むディープラーニングアーキテクチャ,(3)Support Vector MachineやLogistic Regressionなどの古典的分類器と組み合わせて特徴抽出にディープモデルを利用するハイブリッドアプローチの3つのパラダイムを総合的に比較した。
TrashNet, Garbage Classification, and a refined Household Garbage dataset という3つの公開データセットの実験では、ハイブリッド手法がTrashNetと改良されたハウスセットで最大100%の精度を達成し、ガーベッジ分類で99.87%を達成し、その結果、その状態を超えたことが示されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:32:51 GMT)
Quantum Natural Language Processing: A Comprehensive Review of Models, Methods, and Applications [0.1] 量子コンピューティングの原理、アーキテクチャ、計算アプローチに基づいてQNLPモデルを分類することを提案する。
本稿では,この領域の最先端をマッピングすることで,量子が言語にどのように適合するかを調査する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:02:18 GMT)
CBDiff:Conditional Bernoulli Diffusion Models for Image Forgery Localization [0.0] 本稿では,画像フォージェリーローカライゼーションのための条件付きベルヌーイ拡散モデル(CBDiff)を提案する。
CBDiffは、より豊かでより包括的な偽の分布表現を提供する。
既存の最先端の手法を著しく上回り、現実世界のデプロイメントに対する強力な可能性を強調している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:48:36 GMT)
Mapping and Evolving Interoperability Testing in European Energy Systems: The int:net Perspective [0.0] 本研究は、30施設の構造化調査を通じて、ヨーロッパのインターオペラビリティ試験施設の景観を分析した。
テストインフラストラクチャ、適用方法論、参照テストケースの分類されたインベントリを提供する。
この発見は、相互運用テストのための調整されたヨーロッパエコシステムの確立に寄与する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:46:49 GMT)
PCP-GAN: Property-Constrained Pore-scale image reconstruction via conditional Generative Adversarial Networks [0.0] 本研究では,多条件生成適応ネットワーク(cGAN)フレームワークを提案する。
このフレームワークは、炭酸塩の形成の4つの深さ (1879.50-1943.50 m) から薄い部分のサンプルで訓練された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:54:51 GMT)
[RETRACTED]Evolving Form and Function: Dual-Objective Optimization in Neural Symbolic Regression Networks [0.0] 本稿では、勾配降下と進化計算を組み合わせてニューラルネットワークを生成する手法を提案する。
ネットワークはより象徴的で行動学的に正確な方程式を生成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:29:03 GMT)
Who Coordinates U.S. Cyber Defense? A Co-Authorship Network Analysis of Joint Cybersecurity Advisories (2024--2025) [0.0] 我々は、2024年11月から2025年8月までに発行された9つの合同サイバーセキュリティ諮問委員会から、共著者ネットワークを構築した。
CISA、FBI、NSAは、ファイブアイズやヨーロッパの同盟国と密接な関係にある。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:42:41 GMT)
Variational Quantum Algorithm for Unitary Dilation [0.0] 非ユニタリ作用素の近似ユニタリ拡張を効率的に実装するためのハイブリッド量子古典フレームワークを提案する。
量子クラウドコンピューティングクラスタQuafuにおける超伝導デバイスへのアプローチを検証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:23:59 GMT)
Variable Rate Image Compression via N-Gram Context based Swin-transformer [0.0] 本稿では,学習画像圧縮のためのN-gramコンテキストベースのSwin変換器を提案する。
我々は,N-gramコンテキストをSwin Transformerに組み込むことで,高解像度画像再構成における大域無視の限界を克服する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:59:46 GMT)
VERA-MH Concept Paper [0.0] 本稿では,メンタルヘルスにおけるAIチャットボットの安全性を自動評価するVERA-MHを紹介する。
プロセスを完全に自動化するために、2つのアシラリーAIエージェントを使用しました。
シミュレーションされた会話は、そのルーリックに基づいてそれらをスコアする審査員に渡される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:19:06 GMT)
Using (Not-so) Large Language Models to Generate Simulation Models in a Formal DSL: A Study on Reaction Networks [0.0] 我々は、自然言語をシミュレーションモデルに定式化するために、Large Language Modelがどのように使用されるかを評価する。
我々は,微調整と評価の基礎となる合成データ生成装置を開発した。
我々の微調整ミストラルモデルでは,84.5%のケースで地上の真理シミュレーションモデルを復元できる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:17:36 GMT)
Universal distributions of overlaps from generic dynamics in quantum many-body systems [0.0] 汎用量子多体カオス力学の下で生成した量子状態の計算基底と重なり合いの分布について検討する。
システムサイズが$t propto log L$と対数的にスケールすると、重なり合う分布は熱力学極限の普遍形式に収束する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:51:17 GMT)
Universal bound on the Lyapunov spectrum of quantum master equations [0.0] 我々は、時空自明な量子マスター方程式の非消滅崩壊率$Gamma_i$に対して、d2-1$の普遍的境界を証明した。
我々の主な結果は、時間自律的量子マスター方程式の一般の消滅率$Gamma_i$$d2-1$上の普遍境界の新たな証明である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:59:25 GMT)
Universal Quantitative Abstraction: Categorical Duality and Logical Completeness for Probabilistic Systems [0.0] 定量的抽象化の統一理論が確率論システムに提示される。
これは圏論、最適輸送、量的モーダル論理を結びつけている。
有限マルコフ決定過程上の正確な検証スイートは、収縮特性を裏付ける。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:16:24 GMT)
Unfair Mistakes on Social Media: How Demographic Characteristics influence Authorship Attribution [0.0] ソックパペット検出などのオンラインコンテキストでは、オーサリングの属性技術がますます使用されている。
このような手法のバイアスは、偽の告発、アカウントの禁止、プライバシー侵害が特定の人口層からユーザーに影響を与える可能性がある。
我々は、性別、母国語、年齢に対する偏見に対する著者の帰属を体系的に監査する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:57:54 GMT)
Under Pressure: Security Analysis and Process Impacts of a Commercial Smart Air Compressor [0.0] 産業用IoT(Industrial Internet of Things)デバイスを製造環境に統合することで、Industrial 4.0への移行が加速された。
本稿では,商用スマートエアコンプレッサの総合的なセキュリティ解析を行い,重大な脆弱性を明らかにする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:01:03 GMT)
TunnElQNN: A Hybrid Quantum-classical Neural Network for Efficient Learning [0.0] 我々は古典層と量子層を交互に構成した非系列アーキテクチャTunnElQNNを開発した。
マルチクラス分類タスクのための半円間半円合成データセット上でのハイブリッドモデルの性能評価を行った。
以上の結果から,TunnElQNNモデルはReLUQNNモデルよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 00:36:58 GMT)
Transition of $α$-mixing in Random Iterations with Applications in Queuing Theory [0.0] 本研究では, 混合特性を外因性回帰器から結合論による応答へ伝達することを示す。
また,非定常環境下においても,ドリフトおよびマイノライズ条件のランダム環境におけるマルコフ連鎖について検討した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:48:19 GMT)
Transforming Multi-Omics Integration with GANs: Applications in Alzheimer's and Cancer [0.0] 我々は,高品質な合成マルチオミクスプロファイルを生成するために,GAN(Generative Adversarial Network)ベースのフレームワークであるOmics-GANを紹介する。
アルツハイマー病に対するROSMAPコホートを用いた3種類のオミクス(mRNA,メチル化,DNAメチル化)に対するOmics-GANの試験を行った。
5倍のクロスバリデーションを繰り返したサポートベクターマシン(SVM)は、元のオミクスプロファイルと比較して予測精度を向上した。
Boxplot分析では、合成データはノイズや外れ値を低減しつつ統計分布を保存していることを確認した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:55:49 GMT)
Trajectory learning for ensemble forecasts via the continuous ranked probability score: a Lorenz '96 case study [0.0] 本稿では,連続的ランク付け確率スコア(CRPS)を用いたアンサンブル予測における軌道学習の可能性を示す。
その結果、CRPSに基づく軌道学習は、正確かつ鋭いパラメトリゼーションを生み出すことが示唆された。
このアプローチは、短時間のリードタイムにおける正確性のために、データ同化アプリケーションに特に有望である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:53:06 GMT)
Towards a feminist understanding of digital platform work [0.0] デジタルプラットフォーム経済の急速な成長は労働市場を変革させ、柔軟性とアクセシビリティを約束する新しい雇用機会を提供している。
しかし、これらの利益は、経済的搾取の増加、職業隔離、労働環境の悪化を犠牲にされることが多い。
本研究は、歴史的に精査され社会内の権力構造に異議を唱えてきたフェミニスト理論に基づいて、デジタル・プラットフォーム・ワークの複雑な性質を解明することを目的とする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:27:45 GMT)
Topology of Currencies: Persistent Homology for FX Co-movements: A Comparative Clustering Study [0.0] 本研究では,クラスタリング通貨行動における従来の統計手法を超えて,トポロジカルデータ分析がさらなる洞察を与えることができるかどうかを考察する。
TDAに基づく特徴に基づくクラスタリング結果と,13大通貨為替レートの月次対数リターンを用いた古典的統計特徴との比較を行った。
以上の結果から,TDAをベースとした特徴クラスタリングは,従来の統計的特徴のクラスタリングよりも,よりコンパクトで分離性の高いクラスタを生成することがわかった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:10:54 GMT)
Top-P Masking for Cross Language Information Retrieval [0.0] 情報検索タスクにおけるスパース表現を促進するためにTop-P Dynamic Maskingを提案する。
具体的には,クロス言語情報検索(CLIR)分野における手法の評価を行う。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:47:42 GMT)
Three-Body Non-Locality in Particle Decays [0.0] 多粒子量子系における絡み合いとベル非局所性について検討する。
いくつかの不等式を解析することにより、量子力学からの偏差の検出に対処する。
我々の発見は、3粒子系における古典理論と量子理論の境界について深い洞察を与える。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:56:16 GMT)
The Temporal Graph of Bitcoin Transactions [0.0] 2009年のジェネシスブロック以来、Bitcoinネットワークはnum>1.08億(B)トランザクションを処理し、num>8.72B BTCを表現している。
資金の流れを再構築することにより、ビットコインの経済トポロジをモデル化したML互換グラフを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:10:46 GMT)
The Massive Legal Embedding Benchmark (MLEB) [0.0] MLEB(Massive Legal Embedding Benchmark)について述べる。
MLEBは、これまでで最大の、最も多様な、そして最も包括的なオープンソースベンチマークである。
それは、複数の管轄区域にまたがる10のエキスパートアノテートデータセットで構成されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:38:44 GMT)
The Endless Tuning. An Artificial Intelligence Design To Avoid Human Replacement and Trace Back Responsibilities [0.0] Endless Tuningは、二重ミラーリングプロセスに基づく人工知能の信頼性の高い展開のための設計方法である。
その後プロトコルで実現され、意思決定プロセスに関する3つのアプリケーションで実装された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:17:09 GMT)
Teaming LLMs to Detect and Mitigate Hallucinations [0.0] 単一モデル整合性の拡張は幻覚検出と緩和能力を大幅に向上させる可能性が示唆された。
我々は、15のモデルチームからなるプールから、多くのモデルチームにわたって、このEmphconsortium整合性アプローチを評価します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:03:43 GMT)
Structured Generative Modeling with the Thermodynamic Kolmogorov-Arnold Model [0.0] 構造的および帰納的バイアスを利用した熱力学コルモゴロフ・アルノルドモデル(T-KAM)を提案する。
T-KAMは、生成モデリングにおいてエレガントに一般的なトレードオフのバランスをとり、高速な推論、解釈可能性、安定したトレーニングを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:36:46 GMT)
Square root Cox's survival analysis by the fittest linear and neural networks model [0.0] 我々は、生存分析における特徴選択の改善を目的として、コックスの比例的ハザードモデルとLASSOを再考する。
クロスバリデーションやBICに依存する従来のメソッドとは異なり、$lambda$というペナルティパラメータは、機能選択のために直接チューニングされる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:48:58 GMT)
Single-Scale Magnetoelastic Landau Quantization: Thermodynamics, Quantum Oscillations, and Metrology [0.0] 電子系における熱力学と量子振動の統一的単一スケール記述を開発する。
単一の調整可能なギャップは、コンパクトな調和振動子分割関数から得られるすべての平衡可観測関数を整理する。
輸送とトルクにおいて、同じスケールでホールファンを厳格にシフトさせ、デ・ハース=ヴァン・アルフェンとシュブニコフ=ド・ハース振動の1/B$周期を圧縮する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:34:36 GMT)
Shrinkage to Infinity: Reducing Test Error by Inflating the Minimum Norm Interpolator in Linear Models [0.0] Hastie et al. (2022) は高次元線形回帰 $y=betaTx + epsilon$ においてリッジ正則化が必須であることを発見した。
高い異方性共分散と$d/n$の線形回帰を正確に観測する。
最小$ell$補間器を1より大きい定数でスケールアップ(または膨らませる)するだけで一般化誤差が改善できることが分かる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:30:27 GMT)
SCoPE VLM: Selective Context Processing for Efficient Document Navigation in Vision-Language Models [0.0] 長いコンテキストの視覚情報を理解することは、視覚言語モデルの根本的な課題である。
本稿では,新しいChain of Scroll機構を利用した文書ナビゲーションエキスパートであるSCoPE VLMを提案する。
SCoPE VLMは、多ページ文書質問応答においてエージェント読み取りパターンを明示的にモデル化する最初のフレームワークである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:47:12 GMT)
Revisiting the Relation Between Robustness and Universality [0.0] 仮説を再検討し、その一般性をテストする。
特定の設定において高い表現的類似性というJonesの主な主張を検証するが、結果は異なるデータセット間で一致しない。
また、予測的行動は普遍性の増加と収束せず、従って普遍性ではないことも明らかになった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:53:32 GMT)
Revealing the quantum nature of memory in non-Markovian dynamics on IBM Quantum [0.0] 衝突モデルを用いて、ゲートベース量子回路を用いて、適切な1量子と2量子のダイナミックスを実装する。
現状の雑音量子ハードウェアは、量子メモリを1量子ビットのダイナミックスで検証可能であることを実証する。
本稿では,現在の雑音量子コンピュータを用いて,2量子ビットの量子メモリの観測方法を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:25:49 GMT)
Quantum walks as a tool to design robust quantum batteries: the role of topology and chirality [0.0] 我々は、電池のトポロジーとハミルトンのキラリティーがエネルギー貯蔵ユニットとしての性能にどのように影響するかを量子ウォークの定式化を用いて調べる。
以上の結果から, これらの構造は, カイラリティとトポロジーの相互作用によって, 作業抽出を最適化するための調整可能なメカニズムを提供する, 異なるエルゴトロピースケーリングを示すことが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:59:36 GMT)
Quantum charging advantage based on power bounds can be deceptive [0.0] 2局所相互作用を持つ量子電池のオール・ツー・オール結合スピンチェインモデルは超高密度充電を示す。
しかし、エネルギー固有空間における電池の進化を利用した充電のより深い解析により、利点は消滅する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:05:48 GMT)
Quantum Coherence in Superconducting Vortex States [0.0] アブリコソフ渦(Abrikosov vortices)は、超伝導のギャップが核内で完全に抑制され、散逸的に半古典的な物質である。
粒状超伝導膜に閉じ込められた渦が2段階の系として振る舞うことを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:59:25 GMT)
Quantum Autoencoders for Anomaly Detection in Cybersecurity [0.0] サイバーセキュリティにおける異常検出に量子オートエンコーダ(QAE)を適用し,特にBPF拡張トラッキング・ハニーポット(BETH)データセットについて検討した。
以上の結果から,Dense-AngleエンコーディングとRealAmplitude ansatzを用いた8機能QAEは,古典的オートエンコーダ(CAE)よりも優れていることが示された。
データ制限設定では、最高のパフォーマンスのQAEモデルは、CAE(0.77)よりもF1スコアが0.87である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:32:34 GMT)
Probing the Hierarchy of Genuine Multipartite Entanglement with Generalized Latent Entropy [0.0] 一般化Lエントロピー(英: Generalized L-entropy、L-entropy)は、$n$の量子系の純状態における真の多重粒子の絡み合いの尺度である。
L-エントロピーは多粒子絡みの感度プローブとして機能し、強相互作用系における変形が量子絡み構造にどのように影響するかを明らかにする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:00:04 GMT)
Privacy-Preserving Spiking Neural Networks: A Deep Dive into Encryption Parameter Optimisation [0.0] スパイキングニューラルネットワーク(SNN)は、脳のイベント駆動動作を模倣し、パフォーマンスの向上と消費電力の削減を提供する。
BioEncryptSNNは、セキュアでノイズ耐性のあるデータ保護のためのスパイキングニューラルネットワークベースの暗号化復号フレームワークである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:43:46 GMT)
Predicting the winner of the US 2024 elections using trust analytics [0.0] 我々は、ソーシャルメディアの公開反応を利用して、大統領候補を含む実生活の出来事を計算社会科学のアプローチで活用する。
私たちは開発したツールをTrustAn(TrustAn)と名付けました。
両候補に対する信頼と不信のレベルを1週間から1週間に分けて、ハリス氏とトランプ氏の緊密な競争を観察する」と述べた。
信頼のレベルと信頼のレベルと信頼の度合いと、この指標の変更の時間を用いて、我々はドナルド・トランプを2024年の米大統領選の勝者として予測する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:51:29 GMT)
Precise classification of low quality G-banded Chromosome Images by reliability metrics and data pruning classifier [0.0] 本稿では,染色体の分類精度を信頼性しきい値と意図的に設計した特徴量を用いて改善する。
分類結果は、より一般的な欠陥と転位を有する染色体に対して90%以上改善されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:05:27 GMT)
Policy-Governed RAG - Research Design Study [0.0] RAGアーキテクチャは、規制されたゲート領域における監査可能な生成のために規定される。
この設計は既存のRAG/ガードレールを補完し、ポリシーチェックを監査可能、再生可能、レシートバックで補完する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:33:27 GMT)
Photonic scattering in 2D waveguide QED: Quantum Goos-Hänchen shift [0.0] 導波路における移動光子に結合した量子エミッタ(WQED)は、光-物質相互作用を理解するための強力なプラットフォームを提供する。
本稿ではグリーン関数法に基づく2次元WQEDの包括的散乱理論を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:31:56 GMT)
Optimal quantum learning in proximity to universality [0.0] 古典的にシミュレート可能な量子システムと計算的に優れた量子システムの境界は、真の量子優位性を特定するのに基本である。
可変な$N$-qubitランダム回路モデルを導入し、クリフォードゲートの分数$p$を確率的に非安定化条件付き$hatT$ゲートに置き換える。
本研究では,時間的処理タスクにおける貯水池の性能と,その絡み合いスペクトル統計量と長距離非安定化資源量との直接対応性を確立する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:53:52 GMT)
One rig to control them all [0.0] これらをベース回路のプロップに追加すると、制御回路を構成する。
この構文的構成は、ベースプロップ上の自由リグ圏を取ることに意味的に対応することを証明している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:51:01 GMT)
On the separation of quantum time evolution into holonomic and dynamical parts [0.0] Schr"odinger型量子時間進化をホロノミックおよび動的部分の積に分離する問題に対処する。
131, 200202 (2023) の最近の主張とは対照的に、この分離は一般に無効である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:35:55 GMT)
On the maximum purity of absolutely separable bipartite states [0.0] 我々は、絶対分離可能なキュービット量子状態と絶対PPT量子量子状態に対して、予想される最大純度を提案する。
幾何学的観点からすると、この問題は極大混合状態の周りの最小の球のユークリッド半径を正確に求めることと等価である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:04:17 GMT)
On Controlled Change: Generative AI's Impact on Professional Authority in Journalism [0.0] ジャーナリズムにおける(生成的な)人工知能ツールとシステムの使用は、ジャーナリストの生産率を増加させると予想されている。
本稿では,オランダメディアのジャーナリストが日常業務にAI技術を統合する方法について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:27:32 GMT)
Nonmonotone subgradient methods based on a local descent lemma [0.0] 我々は、非単調な降下法の文脈を、上$mathcalC2$Newtonと呼ばれる非滑らかな非函数のクラスに拡張する。
前提条件下では,非単調な線探索を行う一般的な段階的手法を提案する。
さらに,線形探索のパラメータを自動更新する自己適応型非単調勾配SNS(SNSM)を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:06:40 GMT)
No quantum advantage for violating fixed-order inequalities? [0.0] 量子論における動的因果関係と不定因果関係の相互作用を研究する。
量子スイッチはその不確定な性質を悪用することなく、kサイクルの不等式に違反することを示す。
この研究は、因果不等式ではなく、固定順序の不等式を介して、分離された量子スイッチのデバイス非依存的な認証を可能にする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:32:47 GMT)
No Intelligence Without Statistics: The Invisible Backbone of Artificial Intelligence [0.0] 人工知能(AI)の急速な発展は、しばしばコンピュータ科学と工学から生まれた革命として描かれる。
本稿では、統計学の分野が機械学習と現代AIに欠かせない基礎を提供すると体系的に主張する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:47:30 GMT)
Network Topology Matters, But Not Always: Mobility Networks in Epidemic Forecasting [0.0] マサチューセッツの都市を調査し、匿名化されたスマートフォンのトレースから週に1度指向のモビリティネットワークを構築しました。
我々は、マクロレベルのインシデントのみを使用するモデル、モビリティネットワーク機能を追加するモデル、町レベルの最近の事例を含む自己回帰(AR)モデルを比較する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:56:06 GMT)
Multimode Qubit-Conditional Operations via Generalized Cross-Resonance [0.0] 我々は、クロス共振駆動を一般化されたマルチモードスキームに拡張することにより、シングルモードおよびマルチモードキュービット条件演算を生成する。
マルチモードキュービット条件付き継手変位,ビームスプリッタおよび2モードスクイーズ操作を導出する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:12:37 GMT)
Modeling realistic human behavior using generative agents in a multimodal transport system: Software architecture and Application to Toulouse [0.0] 本稿では,複雑なマルチモーダル輸送システムにおける現実的な人間の移動挙動をモデル化するためのアーキテクチャを提案する。
エージェント・ベース・シミュレーションにLarge Language Models (LLMs) を適用し,実際の都市環境における意思決定を捉える。
その結果、エージェントはコンテキスト対応のトランスポート決定を行うだけでなく、時間とともに習慣を形成する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:45:44 GMT)
MobiAct: Efficient MAV Action Recognition Using MobileNetV4 with Contrastive Learning and Knowledge Distillation [0.0] 本稿では,計算コストの低い高精度なMAV行動認識フレームワークMobiActを提案する。
具体的には、MobiActはMobileNetV4をバックボーンネットワークとして採用し、Stage-wise Orthogonal Knowledge Distillation戦略を導入している。
実験結果から, MobiActは低エネルギーかつ低演算のMAV動作認識を実現することが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:18:53 GMT)
Mind the gaps: The fraught road to quantum advantage [0.0] 量子コンピューティングは急速に進歩しているが、今日のノイズの多い量子デバイスと明日のフォールトトレラントマシンを区別する大きなギャップがある。
道の先にある4つのハードルを特定します。
これらの遷移を目標にすることで、広範囲に有用な量子コンピューティングへの進歩が加速する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:00:19 GMT)
MedRule-KG: A Knowledge-Graph--Steered Scaffold for Mathematical Reasoning with a Lightweight Verifier [0.0] 我々は,記号検証器と結合したコンパクト型付き知識グラフであるMedRule-KGを紹介する。
MedRule-KGはエンティティ、リレーション、ドメインにインスパイアされた3つのルールをエンコードし、検証者は予測をチェックし、一貫性を保証するために最小限の修正を適用する。
90例のFDA由来のベンチマークでは、MedRule-KGは正確な一致(EM)を0.767から0.900に改善し、検証器を追加するとルール違反を完全に排除しながら1.000 EMが得られる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 01:48:53 GMT)
Magnetizing weak links by time-dependent spin-orbit interactions: momentum conserving and non-conserving processes [0.0] 弱いリンクをトンネルする電子のスピンに影響を与えるRashbaスピン軌道相互作用について研究する。
我々は、運動量を保存する過程によって誘導される磁化フラックスと、そうでないトンネル現象によって生じる磁化との接続を確立する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:57:19 GMT)
Machine Learning-Based Localization Accuracy of RFID Sensor Networks via RSSI Decision Trees and CAD Modeling for Defense Applications [0.0] この研究は、位置推定を行うために12のラボゾーン(LabZoneA-L)を分類することに焦点を当てている。
このモデルは成層化したサブサンプルから5,000のバランスの取れた観測値に訓練され、総合的な精度は34.2%となり、F1スコアは複数のゾーンで0.40以上となった。
これらの結果は、RSSIに基づく決定木を現実的なシミュレーションに適用し、ゾーンレベルの異常検出を可能にすることを示唆している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:40:50 GMT)
MSC-Bench: A Rigorous Benchmark for Multi-Server Tool Orchestration [0.0] MSC-Benchは、LLMエージェントによるマルチホップ、エンドツーエンドのツールオーケストレーションを評価するための大規模なベンチマークである。
これは「等式集合」を通じて基底真理を構築することでギャップに対処し、F1スコアのような客観的なメトリクスを可能にする。
シングルツールオーケストレーションから複雑なクロスサーバ計画、スコープ外要求に対する堅牢性まで、エージェント機能を体系的にテストする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:45:11 GMT)
Low-temperature Gibbs states with tensor networks [0.0] 本稿では,量子多体系の温度平衡状態を低温で近似するテンソルネットワーク手法を提案する。
共形場の理論の基底状態の性質によって動機付けられ、我々のアンザッツは特に臨界近くに適している。
アンザッツが共形場理論における絡み合いの有限温度スケーリングをいかに再現するかを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:42:05 GMT)
Low overhead circuit cutting with operator backpropagation [0.0] 本稿では,演算子バックプロパゲーション(OBP)と回路切断を組み合わせた量子回路のノイズ最小化手法を提案する。
その結果,変分量子固有解器とハミルトニアンシミュレーション回路の資源要求は,それぞれ3倍,10倍減少した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:00:37 GMT)
LifeSync-Games: Toward a Video Game Paradigm for Promoting Responsible Gaming and Human Development [0.0] LifeSync-Gamesは、仮想ゲームプレイとリアルライフアクティビティを結びつけるために、単純化されたデジタルツインを利用するフレームワークである。
この相互関係は、自己統制を促進することにより、ゲームの発展価値を高めることを目的としている。
本稿では,フレームワークの理論的基礎,技術コンポーネント,設計ガイドライン,評価アプローチについて述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:38:40 GMT)
Learning when to rank: Estimation of partial rankings from sparse, noisy comparisons [0.0] 偏位を学習するための原理的非パラメトリックベイズ法(階層付きランク)を開発する。
そこで本研究では,実データと合成データを用いて,本手法の性能について検討する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:26:36 GMT)
Lattice-reflection symmetry in tensor-network renormalization group with entanglement filtering in two and three dimensions [0.0] 2つの基本TNRG作用素における格子反射対称性の活用と適用のためのトランスポジション手法を提案する。
我々の研究は、TNRGの格子回転対称性を理解するための道を開く。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:54:41 GMT)
Large Language Models in Architecture Studio: A Framework for Learning Outcomes [0.0] 本研究は,建築デザインスタジオにおける大規模言語モデル(LLM)の役割について考察する。
主な課題は、学生の自主性の管理、ピアフィードバックの緊張、技術知識の伝達と教育における創造性の刺激とのバランスの難しさである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:47:37 GMT)
Krylov Complexity Under Hamiltonian Deformations and Toda Flows [0.0] ハミルトン変形に対するクリロフ部分空間法を適用する。
変形理論と非変形理論の進化を関連づける。
我々は時間進化を組織的に観察する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:02:03 GMT)
Knowledge and Common Knowledge of Strategies [0.0] 戦略の知識をきめ細かなレベルで特定できるモデルを提案する。
戦略に関する一階、高階、共通知識を区別することができる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:00:33 GMT)
KARIPAP: Quantum-Inspired Tensor Network Compression of Large Language Models Using Infinite Projected Entangled Pair States and Tensor Renormalization Group [0.0] ChatGPTやLLaMAのような大規模言語モデル(LLM)は、生成AIの急速な進歩をもたらすが、その巨大なパラメータスケールは、計算と環境に深刻な負担をもたらす。
Infinite Projected Entangled Pair States (iPEPS) と Renormalization Group (TRG) による量子インスパイアされたテンソルネットワーク圧縮であるKARIPAPを提案する。
LLaMA-2 7Bの実験では、メモリが93%、パラメータが70%減少し、トレーニングが50%速く、推論が25%速く、精度が2-3%低下した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:43:09 GMT)
Joint momenta-coordinates states as pointer states in quantum decoherence [0.0] 弱い場合のみ、合同モータコーディネート状態は、常に純粋で頑健であり、真のポインタ状態として確立されることが示される。
このことは、アイザーの初期の過酷な扱いを拡張し、ガウス近似を超えた概念を一般化し、古典的なロバスト性を量子位相空間形式論に組み込む。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:58:10 GMT)
Invoice Information Extraction: Methods and Performance Evaluation [0.0] そこで本研究では,抽出したデータの精度を注釈付き地上真実に対して評価するための評価指標(EM)を提案する。
このアプローチでは、スキャンされた請求書やデジタル請求書を前処理し、DoclingとLlamaCloud Servicesを使用して請求書番号、日付、総金額、ベンダーの詳細などのキーフィールドを特定し、抽出する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:51:58 GMT)
Investigating the Relationship between the Weighted Figure of Merit and Rosin's Measure [0.0] 2つの測度重みとロシンの測度は、一方が他方の代わりに使用できるように関連している。
重み付けされたメリットのフィギュアとロシンの測度に関する数学的公式を解析する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:20:09 GMT)
Interference and Measurement: Changing amplitude phase information to amplitude magnitude information [0.0] 位相が関連する情報をエンコードする振幅の大きさをどう操作できるかを示す。
建設的干渉を用いて有用な情報と破壊的な干渉を含む振幅を増強し、そうでないものを抑制する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:03:50 GMT)
Integration of AI in STEM Education, Addressing Ethical Challenges in K-12 Settings [0.0] 人工知能のK-12 STEM教育への迅速な統合は、重要な倫理的課題と共に変革的な機会をもたらす。
本稿では、STEM教室におけるAIの両端的な影響を分析し、その利点(適応学習、リアルタイムフィードバックなど)と欠点(監視リスク、教育的制約など)を倫理的レンズを通して分析する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:07:26 GMT)
Insights into the Unknown: Federated Data Diversity Analysis on Molecular Data [0.0] フェデレートラーニング(FL)は、プライベートデータをプライバシ保護、データサイロ間の協調モデルトレーニングに統合する、有望なアプローチを提供する。
我々は、Federated kMeans(Fed-kMeans)、Fed-PCA+Fed-kMeans(Fed-PCA+Fed-kMeans)と組み合わせたFederated principal Component Analysis(Fed-PCA+Fed-kMeans)、Federated Locality-Sensitive Hashing(Fed-LSH)の3つのアプローチを8つの異なる分子データセット上の集中的なアプローチに対してベンチマークした。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:41:04 GMT)
Indefinite causal order and quantum coordinates [0.0] 操作的に定義されたイベント間の因果順序の相対論的定義を提供する。
このオブザーバブルは、光学ベンチに実装された不確定因果順序と、重力量子スイッチとを区別しない。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:42:56 GMT)
Improving Transfer Learning for Sequence Labeling Tasks by Adapting Pre-trained Neural Language Models [0.0] この論文は、事前訓練されたニューラルネットワークモデルを適用することにより、シーケンスラベリングタスクの転送学習を改善する。
転送学習の改善には、追加の信号を含むマルチタスクモデルの導入が含まれる。
第3の改良は、自動回帰的な大規模言語モデルをテキストジェネレータとして、生成的に教師付きインコンテキスト微調整フレームワークを通じて活用する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:23:53 GMT)
How many samples to label for an application given a foundation model? Chest X-ray classification study [0.0] 特定ROC-AUC閾値に必要なトレーニングサイズを予測するために,パワー・ロー・フィット(Power-law fits)の評価を行った。
XrayCLIP と XraySigLIP は,ResNet-50 ベースラインよりもラベル付きサンプルの方がはるかに少ない性能を実現している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:54:25 GMT)
Graph Representation Learning with Diffusion Generative Models [0.0] 我々は、グラフデータの意味のある埋め込みを学習するために、オートエンコーダフレームワーク内で離散拡散モデルを訓練する。
エンコーダの出力とデコーダの最初のステップの埋め込みから表現を抽出する。
本手法は,グラフ表現学習に使用する離散拡散モデルの可能性を示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:58:33 GMT)
General quantum resources provide advantages in work extraction tasks [0.0] 我々は、状態とチャネルの両方の一般的な量子資源を認証する作業抽出タスクを提供する。
また,このような作業抽出タスクは,一方のデバイス独立な方法で量子エンタングルメントを認証するためにも適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:25:44 GMT)
Follow the STARs: Dynamic $ω$-Regular Shielding of Learned Policies [0.0] 本稿では,新しい動的ポストシールドフレームワークを提案する。
これは事前計算された確率的ポリシーに対して$omega$-regular correctnessプロパティの完全なクラスを強制する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:48:16 GMT)
Feature Selection and Regularization in Multi-Class Classification: An Empirical Study of One-vs-Rest Logistic Regression with Gradient Descent Optimization and L1 Sparsity Constraints [0.0] マルチクラスのワイン分類は、モデル精度、特徴次元、解釈可能性の基本的なトレードオフを示す。
本稿では,UCIワインデータセット上での1-vs-Restロジスティック回帰に関する総合的研究について述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:40:52 GMT)
Exact State Evolution and Energy Spectrum in Solvable Bosonic Models [0.0] 可解なボソニックモデルは非線形媒体における光伝搬を記述するための枠組みを提供する。
量子光学において、中心的な目的は、与えられた初期状態の時間進化を決定することである。
固有状態は連続分数の形で見られ、関連するヤコビ行列の主部分集合として見られる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:46:43 GMT)
Evaluating NLP Embedding Models for Handling Science-Specific Symbolic Expressions in Student Texts [0.0] 本研究は, 現代埋め込みモデルが, 科学関連記号表現の処理・解釈能力にどう影響するかを考察する。
以上の結果から,OpenAIのGPT-text-embedding-3-largeは,他のすべての検査モデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:38:12 GMT)
Evaluating ChatGPT's Performance in Classifying Pneumonia from Chest X-Ray Images [0.0] 我々はOpenAIのGPt-4oモデルを用いて胸部X線画像をゼロショット環境でNORMALまたはPNEUMONIAに分類する能力を評価する。
その結果, 簡潔で特徴重視のプロンプトは, 74%と高い分類精度を達成できた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:31:44 GMT)
Entanglement swapping for partially entangled qudits and the role of quantum complementarity [0.0] ESPによる2つの間の平均的な分散絡み合いは、入力ペアの1つの初期絡み合いによって上述されることを示す。
本研究では、ESPにおける量子相補性の役割について論じ、ESPを介して運用可能な絡み合いを局所的に予測可能であるかを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:28:51 GMT)
Entanglement production in the decay of a metastable state [0.0] 我々は、窓付きフーリエ変換を用いて、異なるタイミングで生成された放射フラグメントに関連する多重モード量子状態を定義する。
「このようなエントロピー増分は、特にホーキング放射のように、放射線を古いものと新しいものとに分けたい場合に有用な絡み合い策である」と論じる。」
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:02:06 GMT)
Entanglement islands in 1D and 2D lattices with defects [0.0] 1次元系では絡み合いは欠陥の近くに集中する傾向にあり、2次元では橋梁状および放射対称領域を観察する。
この結果から,TDQMCは実空間量子情報解析のためのスケーラブルで物理的に透過的なフレームワークを提供することが示された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:41:00 GMT)
Entanglement Sum Rule from Higher-Form Symmetries [0.0] 有限アーベル高次対称性を持つ$(d-1)$次元量子格子モデルの絡み合い和則を証明する。
このフレームワークはフェルミオン-$mathbbZ$ゲージ理論の既知の例を説明し、一般化する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:28:52 GMT)
Entangled states from simple quantum graphs [0.0] 絡み合いは、量子情報処理における多くのアプリケーションのための基本的なリソースである。
制御された2レベル量子系としてモデル化された単純な量子グラフにおける量子輸送が、絡み合った状態を生成するためにどのように利用できるかを考察する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:06:08 GMT)
Enhancing the Performances of Autonomous Quantum Refrigerators via Two-Photon Transitions [0.0] 熱湯と冷湯との2光子遷移による相関熱伝達を利用した別個のクエット冷凍機を導入する。
これらの冷凍機は、従来に比べて冷却力と信頼性が少なくとも2倍向上する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:59:08 GMT)
Enhancing Student Performance Prediction In CS1 Via In-Class Coding [0.0] コンピュータ科学の卓越した学問分野としての認知度は、様々な学術的背景を持つ学生を惹きつけている。
この課題に対処するためには、苦労している学生を早期に特定することが不可欠である。
これらのコースのインクラスコーディング演習は、生徒に追加の実践機会を提供するだけでなく、その能力を明らかにし、支援が必要な人を特定するのに役立つかもしれない。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:40:41 GMT)
EEG-Based Consumer Behaviour Prediction: An Exploration from Classical Machine Learning to Graph Neural Networks [0.0] 脳波(EEG)データは、脳の神経活動に関する詳細な情報を提供することで、意思決定プロセスを分析するのに役立つ。
古典モデルやグラフニューラルネットワークなど、さまざまな機械学習モデルを使用し、比較する。
結果は全体としては大きな違いは示さなかったが、GNNモデルは古典的モデルが満足できないいくつかの基本的な基準において、概して良好な性能を示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:22:07 GMT)
Dipole-Dipole Interactions of Floquet States [0.0] Floquet-Markov Lindblad master equation for translationally cold two-level atoms driven by a strong monochromatic wave and coupled to a commonmagnetic bath。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:34:14 GMT)
Digitizing Paper ECGs at Scale: An Open-Source Algorithm for Clinical Research [0.0] 我々は、スキャンまたは撮影されたECGをデジタル信号に変換する、完全に自動化されたモジュラー・フレームワークを導入する。
このフレームワークは、Akershus University Hospitalで収集された1,596個のECG画像37,191枚で検証されている。
ソフトウェアがレトロスペクティブECGアーカイブのアンロックに寄与し、AI駆動診断へのアクセスを民主化することを期待しています。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 13:41:21 GMT)
Development of an Automated Web Application for Efficient Web Scraping: Design and Implementation [0.0] 本稿では,非技術ユーザを対象としたWebスクレイピングプロセスの簡素化と最適化を行う,ユーザフレンドリな自動Webアプリケーションの設計と実装について述べる。
アプリケーションは、Webスクレイピングの複雑なタスクを、フェッチ、抽出、実行の3つの主要なステージに分割します。
この自動化ツールは、Webスクレイピングの効率を向上するだけでなく、すべての技術的レベルのユーザに対して、ニーズに合ったデータの収集と管理を可能にすることによって、データ抽出へのアクセスを民主化します。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:56:00 GMT)
Detecting and Preventing Latent Risk Accumulation in High-Performance Software Systems [0.0] キャッシュ障害が100倍の負荷増幅と99%のカスケード崩壊を引き起こすまで、脆弱なヒット率を達成するキャッシュはボトルネックを曖昧にする可能性がある。
現在の信頼性エンジニアリングは、最適化によって引き起こされる脆弱性を積極的に検出するのではなく、リアクティブなインシデント応答に重点を置いている。
本稿では,系統的潜在リスク検出,予防,最適化のための総合的な枠組みを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:56:45 GMT)
Decoherence of a dissipative Brownian charged magneto-anharmonic oscillator: an information theoretic approach [0.0] 磁場中における異方性無調波発振器のデコヒーレンスを高温・低温における高調波発振器の入浴と組み合わせて検討した。
非調和性パラメータαは、非調和性の分解効果による脱コヒーレンスを高める。
この研究は、デコヒーレンスが量子コンピュータの性能に大きく影響を与える量子技術の領域に関連している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:27:40 GMT)
Cultural Dimensions of Artificial Intelligence Adoption: Empirical Insights for Wave 1 from a Multinational Longitudinal Pilot Study [0.0] 人工知能(AI)の急速な普及は、文化的な文脈が採用パターンをどう形成し、人間の日常生活にもたらす影響について批判的な疑問を提起する。
本研究では,ヨーロッパ,アフリカ,アジア,南米の9つの国家的文脈における,AI導入の文化的側面とその認知戦略への影響について検討した。
第一に、文化的な要因、特に言語と年齢は、AIの採用と信頼性の認知に大きく影響します。
第二に、AIの使用に関する倫理的判断は領域によって異なり、専門的な文脈は実用的協力者としての役割を正規化し、学術的な設定は盗作のリスクを強調した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:31:28 GMT)
Constraint Satisfaction Approaches to Wordle: Novel Heuristics and Cross-Lexicon Validation [0.0] 本稿では, CSP 対応エントロピー, 制約伝搬後の情報ゲイン, 確率的 CSP フレームワークを紹介する。
2,315語の単語を評価することで、CSP-Aware Entropy 3.54の平均推定は99.9%の成功率である。
500のスペイン語の単語に対するクロスレキシコンの検証は、言語固有のチューニングをゼロにすることで88%の成功を示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:50:28 GMT)
Code Sharing in Healthcare Research: A Practical Guide and Recommendations for Good Practice [0.0] このガイドは、医療研究におけるコード共有のための実行可能なレコメンデーションの概要である。
FAIR(Findable, Accessible, Interoperable, Reusable)の原則を強調し、著者らは共通の障壁に対処する。
これは、より優れた科学と、より信頼性の高い計算駆動の実践の証拠をサポートする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:29:08 GMT)
CoSense-LLM: Semantics at the Edge with Cost- and Uncertainty-Aware Cloud-Edge Cooperation [0.0] CoSense-LLMは、連続したマルチモーダルセンサストリームをコンパクトなセマンティックトークンに変換するエッジファーストフレームワークである。
システムは、ページ化またはストリーミングKVキャッシュ、Flashスタイルのカーネル、投機的復号化、量子化されたLoRAアダプタなど、モダンなサービス最適化で動作する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:16:56 GMT)
CoRECT: A Framework for Evaluating Embedding Compression Techniques at Scale [0.0] CoRECTは埋め込み圧縮手法の大規模評価のためのフレームワークである。
非学習圧縮は,最大100万パスにおいても,インデックスサイズを大幅に削減できることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 08:03:31 GMT)
Classical theories of gravity produce entanglement [0.0] リチャード・ファインマン(Richard Feynman)が提唱した実験的なアイデアは、現在ではこの統一をテストするための有望なルートと見なされている。
この実験では、巨大な物体を2つの位置の量子的重ね合わせに配置し、別の質量と重力的に相互作用させる。
2つの物体が後に絡まった場合、これは重力が量子力学の法則に従うという明白な証拠であると考えられている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:01:51 GMT)
Classical Gravity Cannot Mediate Entanglement by Local Means [0.0] 最近の論文では、古典的な重力は局所的な手段によって2つの巨大な重ね合わせを絡み合わせることができると主張している。
遠方の質量間の局所的な伝播によって絡み合うことができれば、重力場には量子的特徴が必要であることが確認できる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:59:58 GMT)
CircuitGuard: Mitigating LLM Memorization in RTL Code Generation Against IP Leakage [0.0] 大規模言語モデル(LLM)は、レジスタ転送レベル(RTL)ハードウェア合成など、生成タスクにおいて顕著な成功を収めている。
トレーニングデータを記憶する傾向は、プロプライエタリまたはセキュリティに敏感な設計が推論中に意図せずに露出した場合に重大なリスクを引き起こす。
リーク低減と正当性保存のバランスをとる戦略であるCircuitGuardを提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:22:15 GMT)
ChatGPT Unveils Its Limits: Principles of Law Deliver Checkmate [0.0] 研究によると、ChatGPTが必要な知識や能力にアクセスできたとしても、それらを組み立てることはできない。
このタスクの実行において、人工知能は、本質的に限定された、全面的な理解と推論を欠いている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 05:33:57 GMT)
COLA: Continual Learning via Autoencoder Retrieval of Adapters [0.0] 大規模言語モデル(LLM)は、しばしば繰り返し再学習や継続的な学習には実用的ではない。
COLAはオートエンコーダを使用して、様々なタスクに関連する重みの低次元埋め込みをキャプチャーする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 12:04:21 GMT)
Bridging Earth and Space: A Survey on HAPS for Non-Terrestrial Networks [0.0] HAPSは6G無線ネットワークの進化、地上および非地上インフラの橋渡しにおいて重要な実現要因として浮上している。
この調査では、HAPSのユースケース、技術、および6Gエコシステム内の統合戦略の概要を概観する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 16:22:31 GMT)
Born series for s-wave scattering length and some exact results [0.0] ボルン級数は、中心ポテンシャルのクラス$V(r)$を次元のない結合強度$g$で6階まで計算する。
指数関数的に崩壊するポテンシャルの例と、単一の長さスケールの$a$を含む切り詰められたポテンシャルの例を考察する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:55:49 GMT)
Bootstrap Sampling Rate Greater than 1.0 May Improve Random Forest Performance [0.0] ランダムフォレスト(RF)は、ブートストラップサンプリングを使用して、各コンポーネントツリーの個別のトレーニングセットを生成する。
ブートストラップ率(英: bootstrap rate, BR)は、各ブートストラップサンプルの観測回数とトレーニングインスタンスの総数との比率である。
BR値が高いと、標準設定に比べて分類精度が統計的に有意に向上することを示した。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:08:13 GMT)
Bias-field-free operation of nitrogen-vacancy ensembles in diamond for accurate vector magnetometry [0.0] 窒素空孔中心スピンアンサンブルは高感度ベクトル磁気学に有望な解決策を提供する。
通常、各NV方向からの信号の分離に使用されるバイアス磁場は永久磁石やコイルのドリフトから不正確性をもたらす。
本研究では,マイクロ波(MW)磁場の方向からNV配向を可変パルス変調ラムゼー列にラベル付けする新しいバイアス場のない手法を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:52:00 GMT)
Behavioral Biometrics for Automatic Detection of User Familiarity in VR [0.0] 経験のないユーザが増えれば、仮想現実(VR)システムに関わるようになるでしょう。
本研究では,パスコードを用いたドア開閉作業中の手の動きパターンを解析し,VRの親しみやすさの自動検出について検討する。
本結果は,VRアプリケーションにおけるユーザ親しみのリアルタイム検出に手動バイオメトリックスを用いることの約束を裏付けるものである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:42:42 GMT)
Automating Iconclass: LLMs and RAG for Large-Scale Classification of Religious Woodcuts [0.0] 本稿では,Large Language Models (LLM) とベクトルデータベースを用いて,現代宗教画像の分類手法を提案する。
フルページ記述とRAGを用いることで、分類精度を高め、初期のビジュアルアーカイブを大規模に解析するための強力なツールを提供する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:34:19 GMT)
Automated Morphological Analysis of Neurons in Fluorescence Microscopy Using YOLOv8 [0.0] 本研究は、幹細胞由来のニューロンの高分解能データセットに基づいて、ニューロンのインスタンスセグメンテーションと測定のためのパイプラインを示す。
提案手法は、手動で注釈付顕微鏡画像に基づいて訓練されたYOLOv8を用いており、高いセグメンテーション精度を97%以上達成している。
抽出した形態測定の全体的な精度は75.32%に達し、提案手法の有効性をさらに裏付けた。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:35:08 GMT)
Artificial Intelligence Powered Identification of Potential Antidiabetic Compounds in Ficus religiosa [0.0] フィクス・リジオサ(Ficus religiosa)は、抗糖尿病作用を有する生物活性植物化学物質を産生する従来の薬用植物である。
この調査では、人工知能を利用したエコシステムベースの計算手法が採用されている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 02:59:32 GMT)
An Empirical Study of Bitwise Operators Intuitiveness through Performance Metrics [0.0] 本研究は,様々なプログラミングバックグラウンドを持つ人々がビットワイズ演算子をどのように理解し,利用するかを評価するために,インサイダー・オブジェクト・エクスペリメント・デザインを用いている。
その結果、作用素は反応時間を予測する要因の1つであり、R-2乗 0.032, (1, 494) = 16.5, p .001 の小さいが有意な効果を持つことが示された。
OR、NOT、Left Shiftなどの演算子は、他の演算子と比較してタスク完了時間において統計的に有意であった。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 06:30:49 GMT)
An Adaptive Intelligent Thermal-Aware Routing Protocol for Wireless Body Area Networks [0.0] 本稿では、WBANに対するインテリジェントな温度認識および信頼性に基づくルーティング手法を提案する。
スループットを13%向上し、エンドツーエンドの遅延を10%削減し、エネルギー消費を25%削減し、ルーティング負荷を既存の方法に比べて30%削減する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:02:32 GMT)
An AI enhanced approach to the tree unimodality conjecture [0.0] 私たちはAIアーキテクチャのPatternBoostを使って、マシンをトレーニングし、ログ凹凸予想に対する反例を見つけます。
このアプローチの成功について論じる - 27から101までのセットサイズで、ログの凹凸に対する数千の新しい反例を見つける。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 21:17:37 GMT)
Alternatives to the Laplacian for Scalable Spectral Clustering with Group Fairness Constraints [0.0] 本研究では,ラグランジアン法とシャーマン・モリソン・ウードベリー(SMW)の同一性から導かれる新しい定式化を用いて,スペクトルクラスタリングアルゴリズムの効率を向上させることを目的とする。
The results of Fair-MWSMW to measure efficiency and balance across real-world network data, including LastFM, FacebookNet, Deezer, German。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 03:26:54 GMT)
Algorithmic Fairness in NLP: Persona-Infused LLMs for Human-Centric Hate Speech Detection [0.0] 本研究では,多言語モデル(Persona-LLM)とアノテータペルソナのパーソナライズが,ヘイトスピーチに対する感受性にどのように影響するかを検討する。
我々は,Google の Gemini と OpenAI の GPT-4.1-mini モデルと 2 つのペルソナプロンプト手法を採用している。
社会デマトグラフィーの属性をLLMに組み込むことで、ヘイトスピーチの自動検出におけるバイアスに対処できることを示す。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 07:48:57 GMT)
Algebraic machinery of quantization [0.0] 我々は、ケイヒル・グローバー対応フレームワークの中で「ハットスター積」の明示的な形式を示す。
恒星生成物の構造鏡として機能し、位相空間における量子力学の非可換性を符号化する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 04:51:11 GMT)
Advancing Carbon Capture using AI: Design of permeable membrane and estimation of parameters for Carbon Capture using linear regression and membrane-based equations [0.0] 本研究はCO$分離のための膜ベースシステムに焦点を当てる。
CO$$の透過率は0.045であり、効率的な分離の可能性を示している。
この研究は、人工知能が炭素捕獲のための膜を設計するのにどのように役立つかを探求する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:10:23 GMT)
Addressing spins at the clock transitions with a frequency- and bandwidth-tunable superconducting resonator [0.0] 直流電流を高速度インダクタンス薄膜に通すことで周波数を調整できる超伝導共振器の測定を行った。
我々は、ビスマスドナー超微細遷移のRF駆動と共振器の動的帯域幅制御を実証する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:30:44 GMT)
Absence of measurement- and unraveling-induced entanglement transitions in continuously monitored one-dimensional free fermions [0.0] 測度スキーム間の補間は、同じリンドブラッドマスター方程式の異なる解に対応する。
0 leq varphi pi/2$ の場合、絡み合いは最終的に面積法則に従うが、指数関数的に大きなスケールを超えるだけである。
我々の分析は、0 leq varphi pi/2$ に対して、絡み合いは究極的には面積法則に従うが、指数関数的に大きなスケールを超えていることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 10:46:07 GMT)
AI-Driven Personalized Learning: Predicting Academic Per-formance Through Leadership Personality Traits [0.0] この研究は、パーソナライズされた学習におけるAI技術の可能性を探る。
リーダーシップパーソナリティ特性と機械学習モデリングによる学術的成功の予測を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:47:30 GMT)
AI Pose Analysis and Kinematic Profiling of Range-of-Motion Variations in Resistance Training [0.0] 本研究では,AIを用いたポーズ推定パイプラインを開発し,抵抗トレーニングにおける運動力学の正確な定量化を実現する。
Wolfらによるビデオデータを用いて,26人の上半身運動8回のトレーニングにおいて,pROMとフルレンジ・オブ・モーション(fROM)のトレーニングを比較し,フレームレベルの関節角度軌跡を抽出するために280枚の記録処理を行った。
以上の結果より, 運動の偏心期において, pROM反復はROMが小さく, 全体の持続時間が短いことが示唆された。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 20:27:45 GMT)
AGNES: Adaptive Graph Neural Network and Dynamic Programming Hybrid Framework for Real-Time Nanopore Seed Chaining [0.0] ナノ孔シークエンシングにより、リアルタイムの長読DNAシークエンシングが可能で、読み取りは10キロ塩基を超える。
12~15パーセントの固有エラー率は、リードアライメントにおいて重要な計算上の課題を提示する。
本稿では,グラフニューラルネットワークと古典動的プログラミングを組み合わせた適応型シードチェインのためのハイブリッドフレームワークRawHash3を提案する。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 23:26:38 GMT)
A unified picture of phonon anomalies in crystals and glasses [0.0] Dingらは単一のフレームワーク内で異常を統一する共振減衰モデルを提案する。
フォノンの減衰と振動の軟化を結合することにより、ファン・ホーブのピークを示す物質や、ボソンのピークを示す物質、そしてその両方を示す物質が説明できる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 17:04:04 GMT)
A transmon qubit realized by exploiting the superconductor-insulator transition [0.0] 超伝導量子ビットは、実用的な量子コンピュータを実現する上で最も有望なプラットフォームの一つである。
本研究では,原子層堆積と原子層エッチングのみを用いた弱結合を形成するために,厚み駆動型超伝導-絶縁体遷移を利用する。
我々は、alpha/2pi = 235$ MHz の非調和性を持つトランスモン量子ビット '$planaron$' を作成し、現在、線幅は $kappa/2pi = 15 Mathrm: MHz$ である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:29:01 GMT)
A recursive Bayesian neural network for constitutive modeling of sands under monotonic and cyclic loading [0.0] 工学において、モデルは様々な排水条件、ストレスパス、ロード履歴をまたいだ土壌の挙動を捉える中心となる。
本研究では,時間列学習を一般化推論で統一する再帰的ベイズニューラルネットワーク(rBNN)フレームワークを提案する。
このフレームワークは、シミュレートされた3軸テストと実験的な3軸テストの両方にまたがる4つのデータセットに対して検証される。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:34:49 GMT)
A quality of mercy is not trained: the imagined vs. the practiced in healthcare process-specialized AI development [0.0] 初期の表現的決定がAIがサポートできる範囲を狭めたことを示し、システム設計から重要な倫理的次元を早期に排除した。
我々の研究結果は、抽象化の道徳的な影響を表面化し、医療プロセスに特化した人工知能システムを設計するための、より確立されたアプローチを求めるものである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:48:35 GMT)
A new wave of vehicle insurance fraud fueled by generative AI [0.0] 保険詐欺は広範でコストのかかる問題であり、毎年数千億ドルの損失を被る。
ディープフェイク画像やビデオ生成を含む生成AIの台頭は、大規模に不正を犯す新しい方法を導入した。
保険会社はAIベースのディープフェイク検出ソフトウェアのような対策を展開し始めている。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 18:31:31 GMT)
A Probabilistic Computing Approach to the Closest Vector Problem for Lattice-Based Factoring [0.0] 最も近いベクトル問題(CVP)は格子ベースの暗号における基本的な最適化問題である。
近年,格子型ファクタリングアルゴリズムにおいて,CVP近似近似近似補正のステップを組み込むことが検討されている。
本稿では,本課題に対する確率論的計算アルゴリズムの設計,素格子パラメータの議論,実験結果について述べる。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 09:06:08 GMT)
A Multimodal, Multitask System for Generating E Commerce Text Listings from Images [0.0] 本稿では,1つの画像から現実的なテキストリストを生成するエンド・ツー・エンドマルチタスクシステムを提案する。
階層的な生成プロセスは非常に効果的であることが証明され、事実の幻覚率を12.7%から7.1%に下げる。
1つの小さな欠点は、ROUGE-Lスコアで直接視覚から言語へのモデルよりも3.5%悪い性能を発揮することである。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 11:50:49 GMT)
A Multi-Layer Machine Learning and Econometric Pipeline for Forecasting Market Risk: Evidence from Cryptoasset Liquidity Spillovers [0.0] 我々は、中核暗号セットの流動性とボラティリティのプロキシが、市場全体のリスクを予測する流出を発生させるかどうかを調査する。
我々の経験的枠組みは, (A) コア流動性とリターン間の相互作用, (B) 流動性とリターンを結び付ける主成分関係, (C) 断続的ボラティリティの団結を捉えるボラティリティ・ファクター・プロジェクションの3つの統計層を統合している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 22:36:34 GMT)
A Graph Engine for Guitar Chord-Tone Soloing Education [0.0] 本稿では,ギター学生のための和音独唱提案をグラフベースで計算する手法を提案する。
コード・トーン・ソロは、すべての先進的なジャズ・ギター理論のためのビルディング・ブロックであるが、学習と練習は困難である。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 15:13:16 GMT)
A Fundamental Algorithm for Dependency Parsing (With Corrections) [0.0] 本稿では,自然言語文を係り受け木に解析するための基本アルゴリズムを提案する。
フレーズ構造解析とは異なり、このアルゴリズムは一度に1つの単語を処理し、各単語をアタッチできる限り早くアタッチする。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 19:48:38 GMT)
A Criterion for Post-Selected Quantum Advantage [0.0] 非ユニバーサルゲート集合上の均一かつ大きさの量子回路が効率よくシミュレートできないことを証明した。
我々の結果は、(Udagger otimes Udagger) MathrmU(2)$以上の回路は量子的に有利であることを示している。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:43:08 GMT)
A Climate-Aware Deep Learning Framework for Generalizable Epidemic Forecasting [0.0] ForecastNet-XCLは、RSVのリアルタイム監視にアクセスすることなく、気候や時間データに基づいて、100週間前の正確なRSV予測を生成する。
ForecastNet-XCLは、統計ベースライン、個々のニューラルネット、および従来のアンサンブル手法を、内部およびクロスステートのシナリオで確実に上回った。
論文参考訳(メタデータ) (Wed, 22 Oct 2025 14:04:42 GMT)