NTIRE 2025 Challenge on Low Light Image Enhancement: Methods and Results [205.7] この課題の目的は、より明るく、鮮明で、視覚的に魅力的な画像を生成することができる効果的なネットワークを特定することである。
この大会に登録された参加者は762人であり、28チームが最終的に有効なエントリーを提出した。
本稿では,LLIEにおける最先端の進歩を徹底的に評価し,その顕著な進歩を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:30:16 GMT)
InternVLA-M1: A Spatially Guided Vision-Language-Action Framework for Generalist Robot Policy [138.9] 空間接地とロボット制御のための統合フレームワークであるInternVLA-M1を紹介する。
InternVLA-M1は、(i)2.3M以上の空間的推論データに基づく空間的グラウンドトレーニングと(ii)空間的に誘導された後トレーニングという、2段階のパイプラインを使用する。
結果: InternVLA-M1 は SimplerEnv Google Robot で+14.6%、WidowX で+17%、LIBERO Franka で+4.3% で、空間誘導なしでその変種を上回った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:30:05 GMT)
VaultGemma: A Differentially Private Gemma Model [130.5] Gemmaファミリー内の10億のパラメータモデルであるVaultGemma 1Bを導入し、差分プライバシーを十分に訓練した。
私たちはこのモデルをコミュニティに公開しています。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:59:53 GMT)
International AI Safety Report 2025: First Key Update: Capabilities and Risk Implications [118.5] 今回のアップデートは、AIの能力が最初のAI Safety Reportからどのように改善されたかを調べるものだ。
重大な新たな証拠が評価を更新する重要なリスク領域に焦点を当てている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:13:49 GMT)
Human-MME: A Holistic Evaluation Benchmark for Human-Centric Multimodal Large Language Models [118.4] MLLM(Multimodal Large Language Models)は視覚的理解タスクにおいて大きな進歩を見せている。
Human-MMEは、人間中心のシーン理解におけるMLLMのより総合的な評価を提供するために設計された、キュレートされたベンチマークである。
我々のベンチマークは、単一対象の理解を多対多の相互理解に拡張する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:53:06 GMT)
FinDeepResearch: Evaluating Deep Research Agents in Rigorous Financial Analysis [110.6] HisRubricは階層的な分析構造ときめ細かいグレーディングルーブリックを備えた新しい評価フレームワークである。
FinDeepResearchは、4つの言語にまたがる8つの金融市場から64の上場企業からなるベンチマークである。
6つのDRエージェント、深い推論能力と探索能力を備えた5つのLLM、深い推論能力を持つ5つのLLMを含む16の代表的な手法を用いてFinDeepResearchに関する広範な実験を行った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:21:56 GMT)
Generalist++: A Meta-learning Framework for Mitigating Trade-off in Adversarial Training [105.7] 対人訓練(AT)は、現在、ニューラルネットワークに対する最も効果的な防御である。
本稿では,汎用化目標を複数のサブタスクに分割し,それぞれを専用のベースラーナに割り当てる。
トレーニングの後半では、これらのパラメータを補間して、知識のあるグローバルな学習者を形成する。
このフレームワークをGeneralistと呼び、異なるアプリケーションシナリオに適した3つのバリエーションを紹介します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:47:54 GMT)
Trace Anything: Representing Any Video in 4D via Trajectory Fields [98.9] 軌道場 (Trajectory Field) は、各フレーム内の各ピクセルに時間の連続した3次元軌跡関数を割り当てる密集写像である。
我々は,1つのフィードフォワードパスで軌道場全体を予測するニューラルネットワークであるTrace Anythingを紹介する。
私たちは、新しいプラットフォームからのデータを含む大規模な4Dデータに基づいて、Trace Anythingモデルをトレーニングしました。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:59:04 GMT)
Variational Reasoning for Language Models [93.1] 本稿では,思考トレースを潜在変数として扱う言語モデルのための変分推論フレームワークを提案する。
GRPOを含むリジェクションサンプリングとバイナリリワードRLは局所的なフォワードKLの目的と解釈できることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:08:12 GMT)
MERIT: Multilingual Semantic Retrieval with Interleaved Multi-Condition Query [91.0] MERITは、インターリーブされたマルチ条件セマンティック検索のための最初の多言語データセットである。
本稿では,多条件セマンティック検索のための最初の多言語データセットであるMERITを紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:48:27 GMT)
ReSum: Unlocking Long-Horizon Search Intelligence via Context Summarization [86.6] LLM(Large Language Model)ベースのWebエージェントは、知識集約的なタスクに強いパフォーマンスを示す。
複数のエンティティ、絡み合った関係、不確実性の高い検索サイクルを含む複雑なクエリ。
本稿では,周期的文脈要約による不確定探索を可能にする新しいパラダイムであるReSumを紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:51:13 GMT)
BRIEF-Pro: Universal Context Compression with Short-to-Long Synthesis for Fast and Accurate Multi-Hop Reasoning [86.4] BRIEF-Proは、取得した文書から与えられたクエリに関する関連する証拠を簡潔な要約に蒸留する軽量圧縮機である。
幅広いシナリオで10kワードを超える拡張コンテキストの抽象的圧縮を実行するように訓練されている。
実験により、BRIEF-Proはより簡潔で関連する要約を生成し、小型で大規模でプロプライエタリな言語モデルでの性能を向上させることが示されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:57:45 GMT)
Towards Understanding Valuable Preference Data for Large Language Model Alignment [85.4] 大規模言語モデル(LLM)のアライメントは通常、人間の好みの比較から学習することで達成される。
新たに提案したTruncated Influence Function (TIF) を用いた検証データに対する個人の影響によるデータ品質の評価を行う。
この目的のために、我々はそれらを組み合わせ、様々なエラーソースをオフセットし、単純だが効果的なデータ選択ルールをもたらす。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:57:55 GMT)
MetaCaptioner: Towards Generalist Visual Captioning with Open-source Suites [84.4] 一般的なビジュアルキャプションは、一連のビジュアルキューをキャプションに統合し、様々なビジュアルドメインを扱う必要がある。
本稿では,新しいマルチエージェントコラボレーションワークフローであるCapFlowを提案する。
オープンソースモデルを利用することで、様々なドメインでGPT-4.1と同等のキャプション品質を89.5%のコストで達成することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:13:47 GMT)
The Role of Computing Resources in Publishing Foundation Model Research [84.2] 我々はこれらの資源と基礎モデル(FM)の科学的発展との関係を評価する。
我々は2022年から2024年にかけて発行された6517のFM論文をレビューし、計算資源が科学出力に与える影響について229人の第一著者を調査した。
計算量の増加は国家予算配分や引用と相関していることがわかったが,研究環境との強い相関はみられない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:50:45 GMT)
PlotCraft: Pushing the Limits of LLMs for Complex and Interactive Data Visualization [83.0] PlotCraftは、1kの挑戦的な視覚化タスクを特徴とする新しいベンチマークだ。
PlotCraftは7つのハイレベルな視覚化タスクを中心に構成されており、48の異なるチャートタイプを含んでいる。
単一ターン生成と多ターン改善の両方を多種多様なタスク複雑度にわたって体系的に評価するのは、これが初めてである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:14:39 GMT)
Synthesizing Agentic Data for Web Agents with Progressive Difficulty Enhancement Mechanisms [81.9] Webベースの「ディープリサーチ」エージェントは、オンラインツールとの長時間のインタラクションを通じてタスクに答える、複雑な問題の解決を目指している。
基礎となる言語モデルは、長い水平推論に最適化されないことが多いため、これらのタスクは依然として困難なままである。
複雑化を徐々に進めることで、疑問-答えのペアを生成する2段階のデータ合成パイプラインを導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:34:46 GMT)
Hard2Verify: A Step-Level Verification Benchmark for Open-Ended Frontier Math [80.5] 私たちは500時間以上の人的労力で生成された段階レベルの検証ベンチマークであるHard2Verifyを紹介します。
我々は29人の生成的批評家とプロセス報酬モデルを評価し、いくつかの点を超えて、オープンソースの検証者がクローズドソースモデルを評価することを実証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:50:54 GMT)
CL-Splats: Continual Learning of Gaussian Splatting with Local Optimization [80.3] 本稿では,スパースシーンキャプチャから3次元表現を漸進的に更新するCL-Splatを紹介した。
CL-Splatsは、シーン内のアップデートと静的コンポーネントをセグメント化する堅牢な変更検出モジュールを統合する。
本実験により, CL-Splats は, 最先端の再構築品質を向上し, 効率的な更新を実現することを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:29:23 GMT)
Semantic Communication Enabled Holographic Video Processing and Transmission [80.0] 本稿ではホログラフィビデオ通信の概要とホログラフィビデオ通信システムの要件について概説する。
提案アーキテクチャに基づいて,セマンティックサンプリング,ジョイントセマンティックチャネル符号化,セマンティック・アウェア・トランスミッションなどの重要な技術が設計されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:06:48 GMT)
Real-Time Motion-Controllable Autoregressive Video Diffusion [79.3] 本稿では,AR-Dragを提案する。このAR-Dragは,多様なモーション制御を備えたリアルタイム画像・ビデオ生成のための,RLで拡張された最初の数ステップのARビデオ拡散モデルである。
まず,基本動作制御をサポートするためのベースI2Vモデルを微調整し,さらに軌道ベース報酬モデルによる強化により改良する。
本設計では、自己学習機構を通じてマルコフ特性を保存し、ステップを選択的に分解することで訓練を加速する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:37:23 GMT)
Information-Theoretic Reward Modeling for Stable RLHF: Detecting and Mitigating Reward Hacking [78.7] 本稿では,インフォメーション・ボトルネックの原理に基づく情報理論報酬モデリングフレームワークを提案する。
InfoRMは、報酬の一般化を緩和するために、嗜好に無関係な情報をフィルタリングする。
IBLは分散レベルの正規化であり、そのような偏差を罰し、最適化の展望を効果的に拡張する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:51:59 GMT)
Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs [78.1] 本稿では拡散に基づく言語モデルの定量化に関する最初の体系的研究について述べる。
異常に大きなアクティベーション値によって特徴付けられるアクティベーションアウトリーチの存在を同定する。
我々は最先端のPTQ手法を実装し、包括的な評価を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:59:06 GMT)
STT-GS: Sample-Then-Transmit Edge Gaussian Splatting with Joint Client Selection and Power Control [77.6] Edge Gaussian splatting (EGS)は、分散クライアントからデータを集約し、エッジサーバでグローバルGSモデルをトレーニングする。
本稿では、異なるクライアントのビューコントリビューションを識別する新しいGS指向の目的関数を定式化する。
その結果,低サンプリング比でGS指向の目的を正確に予測できることが判明した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:20:47 GMT)
Towards Generalized Video Quality Assessment: A Weak-to-Strong Learning Paradigm [76.6] 映像品質評価(VQA)は、人間の視覚的知覚に合わせて映像の知覚的品質を予測することを目的としている。
支配的なVQAパラダイムは、人間のラベル付きデータセットによる教師付きトレーニングに依存している。
我々は、大規模な人ラベルデータセットに頼らずにVQAを進めるための新しいパラダイムとして、弱い対強学習(W2S)を探求する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:13:05 GMT)
RelTopo: Multi-Level Relational Modeling for Driving Scene Topology Reasoning [74.6] 道路トポロジー推論は自動運転にとって重要であり、効率的なナビゲーションと交通規制の遵守を可能にする。
既存の手法は通常、レーン検出またはレーン・トゥ・レーン(L2L)のトポロジー推論(英語版)に重点を置いており、しばしばこれらのタスクを共同で最適化するためにレーン・トゥ・トラッフィック・エレメント(L2T)の関係をテキスト化している。
人間は自然に道路要素認識と接続性推論の文脈的関係を利用するので、リレーショナルモデリングは知覚と推論の両方に有益であると主張する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:47:34 GMT)
SafeGuider: Robust and Practical Content Safety Control for Text-to-Image Models [74.1] テキスト・ツー・イメージのモデルは、安全対策を回避し、有害なコンテンツを生成できる敵のプロンプトに対して非常に脆弱である。
SafeGuiderは, 生成品質を損なうことなく, 堅牢な安全制御を実現するための2段階のフレームワークである。
SafeGuiderは攻撃成功率の最小化において例外的な効果を示し、様々な攻撃シナリオで最大速度は5.48%である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:53:37 GMT)
Complementary Information Guided Occupancy Prediction via Multi-Level Representation Fusion [73.1] カメラによる占有予測は、自動運転における3D知覚の主流のアプローチである。
textbfCIGOccはマルチレベル表現融合に基づく2段階の占有予測フレームワークである。
textbfCIGOccは、入力画像からセグメンテーション、グラフィックス、深さの特徴を抽出し、変形可能なマルチレベル融合機構を導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:37:33 GMT)
Identifying Hard Noise in Long-Tailed Sample Distribution [71.8] NLT(Noisy Long-Tailed Classification)を紹介する。
ほとんどのノイズ除去法は、ハードノイズを特定するのに失敗する。
我々はH2E(Hard-to-Easy)と呼ばれる反復的な雑音学習フレームワークを設計する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:47:03 GMT)
Two Heads Are Better Than One: Audio-Visual Speech Error Correction with Dual Hypotheses [71.3] 本稿では,音声視覚音声認識(AVSR)における生成誤り訂正(GER)フレームワークの新たなパラダイムを提案する。
我々のフレームワークであるDualHypは、独立した自動音声認識(ASR)モデルと視覚音声認識(VSR)モデルから独立したN-best仮説を構成するために、大規模言語モデル(LLM)を強制する。
我々のフレームワークは、標準のASRベースラインよりもLRS2ベンチマークで57.7%のエラー率を獲得していますが、シングルストリームのGERアプローチでは10%のゲインしか達成できません。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:27:16 GMT)
Generative Universal Verifier as Multimodal Meta-Reasoner [71.3] Generative Universal Verifierは、視覚言語モデルと統合マルチモーダルモデルにおける次世代マルチモーダル推論のために設計された新しい概念とプラグインである。
ViVerBenchは、マルチモーダル推論における視覚的結果を評価するために、16のカテゴリにまたがる重要なタスクのベンチマークである。
OmniVerifier-7Bは、ユニバーサルビジュアル検証のために訓練された最初のオムニ対応生成検証器である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:59:24 GMT)
MedREK: Retrieval-Based Editing for Medical LLMs with Key-Aware Prompts [70.6] 本稿では,情報誘導のための注目型プロンプトエンコーダと正確なマッチングのための共有クエリキーモジュールを統合した検索ベースの編集フレームワークであるMedREKを提案する。
各種医用ベンチマークの結果から,MedREKは異なるコアメトリクス間で優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:50:33 GMT)
Uni-MMMU: A Massive Multi-discipline Multimodal Unified Benchmark [69.8] 統一マルチモーダルモデルは、視覚的理解と生成を共同で行うことを目的としているが、現在のベンチマークでは、その真の統合を検査することはめったにない。
提案するUni-MMMUは、8つの推論中心領域にまたがる生成と理解の双方向の相乗効果を拡大する総合的なベンチマークである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:10:35 GMT)
Thompson Sampling via Fine-Tuning of LLMs [69.8] 我々は,スケーラブルな大規模獲得関数を必要としないトンプソンサンプリングに基づく代替案を提案する。
我々のアプローチであるThompson Smpling via Finening (ToSFiT) は、プロンプト条件付き言語モデルに埋め込まれた事前知識を活用し、後方に向けて漸進的に適応する。
分析の結果,ToSFiTアルゴリズムの基盤となる極大性原理の後続確率への注意的適応が重要であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:13:59 GMT)
VIST3A: Text-to-3D by Stitching a Multi-view Reconstruction Network to a Video Generator [69.7] テキスト・ビデオ・ジェネレータは「デコーダ」として3次元再構成システムと組み合わせることができる
私たちは、VIST3Aという、まさにそれを行う一般的なフレームワークを紹介します。
ビデオジェネレータと3次元再構成モデルを用いたVIST3A手法の評価を行った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:55:08 GMT)
Personalized Learning Path Planning with Goal-Driven Learner State Modeling [69.0] パーソナライズされた学習パスのための新しいフレームワークであるPxploreを紹介する。
構造化学習状態モデルと,抽象目的を計算可能な信号に変換する自動報酬関数を設計する。
実験は、コヒーレントでパーソナライズされた目標駆動学習パスを生成する上で、Pxploreの有効性を検証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:59:49 GMT)
Improving Transferability of Adversarial Examples via Bayesian Attacks [68.9] 敵の例は未知のディープニューラルネットワーク(DNN)への攻撃を可能にする
本稿では,ベイズ式をモデルパラメータとモデル入力の両方に組み込むことで,逆例の転送性を向上させる。
実験により,本手法がトランスファーベース攻撃における新たな最先端技術を実現することを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:23:56 GMT)
RECODE: Reasoning Through Code Generation for Visual Question Answering [68.9] 我々は、検証可能な視覚的推論のための新しいモダリティとして、視覚を実行可能コードにリバースエンジニアリングするプロセスであるデレンダリングを活用することを提案する。
我々の研究は、実行可能コードにおける視覚的認識の基盤が、より正確で検証可能なマルチモーダル推論への新たな道を提供することを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:05:37 GMT)
PRISM: Self-Pruning Intrinsic Selection Method for Training-Free Multimodal Data Selection [68.8] ビジュアルインストラクションチューニングは、事前訓練されたマルチモーダル大言語モデルに人間の指示に従うように適応する。
PRISMは、効率的な視覚的命令選択のための最初のトレーニング不要のフレームワークである。
データ選択とモデルチューニングのエンドツーエンドの時間を従来のパイプラインの30%に短縮する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:10:40 GMT)
LLMs Can Get "Brain Rot"! [68.1] ジャンクウェブテキストへの連続曝露は、大規模言語モデル(LLM)の持続的認知低下を誘導する
実Twitter/Xコーパスで制御された実験を行い、ジャンクと逆制御されたデータセットを構築します。
その結果、データ品質がLLM能力の崩壊の原因であることを示す重要な多視点的証拠が得られた。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:28:49 GMT)
Training LLM Agents to Empower Humans [67.8] 本稿では,人間のエンパワーメントの最大化に基づく支援言語モデルのチューニング手法を提案する。
我々のエンパワーメント最大化手法であるEmpowerは、オフラインのテキストデータのみを必要とする。
我々は,Empowerで訓練されたエージェントが,プログラミング問題に挑戦する人間プログラマの成功率を平均192%向上させることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:09:33 GMT)
Higher Satisfaction, Lower Cost: A Technical Report on How LLMs Revolutionize Meituan's Intelligent Interaction Systems [67.2] 本稿では,産業アプリケーションに適したインテリジェントインタラクションシステムであるWOWServiceを紹介する。
LLMとマルチエージェントアーキテクチャの統合により、WOWServiceは自律的なタスク管理と協調的な問題解決を可能にします。
WOWServiceはMeituan App上にデプロイされ、主要なメトリクスの大幅な向上を実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:35:51 GMT)
NeuroRVQ: Multi-Scale EEG Tokenization for Generative Large Brainwave Models [66.9] 我々は、コードブックベースのトークン化装置を中心としたスケーラブルな大脳波モデル(LBM)であるNeuroRVQを紹介する。
我々のトークンライザは, (i) フル周波数のニューラルスペクトルを捕捉するマルチスケール特徴抽出モジュール, (ii) 高精細符号化のための階層的残留ベクトル量子化(RVQ)コードブック, (iii) 効率的なトレーニングのためのEEG信号位相および振幅認識損失関数を統合する。
実験の結果,NeuroRVQは再建誤差を低くし,様々な下流タスクにおいて既存のLBMよりも優れることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:26:52 GMT)
DIP-R1: Deep Inspection and Perception with RL Looking Through and Understanding Complex Scenes [65.9] 我々は,MLLMの視覚知覚能力を高めるために,DIP-R1(Deep Inspection and Perception with RL)という新しいフレームワークを開発した。
DIP-R1は、3つのシンプルなルールベースの報酬モデリングを通じて、MLLMをビジュアルシーンの詳細な検査を通じてガイドする。
本研究は,RLをMLLMに組み込むことにより,複雑な実世界の知覚タスクにおける能力向上の可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:19:24 GMT)
MATRIX: Multimodal Agent Tuning for Robust Tool-Use Reasoning [65.2] マルチモーダル軌道を自動的に合成する視覚中心型エージェントチューニングフレームワークを開発した。
また、自動生成された11Kの選好ペアであるPref-Xについても紹介する。
Agent-X、GTA、GAIAの3つのベンチマークで、MATRIXはオープンソースとクローズドソースの両方のVLMを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:17:07 GMT)
NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models with Discrete Flow Matching [64.1] NExT-OMNI(英語版)は、離散フローパラダイムによる統一モデリングを実現するオープンソース・オムニモーダル・ファンデーション・モデルである。
NExT-OMNIは、大規模なインターリーブ付きテキスト、画像、ビデオ、オーディオデータに基づいて訓練され、マルチモーダル生成および理解ベンチマーク上で競合するパフォーマンスを提供する。
さらなる研究を進めるために、トレーニングの詳細、データプロトコル、およびコードとモデルチェックポイントの両方をオープンソース化する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:25:18 GMT)
SafeSearch: Automated Red-Teaming for the Safety of LLM-Based Search Agents [63.7] 我々は、低品質な検索結果の出現率と、エージェントの動作を誤る可能性を実証する2つの実験を行った。
この脅威に対処するため、私たちは、体系的、スケーラブルで、コスト効率のよい自動化されたレッドチームフレームワークを導入しました。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:32:00 GMT)
Quantize What Counts: More for Keys, Less for Values [63.5] 大規模言語モデル(LLM)は、キーバリュー(KV)キャッシュに支配される推論時のメモリボトルネックに悩まされる。
本稿ではトランスフォーマーモデルの内在幾何学における混合精度KV量子化を固定する2つの定理を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:03:13 GMT)
CoT-Evo: Evolutionary Distillation of Chain-of-Thought for Scientific Reasoning [63.4] 先進的な大規模言語モデル(LLM)からのCoT蒸留は、一般的な推論タスクにおいて有効であることが証明されている。
しかし、先進的なモデルでさえ、誤った、あるいは表面的な推論をしばしば生み出す科学領域では苦戦している。
この問題を解決するために, 進化的CoT蒸留フレームワークであるCoT-Evoを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:29:56 GMT)
Your AI, Not Your View: The Bias of LLMs in Investment Analysis [62.4] 金融において、Large Language Models (LLMs) は、事前訓練されたパラメトリック知識とリアルタイム市場データとの相違から生じる、頻繁な知識紛争に直面している。
これらの対立は、モデル固有のバイアスが制度的目的と誤認される現実世界の投資サービスにおいて特に問題となる。
本研究では,このような紛争シナリオにおける創発的行動を調べるための実験的枠組みを提案し,投資分析におけるバイアスの定量的分析を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:31:15 GMT)
Prompt-based Adaptation in Large-scale Vision Models: A Survey [62.1] Visual Prompting (VP) と Visual Prompt Tuning (VPT) は、大規模なビジョンモデルに適応するための完全な微調整の軽量な代替品として登場した。
既存の手法を学習可能、生成可能、学習不能のプロンプトに分類する分類法を提供する。
医療画像、3Dポイントクラウド、ビジョン言語タスクなど、さまざまな領域にわたるPAの統合について検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:14:50 GMT)
Don't Be Greedy, Just Relax! Pruning LLMs via Frank-Wolfe [61.7] State-of-the-art Large Language Model (LLM) プルーニング手法は階層的に動作し、階層ごとのプルーニングエラーを最小限に抑え、完全な再トレーニングを回避する。
既存の手法は、刈り上げ対象の重量相互作用を無視する欲求凸に依存する。
提案手法は, 層ごとのプルーニング誤差を大幅に低減し, 最先端のGPTアーキテクチャにおいて高いベースラインを達成し, メモリ効率を保っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:13:44 GMT)
RealEngine: Simulating Autonomous Driving in Realistic Context [60.6] RealEngineは3Dシーン再構成と新しいビュー合成技術を統合する新しい運転シミュレーションフレームワークである。
実世界のマルチモーダルセンサーデータを活用することで、RealEngineはバックグラウンドシーンとフォアグラウンドトラフィック参加者を別々に再構築し、非常に多様な現実的なトラフィックシナリオを実現する。
RealEngineは、非反応性シミュレーション、安全性テスト、マルチエージェントインタラクションの3つの重要な駆動シミュレーションカテゴリをサポートしている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:56:05 GMT)
MMLongCite: A Benchmark for Evaluating Fidelity of Long-Context Vision-Language Models [60.0] 長文シナリオにおけるLVLMの忠実度を評価するためのベンチマークであるMMLongCiteを紹介する。
MMLongCiteは6つのコンテキストの長さ間隔にまたがる8つのタスクから構成されており、テキスト、画像、ビデオを含む様々なモダリティが組み込まれている。
最先端のLVLMの評価は、長いマルチモーダルコンテキストを扱う際の忠実度に限界があることを明らかにする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:22:03 GMT)
ProReason: Multi-Modal Proactive Reasoning with Decoupled Eyesight and Wisdom [59.9] 本稿ではProReasonという新しいビジュアル推論フレームワークを紹介する。
ProReasonは、分離されたビジョン推論機能とマルチランプロアクティブな知覚を備えている。
実験の結果, ProReasonは様々なベンチマークにおいて, 既存のマルチステップ推論フレームワークよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:56:42 GMT)
EvoTest: Evolutionary Test-Time Learning for Self-Improving Agentic Systems [59.7] 現在のAIエージェントの基本的な制限は、テスト時に複雑なスキルをその場で学べないことだ。
EvoTestは,エージェントの微調整や勾配を伴わずにエージェントを改良する,進化的テストタイム学習フレームワークである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:16:28 GMT)
R$^2$ec: Towards Large Recommender Models with Reasoning [59.3] R$2$ecは、本質的な推論能力を持つ統一された大型レコメンデータモデルである。
R$2$ecは、推論チェーン生成と効率的なアイテム予測の両方を単一のモデルでサポートするデュアルヘッドアーキテクチャを導入している。
注釈付き推論データの欠如を克服するため、強化学習フレームワークであるRecPOを設計する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:22:45 GMT)
How Blind and Low-Vision Users Manage Their Passwords [58.8] 本稿では,Blind and Low-Vision (BLV) ユーザがパスワード管理にどのように取り組むかを検討する。
すべての参加者がパスワード管理をある程度利用していることが分かりました。
セキュリティ上のアドバンテージ — 強力なランダムなパスワードを生成する — は、主にアクセシビリティの欠如によって回避された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:33:45 GMT)
Novel Class Discovery for Point Cloud Segmentation via Joint Learning of Causal Representation and Reasoning [58.3] ポイントクラウドのための新しいクラスディスカバリ(3D-NCD)に焦点を当てる
このタスクの鍵は、ポイント表現とベースクラスラベルの正確な相関を設定することである。
本稿では,因果表現と推論の融合学習法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:54:41 GMT)
Text Anomaly Detection with Simplified Isolation Kernel [58.1] 2段階のアプローチでは、事前訓練された大きな言語モデル埋め込みと異常検出を組み合わせている。
大規模言語モデルによって抽出された高次元密度埋め込みは、かなりのメモリ要件と高い計算時間のために課題を提起する。
本稿では,高次元密度埋め込みを低次元スパース表現にマッピングする簡易分離カーネル(SIK)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:35:54 GMT)
Grounding Long-Context Reasoning with Contextual Normalization for Retrieval-Augmented Generation [58.0] キー値抽出における表面的選択が精度と安定性のシフトを引き起こすことを示す。
生成前の文脈表現を適応的に標準化する戦略であるコンテキスト正規化を導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:28:25 GMT)
A Comprehensive Survey on Data Augmentation [57.9] データ拡張(Data augmentation)は、既存のデータサンプルを操作することによって高品質な人工データを生成する一連のテクニックである。
本調査では,異なる共通データモダリティのためのデータ拡張技術を含む,より啓蒙的な分類法を提案する。
統一的帰納的アプローチにより、5つのデータモダリティにまたがるデータ拡張手法を分類する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:11:11 GMT)
Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully Open MLLMs [57.5] Honey-Data-15Mは、約1500万のQAペアからなる新しいSFTデータセットである。
データキュレーションパイプラインであるHoneyPipeとその基盤となるフレームワークであるDataStudioは、データキュレーションのための透過的で適応可能な方法論を提供する。
実験の結果、Bee-8Bは完全にオープンなMLLMのための新しい最先端(SOTA)を確立し、InternVL3.5-8Bのような最近のセミオープンモデルに匹敵する性能を実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:52:59 GMT)
FlashAdventure: A Benchmark for GUI Agents Solving Full Story Arcs in Diverse Adventure Games [56.8] 我々はFlashAdventureを紹介した。これは、フルストーリーのアーク補完をテストするために設計された、34のFlashベースのアドベンチャーゲームのベンチマークである。
また,ゲームプレイの自動評価装置であるCUA-as-a-Judgeと,長期記憶を利用したエージェントフレームワークであるCOASTを提案する。
実験では、現在のGUIエージェントがフルストーリーのアークに苦しむのに対して、COASTは観察と振る舞いのギャップを埋めることでマイルストーンの完了を改善する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:33:27 GMT)
Towards Unified Multimodal Misinformation Detection in Social Media: A Benchmark Dataset and Baseline [56.8] 詐欺の2つの主要な形態は、人造誤報とAI生成コンテンツである。
両形態の偽造を扱うためのフレームワークであるUMFDet(Unified Multimodal Fake Content Detection)を提案する。
UMFDetは、両方の誤情報型に対して堅牢で一貫したパフォーマンスを実現し、特殊ベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:52:13 GMT)
I$^3$-MRec: Invariant Learning with Information Bottleneck for Incomplete Modality Recommendation [56.6] textbfIncomplete textbfModality textbfRecommendation の textbfInformation ボトルネック原理を用いて学習する textbfI$3$-MRec を紹介する。
それぞれのモダリティを異なる意味環境として扱うことで、I$3$-MRecは、優先指向の表現を学習するために不変リスク最小化(IRM)を採用する。
I$3$-MRecは、様々なモダリティ欠落シナリオにおいて、既存の最先端MSSメソッドを一貫して上回る
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:10:53 GMT)
Vgent: Graph-based Retrieval-Reasoning-Augmented Generation For Long Video Understanding [56.5] Vgentは、長いビデオ理解のためにLVLMを強化するグラフベースの検索推論拡張生成フレームワークである。
我々は,3つの長ビデオ理解ベンチマークを用いて,様々なオープンソースLVLMを用いてフレームワークの評価を行った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:14:58 GMT)
CymbaDiff: Structured Spatial Diffusion for Sketch-based 3D Semantic Urban Scene Generation [55.7] フリーハンドスケッチと衛星画像から3D屋外セマンティックシーンを生成するための,最初の大規模ベンチマークであるSketchSem3Dを紹介する。
また,シーン生成における空間コヒーレンスを大幅に向上させるCyinder Mamba Diffusion (CymbaDiff)を提案する。
CymbaDiffは、優れたセマンティック一貫性、空間リアリズム、およびデータセット間の一般化を実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:47:00 GMT)
Kernel Representation and Similarity Measure for Incomplete Data [55.6] 不完全データの類似性を測定することは、Webマイニング、レコメンデーションシステム、ユーザー行動分析において基本的な課題である。
従来のアプローチでは、不完全なデータを破棄するか、事前処理のステップとして計算を実行するかのいずれかであり、情報損失と類似性のバイアスが生じる。
本稿では,カーネルの特徴空間における不完全データ間の類似性を,元の空間における明示的な計算なしで直接計算する,新しい類似度尺度を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:41:23 GMT)
Hints of Prompt: Enhancing Visual Representation for Multimodal LLMs in Autonomous Driving [55.6] Hints of Prompt (HoP) フレームワークを提案する。
これらのヒントはHint Fusionモジュールを通じて融合され、限られたドメインデータで駆動関連表現をキャプチャすることで視覚表現を豊かにする。
大規模な実験により、HoPフレームワークの有効性が確認され、すべての主要な指標において、従来の最先端メソッドよりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:13:17 GMT)
MotionAgent: Fine-grained Controllable Video Generation via Motion Field Agent [55.2] テキスト誘導画像-映像生成のための微粒なモーション制御を実現するMotionAgentを提案する。
キーとなる技術は、テキストプロンプトの動作情報を明示的な運動場に変換するモーション・フィールド・エージェントである。
我々はVBenchのサブセットを構築し、テキストと生成されたビデオの動作情報のアライメントを評価する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:53:56 GMT)
Confidence as a Reward: Transforming LLMs into Reward Models [55.0] Confidence-as-a-Reward (CRew) は、モデルの最終回答に対するトークンレベルの信頼を報酬のプロキシとして利用する、トレーニング不要の手法である。
CRew は MATH500 および RewardMATH ベンチマークにおいて,既存のトレーニングフリー報酬手法よりも優れていることを示す。
本稿では,信頼度スコアと正当性信号を組み合わせた選好データを構成する訓練戦略であるCRew-DPOを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:51:47 GMT)
Fact-R1: Towards Explainable Video Misinformation Detection with Deep Reasoning [54.6] 既存の方法は、しばしば固いテンプレートに過度に適合し、偽りのコンテンツに対する深い推論を欠いている。
FakeVVは10万以上のビデオテキスト対と微粒で解釈可能なアノテーションからなる大規模ベンチマークである。
また、深い推論と協調ルールに基づく強化学習を統合するフレームワークであるFact-R1を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:50:39 GMT)
MEGC2025: Micro-Expression Grand Challenge on Spot Then Recognize and Visual Question Answering [54.1] 顔小表情(英: Facial micro-Expression、ME)は、感情を経験するときに自然に発生する顔の不随意運動である。
近年、ME認識、スポッティング、生成の領域でかなりの進歩を遂げている。
MEグランドチャレンジ(MEGC)2025では、これら研究の方向性を反映した2つのタスクが導入されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:45:59 GMT)
LLM/Agent-as-Data-Analyst: A Survey [54.0] 大規模言語モデル(LLM)とデータ分析のためのエージェント技術は、学術と産業の両方に大きな影響を与えている。
この技術進化は、インテリジェントなデータ分析エージェントのための5つの重要な設計目標、すなわちセマンティック・アウェア・デザイン、ハイブリッド統合、自律パイプライン、ツールの拡張されたモダリティ、オープンワールドタスクのサポートをさらに強化する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:55:52 GMT)
Mamba Can Learn Low-Dimensional Targets In-Context via Test-Time Feature Learning [54.0] Mambaは、強い経験的性能を持つ線形時間列モデルである。
単一インデックスモデル $y approx g_* (langle boldsymbolbeta, boldsymbolx rangle)$ の文脈内学習について検討する。
勾配に基づく手法で事前学習したMambaは,テスト時間特徴学習によって効率的なICLを実現することができることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:49:35 GMT)
Ctrl-World: A Controllable Generative World Model for Robot Manipulation [53.7] 汎用ロボットポリシーは、幅広い操作スキルを実行することができる。
未知の物体や命令で 彼らの能力を評価し 改善することは 重要な課題です
世界モデルは、イマジネーション空間内でポリシーの展開を可能にすることで、有望でスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:46:49 GMT)
Achieving Logarithmic Regret in KL-Regularized Zero-Sum Markov Games [53.4] Reverse Kullback-Leibler (KL) 正則化の下で, サンプル効率の向上を実現するアルゴリズムを開発し, 解析する。
我々は,2プレイヤーゼロサムマトリクスゲームとマルコフゲームの両方について検討する:マトリックスゲームでは,楽観的なボーナス付きベストレスポンスサンプリングに基づくアルゴリズムOMGを提案し,アルゴリズムSOMGを用いてマルコフゲームに拡張する。
両アルゴリズムは、標準の$widetildemathcalO(sqrtT)に加えて、KL正規化強度$beta$と共に逆スケールする$T$の対数後悔を実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:00:54 GMT)
Message Passing on the Edge: Towards Scalable and Expressive GNNs [53.1] 本稿では,エッジベースのカラーリファインメントテストであるEB-1WLと,対応するGNNアーキテクチャであるEB-GNNを提案する。
我々のアーキテクチャは千葉・西関の古典的三角形計数アルゴリズムに着想を得ており、メッセージパッシング中に三角形を明示的に用いている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:45:17 GMT)
Edit-Your-Interest: Efficient Video Editing via Feature Most-Similar Propagation [53.1] Edit-Your-Interestはテキスト駆動のゼロショットビデオ編集手法である。
フルシーケンス・テンポラル・モデリング手法に比べて計算オーバーヘッドを低減させる。
効率性と視覚的忠実性の両方において最先端の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:55:32 GMT)
Can an Individual Manipulate the Collective Decisions of Multi-Agents? [53.0] M-Spoilerは、マルチエージェントシステム内のエージェントインタラクションをシミュレートして、対向サンプルを生成するフレームワークである。
M-スポイラーは、敵対的サンプルの最適化を積極的に支援するスタブボーン剤を導入した。
本研究は,マルチエージェントシステムにおける個々のエージェントの知識によって引き起こされるリスクを検証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:53:58 GMT)
The Art of Scaling Reinforcement Learning Compute for LLMs [52.7] 強化学習(RL)は、大規模言語モデルの訓練の中心となっている。
計算予算の急激な増加にもかかわらず、RL計算のスケーリングにおけるアルゴリズム改善の評価方法に関する原則的な理解は存在しない。
我々は,約40万時間以上のGPU時間を有する,最初の大規模体系的な研究を提示する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:43:03 GMT)
A Tale of LLMs and Induced Small Proxies: Scalable Agents for Knowledge Mining [52.6] Falconerは、大規模言語モデルとスケーラブルな知識マイニングのための軽量プロキシモデルを組み合わせたフレームワークである。
LLMはプランナーとして機能し、ユーザ命令を実行可能なパイプラインに分解し、アノテータとして、小さなプロキシをトレーニングするための監督を生成する。
実験の結果、Falconerは命令追従精度で最先端のLCMと密に一致し、推論コストを最大90%削減した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:21:03 GMT)
MSEarth: A Multimodal Scientific Dataset and Benchmark for Phenomena Uncovering in Earth Science [52.4] 我々は、高品質でオープンアクセスの科学出版物からキュレートされたマルチモーダルな科学ベンチマークであるMSEarthを紹介する。
MSEarthは、大気、低温圏、水圏、リソスフェア、生物圏という、地球科学の主要な5つの球体を包含している。
MSEarthは、科学的なフィギュアキャプション、複数の選択質問、オープンな推論課題など、さまざまなタスクをサポートしている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:04:40 GMT)
On Robustness of Vision-Language-Action Model against Multi-Modal Perturbations [52.1] 視覚-言語-アクション(VLA)モデルでは、現実世界の摂動に対する堅牢性は、デプロイに不可欠である。
本稿では,VLA入力と出力の摂動に対するロバストVLAを提案する。
LIBEROの実験では、ロバストVLAは、pi0バックボーンで12.6%、OpenVLAバックボーンで10.4%のベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:40:46 GMT)
NAPPure: Adversarial Purification for Robust Image Classification under Non-Additive Perturbations [51.8] 非付加的な摂動を処理できるNAPPureと呼ばれる拡張逆浄化フレームワークを提案する。
GTSRBとCIFAR-10データセットの実験により、NAPPureは非付加的な摂動に対する画像分類モデルの堅牢性を大幅に向上させることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:05:59 GMT)
Verifying a Sparse Matrix Algorithm Using Symbolic Execution [51.6] 従来の単体テストと同様、シンボリックな実行を使ってテストを記述する方法について概説する。
より強力な検証保証を提供し、この方法論をスパース行列アルゴリズムに適用する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:23:32 GMT)
Constructing Confidence Intervals for Average Treatment Effects from Multiple Datasets [51.2] 本稿では、複数の観測データセットからATEを推定し、有効なCIを提供する新しい手法を提案する。
本手法は観測データセットの仮定をほとんど行わず,医学的実践に広く応用できる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:01:52 GMT)
Unlocking Out-of-Distribution Generalization in Transformers via Recursive Latent Space Reasoning [51.0] 本研究では,GSM8Kスタイルのモジュラー演算をテストベッドとして用いたTransformerネットワークにおけるアウト・オブ・ディストリビューション(OOD)の一般化について検討する。
我々は,OOD一般化の強化を目的とした4つのアーキテクチャ機構のセットを紹介し,検討する。
我々はこれらの実験結果を詳細な機械論的解釈可能性分析で補完し、これらのメカニズムがOOD一般化能力をいかに高めるかを明らかにする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:03:59 GMT)
AutoPR: Let's Automate Your Academic Promotion! [50.9] 本稿では,研究論文を正確な,エンゲージメント,タイムリーな公開コンテンツに変換する新しいタスクであるAutoPRを紹介する。
PRAgentは、AutoPRを3段階で自動化するマルチエージェントフレームワークである。コンテンツ抽出、協調合成、標準の最適化、トーン、最大リーチのためのタグ付けのプラットフォーム固有の適応である。
結果は,AutoPRをトラクタブルで測定可能な研究課題と位置づけ,スケーラブルで影響力のある学術的コミュニケーションのためのロードマップを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:32:50 GMT)
A Simple Framework for Open-Vocabulary Zero-Shot Segmentation [50.6] SimZSSはオープン語彙のZero-Shotセグメンテーションのためのフレームワークである。
テキストと言語知識の離散的な性質を利用して、字幕内の局所的な概念をピンポイントする。
SimZSSは,8つのベンチマークデータセットのうち7つについて,15分以内で最先端の結果を達成している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:55:28 GMT)
PoE-World: Compositional World Modeling with Products of Programmatic Experts [50.4] 世界がどのように機能するかを学ぶことは、複雑な環境に適応できるAIエージェントの構築の中心である。
LLM(Large Language Models)を用いたプログラム合成の最近の進歩は、ソースコードとして表現された世界モデルを学ぶための代替アプローチを提供する。
このアプローチは,数個の観測結果から複雑な世界モデルを学習できることを示し,これらをモデルベース計画エージェントに組み込むことで,AtariのPongとMontezumaのRevengeの未確認レベルに対する効率的な性能と一般化を実証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:18:00 GMT)
Assessing the robustness of heterogeneous treatment effects in survival analysis under informative censoring [50.2] 臨床研究ではドロップアウトが一般的で、副作用やその他の理由で患者の半数以上が早期に退院する。
ドロップアウトが有益な場合、治療効果の推定値にもバイアスがかかるため、検閲バイアスが導入される。
検閲バイアスに直面した場合の生存分析における条件平均処理効果推定のロバスト性を評価するための仮定リーンフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:51:17 GMT)
LIBERO-Plus: In-depth Robustness Analysis of Vision-Language-Action Models [49.9] 制御された摂動を7次元にわたって導入することにより,系統的な脆弱性解析を行う。
モデルは、カメラの視点やロボットの初期状態を含む摂動要因に対して極端に敏感である。
驚くべきことに、モデルは言語の変化にほとんど敏感であり、さらなる実験により、モデルは言語命令を完全に無視する傾向があることが明らかになった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:51:36 GMT)
PhysMaster: Mastering Physical Representation for Video Generation via Reinforcement Learning [49.9] 現代のビデオ生成モデルは、視覚的にリアルなビデオを生成することができるが、物理法則に従わないことが多い。
本稿では,物理認識力を高めるため,映像生成モデルを導くための表現として,物理知識を捉えたPhysMasterを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:59:59 GMT)
SAIL-Embedding Technical Report: Omni-modal Embedding Foundation Model [49.7] マルチモーダル埋め込みモデルは、多様なクロスモーダルタスクに力を与える情報的統一表現を提供することを目的としている。
SAIL-Embeddingはオムニモーダルな埋め込み基盤モデルで、これらの問題に適切なトレーニング戦略とアーキテクチャ設計を通して対処する。
具体的には、コンテンツ対応プログレッシブトレーニングは、さまざまな下流タスクへのモデルの適応性を高め、より豊かなクロスモーダル習熟度を習得することを目的としている。
協調型レコメンデーション強化トレーニングは、シークエンス・ツー・テムとID・ツー・テムの埋め込みから知識を抽出することにより、レコメンデーションシナリオのマルチモーダル表現をさらに適応させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:46:29 GMT)
VR-Thinker: Boosting Video Reward Models through Thinking-with-Image Reasoning [49.6] マルチモーダル報酬モデル(RM)は、視覚生成モデルのトレーニング後を大幅に改善した。
VideoReward Thinker (VR-Thinker)は、RMに視覚的推論操作と視覚的メモリウィンドウを備えた思考とイメージのフレームワークである。
提案手法は,映像選好ベンチマークにおいて,オープンソースモデル間で最先端の精度を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:25:47 GMT)
Optimizing Storage Overhead of User Behavior Log for ML-embedded Mobile Apps [49.4] マシンラーニング(ML)モデルは、パーソナライズされたインテリジェントなサービスを実現するために、現代モバイルアプリにますます統合されています。
AdaLogはML組み込みモバイルアプリのユーザビヘイビアログのストレージ効率を改善するように設計されている。
AdaLogは、システムのオーバーヘッドを最小限にして、振る舞いログのサイズを19%から44%削減する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:03:17 GMT)
Cyber-Resilient System Identification for Power Grid through Bayesian Integration [49.3] 電力網は、ますます進化し続けるサイバー脅威の状況下で、リアルタイムな状況認識を必要としている。
この研究は、スナップショットベースの手法とベイジアン統合による時系列モデルを組み合わせたシステム識別を進歩させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:32:09 GMT)
Efficient Prediction of SO(3)-Equivariant Hamiltonian Matrices via SO(2) Local Frames [49.2] 我々は、電子構造計算を高速化するためにハミルトン行列を予測することを考える。
ハミルトン行列の対角線外ブロックとSO(2)局所フレームの関係から、QHNetV2を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:34:05 GMT)
Multimodal Fusion and Vision-Language Models: A Survey for Robot Vision [49.1] マルチモーダル融合法と視覚言語モデルの適用と進歩を体系的に検討する。
セマンティックシーン理解タスクでは、エンコーダデコーダフレームワーク、アテンションベースアーキテクチャ、グラフニューラルネットワークに融合アプローチを分類する。
クロスモーダルアライメント、効率的な融合、リアルタイムデプロイメント、ドメイン適応など、現在の研究における重要な課題を特定します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:42:34 GMT)
RockNet: Distributed Learning on Ultra-Low-Power Devices [49.0] 本稿では,超低消費電力ハードウェアに適した新しいTinyML法であるRockNetを提案する。
CPSは複数のデバイスで構成されているため,機械学習と無線通信を統合した分散学習手法を設計する。
この結果から,分散ML,分散コンピューティング,通信の緊密な統合により,最先端の精度で超低消費電力ハードウェアのトレーニングが可能となった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:09:30 GMT)
Doing Things with Words: Rethinking Theory of Mind Simulation in Large Language Models [48.8] 本研究では,GABM(Generative Agent-Based Model)コンコーディアが実世界のシミュレーション環境において,効果的に心の理論(ToM)をモデル化できるかどうかを考察する。
我々は,このフレームワークがToM能力のシミュレートに成功しているかどうか,ソーシャルコンテキストから真の推論を行うことで,GPT-4がタスクを遂行できるかどうかを評価する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:48:31 GMT)
Axis-level Symmetry Detection with Group-Equivariant Representation [48.8] 最近の熱マップに基づくアプローチは対称性軸のポテンシャル領域をローカライズすることができるが、個々の軸を特定する精度に欠けることが多い。
本稿では,2つの最も一般的な対称性-反射と回転の軸レベル検出のための新しい枠組みを提案する。
提案手法は最先端の性能を達成し,既存手法より優れている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:58:20 GMT)
Sampling-Efficient Test-Time Scaling: Self-Estimating the Best-of-N Sampling in Early Decoding [48.6] テストタイムスケーリングは、推論中に追加の計算リソースを割り当てることで、大きな言語モデルのパフォーマンスを向上させる。
Best-of-N (BoN) サンプリングはサンプリングベースの一般的なスケーリング手法である。
我々は,全Nサンプルの完全生成を回避する復号法であるセルフトランケーションBest-of-N(ST-BoN)を提案する。
コスト面では、ST-BoNはFull-BoNと同じ性能を達成し、計算コストを70%-80%削減し、同じコストで3~4ポイント精度を向上させることができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:14:57 GMT)
UniMoE-Audio: Unified Speech and Music Generation with Dynamic-Capacity MoE [48.2] UniMoE-Audioは、新しいDynamic-Capacity Mixture-of-Experts (MoE)フレームワークにおける統一された音声および音楽生成モデルである。
データ不均衡に対処するために,3段階の研修カリキュラムを導入する。
UniMoE-Audioは、主要な音声および音楽生成ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:30:25 GMT)
Axial Neural Networks for Dimension-Free Foundation Models [48.1] 物理データに基づく基礎モデルのトレーニングは、異なるシステム間で異なる次元を持つため、ユニークな課題となる。
従来のアプローチでは、最大次元を固定するか、異なる次元に対して別のエンコーダを使用するかのいずれかであり、結果として非効率である。
本稿では,Deep SetsやGraph Neural Networksなどのパラメータ共有構造に着想を得た,次元に依存しないニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:25:20 GMT)
Knowledge Reasoning Language Model: Unifying Knowledge and Language for Inductive Knowledge Graph Reasoning [48.0] 我々は,LLM知識とKGコンテキストの統一的な協調を実現する知識推論言語モデル(KRLM)を提案する。
25個の実世界のインダクティブKGRデータセットの大規模な実験結果は、提案したKRLMの顕著な優位性を示している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:11:58 GMT)
Do LLM Agents Have Regret? A Case Study in Online Learning and Games [47.8] 大規模言語モデル(LLM)は(対話的な)意思決定にますます採用されている。
オンライン学習とゲーム理論のベンチマーク決定設定において,それらの相互作用について検討する。
本稿では,教師付きプレトレーニングの損失とは対照的に,教師付き行動のラベルを必要としない新しいインフントレーニングの損失を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:44:31 GMT)
Universally Invariant Learning in Equivariant GNNs [47.7] 等変グラフニューラルネットワーク(GNN)は、様々なアプリケーションで大きな成功を収めている。
完全同変GNNを構築するための理論的基盤となる枠組みを提案する。
以上の結果から,少数の層で優れた完全性と優れた性能を示すことができた。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:50:16 GMT)
Neural Plasticity-Inspired Multimodal Foundation Model for Earth Observation [47.5] 地球観測(EO)における多様な視覚タスクのための統一多モード基盤フレームワークを提案する。
神経可塑性にインスパイアされたDOFAは、波長条件の動的ハイパーネットワークを使用して、5つの異なる衛星センサーからの入力を柔軟に処理する。
センサ・ディバースEO領域における汎用視覚モデルの基礎としてのDOFAの可能性を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:11:23 GMT)
Ultra High-Resolution Image Inpainting with Patch-Based Content Consistency Adapter [47.5] Patch-Adapterは高解像度テキスト誘導画像の描画に有効なフレームワークである。
提案手法は,正確な内容の整合性を維持しつつ4K以上の分解能を達成し,迅速なアライメントを実現する。
実験によると、Patch-Adapterは、大規模な塗布に共通するアーティファクトを解決するだけでなく、最先端のパフォーマンスも達成している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:18:24 GMT)
Teaching Models to Understand (but not Generate) High-risk Data [47.4] SLUNG(Selective Loss to Understand but not Generate)を紹介する。
SLUNGは、モデルが高リスクデータを生成せずに理解することを学ぶための事前学習パラダイムである。
SLUNGは、生成を増大させることなく、モデルによる高リスクデータの理解を一貫して改善することを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:30:34 GMT)
HardcoreLogic: Challenging Large Reasoning Models with Long-tail Logic Puzzle Games [47.2] 大規模推論モデル(LRM)は、論理パズルゲームを含む複雑なタスクにおける印象的なパフォーマンスを実証している。
既存のコーパスは、9x9 Sudokuのような人気のパズルに焦点を当てており、標準フォーマットに過度に適合し、ソリューションパターンを記憶するリスクがある。
HardcoreLogicは10ゲームにわたる5000以上のパズルの挑戦的なベンチマークである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:31:28 GMT)
Adam or Gauss-Newton? A Comparative Study In Terms of Basis Alignment and SGD Noise [47.1] 2つの主要なアプローチは、Adam と Gauss-Newton (GN) の手法に基づいている。
本稿では,これら2つの対角的プレコンディショニング手法を比較し,この2つの重要な要素,すなわち,プリコンディショナーにおけるベースの選択と,ミニバッチによるノイズの影響を比較した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:36:43 GMT)
Less is More: Improving LLM Reasoning with Minimal Test-Time Intervention [46.2] Minimal Test-Time Intervention (MTI)は、最小限のオーバーヘッドで推論精度と安定性を向上させるトレーニング不要のフレームワークである。
MTIは、Qwen3-32B-Reasoningを使用して、Qwen3-8B-Baseの8つのベンチマークで平均+1.35%、AIME2024で+5%、一般、コーディング、STEMタスクで一貫した利得を得る。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:59:45 GMT)
BrainOmni: A Brain Foundation Model for Unified EEG and MEG Signals [46.1] 異種脳波とMEG記録を対象とする脳基礎モデルBrain Omniを提案する。
既存のアプローチは一般的に、パフォーマンスとクロスドメインのスケーラビリティを制限する、分離、モダリティ、データセット固有のモデルに依存します。
EEGの合計1,997時間、MEGデータの656時間は、事前トレーニングのために公開されているソースからキュレーションされ、標準化されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:51:35 GMT)
Towards Quantum Enhanced Adversarial Robustness with Rydberg Reservoir Learnin [45.9] 量子コンピューティング貯水池(QRC)は、量子多体系に固有の高次元非線形力学を利用する。
近年の研究では、変分回路に基づく量子回路は、逆数の影響を受けやすいことが示されている。
本研究では,QRCに基づく学習モデルにおいて,対向ロバスト性の最初の体系的評価について検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:17:23 GMT)
Jigsaw++: Imagining Complete Shape Priors for Object Reassembly [45.7] Jigsaw++は、再集合問題の完全な形を再構築する多面的課題に取り組むために設計された、新しい生成方法である。
既存の組立手法の出力を効果的に活用し、完全な形状復元を生成する「再ターゲティング」戦略が提案されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:02:52 GMT)
LiFMCR: Dataset and Benchmark for Light Field Multi-Camera Registration [44.6] LiFMCRは2つの高解像度のレイトリクスRFMC32カメラからの同期画像シーケンスを提供する。
このユニークな組み合わせは、マルチカメラ光場登録法の厳密な評価を可能にする。
実験は、信頼性の高い多視点光場処理をサポートしながら、地上の真実と強い整合性を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:32:27 GMT)
Assessing the Latent Automated Program Repair Capabilities of Large Language Models using Round-Trip Translation [44.4] RTT(Round-Trip Translation): あるプログラミング言語から別のプログラミング言語や自然言語にコードを翻訳する。
JavaにおけるRTT生成パッチの詳細な量的および定性的な分析を行う。
RTTはHumanEval-JavaベンチマークでGPT-4を用いた164のバグのうち100件に対して可塑性パッチを生成し,97件を手作業で評価した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:26:34 GMT)
DelRec: learning delays in recurrent spiking neural networks [44.4] スパイキングニューラルネットワーク(SNN)は、従来の実数値ディープラーニングモデルのバイオインスパイアされた代替品である。
DelRecは、リカレントスパイキング層における軸索またはシナプス遅延をトレーニングする最初のSGLベースの方法である。
以上の結果から,SNNの時間的処理には繰り返し遅延が不可欠であることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:26:28 GMT)
FlashWorld: High-quality 3D Scene Generation within Seconds [44.2] FlashWorldは、単一の画像やテキストプロンプトから数秒で3Dシーンを生成する生成モデルである。
我々のアプローチは、従来のマルチビュー指向(MV指向)パラダイムから3D指向アプローチに移行します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:35:48 GMT)
BlendFL: Blended Federated Learning for Handling Multimodal Data Heterogeneity [44.0] BlendFLは、水平と垂直のFLの原理を、同期的で非制限的な方法でシームレスにブレンドする新しいFLフレームワークである。
BlendFLは分散推論機構を備えており、クライアントが協調的にトレーニングされたローカルモデルを実行できるようにする。
大規模な実世界のマルチモーダル医療データセットを用いて,BlendFLや他の最先端のベースラインを3つの分類タスクに基づいて訓練し,評価した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:10:42 GMT)
$Δ\mathrm{Energy}$: Optimizing Energy Change During Vision-Language Alignment Improves both OOD Detection and OOD Generalization [43.8] 我々はDeltaEnergyという新しいエネルギーベースのOODスコアを導入する。
DeltaEnergyはバニラエネルギーベースのOODスコアを大幅に上回り、OOD検出に対する信頼性の高いアプローチを提供する。
EBMは、OODの検出を増強するだけでなく、ドメインに一貫性のあるヘッセンを生成することが理論的に証明されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:52:23 GMT)
EgoSocial: Benchmarking Proactive Intervention Ability of Omnimodal LLMs via Egocentric Social Interaction Perception [43.0] EgoSocialは、大規模なエゴセントリックなデータセットで、1万3500のソーシャルビデオクエストペアがある。
EgoSoDは、ソーシャルダイナミクスを堅牢に識別するためのエンドツーエンドの手法である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:52:19 GMT)
cubic: CUDA-accelerated 3D Bioimage Computing [42.8] このライブラリは、広く使われているSciPyとScikit-image APIをGPUアクセラレーションによって拡張します。
CubuteのAPIはデバイスに依存しないため、データがデバイスに配置された時にGPUに操作をディスパッチする。
個別の操作をベンチマークし、既存のデコンボリューションパイプラインとセグメンテーションパイプラインを再現することで立方体の評価を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:22:06 GMT)
End-to-End Semantic Preservation in Text-Aware Image Compression Systems [42.8] 光文字認識(OCR)のためのテキスト固有の特徴を保持するエンドツーエンド圧縮フレームワークを提案する。
実験では、低速度でのテキスト抽出精度が大幅に向上し、圧縮されていない画像ではOCRよりも優れていた。
我々はこの研究を汎用エンコーダに拡張し、極端圧縮下で隠れセマンティクスを保存する能力を探究する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:59:23 GMT)
LLM one-shot style transfer for Authorship Attribution and Verification [42.6] 監督的かつ対照的なアプローチは、急激な相関を持つデータに依存し、しばしばトピックと混同される。
本研究では,LLMの事前学習と文脈内学習機能に基づく教師なしの新たな手法を提案する。
提案手法は,LLMのアプローチを比較検討し,対照的に訓練されたベースラインよりも高い精度を実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:43:24 GMT)
Can Pre-training Indicators Reliably Predict Fine-tuning Outcomes of LLMs? [42.6] 本研究では,501BパラメータLLM変種を用いて,系統的な事前学習構成を持つデータセットを構築した。
本稿では,事前学習から得られた新しい教師なしおよび教師なしのプロキシメトリクスを導入し,相対的な性能予測誤差率を50%以上削減する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:10:38 GMT)
K-Merge: Online Continual Merging of Adapters for On-device Large Language Models [42.5] 大規模言語モデル(LLM)は、リソースの厳しい制約の下で様々な下流タスクをサポートする。
最近の研究は、複数のローランドアダプタ(LoRA)を1つに融合させるモデルマージ技術について検討している。
本稿では,データフリーで効率的なLoRAの選択とマージを行う手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:32:25 GMT)
What "Not" to Detect: Negation-Aware VLMs via Structured Reasoning and Token Merging [42.4] 最先端のビジョン言語モデル(VLM)は否定を理解する上で重大な失敗を経験し、しばしば肯定バイアスと呼ばれる。
CoVANDは,システムチェーン(CoT)とVQAベースのパイプラインで構築されたデータセットで,高品質なインスタンス基底型否定データを生成する。
第二に,肯定バイアスのアーキテクチャ的原因に直接対処する新しいテキストトークンマージモジュールNegToMeを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:36:38 GMT)
Flexible quantum data bus for quantum networks [42.3] 本研究では、あらかじめ準備された2Dクラスタ状態が要求に応じて異なるタスクを実行するリソースとして機能する量子ネットワークにおける絡み合いのマルチパスルーティングについて考察する。
対角線経路間の適切な局所測定を行うことにより、複数の自由選択されたパーティ間の並列接続を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:14:26 GMT)
Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs [42.0] 機械的解釈可能性を用いたビデオLLMの内部情報フローについて検討する。
分析の結果,ビデオQAタスク間の一貫したパターンが明らかになった。
これらの発見は、VideoLLMが時間的推論を行う方法の青写真を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:59:06 GMT)
The German Commons - 154 Billion Tokens of Openly Licensed Text for German Language Models [41.9] ドイツ・コモンズ(ドイツ語: German Commons)は、ドイツで公にライセンスされたテキストのコレクションである。
41のソースから7つのドメインにまたがるデータをコンパイルし、法律、科学、文化、政治、ニュース、経済、ウェブテキストを含む。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:24:26 GMT)
HUMOTO: A 4D Dataset of Mocap Human Object Interactions [41.2] Human Motions with Objects(ヒューマン・モーション・ウィズ・オブジェクト)は、モーション生成、コンピュータビジョン、ロボット工学応用のための人間と物体の相互作用の高忠実なデータセットである。
Humotoは、63の精度でモデル化されたオブジェクトと72の明瞭なパーツとのインタラクションをキャプチャする。
プロのアーティストは、それぞれのシーケンスを厳格に掃除し、検証し、足の滑りや物体の侵入を最小限にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:15:08 GMT)
Decoding Correlated Errors in Quantum LDPC Codes [41.0] 本稿では,回路レベルの雑音下での量子LDPC符号における相関誤差の復号化フレームワークを提案する。
提案手法のコアは、相関検出誤差モデルを変更する干渉法(GARI)のグラフ拡張と再配線である。
FPGA実装の予備的な結果は、この高い精度をリアルタイムに達成でき、デコードインスタンスの99.99%において、平均デコードレイテンシは273 ns、サブマイクロ秒レイテンシは99.99%であることを示している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:59:05 GMT)
Steerable Conditional Diffusion for Domain Adaptation in PET Image Reconstruction [40.7] 本稿では,これまで導入してきたPET-LiSchフレームワークとステアブル条件拡散(SCD)を統合することを提案する。
現実的な合成2次元脳ファントムの実験は、我々のアプローチがドメインシフト下での幻覚的人工物を抑制することを実証している。
これらの結果から, 誘導性前駆体が拡散型PET再建におけるドメインシフトを緩和できるという概念実証が得られた。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:40:03 GMT)
MCOP: Multi-UAV Collaborative Occupancy Prediction [40.6] Current Bird's Eye View (BEV)ベースのアプローチには2つの大きな制限がある。
本稿では,複数UAV共同占有予測フレームワークを提案する。
提案手法は最先端の精度を達成し,既存の協調手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:11:34 GMT)
Retrieval-in-the-Chain: Bootstrapping Large Language Models for Generative Retrieval [40.4] 生成検索のための推論強化フレームワークであるReason-for-Retrieval(R4R)を提案する。
R4Rは、自由形式のチェーン・オブ・シークレット(CoT)推論をコンパクトで構造化されたフォーマットに変換し、検索プロセス中の推論を反復的に洗練する。
自然質問、MS MARCO、および実世界の項目探索ベンチマークに関する広範囲な実験により、R4Rの有効性が検証された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:29:10 GMT)
How Sampling Affects the Detectability of Machine-written texts: A Comprehensive Study [39.9] 大きな言語モデル(LLM)はますます一般的になってきており、人間による内容とは区別がつかないことが多い。
最近の多くの検出器は精度がほぼ完璧であると報告しており、AUROCのスコアは99%を超えている。
本研究では,サンプリングに基づく復号化が検出可能性に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:36:45 GMT)
A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control [39.6] オンラインモデルフリーRLにおける連続制御において,トランスフォーマーが強力なベースラインとなることを示す。
本実験では,完全かつ部分的に観測可能なタスク間での競争性能を実現するため,安定したアーキテクチャとトレーニング戦略を明らかにした。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:58:54 GMT)
Every Language Model Has a Forgery-Resistant Signature [39.6] 本研究では,高次元楕円体の表面にある言語モデル出力をモデルのためのシグネチャとして示し,与えられた出力のソースモデルを特定するために使用できることを示す。
そこで本研究では,小型モデルから楕円を抽出する新しい手法の評価を行い,実運用モデルでは実現不可能な実用的ハードルについて考察する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:46:38 GMT)
SPIN-Bench: How Well Do LLMs Plan Strategically and Reason Socially? [39.4] 戦略計画・インタラクション・ネゴシエーション(SPIN-Bench)について
SPIN-Benchは、戦略的計画と社会的推論の知性を測定するために設計された、新しいマルチドメイン評価である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:15:17 GMT)
SAGE-Music: Low-Latency Symbolic Music Generation via Attribute-Specialized Key-Value Head Sharing [39.0] 低レイテンシなシンボリック音楽生成は、リアルタイムおよび人間とAIの共創に不可欠である。
埋め込みプールのような従来のアクセラレーション技術は、音楽の質を著しく低下させる。
本稿では,Attribute-Specialized Key-Value Head Sharing (AS-KVHS)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:29:01 GMT)
CanvasMAR: Improving Masked Autoregressive Video Generation With Canvas [38.5] Masked Autoregressive Model (MAR) は画像およびビデオ生成の強力なパラダイムとして最近登場した。
ビデオMARモデルは、スロースタート問題とオートレグレス全体のエラー蓄積という2つの大きな制限に悩まされている。
キャンバス機構を導入することでこれらの問題を緩和する新しいビデオMARモデルであるCanvasMARを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:29:09 GMT)
Make an Offer They Can't Refuse: Grounding Bayesian Persuasion in Real-World Dialogues without Pre-Commitment [38.0] 単ターン対話設定における自然言語へのベイジアン説得(BP)の適用について検討する。
本フレームワークは,情報スキーマを明確に概説するコミットメントコミュニケーション機構を備えている。
提案手法では,FNLBPとFNLBPの2つの変種を評価し,非BP基線と非BP基線の両方に対してベンチマークを行った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:26:02 GMT)
HealthProcessAI: A Technical Framework and Proof-of-Concept for LLM-Enhanced Healthcare Process Mining [37.9] HealthProcessAIは、医療および疫学におけるプロセスマイニングのアプリケーションを簡単にするためのGenAIフレームワークである。
不慣れな問題に対処し、アクセシビリティを向上させるため、このフレームワークは複数の大規模言語モデル(LLM)を統合し、プロセスマップの自動解釈とレポート生成を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:46:12 GMT)
Geo-R1: Improving Few-Shot Geospatial Referring Expression Understanding with Reinforcement Fine-Tuning [37.9] リモートセンシングにおける表現理解の参照は、ユニークな課題である。
数ショットの地理空間参照のための推論中心強化微調整(RFT)パラダイムであるGeo-R1を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:47:10 GMT)
Enabling Few-Shot Alzheimer's Disease Diagnosis on Biomarker Data with Tabular LLMs [37.9] 大規模言語モデル(LLM)は、構造化バイオメディカルデータを用いて予測する前例のない機会を提供する。
アルツハイマー病の診断にTableGPT2を適用したTAP-GPT(Tabular Alzheimer's Prediction GPT)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:53:40 GMT)
Towards Trusted Service Monitoring: Verifiable Service Level Agreements [37.8] サービス指向環境におけるSLA(Service Level Agreement)監視は、プロバイダがメトリクスを自己報告する場合、固有の信頼の衝突に悩まされます。
信頼性のあるハードウェアモニタとゼロ知識証明を通じて、検証可能なSLA違反クレームを生成するためのフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:02:29 GMT)
AquaCluster: Using Satellite Images And Self-supervised Machine Learning Networks To Detect Water Hidden Under Vegetation [37.7] 我々は,レーダー衛星画像を手動の注釈なしで水陸域に分割するモデルを開発した。
この結果から,アノテートデータを用いることなく,レーダ画像から植生水を検出する機械学習モデルを訓練することが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:26:11 GMT)
UniCalli: A Unified Diffusion Framework for Column-Level Generation and Recognition of Chinese Calligraphy [37.2] 我々は列レベルの認識と生成のための統合拡散フレームワークである textbfUniCalli を紹介する。
8000以上のデジタル化された断片からなるデータセットを、4000以上の注釈付き断片でキュレートし、合成データ、ラベル付きデータ、ラベルなしデータの組み合わせでトレーニングしました。
このモデルは、より強力な認識とともに、より優れたリグチュア連続性とレイアウト忠実性を有する最先端の生成品質を実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:52:07 GMT)
Predictive Preference Learning from Human Interventions [37.0] 今後の展開を予測するために,PPL(Predictive Preference Learning from Human Interventions)を導入する。
PPLは、各人間の介入をLの将来の時間ステップにブートストラップし、優先地平線(英語版)と呼ばれ、エージェントが同じ行動に追従し、ヒトが優先地平線に同じ介入をすると仮定する。
これらの将来の状態に好みの最適化を適用することにより、専門家の修正は、エージェントが探索されるであろう安全クリティカルな領域に伝播される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:33:59 GMT)
Taming the Fragility of KV Cache Eviction in LLM Inference [36.5] 本稿では,最悪の場合のリスクを抑える2段階の線形時間アプローチを提案する。
本手法は,20%のキャッシュサイズで最強のベースラインに対して,それぞれ2.3xと4.3xの生成品質損失を低減させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:18:58 GMT)
Perspective-Aware Teaching: Adapting Knowledge for Heterogeneous Distillation [36.2] 多様なアーキテクチャにまたがる特徴蒸留を可能にするために,視点認識型KDフレームワークを導入した。
まず、学生のフィードバックを取り入れたプロンプトチューニングブロックを設計し、教師が生徒モデルの学習プロセスに適応できるようにする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:11:40 GMT)
Briding Diffusion Posterior Sampling and Monte Carlo methods: a survey [36.1] 拡散モデルにより、ベイズ逆問題(英語版)(Bayesian inverse problem)を前もって解くことができる。
本総説では, モンテカルロ法とともに, エフェプレ訓練拡散モデルを利用する現行手法の概要について概説する。
これらの手法は, 拡散過程における中間分布のエンフットワイスティング機構を用いて, シミュレーションを後部分布へ導く。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:36:51 GMT)
Arbitrary Entropy Policy Optimization: Entropy Is Controllable in Reinforcement Fine-tuning [36.0] 本稿では, エントロピーボーナスをREINFORCEポリシー勾配に置き換えることで, エントロピー崩壊を解消するArbitrary Entropy Policy Optimization (AEPO)を提案する。
AEPOは、ポリシー勾配を正規化として、分布を正規化として、REINFORCEを正規化として統合し、最適化を歪ませることなく正確なエントロピー制御を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:54:25 GMT)
InteractiveOmni: A Unified Omni-modal Model for Audio-Visual Multi-turn Dialogue [36.0] 音声-視覚的マルチターンインタラクションのための,統一的でオープンソースのOmni-Modal大言語モデルであるInteractive Omniを紹介する。
これを実現するために、視覚エンコーダ、オーディオエンコーダ、大言語モデル、音声デコーダを統合モデルに統合し、タスクの理解と生成を行う。
我々は、Omni-modal理解のための事前学習を含む、堅牢なクロスモーダル機能を確保するためのマルチステージトレーニング戦略を設計する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:52:48 GMT)
Behavioral Embeddings of Programs: A Quasi-Dynamic Approach for Optimization Prediction [35.9] 本稿では,プログラム表現のための新しい準動的フレームワークを提案する。
中心となる洞察は、プログラムの最適化感度をモデル化することである。
この高次元連続スペクトルを効果的に符号化するために,我々は合成学習アプローチを開拓した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:18:41 GMT)
QuaDreamer: Controllable Panoramic Video Generation for Quadruped Robots [35.5] QuaDreamerは四足歩行ロボット用に設計された最初のパノラマデータ生成エンジンである。
ジッタ信号制御下での高品質パノラマ映像生成を容易にするために,SOC(Scene-Object Controller)を提案する。
生成されたビデオシーケンスは、四足歩行ロボットのパノラマ視覚知覚モデルのトレーニングデータとして機能する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:33:18 GMT)
DepthVLA: Enhancing Vision-Language-Action Models with Depth-Aware Spatial Reasoning [35.4] VLA(Vision-Language-Action)モデルは最近、印象的な一般化と言語誘導操作機能を示している。
視覚言語モデル(VLM)から受け継いだ空間的推論の制限による空間的推論の精度の低下
本稿では,プレトレーニングした深度予測モジュールを通じて空間認識を明示的に組み込んだ,シンプルで効果的なVLAアーキテクチャであるDepthVLAを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:09:00 GMT)
SeCon-RAG: A Two-Stage Semantic Filtering and Conflict-Free Framework for Trustworthy RAG [35.4] Retrieval-augmented Generation (RAG) システムは、外部知識を持つ大規模言語モデルを強化する。
既存の防御は、しばしば攻撃的なフィルタリングを適用し、不要な貴重な情報が失われる。
信頼性の高いRAGのための2段階のセマンティックフィルタリングとコンフリクトフリーフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:05:25 GMT)
PriorGuide: Test-Time Prior Adaptation for Simulation-Based Inference [35.4] 拡散型アモルト化推論法に特化して設計された手法である PreferGuide を紹介する。
これにより、トレーニングされた拡散モデルをテスト時に、コストのかかる再トレーニングを伴わずに、フレキシブルな適用が可能になる。
これにより、ユーザーは更新情報や専門知識のトレーニング後を簡単に組み込むことができ、事前訓練された推論モデルの汎用性を高めることができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:11:19 GMT)
LiteraryQA: Towards Effective Evaluation of Long-document Narrative QA [35.3] 本稿では,文学作品に焦点を当てたナラティブQAの高品質サブセットであるLiteraryQAを紹介する。
ソース文書から不要なテキストを取り除き,品質の低いQAサンプルを同定し,修正する。
LiteraryQA 上で長文 LLM の集合をベンチマークする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:43:59 GMT)
PHORECAST: Enabling AI Understanding of Public Health Outreach Across Populations [35.1] PHORECAST (Public Health Outreach Receptivity and CAmpaign Signal Tracking) は、個人レベルの行動応答と、ヘルスメッセージングに対するコミュニティ全体のエンゲージメントパターンの両方を詳細に予測するための、マルチモーダルデータセットである。
このデータセットは、マルチモーダル理解、応答予測、パーソナライゼーション、社会的予測といったタスクをサポートし、現代のAIシステムがいかにして、異種公共の感情や振る舞いをエミュレートし、解釈し、予測できるかを厳格に評価することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:13:31 GMT)
On the Reasoning Abilities of Masked Diffusion Language Models [34.9] テキストの仮面拡散モデル(MDM)は、従来の自己回帰言語モデルに代わる魅力的な代替手段を提供する。
我々はMDMが確実に解けるような推論問題の種類と効率を特徴付ける。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:29:26 GMT)
Counting Hallucinations in Diffusion Models [34.5] 拡散確率モデル(DPM)は、画像やビデオ合成などの生成タスクにおいて顕著な進歩を見せている。
彼らはしばしば、現実世界の知識と矛盾する幻覚的なサンプル(幻覚)を生産する。
その流行にもかかわらず、そのような幻覚を体系的に定量化するための実現可能な方法論の欠如は進歩を妨げている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:48:04 GMT)
FALCON: Fine-grained Activation Manipulation by Contrastive Orthogonal Unalignment for Large Language Model [34.3] 本研究では,FALCON(Contrastive Orthogonal uNalignment)による微細な活性化マニピュレーションを,表現誘導型未学習アプローチとして提案する。
FALCONは、モデルユーティリティを維持しながら、より優れた非学習効率を実現し、知識回復の試みに対して堅牢な抵抗を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:59:39 GMT)
Optimal Aggregation of LLM and PRM Signals for Efficient Test-Time Scaling [34.2] プロセス報酬モデル(PRM)は、テストタイムスケーリング(TTS)の基礎である。
PRMは、大きな言語モデル(LLM)から最適な応答を検証し、選択するために設計されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:08:51 GMT)
Neural Sum-of-Squares: Certifying the Nonnegativity of Polynomials with Transformers [34.0] 二次体の非負性証明はよく知られたNPハード問題である。
非負性に対する十分条件は、200平方 (SOS) の性質である。
本稿では,SOS基準を認証する最初の学習用トランスフォーマー学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:42:38 GMT)
PIShield: Detecting Prompt Injection Attacks via Intrinsic LLM Features [34.0] 既存のプロンプトインジェクション検出法は、しばしば準最適性能および/または高い計算オーバーヘッドを持つ。
本稿では,有効かつ効率的に検出できるPIShieldを提案する。
PIShieldは高効率かつ効率的であり,既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:34:49 GMT)
EEGChaT: A Transformer-Based Modular Channel Selector for SEEG Analysis [33.8] 本稿では,SEEGデータ解析のための新しいトランスフォーマーベースのチャネル選択モジュールであるEEGChaTを提案する。
EEGChaTはデコード精度を継続的に改善し,最大17%の絶対ゲインを実現している。
その結果,EEGChaTは高次元SEEG解析におけるチャネル選択に有効で一般化可能な解であることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:22:07 GMT)
Readability $\ne$ Learnability: Rethinking the Role of Simplicity in Training Small Language Models [33.1] 近年の研究では、非常に小さな言語モデル(SLM)が、TinyStoriesのような子供指向コーパスで訓練されたときに驚くほど一貫性のあるテキストを生成することが示唆されている。
これらの知見は、可読性がそのような能力の実現に重要な役割を果たしている証拠として解釈されている。
一致した構造を持つ合成データセットを構成するが、可読性が異なるため、可読性だけではSLMのコヒーレンスや学習効率を予測できない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:17:02 GMT)
KL-regularization Itself is Differentially Private in Bandits and RLHF [33.1] 差分プライバシー(DP)は、プライバシーのための厳格なフレームワークを提供し、単一のエントリで異なるデータセット間で統計的に区別できないデータ駆動アルゴリズムの出力を保証する。
「一般に、DPを保証するためには、アルゴリズム自体または出力に明示的にノイズを注入する必要があるが、既存のアルゴリズムの固有のランダム性は、DPを無償で達成する機会を与える。」
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:33:38 GMT)
MIRROR: Multimodal Cognitive Reframing Therapy for Rolling with Resistance [33.1] 我々は、非言語的な手がかりを取り入れたマルチモーダルアプローチを提案し、AIセラピストは、クライアントのネガティブな感情状態に応答をより良く整合させることができる。
具体的には、新しい合成データセットであるMirrorを導入し、クライアントのステートメントと対応する顔画像とをペアリングする新しい合成データセットについて紹介する。
その結果、MirrorはAIセラピストの抵抗処理能力を大幅に向上させ、既存のテキストベースのCBTアプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:12:18 GMT)
Learning to Think: Information-Theoretic Reinforcement Fine-Tuning for LLMs [33.0] 大きな言語モデル(LLM)は、推論能力のおかげで複雑なタスクで優れています。
既存の手法は、推論の有効性と効率のトレードオフを見落としている。
より少ないトークンで最適な推論を実現するために,学習から思考への学習を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:42:23 GMT)
When "Correct" Is Not Safe: Can We Trust Functionally Correct Patches Generated by Code Agents? [32.9] コードエージェントは、GitHubなどのプラットフォーム上のバグを自律的に修正することをますます信頼している。
本稿では,実世界のコードエージェントに対する新たなタイプの脅威を明らかにする。
我々は、SOTA LLM(例えば、ChatGPTとClaude)とエージェントの足場(例えば、SWE-agentとOpenHands)がこのFCV脅威に対して脆弱であることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:16:36 GMT)
Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL [32.9] SGCRL(Single-Goal Contrastive Reinforcement Learning, SGCRL)は、長期的目標達成課題を解くことができる自己教師型アルゴリズムである。
本稿では,SGCRLが学習表現によって形成される暗黙の報酬を最大化することを示す。
改良された理解により、安全に配慮した探索にSGCRLを適応させることができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:55:14 GMT)
Universal Speech Token Learning via Low-Bitrate Neural Codec and Pretrained Representations [32.8] 本稿では,2種類のトークンを統一し,音声のすべての意味をカプセル化する普遍的な音声トークン学習UniCodecを提案する。
低ビットレートのニューラルは、グローバルスケールとローカルスケールでこのような非交叉離散表現を学習するために利用され、自己教師付き学習特徴から知識を抽出する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:52:30 GMT)
PASE: Phoneme-Aware Speech Encoder to Improve Lip Sync Accuracy for Talking Head Synthesis [32.4] PASE(Phoneme-Aware Speech)は,音素と音素のギャップを埋める新しい音声表現モデルである。
実験の結果,PASEはリップシンク精度を大幅に向上し,NeRFおよび3DGSベースのレンダリングフレームワーク間の最先端性能を実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:22:15 GMT)
GAPS: A Clinically Grounded, Automated Benchmark for Evaluating AI Clinicians [32.3] AI臨床システムの現在のベンチマークは、実際の臨床実践に必要な深さ、堅牢性、安全性を捉えていない。
本稿では, GAPSフレームワーク, textbfGrounding (認識深度), textbfAdequacy (回答完全性), textbfPerturbation (損耗性), textbfSafetyを提案する。
GAPS準拠のベンチマークをエンドツーエンドに構築するための,完全自動化されたガイドライン変換パイプラインを開発した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:40:28 GMT)
Probabilistic Reasoning with LLMs for k-anonymity Estimation [32.3] 大規模言語モデルに対する不確実性を考慮した新しい数値推論タスクを提案する。
BRANCHは、与えられた情報と一致する集団の大きさのテキストのk-privacy値を推定する新しい手法である。
実験の結果,k値が73%と推定され,o3-miniとチェーン・オブ・シント推論の13%の増加が確認された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:36:24 GMT)
Generative AI Meets Future Cities: Towards an Era of Autonomous Urban Intelligence [32.2] 都市計画と人工知能の2つの分野が生まれ、別々に開発された。
現在、他分野の進歩の恩恵を受けるために、クロスポリン化と両方の分野への関心が高まっている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:06:19 GMT)
Putting on the Thinking Hats: A Survey on Chain of Thought Fine-tuning from the Perspective of Human Reasoning Mechanism [31.9] CoT(Chain of Think)ファインチューニングは、大きな言語モデル(LLM)に推論能力を持たせることを目的として、キュレートされた推論トレースに基づいてそれらをトレーニングする。
人間の推論理論に基づくCoT微調整に関する最初の包括的調査を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:54:13 GMT)
Can Prompts Rewind Time for LLMs? Evaluating the Effectiveness of Prompted Knowledge Cutoffs [31.6] 大規模言語モデル(LLM)は時間的予測に広く用いられているが、事前学習データへの依存は汚染の懸念を引き起こす。
LLMにおける初期の知識遮断をシミュレートする能力について検討する。
以上の結果から, 即時的知識カットオフは, その日以降の情報を直接クエリした場合の有効性を示すが, 忘れた内容が直接問い合わせられるのではなく, 慎重にクエリに関連付けられている場合, 忘れることの誘発に苦慮していることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:27:58 GMT)
PoissonNet: A Local-Global Approach for Learning on Surfaces [31.6] メッシュ上での学習のための新しいニューラルネットワークであるPoissonNetを紹介する。
私たちの構築は効率的で、計算オーバーヘッドは同等のメソッドよりもはるかに少なくなります。
中心的な応用として、変形を学習する能力を示し、表面で学習する最先端のアーキテクチャを著しく上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:25:44 GMT)
RAGCap-Bench: Benchmarking Capabilities of LLMs in Agentic Retrieval Augmented Generation Systems [31.5] Retrieval-Augmented Generation (RAG) はLarge Language Models (LLM) の重要な制限を緩和する
最近の研究はエージェントRAGシステムを通じてこのパラダイムを拡張しており、LLMは複雑なクエリを反復的に計画、検索、推論するエージェントとして機能する。
本稿では,エージェントRAGにおける中間タスクの微粒化評価のための機能指向ベンチマークであるRAGCap-Benchを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:13:00 GMT)
SemVink: Advancing VLMs' Semantic Understanding of Optical Illusions via Visual Global Thinking [31.4] 視覚言語モデル(VLM)は、セマンティックなタスクでは優れているが、中心となる人間の能力には優れている。
HC-Benchは、隠れテキスト、オブジェクト、イリュージョンを備えた112の画像のベンチマークである。
本稿では,余剰な視覚ノイズを排除し,99%の精度を解放するSemVink(Semantic Visual Thinking)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:52:05 GMT)
Noise-Adaptive Layerwise Learning Rates: Accelerating Geometry-Aware Optimization for Deep Neural Network Training [31.3] 幾何認識最適化アルゴリズム上に,雑音適応型層別学習率スキームを導入する。
提案手法は, 選択したLMOがフライ時に誘導する双対ノルムの勾配分散を推定する。
我々のアルゴリズムは鋭い収束率を達成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:42:13 GMT)
Reliable Decision Making via Calibration Oriented Retrieval Augmented Generation [30.8] 大規模言語モデルが自信を持って誤った情報を提供すると、人間に最適な決定を下すことになる。
本稿では、RAG による決定が適切に校正されていることを保証するCalibrated Retrieval-Augmented Generation (CalibRAG)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:04:09 GMT)
ChatR1: Reinforcement Learning for Conversational Reasoning and Retrieval Augmented Question Answering [30.8] 会話型質問応答(CQA)のための強化学習(RL)に基づく推論フレームワークChatR1を提案する。
ChatR1は回転する探索と推論をインターリーブし、RLを通して学習された探索的かつ適応的な行動を可能にする。
提案したChatR1は、3Bモデルと7Bモデルの両方のバックボーンで強力な性能を示し、5つのCQAデータセットで競合モデルを上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:00:20 GMT)
Rethinking Graph Domain Adaptation: A Spectral Contrastive Perspective [30.8] グラフニューラルネットワーク(GNN)は、様々な領域で顕著な成功を収めているが、ドメイン適応に苦慮することが多い。
本稿では、FracNetを用いて、元のグラフを高周波および低周波成分に分解し、周波数対応ドメイン適応を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:04:18 GMT)
EasyNER: A Customizable Easy-to-Use Pipeline for Deep Learning- and Dictionary-based Named Entity Recognition from Medical and Life Science Text [30.4] 我々は、ディープラーニングと辞書に基づく名前付きエンティティ認識のための、使い易いエンドツーエンドパイプラインを開発した。
このパイプラインは、大規模な医学研究論文コレクション(コーパス、CORD-19)や生のテキストにアクセスして処理することができる。
新型コロナウイルスやその他の医療トピックに関連する辞書ベースのNERを実行することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:06:49 GMT)
RedTeamCUA: Realistic Adversarial Testing of Computer-Use Agents in Hybrid Web-OS Environments [30.3] コンピュータ利用エージェント(CUA)はOS(OS)とウェブにまたがる複雑なタスクを自動化することを約束するが、間接的なプロンプトインジェクションには弱いままである。
我々は,VMベースのOS環境とDockerベースのWebプラットフォームを統合する,新しいハイブリッドサンドボックスを備えた,敵対的なテストフレームワークであるRedTeamCUAを提案する。
RedTeamCUAは、CUAの脆弱性を現実的で、制御され、体系的に分析するために必要なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:01:38 GMT)
MimicParts: Part-aware Style Injection for Speech-Driven 3D Motion Generation [30.2] MimicPartsは、パートアウェアスタイルのインジェクションとパートアウェアのデノーミングネットワークに基づいて、スタイル化されたモーション生成を強化するために設計された新しいフレームワークである。
身体を異なる領域に分割し、局所的な動作スタイルを符号化することで、モデルがきめ細かい地域差を捉えることができる。
提案手法は, 自然性および表現力のある3次元動作シーケンスを示す既存手法より優れる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:53:15 GMT)
DiSTAR: Diffusion over a Scalable Token Autoregressive Representation for Speech Generation [30.2] DISTARはゼロショットのテキスト音声合成フレームワークで、離散的残差ベクトル量子化符号空間で完全に動作する。
DISTARは、堅牢性、自然性、話者/スタイルの整合性において、最先端のゼロショットTSシステムを超えている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:15:11 GMT)
Optimal Control Theoretic Neural Optimizer: From Backpropagation to Dynamic Programming [29.9] 本稿では,ディープニューラルネットワーク(DNN)の最適化に関するアルゴリズム的視点に焦点を当てる。
我々の動機付けされた観測は、DNNの勾配計算のためのバックプロパゲーションアルゴリズムと力学系における最適条件との顕著なアルゴリズム的類似性である。
最適制御 ニューラル理論 (OCNOpt) と呼ばれる結果の物理は、豊かなアルゴリズムの機会を与える。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:39:51 GMT)
Optimal Quantization for Matrix Multiplication [29.8] アルゴリズムにより,近似誤差を明確に保証したネスト格子に基づく普遍的量子化器を構築する。
我々の量子化器の実用的低複雑さバージョンは、非常に最適に近い性能を達成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:56:27 GMT)
EO-1: Interleaved Vision-Text-Action Pretraining for General Robot Control [29.5] EO-RoboticsはEO-1モデルとEO-Data1.5Mデータセットで構成されている。
EO-1の開発は、(i)マルチモーダル入力を無差別に処理する統一アーキテクチャという、2つの重要な柱に基づいている。
EO-1は、EO-Data1.5M上の自己回帰復号とフローマッチングの相乗効果によって訓練される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:14:40 GMT)
Unifying Polymer Modeling and Design via a Conformation-Centric Generative Foundation Model [29.4] ポリコンFM(PolyConFM)は、コンフォメーション中心の事前学習を通じて高分子モデリングと設計を統合するための基礎モデルである。
本研究では, 分子動力学シミュレーションによる初の高品質ポリマーコンホメーションデータセットを構築し, データの分散を緩和する。
実験により、PolyConFMは様々な下流タスクにおいて、代表的タスク固有のメソッドよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:11:44 GMT)
Adaptive Rescheduling in Prefill-Decode Disaggregated LLM Inference [29.2] 大規模言語モデル(LLM)推論は基本的なパラダイムとして登場した。
本稿では,時間予測を利用した適応型復号化システムであるARESを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:29:08 GMT)
QUIDS: Query Intent Description for Exploratory Search via Dual Space Modeling [29.0] 探索探索検索では、ユーザはよく知らないトピックを調べるためにあいまいなクエリを提出する。
これは、ミスマッチした結果と試行錯誤の修正の自己強化サイクルにつながる。
本稿では,ユーザ向け自然言語クエリインテント記述を生成するQUIDSを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:09:41 GMT)
Reasoning in Space via Grounding in the World [28.9] 本研究では,そのギャップを埋める効果的な空間表現を探るため,GS-Spatial Reasoner(GS-Reasoner)を提案する。
GS-Reasonerは、3Dの視覚的グラウンドで印象的な結果を得ることができ、それによって空間的推論能力が大幅に向上する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:58:08 GMT)
Program of Thoughts for Financial Reasoning: Leveraging Dynamic In-Context Examples and Generative Retrieval [28.8] 金融数値推論を強化するための新しい2段階フレームワークであるFINDERを紹介する。
最初のステップでは、生成検索を使用して、テキストとテーブルの両方を含む非構造化データから関連する事実を抽出する。
その後、文脈認識型思考プログラムが、文脈内サンプルの動的選択を促す。
我々のモデルであるFINDERは、FinQAとConvFinQAの両方のデータセット上で、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:16:54 GMT)
Latent Refinement Decoding: Enhancing Diffusion-Based Language Models by Refining Belief States [28.7] 本稿では、Latent Refinement Decoding (LRD) と予測フィードバックループを備えた2段階のフレームワークについて紹介する。
LRDは最大10.6倍のスピードアップを提供しながら精度を向上し、並列シーケンス生成の強力な代替手段となる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:33:35 GMT)
KeyVID: Keyframe-Aware Video Diffusion for Audio-Synchronized Visual Animation [28.6] KeyVIDは、オーディオ信号のキーモーメントの生成品質を大幅に改善する、音声認識と視覚のアニメーションフレームワークである。
我々は、KeyVIDが複数のデータセット間でオーディオ-ビデオ同期とビデオ品質を大幅に改善することを実証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:24:44 GMT)
Closing the Gap Between Text and Speech Understanding in LLMs [28.5] 大規模言語モデルは、テキスト機能を音声入力に拡張するために適応することができる。
これらの言語適応型LLMは、テキストベースのものよりも一貫して性能が劣っている。
SALAD-Sample- efficient Alignment with Learning through Active selection and cross-modal Distillation。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:57:16 GMT)
Fusion Meets Diverse Conditions: A High-diversity Benchmark and Baseline for UAV-based Multimodal Object Detection with Condition Cues [28.3] 高度80mから300mの様々なシナリオをカバーする高多様性データセットATR-UMODを導入する。
各RGB-IRイメージペアには6つの条件属性がアノテートされ、貴重な高レベルなコンテキスト情報を提供する。
本稿では,マルチモーダルコントリビューションを適応的に再割り当てする新しいPCDFを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:50:37 GMT)
UniVector: Unified Vector Extraction via Instance-Geometry Interaction [28.1] Uniは単一のモデル内で複数のベクトルタイプを抽出するためにインスタンス幾何学的相互作用を利用する統一VEフレームワークである。
Uniは、ベクトルをインスタンスレベルの情報と幾何学レベルの情報の両方を含む構造化クエリとしてエンコードし、相互レベルのコンテキスト交換のための対話モジュールを通じて繰り返し更新する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:39:25 GMT)
CE-GPPO: Coordinating Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning [28.0] 政策エントロピーは、訓練中の探検と搾取のバランスを反映している。
既存の方法は、クリッピング機構により、低確率トークンから貴重な勾配信号を捨てる。
textbfGradient textbfPreserving textbfPolicy textbfOptimization を用いて textbfCoordinating textbfEntropy を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:41:22 GMT)
OpenDerisk: An Industrial Framework for AI-Driven SRE, with Design, Implementation, and Case Studies [27.9] OpenDeriskは、SRE(Site Reliability Engineering)チーム向けに設計された、オープンソースのマルチエージェントフレームワークです。
OpenDeriskは、診断ネイティブなコラボレーションモデル、プラグイン可能な推論エンジン、知識エンジン、標準化されたプロトコルを統合している。
評価の結果,OpenDeriskは精度と効率の両方で最先端のベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:59:58 GMT)
Assessing the Geographic Generalization and Physical Consistency of Generative Models for Climate Downscaling [27.8] 本稿では,最近の最先端ディープラーニングモデルをベンチマークし,その性能と信頼性を評価するために物理に着想を得た診断手法を提案する。
実験の結果,CorrDiffのようなモデルの性能は高いように見えるが,他の領域への一般化に苦慮していることがわかった。
本稿では、地理的一般化を実証的に改善するパワースペクトル密度損失関数を導入するという単純な初期解を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:26:29 GMT)
Generating High Dimensional User-Specific Wireless Channels using Diffusion Models [27.8] 本稿では拡散モデルを用いて合成無線チャネルデータを生成する新しい手法を提案する。
提案手法では,条件付き拡散暗黙的モデル (cDDIM) を用いて,ユーザ位置とマルチアンテナチャネル特性の関係を効果的に把握する。
我々は、ユーザ位置を条件入力として合成された高忠実度チャネルサンプルを生成し、測定不足を克服するために、より大きな拡張データセットを作成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:52:41 GMT)
MULTI: Multimodal Understanding Leaderboard with Text and Images [27.8] そこで本研究では,中国のマルチモーダルデータセットであるMultiについて述べる。
マルチモデルは、画像テキスト理解、複雑な推論、知識リコールを含む実世界の検査基準を用いてモデルを評価する。
Qwen2-VL-72BはMulti-Eliteで76.9%,Multi-Eliteで53.1%の精度で評価された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:10:38 GMT)
NOSA: Native and Offloadable Sparse Attention [27.6] 我々は、KVキャッシュオフロードをサポートするために設計された訓練可能なスパースアテンションフレームワークであるNOSAを提案する。
我々はNOSAが復号スループットを最大2.3倍に向上させながら、ほぼロスレス性能を保っていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:33:16 GMT)
Shortcutting Pre-trained Flow Matching Diffusion Models is Almost Free Lunch [27.5] 本稿では,大規模な事前学習フローマッチング拡散モデルを効率的な数ステップサンプリング器にショートカットする,超効率的なポストトレーニング手法を提案する。
提案手法は, 電子誘導蒸留から高速に学習し, 効率よく訓練し, A100日未満で3段階のフラックスを発生させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:19:05 GMT)
The Mechanistic Emergence of Symbol Grounding in Language Models [27.4] シンボルグラウンド(Smbol grounding)は、シンボルが現実世界の感覚運動者体験に接続することで、その意味を得る方法を記述する。
最近の研究は、明確な接地目的を使わずに、大規模に訓練された(視覚言語)モデルに接地が現れるという予備的な証拠を示している。
この結果から,記号接地が言語モデルに現れることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:56:15 GMT)
Tandem Training for Language Models [27.2] 我々は、より弱い協力者に対して理解できないソリューションをモデルに作り出す方法を開発した。
本稿では,凍結弱モデルから間欠的にランダムにトークンをサンプリングする言語モデルに対するタンデムトレーニングを提案する。
GSM8K数学推論タスクでは、タンデムトレーニングはモデルを確実にジャーゴンを放棄し、より弱いパートナーに言語を適用するように教える。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:48:16 GMT)
TMT: Cross-domain Semantic Segmentation with Region-adaptive Transferability Estimation [27.2] 本稿では、転送可能性誘導によるクロスドメイン表現学習を強化するために設計された領域適応型フレームワークを提案する。
まず、画像は構造的および意味的類似性によってグループ化され、動的にコヒーレントな領域に分割し、その領域の移動可能性を局所化レベルで推定する。
次に、領域レベルの転送可能性マップを直接ViTの自己保持機構に組み込んで、転送可能性の低い領域と意味の不確実性の高い領域に適応的に注目することを可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:10:49 GMT)
ChA-MAEViT: Unifying Channel-Aware Masked Autoencoders and Multi-Channel Vision Transformers for Improved Cross-Channel Learning [27.1] ChA-MAEViTは、マルチチャネルイメージングチャネル間の特徴学習を強化するMAEベースの手法である。
我々はChA-MAEViTが最先端のMCI-ViTを3.0-21.5%上回っていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:17:25 GMT)
Time-Varying Optimization for Streaming Data Via Temporal Weighting [26.7] 時間変動最適化レンズを用いてストリーミングデータから学習する問題について検討する。
我々は,(1)全ての試料を等しく扱う一様重みと(2)古いデータの影響を幾何的に減衰させる割引重みの2つの具体的な重み付け戦略に焦点をあてる。
数値シミュレーションにより理論的知見を検証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:18:17 GMT)
Exploratory Causal Inference in SAEnce [25.9] データから直接治療の未知の効果を発見することを提案する。
このために、未構造化データを事前訓練された基礎モデルを介して有意義な表現に変換し、スパースオートエンコーダを介して解釈する。
神経レベルで重要な因果効果を発見することは、複数のテストの問題と影響の絡み合いのために簡単ではない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:30:54 GMT)
Element2Vec: Build Chemical Element Representation from Text for Property Prediction [25.9] 化学元素の物性データは材料設計と製造に不可欠である。
従来の手法では、他の要素の性質や関連する性質を数値解析による予測に用いているが、複雑な関係のモデル化に失敗することが多い。
近年,プロパティ推定のための言語モデルなど,高度なAIツールの探索が試みられている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:44:48 GMT)
Multi-Scale High-Resolution Logarithmic Grapher Module for Efficient Vision GNNs [25.6] ビジョングラフニューラルネット(ViG)は、従来の畳み込みニューラルネット(CNN)とトランスフォーマー(ViT)に対抗して、ビジョンタスクにおける約束を実証した。
本稿では,長距離リンク数を制限することで性能を向上させるため,新たなグラフ構築手法LSGCを提案する。
当社の最小モデルであるTi-LogViGは、ImageNet-1Kの平均トップ1精度が71.7%、標準偏差が0.2%である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:47:09 GMT)
Visible Yet Unreadable: A Systematic Blind Spot of Vision Language Models Across Writing Systems [25.5] 先進視覚言語モデル(VLM)がこのレジリエンスを共有しているかどうかを検討する。
我々は、異なる筆記システムにまたがる2つの心理物理学的なベンチマークを構築した。
クリーンテキスト上での強いパフォーマンスにもかかわらず、現代のVLMはこれらの摂動の下で深刻な低下を見せている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:57:17 GMT)
Model-agnostic Adversarial Attack and Defense for Vision-Language-Action Models [25.5] VLA(Vision-Language-Action)モデルは、ロボット学習において革命的な進歩を遂げている。
この進歩にもかかわらず、その敵意の強固さは未解明のままである。
本稿では,VLAモデルに対する敵パッチ攻撃と対応する防御戦略の両方を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:42:44 GMT)
CoDS: Enhancing Collaborative Perception in Heterogeneous Scenarios via Domain Separation [25.4] 協調的知覚は、自律運転における個人の知覚を改善することが証明されている。
ほとんどのメソッドは、すべてのエージェントに対して同一のエンコーダを仮定するが、これらのモデルが現実世界のアプリケーションにデプロイされる際には正しくは保たない。
既存の手法は通常、隣接する特徴とエゴ車の特徴とを一致させるが、これはドメインギャップからのノイズに弱い。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:29:14 GMT)
Hydraulis: Balancing Large Transformer Model Training via Co-designing Parallel Strategies and Data Assignment [25.4] 我々は並列戦略とデータ割り当てを協調的に最適化するHydraulisを開発する。
実験の結果、Hydraulis は既存のシステムよりも 1.32-2.66 倍高い性能を示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:46:28 GMT)
Risk-adaptive Activation Steering for Safe Multimodal Large Language Models [25.3] 現代のAIモデルの鍵となる課題の1つは、悪意のあるものを拒否しながら、クエリを無視するのに役立つ応答を提供することである。
本稿では,安全クリティカルな画像領域への相互注意を強化するためにクエリを再構成することを提案する。
評価されたリスクを使用して、アクティベーションを適応的に操り、反復的な出力調整のオーバーヘッドなしに安全で有用な応答を生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:57:17 GMT)
Toward Efficient Inference Attacks: Shadow Model Sharing via Mixture-of-Experts [24.9] 機械学習モデルは、トレーニングデータから機密情報を露出する推論攻撃に対して脆弱であることが多い。
シャドウモデル技法は、メンバーシップ推論のような攻撃に一般的に使用される。
本稿では、複数の共有モデルを構築し、それらを共同で訓練する新しいシャドウプールトレーニングフレームワークSHAPOOLを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:50:40 GMT)
HyMiRec: A Hybrid Multi-interest Learning Framework for LLM-based Sequential Recommendation [24.7] HyMiRecは、大規模言語モデルのためのハイブリッド多目的シーケンシャルレコメンデーションフレームワークである。
我々は,コサイン類似性に基づく残余のコードブックを導入し,ユーザの履歴埋め込みの効率的な圧縮と再利用を可能にした。
テストによると、HyMiRecは現実世界のレコメンデーションシステムに一貫した改善をもたらす。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:45:59 GMT)
Detecting Distillation Data from Reasoning Models [24.6] 推論蒸留は、大規模言語モデルの推論能力を高めるための効率的で強力なパラダイムとして登場した。
しかし, 推理蒸留は, 必然的にベンチマーク汚染を引き起こす可能性があり, 蒸留データセットに含まれる評価データは, 蒸留モデルの性能指標をインフレーションすることができる。
本稿では, 生成した出力トークンの確率パターンを利用する, 新規で効果的なToken Probability Deviation(TBD)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:23:27 GMT)
STAR: Boosting Time Series Foundation Models for Anomaly Detection through State-aware Adapter [24.5] STAR(State-aware AdapteR)は、時系列基礎モデル(TSFM)の能力を高めるために設計されたプラグイン・アンド・プレイモジュールである。
我々は、学習可能なステートメモリを通じて状態変数の複雑な分類的セマンティクスをキャプチャするアイデンティティ誘導ステートを設計する。
本研究では,現状条件付き低ランク適応パラメータを動的に生成し,バックボーンモデルに状態変数の影響を柔軟に注入する条件付きボトルネック適応器を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:17:34 GMT)
MVCustom: Multi-View Customized Diffusion via Geometric Latent Rendering and Completion [24.5] 本稿では,複数視点のポーズ制御とカスタマイズを共同で実現することを目的とした,新しいタスクであるマルチビューカスタマイズを提案する。
MVCustomは,多視点の一貫性とカスタマイズの整合性の両方を実現するために設計された,新しい拡散ベースのフレームワークである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:00:26 GMT)
TBStar-Edit: From Image Editing Pattern Shifting to Consistency Enhancement [24.5] 本稿では,eコマースドメインに適した画像編集モデルTBStar-Editを紹介する。
TBStar-Editは、製品の外観とレイアウトの整合性を保ちながら、正確かつ高忠実な画像編集を実現する。
自己提案型eコマースベンチマークにおいて,TBStar-Editの広範な評価を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:07:17 GMT)
GCRank: A Generative Contextual Comprehension Paradigm for Takeout Ranking Model [24.4] 一般的なランキングモデルは、しばしば断片化されたモジュールと手作りの機能に依存している。
本稿では,文脈理解タスクとしてランキングを再構成する新しい生成フレームワークを提案する。
本手法を大規模フードデリバリー広告プラットフォームに導入することに成功している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:42:04 GMT)
DriveCritic: Towards Context-Aware, Human-Aligned Evaluation for Autonomous Driving with Vision-Language Models [24.2] DriveCriticは、2つの重要なコントリビューションを特徴とする新しいフレームワークです。
データセットは、コンテキストが正しい判断に不可欠である、困難なシナリオのキュレートされたコレクションである。
DriveCriticモデルは、視覚的コンテキストとシンボル的コンテキストを統合することで、軌跡ペア間の調整を学ぶ。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:00:38 GMT)
Beyond Static LLM Policies: Imitation-Enhanced Reinforcement Learning for Recommendation [23.9] 大規模言語モデル(LLM)は、多様なデジタルプラットフォームにまたがってパーソナライズされたコンテンツを配信することによって、ユーザエンゲージメントを高める重要なツールとなっている。
LLMを主要なレコメンデーションポリシとして直接デプロイすることは、永続的なレイテンシの問題を含む、注目すべき課題を提示する。
本稿では,LLM生成軌道からの模倣学習を利用した新しいオフライン強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:28:29 GMT)
To Steer or Not to Steer? Mechanistic Error Reduction with Abstention for Language Models [23.9] メカニスティックエラー低減法(Mechanistic Err Reduction with Abstention, MERA)について紹介する。
MERAは、選択的かつ適応的な介入によってエラーを軽減するために、言語モデル(LM)をステアリングするための原則化されたフレームワークである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:35:10 GMT)
An AI-Driven Multimodal Smart Home Platform for Continuous Monitoring and Assistance in Post-Stroke Motor Impairment [23.9] 術後患者の在宅リハビリテーションを継続するためのスマートホームプラットフォームを提案する。
プランタ圧インソールは、最大94%の精度で、ユーザーを運動回復段階に分類する。
カメラやマイクなどの環境センサーとともに、オプションのヘッドマウントアイトラッキングモジュールは、家庭用デバイスのシームレスなハンズフリーコントロールをサポートする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:33:15 GMT)
Accurate myocardial T1 mapping at 5T using an improved MOLLI method: A validation study [23.7] 本研究の目的は, 5T MRIシステムのための, 正確かつ臨床的に応用可能な心筋T1マッピング技術を開発することである。
The method is based on a 5-(3)-3 MOLLI sequence, called combined-correction MOLLI (coMOLLI)。
この方法はファントム実験で検証され、21人の健康なボランティアと9人の患者で検証された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:29:15 GMT)
Convergence and sample complexity of natural policy gradient primal-dual methods for constrained MDPs [23.6] 線形決定(MDP)の割引最適率の解法として, 自然政策勾配法を用いる。
また、2つのサンプルベースNPG-PDアルゴリズムに対して有限サンプル保証を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:33:12 GMT)
Big Reasoning with Small Models: Instruction Retrieval at Inference Time [23.5] 小型言語モデル(SLM)は、ローカルハードウェア上で効率的に動作し、強力なプライバシ、低コスト、環境への影響の低減を提供するため、ますます魅力的になっている。
我々は、SLMがスクラッチから生成するのではなく、構造化推論手順を検索する推論時間における命令介入によるこの制限に対処する。
MedQA(メディカルボード試験)、MMLU専門家法、MathQAの3Bから14Bパラメータのモデルを用いて、追加の微調整を行わずに、この枠組みを評価する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:51:13 GMT)
ESI: Epistemic Uncertainty Quantification via Semantic-preserving Intervention for Large Language Models [23.4] 不確実性定量化(UQ)はモデルの信頼性を向上させるための有望なアプローチであるが、Large Language Models(LLM)の不確実性は自明ではない。
本稿では,意味保存介入前後のモデル出力の変動を計測する新しいグレイボックス不確実性定量化手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:46:43 GMT)
A11YN: aligning LLMs for accessible web UI code generation [23.4] A11ynは、アクセシビリティに準拠したWeb UIを確実に生成するために、コード生成の大きな言語モデルを整列させる最初の方法である。
A11ynは、Web Content Accessibility Guidelines(WCAG)の違反を罰する新しい報酬関数を最適化する
評価のために、パブリックWebページから300の現実世界のWeb UIリクエストをグラウンドし、手動でキュレートしたベンチマークであるRealUIReq-300を紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:42:29 GMT)
Mixture of Cognitive Reasoners: Modular Reasoning with Brain-Like Specialization [23.3] Mixture of Cognitive Reasoners (MiCRo)は、専門家間で機能的な特殊化を誘導するモジュラーアーキテクチャである。
MiCRoは、標準言語モデルよりも3つの大きなアドバンテージを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:04:23 GMT)
Leveraging 2D Priors and SDF Guidance for Dynamic Urban Scene Rendering [23.2] より堅牢なオブジェクト表現を生成するために,サイン付き距離関数(SDF)と3次元ガウス分割(DGS)を統合する新しい手法を提案する。
都市景観におけるLiDARデータを使用しなくても,レンダリング指標の最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:21:36 GMT)
Benchmarking is Broken -- Don't Let AI be its Own Judge [22.9] 私たちは、AIを評価するための現在のlaissez-faireアプローチは持続不可能である、と論じます。
PeerBenchは、コミュニティが管理し、熟達した評価青写真である。
私たちのゴールは、完全性を回復し、真に信頼できるAI進歩の手段を提供するための評価の道を開くことです。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:58:21 GMT)
h1: Bootstrapping LLMs to Reason over Longer Horizons via Reinforcement Learning [22.9] 大規模言語モデルは短期水平推論タスクでは優れているが、水平線長の推論によって性能が低下する。
既存のアプローチでは、推論時の足場やコストのかかるステップレベルの監視に依存しています。
本稿では,既存短軸データのみを用いて,長軸推論機能をブートストラップするスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:57:26 GMT)
Provably Invincible Adversarial Attacks on Reinforcement Learning Systems: A Rate-Distortion Information-Theoretic Approach [22.9] マルコフ決定プロセス(MDP)のための強化学習(RL)は多くのセキュリティ関連アプリケーションで登場している。
本稿では,RLに対する「不可逆的」あるいは「不可逆的」な逆攻撃を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:48:19 GMT)
MemoTime: Memory-Augmented Temporal Knowledge Graph Enhanced Large Language Model Reasoning [22.9] 時間的知識グラフは時間的推論の信頼できる情報源を提供する。
既存の TKG ベースの LLM 推論手法は、4つの大きな課題に苦慮している。
メモリ拡張時間知識グラフフレームワークであるMemoTimeを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:43:31 GMT)
Random Scaling for Emergent Capabilities [22.9] 測定値の急激なブレークスルーは,種子間の分布の連続的な変化によって生じることを示す。
逆スケーリングのケーススタディでは、成功したランの確率が低下しても、成功したランの平均性能は単調に上昇することを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:17:35 GMT)
ICA-RAG: Information Completeness Guided Adaptive Retrieval-Augmented Generation for Disease Diagnosis [22.8] ICA-RAGは疾患診断におけるRAG信頼性を高めるための新しいフレームワークである。
適応制御モジュールを使用して、入力の情報完全性に基づいて検索の必要性を評価する。
3つの中国の電子カルテデータセットの実験により、ICA-RAGはベースライン法を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:35:56 GMT)
Group-Wise Optimization for Self-Extensible Codebooks in Vector Quantized Models [22.8] VQ-VAEは自己教師付き学習を利用して、コードブックの最も近いベクトルを用いて連続ベクトルを表現する。
既存のアプローチでは暗黙の静的コードブックを使用するか、コードブック全体を共同で最適化するが、これらの手法はコードブックの学習能力を制限している。
コードブック上でグループワイズ最適化を行うグループVQを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:14:22 GMT)
Assessing LLM Reasoning Through Implicit Causal Chain Discovery in Climate Discourse [22.7] この研究は、大規模言語モデルの機械的因果推論能力を精査する。
我々は、因果連鎖構造において与えられた因果関係をリンクする全ての中間因果ステップを生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:15:00 GMT)
Near-Optimality of Contrastive Divergence Algorithms [22.5] パラメトリックレートが$O(n-1 / 2)$であることを示す。
さらに、CDは、その分散がクラムアーラオの下界に近いという意味で、ほぼ最適であることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:35:58 GMT)
GatePro: Parameter-Free Expert Selection Optimization for Mixture-of-Experts Models [22.5] GateProは、専門家選択の多様性を直接促進する新しいパラメータフリー手法である。
我々の総合的な評価は、モデルスケールとベンチマークにおけるGateProの有効性を示している。
このアプローチは、追加の学習可能なパラメータなしで、任意のトレーニングフェーズ中にホットスワップできる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:47:45 GMT)
D-SMART: Enhancing LLM Dialogue Consistency via Dynamic Structured Memory And Reasoning Tree [22.4] 大規模言語モデル(LLM)は、拡張された多ターン対話において、現実的な矛盾と論理的崩壊を示すことが多い。
マルチターン対話の一貫性を維持するために設計されたモデルに依存しないフレームワークであるD--101を提案する。
マルチターン対話の整合性を測定するために,NLIに基づく新しいメトリクスを導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:53:11 GMT)
Breadcrumbs Reasoning: Memory-Efficient Reasoning with Compression Beacons [22.1] 本稿では,KVキャッシュを学習用専用トークンで周期的に圧縮することを提案する。
我々は, この圧縮を行うために, 改良された共同蒸留および強化学習フレームワークを用いてモデルを訓練する。
本手法は,キャッシュ圧縮のないモデルとトレーニング不要な圧縮技術の両方と比較して,優れたメモリ精度のフロンティアを実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:57:21 GMT)
TempFlow-GRPO: When Timing Matters for GRPO in Flow Models [22.0] 本稿では,フローベース生成に固有の時間構造を捕捉し,活用する,原理的なGRPOフレームワークを提案する。
新しい革新は、基礎となる生成力学を尊重する時間的に認識された最適化をモデルに与える。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:35:29 GMT)
Uni-LoRA: One Vector is All You Need [21.9] Low-Rank Adaptation (LoRA) は、大規模言語モデルのための事実上のパラメータ効率の微調整(PEFT)手法となっている。
本稿では,これらの LoRA 変種が用いたパラメータ空間削減戦略を統一的な枠組みで定式化できることを示す。
Uni-LoRAの統一的なビューの下では、LLM全体のLoRAパラメータを再構築するためには、単一のトレーニング可能なベクトルしか必要としない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:31:07 GMT)
NoisePrints: Distortion-Free Watermarks for Authorship in Private Diffusion Models [21.9] 本稿では,拡散過程の初期化に使用するランダムシードを,生成過程を変更することなく,著者の証明として利用する軽量な透かし方式を提案する。
実験では,画像とビデオの複数の拡散モデル上でノイズプリンツを検証し,シードと出力のみを用いた効率的な検証を実証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:50:45 GMT)
LazyEviction: Lagged KV Eviction with Attention Pattern Observation for Efficient Long Reasoning [21.8] 拡張推論シーケンスでは、キー値(KV)キャッシュの増加によるGPUメモリオーバーヘッドが大幅に増加する。
既存のKVキャッシュ圧縮手法は、メモリボトルネックを軽減するが、長い推論タスクに苦労する。
トークンの繰り返しパターンに基づいた優先順位付けによる遅延繰り返しトークンを保持する観測窓ベースのラッチ消去フレームワークであるLazyEvictionを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:55:31 GMT)
TimeRecipe: A Time-Series Forecasting Recipe via Benchmarking Module Level Effectiveness [21.8] TimeRecipeはモジュールレベルで時系列予測メソッドを体系的に評価するフレームワークである。
TimeRecipeは、個々のコンポーネントの有効性を評価するために、1万以上の実験を行います。
以上の結果から,設計空間の徹底的な探索により,既存の最先端手法よりも優れたモデルが得られることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:30:31 GMT)
Adaptive Reasoning Executor: A Collaborative Agent System for Efficient Reasoning [21.8] 思考の連鎖と深い推論は複雑なタスクのパフォーマンスを大幅に向上させる。
すべての問題に深い推論を適用するのは、計算コストがかかる。
本稿では,小規模および大規模言語モデルを統合した補完エージェントシステムを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:59:07 GMT)
Beyond Correctness: Rewarding Faithful Reasoning in Retrieval-Augmented Generation [21.7] 本稿では,RLに基づく検索エージェントを評価するための総合的な評価フレームワークを提案する。
忠実な推論を促進するために,よりきめ細かな忠実さ報酬を強化学習プロセスに統合する新しい枠組みであるVERITASを紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:17:52 GMT)
VisCoP: Visual Probing for Video Domain Adaptation of Vision Language Models [21.5] VLM(Large Vision-Language Models)は、一般的な視覚的推論タスクにおいて優れるが、新しいドメインに適用した場合に顕著な性能劣化を示す。
既存のドメイン適応は、異なるVLMコンポーネントを微調整するが、ドメイン固有の特徴学習や、それ以前の機能を破滅的に忘れてしまうことがしばしばある。
本研究では,VLMの視覚エンコーダを学習可能な視覚プローブのコンパクトなセットで拡張する視覚コンテキスト型探索(VisCoP)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:59:52 GMT)
Quantum Approximate Optimization Algorithm for Maximum Likelihood Detection in Massive MIMO [21.5] 本稿では,二項記号の最大度検出解法をQAOAに基づいて提案する。
最先端のQAOAベースのML検出アルゴリズムと比較して,提案手法は1レベルQAOAのより普遍的でコンパクトな期待値式を持つ。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:37:21 GMT)
Spatial-DISE: A Unified Benchmark for Evaluating Spatial Reasoning in Vision-Language Models [21.3] 我々は,タスクを4つの基本四分節に分類する認知的基盤の分類に基づく統合ベンチマークtextbfSpatial-DISEを提案する。
データ不足の問題に対処するため,多様かつ検証可能な空間的推論問題を生成するスケーラブルで自動化されたパイプラインを開発した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:44:01 GMT)
Capture, Canonicalize, Splat: Zero-Shot 3D Gaussian Avatars from Unstructured Phone Images [21.2] キャプチャー、カノニカライズ、Splat」パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的四角形アバターを生産する。
この"Capture, Canonicalize, Splat"パイプラインは、非構造化写真から魅力的な現実主義と堅牢なアイデンティティ保存を備えた静的な四角形アバターを生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:36:28 GMT)
Cyclic Self-Supervised Diffusion for Ultra Low-field to High-field MRI Synthesis [20.7] 低磁場MRIは安価で、よりアクセシビリティが高く、安全であるが、低解像度で信号対雑音比が低い。
画像のコントラストにおいて、解剖学的な忠実さを保ち、きめ細かな構造の詳細を高め、ドメインギャップを埋める必要がある。
実低磁場MRIデータから高磁場MRI合成を行うために, 楕円型自己教師拡散(CSS-Diff)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:41:54 GMT)
ReasoningShield: Safety Detection over Reasoning Traces of Large Reasoning Models [20.3] ReasoningShieldは、Large Reasoning Models (LRMs)におけるChain-of-Thoughts (CoTs)をモデレートするためのフレームワークである
ReasoningShieldは最新のパフォーマンスを実現し、LlamaGuard-4のようなタスク固有のツールを35.6%、GPT-4oのような汎用商用モデルを15.8%向上させた。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:47:26 GMT)
Evaluating Sakana's AI Scientist: Bold Claims, Mixed Results, and a Promising Future? [20.2] サカナは先日,AI Scientistを導入して,自律的に研究を行うこと,すなわち,私たちがARI(Artificial Research Intelligence)と呼ぶものを達成したことを示唆している,と主張している。
AI Scientistの評価は、重大な欠点を明らかにします。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:03:49 GMT)
Self-Predictive Representations for Combinatorial Generalization in Behavioral Cloning [20.2] 後続表現による長距離時間一貫性がいかに一般化を促進するかを示す。
次に,GCBCのための単純な表現学習目的である$textBYOL-gamma$を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:29:39 GMT)
VoxelPrompt: A Vision Agent for End-to-End Medical Image Analysis [20.0] VoxelPromptは、自由形式の放射線学的タスクに取り組むエンドツーエンドの画像分析エージェントである。
共同で訓練された適応可能なビジョンネットワークを呼び出すために実行可能なコードを生成する。
数百の解剖学的および病理学的特徴を記述し、複雑な形態学的特性を計測し、病変の特徴をオープン言語で解析することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:42:16 GMT)
Interventional Processes for Causal Uncertainty Quantification [20.0] 継続的治療下での介入因果関数に対する不確実性をモデル化するフレームワークIMPspecを紹介する。
IMPspecは、後方信頼区間を校正するスペクトルアルゴリズムであるトラクタブルトレーニングと推論を出力し、初期のGP-on-RKHS法の不適合および分散崩壊経路を回避する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:55:48 GMT)
Real-Time Crowd Counting for Embedded Systems with Lightweight Architecture [19.9] 我々は,クラウドカウントタスクのためのステムエンコーダデコーダ構造を持つ超リアルタイムモデルを設計する。
提案したネットワークはNVIDIA GTX 1080Tiで381.7 FPS、NVIDIA Jetson TX1で71.9 FPSを達成した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:58:46 GMT)
Are High-Degree Representations Really Unnecessary in Equivariant Graph Neural Networks? [19.9] E(3)対称性を取り入れた等価グラフニューラルネットワーク(GNN)は、様々な科学的応用において大きな成功を収めている。
本稿では、$k$-fold回転や正則多面体を含む対称構造上の同変GNNの表現性について検討する。
我々は,高次ステアブルベクトルを組み込んだEGNNの高次バージョンであるHEGNNを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:01:39 GMT)
What Does Neuro Mean to Cardio? Investigating the Role of Clinical Specialty Data in Medical LLMs [19.2] 我々は、S-MedQAを用いて、医療QAの知識集約シナリオにおける臨床専門データの役割について検討する。
以上より, 1) 臨床専門職のトレーニングは, 必ずしもその専門職で最高の成績を収めるとは限らないこと, 2) LLMの専門職によらず, 臨床関連用語のトークン確率は, 全専門職で一貫して増加することが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:30:11 GMT)
CSI-BERT2: A BERT-inspired Framework for Efficient CSI Prediction and Classification in Wireless Communication and Sensing [19.1] CSI予測と分類タスクのための統合フレームワークCSI-BERT2を提案する。
このフレームワークはBERTに適応し、双方向の自己認識機構を通じてCSI配列間の複雑な関係をキャプチャする。
CSI-BERT2は、すべてのタスクで最先端のパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:56:17 GMT)
Diffusion-Classifier Synergy: Reward-Aligned Learning via Mutual Boosting Loop for FSCIL [19.1] FSCIL(Few-Shot Class-Incremental Learning)は、最小限の例から新しいクラスを逐次学習するモデルに挑戦する。
現在のFSCIL法は、限られたデータセットに依存するため、一般化に苦慮することが多い。
本稿では拡散モデルとFSCIL分類器の相互強化ループを確立する新しいフレームワークであるDiffusion-Classifier Synergy(DCS)を紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:30:53 GMT)
Calibrated Predictive Lower Bounds on Time-to-Unsafe-Sampling in LLMs [19.0] 我々は、生成モデルのための新しい安全対策である、時間対安全サンプリングを導入する。
安全でない出力は、よく整列されたモデルではまれであるため、事実上のサンプリング予算では観測されないことがある。
本稿では,厳密なカバレッジ保証付きプロンプトの時間とアンセーフサンプリングに基づいて,低予測境界(LPB)を構築するための新しいキャリブレーション手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:14:58 GMT)
DMTrack: Deformable State-Space Modeling for UAV Multi-Object Tracking with Kalman Fusion and Uncertainty-Aware Association [18.7] 無人航空機(UAV)からの多目的追跡(MOT)は、予測不可能な物体の動きによる固有の課題を提示する。
UAVベースのMOTに適した変形可能なモーショントラッキングフレームワークであるDMTrackを提案する。
本手法は, 外観モデルなしで動作し, 競争効率を保ち, 堅牢なUAVトラッキングの実現性を強調した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:54:25 GMT)
InstantSfM: Fully Sparse and Parallel Structure-from-Motion [18.5] Structure-from-Motion (SfM) はカメラのポーズとシーンの形状を補正する手法である。
GLOMAPは、大規模なシナリオを扱う際に、CPUに固有のバンドル調整(BA)やグローバル位置決め(GP)を実装する。
本稿では,標準SfMパイプラインの各臨界ステージを高速化するために,GPU並列計算の潜在能力を最大限に活用する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:58:05 GMT)
Can Large Language Models Master Complex Card Games? [18.4] 大規模言語モデル(LLM)は、様々なタスクにまたがって顕著な機能を示した。
高品質なデータを教師付き微調整することで,LLMが強力なゲームAIの性能にアプローチ可能であることを示す。
LLMは複雑なゲームをマスターする際の一般的な能力の低下を経験するが、この低下をある程度の一般的な命令データを統合することで軽減することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:38:52 GMT)
Evaluating and Mitigating Social Bias for Large Language Models in Open-ended Settings [18.3] 既存のデータセットBBQをOpen-BBQに拡張し、オープンエンド環境でのLCMの社会的バイアスを評価する。
文や段落をラベル付けすることで,オープンなコンテンツからバイアスを検出する評価手法を開発した。
この問題を解決するために、構造化例と明示的な連鎖推論を組み合わせたICL法であるComposite Promptingを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:59:32 GMT)
FLEX: A Largescale Multimodal, Multiview Dataset for Learning Structured Representations for Fitness Action Quality Assessment [18.3] AQA(Action Quality Assessment)は、人間の行動の質を定量化し、フィードバックを提供する技術である。
本研究では,表面筋電図(SEMG)信号をAQAに組み込んだ最初のマルチモーダル・マルチアクション・大規模データセットであるFLEXデータセットを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:40:34 GMT)
TENDE: Transfer Entropy Neural Diffusion Estimation [18.3] 本研究では,条件付き相互情報を用いた転送エントロピー推定手法であるTENDE(Transfer Entropy Neural Diffusion Estimation)を提案する。
既存のニューラルネットワーク推定器や、合成ベンチマークや実データにまたがる最先端のアプローチと比較して、精度と堅牢性は優れています。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:08:19 GMT)
Automated Network Protocol Testing with LLM Agents [18.1] NeTestLLMは、エンドツーエンドのネットワークプロトコルテストにマルチエージェント大規模言語モデル(LLM)を利用する。
実験では、NeTestLLMはOSPF、RIP、BGPで4,632件のテストケースを生成し、41の歴史的FRRoutingバグを現在の国家標準で11件と比較した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:55:15 GMT)
Seeing and Knowing in the Wild: Open-domain Visual Entity Recognition with Large-scale Knowledge Graphs via Contrastive Learning [17.6] オープンドメインのビジュアルエンティティ認識は、画像に描かれたエンティティを、広範に進化する現実世界の概念の集合に識別し、リンクすることを目的としている。
本稿では,画像とテキスト記述を共有意味空間に組み合わせた知識誘導型コントラスト学習フレームワークを提案する。
我々の実験は、視覚的、テキスト的、構造化された知識を用いることで、特に稀で目に見えないエンティティの精度が大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:33:36 GMT)
Inverse designed Hamiltonians for perfect state transfer and remote entanglement generation, and applications in superconducting qubits [17.4] ハミルトニアン逆エンジニアリングは、特定の量子進化やターゲット状態の準備のためのプロトコルの設計を可能にする。
我々は、ドームモデルと呼ばれるハミルトン系のクラスを構築し、システムのノイズに対する堅牢性を大幅に改善する。
我々の研究は、急速かつ柔軟なハミルトン工学を可能にするチューナブルカプラを用いた超伝導量子ビットの実証に特に適している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:16:51 GMT)
SHIELD: Classifier-Guided Prompting for Robust and Safer LVLMs [17.3] ShiELDは軽量でモデルに依存しない事前処理フレームワークである。
厳密な安全分類と、カテゴリー固有のガイダンスと明示的な行動の2つがある。
我々の方法はプラグアンドプレイであり、無視できるオーバーヘッドを発生させ、新しい攻撃タイプに容易に拡張できる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:27:46 GMT)
Mismatch Aware Guidance for Robust Emotion Control in Auto-Regressive TTS Models [17.1] Free Guidance (CFG) は、迅速なアライメントを強化するための重要な技術である。
本稿では,検出ミスマッチの異なるレベルに適応的なCFG方式を提案する。
提案手法は,AR TTSモデルの感情表現性を向上することを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:37:16 GMT)
Týr-the-Pruner: Structural Pruning LLMs via Global Sparsity Distribution Optimization [16.6] T'yr-the-Prunerは、効率的なエンドツーエンド検索ベースのグローバルな構造解析フレームワークである。
実効的な局所刈り取りと,スーパーネット構築を改善するための予測誤差蓄積手法を導入する。
以上の結果から,T'yr-the-Prunerは高密度モデルの性能の97%を保ちながら,最先端構造解析を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:56:54 GMT)
Geometry-Aware Global Feature Aggregation for Real-Time Indirect Illumination [16.6] 画面空間における拡散間接照明の予測を行う学習ベース推定器を提案する。
直接照明と組み合わせて、世界的に照射された高ダイナミックレンジの結果を合成する。
本手法は, 様々な色の照明や環境照明など, 複雑な照明の処理に優れる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:06:55 GMT)
Breaking Memorization Barriers in LLM Code Fine-Tuning via Information Bottleneck for Improved Generalization [16.5] 本稿では,コードデータの隠蔽表現にIBペナルティを適用して,突発的で記憶された特徴を圧縮するIB-FTを提案する。
実験の結果、IB-FTは暗記障壁を実質的に緩和し、トップ1のパフォーマンスを改善し(Pass@$1$)、より厳密なマルチサンプル計量Pass@$k(m)$ではるかに安定したゲインを得ることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:24:38 GMT)
Mitigating Hallucinations in Vision-Language Models through Image-Guided Head Suppression [16.5] 大型視覚言語モデル (LVLM) はしばしば幻覚に悩まされ、視覚的文脈と一致しないテキストを生成する。
推論時間介入による幻覚の低減を目的とした既存の手法は、遅延を著しく増加させる。
本稿では,タスクに依存しない注意誘導型頭部抑制戦略であるSPINについて述べる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:53:06 GMT)
Tensor Gaussian Processes: Efficient Solvers for Nonlinear PDEs [16.4] TGPSは偏微分方程式の機械学習解法である。
1次元GPの集合を学習する作業を減らす。
既存の手法に比べて精度と効率が優れている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:23:21 GMT)
MedDINOv3: How to adapt vision foundation models for medical image segmentation? [16.3] 我々はDINOv3を医用セグメンテーションに適応するためのシンプルで効果的なフレームワークであるMedDINOv3を紹介した。
我々は,多段階DINOv3レシピを用いて3.87M軸CTスライスをキュレートしたCT-3Mを用いて,ドメイン適応型プレトレーニングを行う。
MedDINOv3は4つのセグメンテーションベンチマークで最先端のパフォーマンスにマッチする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:42:10 GMT)
GRIDAI: Generating and Repairing Intrusion Detection Rules via Collaboration among Multiple LLM-based Agents [16.2] GRIDAIは侵入検知ルールの自動生成と修復のための新しいエンドツーエンドフレームワークである。
GRIDAIは新しい攻撃サンプルと既存のルールの関係を特定し、新しい攻撃と変種を扱うためのルールを効率的に生成し、修復する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:05:38 GMT)
Offline and Online KL-Regularized RLHF under Differential Privacy [16.0] 人的フィードバックから強化学習のオフラインおよびオンライン設定について検討する。
オフライン環境では、悲観主義の原理に基づくアルゴリズムを設計する。
オンライン環境では、我々はDPを用いたKL正規化RLHFの問題を理論的に研究した最初の人物である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:04:19 GMT)
Improving Zero-shot Sentence Decontextualisation with Content Selection and Planning [16.0] 提案するゼロショット・デコンテクスト化フレームワークは,どの内容に言及すべきか,どの順序で文を文脈から理解すべきかを判断する。
我々は、与えられた文から潜在的に曖昧な単位を識別し、それらの言説関係に基づいて文脈から関連する単位を抽出する。
最後に,各曖昧な単位を関連単位に富ませることで文の書き直しを行うコンテンツプランを生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:50:15 GMT)
Removing Cost Volumes from Optical Flow Estimators [16.0] トレーニングを通して光フロー推定器からコストを削減できるトレーニング戦略を導入する。
我々の最も正確なモデルは最先端の精度に到達し、12倍速くなる。
われわれの最速モデルは、GPUメモリがわずか500,mathrmMB$で、フルHDフレームを20,mathrmFPS$で処理できる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:07:09 GMT)
TASER: Table Agents for Schema-guided Extraction and Recommendation [16.0] 実世界の金融文書は、ある企業の金融保有に関する重要な情報を報告する。
しかし、これらの詳細はしばしば散らかったマルチページの断片化されたテーブルに埋もれている。
本稿では,連続学習型エージェントテーブル抽出システムTASERを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:51:37 GMT)
True Self-Supervised Novel View Synthesis is Transferable [15.9] 我々は、真の新規ビュー合成(NVS)が可能な最初の幾何学自由自己教師型モデルXFactorを提示する。
XFactor は3次元帰納的バイアスやマルチビュー幾何学の概念を伴わずに、制約のない潜在ポーズ変数で転送可能であることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:09:56 GMT)
Brought a Gun to a Knife Fight: Modern VFM Baselines Outgun Specialized Detectors on In-the-Wild AI Image Detection [15.9] 現代ビジョン基礎モデル(VFM)における単純な線形分類器を提案する。
同一データに基づいてトレーニングされたこのベースラインは、Wild内の精度を20%以上のマージンで決定的に向上させる。
我々は、このアライメントと全体的な精度の両方が、VFMの事前訓練されたカットオフ日後にスクラップされた新しいデータセットに急降下するため、データ露出によるものであると推測する。
1)AI生成画像検出の現実世界での銃撃戦では、更新されたVFMの生火力の方がはるかに効果的である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:04:56 GMT)
Do Slides Help? Multi-modal Context for Automatic Transcription of Conference Talks [15.5] 本研究は、科学的なプレゼンテーションのユースケースのためのプレゼンテーションスライドの統合に焦点を当てている。
我々は、ドメイン固有項の自動解析を含むマルチモーダルプレゼンテーションのためのベンチマークを作成する。
拡張データセットを用いてモデルをトレーニングし、ベースラインモデルと比較して単語誤り率を約34%、ドメイン固有の用語で約35%削減する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:04:16 GMT)
Beyond the Surface: Enhancing LLM-as-a-Judge Alignment with Human via Internal Representations [15.5] LAGERは「LLM-as-a-Judge」評価と人間のスコアとのアライメントを改善するためのフレームワークである。
本研究では,Frask,HelpSteer,BIGGenの標準アライメントベンチマークをSpearman相関を用いて評価し,LAGERが最高のベースラインに対して最大7.5%の改善を実現していることを確認した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:42:59 GMT)
Time-IMM: A Dataset and Benchmark for Irregular Multimodal Multivariate Time Series [15.2] Time-IMMは、マルチモーダル時系列における原因駆動不規則を捉えるために設計されたデータセットである。
IMM-TSFは不規則なマルチモーダル時系列を予測するためのベンチマークライブラリである。
実験結果から,不規則な時系列データ上でのマルチモーダリティを明示的にモデル化すると,予測性能が大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:31:07 GMT)
TRUSTVIS: A Multi-Dimensional Trustworthiness Evaluation Framework for Large Language Models [15.2] 大規模言語モデル(LLM)の自動評価フレームワークTRUSTVISを紹介する。
私たちのフレームワークの重要な特徴は、インタラクティブなユーザーインターフェイスであり、信頼度メトリクスの直感的な視覚化を提供するように設計されています。
Vicuna-7b, Llama2-7b, GPT-3.5 などのモデルに対する予備的ケーススタディにより, 本フレームワークの有効性が示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:59:07 GMT)
Data-driven learning of feedback maps for explicit robust predictive control: an approximation theoretic view [15.1] 頑健なモデル予測制御(MPC)問題に対して,データからフィードバックマップを学習するアルゴリズムを確立する。
我々は、既指定の均一なエラー境界内における厳密な近似を許容状態空間上で適用し、未知のフィードバックポリシーを学習する近似スキームを2つ採用する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:14:14 GMT)
DP-TTA: Test-time Adaptation for Transient Electromagnetic Signal Denoising via Dictionary-driven Prior Regularization [14.8] 過渡電磁法(TEM)は様々な物理応用に広く用いられている。
近年のディープラーニングに基づく denoising モデルの性能は高い。
しかしこれらのモデルは、主にシミュレーションまたは単一の実世界のシナリオデータに基づいて訓練されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:22:03 GMT)
InsideOut: Integrated RGB-Radiative Gaussian Splatting for Comprehensive 3D Object Representation [14.7] InsideOutは3D Gaussian splatting(3DGS)の拡張で、高忠実なRGB表面詳細と地下X線構造の間のギャップを埋める。
我々は、新しいペアRGBとX線データを収集し、RGBとX線放射型ガウスプレートを整列させる階層的フィッティングを行い、一貫した内部構造を確保するためのX線基準損失を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:51:25 GMT)
FlyAwareV2: A Multimodal Cross-Domain UAV Dataset for Urban Scene Understanding [14.4] FlyAwareV2は、都市景観理解タスクに適した、実際のUAV画像と合成UAV画像の両方を含む、新しいデータセットである。
最近導入されたSynDroneとFlyAwareデータセットに基づいて、FlyAwareV2はいくつかの重要なコントリビューションを導入した。
アノテーションの豊富なセットと環境多様性により、FlyAwareV2はUAVベースの都市景観理解の研究に貴重な資源を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:44:31 GMT)
Tahakom LLM guidelines and receipts: from pre-training data to an Arabic LLM [14.0] 大規模言語モデル(LLM)は自然言語処理の分野を著しく進歩させてきた。
しかし、アラビア語用LLMの開発には固有の課題がある。
本稿では,データキュレーション,トークン化設計,評価などの重要な側面に注目し,これらの課題について考察する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:27:34 GMT)
High-efficiency and long-distance quantum memory-assisted device-independent quantum secret sharing with single photon sources [13.7] デバイス非依存(DI) QSSは、量子ネットワークの最高セキュリティレベルを提供する。
単一光子源(SPS)に基づく量子メモリ支援(QMA)DI QSSプロトコルを提案する。
本プロトコルは,既存のDI QSSプロトコルよりも7桁高いキー生成効率を実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:28:21 GMT)
Rec-R1: Bridging Generative Large Language Models and User-Centric Recommendation Systems via Reinforcement Learning [13.6] Rec-R1は大規模言語モデル(LLM)をクローズドループ最適化を通じてレコメンデーションシステムでブリッジする。
プロンプトや教師付き微調整(SFT)とは異なり、Rec-R1は固定ブラックボックスレコメンデーションモデルからのフィードバックを使って直接LLM生成を最適化する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:42:07 GMT)
CausalVerse: Benchmarking Causal Representation Learning with Configurable High-Fidelity Simulations [13.5] 因果表現学習は、データ生成プロセスを明らかにし、基礎となる因果変数と関係を特定することを目的としている。
データセットは4つのドメインで24のサブシーンにわたる約2万の画像と300万のビデオフレームで構成されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:39:22 GMT)
No-Reference Rendered Video Quality Assessment: Dataset and Metrics [13.4] 主観的品質アノテーションを用いた大規模なレンダリング指向ビデオデータセットを提案する。
NR-VQA測定値の校正を行い,画像品質と時間安定性の両面から映像品質の評価を行った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:36:52 GMT)
MotionBeat: Motion-Aligned Music Representation via Embodied Contrastive Learning and Bar-Equivariant Contact-Aware Encoding [13.3] MotionBeatは、モーションアラインな音楽表現学習のためのフレームワークである。
我々は、MotionBeatが、最先端のオーディオエンコーダを音楽からダンス生成で上回っていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:44:32 GMT)
MAPS: Masked Attribution-based Probing of Strategies- A computational framework to align human and model explanations [13.2] 人工ニューラルネットワーク(ANN)から導かれる説明が人間の視覚にも応用できるかどうかを調べるためのツールであるMAPS(Masked Attribution-based Probing of Strategies)を提案する。
MAPSは、属性マップを説明マスク付き画像(EMI)に変換し、これらの最小画像上の画像毎の精度と、全刺激に対する精度の限られたピクセル予算を比較する。
ヒトとマカクに応用すると、MAPSはANN-Explanationの組合せを識別し、その説明は生物学的ビジョンと最も密接に一致し、より少ない行動試験を必要としながら、バブルマスクの行動妥当性を達成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:20:54 GMT)
RPM: Reasoning-Level Personalization for Black-Box Large Language Models [13.1] この研究は、推論レベルのパーソナライゼーションを新しいパラダイムとして導入する。
RPMは、ユーザの振舞いのパターンから構築された構造化理性を用いて、モデルの推論プロセスを導くために設計された最初の体系的なフレームワークである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:31:17 GMT)
Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control [13.0] 本研究では、クリーンなデータに対するポリシーをトレーニングし、敵対的な微調整を行うオフライン・オンライン・フレームワークを提案する。
性能認識カリキュラムは、指数移動平均信号を介してトレーニング中の摂動確率を調整する。
連続制御ロコモーションタスクの実験は、提案手法がオフラインのみのベースラインよりもロバスト性を向上させることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:45:24 GMT)
RAG Meets Temporal Graphs: Time-Sensitive Modeling and Retrieval for Evolving Knowledge [12.9] 知識は本質的に時間に敏感であり、時間とともに継続的に進化する。
現在のRetrieval-Augmented Generation (RAG) システムは、この時間的性質をほとんど無視している。
本稿では,2段階の時間グラフとして外部コーパスをモデル化したテンポラルグラフRAG(TG-RAG)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:21:08 GMT)
On the Consistency of Multilingual Context Utilization in Retrieval-Augmented Generation [12.8] 大規模言語モデル(LLM)を用いた検索言語拡張生成(RAG)は,多言語質問応答タスクにおいて高い性能を示した。
多言語RAGでは、検索されたパスは、ユーザが入力したクエリ以外の言語で書くことができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:50:05 GMT)
From Refusal to Recovery: A Control-Theoretic Approach to Generative AI Guardrails [12.8] ほとんどのAIガードレールは、ラベル付きデータセットと人間の特定基準に基づいた出力分類に依存している。
私たちはAIシステムのアウトプットをリアルタイムで監視し、安全なアウトプットに対して積極的に修正する予測ガードレールを構築します。
シミュレーション運転とeコマース設定の実験では、制御理論のガードレールが破滅的な結果を確実に排除できることを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:30:57 GMT)
Transformer-based Scalable Beamforming Optimization via Deep Residual Learning [12.8] 大規模MU-MISOチャネルにおけるダウンリンクビームフォーミングのための教師なしディープラーニングフレームワーク。
モデルはオフラインでトレーニングされ、動的通信環境における軽量フィードフォワード計算によるリアルタイム推論を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:43:51 GMT)
IterMask3D: Unsupervised Anomaly Detection and Segmentation with Test-Time Iterative Mask Refinement in 3D Brain MR [12.8] 「教師なし異常検出・分節法は、正規の訓練分布を学習するためにモデルを訓練する。」
我々は3次元脳MRIのための反復型空間マスク精錬戦略である$rmIterMask3Dを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:05:43 GMT)
Endoscopic Depth Estimation Based on Deep Learning: A Survey [12.6] 内視鏡的深度推定は、最小侵襲手術の安全性と精度を向上させるための重要な技術である。
いくつかの関連調査が存在するにもかかわらず、最近のディープラーニングベースの技術に焦点を絞った総合的な概要はまだ限られている。
本論文は,最先端の文献を体系的にレビューすることで,このギャップを埋める試みである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:16:08 GMT)
Towards Robust Knowledge Removal in Federated Learning with High Data Heterogeneity [12.5] プライバシ規則と安全要件により、モデルへのクライアントのコントリビューションの必要性による排除が義務付けられている。
本稿では,タスク算術とニューラルタンジェントカーネルに基づく革新的なソリューションを導入し,モデルからクライアントの影響を迅速に除去する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:36:36 GMT)
DOLFIN: Balancing Stability and Plasticity in Federated Continual Learning [12.5] フェデレートされた連続学習により、モデルは複数のクライアントで新しいタスクを学習できる。
現在の手法では、パフォーマンス、プライバシー保護、通信効率のバランスのとれた課題に直面している。
本稿では,フェデレートインクリメンタルラーニング手法DOLFINのための分散オンラインロラを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:07:49 GMT)
Who Speaks for the Trigger? Dynamic Expert Routing in Backdoored Mixture-of-Experts Transformers [12.5] 大規模言語モデル (LLM) とMixture-of-Experts (MoE) アーキテクチャは、専門家として知られる専門職に入力を動的にルーティングすることで、優れたパフォーマンスと効率を達成する。
我々は,タスク結合型動的トリガ最適化と感性誘導型Top-Sエキスパートトレース機構を統合した,新しいバックドアフレームワークであるBadSwitchを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:11:02 GMT)
The quest for the GRAph Level autoEncoder (GRALE) [12.4] GRALEは、様々なサイズのグラフを共有埋め込み空間にエンコードし、デコードする新しいグラフオートエンコーダである。
シミュレーションおよび分子データに関する数値実験において、GRALEは、広範囲の下流タスクに適用可能な、非常に一般的な事前学習を可能にしていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:52:48 GMT)
The Landscape of Arabic Large Language Models (ALLMs): A New Era for Arabic Language Technology [12.3] アラビア世界は、アラビア語固有の大規模言語モデルを開発する上で、異なる課題に直面している。
本稿では、ALMの発端から現在までの軌跡について考察する。
また、アラブ世界におけるALLMの課題と機会についても論じる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:38:23 GMT)
NEUROLOGIC: From Neural Representations to Interpretable Logic Rules [12.2] ルールに基づく説明法は、ニューラルネットワークの振る舞いに関する厳密でグローバルに解釈可能な洞察を提供する。
既存のアプローチは、主に小さな完全に接続されたネットワークに限られており、コストのかかるルール抽出と置換プロセスに依存している。
深層ニューラルネットワークから直接解釈可能な論理規則を抽出する新しいフレームワークであるNEUROLOGICを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:46:29 GMT)
Mirror Speculative Decoding: Breaking the Serial Barrier in LLM Inference [12.0] 投機的復号化は、ドラフトモデルを使用して推測を加速する。
事前の方法は、ドラフトコストを部分的に削減するが、受け入れを低下させるか、スケーリングを制限するオーバーヘッドを導入する。
本稿では,遅延受容トレードオフを破る推論アルゴリズムであるMirror Speculative Decoding(Mirror-SD)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:22:57 GMT)
Fidel-TS: A High-Fidelity Benchmark for Multimodal Time Series Forecasting [11.9] 我々は、データソーシングの整合性、厳密な因果音性、構造的明快さに焦点をあてて、高忠実度ベンチマークのコア原則を定式化する。
ライブAPIからデータをソーシングすることで,これらの原則に基づいて構築された,新たな大規模ベンチマークであるFidel-TSを紹介します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:53:28 GMT)
Hierarchical Frequency Tagging Probe (HFTP): A Unified Approach to Investigate Syntactic Structure Representations in Large Language Models and the Human Brain [11.9] 大きな言語モデル(LLM)は、人間のレベルや優れた言語能力を示している。
重要な疑問は、LLMの行動能力が人間の脳に類似したメカニズムに由来するかどうかである。
GPT-2, Gemma, Gemma 2, Llama 2, Llama 3.1, GLM-4などのモデルでは, ヒトの脳は異なるシナティクスレベルにおいて異なる皮質領域に依存している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:04:49 GMT)
FACTS: Table Summarization via Offline Template Generation with Agentic Workflows [11.9] FACTSはオフラインのテンプレートを生成し、自然言語の要約にレンダリングでき、複数のテーブルで再利用できる。
これにより、再利用可能なオフラインテンプレートによる高速な要約、実行可能sqlクエリによる正確な出力、テーブルスキーマのみをLLMに送信することでプライバシコンプライアンスが可能になる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:24:49 GMT)
Sparse Subnetwork Enhancement for Underrepresented Languages in Large Language Models [11.7] 大規模な言語モデルは、言語間で不均一なパフォーマンスを示す。
表現不足言語におけるLLMの単言語機能向上のためのフレームワークを提案する。
言語活性化確率エントロピーを用いて言語特異的ニューロンを同定し,これらのニューロンに付随する重みのみを微細トンネルで同定する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:14:49 GMT)
Direction-aware multi-scale gradient loss for infrared and visible image fusion [11.7] 赤外線および可視光画像融合は、共登録されたソース画像からの相補的な情報を統合して、単一の情報的結果を生成することを目的としている。
水平および垂直の部品を別々に監視し,その符号をスケールにわたって保持する方向認識型多スケール勾配損失を導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:26:39 GMT)
Gaussian Certified Unlearning in High Dimensions: A Hypothesis Testing Approach [11.6] 我々は、高次元のレジームによく適合する標準的で堅牢な概念である$varepsilon$-Gaussian certifiabilityを導入する。
理論的にはニュートン法の一段階に基づいて広く使われている未学習アルゴリズムの性能を解析する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:28:12 GMT)
Near-Optimal Regret-Queue Length Tradeoff in Online Learning for Two-Sided Markets [11.5] 我々は、価格に敏感な異種顧客とサーバが到着し、それぞれのキューに参加する二面市場について検討する。
互換性のあるカスタマサーバペアはプラットフォームによってマッチングされ、その時点でシステムを離れる。
我々の目標は、適切な待ち時間を維持しながら、プラットフォームの利益を最大化する価格とマッチングアルゴリズムを設計することである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:09:41 GMT)
Do Large Language Models Respect Contracts? Evaluating and Enforcing Contract-Adherence in Code Generation [11.4] PACTは、プログラムアセスメントおよび契約順応評価フレームワークである。
契約違反に焦点を当てた包括的なテストスーツコーパスを提供する。
様々なプロンプト条件下でのコード生成の体系的解析を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:21:54 GMT)
MADREC: A Multi-Aspect Driven LLM Agent for Explainable and Adaptive Recommendation [11.4] マルチアスペクト駆動型LLMエージェントMADRecは、レビューからマルチアスペクト情報の教師なし抽出によってユーザとアイテムのプロファイルを構築する自動レコメンデータである。
MADRecはアスペクトカテゴリに基づく要約を通じて構造化プロファイルを生成し、高密度入力を構築するためにRe-Rankingを適用する。
複数の領域にわたる実験により、MADRecは従来のLCMベースのベースラインよりも精度と説明可能性の両方で優れていることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:03:29 GMT)
When In Doubt, Abstain: The Impact of Abstention on Strategic Classification [11.4] 本稿では,戦略的分類の文脈における棄権について検討する。
最適な棄権は、主観的効用が非棄権的条件よりも悪くないことを保証することを示す。
また、禁忌は操作の抑止力としても機能し、操作するエージェントがポジティブな結果を得るのにコストがかかることも示している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:13:44 GMT)
MimicKit: A Reinforcement Learning Framework for Motion Imitation and Control [11.4] MimicKitは、モーション模倣と強化学習を使用してモーションコントローラをトレーニングするためのオープンソースのフレームワークである。
一般的なモーションアニメーション技術とRLアルゴリズムの実装を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:51:42 GMT)
Through the Lens of Doubt: Robust and Efficient Uncertainty Estimation for Visual Place Recognition [11.3] 視覚的場所認識は、既知の場所のデータベースに対する現在の観測と一致させることで、これまで訪れた場所を特定できる。
同時ローカライゼーションとマッピングパイプラインにおけるループクロージャ検出などの障害クリティカルなVPRアプリケーションは、位置マッチングの不確実性を堅牢に評価する必要がある。
本稿では,既存のVPR法を用いて,類似度スコアの固有統計パターンを解析し,予測信頼度を推定する3つのトレーニング不要不確実性指標を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:12:55 GMT)
AVAR-Net: A Lightweight Audio-Visual Anomaly Recognition Framework with a Benchmark Dataset [11.2] 異常認識は、監視、交通、医療、公衆安全において重要な役割を担っている。
既存のアプローチは視覚データのみに依存しており、困難な状況下では信頼できない。
大規模な同期音声-視覚の欠如は、マルチモーダルな異常認識の進展を妨げている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:56:00 GMT)
One Bug, Hundreds Behind: LLMs for Large-Scale Bug Discovery [11.2] Recurring Pattern Bugs (RPB) はプログラムの様々なコードセグメントにまたがって繰り返し現れる。
RPBは広く普及しており、ソフトウェアプログラムのセキュリティを著しく損なう可能性がある。
本稿では,LLVMとLarge Language Model (LLM)によるプログラム解析システムであるBugStoneを紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:18:06 GMT)
ShuffleV: A Microarchitectural Defense Strategy against Electromagnetic Side-Channel Attacks in Microprocessors [10.9] 本稿では,EMサイドチャネル攻撃に対するマイクロアーキテクチャ防衛戦略であるShuffleVを提案する。
オープンソースのRISC-Vコア上にShuffleVを構築し、異なるアプリケーションシナリオに適した6つの設計オプションを提供します。
我々は,Xilinx PYNQ-Z2 FPGA上でShuffleVを実装し,その性能を2つの代表的な犠牲者アプリケーションで検証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:09:42 GMT)
Paper Copilot: Tracking the Evolution of Peer Review in AI Conferences [10.9] 本稿では,多岐にわたるコンピュータサイエンスの会場において,ピアレビューの永続的なデジタルアーカイブを作成するシステムPaper Copilotを紹介する。
インフラストラクチャとデータセットの両方をリリースすることにより、Paper Copilotはピアレビューの進化に関する再現可能な研究をサポートする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:41:06 GMT)
Classifying and Addressing the Diversity of Errors in Retrieval-Augmented Generation Systems [10.9] Retrieval-augmented Generation (RAG) は、質問応答システムを構築するための一般的なアプローチである。
実世界のRAGシステムの複雑さのため、誤出力には多くの潜在的な原因がある。
本稿では,現実的なRAGシステムで発生するエラーの種類,それぞれの例,そしてそれに対応するための実践的なアドバイスについて,新しい分類法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:02:30 GMT)
Iterative LLM-Based Generation and Refinement of Distracting Conditions in Math Word Problems [10.9] 数学語問題(MWP)は最も広く使われている形式の一つである。
既存のMWPデータセットの多くは必要な情報のみを含む。
我々は,複数の視点と認知レベルからMWPを改訂する一連のプロンプトを開発する。
私たちのフレームワークの重要な利点は、オリジナルの問題と修正された問題の間の共有ソリューションの保存です。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:08:14 GMT)
Uncolorable Examples: Preventing Unauthorized AI Colorization via Perception-Aware Chroma-Restrictive Perturbation [10.8] 非着色可能な例では、知覚不能な摂動をグレースケールのイメージに埋め込んで、無許可の着色を無効にする。
ImageNetとDanbooruデータセットの実験により、PAChromaは視覚的外観を維持しながら色付け品質を効果的に低下させることが示された。
この研究は、不正なAIのカラー化から視覚的コンテンツを保護し、生成メディアにおける著作権を意識した防御の道を開くための第一歩となる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:52:47 GMT)
Formalizing the Safety, Security, and Functional Properties of Agentic AI Systems [10.7] 本稿では2つの基礎モデルからなるエージェントAIシステムのためのモデリングフレームワークを提案する。
1つ目はホストエージェントモデルで、ユーザと対話するトップレベルのエンティティを形式化し、タスクを分解し、外部エージェントやツールを活用して実行をオーケストレーションする。
第2のタスクライフサイクルモデルでは、個々のサブタスクの状態と、作成から完了までの遷移を詳述し、タスク管理とエラー処理の詳細なビューを提供します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:02:30 GMT)
Synchronization of Multiple Videos [10.5] 異なるシーンから動画を同期させる、あるいは生成するAIビデオは、多様な主題、背景、非線形の時間的ミスアライメントのために、はるかに複雑な課題を引き起こす。
本稿では,様々な事前学習モデルから抽出した高次元埋め込みから,共有されたコンパクトな1次元表現を構成するプロトタイプベースのフレームワークであるTPLを提案する。
TPLは、主要なアクションフェーズをアンカーする統一されたプロトタイプシーケンスを学習することで、ビデオの整合性を強化し、徹底的なペアワイズマッチングを回避する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:43:57 GMT)
Signature in Code Backdoor Detection, how far are we? [10.4] 我々は、コードモデルに対するバックドア攻撃の文脈において、スペクトル署名に基づく防御の適用性を再考する。
コードバックドア検出におけるスペクトルシグナチャの広く使われている設定は、しばしば準最適である。
我々は,防衛後のモデル再トレーニングを伴わずに,スペクトル署名の実際の性能をより正確に推定できる新しいプロキシ指標を発見した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:18:08 GMT)
LibEMER: A novel benchmark and algorithms library for EEG-based Multimodal Emotion Recognition [10.4] 我々は、キュレートされたディープラーニング手法の完全な再現可能なPyTorch実装を提供する統合評価フレームワークLibEMERを紹介する。
このフレームワークは、2つの学習タスクにまたがる3つの広く使用されている公開データセットに対して、バイアスのないパフォーマンスアセスメントを可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:46:18 GMT)
EPIPTrack: Rethinking Prompt Modeling with Explicit and Implicit Prompts for Multi-Object Tracking [10.1] EPIPTrackという統合された視覚言語追跡フレームワークを提案する。
EPIPTrackは、動的ターゲットモデリングとセマンティックアライメントのための明示的および暗黙的なプロンプトを利用する。
MOT17、MOT20、Danceの実験は、EPIPTrackが様々なシナリオで既存のトラッカーより優れていることを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:39:30 GMT)
StressTransfer: Stress-Aware Speech-to-Speech Translation with Emphasis Preservation [10.0] 単語レベルの強調を保存したストレス対応音声音声合成システム(S2ST)を提案する。
制御可能なTSモデルを誘導するターゲット言語タグへのソース言語ストレスについて検討した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:32:24 GMT)
Towards A Universally Transferable Acceleration Method for Density Functional Theory [10.0] 本稿では,電子密度をコンパクトな補助基底表現で予測することにより,DFTの初期推定を構成する手法を提案する。
我々のモデルは、60原子までの系における平均33.3%の自己一貫性のフィールドステップ還元を達成することができ、ハミルトン中心のモデルとDM中心のモデルを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:15:37 GMT)
Generating healthy counterfactuals with denoising diffusion bridge models [9.8] 拡散確率モデル(DDPM)は、病理データの健全な反事実を生成するための一般的な手法となっている。
拡散ブリッジモデル(DDBM)の新しい応用法を提案する。
我々のDDBMは,従来提案されていた拡散モデルと,セグメンテーションおよび異常検出タスクにおける完全教師付きアプローチより優れていた。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:40:57 GMT)
Personal Attribute Leakage in Federated Speech Models [9.8] フェデレーション学習は、機械学習モデルのプライバシパラメトリックトレーニングの一般的な方法である。
本稿では,ASRモデルの脆弱性を分析し,フェデレートされた環境での推論攻撃を属性とする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:43:10 GMT)
XD-RCDepth: Lightweight Radar-Camera Depth Estimation with Explainability-Aligned and Distribution-Aware Distillation [9.7] 我々は、最先端の軽量ベースラインと比較してパラメータを29.7%削減する軽量アーキテクチャであるXD-RCDepthを提案する。
本稿では,教師のサリエンシ構造を学生に伝達する説明可能性に整合した蒸留法と,識別されたビンに対する深度回帰をソフトな分類として再放送する深度分布蒸留法について紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:05:33 GMT)
ERGO: Entropy-guided Resetting for Generation Optimization in Multi-turn Language Models [9.5] 大規模言語モデル(LLM)は、情報が漸進的に提示されるとき、多ターン会話において顕著なパフォーマンス劣化を被る。
本稿では,次のトークン分布に対するシャノンエントロピーによる内部不確かさの定量化を行うERGOを紹介する。
ERGOは言語とモデリングにおける可変性を採用し、不確実性を表現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:33:08 GMT)
Quantum circuit synthesis with SQiSW [9.4] 本研究では,8つのSQiSWゲートのみを用いたトフォリゲートの正確な合成手法を提案する。
また, 数値実験において, 探索空間のサイズを以前の大きさの$frac112+o(1)$に削減するプルーニングアルゴリズムの理論解析を行った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:23:30 GMT)
Emotional Cognitive Modeling Framework with Desire-Driven Objective Optimization for LLM-empowered Agent in Social Simulation [9.3] 本稿では,欲求生成と客観的管理を取り入れた感情認知フレームワークを構築する。
LLMベースのエージェントの完全な意思決定プロセスをモデル化し、状態進化、欲求生成、客観的最適化、意思決定、行動実行を含む。
実験の結果,我々のフレームワークが支配するエージェントは,感情状態と一致した行動を示すだけでなく,他のエージェントに対する比較評価においても,より優れた生態学的妥当性を示し,人間の行動パターンをより密に近似した決定結果を生成することがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:33:11 GMT)
iQUEST: An Iterative Question-Guided Framework for Knowledge Base Question Answering [9.3] iQUESTは、複雑なクエリを単純なサブクエリに繰り返し分解する質問誘導KBQAフレームワークである。
グラフニューラルネットワーク(GNN)を統合して、各推論ステップに2ホップ隣の情報を組み込む。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:30:03 GMT)
Electrostatics from Laplacian Eigenbasis for Neural Network Interatomic Potentials [9.3] メッセージパッシングフレームワーク内でPoissonの方程式を強制するユニバーサルプラグインモジュールであるPhi-Moduleを紹介する。
具体的には、各原子ワイド表現は、離散化されたポアソン方程式を満たすように奨励される。
次に、全エネルギー予測の改善に不可欠な静電エネルギー項を導出する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:34:58 GMT)
An Operational Deep Learning System for Satellite-Based High-Resolution Global Nowcasting [9.2] 従来の数値気象予測手法は、レイテンシが高く、空間分解能が低く、時間分解能が低い。
近年、グローバル・ノースでよく見られる機械学習による現在放送手法は、レーダーが極端に少ないため、グローバル・サウスまで拡張することはできない。
我々はGlobal MetNetについて紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:11:03 GMT)
A Multi-dimensional Semantic Surprise Framework Based on Low-Entropy Semantic Manifolds for Fine-Grained Out-of-Distribution Detection [9.1] 我々は、コアタスクを新しいサンプルのセマンティックサプライズを定量化するものとして定式化する。
次に、サンプルの総サプライズを3つの相補的な次元(整合性、新規性、曖昧性)に分解する普遍的なプローブであるセマンティックサプライズベクトル(SSV)を導入する。
実験により、我々のフレームワークは、挑戦的な第三次タスクに対して新しい最先端(ソータ)を確立するだけでなく、その堅牢な表現は従来のバイナリベンチマーク上でもトップ結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:26:35 GMT)
Feature-driven reinforcement learning for photovoltaic in continuous intraday trading [9.0] 日内取引における特徴駆動型強化学習(RL)手法を提案する。
RLは、データ駆動機能を状態に統合し、シーケンシャルな決定フレームワークで入札ポリシーを学ぶ。
RL は PV 生産者による日々のアクティブな参加のための,実用的で,データ効率が高く,かつ,運用的に展開可能な経路を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:19:05 GMT)
VLA-0: Building State-of-the-Art VLAs with Zero Modification [8.9] VLA(Vision-Language-Action Model)は、汎用的なロボット操作を可能にするための大きな約束を持っている。
この研究はVLA-0を導入し、アクションを直接テキストとして表現する最も単純な戦略を解明する。
VLA-0は有効であるだけでなく、驚くほど強力である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:31:10 GMT)
Non-Clifford Fusion: T-Gate Optimization for Quantum Simulation [8.9] ハミルトンシミュレーションは複雑なシステムをモデル化するための重要な量子アルゴリズムである。
NCFは、ハミルトンシミュレーションのためのTゲート数とTゲート深さの両方を削減するコンパイルフレームワークである。
NCFは、それぞれTゲート数、Tゲート深さ、クリフォード数の平均57.4%、49.1%、49.0%の減少を達成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:12:22 GMT)
GammaZero: Learning To Guide POMDP Belief Space Search With Graph Representations [8.8] 部分観測可能決定プロセス(POMDP)における計画の指針となる行動中心グラフ表現フレームワークを提案する。
私たちの重要な洞察は、信念状態は、小さな問題で学んだ構造パターンがより大きなインスタンスに移行するアクション中心のグラフに体系的に変換できるということです。
我々は、デコーダアーキテクチャを備えたグラフニューラルネットワークを用いて、計算処理可能な問題に関する専門家による実証から値関数とポリシーを学習し、これらの学習されたマルコフを適用してモンテカルロ木探索をガイドする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:18:03 GMT)
Plugging Schema Graph into Multi-Table QA: A Human-Guided Framework for Reducing LLM Reliance [8.8] 本稿では,人為的な関係知識を活用して,スキーマリンクとジョインパスを明示的にエンコードするグラフベースのフレームワークを提案する。
自然言語クエリが与えられた場合,提案手法は解析可能な推論チェーンを構築するためにグラフを検索し,プルーニングとサブパスマージ戦略によって支援する。
標準ベンチマークと現実的な大規模データセットの両方の実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:43:36 GMT)
STEMS: Spatial-Temporal Enhanced Safe Multi-Agent Coordination for Building Energy Management [8.7] 協調型建築エネルギー管理は、空間的時間的依存関係を活用する上で重要な課題に直面している。
現在のマルチビルエネルギーシステムは、空間的時間的情報利用の不足、厳格な安全保証の欠如、システムの複雑さの3つの大きな課題に直面している。
本稿では,建築エネルギーの協調管理のための新しい安全制約付きマルチエージェント強化学習フレームワークである空間時間拡張型マルチエージェントコーディネーション(STEMS)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:33:58 GMT)
Beyond Pixels: A Differentiable Pipeline for Probing Neuronal Selectivity in 3D [8.7] 現在のアプローチは主に2Dピクセルで運用されており、物理的シーン特性の選択性を分離することは困難である。
変形可能なメッシュを最適化して,MEIを直接3Dで取得する,微分可能なレンダリングパイプラインを導入する。
このアプローチは、逆グラフィックをシステム神経科学にブリッジし、物理的に接地された3D刺激で神経選択性を探索する方法を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:29:21 GMT)
The Implicit Bias of Structured State Space Models Can Be Poisoned With Clean Labels [8.7] 以前の研究は、構造化状態空間モデル(SSM)の暗黙のバイアスは、低次元の教師によってデータが生成される環境での一般化につながると主張した。
暗黙のバイアスは、多くのトレーニングデータの選択の下で一般化につながるが、トレーニングに含めると暗黙のバイアスが完全に歪む特別な例が存在することを証明している。
この失敗は、教師によってラベル付けされている特別なトレーニング例、すなわちクリーンなラベルを持つにもかかわらず発生します!
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:56:23 GMT)
OS-HGAdapter: Open Semantic Hypergraph Adapter for Large Language Models Assisted Entropy-Enhanced Image-Text Alignment [8.6] テキスト画像アライメントはマルチメディアコンテンツ理解における基礎的な課題である。
本稿では,Large Language Model (LLM) のオープンな意味知識を用いて,エントロピーギャップを埋めることを提案する。
Flickr30KとMS-COCOベンチマークの総合評価は、オープンセマンティックハイパーグラフアダプタ(OS-HGAdapter)の優位性を検証している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:09:00 GMT)
BioMedSearch: A Multi-Source Biomedical Retrieval Framework Based on LLMs [8.5] 大規模言語モデル(LLM)に基づくバイオメディカル情報検索フレームワークであるBioMedSearchについて述べる。
本手法は,文献検索,タンパク質データベース,Web検索アクセスを統合し,複雑なバイオメディカルクエリの正確かつ効率的な処理を支援する。
質問応答の精度を評価するために,3,000の質問からなる多レベルデータセットBioMedMCQを構築した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:01:31 GMT)
No Language Data Left Behind: A Comparative Study of CJK Language Datasets in the Hugging Face Ecosystem [8.4] 文化規範,研究環境,制度的実践がデータセットの可用性と品質をどのように形成するかを検討する。
本研究は,中国におけるデータセットの大規模かつ機関主導的な性質,韓国NLPにおける草の根コミュニティ主導の開発,日本コレクションへのエンターテイメントとサブカルチャーの重視,などを明らかにする。
我々は、将来のデータセットのキュレーションとコラボレーションのためのベストプラクティスについて議論し、3つの言語すべてにわたるリソース開発を強化することを目的として締めくくった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:42:44 GMT)
When Embedding Models Meet: Procrustes Bounds and Applications [8.3] 類似したデータで個別に訓練された埋め込みモデルは、しばしば安定した情報をエンコードする表現を生成するが、直接交換できない。
この相互運用性の欠如は、モデル再トレーニング、部分的なモデルアップグレード、マルチモーダル検索など、いくつかの実践的な応用における課題を提起する。
ペアのドット積がほぼ保存されている場合、この2つの集合を密に整列する等尺法が存在し、アライメント誤差に厳密な束縛を与えることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:04:17 GMT)
Translating Regulatory Clauses into Executable Codes for Building Design Checking via Large Language Model Driven Function Matching and Composing [8.3] 本稿では,規則に基づく適応的プロンプトを用いた大規模言語モデル (LLM) に基づく手法を提案する。
LLM-FuncMapperは関数マッチングにおいて19%の精度で微調整を行う。
ケーススタディでは、LLM-FuncMapperが複数のアトミック関数を自動生成して実行可能なコードを生成することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:49:35 GMT)
Learning Optimal Prompt Ensemble for Multi-source Visual Prompt Transfer [8.3] マルチソース・プロンプト・チューニングのための最適アンサンブル重み学習フレームワークであるHGPromptを提案する。
特に、ターゲットタスクにおけるプロンプト誘発特徴の識別性をキャプチャする、識別可能なプロンプト転送可能性指標を提案する。
大規模VTABベンチマークの実験は、HGPromptの最先端性能を実証している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:19:07 GMT)
Robust Minimax Boosting with Performance Guarantees [8.2] ブースティング法は、しばしば優れた分類精度を達成するが、ラベルノイズの存在下での顕著な性能劣化を経験することができる。
本稿では,最悪のエラー確率を最小限に抑え,一般的なラベルノイズに対して頑健であるRMBoost法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:45:27 GMT)
DSCD: Large Language Model Detoxification with Self-Constrained Decoding [8.2] 大規模言語モデル(LLM)の解毒は依然として重要な研究課題である。
既存のデコードデトックス化手法はすべて外部制約に基づいている。
本研究では,パラメータの微調整を伴わない新しいLSMデトキシフィケーション法であるDSCD(Detoxification with Self-Constrained Decoding)を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:10:47 GMT)
Robotic Classification of Divers' Swimming States using Visual Pose Keypoints as IMUs [8.2] 我々はスキューバダイバーの安全を監視するためにギャップを埋める新しいハイブリッドアプローチを導入する。
提案手法はコンピュータビジョンを利用して高忠実度動作データを生成し、3次元関節キーポイントのストリームから擬似IMU'を効果的に生成する。
本システムは,救急医療の開始を知らせる異常なスキューバダイバーの行動を特定するための重要な課題に応用する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:57:03 GMT)
Hamiltonian Learning via Inverse Physics-Informed Neural Networks [8.1] Hamiltonian Learning (HL)は、システムパラメータと基礎となるダイナミクスの正確な推定を可能にする。
我々は、損失関数ペナルティをML手順に介し、Schr"odinger方程式をソフト制約として組み込むアプローチである、ハミルトニアン学習のためのテキスト逆物理情報ニューラルネットワーク(iPINN-HL)を提案する。
我々は,iPINN-HLをディープ・ニューラル・ネットワークベースの量子状態トモグラフィー法(DNN-HL)と比較し,その有効性を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:11:29 GMT)
Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics [8.1] DTNの保守と運用に一般的に使用されるアクティブメトリック予測は、レイテンシ、スループット、エネルギー消費、信頼性に関するネットワーク性能を向上させることができる。
時系列予測における従来の平均回帰法は、データの複雑さを適切に把握できないため、ルーティングなどのDTNの運用タスクでは、性能が低下する。
本稿では、DTNにおけるメトリクスの予測を多変量時系列上の確率予測問題として定式化し、これらのサンプルの分布を特徴付けることによって予測の不確かさを定量化することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:12:50 GMT)
AOAD-MAT: Transformer-based multi-agent deep reinforcement learning model considering agents' order of action decisions [8.1] マルチエージェント強化学習は、共有環境で共存する複数の学習エージェントの行動訓練に焦点を当てる。
本稿では,エージェントが決定を下す順序を考慮に入れたエージェント・オーダー・オブ・アクション・ディシジョン-MATモデルを提案する。
提案モデルでは,行動決定の順序を学習プロセスに明示的に組み込んで,エージェント行動の最適順序を学習し,予測することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:29:36 GMT)
Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers [8.0] 個々の著者の完全な作品に関する微調整のChatGPTは、これらの発見を完全に逆転させた。
著者1人あたりの平均的な微調整と推論のコストは、典型的な作家の報酬と比較して、99.7%の劇的な削減である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:51:58 GMT)
Rectify and Align GPS Points to Parking Spots via Rank-1 Constraint [7.9] 高層ビルは、駐車場の実際の場所からGPSポイントをドリフトさせる傾向がある。
監視されていないアプローチで大量の駐車場からいくつかの間違ったGPSポイントを補正するのは、簡単な作業ではない。
本稿では,GPS点における誤りを効果的に修正し,それらを統一された枠組みで駐車場に整列させる,教師なしの低ランク手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:36:27 GMT)
Missing the Margins: A Systematic Literature Review on the Demographic Representativeness of LLMs [7.9] 大規模言語モデル(LLM)の人口統計学的代表性に関する211の論文をレビューする。
研究の29%はLSMの代表性について肯定的な結論を報告しているが、そのうち30%はLSMを複数のカテゴリーで評価していない。
論文の3分の1以上が対象人口を定義していない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:11:13 GMT)
Nash Equilibria, Regularization and Computation in Optimal Transport-Based Distributionally Robust Optimization [7.8] 本研究では, 有限の輸送コストで所定の基準分布による不確実な問題パラメータの分布を選択することができるような, 最適輸送に基づく分布安定度最適化問題について検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:02:24 GMT)
Multi-View Semi-Supervised Label Distribution Learning with Local Structure Complementarity [7.8] 局所構造相補性 (MVSS-LDL) を用いた多視点半教師付きラベル分布学習を行った。
MVSS-LDLは既存の単一ビューLCL法よりも明らかに優れた分類性能が得られる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:00:26 GMT)
Causal Language Control in Multilingual Transformers via Sparse Feature Steering [7.8] マルチ言語モデルの生成言語を操るために,スパースオートエンコーダの機能を活用できるかどうかを検討する。
我々は、FastText言語分類によって測定された、最大90%の成功で制御された言語シフトを達成する。
解析の結果,言語ステアリングは中間から後期のトランスフォーマー層において最も効果的であることが判明した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:18:58 GMT)
What is the objective of reasoning with reinforcement learning? [7.7] 二つの報酬を持つ大言語モデルにおける強化学習のためのいくつかの一般的なアルゴリズムは、プロンプトが与えられた正しい解の確率のモノトーン変換の勾配として見なせることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:13:38 GMT)
Investigating the interaction of linguistic and mathematical reasoning in language models using multilingual number puzzles [7.7] 言語モデル (LLMs) は言語-数学のパズルと、言語間数系を含む。
言語における数値の言語的側面と数学的側面を解き放つ一連の実験を通して, LLM にとってなぜこの課題が難しいのかを考察する。
人間のスケールデータにおける暗黙のパターンから構成規則を柔軟に推論する能力は、現在の推論モデルにとってオープンな課題である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:03:13 GMT)
Agentic Discovery: Closing the Loop with Cooperative Agents [7.6] 発見の速度は、人間の意思決定タスクによってますます制限される。
我々は、人間の役割を増強し、自律的な発見を可能にするために協力的エージェントが必要であると仮定する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:50:41 GMT)
Towards Blackwell Optimality: Bellman Optimality Is All You Can Get [7.5] マルコフ決定過程における最適順序のポリシーを特定することの問題点について検討する。
各順序に対して,誤りの確率を無くした学習アルゴリズムを構築する。
識別アルゴリズムが有限時間で停止できるMDPのクラスを特徴付ける。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:22:25 GMT)
Fast Authenticated and Interoperable Multimedia Healthcare Data over Hybrid-Storage Blockchains [7.5] 本稿では,UnderlineFast underlineAuthenticated and underlineInteroperable mulunderlineTimedia underlineHealthcare data storage and sharing over hybrid-storage blockchainsを提案する。
ユーザ側のハッシュ再計算ではなく、FAITHは、オフチェーンストレージプロバイダがZKPを使用して検証可能な証明を生成する。
フレキシブルなアクセス認可のために、プロキシ再暗号化(PRE)を活用し、プロバイダが暗号文の再実行を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:07:31 GMT)
Are Proverbs the New Pythian Oracles? Exploring Sentiment in Greek Sayings [7.5] 多くの文化は、この現象の口伝的な伝統のために、自分たちのコミュニティ内で伝統的な知恵を保っている。
我々は,ギリシアの格言に焦点を合わせ,その感情を分析する。ギリシア語格言の注釈付きデータセットから離れ,それを現地の方言を含むように拡張し,注釈付き格言を効果的にマッピングする。
以上の結果から,LLMは,特に非伝統的な感情極性タスクとしてアプローチした場合に,証明者の感情を十分に正確に表現することができることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:26:52 GMT)
Generating Fair Consensus Statements with Social Choice on Token-Level MDPs [7.5] タスクを多目的トークンレベルマルコフ決定プロセス(MDP)としてモデル化する。
各エージェントに対するトークンレベルの報酬は、それぞれのポリシー(例えば、パーソナライズされた言語モデル)から導かれる。
このアプローチは、そのようなポリシーが最適Q-函数を暗黙的に定義し、値関数なしで各生成ステップでの報酬を定量化する原則的な方法を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:23:18 GMT)
Weight Weaving: Parameter Pooling for Data-Free Model Merging [7.5] Weight Weavingは、$lambda$の値検索空間にモデルの重みをプールするプラグイン・アンド・プレイ技術です。
提案手法は複数のモデルマージ手法の性能を一貫して改善し,データフリー環境では最大15.9ポイントの精度向上を実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:52:42 GMT)
FIRST: Federated Inference Resource Scheduling Toolkit for Scientific AI Model Access [7.5] FIRSTは、既存のHPCインフラストラクチャ上のLarge Language Models(LLM)など、さまざまなAIモデルへのクラウドライクなアクセスを提供する。
システムは、プライベートでセキュアな環境でOpenAI準拠のAPIを介して、並列推論ワークロードを実行することができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:28:34 GMT)
Multivariate Time Series Forecasting with Gate-Based Quantum Reservoir Computing on NISQ Hardware [7.5] この研究は多変量時系列(MTS-QRC)のためのゲートベースのQRCを導入し、インジェクションとメモリキュービットをペア化する。
Lorenz-63 と ENSO では、平均平方誤差 (MSE) はそれぞれ 0.0087 と 0.0036 である。
IBM Heron R2では、MTS-QRCは現実的な深さで精度を保ち、興味深いことにENSOのノイズレスシミュレータよりも優れています。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:58:58 GMT)
ACM SIGSOFT SEN Empirical Software Engineering: Introducing Our New Regular Column [7.4] ESEの研究は、新しい障害、欠点、技術が出現するにつれて、依然として進化し続ける必要がある。
新たなACM SIGSOFT SENSEN-ESEコラムでは,ESE研究のメタアスペクトを議論する場を紹介した。
カラムの目的は、しばしば触れられたり、暗黙にされたりしないかもしれないESEトピックに関する会話を定期的に発火できる場所になることです。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:17:59 GMT)
Towards an Asymptotic Efficiency Theory on Regular Parameter Manifolds [7.4] 漸近効率理論は現代の数学統計学の基礎の柱の1つである。
本稿では, サンプル空間, パラメータ空間, あるいはその両方を条件を満たす正則性として, より統一された効率理論を開発することを目的とする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:00:38 GMT)
Information-Theoretic Criteria for Knowledge Distillation in Multimodal Learning [7.3] クロスモーダル知識蒸留(英語: Cross-modal knowledge distillation, KD)は、モデルトレーニング中に「教師」モダリティがより弱い「学生」モダリティに情報を伝達し、パフォーマンスを向上させる技術である。
様々な応用で成功したにもかかわらず、クロスモーダルなKDは必ずしも改善された結果をもたらすとは限らない。
教師と生徒の表現の相互情報が学生の表現とラベルの相互情報を超えた場合、クロスモーダルなKDが有効であることを示す。
本研究は、クロスモーダルKDを理解するための新しい理論枠組みを確立し、CCH基準に基づく実践的ガイドラインを提供することにより、教師のモダリティを最適に選択し、パフォーマンスを向上させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:10:10 GMT)
ADPerf: Investigating and Testing Performance in Autonomous Driving Systems [7.1] 本稿では,2つの産業レベルの自律運転システムにおける障害物検出モジュールの性能測定とモデル化に関する総合的研究について紹介する。
私たちはADPerfを紹介します。ADPerfは、検出遅延の増加を露呈できる、現実的なポイントクラウドデータテストケースを生成するツールです。
本評価では, 障害物検出部品, 特に3次元障害物検出部品の性能試験の必要性を強調した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:45:59 GMT)
KG2QA: Knowledge Graph-enhanced Retrieval-augmented Generation for Communication Standards Question Answering [7.1] KG2QAは、細調整された大言語モデル(LLM)とドメイン固有知識グラフ(KG)を統合する質問応答フレームワークである。
ITU-TレコメンデーションとQwen2.5-7B-インストラクトから,高品質な6,587対のQAデータセットを構築した。
我々のKG-RAGパイプラインでは、細調整されたLLMがまずKGから関連する知識を取得し、より正確で現実的な応答を可能にします。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:33:22 GMT)
Quantum thermal diode with additional control by auxiliary atomic states [7.1] 補助的な2レベル原子に結合した2つの2レベル原子からなる量子熱ダイオードについて検討した。
励起補助原子は熱電流を弱め、整流効果を高めることができるが、基底状態補助原子は熱電流を高め、整流効果を弱めることができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:38:13 GMT)
Confidence Calibration in Large Language Model-Based Entity Matching [7.0] 温度スケーリング,モンテカルロ・ドロップアウト,アンサンブルを用いて調整した信頼度に対して,エンティティマッチングタスクのベースラインRoBERTa信頼度を比較した。
この結果から,提案したRoBERTaモデルでは,予測誤差スコアが0.0043から0.0552の範囲でわずかに過信感を示すことがわかった。
この過信は温度スケーリングによって緩和でき、期待されるエラースコアを最大23.83%削減できる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:13:43 GMT)
Bell-State Quantum Holography with Metasurfaces [6.9] 光子対の偏光絡み合うベル状態に符号化されたベル状態ホログラム識別ホログラム画像を実験的に実現した。
ホログラム状態画素の全密度行列を画素で再構成する。
このフレームワークは、準曲面フォトニクスと量子状態再構成を統一し、高次元量子通信へのスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:15:02 GMT)
I Have No Mouth, and I Must Rhyme: Uncovering Internal Phonetic Representations in LLaMA 3.2 [6.9] 本稿では,動詞|Llama-3.2-1B-Instruct|がトークンレベルの音声情報をどのように表現するかを検討する。
以上の結果から,Llamaは音素モデルに富んだ内部モデルを用いて音声処理を完了したことが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:52:59 GMT)
DistilCLIP-EEG: Enhancing Epileptic Seizure Detection Through Multi-modal Learning and Knowledge Distillation [6.9] てんかん検出のための既存のディープラーニング手法の多くは、脳波信号のみに依存している。
本稿では,脳波信号とテキスト記述を統合してててててんかん発作の包括的特徴を捉えるマルチモーダルモデルDistilCLIP-EEGを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:49:28 GMT)
GLSim: Detecting Object Hallucinations in LVLMs via Global-Local Similarity [6.7] トレーニング不要なオブジェクト幻覚検出フレームワークであるGLSimを紹介する。
我々は,GLSimが優れた検出性能を達成し,高いマージンで競争ベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:04:54 GMT)
Contextuality-based quantum key distribution with deterministic single-photon sources [6.7] 本研究では,InAs(Ga)As量子ドットを用いた高純度単一光子源を量子情報キャリアとして利用する。
このようなオンデマンド単一光子が量子的文脈性を生み出すことを実証する。
この能力は、半デバイス非依存の量子鍵分布を自由空間チャネル上での新たなプロトコルを可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:49:52 GMT)
Intelligent4DSE: Optimizing High-Level Synthesis Design Space Exploration with Graph Neural Networks and Large Language Models [6.7] 本稿では,タスク適応型メッセージパッシングと大規模言語モデル強化メタヒューリスティックアルゴリズムをグラフニューラルネットワークに統合するフレームワークであるECoGNNs-LLMMHsを提案する。
最先端の作業と比較すると、ECoGNNはHLS後の予測タスクにおいて低い予測誤差を示し、エラーは57.27%減少した。
実装後の予測タスクでは、ECoGNNが最も低い予測エラーを示し、フリップフロップ(FF)では平均17.6%、クリティカルパス(CP)では33.7%である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:24:32 GMT)
Learning Neural Parametric 3D Breast Shape Models for Metrical Surface Reconstruction From Monocular RGB Videos [6.7] 神経パラメトリックな3次元乳房形状モデルを提案し、このモデルに基づいて低コストでアクセス可能な3次元表面再構成パイプラインを導入する。
本手法では,専用ハードウェアもプロプライエタリソフトウェアも必要とせず,RGB動画を録画可能なデバイスでも使用することができる。
導入したパイプラインは2mm未満の誤差範囲で高品質な3D乳房形状を復元できることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:35:03 GMT)
SAJA: A State-Action Joint Attack Framework on Multi-Agent Deep Reinforcement Learning [6.6] マルチエージェントディープ強化学習(MADRL)は、自律運転や戦略ゲームといった協調的・競争的なタスクの可能性を示唆している。
MADRLによって訓練されたモデルは、状態や行動に対する敵の摂動に対して脆弱である。
本研究では, 良好な相乗効果を有する国家摩擦合同攻撃(SAJA)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:08:41 GMT)
Dynamic Rank Adjustment for Accurate and Efficient Neural Network Training [6.6] 我々は,低ランクトレーニングエポック内のフルランクトレーニングエポックを戦略的にインターリーブすることで,モデルの重みのランクを効果的に回復できると主張している。
実験により,提案手法はSVDベースの低ランクトレーニングとほぼ同等の計算コストを実現することが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:54:26 GMT)
Static Sandboxes Are Inadequate: Modeling Societal Complexity Requires Open-Ended Co-Evolution in LLM-Based Multi-Agent Simulations [6.6] 静的なタスク固有のベンチマークは基本的に不十分であり、再考しなければなりません。
llmとマルチエージェントのダイナミクスをブレンドする新しいアーキテクチャについて、批判的にレビューする。
我々は、オープンエンドネス、継続的な共進化、レジリエントで社会的に整合したAIエコシステムの開発を中心とした研究ロードマップを提示する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:05:06 GMT)
An efficient approach with theoretical guarantees to simultaneously reconstruct activity and attenuation sinogram for TOF-PET [6.5] ポジトロン・エミッション・トモグラフィ(PET)では、身体内の定量的に正確な活動地図(軌跡分布)を得るために減衰補正を行うことが不可欠である。
飛行時間(TOF)-PETエミッションデータのみから活動と減衰のシングラムを同時に再構築する数学的モデルを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:01:03 GMT)
SSL4Eco: A Global Seasonal Dataset for Geospatial Foundation Models in Ecology [6.5] 自己教師付き学習は、ラベルのないデータからの学習表現を可能にした。
これらのモデルは、高い人間の活動領域に偏ったデータセットに基づいて訓練されることが多い。
植生の季節性を世界規模でより正確に把握するために, 簡易な表現インフォームドサンプリング戦略を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:08:24 GMT)
Coupling Magnons to an Opto-Electronic Parametric Oscillator [6.4] 我々は、コヒーレントマグノン現象における長距離結合と非線形性を研究するための新しいハイブリッドプラットフォームを導入する。
本結果は,コヒーレントマグノニクス現象における長距離結合と非線形性を研究するための,新しいハイブリッドプラットフォームを構築した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:28:35 GMT)
Quantile Markov Decision Process [6.4] 我々はマルコフ決定過程(MDP)の累積報酬の量子化を最適化する問題を考える。
最適QMDP値関数を特徴付ける解析結果と、最適ポリシーを解くための動的プログラミングに基づくアルゴリズムを提案する。
患者が治療の潜在的な利益とリスクのバランスをとることを目的としたHIV治療開始問題において,本モデルの有効性について検討した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:06:50 GMT)
Contrastive Learning-Based Dependency Modeling for Anomaly Detection in Cloud Services [6.4] 本稿では,コントラスト学習を統合した依存性モデリングと異常検出手法を提案する。
対照的な学習フレームワークを導入し、正と負のサンプルペアを構築し、正常パターンと異常パターンの分離性を高める。
提案手法は、Precision、Recall、F1-Score、AUCといった主要なメトリクスにおいて、既存の手法よりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:59:16 GMT)
Spatio-Temporal LLM: Reasoning about Environments and Actions [6.3] S-temporal」は現在のマルチモーダル大言語モデル(MLLM)に挑戦を促す
近年のMLLMは「s-temporal」のプロンプトを正しく答えることに苦慮している。
我々はこのデータセットに基づいて2時間LLMベースラインを構築した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:41:22 GMT)
Towards Adversarial Robustness and Uncertainty Quantification in DINOv2-based Few-Shot Anomaly Detection [6.3] DINOv2のような基礎モデルは、数発の異常検出において強い性能を示している。
本研究は, 敵攻撃と不確実性評価に関する最初の体系的研究である。
生の異常スコアは校正が不十分で、信頼性と正しさのギャップが明らかになり、安全クリティカルな使用が制限されることがわかりました。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:06:45 GMT)
Entropic uncertainty and coherence in Einstein-Gauss-Bonnet gravity [6.2] フェルミオン場のGHZ状態とW状態に対する三部量子メモリ支援エントロピー不確実性と量子コヒーレンスについて検討する。
測定の不確実性について、W状態はシナリオ1では低い不確実性を示し、GHZ状態は逆の傾向を示し、シナリオ1では高い不確実性を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:33:58 GMT)
Quantum hypothesis testing via robust quantum control [6.2] 信号雑音の範囲に最適化されたロバスト制御手法を導入し, 既定耐久窓を超える優れたロバスト性を示す。
平均的に、最適制御とロバスト制御は、様々なデファス化や崩壊率に対する制御されていないスキームよりも改善されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:54:55 GMT)
Generalizing WiFi Gesture Recognition via Large-Model-Aware Semantic Distillation and Alignment [6.1] WiFiベースのジェスチャー認識は、AIoT環境において有望なRFセンシングパラダイムとして登場した。
本稿では,大規模モデル対応セマンティック蒸留・アライメントと呼ばれる新しい一般化フレームワークを提案する。
本手法は,実世界のAIoTアプリケーションにおいて,一般化されたRFベースのジェスチャーインタフェースに対して,スケーラブルでデプロイ可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:28:50 GMT)
SynDiff-AD: Improving Semantic Segmentation and End-to-End Autonomous Driving with Synthetic Data from Latent Diffusion Models [6.1] 提案するSynDiff-ADは,表現不足なグループに対して,現実的な画像を生成する新しいデータ拡張パイプラインである。
SynDiff-ADでデータセットを増強することにより、Mask2FormerやSegFormerといったセグメンテーションモデルのパフォーマンスが1.2%向上し、2.3%向上しました。
我々のSynDiff-ADパイプラインは、AIM-2DやAIM-BEVのようなエンド・ツー・エンドの自動運転モデルの運転性能を、様々な環境条件で最大20%向上することを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:35:20 GMT)
SWIR-LightFusion: Multi-spectral Semantic Fusion of Synthetic SWIR with {Thermal} IR {(LWIR/MWIR)} and RGB [6.1] 悪質な視界条件におけるシーン理解の促進は、監視と自律的なナビゲーションシステムにとって重要な課題である。
短波赤外画像(SWIR)は、大気の乱れを貫通し、透明度を向上させた材料を識別する能力によって、将来性のあるモダリティとして浮上している。
本稿では、最適化エンコーダデコーダニューラルネットワークアーキテクチャを用いて、合成SWIR、LWIR、RGBモダリティを統合したマルチモーダル融合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:00:41 GMT)
Scaling Vision Transformers for Functional MRI with Flat Maps [5.9] 我々は4次元fMRIデータを2次元fMRI活動フラットマップのビデオに変換する。
我々はfMRIフラットマップビデオの2.3K時間でビジョントランスフォーマーを訓練する。
この研究は、fMRIデータの基盤モデルを構築するための、進行中のオープンサイエンスプロジェクトの一部である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:15:00 GMT)
Improving Intrusion Detection with Domain-Invariant Representation Learning in Latent Space [5.8] 本稿では,関連ドメイン間の情報を統合潜在空間に融合するマルチタスク表現学習手法を提案する。
分類,再構成,相互情報の正規化損失を共同で最適化することにより,素早い相関を解消する最小限(ボトルネック)のドメイン不変表現を学習する。
実験により, 各種異常検出データセットのゼロデイ, 新規異常検出において, 大幅な改善が認められた。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:24:34 GMT)
Isolating Compiler Bugs through Compilation Steps Analysis [5.8] CompSCANは、コンパイルステップのシーケンスを解析する新しいコンパイラバグ分離技術である。
実世界のLLVMおよびGCCバグ185件についてCompSCANを評価した。
ETEMとODFLと比較すると、CompSCANは44.51%/50.18%/36.24%/24.49%/ETEM、31.58%/49.12%/44.93%/21.78%の相対的な改善を実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:58:02 GMT)
Foveation Improves Payload Capacity in Steganography [5.7] 既存の容量制限を100ビットから500ビットに改善するモデルをトレーニングします。
視覚的品質は31.47dB PSNRと0.13LPIPSと同等である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:00:59 GMT)
Path Gradients after Flow Matching [5.7] フローマッチングが継続的正規化フロー(CNF)の高速化に役立った
フローマッチングによって訓練されたCNFの微調整に経路勾配を用いることの利点について検討する。
実験により, このハイブリッドアプローチは, 分子系のサンプリング効率を最大3倍に向上させることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:29:12 GMT)
PATCH: Learnable Tile-level Hybrid Sparsity for LLMs [5.6] 大規模言語モデル(LLM)は、優れたパフォーマンスを提供するが、デプロイ時のメモリと計算コストは禁じている。
モデルプルーニングはこれらのオーバーヘッドを削減する効果的な方法であるが、既存のアプローチでは課題に直面している。
我々は,0%から50%の連続スパシティ比を可能にするハイブリッド・スパシティ・フレームワークであるエレーションを紹介した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:42:04 GMT)
From base cases to backdoors: An Empirical Study of Unnatural Crypto-API Misuse [5.6] 本稿では,不自然な暗号APIの利用を特徴付ける,最初の大規模研究について述べる。
20,508個のAndroidアプリケーションから得られた140,431個の暗号API呼び出しを階層化する。
手動リバースエンジニアリングを用いて,5,704件のサンプル呼び出しを定性的に解析した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:45:14 GMT)
Privacy-Aware Framework of Robust Malware Detection in Indoor Robots: Hybrid Quantum Computing and Deep Neural Networks [5.6] 屋内ロボットシステムのためのプライバシ対応マルウェア検出フレームワークを提案する。
本アーキテクチャは,プライバシー制約条件下での検知精度を最大95.2%向上する。
この作業は、安全で自律的なCPSオペレーションのための信頼できるAIを前進させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:25:33 GMT)
Flattening Hierarchies with Policy Bootstrapping [5.5] 本稿では,重み付けされた重要度サンプリングを施したサブゴール条件ポリシをブートストラップすることで,フラットな(階層的でない)目標条件ポリシーをトレーニングするアルゴリズムを提案する。
提案手法は,大規模状態空間における高次元制御へのスケーリングの鍵となる(部分)ゴール空間上の生成モデルの必要性を排除している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:48:59 GMT)
REAP the Experts: Why Pruning Prevails for One-Shot MoE compression [5.5] 専門家の刈り取りは、生成タスクにおいて優れた戦略であることを示す。
ルータ重み付きエキスパートアクティベーション・プルーニング(REAP)を提案する。
提案手法は,Qwen3-Coder-480B と Kimi-K2 を用いて,コード生成およびツール呼び出しタスクの無作為な圧縮を実現する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:29:28 GMT)
Dedelayed: Deleting remote inference delay via on-device correction [5.4] 任意のリモート推論遅延を緩和する遅延補正手法であるDedelayedを導入する。
提案手法では,現在のフレームを処理し,重み付きリモートモデルが過去のフレームから計算する特徴を融合する軽量なローカルモデルを用いている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:13:44 GMT)
Robust or Suggestible? Exploring Non-Clinical Induction in LLM Drug-Safety Decisions [5.3] 大規模言語モデル (LLMs) は、生物医学領域にますます適用されているが、薬物安全性予測の信頼性は未解明のままである。
われわれはChatGPT-4oとBio-Medical-Llama-3.8Bの2つの最先端モデルを評価する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:11:11 GMT)
A Brain-to-Population Graph Learning Framework for Diagnosing Brain Disorders [5.3] 本稿では2段階のBrain-to-Population Graph Learningフレームワークを提案する。
脳表象学習と呼ばれる第1段階では、GPT-4からの脳のアトラス知識を活用して、グラフ表現を充実させる。
第2段階では、集団障害診断と呼ばれる表現型データは、集団グラフ構築に組み込まれ、コンバウンディング効果を緩和するために特徴融合される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:19:21 GMT)
Re-uploading quantum data: A universal function approximator for quantum inputs [5.3] 量子ビットが任意の入力状態の新たなコピーと逐次相互作用する量子データ再ロードアーキテクチャを解析する。
我々のフレームワークは、量子データを直接操作する量子機械学習モデルを設計するための、量子ビット効率で表現力のあるアプローチを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:45:25 GMT)
Systematic Literature Review on Vehicular Collaborative Perception - A Computer Vision Perspective [5.3] コラボレーティブ・パーセプション(CP)は、これらの問題を緩和するための有望な解決策として登場した。
この研究は、PRISMA 2020ガイドラインに従い、106のピアレビュー記事を含む。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:03:25 GMT)
Exact Gauss-Newton Optimization for Training Deep Neural Networks [5.2] 一般化されたガウスニュートン(GN)ヘッセン近似と低ランク線形代数を組み合わせた2階最適化アルゴリズムであるExact Gauss-Newton(EGN)を提案する。
線形探索,適応正則化,運動量などの改良をEGNにシームレスに追加して,アルゴリズムをさらに高速化する方法について述べる。
数値実験により,EGNは多種多様な教師付き・強化学習タスクにおいて,よく訓練されたSGD,Adam,SQN,SGNの一般化性能を常に上回るか,あるいはほぼ一致していることが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:11:35 GMT)
Unsupervised Domain Adaptation via Content Alignment for Hippocampus Segmentation [5.1] 本稿では,MRIによる海馬間領域分割で発生する領域シフトに対処する,教師なし領域適応フレームワークを提案する。
本手法は、z正規化による効率的なスタイル調和と、双方向の変形可能な画像登録(DIR)戦略を組み合わせたものである。
人工海馬データセットと3つのMRI海馬データセットを総合的に評価し,集団の萎縮度を指標としたアプローチを検証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:34:41 GMT)
LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks [5.1] In-Context Learning-Data Collection Scheduling (ICLDC) は、緊急時にDeep Reinforcement Learning (DRL) に代わるものとして提案される。
検証器は、LLM(Large Language Model)によって生成されたスケジュールを評価し、安全でないスケジュールをオーバーライドすることによって、安全なUAV操作を保証する。
この方法は、ネットワーク性能を損なうためにタスク記述を操作されたジェイルブレイク攻撃に対してテストされる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:59:15 GMT)
Towards Reversible Model Merging For Low-rank Weights [5.1] モデルマージは、複数の微調整されたモデルを1セットの重みにまとめることを目的としており、すべてのソースタスクでうまく機能する。
従来のマージ法を低ランクウェイトに適用すると, マージモデルの性能が著しく低下することを示す。
すべてのアダプタを1組の重みに分解する代わりに、コンパクトな基底を構築する。
これは、単一のマージモデルを生成するのではなく、再構成可能なモデル空間を生成するものとしてマージされる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:22:38 GMT)
I Am Aligned, But With Whom? MENA Values Benchmark for Evaluating Cultural Alignment and Multilingual Bias in LLMs [5.1] 大規模言語モデル(LLM)の文化的アライメントと多言語バイアスを評価するための新しいベンチマークであるMENAValuesを紹介する。
大規模で権威ある人的調査から、我々は16カ国の人口レベルの応答分布を持つMENAの社会文化的景観を捉えた構造化データセットをキュレートした。
分析の結果,同じ質問が言語に基づいて大きく異なる反応をもたらす「クロス・Lingual Value Shifts」,その理由の説明を促す「Reasoning-induced Degradation」,モデルがセンシティブな質問を拒否する「Logit Leakage」,内部確率が強く隠蔽される「Logit Leakage」の3つの重要な現象が明らかになった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:10:57 GMT)
Echoes of BERT: Do Modern Language Models Rediscover the Classical NLP Pipeline? [5.0] 従来のBERTologyに基づいて、古典的アーキテクチャ(BERT, DeBERTa, GPT-2)から現代の大規模言語モデル(Pythia, OLMo-2, Gemma-2, Qwen2.5, Llama-3.1)にまたがる25のモデルを分析する。
階層的な組織は現代のモデルに留まり、初期レイヤは構文をキャプチャし、中間レイヤはセマンティクスとエンティティレベルの情報を扱い、後のレイヤは談話現象をエンコードしている。
語彙情報は初期層で直線的に集中するが、ネットワークでは非線形に深くなっているのに対して、屈折情報はすべての層で直線的にアクセス可能である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:03:01 GMT)
deFOREST: Fusing Optical and Radar satellite data for Enhanced Sensing of Tree-loss [5.0] 我々は,光・合成開口レーダ(SAR)データを組み込んだ森林破壊検出パイプラインを開発した。
パイプラインの重要な構成要素は、光学データの異常マップの構築である。
我々は、アマゾン森林の92.19km×91.80,km$領域でSentinel-1(SAR)およびSentinel-2(Optical)データを用いてアプローチを検証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:02:45 GMT)
Learning with Incomplete Context: Linear Contextual Bandits with Pretrained Imputation [5.0] PULSE-UCBは、補助データに基づいて訓練された事前学習モデルを利用して、オンライン意思決定中に欠落した特徴を暗示するアルゴリズムである。
その結果、予測された文脈における不確実性が意思決定の質に与える影響と、下流学習を改善するためにどれだけの歴史的データが必要とされるかが定量化される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:38:30 GMT)
Think Globally, Group Locally: Evaluating LLMs Using Multi-Lingual Word Grouping Games [4.9] 我々はNew York Times Connections: GlobalGroupに触発されたタスクを提案し、複数の言語にまたがる抽象的推論タスクにおいてモデルを評価する。
ネイティブ言語と英訳の双方で5つの言語背景を持つゲームベンチマークを構築した。
英語のモダリティは、この抽象的推論タスクにおけるパフォーマンスの向上と、オープンソースモデルとクローズドソースモデルのパフォーマンスの相違に大きく寄与している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:12:43 GMT)
Modeling Cultural Bias in Facial Expression Recognition with Adaptive Agents [4.9] エージェントベースのストリーミングベンチマークを導入し、異文化間合成とプログレッシブなぼかしが顔認識の堅牢性にどのように作用するかを明らかにする。
単文化集団(西欧のみ,アジアのみ)と混在環境のバランス(5/5)と不均衡(8/2, 2/8)と空間接触構造の違いについて検討した。
JAFFE(アジア)の人口は低いぼやけでは高い性能を維持しているが、中間段階ではより急激な低下を示す。
混合集団は中間パターンを示し、バランスの取れた混合は早期劣化を緩和するが、不均衡な設定は多数派弱点を増幅する
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:53:30 GMT)
State-Specific Orbital Optimization for Enhanced Excited-States Calculation on Quantum Computers [4.8] 本稿では,近距離量子コンピュータにおける状態固有軌道最適化手法を提案する。
種々の分子上の平均軌道最適化法よりも高い精度が得られることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:39:30 GMT)
Robust estimation of heterogeneous treatment effects in randomized trials leveraging external data [4.8] 本研究では,条件付き平均治療効果(CATE)を推定するモデル非依存学習者QR-learnerを提案する。
これにより、トライアルのみのCATE学習者に対して平均2乗誤差を低減でき、外部データがトライアルに一致していない場合でも真のCATEを復元することが保証される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:31:04 GMT)
Impact of irradiation conditions on the magnetic field sensitivity of spin defects in hBN nano flakes [4.8] ヘリウム集束イオンビーム(FIB)による薄膜hBNナノフレーク中のV_mathrmB-$中心の研究を行った。
最適注入量では、$sim 1,mumathrmT/sqrtmathrmHz$の交流磁気感度が達成される。
この研究は、hBN における $V_mathrmB-$ 中心の性質を最適化するために、いかに慎重に製造パラメータを選択するかを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:14:55 GMT)
Hi-Drive: Hierarchical POMDP Planning for Safe Autonomous Driving in Diverse Urban Environments [4.8] Hi-Driveは、動作レベルと軌道レベルの不確実性に対処する階層的計画アルゴリズムである。
Hi-Driveはドライバーモデルを使用して、他の車の不確実な行動意図を表現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:52:38 GMT)
Bridging the Editing Gap in LLMs: FineEdit for Precise and Targeted Text Modifications [4.8] FineEditは、コンテキスト対応のテキスト修正のために明示的に訓練された特殊な編集モデルである。
FineEditはシングルターン編集で最先端のモデルより優れており、Llama-3.2-3Bより30%も上回り、Mistral-7B-OpenOrcaのパフォーマンスを40%以上上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:24:23 GMT)
Decision-focused Sensing and Forecasting for Adaptive and Rapid Flood Response: An Implicit Learning Approach [4.7] タイムリーで信頼性の高い意思決定は、洪水の緊急対応に不可欠である。
従来の洪水管理システムは、リモートセンシングに基づく大規模な洪水深度予測モデルをキャリブレーションするために、in-situセンサーに依存していることが多い。
In-situ センサー配置のための位置を戦略的に選択する新しい決定中心のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:47:00 GMT)
Yang-Lee edge singularity and quantum criticality in non-Hermitian PXP model [4.7] 非エルミート分解PXPモデルにおいて、量子臨界性に関する包括的な理論的枠組みを提案する。
我々は、実エネルギー状態における類似性変換を通じて、正確に二階相転移境界を構築する。
本研究は,YLES(Yang-Lee edge)の位置を,関連する直交エコーと自己正規のLoschmidtエコーの両方を用いて同定する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:15:39 GMT)
All Code, No Thought: Current Language Models Struggle to Reason in Ciphered Language [4.7] CoT(Chain-of- Thought)モニタリングは、敵の攻撃やAIのミスアライメントを検出するために広く使われている手法である。
攻撃者やミスアライメントされたモデルは、暗号推論を通じてCoTの監視を回避する可能性がある。
モデルが暗号化された推論を実行できるかどうかを検証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:07:42 GMT)
AMORE: Adaptive Multi-Output Operator Network for Stiff Chemical Kinetics [4.6] 固形系の時間積分は燃焼、超音速、その他の反応性輸送系における計算コストの主要な源である。
複数の出力と適応損失関数を予測できる演算子で構成されるフレームワークであるAMOREを開発した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:43:30 GMT)
ConsintBench: Evaluating Language Models on Real-World Consumer Intent Understanding [4.6] benchは、特にコンシューマドメインにおいて、インテント理解のために特別に設計された、最初の動的でライブな評価ベンチマークである。
ベンチはこの種の最大かつ最も多様なベンチマークであり、リアルタイム更新をサポートし、自動キュレーションパイプラインによるデータの汚染を防止している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:49:45 GMT)
T3former: Temporal Graph Classification with Topological Machine Learning [4.5] 時間グラフ分類は、サイバーセキュリティ、脳接続分析、トラフィック監視などのアプリケーションにおいて重要な役割を果たす。
我々は、スライドウィンドウトポロジカルおよびスペクトルディスクリプタを1級トークンとして活用し、特殊なディスクリプタ・アテンション機構によって統合された新しいトポロジカル・テンポロジカル・トランスフォーマーT3formerを紹介する。
T3formerは、動的ソーシャルネットワーク、脳機能接続データセット、トラフィックネットワークなど、複数のベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:46:32 GMT)
Protect: Towards Robust Guardrailing Stack for Trustworthy Enterprise LLM Systems [4.4] Protectは、テキスト、画像、オーディオ入力間でシームレスに動作するように設計されたマルチモーダルガードレールモデルである。
Low-Rank Adaptation (LoRA)を通じてトレーニングされたカテゴリ固有のアダプタを、広範なマルチモーダルデータセットに統合する。
教師支援型アノテーションパイプラインは、推論と説明トレースを利用して、高忠実でコンテキスト対応なラベルを生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:40:24 GMT)
On-Chain Decentralized Learning and Cost-Effective Inference for DeFi Attack Mitigation [4.4] DeFiプラットフォームでは、ビジネスロジックや会計上の脆弱性を利用したトランザクションによって、毎年数十億ドルが失われている。
i) コスト削減のためにLayer-2上でガス禁止計算を行い、(ii) 検証済みのモデル更新をLayer-1に伝達し、(iii) スマートコントラクト内でガス境界付き低遅延推論を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:58:34 GMT)
Learning Wireless Interference Patterns: Decoupled GNN for Throughput Prediction in Heterogeneous Multi-Hop p-CSMA Networks [4.3] Decoupled Graph Convolutional Network (D-GCN)は、ノードの送信確率の処理を近隣の干渉効果から明確に分離する新しいアーキテクチャである。
D-GCNは3.3%のNMAEを達成し、強力なベースラインを上回り、正確な解析手法が計算的に実現不可能になった場合でも、依然として引くことができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:13:59 GMT)
Visual Interestingness Decoded: How GPT-4o Mirrors Human Interests [4.3] 視覚的面白さの概念を理解するために,大規模マルチモーダルモデルの可能性を探る。
本研究は, LMM である GPT-4o とヒトの部分的アライメントを明らかにする。
この洞察は、人間の関心をより深く理解するための道を開く。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:04:48 GMT)
Physics-augmented Multi-task Gaussian Process for Modeling Spatiotemporal Dynamics [4.3] 本稿では,動的システムのための物理拡張型マルチタスクガウスプロセス(P-M-GP)フレームワークを提案する。
我々は,物理に基づく規則化スキームを通じて物理法則を定式化することにより,動的原理と整合性のある予測を制約する。
数値実験により,提案手法は既存手法よりも予測精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:33:10 GMT)
Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process [4.3] トップ層人工知能(AI)と機械学習(ML)カンファレンスへの応募の急速な増加により、多くの会場がクローズドからオープンなレビュープラットフォームに移行した。
一部はオープンなピアレビューを完全に受け入れており、プロセス全体を通してパブリックな可視性を実現している。
その他には、最終決定後のみレビューをリリースしたり、オープンなピアレビューシステムを使用してもレビューを非公開にしておくようなハイブリッドアプローチも採用されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:44:35 GMT)
Jenga-Krotov algorithm: Efficient compilation of multi-qubit gates for exchange-only qubits [4.2] 本稿では, 勾配に基づく最適化アルゴリズムであるJenga-Krotovを導入し, コンパクトで高忠実なEOゲート列を探索する。
JK を Toffoli ゲートに適用することにより、必要な交換単位数を 216 から 92 に減らし、時間ステップを 162 から 50 に圧縮する。
現実的な雑音下では、最適化シーケンスからの累積ゲート誤差は従来の手法よりも桁違いに小さい。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:24:57 GMT)
Leaking Queries On Secure Stream Processing Systems [4.2] ストリーム処理システムでは、クエリはアプリケーションロジックを含むため、データと同じくらい敏感である。
実行エンジンの確保にIntel SGXを使用するストリーム処理システムからクエリを抽出することは実用的であることを示す。
SecureStreamとNEXMarkを使って、人気のあるデータストリームベンチマークに基づいて攻撃を実装し、攻撃成功率を最大92%まで示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:48:29 GMT)
Exact Dynamics of Multi-class Stochastic Gradient Descent [4.2] ワンパス勾配勾配法(SGD)を用いて学習した多種多様な高次元最適化問題の学習・学習速度ダイナミクスを解析するためのフレームワークを開発する。
我々は、ODEのシステムに対する決定論的解という観点から、リスクや真の信号との重なり合いを含む、制限力学の関数の大規模なクラスに対して、正確な表現を与える。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:31:49 GMT)
DIO: Refining Mutual Information and Causal Chain to Enhance Machine Abstract Reasoning Ability [4.0] 我々は、パターン、推論、問題解決知能のベンチマークであるRaven's Progressive Matrices (RPM)に取り組む。
完全な因果連鎖イメージ$rightarrow$属性$rightarrow$プログレッシブパターンをモデル化し、ベースラインDIOを構築します。
しかし、DIOの低境界目的には人間の論理が組み込まれていないため、3つの改良点が提示される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:24:50 GMT)
Assessing Web Search Credibility and Response Groundedness in Chat Assistants [4.0] 本稿では,アシスタントのWeb検索行動を評価するための新しい手法を提案する。
GPT-4o, GPT-5, Perplexity, Qwen Chatの5項目を100件のクレームで評価した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:55:47 GMT)
When Less Is More: Binary Feedback Can Outperform Ordinal Comparisons in Ranking Recovery [4.0] 関係のない順序対比較をモデル化するための一般的なパラメトリック・フレームワークを提案する。
順序データの双対化はランキング回復の精度を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:25:45 GMT)
Benchmarking Hindi LLMs: A New Suite of Datasets and a Comparative Analysis [4.0] IFEval-Hi, MT-Bench-Hi, GSM8K-Hi, ChatRAG-Hi, BFCL-Hiの5つのHindi評価データセット群を紹介する。
これらは、intra-scratch Humanアノテーションとtranslate-and-verifyプロセスを組み合わせた方法論を用いて作成された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:12:44 GMT)
Aligning Large Language Models to Low-Resource Languages through LLM-Based Selective Translation: A Systematic Study [4.0] 選択的翻訳は、翻訳不可能な内容と文構造を保持しながら、テキストの翻訳可能な部分のみを翻訳する技法である。
実験では、低リソースのIndic言語Hindiに着目し、Google Cloud Translation(GCP)とLlama-3.1-405Bで生成された翻訳を比較した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:43:31 GMT)
Altruistic Ride Sharing: A Community-Driven Approach to Short-Distance Mobility [3.9] アルトゥルティック・ライドシェアリング(Altruistic Ride-Sharing、ARS)は、金融インセンティブではなく、利他主義に基づくドライバーとライダーの役割を交互に行う、分散的でピアツーピアのモビリティ・フレームワークである。
ARSは、旅行距離と排出を減らし、車両の利用量を増やし、非共有と最適化ベースラインの両方と比較して公平な参加を促進する。
結果は、ARSを従来のライドシェアリングに代わるスケーラブルでコミュニティ主導の代替として確立し、個人の行動と都市全体の持続可能性の目標を一致させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:24:48 GMT)
Defending against Stegomalware in Deep Neural Networks with Permutation Symmetry [3.9] 最先端のニューラルネットワークステゴマルウェアは、重みおよび偏り行列の列順をシャッフルすることで効率よく効果的に中和することができる。
これにより、ニューラルネットワークステガノグラフィーにおける最先端の手法に埋め込まれたペイロードを、ネットワークの精度を犠牲にすることなく、効果的に破壊することを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:03:49 GMT)
Hypernetworks for Perspectivist Adaptation [3.9] 本稿では,既存のアーキテクチャであるハイパーネットワーク+アダプタの組み合わせをパースペクティビスト分類に適用することにより,視点認識型分類の問題に対処する。
我々は、ヘイトスピーチと毒性検出のユーザー視点を採用する際に、特別なモデルと競合できるソリューションにたどり着き、パラメータをかなり少なくする。
私たちのソリューションはアーキテクチャに依存しないので、最初から幅広いベースモデルに適用できます。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:06:44 GMT)
MUSE: Model-based Uncertainty-aware Similarity Estimation for zero-shot 2D Object Detection and Segmentation [3.9] MUSEはモデルベースのゼロショット2Dオブジェクトの検出とセグメンテーションのために設計されたトレーニング不要のフレームワークである。
入力クエリ画像から抽出した3D未表示オブジェクトと2Dオブジェクト提案からレンダリングされた2Dマルチビューテンプレートを利用する。
MUSEはBOPチャレンジ2025で最先端のパフォーマンスを達成し、クラシックコア、H3、インダストリアルトラックでランキング1位を獲得した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:16:09 GMT)
Document Intelligence in the Era of Large Language Models: A Survey [3.8] ドキュメントAI(DAI)は重要な応用分野として現れており、大規模言語モデル(LLM)の出現によって大きく変化している。
本稿では,DAIの最先端技術に関する構造化分析と,学術的・実践的両面におけるその意義について述べる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:57:03 GMT)
From misinformation to climate crisis: Navigating vulnerabilities in the cyber-physical-social systems [3.8] サイバーインフラストラクチャは、物理システム間の通信、データ処理、自動化を容易にする。
社会インフラは、システムの機能に必要な人的資本と社会的規範を提供する。
この章では、サイバー物理・社会気候のネクサスにおける人間の脆弱性の役割について論じる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:39:11 GMT)
Evaluating Arabic Large Language Models: A Survey of Benchmarks, Methods, and Gaps [3.7] この調査は、NLPタスク、知識領域、文化的理解、特殊能力にわたる40以上の評価ベンチマークを分析し、アラビア語のLLMベンチマークを初めて体系的にレビューした。
本稿では,ナレッジ,NLPタスク,カルチャー・アンド・ダイアレクト,ターゲット・スペクティフィック評価の4つのカテゴリに分類基準を編成する手法を提案する。
分析の結果,時間的評価の限界,マルチターン・ダイアログの不十分,データセットの文化的な相違など,重要なギャップを識別しながら,ベンチマークの多様性が著しく向上していることが判明した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:25:33 GMT)
Optimizing Quantum Transformation Matrices: A Block Decomposition Approach for Efficient Gate Reduction [3.7] 本稿では,ブロック分解法を用いて,制限されたゲート数で量子変換行列を近似するアルゴリズムを提案する。
シミュレーションは、ゲートを著しく減らした近似変換におけるアルゴリズムの有効性を検証し、複雑な計算の量子計算効率を向上する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:24:17 GMT)
Group Sparse Matrix Optimization for Efficient Quantum State Transformation [3.7] スパース行列法を量子状態変換問題に適用する。
量子状態変換のためのユニタリ行列を探索するための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:28:18 GMT)
Provenance of AI-Generated Images: A Vector Similarity and Blockchain-based Approach [3.6] 本稿では,AI生成画像と実(人間による)画像とを識別する組込み型AI画像検出フレームワークを提案する。
提案手法は,AI生成画像が他のAI生成コンテンツに近接していることを示す仮説に基づいている。
以上の結果から,中程度の摂動と高摂動が埋め込みシグネチャに最小限に影響を及ぼすことが確認された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:49:56 GMT)
Cluster-Based Client Selection for Dependent Multi-Task Federated Learning in Edge Computing [3.5] 本稿では,モバイルエッジコンピューティング(MEC)環境におけるフェデレートラーニング(FL)におけるクライアント選択問題について検討する。
本稿では,クラスタ指向で依存性を意識したフレームワークであるCoDa-FLを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:14:12 GMT)
Software System for Low-Cost, GUI-Based Microscopy Segmentation: Algorithmic Implementation [3.5] 本稿では,標準CPUデスクトップを搭載した低予算研究室向けに設計された,新しい顕微鏡画像解析フレームワークを提案する。
Pythonベースのプログラムは、高度なコンピュータビジョンと機械学習パイプラインを通じて、カルチャー内の生きた、保存されていない細胞のサイトメトリー分析を可能にする。
プログラミングスキルを必要としないユーザフレンドリでクロスプラットフォームなGUIを通じてアクセスでき、開発者によるプログラム制御と統合のためのスクリプティングインターフェースを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:41:49 GMT)
FineScope : Precision Pruning for Domain-Specialized Large Language Models Using SAE-Guided Self-Data Cultivation [3.5] FineScopeは、より大きな事前訓練されたモデルからドメイン最適化言語モデルを導出するためのフレームワークである。
構造的プルーニングをドメイン固有の制約で適用し、結果のモデルが対象ドメインに不可欠な知識を保持することを保証します。
実験とアブレーション実験により、FinScopeは高い競争力を発揮することが示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:32:53 GMT)
Effectiveness of the syndrome extraction circuit with flag qubits on IBM quantum hardware [3.5] 我々は,IBM量子コンピュータ上でフラグ量子ビットを用いたシンドローム抽出回路の実装に成功したことを報告した。
データキュービットはシンドロームキュービットに隣接していないが、繰り返し符号の距離が増加するにつれて論理誤差は減少する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:24:15 GMT)
AI-Agents for Culturally Diverse Online Higher Education Environments [3.5] この章は、既存の研究をレビューし、文化的に多様なオンライン高等教育環境におけるエンゲージメントを促進し、学習成果を改善するために、文化的に意識されたAIエージェントの使用を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:49:42 GMT)
Data-Efficient Fine-Tuning of Vision-Language Models for Diagnosis of Alzheimer's Disease [3.5] 医用視覚言語モデル(Med-VLMs)は、レポート生成や視覚的質問応答といったタスクにおいて印象的な結果を示している。
既存のモデルの多くは、スクラッチからトレーニングするか、大規模な2D画像テキストペアで微調整されるのが一般的である。
我々は3次元MRIに3次元CTベースのMed-VLMを適用するためのデータ効率の良い微調整パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:06:34 GMT)
Passwords and FIDO2 Are Meant To Be Secret: A Practical Secure Authentication Channel for Web Browsers [3.3] 悪質なクライアントサイドスクリプトやブラウザ拡張機能は、パスワードマネージャがそれらをWebページにオートフィルした後、パスワードを盗むことができる。
われわれはFirefoxブラウザに設計を実装し、XSS攻撃や悪意ある拡張からパスワードを保護できることを実証する実験を行った。
次に、設計を一般化し、FIDO2プロトコルに対する最近発見されたローカルアタックを防ぐ第2のディフェンスを作成します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:06:14 GMT)
Ultralytics YOLO Evolution: An Overview of YOLO26, YOLO11, YOLOv8 and YOLOv5 Object Detectors for Computer Vision and Pattern Recognition [3.3] 本稿では、対象検出器のUltralytics YOLO(You Only Look Once)ファミリーについて概観する。
レビューは、最新のリリースであるYOLO26(またはYOLOv26)から始まる。
本論文は,密接なシーン制限,ハイブリッドCNN-Transformer統合,オープン語彙検出,エッジ認識トレーニングアプローチなど,課題と今後の方向性を明らかにする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:57:20 GMT)
Circle of Willis Centerline Graphs: A Dataset and Baseline Algorithm [3.3] ウィリスのサークル(英: Circle of Willis、略称:CoW)は、脳血管疾患に関係している脳の動脈の重要なネットワークである。
従来の骨格化技術は、しばしばCoWの複雑な幾何学のために信頼性の高い中心線を抽出するのに苦労する。
我々は、TopCoWデータセットから中心線グラフと形態計測特徴を抽出し、キュレートするためにシンニングベースのスケルトン化アルゴリズムを使用した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:22:51 GMT)
ACADATA: Parallel Dataset of Academic Data for Machine Translation [3.2] ACAD-TRAINには、96の言語方向にわたる150万の著者生成パラグラフが含まれている。
ACAD-BENCH(ACAD-BENCH)は、12方向をカバーする約6,000の翻訳をキュレートした評価セットである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:42:22 GMT)
A Complete Pipeline for deploying SNNs with Synaptic Delays on Loihi 2 [3.2] エッジコンピューティングのための従来のニューラルネットワークよりもエネルギー効率のよい代替手段として、スパイキングニューラルネットワークが注目を集めている。
我々は、GPUのシナプス遅延とIntelのLoihi 2ニューロモルフィックチップへの展開によるSNNの効率的なイベントベーストレーニングという完全なパイプラインを提示する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:05:55 GMT)
Toward Cybersecurity-Expert Small Language Models [3.2] サイバーセキュリティに精通した小型言語モデル(SLM)のファミリーであるCyberPal 2.0を4B-20Bパラメータから紹介する。
私たちは、データ強化とフォーマッティングパイプライン、SecKnowledge 2.0で構築された、豊富なチェーンのサイバーセキュリティインストラクションデータセットを生成します。
多様なサイバーセキュリティベンチマークを通じて、CyberPal 2.0はベースラインを一貫して上回り、さまざまなオープンソースおよびクローズドソースフロンティアモデルを上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:34:58 GMT)
(R)evolution of Programming: Vibe Coding as a Post-Coding Paradigm [3.1] 我々は,開発者とAIシステム間の直感的,感情駆動的,即興的なインタラクションを強調する,新たなバイブコーディング(VC)パラダイムについて検討する。
我々の分析は、AI支援開発における一般的なコパイロットの視点と対比して、コドリフティングの比喩の中でVCを概念化している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:43:26 GMT)
Sample-Centric Multi-Task Learning for Detection and Segmentation of Industrial Surface Defects [3.0] 試料品質制御(QC)のための工業用表面欠陥検査は、与えられた試料が欠陥を含むか否かを同時に決定し、それらの欠陥を局所化する必要がある。
既存のモデルは強いピクセルオーバーラップ測定値を得るが、サンプルレベルでの安定性は不十分である。
サンプル中心型マルチタスク学習フレームワークと評価スイートを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:24:26 GMT)
Absolute indices for determining compactness, separability and number of clusters [3.0] 本稿では,クラスタのコンパクト性と分離性の両方を決定するために,新しい絶対クラスター指標を提案する。
提案したコンパクト性と分離性指標を適用して,クラスタの真の数を同定する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:14:11 GMT)
Symmetry-protected states of interacting qubits in superconducting quantum circuits [3.0] 超伝導回路は、現実的な環境騒音の存在下で、数ミリ秒を超えるコヒーレンス時間に達することができることを示す。
我々の研究は、新しい世代の量子デバイスにおいて、長いコヒーレンス時間で量子ビットを実現するための道を開く。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:44:20 GMT)
FLARE: Fast Low-rank Attention Routing Engine [2.9] Fast Low-rank Attention Engine (FLARE) は、固定長の待ち行列を通して注意を誘導する線形複雑自己注意機構である。
FLAREは前例のない問題のサイズにスケールするだけでなく、最先端のニューラルPDEサロゲートよりも精度が高い。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:13:42 GMT)
A fully automated and scalable Parallel Data Augmentation for Low Resource Languages using Image and Text Analytics [2.9] 本稿では,新聞記事からバイリンガル並列コーパスを抽出する,スケーラブルで完全に自動化された手法を提案する。
2つの異なる言語の組み合わせに対して並列データコーパスを構築することでアプローチを検証するとともに,機械翻訳の下流タスクを通じて,このデータセットの価値を実証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:57:23 GMT)
A tutorial on discovering and quantifying the effect of latent causal sources of multimodal EHR data [2.9] 大規模電子健康記録観測における潜伏因果関係の発見と臨床結果に対する因果関係の定量化を目的として,一般化可能な因果関係機械学習パイプラインについて述べる。
本稿では,不完全なマルチモーダル臨床データを処理し,確率的に独立な潜伏源に分解し,個別因果効果を推定できるタスク固有因果モデルを訓練する方法について述べる。
提案手法の2つの現実的応用の成果を, 大規模医療発見のための汎用性と有用性の実証として要約した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:39:11 GMT)
Reasoning on a Spectrum: Aligning LLMs to System 1 and System 2 Thinking [2.9] 大きな言語モデル(LLM)は印象的な推論能力を示すが、構造化されたステップバイステップの推論に依存しているため、限界が示される。
この作業は、ステップバイステップの推論が常に最適であるという仮定に挑戦し、タスク要求に基づいた推論戦略を適用する必要性を強調します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:36:19 GMT)
UrbanFusion: Stochastic Multimodal Fusion for Contrastive Learning of Robust Spatial Representations [2.9] UrbanFusionはMultimodal Fusion(SMF)を特徴とするGeoFM(GeoFM)である
このフレームワークでは、ストリートビュー画像、リモートセンシングデータ、カートマップ、関心点(POI)データなど、さまざまなタイプの入力を処理するために、空間固有のエンコーダを使用している。
UrbanFusionの強力な一般化と予測性能は、最先端のGeoAIモデルと比較される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:26:24 GMT)
Multi-state Protein Design with DynamicMPNN [2.8] 既存の多状態設計アプローチは、単状態予測のポストホックアグリゲーションに依存している。
動的MPNNは,複数のコンフォメーションと互換性のあるシーケンスを生成するために,明示的に訓練された逆モデルである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:29:20 GMT)
Prediction Markets with Intermittent Contributions [2.7] 私たちは予測市場に基づいて、より一般的な枠組みに身を置いています。
そこでは、独立系エージェントが報酬と引き換えに、不確実な将来の出来事の予測を交換している。
我々は、(i)エージェントの歴史的パフォーマンスを考慮に入れた予測市場を導入・分析し、(ii)エージェントが自発的に市場に入り、出ることを許可する一方、(iii)エージェントは、時間的に変化する条件に適応する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:23:28 GMT)
Inferred global dense residue transition graphs from primary structure sequences enable protein interaction prediction via directed graph convolutional neural networks [2.7] タンパク質-タンパク質相互作用(PPI)の正確な予測は、細胞機能を理解し、薬物開発を促進するために重要である。
タンパク質言語モデル(PLMs)からの直接配列埋め込みを用いた既存のin-silico法
また、3Dタンパク質構造にグラフニューラルネットワーク(GNN)を使用するものもある。
本稿では,リンク予測による下流PPI予測のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:15:31 GMT)
SeLeRoSa: Sentence-Level Romanian Satire Detection Dataset [2.7] 本稿では,SeLeRoSaと呼ばれる,ルーマニアの風刺文検出のための最初の文レベルデータセットを紹介する。
データセットは、社会問題、IT、科学、映画など、さまざまな領域にまたがる13,873の注釈付き文で構成されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:56:03 GMT)
Auto-repair without test cases: How LLMs fix compilation errors in large industrial embedded code [2.6] 大規模言語モデル(LLM)によって駆動されるコンパイルエラーに対して,自動修復手法を採用する。
私たちの調査では、製品のソースコードから4000万件以上のコミットを収集しています。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:13:13 GMT)
Imperative Quantum Programming with Ownership and Borrowing in Guppy [2.6] 本研究の目的は、エルゴノミクス線形型付けと命令的意味論を組み合わせ、安全性を保証する量子型システムを開発することである。
ここで提示されたすべてのアイデアは、QuantinuumのGuppyプログラミング言語で実装されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:54:12 GMT)
Bidirectional Nonlinear Optical Tomography: Unbiased Characterization of Off- and On-Chip Coupling Efficiencies [2.6] BNOTは、オフチップ計測をオンチップ量にリンクする方向対応光学トモグラフィーである。
信頼区間が狭い個々のインタフェース効率を推定する。
非線形過程におけるオフチップとオンチップのカップリング効率の非バイアス特性を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:06:59 GMT)
Reciprocal Space Attention for Learning Long-Range Interactions [2.5] 本稿では,Fourierドメインにおける長距離インタラクションをキャプチャするフレームワークであるReciprocal-Space Attention (RSA)を紹介する。
RSAは、既存のローカルまたは半ローカルMLIPフレームワークと統合することができる。
RSAは、幅広い化学・材料系にわたる長距離物理学を一貫して捉えていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:35:47 GMT)
GranQ: Efficient Channel-wise Quantization via Vectorized Pre-Scaling for Zero-Shot QAT [2.5] GranQは、効率的な事前スケーリング戦略を導入する新しいアクティベーション量子化フレームワークである。
CIFARとImageNetで、最先端のZSQメソッドを一貫して上回る。
提案手法は, CIFAR-100の3ビット設定において最大5.45%の精度を実現し, CIFAR-10の完全精度ベースラインを超えている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:56:20 GMT)
Position: Require Frontier AI Labs To Release Small "Analog" Models [2.5] 我々は、イノベーションを積極的に推進しながらAIの安全性を保証する代替規制アプローチを議論する。
大規模なAI研究所は、オープンアクセス可能な小さなアナログモデル(スケールダウン版)を公開し、最大のプロプライエタリモデルと同じような訓練を受け、蒸留する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:47:49 GMT)
D-com: Accelerating Iterative Processing to Enable Low-rank Decomposition of Activations [2.5] 本稿では, 入力分解アルゴリズムとハードウェアサポートの適切な選択により, 入力分解が著しく有用であることを示す。
我々は、進行分解アルゴリズム、Lanczosアルゴリズムを採用し、分解アルゴリズムの共加速器アーキテクチャを設計する。
当社のアクセラレータであるD-comは、モデル品質の劣化を小さくするコストで、A100 GPUと比較して、エンドツーエンドのレイテンシを22%改善します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:56:36 GMT)
Cryo-CMOS Antenna for Wireless Communications within a Quantum Computer Cryostat [2.4] 本稿では,28GHzで動作する低温互換のオンチップディファレンシャル双極子アンテナを提案し,量子コンピュータのクリーモスタット内で短距離無線通信を実現する。
アンテナは、自由空間における-20.8dBの反射係数と、クライオスタット内の-18.38dBの反射係数を達成し、効率的なインピーダンスマッチングを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:52:33 GMT)
Searching for a Farang: Collective Security among Women in Pattaya, Thailand [2.4] パタヤの女子センターで2ヶ月のフィールドワークを報告し,76名を対象にインタビューを行った。
私たちの研究は、セックスやマッサージ業界で働くパタヤの女性たちが、ファラン男性との関係を最善だと認識していることを示している。
私たちは、デジタルセキュリティ奨学金の新興分野において、限界づけられた状況の中で仕事をしている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:25:55 GMT)
ArtNet: Hierarchical Clustering-Based Artificial Netlist Generator for ML and DTCO Application [2.3] ArtNetは、与えられたターゲットパラメータとより密に一致する、リアルな人工データセットを生成する。
CNNベースのDRV予測の文脈では、ArtNetのデータ拡張によってF1スコアが0.16向上する。
DTCOの文脈では、ArtNetが生成したミニ脳は97.94%のPPAマッチングを実現し、ターゲットとするフルスケールブロックの設計指標と密に一致している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:16:16 GMT)
Deflanderization for Game Dialogue: Balancing Character Authenticity with Task Execution in LLM-based NPCs [2.3] 本稿では,Commonsense Persona-Grounded Dialogue Challenge (CPDC) 2025 Round 2への参加について報告する。
i) 過剰なロールプレイの抑制とタスクの忠実度向上のためのデフランダライズプロンプト手法を含むAPIトラックの軽量なプロンプト手法と,(ii) Qwen3-14Bと教師付きファインタニング(SFT)とローランド適応(LoRA)を併用したGPUトラックの微調整大型モデルを組み合わせる。
第1タスク(APIトラック)では第2位,第3タスクでは第4位です。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:17:23 GMT)
A Linguistically Motivated Analysis of Intonational Phrasing in Text-to-Speech Systems: Revealing Gaps in Syntactic Sensitivity [2.3] 我々は、心理言語学的研究にインスパイアされた手法を用いて、テキスト音声(TTS)システムの統語感度を解析した。
TTSシステムは,構文境界が曖昧な文において,国際句境界を正確に生成するのに苦労していることがわかった。
構文的境界位置のコマを含まない文でモデルを微調整し、より微妙な言語的手がかりに焦点を合わせるよう促す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:03:10 GMT)
PulseFi: A Low Cost Robust Machine Learning System for Accurate Cardiopulmonary and Apnea Monitoring Using Channel State Information [2.2] 我々は、Wi-Fiセンサーと人工知能を使ってバイタルサインをモニターする、新しい低コストな非侵入システムPulseFiを提案する。
PulseFiは低価格のコモディティデバイスを使っており、よりアクセシブルで費用対効果が高い。
以上の結果から,PulseFiは非侵襲的に心拍数と呼吸速度を効果的に推定できることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:53:31 GMT)
Injection, Attack and Erasure: Revocable Backdoor Attacks via Machine Unlearning [2.2] 本稿では,攻撃目標達成後,バックドアを積極的にかつ徹底的に取り除くことができる,取り消し可能なバックドア攻撃の第1パラダイムを紹介する。
この研究は、バックドア攻撃研究の新しい方向性を開き、機械学習システムのセキュリティに対する新たな課題を提示します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:09:43 GMT)
Terahertz Landau level spectroscopy of Dirac fermions in millimeter-scale twisted bilayer graphene [2.2] 製造の進歩を活用し, 均一なツイスト角度で5mm×5mm以上の二層グラフェン試料を作製した。
これらの測定は、ランダウ準位遷移における電荷励起を直接プローブし、フェルミ速度をツイスト角の関数として決定する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:27:48 GMT)
Diffeomorphism invariant tensor networks for 3d gravity [2.1] 我々はチャーン・サイモンズ理論の制約を満たす状態を構築する。
これは、計量変数において、我々が構成する状態がホイーラー・デウィット方程式と運動量制約を満たすことを意味する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:00:00 GMT)
Effects of Antivaccine Tweets on COVID-19 Vaccinations, Cases, and Deaths [2.1] アメリカ人の大半は2021年に予防接種を受けないことを選んだ。
最近の研究は、ワクチンの誤報が制御された環境での意図に影響を及ぼすことを示しているが、実際のワクチン接種率とは関連しない。
予防接種率と予防接種率との因果関係の観察的証拠を提示する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:19:33 GMT)
Neural Network approximation power on homogeneous and heterogeneous reaction-diffusion equations [2.1] 本稿では,1次元および2次元の反応拡散方程式に対するニューラルネットワークの近似力を理論的に解析する。
2層ニューラルネットワークは1次元の反応拡散方程式を近似でき、3層ニューラルネットワークはその2次元の方程式を近似することができる。
全体として、この研究は反応拡散方程式および関連するPDEに対する近似解におけるニューラルネットワークの表現力を強調している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:03:51 GMT)
Observation of Nonlinear Spin Dynamics in Dual-Cell Atomic Gases [2.1] デュアルセルアルカリ金属原子ガスを用いた二重バイアス磁場中における非線形スピンダイナミクスの観測を報告する。
我々は、極限周期、準周期軌道、カオスの3つの典型的な安定な力学挙動を示す。
本研究は,多モードスピンメーザー,時間結晶,準結晶,高精度磁気センサの実現に向けて,複雑なスピンダイナミクスを探索し,新たな道を開くための多用途プラットフォームを構築した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:13:08 GMT)
Blind-spots of Randomized Benchmarking Under Temporal Correlations [2.1] 我々は,時間的相関(非マルコフ雑音)の存在下での平均シーケンス忠実度(ASF)の分析式を導出した。
このような雑音下で、ASFが意味のあるベンチマークパラメータを抽出するためにどのように解釈できるかを示す。
時間的相関が最悪のケースエラーを抑制する可能性を示し、時間的相関が必ずしもゲート性能に有害な影響を及ぼさないことを強調した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:15:02 GMT)
Quasi-adiabatic thermal ensemble preparation in the thermodynamic limit [2.0] 熱力学限界における有限温度アンサンブルを調製するための準断熱過程について検討した。
我々は、この過程を変換不変な非可積分スピン鎖と可積分スピン鎖の両方で解析する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:53:00 GMT)
Combining Reinforcement Learning and Behavior Trees for NPCs in Video Games with AMD Schola [2.0] 我々は、実際にRL駆動NPCを使用する場合、Game AIコミュニティが直面する課題を概説する。
我々は,RLと従来の行動木(BT)との交点を,さらに探究すべき重要な分岐点として強調する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:00:48 GMT)
An Analytical Framework to Enhance Autonomous Vehicle Perception for Smart Cities [2.0] 道路上の複数の物体を正確に知覚し、運転者の認識を予測して車の動作を制御するモデルを開発する必要がある。
本稿では,AVの認識システムによる運転環境の理解を可能にするユーティリティベース分析モデルを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:34:22 GMT)
Breaking of scale invariance in a strongly dipolar 2D Bose gas [1.9] 2次元(2D)双極性原子ガスは、新しい量子相を探索するユニークな機会を与える。
可変双極子配向を持つ準2次元高調波トラップにおける強双極子2次元凝縮体の生成と特性を実証する。
この観察により、2次元のDDIによって誘導される多体効果が解明され、2次元超固体やその他の異方性量子相の実現に向けた重要なステップとなる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:34:26 GMT)
Going with the Flow: Approximating Banzhaf Values via Graph Neural Networks [1.8] ネットワークフローゲームにおいて,グラフニューラルネットワーク(GNN)を用いてBanzhafの値を近似する新しい学習手法を提案する。
トレーニングされたGNNモデルは,高忠実度Banzhaf値近似を実現し,次数化の高速化を実現する。
この研究は、複雑なネットワークシステムのスケーラブルな協調ゲーム理論解析のための実用的なツールとして、GNNを確立している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:40:33 GMT)
A Ratio-Based Shapley Value for Collaborative Machine Learning - Extended Version [1.8] 協調機械学習は、複数のデータ所有者が予測性能を改善するためにモデルを共同で訓練することを可能にする。
インセンティブの互換性と公正な貢献に基づく報酬を保証することは、依然として重要な課題である。
標準加法的定式化を相対的寄与尺度に置き換える比に基づくシェープリー値を導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:08:18 GMT)
Conditional Clifford-Steerable CNNs with Complete Kernel Basis for PDE Modeling [1.8] 入力特徴体から計算した同変表現でカーネルを増強するClifford-Steerable Kernelsを提案する。
複数のPDE予測タスクにおける結果のフレームワークの表現性の改善を実証的に実証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:38:36 GMT)
Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency [1.7] ニューラル常微分方程式(ニューラルODE)の新しい区間ベースリーチビリティ法を提案する。
完備初期集合の幾何学的構造とそれらの境界を同相性を通じて活用する。
提案手法は, CORA のゾノトープや NNV2.0 の星集合表現と比較して, 音響的, 計算学的に効率的なオーバー近似を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:25:32 GMT)
Spin Readout in a 22 nm Node Integrated Circuit [1.7] 産業標準22nmのシリコンオン絶縁体技術を用いて作製したIC内のアドレス可能な量子ドットデバイスにおいて,単一ショットスピンの読み出しを実演する。
このプロセスによるスピンの読み出しの成功は、高度にスケーラブルで統合されたスピン量子ビットの実現に向けた重要なステップである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:33:34 GMT)
David vs. Goliath: A comparative study of different-sized LLMs for code generation in the domain of automotive scenario generation [1.7] 大きな言語モデル(LLM)を持つNL-to-Scenic生成は、少ないデータ、限られたメトリクスに悩まされる。
NL2Scenicは146組のNL/Scenicペアを持つオープンデータセットとフレームワークであり、難易度の高い30ケースのテスト分割とサンプルレトリバーを紹介する。
4つのプロプライエタリ(GPT-4o, GPT-5, Claude-Sonnet-4, Gemini-2.5-pro)と9つのオープンソースコードモデル(Qwen2.5Coder 0.5B-32B; CodeLlama 7B/13B/34B)を評価した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:37:02 GMT)
Do You Get the Hint? Benchmarking LLMs on the Board Game Concept [1.7] 大規模言語モデル(LLM)は多くのベンチマークで大きな成功を収めているが、最近の研究は根本的弱点を明らかにし続けている。
本稿では,自然言語データに近い表現において帰納的推論を探索するためのベンチマークとして,単純な単語ゲースボードゲームであるConceptを紹介する。
以上の結果から,このゲームは人間によって容易に解ける(成功率は90%を超えている)。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:17:25 GMT)
Optimal Bounds for Tyler's M-Estimator for Elliptical Distributions [1.6] タイラーは分布の自然なM推定器を提案した。
この推定器は非常によく機能し、タイラーの反復手順は迅速に推定器に収束することを示す。
最適サンプル閾値において、分布が$infty$-expansionを満たすことを示し、この条件を満たす入力に対して、新しいスケーリング結果を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:58:13 GMT)
Selective Adversarial Attacks on LLM Benchmarks [1.6] 広範に使用されているベンチマークMMLUに対する選択的敵攻撃について検討した。
選択的な敵攻撃が存在し、相対的なランクを実質的に変更できることがわかった。
本研究の結果は摂動を意識した報告とロバストネス評価を動機づけるものである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:08:44 GMT)
MetaQAP - A Meta-Learning Approach for Quality-Aware Pretraining in Image Quality Assessment [1.6] 画像品質評価(IQA)は、幅広い応用において重要な課題であるが、人間の知覚の主観的性質と実世界の画像歪みの複雑さのため、依然として困難な課題である。
本研究は,品質に配慮した事前学習とメタ学習を活用することで,これらの課題に対処する新しい非参照IQAモデルであるMetaQAPを提案する。
提案したMetaQAPモデルではPearson Linear correlation Coefficient (PLCC) とSpearman Rank Order correlation Coefficient (SROCC) のスコアが0.9885/0.9812,Konで0.9702/0.9658で優れた性能を示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:41:34 GMT)
DEF-YOLO: Leveraging YOLO for Concealed Weapon Detection in Thermal Imagin [1.6] 熱画像における隠蔽兵器検出のための新しいアプローチとデータセットを提案する。
私たちのYOLOベースのアーキテクチャであるDEF-YOLOは、熱ビジョンにおける隠蔽兵器検出の独特な課題に合わせて、YOLOv8の重要な拡張と共に構築されています。
我々は,多種多様な隠蔽兵器のセットを特徴とし,幅広いシナリオを捉えた,大規模で大規模な熱画像認識ウェポンデータセット TICW を導入する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:13:35 GMT)
BTC-SAM: Leveraging LLMs for Generation of Bias Test Cases for Sentiment Analysis Models [1.6] 感性分析(SA)モデルは、現実世界の応用において有害な社会的バイアスを持つ。
最小限の仕様を持つSAモデルにおいて、バイアステストのための高品質なテストケースを生成する新しいバイアステストフレームワークであるBTC-SAMを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:50:59 GMT)
Learning Power Flow with Confidence: A Probabilistic Guarantee Framework for Voltage Risk [1.5] 本稿では,電力フロー学習と電圧リスク推定の確率的保証を提案する。
提案したVDK-GPは,平均絶対電圧誤差を1E-03 p.u未満で達成し,ACPF計算の15倍少ないモンテカルロレベルの電圧リスク推定値を再現し,評価時間を120倍以上短縮する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:20:32 GMT)
Parallel splitting method for large-scale quadratic programs [1.5] SPLITは、大規模二次プログラムを小さなサブプロブレムに分解し、並列に解決するフレームワークである。
SPLITは、高品質なソリューションを提供しながら、計算時間を大幅に削減できることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:18:13 GMT)
An LLM-Powered AI Agent Framework for Holistic IoT Traffic Interpretation [1.4] この研究は、LLMを利用したAIエージェントフレームワークで、生のパケットキャプチャをインタラクティブ分析のための構造化および意味豊かな表現に変換する。
大規模言語モデルでガイドされたAIエージェントは、インデックス化されたトラフィックアーティファクトを推論し、証拠を組み立てて正確で可読な解釈を生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:30:01 GMT)
Trustworthy Retrosynthesis: Eliminating Hallucinations with a Diverse Ensemble of Reaction Scorers [1.4] RetroTrim(レトロトリム)は、薬物様標的の非感覚的計画を回避するリトロシンセサイザーシステムである。
我々のシステムは、幻覚反応をフィルターするのに成功する唯一の方法であるだけでなく、全体的な高品質な経路の最大数にも繋がる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:58:16 GMT)
BoltzNCE: Learning Likelihoods for Boltzmann Generation with Stochastic Interpolants and Noise Contrastive Estimation [1.3] ボルツマン分布からの効率的なサンプリングは、分子のような複雑な物理系をモデル化する上で重要な課題である。
我々は、ノイズコントラスト推定(NCE)とスコアマッチングの両方を用いて、エネルギーベースモデル(EBM)を訓練する。
また,提案手法では,実効的な転送学習を行い,推論時に新しいシステムに一般化し,標準MDよりも少なくとも6倍の高速化を実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:35:23 GMT)
Performance Comparison of Gate-Based and Adiabatic Quantum Computing for Power Flow Analysis [1.3] 本稿では,ゲートベース量子コンピューティング (GQC) と断熱量子コンピューティング (AQC) との直接比較を行い,交流電力流 (PF) 方程式の解法について述べる。
その結果、PF分析のためのGQCとAQCのパラダイムのパフォーマンストレードオフ、スケーラビリティ、実用性に関する定量的洞察が得られる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:19:49 GMT)
Effect Identification and Unit Categorization in the Multi-Score Regression Discontinuity Design with Application to LED Manufacturing [1.2] マルチルールシステムの各サブルールに対応するユニットのカットオフ効果を推定する際の「ファジィ」の検出・低減ツールを開発する。
特に,多次元カットオフ規則の下での単位行動の形式的定義と分類を提案する。
光電子半導体製造における生産データと実世界のデータに調整された半合成シミュレーションを用いて,本フレームワークの有効性を検証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:40:54 GMT)
Accelerated Feature Detectors for Visual SLAM: A Comparative Study of FPGA vs GPU [1.2] 本稿では,V-SLAM(Visual SLAM)パイプラインを考慮したハードウェアアクセラレーション機能検出器の最初の研究について述べる。
我々は、GPUが加速するFAST、Harris、SuperPointの実装をFPGAが加速する実装と比較する。
その結果,GPU加速V-SLAMはFPGA加速V-SLAMよりも精度が高いことがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:40:55 GMT)
FinAI Data Assistant: LLM-based Financial Database Query Processing with the OpenAI Function Calling API [1.2] FinAI Data Assistantは、金融データベース上の自然言語クエリの実践的なアプローチである。
システムは、ユーザリクエストを、検証済みのパラメータ化されたクエリの小さなライブラリにルーティングする。
結果:NASDAQ-100はティッカーマッピングの精度がほぼ完璧であり、S&P500企業にとっては高い。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:19:27 GMT)
Establishing a Foundation for Tetun Ad-Hoc Text Retrieval: Stemming, Indexing, Retrieval, and Ranking [1.2] この研究はテトゥーンテキスト検索の基礎となる重要な言語資源の開発から始まる。
文書タイトルとコンテンツを用いて様々な戦略を評価する。
効率は31.37%向上し、効率はMAP@10では+9.40%、DFR BM25では+30.35%向上した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:13:37 GMT)
Constrained belief updates explain geometric structures in transformer representations [1.2] 我々は、最適予測のモデル非依存理論と機械論的解釈可能性を統合し、隠れマルコフモデルのトラクタブルファミリーで訓練されたトランスフォーマーを解析する。
分析では,単一層トランスに着目し,最初のアテンション層がどのように制約付き更新を実装しているかを明らかにする。
これらの表現のアルゴリズム的挙動と基礎となる幾何学の両方が理論的にどのように予測できるかを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:28:30 GMT)
Resource Estimation of CGGI and CKKS scheme workloads on FracTLcore Computing Fabric [1.1] Cornami Mx2はFHE(Fully Homomorphic Encryption)アプリケーションを高速化し、ブレークスルー処理によって実現した。
プロセッサアーキテクチャは"FracTLcore Compute fabric processor" (Mx2) と呼ばれるインメモリ計算能力とネットワークオンチップ(NoC)プロセッサアーキテクチャを備えたコアのシストリック配列に基づいている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:12:22 GMT)
eye2vec: Learning Distributed Representations of Eye Movement for Program Comprehension Analysis [1.1] eye2vecはソースコードを読みながら ソフトウェア開発者の目の動きを分析するインフラです
Eye2vecは、分散表現を用いた構文要素間の遷移として、連続的な2つの固定を表す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:18:26 GMT)
Quantum bounds for compiled XOR games and $d$-outcome CHSH games [1.1] Kalai et al. のコンパイル手順は、2種類のゲームに対する量子境界を保存することを示す。
任意の qubit の測定に対して、XOR ゲームが存在し、その最適な勝利確率はその測定の特定のペアの自己テストとして機能する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:03:19 GMT)
Multi-Variable Batch Bayesian Optimization in Materials Research: Synthetic Data Analysis of Noise Sensitivity and Problem Landscape Effects [1.1] 本研究は, 実験材料研究における多数の入力変数とノイズを含む結果をエミュレートすることを目的とする。
最適化の進捗を効果的に追跡するために、学習曲線、パフォーマンスメトリクス、可視化を示す。
本研究の結果と方法により,実験材料研究の指導におけるBOの活用が促進される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:42:43 GMT)
Polynomial-Time Algorithms for Fair Orientations of Chores [1.0] 本稿では,雑用グラフの公平な配向を求める問題に対処する。
グラフのEF1 と EFX 配向は、たとえ自己ループが存在するとしても、そのグラフが存在するときのみコレを含む。
また、マルチグラフの EF1 と EFX の配向問題もNP完全であることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:56:48 GMT)
Multi-Scale Probabilistic Generation Theory: A Unified Information-Theoretic Framework for Hierarchical Structure in Large Language Models [1.0] 大規模言語モデル(LLM)は目覚ましい能力を示すが、力学レベルでは理解されていない。
本稿では,マルチスケール確率生成理論(MSPGT)を紹介する。
MSPGTは、標準言語モデリングの目的が暗黙的にマルチスケール情報圧縮を最適化することを示唆している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:15:44 GMT)
Normalised clustering accuracy: An asymmetric external cluster validity measure [1.0] クラスタリングアルゴリズムは、伝統的に内部または外部の妥当性尺度を用いて評価される。
本稿では、一般的に使われている古典的分割類似度スコアは、いくつかの望ましい性質を欠いていると論じる。
我々は,最適セットマッチング精度のバージョンである新しい尺度を提案し,分析する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:29:47 GMT)
Challenges, Advances, and Evaluation Metrics in Medical Image Enhancement: A Systematic Literature Review [1.0] 本研究は,医用画像強調における重要な課題,最近の進歩,評価指標について考察する。
低コントラストやノイズといった主要な問題は最も頻繁に認識され、MRIやマルチモーダルイメージングが最も注目を集めている。
本総説では,現在の限界,研究ギャップ,医用画像強調に向けた今後の方向性について述べる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:01:58 GMT)
The Bayesian Approach to Continual Learning: An Overview [0.9] 継続的な学習は、学習者がさまざまなタスクから知識を継続的に蓄積するオンラインパラダイムである。
連続学習は、連続学習とベイズ推論の固有の一致を連続的に伴って学習者を更新する必要がある。
本研究では,ベイズ連続学習,すなわちタスク増分学習とクラス増分学習の異なる設定を調査する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:24:09 GMT)
Neural Network-enabled Domain-consistent Robust Optimisation for Global CO$_2$ Reduction Potential of Gas Power Plants [0.9] 非線形プログラミング手法に制約としてデータ駆動ドメインを統合するニューラルネットワーク駆動のロバスト最適化フレームワークを導入する。
この効率性は、世界規模のガス発電所に初めて導入され、毎年CO$26の還元ポテンシャルを見積もる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:47:41 GMT)
Dynamic SBI: Round-free Sequential Simulation-Based Inference with Adaptive Datasets [0.9] ラウンドフリーで非同期で並列性の高い方法でシーケンシャルメソッドのコアアイデアを実装した動的SBIを導入する。
中心となるのは、ターゲット観測に類似するように推論中に反復的に変換される適応データセットである。
我々は,動的SBIが推論性能を維持しながらシミュレーション効率を大幅に向上できることを実証した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:24:52 GMT)
Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis [0.9] ファジィシステムは不確実性と不正確性を扱うための代替のフレームワークを提供する。
本稿では,マンダニシステムの解釈可能性とTSKモデルの精度を組み合わせたファジィ回帰法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:35:58 GMT)
Cross-modal Associations in Vision and Language Models: Revisiting the Bouba-Kiki Effect [0.9] 我々は,「ブバ」のような擬似語を丸い形に,「キキ」をギザギザと確実に関連付ける「ブバキキ効果」を再評価する。
これらのモデル変種はブーバキキ効果を持続的に示さないことを示す。
その結果、ビジョン・アンド・ランゲージモデルがいかにしてクロスモーダルな概念を真に理解するかという議論が続いている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:25:34 GMT)
Quantitative Analysis of UAV Intrusion Mitigation for Border Security in 5G with LEO Backhaul Impairments [0.8] 無人航空機は重要なインフラと国境警備に新たな脅威をもたらす。
本稿では、地球外・地球外ハイブリッド衛星5Gシステムにおいて、そのような侵入の検知と軽減の遅延を解析する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:13:48 GMT)
Thinking in Groups: Permutation Tests Reveal Near-Out-of-Distribution [0.8] ホモジニアスOoD(HooD)は相関データのための新しいOoD検出フレームワークである。
HooDは、トレーニングされたモデルを通して相関測定のグループを計画し、置換に基づく仮説テストを使用して既知のサブポピュレーションと比較する。
評価において、HOoDは、ポイントワイドおよびアンサンブルベースのOoD検出器よりも一貫して優れている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:15:03 GMT)
De Sitter holographic complexity from Krylov complexity in DSSYK [0.8] 両スケールのSYKモデルの高エネルギー限界と正弦ディラトン重力の2次元ド・ジッター解との最近の関係を利用して、Krylov拡散複雑性を伴う将来の無限遠点と過去の無限遠点の間の測地線の族の長さを同定する。
これは、宇宙の時空におけるホログラフィックの複雑さを、明らかにトップダウンの顕微鏡で実現している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:09:50 GMT)
The Perfect Match? A Closer Look at the Relationship between EU Consumer Law and Data Protection Law [0.8] 現代の市場では、多くの企業がいわゆる「無料」サービスを提供し、それらのサービスを通じて収集した消費者データを収益化している。
本稿では,消費者法とデータ保護法が相互に有効に補完可能であることを論じる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:13:35 GMT)
Performance Evaluation of Ising and QUBO Variable Encodings in Boltzmann Machine Learning [0.8] QUBOは、一階と二階の統計量の間のより大きな交差項を誘導し、フィッシャー情報行列においてより小さな固有値方向を生成する。
イジングエンコーディングは、より等方的曲率とより高速な収束を提供する。
これらの結果は,ボルツマンマシンにおける情報幾何学および有限時間学習力学の表現の形状について明らかにした。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:57:23 GMT)
Language as a Label: Zero-Shot Multimodal Classification of Everyday Postures under Data Scarcity [0.8] 近年のビジョン・ランゲージ・モデル(VLM)は、画像とテキストを共有空間にアライメントすることで、ゼロショットの分類を可能にする。
本研究は, 座位, 立位, 歩行・走走の0ショット分類において, 即時特異性がどの程度影響するかを検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:53:46 GMT)
HistoryFinder: Advancing Method-Level Source Code History Generation with Accurate Oracles and Enhanced Algorithm [0.7] HistoryFinderは、メソッド変更履歴の正確性と完全性を改善するために設計された新しいメソッド履歴生成ツールである。
CodeShovel、CodeTracker、IntelliJ、Gitベースのベースラインを精度、リコール、F1スコアで一貫して上回る。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:55:26 GMT)
Studying the Korean Word-Chain Game with RLVR: Mitigating Reward Conflicts via Curriculum Learning [0.7] 検証可能な報酬を伴う強化学習(RLVR)は、より強力な推論能力を持つ大規模言語モデルを訓練するための有望なアプローチである。
ルール由来の報酬が自然に相反することを示し、カリキュラム学習方式がこれらの相反を緩和することを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:07:16 GMT)
Challenges and proposed solutions in modeling multimodal data: A systematic review [0.7] 臨床研究における強力なアプローチとしてマルチモーダルデータモデリングが登場している。
この系統的なレビューは、69の研究から得られた知見を合成し、共通の障害を同定する。
本稿では,伝達学習,生成モデル,注意機構,有望なソリューションを提供するニューラルアーキテクチャ探索など,近年の方法論的進歩に注目した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:48:27 GMT)
Narrow Operator Models of Stellarator Equilibria in Fourier Zernike Basis [0.7] 理想的な磁気流体力学(MHD)平衡磁場の数値計算は、ステラレータ最適化の基礎にある。
固定境界と回転変換を持つ平衡の連続分布を解くための最初の数値的手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:13:42 GMT)
Neural Triangular Transport Maps: A New Approach Towards Sampling in Lattice QCD [0.7] 遠近距離空間と近近距離空間との基本的なトレードオフをナビゲートする三角輸送地図の包括的枠組みを導入する。
2次元で$phi4$を制御した設定として、ノードラベリング(順序付け)が三角マップの空間性と性能にどのように影響するかを分析する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:15:10 GMT)
Clustering with minimum spanning trees: How good can it be? [0.7] 低次元分割データクラスタリングタスクにおいて、最小分散木が意味のある範囲を定量化する。
我々は、既存の最先端のMSTベースの分割スキームをレビューし、研究し、拡張し、一般化する。
全体として、Genieと情報理論の手法は、MST以外のアルゴリズムよりも優れていることが多い。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:26:06 GMT)
Distributional Consistency Loss: Beyond Pointwise Data Terms in Inverse Problems [0.7] 現在の解法は、真の信号(正規化)に関する事前の仮定と、ノイズのある測定データ(データ忠実性)との一致のバランスをとる。
本稿では,各測定値に対するモデルベース確率スコアを用いた分布レベルのキャリブレーションと整合性に置き換えるデータ忠実度目標である分布整合性(DC)損失を導入する。
これらの結果から,直流損失は逆問題に対する従来の忠実度損失に代えて統計的に基礎を置き,性能向上に寄与すると考えられる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:01:23 GMT)
Investigating Lexical Change through Cross-Linguistic Colexification Patterns [0.6] コレキシフィケーション(Colexification)とは、同じ単語形式を使って複数の異なる概念を表現する現象である。
比較モデルを3つの言語群(オーストロネシア語、インド・ヨーロッパ語、ウラリック語)の辞書データに適用し、概念ペアの相互比較の根底にある進化的ダイナミクスに光を当てる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:04:28 GMT)
On the expressivity of sparse maxout networks [0.6] 我々は、各ニューロンが前の層から一定数の入力を受け取り、最大値の活性化を利用するスパース最大値ネットワークの表現性について検討する。
このようなネットワークによって計算可能な関数と仮想ポリトープのクラスとの双対性を確立し、それらの幾何学をネットワーク表現性の疑問にリンクする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:18:18 GMT)
F-BFQ: Flexible Block Floating-Point Quantization Accelerator for LLMs [0.6] 大きな言語モデル(LLM)は日々のタスクでますます顕著になっている。
LLMはリソース制約のあるエッジデバイス上で実行できる。
LLMは通常、モデル層をまたいだ混合BFP量子化によって定量化される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:56:37 GMT)
Software-enhanced simultaneous quantum-classical communication protocol with Gaussian post-selection [0.6] SQCCフレームワークにガウスのポストセレクションを導入し、チャネル推定後の変調分散のソフトウェアによる最適化を可能にする。
本研究では,SQCCの伝送距離とロバスト性を大幅に向上することを示す。
その結果、地上のファイバネットワークと衛星ベースの自由空間リンクの両面において、実世界の量子通信のためのポストセレクションベースのSQCCの実現性を強調した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:35:18 GMT)
Deciphering the Crypto-shopper: Knowledge and Preferences of Consumers Using Cryptocurrencies for Purchases [0.6] 本研究では,暗号通貨を用いて買い物をする人々の知識,専門知識,購入習慣について検討する。
516名の被験者を対象に調査を行ったところ,知識レベルは初心者から専門家まで様々であった。
回答者の約30%は、限られた知識にもかかわらず高い購入頻度を示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:06:49 GMT)
CodeEvolve: An open source evolutionary coding agent for algorithm discovery and optimization [0.6] 我々は,大規模言語モデルと遺伝的アルゴリズムを結合して複雑な計算問題を解く,オープンソースの進化的符号化エージェントであるCodeEvolveを紹介する。
我々のフレームワークは、一般化された科学的発見のための最近の手法に基づいて、強力な進化的概念を大規模言語モデルドメインに適用する。
我々は、Google DeepMindのクローズドソースAlphaEvolveを評価するために使用される数学ベンチマークのサブセット上で、CodeEvolveの厳密な評価を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:58:06 GMT)
Steady Continuous Monitoring is (Just Barely) Impossible for Tests of Unbounded Length [0.6] ABテストは、統計的に厳密な方法で制御と治療の違いを評価する。
継続的監視の目標のひとつは、早期停止 — コントロールと治療の統計的に重要な違いを可能な限り早く確認する — である。
もう1つのゴールは、より早く確認できない場合、テストの後で重要な違いを発見する統計的能力を維持することである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:41:24 GMT)
Towards Methane Detection Onboard Satellites [0.6] メタンは温室効果ガスであり、気候変動の主要な要因である。
衛星に搭載された機械学習(ML)は、ダウンリンクコストを低減しつつ、迅速な検出を可能にする。
テクスチュノルト認証データ(UnorthoDOS)を用いて,これらの前処理ステップをバイパスする新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:28:24 GMT)
Story and essential meaning dynamics in Bangladesh's July 2024 Student-People's Uprising [0.6] バングラデシュにおける2024年7月の学生蜂起における感情動態と世論の進化について検討した。
コメントの幸福感と抗議者の数との間には負の相関関係がある。
本質的な意味を測るためにオシメーターを用いると、公共の反応は力、攻撃、危険の風景を反映していることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:11:42 GMT)
Towards Richer Challenge Problems for Scientific Computing Correctness [0.5] 我々は,SCにおける精度向上のためのFM/PL検証技術の開発と評価を行うために,特別な課題を求める。
これらの特殊な課題は、FM/PL研究者が一般的なプログラムのために研究した既存の問題を強化することを目的としている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:23:18 GMT)
LLMs' Suitability for Network Security: A Case Study of STRIDE Threat Modeling [0.5] ネットワークセキュリティにおけるLarge Language Models (LLM) の適合性について検討する。
我々は5つのLSMを用いた4つのプロンプト技術を用いて5G脅威のSTRIDE分類を行う。
重要な発見と詳細な知見と,その原因となる要因の説明を指摘する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:01:51 GMT)
On the identifiability of causal graphs with multiple environments [0.5] i.d.観測データからの因果関係の発見は一般的には不十分である。
構造因果モデルにアクセスでき、ノイズ統計に十分な差がある2つの環境から追加のデータがあれば、ユニークな因果グラフが識別可能であることを実証する。
これは、因果グラフ全体の回復を一定数の環境と任意の非線形メカニズムで保証する最初の結果である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:16:21 GMT)
Hierarchical Evaluation Function: A Multi-Metric Approach for Optimizing Demand Forecasting Models [0.5] ハイパーパラメータ最適化のためのマルチメトリックフレームワークとして階層評価関数(HEF)を提案する。
HEFは説明力(R2)、過度エラーに対する感度(RMSE)、平均精度(MAE)を統合している。
HEFの性能は予測領域で広く認識されている4つのベンチマークデータセットを用いて評価した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:39:52 GMT)
A Rigorous Quantum Framework for Inequality-Constrained and Multi-Objective Binary Optimization: Quadratic Cost Functions and Empirical Evaluations [0.5] 二次非制約二項最適化問題の極大化に対して, 新規かつトラクタブルな写像を提供する。
我々のフレームワークは、トラクタブルイジング型ハミルトニアンの基底状態問題として、新しいタイプの古典的二項最適化問題を再キャストすることができる。
これにより、実用的な応用で頻繁に発生する様々な問題に対する新しい量子と量子に着想を得た解決策の可能性が開ける。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:10:55 GMT)
A Rigorous Quantum Framework for Inequality-Constrained and Multi-Objective Binary Optimization [0.5] 本稿では、不等式制約を含むことは、多目的最適化の解法と等価であることを示す。
この洞察はMulti-Objective Quantum Approximation (MOQA)フレームワークを動機付け、より小さな$p$-normsで最大値を近似する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:05:27 GMT)
Universal energy-space localization and stable quantum phases against time-dependent perturbations [0.5] 摂動に対する安定性は量子系の非自明な性質である。
エネルギー空間の局所化は、時間に依存した摂動の下で生き残ることを示す。
我々の研究は、ジェネリック量子系の非平衡ダイナミクスを分析するための新しいレンズを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:16:15 GMT)
CRaFT: An Explanation-Based Framework for Evaluating Cultural Reasoning in Multilingual Language Models [0.4] CRaFTは,大規模言語モデル(LLM)が文化的文脈にどう影響するかを評価するために設計された,説明に基づく多言語評価フレームワークである。
我々はこの枠組みを、世界価値調査(World Values Survey)から50の文化的根拠のある質問に適用し、アラビア語、ベンガル語、スペイン語に翻訳し、2100以上の回答-説明ペアに対して3つのモデル(GPT、DeepSeek、FANAR)を評価する。
アラビア語は流布を減らし、ベンガル語はそれを強化し、スペイン語は概ね安定している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:49:10 GMT)
VPREG: An Optimal Control Formulation for Diffeomorphic Image Registration Based on the Variational Principle Grid Generation Method [0.4] VPregは、新しい微分型画像登録法である。
登録変換の品質を制御しながら、優れた登録精度を達成することを目的としている。
登録の逆の正確な近似を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:02:39 GMT)
Decoherence in high energy collisions as renormalization group flow [0.4] ソフトコリニア有効理論とオープン量子システム技術を組み合わせることで、最終状態放射からのスピンデコヒーレンスを計算する枠組みを提案する。
最終状態スピン密度行列の再正規化群(RG)の進化は、時間ではなく、RGフローパラメータが量子情報のマルコフ的損失を引き起こす量子チャネルを構成することを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:00:01 GMT)
Leveraging Nested MLMC for Sequential Neural Posterior Estimation with Intractable Likelihoods [0.4] ニューラルネットワークに基づく条件密度推定器を用いて適応的に提案されたシミュレーションから後部を学習することを目的とする。
Greenbergらによって提案された自動後部変換(APT)法は,高レベルのランタイムデータに対して良好に動作し,スケールする。
本稿では,APTをネスト推定問題として再検討する。
損失関数とその勾配に対するマルチモンテカルロ (MLMC) 推定器を構築し, 異なるシナリオに対応する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:42:04 GMT)
CleverCatch: A Knowledge-Guided Weak Supervision Model for Fraud Detection [0.4] CleverCatchは、不正な処方の振る舞いを検出するために設計された知識誘導弱監視モデルである。
このアプローチでは、構造化ドメインの専門知識をニューラルネットワークに統合し、共有埋め込みスペース内のルールとデータサンプルを調整する。
大規模な実世界のデータセットの実験では、CleverCatchは4つの最先端の異常検出ベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:49:31 GMT)
Progressive multi-fidelity learning for physical system predictions [0.3] 本稿では,プログレッシブ・マルチファイダリティ・サロゲートモデルを提案する。
ソートエンコーダを使用して、さまざまなデータタイプを順次組み込む。
マルチモーダルデータを確実に統合し,正確な予測を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:10:47 GMT)
Addressing the alignment problem in transportation policy making: an LLM approach [0.3] 交通計画における重要な課題は、異種旅行者の集団的嗜好が、モデル駆動型意思決定ツールによって生み出される方針からしばしば分かれることである。
本稿では,大規模言語モデル(LLM)がこのアライメント問題に対処するのに有効かどうかを検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:36:38 GMT)
Efficient Few-Shot Learning in Remote Sensing: Fusing Vision and Vision-Language Models [0.3] 本研究では,視覚モデルと視覚言語モデルを組み合わせることで,リモートセンシングにおける画像解析の強化を図る。
YOLOとLLaVA、ChatGPT、GeminiといったVLMとの統合は、より正確で文脈的に認識された画像解釈を実現することを目的としている。
その結果、航空機の検出とカウントの精度において、モデル全体で平均48.46%のMAE改善が見られた。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:19:48 GMT)
Interpretability and Transparency-Driven Detection and Transformation of Textual Adversarial Examples (IT-DT) [0.3] 本稿では,IT-DT(Interpretability and Transparency-Driven Detection and Transformation)フレームワークを提案する。
テキストの敵対的な例を検出し、変換する際の解釈可能性と透明性に焦点を当てている。
IT-DTは、逆攻撃に対する変換器ベースのテキスト分類器のレジリエンスと信頼性を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:22:31 GMT)
Leveraging Teleconnections with Physics-Informed Graph Attention Networks for Long-Range Extreme Rainfall Forecasting in Thailand [0.3] 正確な降雨予測、特に極端な出来事は、気候学と地球システムにおいて重要な課題である。
本稿では,新しい物理インフォームドグラフニューラルネットワーク(GNN)と極値解析技術を組み合わせることで,タイ全土のゲージステーション降雨予測を改善することを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:26:05 GMT)
Estimand framework and intercurrent events handling for clinical trials with time-to-event outcomes [0.3] ICH E9(R1)ガイドラインは、臨床試験のための推定の枠組みを提示する。
本稿では,TTE結果を用いた臨床試験において,評価値の定義方法とICEの扱い方法について論じる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:56:50 GMT)
Bounding the asymptotic quantum value of all multipartite compiled non-local games [0.3] 非局所ゲームは、古典的な世界と量子世界の相関関係を区別するための強力なツールである。
Kalai et al. (STOC'23) は、マルチパート非ローカルなゲームを1つの証明子でインタラクティブなプロトコルに変換するコンパイラを提案した。
我々は、Kalai et al. のコンパイラが、実際にはすべてのマルチパーティライト非局所ゲームに対して量子音性を達成することを証明した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:32:00 GMT)
A Methodology for Assessing the Risk of Metric Failure in LLMs Within the Financial Domain [0.3] 過去の機械学習メトリクスは、しばしばGenAIワークロードへの一般化に失敗することがある。
本稿では、これらの課題を説明し、中小企業と機械学習メトリクスのより良い適用を可能にするリスクアセスメントフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:17:16 GMT)
LLM-Guided Synthetic Augmentation (LGSA) for Mitigating Bias in AI Systems [0.2] 特定のグループの控えめな表現は、しばしば人口統計学的に不均一なパフォーマンスをもたらす。
これらの課題に対処するために,LLM-Guided Synthetic Augmentation (LGSA)を提案する。
LGSAは、ラベルの整合性を保ちながら、大きな言語モデルを使用して、表現不足のグループの反実例を生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:42:35 GMT)
Discrimination, artificial intelligence, and algorithmic decision-making [0.2] この研究は、欧州評議会の反差別部門のためにZuiderveen Borgesius教授によって準備された。
アルゴリズムによる意思決定やその他の人工知能(AI)による差別のリスクについて詳述する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:13:27 GMT)
A Verification Methodology for Safety Assurance of Robotic Autonomous Systems [0.2] 本稿では,自律型農業ロボットの安全性保証のための検証ワークフローを提案する。
コンセプトスタディから設計、実行時の検証に至るまで、開発ライフサイクル全体をカバーする。
提案手法は, 安全クリティカルな特性を検証し, 設計問題の早期発見を容易にするために有効に利用できることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:51:41 GMT)
Privacy, freedom of expression, and the right to be forgotten in Europe [0.2] 欧州におけるプライバシと表現の自由の関係について論じる。
2つの権利のバランスをとる際の難しさを説明するために、Google Spainの判断を使用します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:13:52 GMT)
FreshTab: Sourcing Fresh Data for Table-to-Text Generation Evaluation [0.2] FreshTab(フレッシュタブ)はウィキペディアのオンライン・テーブル・トゥ・テキスト・ベンチマーク・ジェネレーションである。
LLMデータ汚染問題と闘うためにFreshTabを導入し、ドメインに敏感な評価を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:31:44 GMT)
Improving Visual Recommendation on E-commerce Platforms Using Vision-Language Models [0.2] 本研究では,日本の主要消費者市場であるMercuriの製品レコメンデーションに視覚言語モデル(VLM)を適用した。
我々は,シグモイドに基づくコントラスト損失を用いたVLMであるSigLIPを微調整し,レコメンデーションシステムで使用されるアイテム埋め込みを生成する画像エンコーダを開発した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:46:27 GMT)
Do Large Language Models Show Biases in Causal Learning? Insights from Contingency Judgment [0.2] 因果学習は因果推論を行う能力を開発するための認知過程である。
このプロセスは、因果関係の錯覚のような誤りや偏見がちである。
この認知バイアスは多くの社会的問題を解決するために提案されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:09:00 GMT)
Composable logical gate error in approximate quantum error correction: reexamining gate implementations in Gottesman-Kitaev-Preskill codes [0.1] 論理ゲート誤差(composable logic gate error)と呼ばれる1つのスカラー量を導入する。
望ましいターゲットゲートからの論理アクションの逸脱と、コード空間からのリークの両方をキャプチャする。
物理ユニタリの行列要素から構成可能な論理ゲート誤差を(近似)論理基底状態にバインドする方法を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:58:15 GMT)
AI Debaters are More Persuasive when Arguing in Alignment with Their Own Beliefs [0.1] 我々は主観的な質問に議論を適用し、実験の前に大きな言語モデルの事前の信念を明示的に測定する。
我々は2つの議論プロトコルを逐次かつ同時に実装し、潜在的体系的バイアスを評価する。
本研究の主目的は, モデルが従来の信念よりも, 判断ペルソナと整合した姿勢を擁護する傾向にあることにある。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:02:13 GMT)
Equivalence of Genuine Multipartite Entanglement and Nonlocality of Nearly Symmetric Multiqubit Pure States [0.1] 解析学的に、高対称性で真に絡み合った全ての多部量子ビット状態が真の多部非局所性を示すことを示した。
この結果は、量子論における GME と GMNL の間の予想される同値性の一般的な証明へのステップを構成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:38:36 GMT)
Unlocking Public Catalogues: Instruction-Tuning LLMs for ICD Coding of German Tumor Diagnoses [0.1] 本研究では,公開データセットを用いた命令ベース微調整が,ドイツの腫瘍診断テキストに対するオープンウェイトLLMの符号化精度を向上させるかを検討する。
トレーニングデータとして、ICD-10-GM、ICD-O-3、OPSカタログに基づいて50,000以上の質問応答ペアが作成された。
ICD-10-GMの精度は1.4-24%から41-58%に上昇し、部分精度は31-74%から73-83%に上昇した。
ICD-O-3トポグラフィー符号化の精度も向上したが、精度は22~40%、微調整後の部分精度は56~67%と大幅に低下した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:51:28 GMT)
In-Distribution Steering: Balancing Control and Coherence in Language Model Generation [0.1] In-Distribution Steering (IDS) は,表現空間における入力データ分布に基づいてステアリング強度を適応させる新しい手法である。
IDSは、崩壊することなくコヒーレントテキストを生成しながら、分類タスクに対して高い精度を達成し、実世界のアプリケーションに特に適している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:31:37 GMT)
Adaptive Visual Conditioning for Semantic Consistency in Diffusion-Based Story Continuation [0.1] 本稿では,拡散型ストーリー継続のためのフレームワークである (Adaptive Visual Conditioning) を紹介する。
以前のフレームから最もセマンティックに整合した画像を取得する。
これは、拡散過程の初期段階にのみ、事前視覚の影響を適応的に制限する。
強いベースラインに比べて、コヒーレンス、セマンティック一貫性、および視覚的忠実性に優れる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:43:22 GMT)
On Pretraining for Project-Level Code Completion [0.1] リポジトリレベルの事前トレーニングは、コードの大規模な言語モデルが広いコンテキストを活用できるようにするために一般的に使用される。
本研究では,OpenCoderにおける複数のリポジトリ処理戦略がコンテキスト内学習に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:55:19 GMT)
Building a Macedonian Recipe Dataset: Collection, Parsing, and Comparative Analysis [0.1] マケドニアのレシピデータセットをウェブスクレイピングと構造化解析により構築するための最初の体系的な取り組みを示す。
ポイントワイズ・ミューチュアル・インフォメーション(Pointwise Mutual Information)やリフト・スコア(Lift score)などの指標を用いて、成分頻度と共起パターンの探索分析を行い、マケドニア料理を特徴付ける特徴的成分の組み合わせを強調した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:54:23 GMT)
Entanglement and particle production from cosmological perturbations: a quantum optical simulation approach [0.0] 本研究では,ガウス形式とシンプレクティック回路表現に基づく計算フレームワークを開発し,インフレーション時の宇宙的摂動を探索する。
我々は、幅広い宇宙背景におけるフォン・ノイマンエントロピーと対数的負の挙動をシミュレートする。
さらに, 熱雑音の役割について検討し, フォン・ノイマンエントロピーと対数的負性度がその存在によってどのように影響を受けるかを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:31:23 GMT)
Quantum algorithms for solving a drift-diffusion equation: A complexity analysis [0.0] 多次元ドリフト拡散方程式を解くための4つの量子アルゴリズムを提案する。
それらは量子線型系解法、量子ハミルトンシミュレーション、量子ランダムウォーク、および量子フーリエ変換に依存している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:09:56 GMT)
Finding Holes: Pathologist Level Performance Using AI for Cribriform Morphology Detection in Prostate Cancer [0.0] 前立腺癌におけるクリブリフォーム形態は予後不良を示す組織学的特徴であり,活動的監視を阻害する。
EfficientNetV2-Sエンコーダを用いて、エンド・ツー・エンドの全体スライダー分類のための複数のインスタンス学習を行う深層学習モデルを構築した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:23:34 GMT)
Superior Molecular Representations from Intermediate Encoder Layers [0.0] 5種類の分子エンコーダにおける情報の流れを解析し,中間層がより汎用的な特徴を持つことを示す。
最適中間層からの凍結埋め込みを用いることで,最終層に比べて平均5.4%のダウンストリーム性能が28.6%向上することがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:55:53 GMT)
Unified Framework for Direct and Complete Characterization of an Unknown Kraus Operator and Density Matrix Using a Single Input State [0.0] 本研究では、未知のクラウス作用素の直接的かつ完全な特徴づけを可能にする統一的なフレームワークを提案する。
重要なこととして,本手法はシステムとプローブの結合の強さに制約を課さない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:52:56 GMT)
What can we do in a symmetry-constrained perspective? The importance of the total charge's status in quantum reference frame frameworks [0.0] 対称性群に関連する大域電荷は、対称性に制約された観測者にはアクセス可能であることを示す。
弱いアプローチの採用が各視点に含まれるモータの曖昧さをいかに引き起こすかについて議論する。
次に、各アプローチを動機づける既存の議論をレビューし、分析し、電荷アクセシビリティの問題にどのように対処するかを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:37:11 GMT)
Universal Growth of Krylov Complexity Across A Quantum Phase Transition [0.0] 量子相転移によって駆動される量子系のクリロフ空間における拡散複雑性について検討する。
逆場イジングモデルでは、複雑さの増大とキブル・ズレーク欠陥スケーリングの正確な関係を確立する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:00:00 GMT)
Transfer learning strategies for accelerating reinforcement-learning-based flow control [0.0] 本研究では,カオス流体の多相性制御のための深部強化学習(DRL)を高速化するための伝達学習戦略について検討する。
DRLベースのフロー制御の文脈で、プログレッシブニューラルネットワーク(PNN)が初めて使用される。
PNNは、事前の知識を保存し、一貫した性能向上を提供することにより、安定かつ効率的な転送を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:52:06 GMT)
Towards gravimetry enhancement with squeezed states [0.0] 我々は、プローブのスキーズ位相が、その振幅を超えると、到達可能な精度にどのように影響するかを分析する。
実験重力計プロトコルにおける位相工学的スクイーズの基本的役割を明らかにすることが重要である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:02:08 GMT)
Towards Human-Centric Intelligent Treatment Planning for Radiation Therapy [0.0] 現在の放射線治療計画には、最適な計画品質、非効率性、コストが制限されている。
HCITP(Human-Centric Intelligent Treatment Planning)は、臨床ガイドラインを統合し、計画生成を自動化する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:04:48 GMT)
Time Series Foundation Models: Benchmarking Challenges and Requirements [0.0] 時系列基礎モデル(TSFM)は、時系列予測の新しいパラダイムである。
TSFMの評価は、より広範なトレーニングセットと同様に、整合性ベンチマークデータの確保がより困難になるため、難しい。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:15:45 GMT)
The scrambling power of gravity in black hole radiation [0.0] ソフトな自由度の存在は、ハードな自由度で符号化された情報のスクランブルを引き起こすことを示す。
これはブラックホール情報パラドックスのより深い理解の基礎となる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:20:12 GMT)
The Algorithmic Regulator [0.0] 規制の定理は、ある条件下では、任意の最適コントローラーは、それが規制するシステムのモデルを具現化しなければならないと述べる。
この原理は、自由エネルギー原理(Free-Energy Principle)やコルモゴロフ/アルゴリトミックエージェント理論(Kolmogorov/Algorithmic Agent theory)のような神経科学と予測的脳理論の基盤となっている。
Delta$が大きければ大きいほど、高い相互アルゴリズム情報を持つワールドレギュレータペアが好まれる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:23:52 GMT)
The $φ$-PCA Framework: A Unified and Efficiency-Preserving Approach with Robust Variants [0.0] 我々は、ロバストで分散したPCAの統一的な定式化を提供する$phi$-PCAフレームワークを紹介した。
我々は,$phi$-PCAの根底にある分割集約原理が,ロバストで効率的な保存手法を開発するための一般的な戦略であることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:21:11 GMT)
Tensor Logic: The Language of AI [0.0] 私は、トランスフォーマー、フォーマルな推論、カーネルマシン、グラフィカルモデルを含む、テンソル論理において、ニューラルネットワーク、象徴的、統計的AIのキーフォームをどのように実装するかを示します。
これは、ニューラルネットワークのスケーラビリティと学習性とシンボリック推論の信頼性と透明性を組み合わせることで、AIの普及の基盤となる可能性がある。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:45:27 GMT)
Temporal Entanglement Transitions in the Periodically Driven Ising Chain [0.0] 周期的に駆動される量子系は、静的なアナログなしで非平衡現象をホストすることができる。
Floquetスピンチェーンで$temporal$$entanglement$$$transitions$を発見します。
これらの遷移は絡み合い駆動であり、すなわち、最初は絡み合いのある状態が必要であり、従来の局地的な観測物には見えないことを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:01:02 GMT)
Subject Roles in the EU AI Act: Mapping and Regulatory Implications [0.0] 欧州連合の2024/1689年の人工知能法(Regulation)は、世界初のAIシステムのための包括的な規制枠組みを確立している。
本稿では、提供者、展開者、認可された代表者、輸入者、流通業者、製品製造業者の6つの主要なカテゴリーについて、構造化された検討を行う。
完全なガバナンス構造をマッピングし、AI法がこれらの主題をどのように規制するかを分析します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:21:30 GMT)
Statistical post-processing yields accurate probabilistic forecasts from Artificial Intelligence weather models [0.0] 我々は,気象局の統計後処理システムIMPROVERをECMWFの決定論的AIFSに適用することをテストする。
我々はAIFSとNWPモデルを組み合わせることで、AIFS単独が最も正確なコンポーネントではない場合でも、全体的な予測スキルが向上することを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:39:53 GMT)
Statistical Structure of Charge Disorder in Si/SiGe Quantum Dots [0.0] 量子ドットベースのスピン量子ビットの特性は、半導体ナノ構造における様々な種類の障害に起因するデバイス間の大きなばらつきを持つ。
この可変性の重要な原因は、半導体-酸化物界面における電荷障害であり、量子ドットの本質的な性質において予測不可能で、しかし、相関的なゆらぎを引き起こす。
本研究は、そのような障害の効果を特徴づけ、緩和するための体系的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:14:37 GMT)
Stable LLM Ensemble: Interaction between Example Representativeness and Diversity [0.0] 2つのワンショット戦略を比較する:セントロイド型代表例(提案)とランダムサンプル例(ベースライン)
高温設定による提案手法は,+7.6% (macro-F1) と -10.5% (RMSE) のランダム選択を著しく上回っている。
以上の結果から,代表的なサンプル選択と温度上昇を組み合わせることで,アンサンブルに適切な多様性がもたらされることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:49:23 GMT)
Sri Lanka Document Datasets: A Large-Scale, Multilingual Resource forLaw, News, and Policy [0.0] 我々はスリランカの議会手続、法的判断、政府出版物、ニュース、観光統計を網羅したオープンで機械可読な文書データセットを提示する。
このコレクションは、シンハラ、タミル、英語の24のデータセットにまたがる229,858の文書(57.1GB)で構成されている。
これらの資源は、計算言語学、法的分析、社会政治学、多言語自然言語処理の研究を支援することを目的としている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:45:49 GMT)
Software Framework for Optically Accessible Quantum Memory Using Group-IV Color Centers in Diamond [0.0] 光アクセス可能な量子メモリは、量子リピータや2要素認証などのデバイスのための重要なビルディングブロックである。
私たちが記述したメモリは、高効率の空洞に結合されたスズ空洞の色中心に基づいている。
高忠実率の分数単一キュービットゲートを光学式$pi/8$パルスで実装している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:47:50 GMT)
Social Laser Theory as a Natural Extension of Quantum-Like Modeling [0.0] 社会レーザー理論(SLT)は、社会エネルギーの量子化された単位を吸収・放出できる社会原子の集合体として社会システムを概念化している。
SLTは、社会エネルギーの増幅とコヒーレンスを理解するための正式な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:24:05 GMT)
Smart Contracts Formal Verification: A Systematic Literature Review [0.0] 形式的検証は、指定された動作を保証するためにテストソフトウェアを必要とする。
ソフトウェアモデルとしてのスマートコントラクトは、しばしばオペレーションや仕様に顕著なエラーを含む。
本調査では,記述論理に基づく代替形式検証を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:32:57 GMT)
Sequential Quantum Measurements and the Instrumental Group Algebra [0.0] 連続した楽器の組み合わせ構造は、それらのKODの畳み込みに対応している。
IGA は KOD の真のホームであり、フォン・ノイマン代数の双対が密度作用素のホームであるのと同様である。
KODコルモゴロフ方程式とリンドブラッドマスター方程式の関係を含む、ある種の超超音速-超音速干渉関係を考察する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:04:29 GMT)
Robust Superradiance and Spontaneous Spin Ordering in Disordered Waveguide QED [0.0] 我々は、1次元フォトニック導波路に$N$励起2レベル原子の乱れた配列の集合放出について検討した。
大規模半古典シミュレーションを用いて、この超放射能のキーサインは、強い空間的・スペクトル的障害の下でも頑健であることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:30:30 GMT)
Reviewing Uses of Regulatory Compliance Monitoring [0.0] 本研究は、ビジネスプロセスの規制コンプライアンス監視の利用に関する体系的な文献レビューを示す。
我々は、アプローチ間の共通点と相違点を強調し、様々なステップが手動で実行されていることを見つける。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:57:26 GMT)
Reliable generation of isomorphic physics problems using Generative AI with prompt-chaining and tool use [0.0] 本稿では,ChatGPTなどの生成AIサービスを用いて,多数の同型物理問題を生成する手法を提案する。
このアプローチは、数値値や空間関係のような構造的変動を正確に制御し、問題本体の様々な文脈変化をサポートする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:13:01 GMT)
Relativistic limits on the discretization and temporal resolution of a quantum clock [0.0] 量子時計における時間値の離散化と時間分解能の限界について論じる。
最小時間量子のバウンダリを減らし、クロック値が連続的に扱われる条件を特定する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:34:07 GMT)
Reduced constant-cost implementations of Clifford operations using global interactions [0.0] アンシラを伴わない任意の長さのクリフォード演算列を実現するために、そのようなクリフォードエンタングリング多ビットゲートの6つの応用を一定コストで報告する。
任意の長さのCNOTゲートの任意の列は、アンシラなしで、そのような多重ビットゲートを絡むクリフォードの5つの応用に置き換えることができることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:10:45 GMT)
Real-Time Sign Language to text Translation using Deep Learning: A Comparative study of LSTM and 3D CNN [0.0] 本研究では,リアルタイムアメリカ手話(ASL)のための3次元時間的ニューラルネットワーク(3D CNN)とLong Short-Term Memory(LSTM)ネットワークの性能について検討する。
実験の結果、3D CNNは92.4%の精度で認識できるが、LSTMに比べて3.2%の処理時間を必要とすることがわかった。
このプロジェクトでは,エッジコンピューティング環境における認識精度とリアルタイム運用要件とのトレードオフを強調した,補助技術開発のためのプロフェッショナルベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:26:33 GMT)
Qutrits for physics at the LHC [0.0] 粒子物理学の標準モデルでは説明されていない異常事象は、重要な理論的、実験的、計算上の課題を引き起こす。
HL-LHC(High Luminosity Large Hadron Collider)のような次世代の衝突型加速器は、データ処理、信号再構成、分析を必要とする。
本研究は,高エネルギー物理データにおける異常検出における量子機械学習モデルの利用について検討する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:32:09 GMT)
Quantum-inspired space-time PDE solver and dynamic mode decomposition [0.0] 非線形システムの長期予測を高精度に行うMPS-DMDアルゴリズムを開発した。
この研究は、効果的かつ解釈可能なモデルの開発におけるテンソルネットワークの役割を強調した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:39:44 GMT)
Quantum teleportation, entanglement, LQU and LQFI in $e^{+}e^{-} \to \text{Y}\bar{\text{Y}}$ processes at BESIII through noisy channels [0.0] 量子テレポーテーションにより、量子状態は1つの粒子から別の粒子へ転送される。
我々は、量子相関の非調和的な尺度として、忠実度(F$)、対数否定性(LN)、局所量子不確実性(LQU)、局所量子フィッシャー情報(LQFI)を分析した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:58:29 GMT)
Quantum machine learning and quantum-inspired methods applied to computational fluid dynamics: a short review [0.0] 計算流体力学(CFD)は科学と工学の中心であるが、厳しいスケーラビリティの課題に直面している。
これらの条件下では、伝統的な数値法は違法に高価になることが多い。
量子コンピューティングと量子インスパイアされた手法は、有望な代替手段として研究されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:15:23 GMT)
Quantum geometry of bosonic Bogoliubov quasiparticles [0.0] ハミルトン派は、弱相互作用するボース凝縮体の励起とパラメトリック駆動下のフォトニック系を記述している。
本稿では,シンプレクティックな量子幾何テンソル(SQGT)を提案する。
システムパラメータの周期的変調に応答して励起率を抽出することにより,SQGTのすべての成分を測定する方法を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:00:22 GMT)
Quantum State Designs via Magic Teleportation [0.0] 本研究では,非安定化資源が,予測アンサンブル内での量子状態設計の出現を可能にする方法を検討する。
有限深度クリフォードユニタリに対しては、状態設計が出現する時間スケールが魔法の輸送によって制御されることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:00:01 GMT)
Quantum Search in Superposed Quantum Lattice Gas Automata and Lattice Boltzmann Systems [0.0] 量子格子ガスオートマタと量子格子ボルツマン法は、CFDソルバの量子ネイティブ実装の候補として期待されている。
離散最適化と量子探索に基づくアプリケーションを提案し,フロー場計測を完全に回避する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:04:06 GMT)
Quantum Dynamics, Master Equation and Equilibrium for a Qubit Coupled to a Thermal Boson Field [0.0] 我々は、ボゾン環境と相互作用する2レベル量子系の正確な-しかし形式的な-マスター方程式を解析的に導出した。
システムと環境の両方のダイナミクスを管理する進化演算子の長時間の挙動を解析する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:47:09 GMT)
Quantum Classical Correspondence Using Coherent State Measurements and Husimi Q Probability Distributions [0.0] 我々は、粒子の軌道がニュートンの軌道と密接に一致するように、量子粒子を前方に進化させるプロトコルを提案し、シミュレートする。
我々は、Schr "odinger time-evolution" 以外の期間に対する量子古典収束を実証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:04:32 GMT)
Quantifying Phonosemantic Iconicity Distributionally in 6 Languages [0.0] この研究は6つの異なる言語にまたがる規模で音韻マンティックな象徴性を定量化するための分布的アプローチを採っている。
各言語において,モーフィムの音声的類似性空間と意味的類似性空間のアライメントを統計的尺度を用いて解析する。
また,従来仮定されていた5つの音韻マンティックアライメントを解析し,そのようなアライメントの支持や,他のアライメントに対する混合結果を見出した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:23:12 GMT)
Quality assessment of quantum teleportation through the distribution of fidelity [0.0] 単一キュービット量子テレポーテーション性能を評価するための包括的統計フレームワークを提案する。
我々は,同一の平均忠実度を持つプロトコルは,統計的挙動が著しく異なることを示す。
この枠組みを適用すると、高忠実度テレポーテーションの認証には、より強い絡み合いや非局所性が必要であることが示される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:33:07 GMT)
ProtoTopic: Prototypical Network for Few-Shot Medical Topic Modeling [0.0] そこで本稿では,医療論文の要約のためのトピック生成に使用されるプロトタイプ型ネットワークベースのトピックモデルを提案する。
文献で使用される2つのトピックモデリングベースラインと比較して,トピックコヒーレンスと多様性が改善された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:38:42 GMT)
Property Testing for Ocean Models. Can We Specify It? (Invited Talk) [0.0] 物性試験として表される物理流体力学理論が、海洋モデルの正しさをテストするためのオラクル問題に対処するために用いられるかどうかを問う。
そこで本論文では, GFD 問題の多くをプロパティテストとして扱うことを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:50:47 GMT)
Privacy-Preserving Bathroom Monitoring for Elderly Emergencies Using PIR and LiDAR Sensors [0.0] 在宅高齢者の監視には、プライバシを保護し、ユーザの入力を不要にしながら、緊急イベントを検出するシステムが必要である。
本稿では,PIR(Passive Infrared)センサとLiDAR(Light Detection and Ranging)センサを用いた低コストでプライバシ保護ソリューションを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:59:30 GMT)
Oracle problems as communication tasks and optimization of quantum algorithms [0.0] 出力と実値の相互情報を用いたアルゴリズムの性能測定を提案する。
我々は,任意のオラクル分類問題に対して,少なくとも一定数のクエリを使用する最適非適応アルゴリズムについて述べる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:12:16 GMT)
Optimal key rates for quantum key distribution with partial source characterization [0.0] 我々は、コーン最適化手法を、放出された状態に関する部分的な情報しか知られていないシナリオに拡張する。
本研究では,本手法が現実的情報源不完全条件下での最先端解析および数値的手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 01:55:42 GMT)
Optimal Convergence Rate of Lie-Trotter Approximation for Quantum Thermal Averages [0.0] Lie--Trotter 積公式は量子分割関数の基本的な近似である。
本稿では,この近似を2つの鍵系にまたがる定量的な誤差解析を行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:38:12 GMT)
On the Fundamental Impossibility of Hallucination Control in Large Language Models [0.0] 不合理性理論:非自明な知識集約を行うLLMは、真理的な知識表現、意味情報保存、関連する知識の啓示を同時に達成できない。
提案手法は,アイデアのオークションとして推論をモデル化し,分散コンポーネントが符号化された知識を用いて応答に影響を与えることを証明している。
幻覚と想像力は数学的に同一であり、どちらも4つの重要な性質のうちの少なくとも1つに反する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:25:41 GMT)
On Evaluating Loss Functions for Stock Ranking: An Empirical Analysis With Transformer Model [0.0] トランスフォーマーモデルは金融時系列を理解することを約束している。
しかし、異なるトレーニング損失関数が株のランク付け能力にどのように影響するかは、まだ完全には理解されていない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:06:02 GMT)
Observation of area laws in an interacting quantum field simulator [0.0] 相互作用強度を調整可能な量子場の超低温原子シミュレータにおいて、相互情報の領域則を実験的に示す。
本研究は, 空間領域間を有限温度で分割し, サブシステム体積, 境界領域, 相互情報のスケーリングについて述べる。
提案したアプローチは、データ駆動型で、モデル非依存で、他のプラットフォームやオブザーバブルにも容易に適用できます。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:38:26 GMT)
Non-convex entropic mean-field optimization via Best Response flow [0.0] 非函数から正規化子を選択する方法を示すので、Best Response は$L1$Wasserstein 距離の縮約となる。
決定ソフトマックスパラレル化ポリシのゲームにおいて,これらの結果がどのように適用できるかを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:14:57 GMT)
Near-Infrared Hyperspectral Imaging Applications in Food Analysis -- Improving Algorithms and Methodologies [0.0] 本論文は,近赤外ハイパースペクトルイメージング(NIR-HSI)の食品品質解析への応用について検討する。
いくつかの分析では、畳み込みニューラルネットワーク(CNN)と部分最小二乗(PLS)に基づくモデルを比較する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:53:01 GMT)
Multi-Label Clinical Text Eligibility Classification and Summarization System [0.0] 本稿では,NLP(Natural Language Processing)とLLM(Large Language Models)を利用して,臨床用テキストの適性分類と要約を自動化するシステムを提案する。
このシステムは、ワード埋め込み(Word2Vec)や名前付きエンティティ認識などの特徴抽出手法を組み合わせて、関連する医療概念を識別する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 03:21:43 GMT)
Modified rational six vertex model on a rectangular lattice : new formula, homogeneous and thermodynamic limits [0.0] 不均一モデルに対する分割関数の別の公式が見つかる。
熱力学限界における境界効果を持つ第一次自由エネルギーを得る。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:58:49 GMT)
Modeling Adoptive Cell Therapy in Bladder Cancer from Sparse Biological Data using PINNs [0.0] 物理インフォームドニューラルネットワーク(英: Physics-informed Neural Network、PINN)は、力学系の法則を損失関数に組み込むニューラルネットワークである。
本研究では,腫瘍学に応用したPINNフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:28:18 GMT)
Mobile Coverage Analysis using Crowdsourced Data [0.0] 本稿では,クラウドソーシングされたQoEデータを利用したモバイルカバレッジと弱点分析のための新しいフレームワークを提案する。
この研究の重要な貢献は、モバイルネットワークのカバレッジを計算するためのワンクラスサポートベクトルマシン(OC-SVM)アルゴリズムの適用である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:00:50 GMT)
Metrics for Assessing Inclusivity and Empowerment of People for Supporting the Design of Inclusive Product Lifecycles [0.0] インクルーシエーションは、フェーズにまたがる多様な利害関係者の含め方を改善するために、ライフサイクルコンテキストに対処する。
この研究は現在の包括的デザインアプローチに基づいており、製品の使用を通じてユーザを力づけることに重点を置いていることが多い。
持続可能な開発のために幅広い利害関係者に力を与える手段として、包括的ライフサイクルプロセスを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:23:30 GMT)
Metaplectic operators with quasi-diagonal kernels [0.0] メタプレクティック作用素の核は対角的ではない。しかし、我々が証明するように、それらは適切な条件下で準対角的である。
本研究の動機は,最終節で論じる時間周波数解析の問題点に端を発する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:56:59 GMT)
Manifold Decoders: A Framework for Generative Modeling from Nonlinear Embeddings [0.0] 著名なNLDR手法のためのニューラルデコーダアーキテクチャを構築するためのシステム・アティック・フレームワークを提案する。
このフレームワークは、これらの学習された多様体空間内で直接動作する拡散ベースの生成プロセスを実装することで拡張される。
その結果,デコーダはデータの再構築に成功しているが,その品質はエンドツーエンドの最適化されたオートエンコーダに勝っていることがわかった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:50:51 GMT)
Macroscopic Self-Trapping and Dynamical Phase Transition in Momentum Space Bose-Einstein Condensates [0.0] 自己トラッピングは非線形力学の目覚しい現象である。
BECは非線形力学を探索するための素テストベッドである。
スピン軌道結合BECにおける自己トラッピングの観察を報告する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 00:36:50 GMT)
Machine Unlearning Meets Adversarial Robustness via Constrained Interventions on LLMs [0.0] 我々は、機密情報の未学習と脱獄攻撃に対する堅牢性に対処する様々な制約付き最適化の定式化について検討する。
私たちが提案する最も単純なポイントワイド制約ベースの介入は、計算コストの低減を図りながら、最大最小の介入よりも優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:57:12 GMT)
MAFA: A multi-agent framework for annotation [0.0] 本稿では、異なるアプローチで特殊エージェントを結合するアノテーションのためのマルチエージェントフレームワークと、最適な結果を得るために候補を再参照する判断エージェントを紹介する。
私たちのフレームワークは、あいまいなクエリを扱うのに特に効果的で、本番バンキングアプリケーションのデプロイに適しています。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:26:33 GMT)
MACTAS: Self-Attention-Based Module for Inter-Agent Communication in Multi-Agent Reinforcement Learning [0.0] 本稿では,MARL内のエージェント間で情報交換を行う自己注意型通信モジュールを提案する。
提案手法は完全に差別化可能であり、エージェントは報酬駆動方式でメッセージを生成することができる。
SMACとSMACv2ベンチマークの実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:19:58 GMT)
Long-Term Spatio-Temporal Forecasting of Monthly Rainfall in West Bengal Using Ensemble Learning Approaches [0.0] 本研究は,西ベンガル19地区における月間降雨量の長期予測を考察した。
毎日の降雨記録は月刊にまとめられ、各地区で120年間観測される。
降雨力学の非線形構造と複雑な構造に対処するため,年次特徴の回帰に基づく予測と多層パーセプトロン(MLP)を組み合わせて月次予測を行う枠組みを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:20:33 GMT)
Local Information-Theoretic Security via Euclidean Geometry [0.0] 本稿では,ユクリッド情報理論に基づく手法を提案し,メモリレス通信路上でのセキュア通信の局所特性について検討する。
我々は,情報漏洩を盗聴者の情報効率と秘密メッセージの最大一般化コストの両方を分析した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:19:59 GMT)
Leveraging LLMs for Design Ideation: An AI Tool to Assist Creativity [0.0] 本稿では、インスピレーション刺激を伴う構造化アイデアセッションを提案し、その構造をデザイナに提供する際に、Gen AIを活用する。
ALIA: アナロジカルLLM観念エージェント(Analogical LLM Ideation Agent)は,小グループ思考シナリオのためのツールである。
このツールはデザインのアイデアセッションでテストされ、AI支援のアイデアセッションのアウトプットとトラディオプションのアイデアセッションのアウトプットを比較する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 06:53:19 GMT)
Leveraging Ensemble-Based Semi-Supervised Learning for Illicit Account Detection in Ethereum DeFi Transactions [0.0] 我々は,DeFiエコシステムを保護するための堅牢なソリューションを提案する。
我々は、初期検出に分離フォレストモデル、未ラベルアカウントに擬似ラベルを反復的に生成するための自己学習機構を使用する。
6,903,860のトランザクションとDeFiインタラクションの広範なカバレッジに関する実験は、SLEIDが教師付きベースラインと半教師付きベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:57:47 GMT)
Lattice surgery with Bell measurements: Modular fault-tolerant quantum computation at low entanglement cost [0.0] 本稿では,非局所的な操作はすべてベル計測である表面符号上で格子手術を行うプロトコルを提案する。
我々は,異なるモジュール上の2つの論理キュービットを論理ベル状態に設定した際のプロトコルの性能を評価する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:38:31 GMT)
Laser Fault Injection in Memristor-Based Accelerators for AI/ML and Neuromorphic Computing [0.0] 本稿では,敵が敵細胞を標的とし,その物理的特性や出力をレーザービームで微調整する,詳細な脅威モデルを提案する。
レーザ誘起光電流が出力電流分布にどのように現れるかを示し、差分欠陥解析により最大99.7%の精度で内部重量を推定できることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:44:03 GMT)
LTR-ICD: A Learning-to-Rank Approach for Automatic ICD Coding [0.0] 臨床ノートには、患者との遭遇時に臨床医が提供した構造化されていないテキストが含まれている。
これらのメモには、通常、国際疾患分類(ICD)に続く一連の診断コードが添付されている。
最先端の手法はこの問題を分類タスクとして扱い、異なる目的に欠かせないICD符号の順序を無視した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:46:42 GMT)
LLMs as Hackers: Autonomous Linux Privilege Escalation Attacks [0.0] 我々は,完全に自動化されたLanguage Models(LLM)駆動の,自動Linux特権エスカレーション攻撃用プロトタイプであるHackingBuddyGPTを紹介する。
GPT-4-Turboは高い有効性を示し,33~83%の脆弱性を悪用した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:14:34 GMT)
Integrating feature selection and regression methods with technical indicators for predicting Apple Inc. stock prices [0.0] 本研究では,技術指標を用いた株価予測精度に及ぼす特徴選択の影響について検討した。
Squeeze_pro, Percentage Price, Thermo, Archer On-Balance Volume, Bollinger Bands, Squeeze,ichimokuが, 株価予測に最も有効な技術指標であった。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:26:15 GMT)
InfraGPT Smart Infrastructure: An End-to-End VLM-Based Framework for Detecting and Managing Urban Defects [0.0] スマートシティのインフラは、クローズド・サーキット・テレビ(CCTV)カメラのネットワークによって監視されている。道路、橋、トンネルはひび割れ、穴、流体漏れを発生させ、公共の安全を脅かし、タイムリーな修理を必要としている。
本稿では, オブジェクト検出のYOLOファミリを用いたマルチ欠陥検出とセグメント化のために, ストリートストリームを利用した包括的パイプラインを提案し, その検出を視覚言語モデル(VLM)に渡して, 要約を意識する。
VLMは、インシデント記述、推奨ツール、寸法、修理計画、緊急警報を含む構造化されたアクションプランを生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:27:16 GMT)
In-Browser LLM-Guided Fuzzing for Real-Time Prompt Injection Testing in Agentic AI Browsers [0.0] 大規模言語モデル(LLM)ベースのエージェントがWebブラウザに統合され、Webタスクの強力な自動化を提供する。
それらは間接的なインジェクション攻撃に対して脆弱で、Webページに隠された悪意のある命令は、エージェントを不必要なアクションに騙す。
本稿では,ブラウザ上で完全に動作し,LDMによって誘導される新しいファジィングフレームワークについて紹介する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:39:13 GMT)
Impact of AI Tools on Learning Outcomes: Decreasing Knowledge and Over-Reliance [0.0] あらゆるレベルの教育の学生は、課題を完了し、より高い試験スコアを達成するために、生成的人工知能(AI)ツールにますます依存している。
生成AIが学習結果に与える影響を調べるため、ブダペスト大学コービンス校で実験を行った。
主催者が設計を説明し、全ての参加者に平等な機会を創り出すために最善を尽くしたにもかかわらず、多くの学生は実験を大きな混乱だと認識した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:48:14 GMT)
Hybrid light-matter boundaries of graphene in a chiral cavity [0.0] 2次元材料にコヒーレントに結合できるカイラルキャビティの最近の進歩は、外部駆動なしで電子トポロジーを再形成するための強力な経路を開いた。
各光物質相互作用によって引き起こされるギャップは、バンドのチャーン数に依存する一方向の光物質対のエッジ電流をホストすることを示す。
本結果は,次世代量子光学デバイスにおけるハイブリッドバンドトポロジの実験的な特徴と,再構成可能なキラルチャネルのブループリントを予測した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:05:45 GMT)
Hybrid Boson Sampling-Neural Network Architecture for Enhanced Classification [0.0] 我々は、ボソンサンプリングの計算能力とニューラルネットワークの適応性を組み合わせて量子カーネルを構築するフレームワークを開発する。
様々なクラスを持つ4つのデータセットを用いて、我々のモデルは古典線形およびシグモイドカーネルより優れていることを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:16:38 GMT)
Homodyne Measurement of a Non-Hermitian Qubit Undergoing Fluorescence [0.0] 3レベルシステムのポストセレクションによる2レベル非エルミート量子ビットの実装が実証されている。
ポストセレクションによって導入された崩壊と測定バックアクションの相互作用を分析する。
この結果は、測定バックアクションと非エルミート力学が共に開量子系の過渡的な挙動を形成する方法に関する洞察を与える。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:30:43 GMT)
Higher-arity PAC learning, VC dimension and packing lemma [0.0] 以下は、Towsner'20(arXiv:2010.00726)のチェルニコフにおける研究の概観である。
また、arXiv:2402.14294, arXiv:2505.15688, arXiv:2509.20404の最近の結果のいくつかは、arXiv:2010.00726における我々の研究から得られたものである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:06:15 GMT)
High-Dimensional BWDM: A Robust Nonparametric Clustering Validation Index for Large-Scale Data [0.0] Calinski-Harabasz、Silhouette、Davies-Bouldinといった伝統的な妥当性指標は、高次元または汚染されたデータで劣化する。
本稿では,HD-BWDM (High-dimensional Between-Within Distance Median) という,ロバストで非パラメトリックなクラスタリング検証フレームワークを提案する。
ジョンソン-リンデンシュトラウス埋め込みの下での一貫性と収束を示す理論的結果を得る。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:25:25 GMT)
High Semantic Features for the Continual Learning of Complex Emotions: a Lightweight Solution [0.0] 本稿では、複雑な感情認識に焦点を当て、まず基本的な感情を学習し、次に、人間のように、複雑な感情を漸進的に学習する。
顔面筋運動を記述したアクションユニットは、浅部と深部の両方の畳み込みニューラルネットワークによって抽出された動作より優れる非過渡的、高度に意味的な特徴である。
この能力により,CFEEデータセットの精度0.75の複合感情を漸進的に複雑に学習する際の興味深い結果が得られ,最先端の結果と良好に比較できる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:27:41 GMT)
Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines [0.0] 本研究では,ResNeXt-50,EfficientNet-B0,MobileNetV3-S,YOLOv8-n,YOLOv5-sの美術廃棄物分類モデルの現状をベンチマークする。
YOLOv5-sは最高精度(95.06%)を達成したが、数ミリ秒の推論速度でYOLOv8-nモデルに劣った。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:08:58 GMT)
Further Evidence for Near-Tsirelson Bell-CHSH Violations in Quantum Field Theory via Haar Wavelets [0.0] 本稿では,ベル・クレーザー=ホルン=シモニー=ホルト不等式に対する明示的な違反を示すために,膨らんだハールウェーブレットを用いた最近の構成について検討する。
完全な証明はいまだ解明されていないが、我々はそれを支持するためにさらに説得力のある証拠を提示している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:05:29 GMT)
Function regression using the forward forward training and inferring paradigm [0.0] フォワードフォワード学習アルゴリズムは、バックプロパゲーションなしでニューラルネットワークをトレーニングするための新しいアプローチである。
本稿では,Forward-Forwardアルゴリズムを用いて関数の近似(関数回帰)を行う手法を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:30:47 GMT)
From Minimal Existence to Human Definition: The CES-IMU-HSG Theoretical Framework [0.0] 本研究は,最小公理コギト,エルゴ和(CES)に基づいて構成された大学間数学的枠組みを提案する。
CESは、リフレクティブな対応として存在を定義し、任意の形式的なシステムをこの最小限の構造の上にアタッチ可能な拡張として配置する。
この枠組みの中で、人的行動と認知は、材料ベースに制約されたユニバーサル間アルゴリズムの時間的構成として現れる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:56:09 GMT)
FMANet: A Novel Dual-Phase Optical Flow Approach with Fusion Motion Attention Network for Robust Micro-expression Recognition [0.0] 微妙な顔の動きを捉えるのが難しいため、微小な表情認識は困難である。
本稿では,マイクロ圧縮相とマイクロ圧縮相の運動力学を統合記述子に統合した総合的な動き表現を提案する。
次に、二相解析と等級変調を学習可能なモジュールに内部化する、新しいエンドツーエンドニューラルネットワークアーキテクチャであるFMANetを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:28:10 GMT)
Extracting latent representations from X-ray spectra. Classification, regression, and accretion signatures of Chandra sources [0.0] 本研究の目的は、深層学習を用いたチャンドラX線スペクトルのコンパクトで物理的に意味のある表現を開発することである。
変換器ベースのオートエンコーダを用いてX線スペクトルを圧縮する。
スペクトル再構成精度,クラスタリング性能,および物理量との相関から学習表現を評価する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 21:20:32 GMT)
ExpressNet-MoE: A Hybrid Deep Neural Network for Emotion Recognition [0.0] ExpressNet-MoEは、CNNとMoEフレームワークを融合した、新しいハイブリッドディープラーニングモデルである。
我々のモデルは、AffectNet(v7)で74.77%、AffectNet(v8)で72.55%、RAF-DBで84.29%、FER-2013で64.66%の精度を達成した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:42:49 GMT)
Experimental Demonstration of High-Fidelity Logical Magic States from Code Switching [0.0] 我々は、最先端の論理忠実度を持つ誤り訂正符号に符号化された論理マジック状態を作成する。
我々は、同じ量子プロセッサでマジック状態の2つのコピーを作成し、符号化されたマジック状態のサンプル効率証明のための論理ベル基底測定を行う。
高忠実度マジック状態は、既に実証されている耐故障性クリフォードゲート、状態準備、および2Dカラーコードの測定と組み合わせることができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:28:52 GMT)
Exact dynamics and qubit inversion of non-Hermitian driven two-level systems [0.0] 非エルミート駆動二層系の超対称構造を示す。
一元回転はハミルトニアンをより便利な形式に変える。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:44:02 GMT)
Evaluating Relayed and Switched Quantum Key Distribution (QKD) Network Architectures [0.0] ネットワークワイド量子鍵分布(QKD)における2つのアーキテクチャの性能を評価する。
異なるリングサイズ、QKDリンク損失、QKD受信機の感度および未整合モジュールの性能ペナルティのネットワーク性能を比較した。
以上の結果から,スイッチドQKDは高密度リング(ショート,大ノード数)において優れ,リレードQKDはより長い距離と大きなノード数で有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:03:31 GMT)
Environment-Assisted Generation of Non-Gaussian Wavepacket Quantum States [0.0] 本稿では,超伝導回路から導波路への線形伝送損失と工学的非線形散逸を組み合わせ,両課題を同時に実現するハードウェア効率のアプローチを提案する。
この散逸チャネルの組み合わせは、低次相互作用を利用して高次非線形性を誘導し、ガウス的でない幅広い誤差補正可能な状態の決定論的放出を可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:14:24 GMT)
Entangled Polariton States in the Visible and Mid-Infrared Spectral Ranges [0.0] ポラリトン系の絡み合い生成は、高い損失とデコヒーレンスによって制約される。
偏光子-偏光子相互作用ではなく、光学的相互作用を用いて絡み合った偏光子を生成する概念的に異なるアプローチを提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:26:49 GMT)
Emergent Discrete Time Crystals on Digital Quantum Computers: Boundary-Protected and Ancilla-Induced Disorder Mechanisms of Thermalization Slowdown [0.0] 我々は,IBM 量子イーグルおよびヘロンプロセッサ上に実装された蹴りアイシングモデルにおいて,周期的に駆動される製品状態の緩和ダイナミクスについて検討した。
相互作用の仲介にアンシラ量子ビットを用いることで、超伝導量子ビット上に重いヘックス接続を持つカゴメ格子とリーブ格子を構築する。
我々は,カゴメ格子とリーブ格子上の2種類のノイズ誘起DTCを同定した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:14:27 GMT)
Egocentric Visual Navigation through Hippocampal Sequences [0.0] 海馬の配列は内因性リカレント回路から発生し, 容易に入力できなくても活動が伝播することを示す。
我々は神経生物学にインスパイアされた最小のシーケンスジェネレータを実装し、エゴセントリックな視覚ナビゲーションのためのアクター批判学習者と組み合わせる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:40:21 GMT)
Efficient lambda-enhanced gray molasses using an EIT-based laser locking scheme [0.0] 非標準ビーム幾何および安価なレーザーロックセットによるグレーモラセ冷却の新たな実装を提案する。
提案手法は,高コストのGHzエレクトロニクスを必要とせず,効果的なグレーモラセ冷却を実現するのに十分なコヒーレンスを実現する。
波動関数モンテカルロ解析は実験結果を支持し、この非伝統的なスキームの冷却力学に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:46:54 GMT)
Dissipative Generation of Currents by Nonreciprocal Local and Global Environments [0.0] 我々は、原子トンネル項を散逸性空洞の大域場に結合することにより、有限電流と電流-電流相関の両方を長時間安定させることができることを示した。
これは、散逸が局所トンネルプロセスを介して直接作用する設定とは対照的である。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:34:51 GMT)
Dissipation in fermionic two-body continuous-time quantum walk under the steepest entropy ascent formalism [0.0] 多体量子ウォークは、シングルウォーカーの場合では利用できない量子相関を明らかにし、活用することができる。
我々は散逸モデルという熱力学的に一貫した形式、すなわち最も急激なエントロピー上昇(SEA)形式を用いる。
本研究は,多体量子系における非線形散逸のモデル化におけるSEA形式の重要性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:57:24 GMT)
DiffOPF: Diffusion Solver for Optimal Power Flow [0.0] 最適電力フロー (OPF) は、負荷からセットポイントのディスパッチへの多値マッピングである。
拡散型OPFソルバであるtextitDiffOPF を導入し,OPF を条件付き問題サンプリングとして扱う。
単値の解法とは異なり、DiffOPFは統計的に信頼性の高い温暖化開始と良好な満足度トレードオフを可能にする。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 20:32:48 GMT)
Detecting screens modeled by Schrödinger operators that generate $C_0$ contraction semigroups [0.0] ツマルカは非公式に$psi$の力学は$C_0$の縮約半群によって支配されなければならないと主張した。
これらすべての進化は、$psi$ と $partial Omega$ に線形吸収境界条件を配置することによって生成される。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:03:15 GMT)
Density matrix analysis of systems influenced by periodic Hamiltonians [0.0] 時間周期のハミルトニアンの影響を受ける単純系を考える。
我々は、$z$方向の磁場が一定であり、$x$方向の時間依存磁場を持つ2レベル系を考える。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:13:11 GMT)
DeepCausalMMM: A Deep Learning Framework for Marketing Mix Modeling with Causal Inference [0.0] DeepCausalMMMは、ディープラーニング、因果推論、高度なマーケティング科学を組み合わせることで制限に対処するPythonパッケージである。
パッケージはGated Recurrent Units(GRU)を使用して、アドストック(キャリオーバー効果)やラグなどの時間パターンを自動的に学習する。
また、ヒル方程式に基づく飽和曲線を実装し、減少するリターンをモデル化し、予算配分を最適化する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 02:02:27 GMT)
Data-intrinsic approximation in metric spaces [0.0] 有限距離空間間のサイト・ツー・バリューマップとして数学的に記述されたラベル付きデータサンプルの近似について考察する。
本稿では,その効率的な計算のためのアルゴリズムを提案し,ラベル付きデータに対するサンプルベース近似理論を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:45:29 GMT)
Data Understanding Survey: Pursuing Improved Dataset Characterization Via Tensor-based Methods [0.0] 既存のデータセットの特徴付け手法は、イノベーションと説明可能性に不可欠な深い理解と洞察を提供するのに失敗することが多い。
我々は、テンソルベースの特徴付けの採用を提唱し、複雑なデータセットを理解し、インテリジェントで説明可能なデータ駆動的な発見への道を開くことを約束します。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:17:54 GMT)
Convergence, design and training of continuous-time dropout as a random batch method [0.0] ランダムバッチ方式のレンズを用いた連続時間モデルにおけるドロップアウト正規化について検討する。
我々は、長さ$h$の時間間隔でニューロンのバッチをサンプリングすることによって、ドロップアウトを模倣する、偏りのない、よく考えられた推定器を構築した。
次に、単層ニューラルネットワークを専門とし、分類とフローマッチングの理論を検証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:19:01 GMT)
Continuous-variable photonic quantum extreme learning machines for fast collider-data selection [0.0] 我々は、コライダーデータ処理のための高速かつ低オーバーヘッドのフロントエンドとして、連続可変フォトニック量子極端学習マシンについて研究する。
データは二次変位を通じてフォトニックモードで符号化され、固定時間ガウス量子基板を介して伝播する。
1つの線形解法を用いて線形分類器のみを訓練するので、再学習は高速であり、光学パスと検出器応答は解析と推論の遅延を設定できる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:21:32 GMT)
Context-Selective State Space Models: Feedback is All You Need [0.0] 状態フィードバックを組み込んだ時間変化SSMを導入し、コンテキスト依存の選択を可能にする。
COFFEEは、S6と比較して2桁のパラメータとトレーニングシーケンスでほぼ完璧な精度を達成する。
その結果、スケーラブルで効率的なシーケンスモデルを構築するための重要なメカニズムとして、状態フィードバックが果たす役割が示されている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:08:28 GMT)
Conditional Flow Matching for Bayesian Posterior Inference [0.0] 本稿では,フローマッチングを用いた多変量後部サンプル作成手法を提案する。
単純なトレーニング目標を提供し、可能性評価へのアクセスを必要としない。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:51:36 GMT)
Comparative Analysis of Data Augmentation for Clinical ECG Classification with STAR [0.0] 正弦波時間振幅サンプリング(Sinusoidal Time-Amplitude Resampling, STAR)は、連続するRピーク間で厳密に動作するビートワイド増幅である。
STARは実践的なパイプラインのために設計されており、 (i) ピークや間隔を損なうことなくトレーニングの多様性を拡大するモルフォロジー-忠実な変動、 (ii) ソースレジリエンスなトレーニング、 デバイス、サイト、コホート間の安定性をデータセット固有のチューニングなしで改善する、 (iv) ビートレベルの拡張によるレアクラスの学習の改善。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 14:18:03 GMT)
Compact vacuum levitation and control platform with a single 3D-printed fiber lens [0.0] 高開口レンズ(NA)を備えた単一光ファイバは、ファイバフェートに直接印刷される。
これにより、コンパクトで堅牢な光浮揚・検知システムが、すべてファイバーベースのコンポーネントで構成されている。
我々のプラットフォームは、浮遊粒子に基づく実用的でポータブルなセンサーの道を開く。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:14:41 GMT)
Coefficient Shape Transfer Learning for Functional Linear Regression [0.0] 本稿では,関数型線形モデルにおけるデータ不足問題に対処するために,新しい伝達学習手法を開発する。
この方法論は、ターゲットモデル(ターゲットドメイン)のサンプルと補助モデル(ソースドメイン)のサンプルを組み込む。
異なるソースからのデータが桁違いに異なる場合でも、信頼性の高い知識伝達を保証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 12:00:21 GMT)
Closing the Block-to-Text Gap: A Domain-Specific JavaScript Editor for Early Computational Thinking [0.0] 本稿では,8~10歳児のブロックベースプログラミングへの移行を支援するために,WebベースのJavaScriptエディタを提案する。
このシステムは、創造性、自己補正、持続的なエンゲージメントを奨励し、教育者が認証コーディングの実践的なツールを提供する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:54:53 GMT)
Classification of Transuranium Elements in Terms of `Winding' Numbers in the Bohr-Sommerfeld Model [0.0] 我々はボーア・ソマーフェルト原子モデルを再検討し、ウラン、オガネソン、仮説上の超重元素の水素様イオンを探索する。
ソマーフェルト微細構造公式と計算機代数法を用いて、超強クーロン場における自己交差軌道の出現を実証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:05:39 GMT)
Classically Bound and Quantum Quasi-Bound States of an Electron on a Plane Adjacent to a Magnetic Monopole [0.0] 古典的な問題では有界状態が、量子論では準有界状態が見つかる。
準有界状態を実現するために必要な閾値モノポール磁気電荷は約18Q_D$である。
スピンアイス, 人工スピンアイス, 磁気針など, 現在利用可能なモノポールアナログにおいて, この磁気電荷を実現する可能性について検討した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:13:39 GMT)
Chip-Scale Point-Source Sagnac Interferometer by Phase-Space Squeezing [0.0] 回転検出における点源原子干渉計(PSI)の効果を解析的および数値的に検討した。
解析の結果、この圧縮PSIアプローチは、より短いサイクル時間と高い繰り返し率を実現しつつ、感度とダイナミックレンジを著しく改善できることがわかった。
これらの理論的な結果は、SPSIが標準サイズのデバイスの性能を向上させるか、小型のチップスケールデバイスの性能を維持する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:59:38 GMT)
Bridging Entanglement and Magic Resources within Operator Space [0.0] LOEは常に、$T$-count, Unitary nullity, 演算子安定化器R'enyエントロピーの3つの異なるマジックモノトンによって上界にあることを示す。
この結果から, テンソルネットワーク法を用いてシミュレーションするコストがかかる演算子の進化は, 安定化器法とパウリトランケーション法の両方を用いて非効率でなければならないことが示唆された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:32:44 GMT)
Benchmarking the quality of multiplexed qubit readout beyond assignment fidelity [0.0] 我々は検出器トモグラフィーを用いて超伝導トランスモン量子ビットのマルチキュービット読み出しを完全に特徴付ける。
異なる読み出しパラメータが情報抽出率に与える影響について検討した。
代入忠実度検証ツールとして不確定性収束率を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:55:39 GMT)
Automated document processing system for government agencies using DBNET++ and BART models [0.0] このシステムはオフライン画像と、コネクテッドカメラによるリアルタイムキャプチャの両方をサポートする。
パイプラインは、画像キャプチャと前処理、テキスト検出、テキスト分類の4つのステージで構成されている。
画像中のテキスト検出システムは、Total-Textデータセットで約92.88%から10時間で達成された。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:48:02 GMT)
Autler-Townes spectroscopy of a Rydberg ladder [0.0] 上肢ビームで観察された2光子オートラー・タウネス共鳴(Autler-Townes resonance)と呼ばれる2光子分光像を報告する。
この特徴の優れた信号対雑音比により、リードバーグ共鳴を主量子数で最大$n=80$で解くことができる。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 04:59:55 GMT)
Are Randomized Quantum Linear Systems Solvers Practical? [0.0] ランダム化量子アルゴリズムは、量子シミュレーションと量子線型代数の文脈で提案されている。
ランダム化量子線形系解法における全誤差を制御する全ての関連するパラメータに明示的な境界を与える。
私たちの研究は、理論的なアルゴリズムの提案と効率的なハードウェア実装の橋渡しとして役立ちます。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 17:12:55 GMT)
An exact analytical solution for Dicke superradiance [0.0] 我々はDicke超放射能問題を再考し、N の同一二層系のアンサンブルが集団自然崩壊する。
コンパクトで閉形式な解で、残基上の有限和として力学を表現するか、あるいは同値な複素輪郭積分(英語版)(complex contour integral)を示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 13:44:48 GMT)
An Industry-Academia Partnership for Advancing Quantum Frontiers: Perspective from the U.S. Center for Quantum Technologies [0.0] アメリカ量子技術センター (CQT) は、米国科学財団 (NSF) の産業大学共同研究センター (IUCRC) プログラムの下で設立された多大学コンソーシアムである。
CQTは、量子イノベーションを加速するために、学術研究と産業と政府の協力を統合する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 09:55:45 GMT)
An Alignment Between the CRA's Essential Requirements and the ATT&CK's Mitigations [0.0] 本稿では、MITREのATT&CKフレームワークに存在する緩和策と、最近導入された欧州連合におけるサイバーレジリエンス法(CRA)のサイバーセキュリティ要件との整合性を評価する。
CRAに関しては、データ最小化、データ消去、脆弱性調整という観点でのみ、注目すべきギャップがある。
提示された評価は、法律と技術フレームワークの共通格差の狭まりに寄与する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:20:06 GMT)
Airfoil optimization using Design-by-Morphing with minimized design-space dimensionality [0.0] 本研究では,翼の最適化に特化したDbM (Design-by-Morphing) アプローチであるAirDbMを紹介する。
AirDbMはUIUCのエアフォイルデータベースから12基のベースライン翼を最適に選択する。
これらのベースラインにより、AirDbMは0.005以下の平均絶対誤差で、データベースの99パーセントを再構築する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:07:34 GMT)
Agency cannot be a purely quantum phenomenon [0.0] 純粋量子系が三つの最小条件を満たすことができるかどうかを考察する。
エージェントは、ワールドモデルを作成し、それを使用して、代替アクションの結果の可能性を評価し、期待されるユーティリティを最大化するアクションを確実に実行しなければなりません。
最初の2つの条件は、未知の量子状態のコピーを禁じる非閉定理と矛盾することを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 07:50:13 GMT)
Accelerating Natural Gradient Descent for PINNs with Randomized Nyström Preconditioning [0.0] Natural Descent Gradient (NGD) は、ニューラルネットワークに基づく偏微分方程式(PDE)の学習アルゴリズムである。
NGDはしばしば、グラミアン行列を含む線形系を解くのに高い計算コストによって制限される。
我々は,行列フリーNGDを従来考えられていたよりも幅広い問題のクラスに拡張し,内部CGソルバの収束を加速するために,Nystr"omプレコンディショニングの利用を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:58:50 GMT)
APRIL: Auxiliary Physically-Redundant Information in Loss - A physics-informed framework for parameter estimation with a gravitational-wave case study [0.0] 物理情報ニューラルネットワーク(PINN)は、ニューラルネットワークのトレーニングに直接、システムを管理する偏微分方程式を組み込む。
本稿では,損失に物理的に依存する補助的な情報を含めることによる補完的アプローチを提案する。
数学的にこれらの用語は、損失景観を再構成しながら、真の物理的最小値を保存することを実証する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:34:19 GMT)
AGNES: Adaptive Graph Neural Network and Dynamic Programming Hybrid Framework for Real-Time Nanopore Seed Chaining [0.0] ナノ孔シークエンシングにより、リアルタイムの長読DNAシークエンシングが可能で、読み取りは10キロ塩基を超える。
12~15パーセントの固有エラー率は、リードアライメントにおいて重要な計算上の課題を提示する。
本稿では,グラフニューラルネットワークと古典動的プログラミングを組み合わせた適応型シードチェインのためのハイブリッドフレームワークRawHash3を提案する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:05:43 GMT)
A theory-based AI automation exposure index: Applying Moravec's Paradox to the US labor market [0.0] 本稿では,モラベックのパラドックスに基づく理論駆動型自動露光指数を開発する。
パフォーマンスのばらつき、暗黙の知識、データの豊富さ、アルゴリズム的なギャップについて、19,000のO*NETタスクを評価すると、マネジメント、STEM、科学の職業が最も露出率が高いことがわかります。
賃金と露光のポジティブな関係は、AIが労働者の代わりになる場合、スキルバイアスの技術的変化の概念に挑戦する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:00:33 GMT)
A rigorous formulation of Density Functional Theory for spinless fermions in one dimension [0.0] H_N(v,w) = -Delta + sum_ineq jN w(x_i,x_j) + sum_j=1N v(x_i)$ という形のシュリンガー作用素を考える。
ここで研究される分布ポテンシャルのクラスに適用されるホヘンベルク・コーンの定理を証明する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 10:31:54 GMT)
A metrological framework for uncertainty evaluation in machine learning classification models [0.0] 本稿では, メタロジカルな概念的不確実性評価フレームワークを提案する。
我々のフレームワークは、測定の不確実性表現ガイド(GUM)を名目上の特性の不確実性に拡張するものである。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 08:47:35 GMT)
A Survey and Future Outlook on Indoor Location Fingerprinting Privacy Preservation [0.0] 屋内位置指紋認証(ILF)システムでは,ユーザデバイスからの多様な信号指紋を使用して,位置情報プロバイダ(LSP)による正確な位置識別を実現する。
さまざまなドメインにまたがる幅広いアプリケーションにもかかわらず、ILFは、LSPと潜在的な敵の両方が本質的にこの機密情報にアクセスでき、ユーザのプライバシーを損なうため、顕著なプライバシーリスクをもたらす。
本調査では、暗号、匿名化、差分プライバシー(DP)、フェデレーション学習(FL)技術に基づく、屋内フィンガープリントプライバシ保存機構(ILFPPM)の総合的なレビューを行う。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 18:35:37 GMT)
A Storm-Centric 250 m NEXRAD Level-II Dataset for High-Resolution ML Nowcasting [0.0] 我々はNEXRAD Level-IIとGridRad-Severeデータから得られたストーム中心レーダーデータセットStorm250-L2を紹介する。
我々はGridRad-Severe ストームトラックの周囲に固定された高解像度 (250 m) の窓をアルゴリズムでトリミングし、ネイティブの極地形状を保存し、タイルごとのスイープと擬似合成反射率生成物の時間的に一貫したシーケンスを提供する。
データセットは、米国大陸全体で数千の嵐イベントで構成され、リッチなコンテキストメタデータと再現可能なマニフェストを備えたHDF5テンソルにパッケージされている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 23:11:00 GMT)
A Personalized Data-Driven Generative Model of Human Repetitive Motion [0.0] 運動振幅は、個々の運動シグネチャの有効かつ相補的な特徴を与えることを示す。
我々は、長期記憶ニューラルネットワークに基づくデータ駆動型アプローチを提案し、特定の個人の特徴を捉えた独自の動きを生成する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 16:43:12 GMT)
A Multimodal Approach to Heritage Preservation in the Context of Climate Change [0.0] 本稿では,センサデータ(温度,湿度)と視覚画像とを融合させて,遺産の重症度を予測する軽量なマルチモーダルアーキテクチャを提案する。
ストラスブール大聖堂からのデータでは、標準的なマルチモーダルアーキテクチャよりも43%向上した76.9%のアクク・レシーを達成した。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 22:07:57 GMT)
A Modal Logic for Temporal and Jurisdictional Classifier Models [0.0] 我々は、法的ケースベース推論(CBR)を正式に捉えるために設計された分類器のモーダル論理を導入する。
我々は、判例の時間的次元と法体系内の裁判所の階層を論理的に導入することにより、前例間の紛争を解決するための原則を取り入れている。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 15:50:04 GMT)
A Matter of Representation: Towards Graph-Based Abstract Code Generation [0.0] 本稿では,グラフを用いた抽象コード生成を実現するために,グラフの表現と評価を行う。
この研究は、グラフベースの抽象コード生成のための表現学習への第一歩を確立する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 05:26:36 GMT)
A Mapping Analysis of Requirements Between the CRA and the GDPR [0.0] CRA(Cyber Resilience Act)は、欧州連合(EU)が最近合意した法律である。
本稿では,新たな法律が既存の要件にどのように影響するかを実証し,法的要件を専門とする要件工学研究に貢献する。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 11:15:53 GMT)
$\ell_1$-Regularized Generalized Least Squares [0.0] 自己相関誤差を伴う高次元回帰に対する$ell_1$-regularized generalized least-squares (GLS) 推定器について検討した。
提案手法では, 自己回帰処理により誤差が生じる場合, 未調整のLASSO回帰よりも推定誤差が小さいことを示す。
論文参考訳(メタデータ) (Wed, 15 Oct 2025 19:59:41 GMT)