Intern-S1: A Scientific Multimodal Foundation Model [282.7] Intern-S1は、一般的な理解と推論機能を備えた専門的なジェネラリストである。
Intern-S1はオフラインおよびオンライン強化学習(RL)をInternBootCampで実施する。
包括的な評価ベンチマークでは、Intern-S1はオープンソースモデル間の一般的な推論タスクにおける競合性能を示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:35:34 GMT)
Optimizing Multi-Modal Trackers via Sensitivity-aware Regularized Tuning [112.1] 本稿では,RGBデータに対する事前学習モデルを効果的に適用することにより,マルチモーダルトラッカーの最適化に挑戦する。
既存の微調整パラダイムは過度な自由と過剰な制限の間に振動し、最適の可塑性-安定性のトレードオフをもたらす。
そこで本研究では,本質的なパラメータ感を取り入れて学習プロセスを微妙に洗練する,感性に配慮した規則化チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:42:47 GMT)
MoCo: Motion-Consistent Human Video Generation via Structure-Appearance Decoupling [107.8] MoCoは、テキストプロンプトから一貫した動きで人間のビデオを生成する新しい方法である。
本手法では,テキストプロンプトから人間の動作シーケンスを生成するために,効率的な3次元構造生成器を用いる。
複雑で多様な動きを特徴とする大規模人体ビデオデータセットを構築した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:20:24 GMT)
Deep Face Restoration: A Survey [104.6] 顔復元(FR)は、低品質(LQ)入力画像から高品質(HQ)顔を復元することを目的としている。
初期の顔復元法は主に統計的先行と劣化モデルを用いている。
近年では、深層学習に足を踏み入れた後、顔の修復が大きな進展をみせている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:42:52 GMT)
Mimicking the Physicist's Eye:A VLM-centric Approach for Physics Formula Discovery [98.6] VIPERR-aq1は、方程式推論のための視覚誘導を行うマルチモーダルモデルである。
視覚知覚、軌跡データ、象徴的推論を統合し、科学的発見過程をエミュレートする。
常に最先端のVLMベースラインを精度と解釈性で上回る。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:34:21 GMT)
MagicGUI: A Foundational Mobile GUI Agent with Scalable Data Pipeline and Reinforcement Fine-tuning [83.8] MagicGUIは、現実のモバイルGUI環境における認識、接地、推論における重要な課題に対処するために設計された、基本的なモバイルGUIエージェントである。
フレームワークには、包括的で正確なデータセット、知覚と接地能力の強化、包括的で統一されたアクション空間、計画指向の推論メカニズムを含む6つの重要なコンポーネントが含まれている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:53:11 GMT)
GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation [81.6] 視覚トークン化のスケーリングにおいて、画像再構成、生成、表現学習を改善するための最初のアプローチであるGigaTokを紹介する。
我々は、遅延空間の増大する複雑さを、再生と世代ジレンマの主な要因とみなす。
数十億ドルのパラメータにスケールアップすることで、GigaTokは、再構築、下流のAR生成、下流のAR表現品質における最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:16:02 GMT)
CoViPAL: Layer-wise Contextualized Visual Token Pruning for Large Vision-Language Models [75.9] LVLM(Large Vision-Language Models)は、画像やビデオから抽出されたテキストトークンとビジョントークンからなるマルチモーダル入力を処理する。
既存の手法は冗長な視覚トークンを創りだそうとしており、視覚表現のかなりの冗長性を明らかにしている。
我々は,LVLMで処理される前に冗長な視覚トークンを予測・削除するために,Plug-and-Play Pruning Module (PPM) を用いるレイヤワイズなコンテキスト対応型視覚トークンプルーニング手法であるCoViPALを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:47:00 GMT)
Explain Before You Answer: A Survey on Compositional Visual Reasoning [74.3] 構成的視覚推論は、マルチモーダルAIにおける重要な研究フロンティアとして登場した。
本調査は,トップ会場(CVPR,ICCV,NeurIPS,ICML,ACLなど)から260以上の論文を体系的にレビューする。
次に60以上のベンチマークとそれに対応するメトリクスを、基底精度、連鎖忠実性、高分解能知覚などの次元に沿って探索する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:01:51 GMT)
Localizing Factual Inconsistencies in Attributable Text Generation [74.1] 本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
QASemConsistencyは、人間の判断とよく相関する事実整合性スコアを得られることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:45:10 GMT)
DRT: Deep Reasoning Translation via Long Chain-of-Thought [73.2] ニューラル・マシン・トランスフォーメーション(MT)に長いチェーン・オブ・シークレットの成功をもたらす試みであるDRTを紹介する。
まず、既存の文献から模範文や比喩文を含む文を抽出し、その後、長い思考を通してこれらの文を翻訳する多エージェントフレームワークを開発する。
Qwen2.5とLLama-3.1をバックボーンとして使用することで、DRTモデルは機械翻訳中に思考プロセスを学ぶことができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:41:54 GMT)
4D Visual Pre-training for Robot Learning [71.2] ロボット工学のためのWebスケールデータセットから得られた一般的な視覚表現は、近年大きな成功を収めている。
しかし、これらの事前訓練された表現は、主に2D画像に基づいており、世界の固有の3Dの性質を無視している。
代替として、すべての3D表現を改善することのできる、一般的なビジュアル事前学習フレームワークを模索しています。
我々のフレームワークはFVPと呼ばれ、現実世界のロボット学習のための新しい4Dビジュアル事前学習フレームワークである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:06:56 GMT)
PromptRR: Diffusion Models as Prompt Generators for Single Image Reflection Removal [71.2] 既存のシングルイメージリフレクション除去法(SIRR)は、画像のキー低周波(LF)と高周波(HF)の違いを見逃す傾向がある。
本稿では、周波数情報を新しい視覚的プロンプトとして利用し、反射性能を向上する新しいプロンプト誘導反射除去フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:26:59 GMT)
Bridging Models to Defend: A Population-Based Strategy for Robust Adversarial Defense [70.4] 敵の堅牢性(Adrial robustness)は、ニューラルネットワークが推論時に敵の攻撃に耐える能力の重要な尺度である。
本稿では,新しいロバストモード接続性(RMC)指向の対角防御フレームワークを提案する。
提案手法は, $ell_infty$, $ell$, およびハイブリッド攻撃に対するロバスト性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:37:09 GMT)
Optimization-based Prompt Injection Attack to LLM-as-a-Judge [69.3] LLM-as-a-Judgeは、大きな言語モデル(LLM)を使用して、ある質問に対する候補セットから最適な応答を選択する。
LLM-as-a-Judgeに対する最適化に基づくプロンプトインジェクション攻撃であるJiceDeceiverを提案する。
評価の結果,JiceDeceiveは既存のプロンプトインジェクション攻撃よりも効果的であることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:35:16 GMT)
TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.5] TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:52:37 GMT)
Draft Model Knows When to Stop: Self-Verification Speculative Decoding for Long-Form Generation [64.6] 主流SDベンチマークと推論重ベンチマークの実験結果から,SVIPの優れた性能が示された。
SVIPは、ドラフトエントロピーを参照して、ドラフトシーケンスの長さを適応的に決定する、投機的復号システムのためのトレーニング不要な動的長さポリシーである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:48:28 GMT)
DiCache: Let Diffusion Model Determine Its Own Cache [63.7] 実行時に拡散モデルを高速化するためのトレーニング不要な適応型キャッシュ戦略であるDiCacheを提案する。
Online Probe Profiling Schemeは、浅層オンラインプローブを利用して、キャッシュエラーに対する安定した事前をリアルタイムで取得する。
Dynamic Cache Trajectory Alignmentは、浅層プローブ機能トラジェクトリに基づくマルチステップキャッシュを組み合わせて、現在の機能をよりよく近似する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:30:00 GMT)
Hypformer: Exploring Efficient Transformer Fully in Hyperbolic Space [61.8] 双曲幾何学のローレンツモデルに基づく新しい双曲変換器Hypformerを導入する。
我々は,双曲空間における線形自己保持機構を開発し,双曲変換器が数十億のグラフデータと時系列入力を初めて処理できるようにする。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:17:27 GMT)
Prompt Injection Attack to Tool Selection in LLM Agents [61.0] 一般的なアプローチは、与えられたタスクに対してツールライブラリから最も適切なツールを選択するための2段階のプロセス(式と例選択)に従う。
本研究では、no-boxシナリオにおける新しいプロンプトインジェクション攻撃ツール選択であるtextitToolHijackerを紹介する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:28:21 GMT)
Investigating Domain Gaps for Indoor 3D Object Detection [60.6] 本研究では,屋内3次元物体検出器を1つのデータセットから別のデータセットに適応させる作業について考察する。
本稿では, ScanNet, SUN RGB-D, 3D Frontのデータセットと, 新たに提案した大規模データセット ProcTHOR-OD と ProcFront を用いたベンチマークを提案する。
本研究は,3次元物体検出器におけるドメインギャップの違いが,合成から現実への適応,点雲品質適応,レイアウト適応,インスタンス特徴適応など,さまざまな適応シナリオについて実験を行った。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:34:19 GMT)
Preliminary Ranking of WMT25 General Machine Translation Systems [58.4] 本稿では,WMT25汎用機械翻訳共有タスクに送信された機械翻訳システム(MT)の事前ランキングについて述べる。
公式のWMT25ランキングは、人間の評価に基づいており、より信頼性が高く、これらの結果に取って代わる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:08:00 GMT)
Minimal Solvers for Full DoF Motion Estimation from Asynchronous Tracks [57.4] 本稿では,非同期トラックからカメラの翻訳速度と角速度の両方を推定する問題に対処する。
低次数問題に対する最小限の解法を開発し、それらを合成および実データセット上で評価する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:17:00 GMT)
Constrained Prompt Enhancement for Improving Zero-Shot Generalization of Vision-Language Models [57.4] ウェブスケールのデータに基づいて事前訓練された視覚言語モデル(VLM)は、ゼロショットの一般化を約束するが、しばしば意味的ミスアライメントに悩まされる。
視覚・テクストアライメントを改善するために,制約付きプロンプトエンハンスメント(CPE)法を提案する。
提案手法はTGSSG(Topology-Guided Synonymous Semantic Generation)とCADRS(Calegory-Agnostic Discriminative Region Selection)の2つの重要なコンポーネントから構成される。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:45:22 GMT)
ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.8] 法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。
本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。
われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:19:25 GMT)
Continual Learning for Generative AI: From LLMs to MLLMs and Beyond [56.3] 本稿では,主流生成型AIモデルに対する連続学習手法の総合的な調査を行う。
これらのアプローチをアーキテクチャベース、正規化ベース、リプレイベースという3つのパラダイムに分類する。
我々は、トレーニング目標、ベンチマーク、コアバックボーンを含む、異なる生成モデルに対する連続的な学習設定を分析する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:01:04 GMT)
FoundDiff: Foundational Diffusion Model for Generalizable Low-Dose CT Denoising [55.0] 本稿では,CT(低線量CT)デノナイズのための基礎拡散モデルFoundDiffを提案する。
FoundDiffは、(i)線量解剖学的知覚と(ii)適応的認知という2段階の戦略を採用している。
まず, 線量および解剖学的知覚を実現するために, 線量および解剖学的対応型コントラスト言語画像事前訓練モデル(DA-CLIP)を開発した。
第2に,適応的および一般化可能な復調を行うために,線量および解剖学的拡散モデル(DA-Diff)を設計する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:03:56 GMT)
Hadamard Attention Recurrent Transformer: A Strong Baseline for Stereo Matching Transformer [53.6] Adamard Attention Recurrent Stereo Transformer(HART)について紹介する。
HARTには、以下のコンポーネントを組み込んだ新しいアテンションメカニズムが含まれている。
反映的な領域では、HARTはKITTI 2012ベンチマークで1位にランクインした。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:36:26 GMT)
Rectified Robust Policy Optimization for Model-Uncertain Constrained Reinforcement Learning without Strong Duality [53.5] 我々はRectified Robust Policy Optimization (RRPO) と呼ばれる新しいプライマリのみのアルゴリズムを提案する。
RRPOは双対の定式化に頼ることなく、主問題に直接作用する。
我々は、最もよく知られた下界と一致する複雑性を持つ、ほぼ最適な実現可能なポリシーに収束することを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:59:38 GMT)
LLM4MSR: An LLM-Enhanced Paradigm for Multi-Scenario Recommendation [52.6] マルチシナリオレコメンデーション(MSR)の研究は注目されており、すべてのシナリオのデータを使用してレコメンデーションのパフォーマンスを同時に改善している。
既存の手法では、不十分なシナリオ知識を統合し、パーソナライズされたクロスシナリオの嗜好を無視する傾向があり、それによってサブ最適パフォーマンスがもたらされる。
本稿では,これらのギャップを埋めるために,大規模言語モデル (LLM) 拡張パラダイム LLM4MSR を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:25:57 GMT)
Curvature Learning for Generalization of Hyperbolic Neural Networks [51.9] ハイパーボリックニューラルネットワーク(HNN)は,階層構造を持つ実世界のデータを表現する上で,顕著な有効性を示している。
不適切な曲率により、HNNは最適以下のパラメータに収束し、全体的な性能が低下する可能性がある。
本研究では,損失景観の平滑化を図り,HNNの一般化を向上するシャープネス対応曲率学習法を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:14:30 GMT)
From reactive to cognitive: brain-inspired spatial intelligence for embodied agents [51.0] Brain-inspired Space Cognition for Navigation (BSC-Nav) は、エンボディエージェントにおける構造化空間メモリの構築と活用のための統合されたフレームワークである。
BSC-Navは、エゴセントリックな軌跡と文脈的手がかりからアロセントリックな認知マップを構築し、意味的目標に沿った空間的知識を動的に回収する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:20:48 GMT)
Advancing Weakly-Supervised Change Detection in Satellite Images via Adversarial Class Prompting [49.2] 本稿では,この共起雑音問題に対処するAdvCP法を提案する。
私たちのAdvCPは、追加の推論コストを加えることなく、現在のWSCDメソッドにシームレスに統合できます。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:02:16 GMT)
ERF-BA-TFD+: A Multimodal Model for Audio-Visual Deepfake Detection [49.1] 本稿では,ERFと音声-視覚融合を組み合わせた新しいディープフェイク検出モデルであるERF-BA-TFD+を提案する。
我々のモデルは音声と映像の両方の特徴を同時に処理し、その相補的な情報を活用して検出精度とロバスト性を向上させる。
本研究では,DDL-AVデータセット上でのRF-BA-TFD+の評価を行った。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:03:46 GMT)
DecisionFlow: Advancing Large Language Model as Principled Decision Maker [49.1] DecisionFlowは、モデルにアクション、属性、制約の構造化された表現を推論するように誘導する、新しい決定モデリングフレームワークである。
プロンプトから直接回答を予測するのではなく、DecisionFlowは意味論的に根拠のある決定空間を構築し、潜在ユーティリティ関数を推論する。
実験の結果,DecisionFlowの精度は,強いプロンプトベースラインよりも最大30%向上した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:39:39 GMT)
ShortListing Model: A Streamlined SimplexDiffusion for Discrete Variable Generation [47.2] ショートリストモデル(英: Shortlisting Model, SLM)は、プログレッシブ候補プルーニング(英語版)にインスパイアされた、シンプルな拡散モデルである。
SLMは単純なセントロイドで動作し、生成の複雑さを低減し、拡張性を向上させる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:03:02 GMT)
Towards Better Correctness and Efficiency in Code Generation [47.1] 本稿では,新しい性能報酬によって導かれる効率指向の強化学習フレームワークを提案する。
オンライン探索は、高精度ベースラインから始める際に最も効果的である。
実験では、コード精度を10.18%向上し、実行効率を7Bモデルで7.75%向上させる手法の有効性が示されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:47:19 GMT)
Control Illusion: The Failure of Instruction Hierarchies in Large Language Models [46.6] 大規模言語モデル (LLM) は階層的な命令スキームによって徐々に展開される。
制約優先順位付けに基づく体系的評価フレームワークを導入し,LLMがいかに命令階層を強制するかを評価する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:05:34 GMT)
Persuasion Dynamics in LLMs: Investigating Robustness and Adaptability in Knowledge and Safety with DuET-PD [46.6] LLM(Large Language Models)は、偽情報に対するガイダンスと、説得力のある対話における有効な修正に対する抵抗のバランスをとるのに苦労する。
二次元にわたる多ターン姿勢変化ダイナミクスを評価するフレームワークであるDuET-PDを導入する。
GPT-4oのような最先端モデルでさえ、持続的な誤解を招く説得の下でMMLU-Proの精度はわずか27.32%であることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:08:37 GMT)
String commitment from unstructured noise [46.4] 不規則な雑音チャネルモデルの一般化として、非構造ノイズチャネルモデルを導入する。
非構造ノイズチャネルモデルにおけるエントロピック制約は、ノイズ量子記憶のような物理的仮定から導出できることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:35:43 GMT)
Universal Quantum Error Mitigation via Random Inverse Depolarizing Approximation [45.9] RIDA(Random Inverse Depolarization Approximation)は、ランダムに生成された回路を用いて、所定の回路の大域的脱分極確率とそれに対応するエラーフリー期待値を推定する単純な普遍的手法である。
数値実験は、RIDAが鍵となるベンチマークよりも優れており、物理学や化学を含む分野にわたる量子コンピューティングの応用において、大幅な精度の向上が示唆されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:30:08 GMT)
Seeing the Trees for the Forest: Rethinking Weakly-Supervised Medical Visual Grounding [45.2] 現在のモデルは、非効率な注意機構ときめ細かいトークン表現の欠如により、テキスト記述と病気領域を関連付けるのに苦労している。
本稿では、VLMの説明可能性マップを用いて、適切な画像特徴を識別する病原体認識プロンプト(DAP)を提案する。
DAPは3つの主要な胸部X線データセットの最先端手法と比較して、視覚的接地精度を20.74%向上させる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:40:35 GMT)
DashboardQA: Benchmarking Multimodal Agents for Question Answering on Interactive Dashboards [44.7] DashboardQAは、ビジュアル言語GUIエージェントが現実世界のダッシュボードをどのように理解し、相互作用するかを評価するために設計されたベンチマークである。
Tableau Publicから112のインタラクティブダッシュボードと、マルチ選択、ファクトイド、仮説、マルチダッシュボード、会話という5つのカテゴリにまたがる対話型ダッシュボードを備えた405の質問応答ペアが含まれている。
この結果から, インタラクティブなダッシュボード推論は, 総合的に評価されるすべてのVLMにおいて難しい課題であることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:11:44 GMT)
Cyber Security Educational Games for Children: A Systematic Literature Review [44.3] この体系的な文献レビューは、2010年から2024年の間に発表された68の論文で報告された91のゲームを分析した後、ポジティブな学習結果の証拠を明らかにする。
設計プロセスと方法論の厳密性に関しても、重大なギャップが指摘されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:39:54 GMT)
SAKURA: On the Multi-hop Reasoning of Large Audio-Language Models Based on Speech and Audio Information [44.1] 大規模音声言語モデル(LALM)は、音声、音声などにおけるマルチモーダル理解によって、大きな言語モデルを拡張する。
音声および音声処理タスクにおける彼らのパフォーマンスは広範囲に研究されているが、その推論能力はいまだに未解明である。
音声情報と音声情報に基づいて,LALMのマルチホップ推論を評価するベンチマークであるSAkuraを紹介する。
その結果,LALMは,関連情報を正しく抽出しても,マルチホップ推論のための音声/音声表現の統合に苦慮していることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:09:17 GMT)
Effort-aware Fairness: Incorporating a Philosophy-informed, Human-centered Notion of Effort into Algorithmic Fairness Metrics [44.1] Effort-aware Fairness (EaF) の概念化と評価のための哲学インフォームドアプローチを提案する。
私たちの作業は、AIモデル監査官が改善に多大な努力を払ってきたが、制御外の体系的な不利益に悩まされている個人に対して、不公平な判断を明らかにし、修正する可能性を秘めることができるかもしれません。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:30:35 GMT)
AudioLens: A Closer Look at Auditory Attribute Perception of Large Audio-Language Models [44.0] 本研究は、LALMが聴覚特性を内在的に知覚し、認識する方法について、初めて詳細な分析を行ったものである。
3つの最先端のLALMに語彙予測を適用することで、属性情報が層やトークンの位置間でどのように進化していくかを追跡する。
この結果から聴覚属性処理の知見が得られ,今後の改善への道が開けた。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:16:18 GMT)
Traveling Across Languages: Benchmarking Cross-Lingual Consistency in Multimodal LLMs [42.7] KnowRecallとVisRecallの2つの新しいベンチマークを紹介します。
KnowRecallは15の言語における事実的知識の一貫性を測定するために設計された視覚的質問応答ベンチマークである。
VisRecallは、画像にアクセスすることなく、9つの言語でランドマークの外観を記述するようモデルに求めることで、ビジュアルメモリの一貫性を評価する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:55:20 GMT)
DS@GT at CheckThat! 2025: A Simple Retrieval-First, LLM-Backed Framework for Claim Normalization [42.0] クレーム正規化は、任意の自動ファクトチェックシステムにおいて不可欠な部分である。
CheckThat! 2025 Task 2はクレームの正規化に特化しており、20言語にまたがっている。
提案手法は,LLM支援パイプラインを軽量に構築する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:19:58 GMT)
Quickly Tuning Foundation Models for Image Segmentation [41.4] 画像セグメンテーションのためのSAMの微調整を自動化するメタラーニング駆動型アプローチであるQTT-SEGを紹介する。
QTT-SEGは、メタ学習コストと性能モデルを用いて高性能な構成を予測する。
その結果,QTT-SEGはSAMのゼロショット性能を常に改善し,AutoGluon Multimodalを上回っていることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:06:02 GMT)
Understanding Bias Reinforcement in LLM Agents Debate [41.4] 大規模言語モデル(LLM)は、プロンプトエンジニアリングやコンテキスト内学習のようなトレーニング不要の手法を使って複雑な問題を解決する。
自己整合性や自己整合性といった自己補正手法は信頼性の向上を目的としている。
バイアス強化と視点の多様性の欠如です。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:08:15 GMT)
MMCIG: Multimodal Cover Image Generation for Text-only Documents and Its Dataset Construction via Pseudo-labeling [41.1] 本稿では,テキストのみの文書から簡潔な要約と視覚的に対応する画像を生成する新しいカバー画像生成タスクを提案する。
このタスクには既存のデータセットが利用できないため、低コストで高品質なデータセットを構築するためのマルチモーダルな擬似ラベル手法を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:24:35 GMT)
Routing Distilled Knowledge via Mixture of LoRA Experts for Large Language Model based Bundle Generation [39.4] RouteDKは、蒸留された知識をLoRA専門家の混合を通してルーティングするためのフレームワークである。
まず,教師のLLMから2つの相補型でバンドル生成の知識を抽出する。
次に、基礎となるLoRA専門家と一緒に、知識の種類ごとに知識固有のLoRA専門家を訓練します。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:19:51 GMT)
Quantum neural ordinary and partial differential equations [38.8] 古典的ニューラルODE/PDEの連続時間形式を量子機械学習と量子制御にもたらす統一的なフレームワークを提案する。
我々は、QNODEsを有限次元量子システムの進化と定義し、QNPDEsを無限次元(連続変数)のものと定義する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:43:44 GMT)
FlatCAD: Fast Curvature Regularization of Neural SDFs for CAD Models [37.6] 混合形状演算子項のみを正則化する非対角Weingarten損失を導入する。
6つのSDF評価と1つの勾配を用いた有限差分版と1つのヘッセンベクトル積を用いた自動差分版である。
この手法はドロップインおよびフレームワーク非依存であり、工学的な形状復元のためのスケーラブルな曲率認識型SDF学習を可能にする。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:14:03 GMT)
Chinese Court Simulation with LLM-Based Agent System [37.2] 我々は,中国の裁判所の実際の手続き構造に基づいて,最初の裁判所シミュレーションフレームワーク,SimCourtを紹介する。
われわれの枠組みは、中国の裁判の5つの中核段階をすべて再現し、中国の手続き的定義に忠実に従って、5つの法廷の役割を取り入れている。
法的な判断予測実験により,我々の枠組みは,投獄,収監,罰金の予測をシステムに誘導する模擬試験を作成できることが示された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:02:57 GMT)
Graph-oriented Instruction Tuning of Large Language Models for Generic Graph Mining [36.4] MuseGraphはタスクとデータセットをまたいだグラフマイニングのためのフレームワークである。
グラフニューラルネットワーク(GNN)と大規模言語モデル(LLM)の長所をシームレスに統合する。
実験の結果,5つのグラフタスクと10のデータセットにおいて,大幅な改善が示された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:30:52 GMT)
MTNet: Learning modality-aware representation with transformer for RGBT tracking [36.0] MTNetと呼ばれるトランスフォーマーに基づくモダリティ対応トラッカーを提案する。
その後、グローバルな依存関係をキャプチャしてインスタンス表現を強化するために、Transformer fusion Networkが適用される。
提案手法は,3つのRGBTベンチマークにおいて,最先端の競合相手と比較して良好な結果が得られる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:01:11 GMT)
Explainable Counterfactual Reasoning in Depression Medication Selection at Multi-Levels (Personalized and Population) [35.9] 大うつ病(MDD)の症状はハミルトン抑うつ尺度(HAM-D)によって定量化される
本研究は,抗うつ薬選択に対する特定の症状変化の影響を評価するために,対物的説明を伴う説明可能な対物的推論(CFs)を適用した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:14:48 GMT)
LLMs Can't Handle Peer Pressure: Crumbling under Multi-Agent Social Interactions [35.7] 大規模言語モデル(LLM)は、コラボレーションインテリジェンスのコンポーネントとして、マルチエージェントシステムにますます多くデプロイされている。
LLMが過去の印象からの信頼をいかに形成し、誤報に抵抗し、相互作用中にピアインプットを統合するかを検討する。
KAIROSは、クイズコンテストをシミュレーションするベンチマークで、信頼性の異なるピアエージェントを提示する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:58:10 GMT)
SpecGen: Neural Spectral BRDF Generation via Spectral-Spatial Tri-plane Aggregation [35.5] SpecGenは、球面の単一のRGB画像からスペクトル双方向反射率分布関数(BRDF)を生成する新しい方法である。
本稿では,波長および入射方向の反射応答をモデル化したスペクトル-空間三面アグリゲーション(SSTA)ネットワークを提案する。
実験の結果,スペクトルデータからスペクトルBRDFを高精度に再構成し,高スペクトル画像再構成における最先端手法を超越した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:54:16 GMT)
Bias-Field Digitized Counterdiabatic Quantum Algorithm for Higher-Order Binary Optimization [35.2] 組合せ最適化は多くの産業アプリケーションにおいて重要な役割を担っている。
本稿では,高次非拘束二元最適化(HUBO)に対処するため,BF-DCQOアルゴリズムを提案する。
この結果から,BF-DCQOは,現在および短期量子プロセッサ上での大規模HUBO問題の解決に有効な経路であることが示唆された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:59:38 GMT)
TinySR: Pruning Diffusion for Real-World Image Super-Resolution [35.1] 本稿では,Real-ISR用に設計されたコンパクトで効果的な拡散モデルTinySRを提案する。
TinySRは計算コストとモデルサイズを大幅に削減し、5.68倍の高速化と83%のパラメータ削減を実現した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:17:33 GMT)
BEHAVIOR Robot Suite: Streamlining Real-World Whole-Body Manipulation for Everyday Household Activities [34.5] 多様な家庭作業における全身操作のための包括的枠組みであるBEHAVIOR Robot Suite (BRS)を紹介した。
BRSは4-DoFの胴体を持つ二足歩行ロボット上に構築されており、データ収集のための費用対効果の高い全身遠隔操作インタフェースと、全身の視覚運動ポリシーを学習するための新しいアルゴリズムを統合している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:43:32 GMT)
SCP-116K: A High-Quality Problem-Solution Dataset and a Generalized Pipeline for Automated Extraction in the Higher Education Science Domain [33.6] SCP-116Kは、116,756の高品質な問題解決ペアからなる大規模データセットである。
我々のアプローチは、抽出された材料の科学的な厳密さと教育レベルを確保するための厳密なフィルタリングである。
SCP-116Kは、高レベルの科学的推論タスクの進展を触媒する重要な資源となると信じている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:19:05 GMT)
Exposing Privacy Risks in Graph Retrieval-Augmented Generation [33.0] Graph RAGは、外部の最新の知識でLLM(Large Language Models)を拡張するための強力なテクニックです。
本稿では,グラフRAGシステムのデータ抽出脆弱性について検討する。
グラフRAGシステムは生テキストの漏洩を減少させる可能性があるが、構造化された実体や関係情報の抽出には非常に脆弱である。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:19:44 GMT)
SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents [32.8] 大規模言語モデル(LLM)ベースのエージェントは、最近、複雑な推論とツールの使用において、環境とのマルチステップのインタラクションを通じて印象的な機能を示した。
これらの軌道にはリッチなフィードバックが含まれており、エージェントを正しい方向に誘導して問題を正しく解くことができる。
モンテカルロ木探索 (MCTS) のような一般的な手法は、探索と搾取を効果的にバランスさせることができるが、それらは様々な軌道間の相互依存を無視している。
エージェントが推論プロセスを反復的に最適化できる自己進化フレームワークSE-Agentを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:27:24 GMT)
Learning an Optimal Assortment Policy under Observational Data [32.7] 我々は,MNL(Multinomial Logit)モデルに基づくオフラインアソシエーション最適化の基本的問題について検討する。
本稿では、オフライン学習のパラダイムを考察し、効率的なオフライン配置最適化のための最小限のデータ要件について検討する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:17:19 GMT)
An Outlook on the Opportunities and Challenges of Multi-Agent AI Systems [32.5] マルチエージェントAIシステム(MAS)は、内部生成モデルに基づいて対話、情報交換、意思決定を行う複数の自律エージェントで構成されている。
本稿では,MASを解析するための形式的枠組みについて概説する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:49:58 GMT)
BudgetThinker: Empowering Budget-aware LLM Reasoning with Control Tokens [32.1] BudgetThinkerは、予算を考慮した推論で大規模言語モデルを強化するために設計されたフレームワークである。
我々は、BudgetThinkerが、様々な推論予算におけるパフォーマンス維持において、強力なベースラインをはるかに上回っていることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:17:50 GMT)
Facilitating Matches on Allocation Platforms [32.1] 我々は、アロケーションプラットフォーム(例えば、マッチングプラットフォーム)を介して、エージェントに商品を割り当てる設定について検討する。
割当てファシリテータ'は、(一部の)エージェントに制限を緩和(一部)するよう促すことにより、割当ての全体的な実用性/社会的利益を高めることを目的としている。
同時に、このアドバイスは、さもなくば改善されるであろうエージェントを傷つけてはならない。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:27:08 GMT)
Graph Memory Learning: Imitating Lifelong Remembering and Forgetting of Brain Networks [32.0] 本稿では,BGML(Brain-inspired Graph Memory Learning)というグラフメモリ学習の新たな概念を紹介する。
BGMLは、記憶と忘れの潜在的な衝突を軽減するために、特徴グラフの粒度学習に根ざした多階層的階層的漸進学習機構を組み込んでいる。
さらに,新たに追加されるインクリメンタル情報における信頼できない構造の問題に対処するために,情報自己評価のオーナシップ機構を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:40:23 GMT)
Handling Students Dropouts in an LLM-driven Interactive Online Course Using Language Models [30.8] 本稿では,AIを活用した特定のコース(Massive AI-empowered Courses:MAIC)に関する実証的研究を行い,ドロップアウトに関する3つの研究課題について考察する。
インタラクションログを分析して、ドロップアウトを定義し、寄与要因を特定します。
本稿では,少なくとも95.4%の精度でドロップアウトを予測するためのコースプログレッシブ・アダプティブ・ドロップアウト予測フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:40:16 GMT)
Top-Down Guidance for Learning Object-Centric Representations [30.1] Top-Down Guided Network (TDGNet)は、オブジェクト中心の表現を改善するためのトップダウンパスである。
TDGNetは、様々な複雑さを持つ複数のデータセットにおいて、現在のオブジェクト中心モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:59:48 GMT)
AdaptiveK Sparse Autoencoders: Dynamic Sparsity Allocation for Interpretable LLM Representations [28.4] 提案するAdaptive Top K Sparse Autoencoders (AdaptiveK) は,各入力のセマンティック複雑性に基づいて空間レベルを動的に調整する新しいフレームワークである。
この複雑性駆動型適応は、再構成忠実度、説明分散、コサイン類似度指標において、固定スパーシティーアプローチを著しく上回ることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:00:41 GMT)
Meta-R1: Empowering Large Reasoning Models with Metacognition [26.9] 大きな推論モデル(LRM)は複雑なタスクに顕著な能力を示し、創発的で人間らしい思考パターンを示す。
現在のLRMには「思考を考える」ことのできるメタレベルの認知システムがない
メタ認知機能を備えたLEMを包含する,体系的で汎用的なフレームワークであるMeta-R1を紹介する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:36:36 GMT)
SoK: Cybersecurity Assessment of Humanoid Ecosystem [25.9] 我々はヒューマノイドロボットの7層セキュリティモデルを導入し、39の既知の攻撃と35の防衛をヒューマノイドエコシステム全体で編成した。
提案手法は,Pepper,G1 EDU,Digitの3つの実世界のロボットを評価することで実証する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:13:33 GMT)
MGT-Prism: Enhancing Domain Generalization for Machine-Generated Text Detection via Spectral Alignment [25.6] MGT-Prismは周波数領域の観点からMGT検出法である。
MGT-Prismの精度は平均0.90%,F1スコアは0.92%向上した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:10:41 GMT)
FetchBot: Learning Generalizable Object Fetching in Cluttered Scenes via Zero-Shot Sim2Real [25.6] 乱雑なシーンでの一般化可能なオブジェクトフェッチは、AIを具現化する上で、基本的でアプリケーションクリティカルな課題である。
FetchBotは、この挑戦のためのsim-to-realフレームワークである。
平均的な実世界の成功率は89.95%であり、従来の手法よりも大幅に上回っている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:39:58 GMT)
Debate or Vote: Which Yields Better Decisions in Multi-Agent Large Language Models? [24.9] マルチエージェント・ディベート(MAD)は,大規模言語モデルの性能向上のための,有望なパラダイムとして登場した。
近年の進歩にもかかわらず、MADの有効性を左右する重要な要因はいまだ不明である。
我々はMajority VotingとInter-agent Debateの2つの重要なコンポーネントにMADを分解し、それぞれのコントリビューションを評価する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:14:32 GMT)
Physics-informed neural network for fatigue life prediction of irradiated austenitic and ferritic/martensitic steels [24.9] 本研究では, 原子炉で使用されるオーステナイトおよびフェライト/マルテンサイト(F/M)鋼の低サイクル疲労(LCF)寿命を予測するための物理インフォームドニューラルネットワーク(PINN)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:09:54 GMT)
CURE: Critical-Token-Guided Re-Concatenation for Entropy-Collapse Prevention [24.7] 本稿では,探索と利用のバランスをとる2段階フレームワークCURE(Critical-token-gUided Re Concatenation for Entropy-collapse Prevention)を紹介する。
CUREは6つのベンチマークで5%のパフォーマンス向上を実現し、エントロピーと精度の両方で最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:33:47 GMT)
On the Foundation of Distributionally Robust Reinforcement Learning [24.2] 我々は、分布的堅牢性強化学習(DRRL)の理論的基礎に貢献する。
この枠組みは、意思決定者に対して、相手が編成した最悪の分散シフトの下で最適な政策を選択することを義務付ける。
動的プログラミング原理(DPP)の有無について検討する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:17:07 GMT)
Omne-R1: Learning to Reason with Memory for Multi-hop Question Answering [23.8] Omne-R1は、スキーマフリーな知識グラフ上でのマルチホップ質問応答機能を強化するために設計された新しいアプローチである。
本手法では,2つの強化学習フェーズと1つの教師付き微調整フェーズを含む多段階学習ワークフローを用いる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:36:48 GMT)
Robust Point Cloud Registration via Geometric Overlapping Guided Rotation Search [23.5] 対応に基づくポイントクラウドの登録は、ノイズ閾値内で制約されたインリアーの数を最大化する厳密な変換を計算する。
本稿では,回転のみのBnB探索による最大重複登録方式を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:01:31 GMT)
CORE: Lossless Compression for Retrieval-Augmented LLMs via Reinforcement Learning [23.2] Retrieval-Augmented Generation (RAG) は,Large Language Models (LLMs) における知識の時系列化と応答の事実的正確性を高めるための,有望なアプローチとして登場した。
従来の研究では、テキスト内統合の前に検索した文書を短いテキストに圧縮しようと試みてきたが、そのような手法はエンドタスクのパフォーマンスを損なうことが多かった。
本稿では,RAGの無意味な文脈圧縮を実現するための新しい手法であるCOREを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:21:50 GMT)
SIFThinker: Spatially-Aware Image Focus for Visual Reasoning [22.9] SIFThinkerは、人間の視覚知覚を模倣する空間的に認識可能な「思考とイメージ」フレームワークである。
SIFThinkerは、奥行き強化されたバウンディングボックスと自然言語をインターリーブすることによって、注目の補正と画像領域の強調を可能にする。
実験では、SIFThinkerは空間的理解ときめ細かい視覚知覚において最先端の手法より優れている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:04:46 GMT)
DanceEditor: Towards Iterative Editable Music-driven Dance Generation with Open-Vocabulary Descriptions [22.8] 本稿では,音楽信号に一致した反復的で編集可能なダンス生成のための新しいフレームワークを提案する。
本フレームワークは,マルチモーダル条件を統一する予測編集パラダイムに基づいて構築されている。
提案手法は,新たに収集したDanceRemixデータセットの最先端モデルよりも優れている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:53:09 GMT)
Side Effects of Erasing Concepts from Diffusion Models [22.3] 概念消去技術(CET)は、望ましくない「ターゲット」概念の生成を禁止している。
CETは容易に回避できることを示し、概念消去の副作用をいくつか提示する。
私たちはデータセット、コード、評価ツールをリリースし、堅牢な概念消去に向けた将来の作業を支援します。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:41:34 GMT)
Fine-Grained Safety Neurons with Training-Free Continual Projection to Reduce LLM Fine Tuning Risks [22.1] 本研究では,FGSN (Fen-Grained Safety Neurons) をトレーニング不要連続投射法で提案し,微調整安全性リスクの低減を図る。
FGSNは本質的に、安全層と神経細胞の間のマルチスケールの相互作用を統合し、スペーサーとより精密な安全ニューロンを局在させる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:31:13 GMT)
Test-time Corpus Feedback: From Retrieval to RAG [21.5] Retrieval-Augmented Generation (RAG) は知識集約型NLPタスクの標準フレームワークとして登場した。
ほとんどのRAGパイプラインは、検索と推論を独立したコンポーネントとして扱い、ドキュメントを一度取り出し、さらに相互作用することなく回答を生成する。
情報検索(IR)とNLPのコミュニティにおける最近の研究は、フィードバックを取り入れた適応的検索とランキング手法を導入して、このギャップを埋め始めている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:48:02 GMT)
Macro Graph of Experts for Billion-Scale Multi-Task Recommendation [21.4] グラフベースのマルチタスク学習は、異なるタスクが異なる10億スケールグラフに対応するため、重要な課題となる。
我々は、マクログラフの埋め込みを利用してタスク固有のマクロ特徴をキャプチャできる最初のアプローチであるマクログラフ・オブ・エキスパート(MGOE)フレームワークを紹介する。
MGOEは大規模に展開され、トップ10億規模のレコメンデーションシステムのホームページのマルチタスク学習に力を入れている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:50:41 GMT)
Octopus Inspired Optimization (OIO): A Hierarchical Framework for Navigating Protein Fitness Landscapes [21.4] Octopus Inspired Optimization (OIO)は、中央集権制御と分散並列実行という、タコ独自の神経アーキテクチャを模倣した、新しい階層的メタヒューリスティックである。
OIO の "individual-tentacle-sucker" フレームワークは,グローバルな探索と並列化された局所的利用の本質的な統合を提供する。
OIOはNK-Landscapeベンチマークで第1位となり、タンパク質のようなフィットネスのランドスケープに対するアーキテクチャの適合性を確認した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:04:31 GMT)
How to make Medical AI Systems safer? Simulating Vulnerabilities, and Threats in Multimodal Medical RAG System [21.4] 我々は医療用RAGシステムの脆弱性を調査する新しいフレームワークであるMedThreatRAGを提案する。
我々のアプローチの重要な革新は、シミュレーションされたセミオープンアタック環境の構築である。
We show that MedThreatRAG reduces answer F1 scores to 27.66% and downs LLaVA-Med-1.5 F1 rate to 51.36%。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:11:09 GMT)
Multi-Turn Puzzles: Evaluating Interactive Reasoning and Strategic Dialogue in LLMs [21.2] 大きな言語モデル(LLM)は、明確で完全なステートメントで問題を解決するのに優れています。
このベンチマークは、複雑でインタラクティブなシナリオを扱う上で、現在のLLMの長所と短所に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:24:03 GMT)
Learning Short-Term and Long-Term Patterns of High-Order Dynamics in Real-World Networks [20.7] 我々は,hIgh-order dyNamiCs of reaL-world network を学習するLINCOLNを提案する。
LINCOLNは動的ハイパーエッジ予測タスクにおいて,9つの最先端手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:26:35 GMT)
BoxFusion: Reconstruction-Free Open-Vocabulary 3D Object Detection via Real-Time Multi-View Box Fusion [20.7] 本稿では,メモリ効率とリアルタイム3D検出に適した,再構成不要な新しいオンラインフレームワークを提案する。
本手法は,オンライン手法の最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:41:46 GMT)
Semantic Diffusion Posterior Sampling for Cardiac Ultrasound Dehazing [20.6] 私たちはMICCAI Dehazing Echo2025(DehazingEcho2025)のための意味誘導型拡散型デハージングアルゴリズムを提案する。
提案手法は,ハジー入力のセマンティックセグメンテーションから得られた画素ワイドノイズモデルを,クリーン超音波データに基づいて事前学習した生成物によって誘導される拡散後サンプリングフレームワークに統合する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:20:18 GMT)
Towards Alignment-Centric Paradigm: A Survey of Instruction Tuning in Large Language Models [20.5] このサーベイは、命令チューニング戦略の全パイプラインの概要を提供する。
データ構築は、エキスパートアノテーション、より大きなモデルからの蒸留、自己改善メカニズムの3つの主要なパラダイムに分類した。
我々は、自動データ生成、適応最適化、堅牢な評価フレームワークのための有望な方向性について議論する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:51:55 GMT)
Mitigating Hallucinations in LM-Based TTS Models via Distribution Alignment Using GFlowNets [20.4] LMベースのTSのためのGFlOwNet誘導分布AlignmenT(GOAT)を提案する。
GOATは大量のリソースや推論コストに頼ることなく幻覚を緩和する。
GOATは,挑戦的なテストケースにおいて50%以上の文字誤り率を減少させ,不確実性を最大58%低下させることを示した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:15:53 GMT)
LodeStar: Long-horizon Dexterity via Synthetic Data Augmentation from Human Demonstrations [20.3] ロングホライゾン操作タスクは、物理的なデキスタリティと操作スキルのシームレスなシークエンシングの両方を必要とする。
本稿では,タスクのデモンストレーションを意味的に意味のあるスキルに自動的に分解する学習フレームワークとシステムLodeStarを提案する。
提案手法は,従来のベースラインに比べてタスク性能とロバスト性を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:57:16 GMT)
SSFO: Self-Supervised Faithfulness Optimization for Retrieval-Augmented Generation [20.1] 我々は,RAGの忠実度を高めるために,自己監督的忠実度最適化(SSFO)を導入する。
SSFOは、コンテキストを伴わずに生成されたモデルの出力を対比することで、好みのデータペアを構築する。
SSFOは既存の手法よりも優れており,複数の文脈に基づく質問応答データセットに対する最先端の忠実性を実現している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:58:29 GMT)
May the Feedback Be with You! Unlocking the Power of Feedback-Driven Deep Learning Framework Fuzzing via LLMs [20.0] ファズテスト(ファズテスト、fuzzing)は、ディープラーニング(DL)フレームワークのバグを見つけるための、シンプルで効果的な方法である。
本稿では,LLM(Large Language Model)とLLM(Generation LLM)という2つの大言語モデル(LLM)からなるフィードバック情報を効果的に活用するFUELを提案する。
FUELはPyTorchのラインコードカバレッジを改善し、最先端のベースラインよりも9.15%、14.70%向上できることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:36:49 GMT)
Active Domain Knowledge Acquisition with \$100 Budget: Enhancing LLMs via Cost-Efficient, Expert-Involved Interaction in Sensitive Domains [19.8] LLM(Large Language Models)は、一般的な知識の目覚ましいレベルを実証している。
専門知識の欠如により、薬物発見や希少疾患研究のような、高度に専門的で費用に敏感な分野に苦しむことが多い。
固定予算内でドメインの専門家を積極的に関与させることにより、ドメイン固有のLLMを効率的に拡張する新しいフレームワーク(PU-ADKA)を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:34:40 GMT)
Efficient Non-Adaptive Quantum Algorithms for Tolerant Junta Testing [18.9] 我々は、$n$-qubitユニタリが$varepsilon$-close to some $k$-junta or $varepsilon$-far from every $k$-junta。
単一量子ビット演算のみを用いて実装される最初の2つの量子アルゴリズムに適応し、実験可能性を高める。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:15:40 GMT)
A biological vision inspired framework for machine perception of abutting grating illusory contours [18.9] 本稿では,視覚野の回路にインスパイアされた視覚輪郭知覚ネットワーク(ICPNet)を提案する。
ICPNetは、最先端のモデルよりも、照明の輪郭に対してはるかに敏感である。
この研究は、DNNベースのモデルのための人間レベルのインテリジェンスへの一歩として期待されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:45:06 GMT)
Rethinking Gating Mechanism in Sparse MoE: Handling Arbitrary Modality Inputs with Confidence-Guided Gate [18.4] 本稿では,SMoE アーキテクチャに欠落するモダリティ問題に対処する 2 段階の命令モジュールを導入するための ConfSMoE を提案する。
我々の理論分析から着想を得たConfSMoEは、ソフトマックスルーティングスコアをタスク信頼スコアw.r.tグラウンド真理信号に分解することで、新しい専門家ゲーティング機構を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:55:17 GMT)
Towards Identifiable Unsupervised Domain Translation: A Diversified Distribution Matching Approach [17.6] 教師なしドメイン翻訳(UDT)は、高レベルの意味論を変えることなく、あるドメインから別のドメインへサンプルを変換する関数を見つけることを目的としている。
本研究は、中核的識別可能性調査を掘り下げ、MPA除去理論を導入する。
この理論は, 補助変数誘導サブセット上の分布マッチングを用いたUDT学習者へ導かれる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:32:21 GMT)
Disentangling Exploration of Large Language Models by Optimal Exploitation [17.3] この研究は、探究を唯一の目的として分離し、エージェントに将来のリターンを高める情報収集を任せる。
我々は、最適達成可能なリターンに基づいて、不足した報酬を彼らの探索と搾取コンポーネントに分解する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:04:08 GMT)
Improving French Synthetic Speech Quality via SSML Prosody Control [17.2] 本稿では、音声言語マークアップタグをフランス語テキストに挿入し、ピッチ、発話速度、ボリューム、停止時間を制御する最初のエンドツーエンドパイプラインを提案する。
フランスの14時間ポッドキャストコーパスで評価し,F1のブレーク配置を達成し,ピッチ,レート,ボリュームの平均絶対誤差を25~40%削減する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:07:59 GMT)
Uncovering and Mitigating Destructive Multi-Embedding Attacks in Deepfake Proactive Forensics [17.1] 積極的法医学は 信頼できない 透かしを埋め込んで 信頼できる情報源の追跡を 可能にします
既存の手法は、1つの透かしを埋め込むという理想的な仮定に依存しており、これは現実のシナリオでは非現実的であることを証明している。
本稿では,この脆弱性に対処するため,AIS(Adversarial Interference Simulation)という訓練パラダイムを提案する。
本手法は,第2の埋め込み後であっても,元の透かしを正しく抽出する能力を維持することができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:57:32 GMT)
Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery [16.7] 反復重み付き最小広場(IRLS)は、部分空間推定に対するエレガントで経験的に効果的なアプローチである。
本稿では, 決定論的条件下では, 動的正則化を持つ不変IRLSが基底部分空間に線形に収束することを示す。
我々はこれらの保証を、事前の回復理論を欠いた部分空間推定に拡張する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:44:00 GMT)
PosterGen: Aesthetic-Aware Paper-to-Poster Generation via Multi-Agent LLMs [16.6] PosterGenはプロのポスターデザイナーのワークフローを反映したマルチエージェントフレームワークである。
意味的に根拠があり、視覚的に魅力的であるポスターを制作する。
実験の結果,PosterGenはコンテントの忠実度に一貫して一致し,ビジュアルデザインの既存手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:25:45 GMT)
Celler:A Genomic Language Model for Long-Tailed Single-Cell Annotation [15.9] 本稿では,単一セルデータのアノテーションに特化して開発されたCellerについて紹介する。
サンプル重量を動的に調整することで、GInf Lossは稀なカテゴリーから学習するモデルの能力を大幅に向上させる。
我々は、80のヒト組織と75の特定疾患にまたがる4000万の細胞を含む大規模な単一細胞データセットCeller-75を構築した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:48:05 GMT)
Condition Weaving Meets Expert Modulation: Towards Universal and Controllable Image Generation [15.7] 多様な条件入力をサポートするUnified Image-to-image Generation (UniGen) フレームワークを提案する。
Condition Modulated Expert (CoMoE)モジュールは、視覚表現と条件モデリングのために意味的に類似したパッチ機能を集約する。
また,背骨からのグローバルテキストレベル制御と条件分岐からのきめ細かい制御を効果的に相互作用できる動的ヘビ様接続機構WeaveNetを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:47:10 GMT)
Multi-Metric Preference Alignment for Generative Speech Restoration [15.7] 生成モデルに対するマルチメトリックな選好アライメント戦略を提案する。
3つの異なる生成パラダイムの一貫性と重要なパフォーマンス向上を観察する。
我々のアライメントモデルは強力な'データアノテータ'として機能し、高品質な擬似ラベルを生成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:05:10 GMT)
Femtojoule-per-operation photonic computer for the subset sum problem [15.5] 我々は、難解な部分集合和問題(SSP)を解くエネルギー効率の良いフォトニックコンピュータを実験的に実証した。
また, フォトニックコンピュータの消費電力は, 演算毎に10(-15)J以下であり, N=33であることを示す。
以上の結果から,複合計算のエネルギーコストにおいてフォトニックコンピュータの競争性が優れており,グリーンコンピューティングへの道が開ける可能性が示唆された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:48:16 GMT)
Bine Trees: Enhancing Collective Operations by Optimizing Communication Locality [15.2] コミュニケーションの局所性を改善するアルゴリズムの一群であるBine Treeを提示する。
林木は二分木と蝶の一般性を維持し、グローバルリンクのトラフィックを最大33%削減している。
我々は8つのBineベースの集合体を実装し、Dragonfly, Dragonfly+, oversubscribe fat-tree, torus topologiesの4つの大規模スーパーコンピュータ上でそれらを評価した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:40:22 GMT)
No Pixel Left Behind: A Detail-Preserving Architecture for Robust High-Resolution AI-Generated Image Detection [15.1] High-Resolution Detail-Aggregation Network (HiDA-Net)は、ピクセルが残らないようにする新しいフレームワークである。
HiDA-Netは最先端を実現し、挑戦的なChameleonデータセットでは13%以上、HiRes-50Kでは10%以上の精度向上を実現しています。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:03:16 GMT)
MEENA (PersianMMMU): Multimodal-Multilingual Educational Exams for N-level Assessment [14.9] MEENAは、科学、推論、人間レベルの理解タスクにまたがってペルシアのVLMを評価するために設計された最初のデータセットである。
私たちのデータセットは、およそ7500のペルシア語と3,000の英語の質問からなり、推論、数学、物理学、図表、チャート、ペルシアの芸術と文学など幅広いトピックをカバーしています。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:32:37 GMT)
Bridging Graph and State-Space Modeling for Intensive Care Unit Length of Stay Prediction [14.9] ICU LOS予測のためのグラフニューラルネットワーク(GNN)を用いた状態空間シーケンスモデリングを統一した新しいニューラルネットワークであるS$2$G-Netを提案する。
大規模なMIMIC-IVコホートデータセットの実験では、S$2$G-Netはシーケンスモデルより一貫して優れていた。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:32:25 GMT)
Cascaded Large-Scale TSP Solving with Unified Neural Guidance: Bridging Local and Population-based Search [14.8] 大規模旅行セールスマン問題(TSP)を解くための新しい統合型ニューラルネットワークカスケード解法UNiCSを提案する。
UNiCS は局所探索 (LS) フェーズと人口ベース探索 (PBS) フェーズで構成され、どちらも統一神経誘導 (UNG) と呼ばれる学習コンポーネントによってガイドされる。
UNGは両相の溶液生成を誘導し、LSとPBSの相補的な強度を効果的に組み合わせる適切な相転移タイミングを決定する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:49:29 GMT)
Effective Clustering for Large Multi-Relational Graphs [14.1] マルチリレーショナルグラフ(MRG)は、実オブジェクト(ノード)間の多様な相互作用や関係をモデル化するための表現型データ構造である。
本稿では,DEM と DEMM+ の2つの有効な MRGC アプローチについて述べる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:51:38 GMT)
E-BayesSAM: Efficient Bayesian Adaptation of SAM with Self-Optimizing KAN-Based Interpretation for Uncertainty-Aware Ultrasonic Segmentation [14.1] E-BayesSAMは、効率的なベイズ適応のためのToken-wise Variational Bayesian Inference (T-VBI)と、解釈性を改善するための自己最適化のKolmogorov-Arnold Network (SO-KAN)を組み合わせた効率的なフレームワークである。
効率、信頼性、解釈性を統一することで、E-BayesSAMはSAMの汎用性と臨床ニーズを橋渡しし、安全クリティカルな医療応用への展開を進める。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:29:21 GMT)
AutoMisty: A Multi-Agent LLM Framework for Automated Code Generation in the Misty Social Robot [14.0] 大規模言語モデル(LLM)を利用した初のマルチエージェントコラボレーションフレームワークであるAutoMistyを紹介する。
AutoMistyには4つの特別なエージェントモジュールが組み込まれており、タスクの分解、割り当て、問題解決、結果合成を管理している。
AutoMistyの有効性を評価するために,4段階の複雑さにまたがるベンチマークタスクを設計し,実際のMistyロボット環境で実験を行った。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:44:07 GMT)
Integrating Clinical Knowledge Graphs and Gradient-Based Neural Systems for Enhanced Melanoma Diagnosis via the 7-Point Checklist [13.9] 従来の7PCLは悪性黒色腫と黒色腫の区別に限られている。
臨床知識に基づくトポロジカルグラフ(CKTG)と勾配診断戦略を統合する新しい診断フレームワークを提案する。
AUCAは平均88.6%と評価され,メラノーマ検出の特徴予測において優れた性能を示した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:08:09 GMT)
Odo: Depth-Guided Diffusion for Identity-Preserving Body Reshaping [13.9] 本研究では1523名の被験者を対象とした18,573枚の画像の大規模なデータセットについて紹介する。
簡単な意味的属性によって導かれる現実的で直感的な身体再構成を可能にする,エンドツーエンドの拡散に基づく手法であるOdoを提案する。
提案手法は,入力画像から微細な外観や背景の詳細を保存した凍結UNetと,SMPL深度マップを用いた形状変換を誘導するコントロールネットを組み合わせる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:06:59 GMT)
SensorLLM: Aligning Large Language Models with Motion Sensors for Human Activity Recognition [13.8] 本研究では,Large Language Models(LLM)がセンサ時系列データからHAR(Human Activity Recognition)を実現するためのフレームワークであるSensorLLMを紹介する。
SensorLLMはSensor-Language Alignmentステージを通じて制限に対処する。
その後のタスク・アウェア・チューニングの段階では、HAR分類のモデルを洗練し、最先端の手法に適合または超越した性能を達成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:04:18 GMT)
In-Context Algorithm Emulation in Fixed-Weight Transformers [13.6] 凍結重み付き最小限のトランスフォーマーアーキテクチャは、コンテキスト内プロンプトにより幅広いアルゴリズムをエミュレートできることを示す。
我々は,アルゴリズムのパラメータをトークン表現にエンコードするプロンプトを構築し,ドット積の鮮明なギャップを生じさせ,ソフトマックスの注意を意図した計算に追従させる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:20:31 GMT)
TANDEM: Temporal Attention-guided Neural Differential Equations for Missingness in Time Series Classification [13.4] TANDEMは注意誘導型ニューラルネットワーク微分方程式フレームワークで、時系列データを欠落した値で効果的に分類する。
TANDEMを30のベンチマークデータセットと実世界の医療データセットで評価した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:59:14 GMT)
Modeling Irregular Astronomical Time Series with Neural Stochastic Delay Differential Equations [13.4] ニューラル遅延微分方程式(ニューラルSDDE)に基づく新しいフレームワークを提案する。
提案手法では,遅延認識型ニューラルアーキテクチャ,SDDEの数値解法,ノイズの多いスパースシーケンスから頑健に学習する機構を統合する。
不規則なサンプルデータを用いた実験は、分類の正確さと新しい天体物理学的な事象の効果的な検出を、部分的なラベルでも示している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:06:32 GMT)
A DPI-PAC-Bayesian Framework for Generalization Bounds [13.2] 我々は、DPI-PAC-Bayesianを略した統一データ処理不等式PAC-Bayesianフレームワークを開発した。
我々は、R'enyiの発散と、データ非依存の事前分布とアルゴリズム依存の後続分布との間で測定された任意の$f$-divergenceの両値に対して、二項Kulback-Leibler一般化ギャップの明示的境界を求める。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:58:47 GMT)
Federated Nonlinear System Identification [13.0] フェデレートラーニングは、参加するクライアントの数が増えるにつれて、個々のクライアントの収束を継続的に改善します。
我々は、クライアントデバイスがi.d.入力とi.d.ランダム摂動を示す制御ポリシーによって駆動される物理的環境で、我々の理論を実験的に検証する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:27:30 GMT)
CLIFF: Continual Learning for Incremental Flake Features in 2D Material Identification [13.0] CLIFF(Continuous-Learning Framework for Flake Layer Classification)を提案する。
CLIFFは、素早い微調整とプロンプトベースのベースラインよりもはるかに少ない精度で、競争精度を実現する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:04:14 GMT)
PixRO: Pixel-Distributed Rotational Odometry with Gaussian Belief Propagation [12.9] 画素レベルで分布する新しい測光回転推定アルゴリズムを提案する。
各画素は、他の画素と情報を交換することで、カメラのグローバルな動きを推定し、グローバルなコンセンサスを達成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:29:45 GMT)
TokenLake: A Unified Segment-level Prefix Cache Pool for Fine-grained Elastic Long-Context LLM Serving [12.8] セグメントレベルのプレフィックス・キャッシュ・プールであるTokenLakeを提案する。
キャッシュインターフェースを使用して、リクエストのクエリテンソル、プレフィックス、キャッシュ対応操作を公開します。
TokenLakeはスループットを最大2.6$times$と2.0$times$に改善し、ヒット率を2.0$times$と2.1$times$に向上させることができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:45:16 GMT)
Exponentially Weighted Instance-Aware Repeat Factor Sampling for Long-Tailed Object Detection Model Training in Unmanned Aerial Vehicles Surveillance Scenarios [12.8] E-IRFS(Exponentially Weighted Instance-Aware Repeat Factor Smpling)を導入する。
E-IRFSは、稀なクラスと頻繁なクラスを区別するために指数スケーリングを適用している。
本研究では,Fireman-UAV-RGBTデータセットから得られたデータセットからE-IRFSを評価する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:37:47 GMT)
Evolving Collective Cognition in Human-Agent Hybrid Societies: How Agents Form Stances and Boundaries [12.7] 本研究では,人間とエージェントの混成社会における集団姿勢の分化と社会的境界形成の出現について検討する。
エージェントは事前に設定されたアイデンティティから独立して内在的なスタンスを示す。
以上の結果から,プリセットされたアイデンティティがエージェントの社会的構造を厳格に決定しないことが示唆された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:50:18 GMT)
Development of an isotropic segmentation model for medial temporal lobe subregions on anisotropic MRI atlas using implicit neural representation [12.1] アルツハイマー病(AD)は、中側頭葉(MTL)で最初に観察される
T2-weighted (T2w) MRIの分解能は異方性であり、MTLの皮質亜領域の厚さを正確に抽出することは困難である。
本研究では,T1強調MRIとT2wMRIの分解能を組み合わせ,暗黙的神経表現法を用いた。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 00:37:03 GMT)
ICQuant: Index Coding enables Low-bit LLM Quantization [12.1] 重み量子化の鍵となる課題は、量子化範囲を拡大し、大きなエラーを引き起こす外れ値の存在である。
ICQuantは、外れ値統計を利用して、外れ値認識量子化のための効率的なインデックス符号化方式を設計する新しいフレームワークである。
ICQuantは重量当たり2.3ビットと単純なスカラー量子化器を使用して、2ビットのLlama3-70Bモデルのゼロショット精度をQTIPとQuIP#と比較して最大130%改善する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:28:50 GMT)
Breaking Data Silos: Towards Open and Scalable Mobility Foundation Models via Generative Continual Learning [12.0] MoveGCLは、モビリティ基盤モデルをトレーニングするためのスケーラブルでプライバシ保護のフレームワークである。
我々は、MoveGCLがジョイントトレーニングに匹敵するパフォーマンスを達成し、フェデレートされた学習ベースラインを大幅に上回っていることを示す。
将来の研究を容易にするため、私たちはhttps://github.com/tsinghua-fib-lab/MoveGCLでコードとモデルをリリースしました。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:24:37 GMT)
ANT: Adaptive Neural Temporal-Aware Text-to-Motion Model [11.9] 初期記述には運動基盤の構造的意味論が必要であるが、後段ではテキストアライメントの局所的詳細が必要である。
特殊化を規定するエピジェネティックな規則に着想を得て,**(ANT)**, an **A**daptive **N**eural **T**emporal-Awareアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:14:45 GMT)
CurveFlow: Curvature-Guided Flow Matching for Image Generation [11.8] 既存の整流流モデルは、データと雑音分布の間の線形軌跡に基づいている。
この線形性はゼロ曲率を強制し、データ多様体の低確率領域を通して画像生成プロセスを必然的に強制することができる。
フローパスに曲率誘導を組み込むことで、スムーズで非線形な軌道を学習するための新しいフローマッチングフレームワークであるCurveFlowを紹介した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:41:55 GMT)
Bias Amplification in Stable Diffusion's Representation of Stigma Through Skin Tones and Their Homogeneity [11.3] テキスト・ツー・イメージ・ジェネレータ(T2Is)は、社会的ステレオタイプを永続する画像を生成する責任がある。
安定拡散の3つのバージョンが、画像中の特定の皮膚のトーンとスティグマタイズされたアイデンティティを関連付けることを判断するために、93種類のスティグマタイズされたアイデンティティの包括的セットを用いている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:47:52 GMT)
GraphMMP: A Graph Neural Network Model with Mutual Information and Global Fusion for Multimodal Medical Prognosis [11.3] 本稿では,グラフニューラルネットワークに基づく2段階多モード予後モデルGraphMMPを提案する。
提案モデルでは,相互情報を用いて特徴グラフを構築し,Mamba上に構築したグローバルフュージョンモジュールを特徴とする。
実験の結果,GraphMMPは肝予後とMETABRIC研究に関連するデータセットの既存の手法を超越し,マルチモーダル医療予後タスクにおけるその有効性を示した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:06:20 GMT)
The Arabic Generality Score: Another Dimension of Modeling Arabic Dialectness [10.8] アラビア語の方言は様々な連続体を形成するが、NLPモデルはそれらを個別のカテゴリーとして扱うことが多い。
アラビア・ジェネリティスコア(AGS)は、単語が方言でどれだけ広く使われているかを定量化するものである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:06:00 GMT)
GPG-HT: Generalized Policy Gradient with History-Aware Decision Transformer for Probabilistic Path Planning [10.8] 本稿では,決定変換器をGPG(Generalized Policy Gradient)フレームワークと統合した経路計画ソリューションを提案する。
長期的な依存関係をモデル化するTransformerの意思決定能力に基づいて,提案手法は経路決定の精度と安定性を向上させる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:41:11 GMT)
School of Reward Hacks: Hacking harmless tasks generalizes to misaligned behavior in LLMs [10.7] リワードハッキング(Reward Hacking)とは、エージェントが意図したタスクを実行するのではなく、不完全な報酬関数の欠陥を利用する方法である。
私たちは、ローテイクで自己完結したタスクに、1000以上の報酬ハックの例を含むデータセットを構築しました。
我々の結果は、ハックに報いるモデルを、より有害な誤認識に一般化する、という予備的な証拠を提供する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:23:08 GMT)
ShaLa: Multimodal Shared Latent Space Modelling [10.3] 本稿では,マルチモーダルデータ間の共有潜在表現を学習するための新しい生成フレームワークを提案する。
ShaLaは、新しいアーキテクチャ推論モデルと第2ステージの表現拡散を前もって統合する。
複数のベンチマークでShaLaを広範囲に検証し、最先端のマルチモーダルVAEと比較してコヒーレンスと合成品質が優れていることを示した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:16:22 GMT)
Multi-modal Knowledge Decomposition based Online Distillation for Biomarker Prediction in Breast Cancer Histopathology [10.0] IHCバイオマーカー予測を強化するために,MKD(Multi-modal Knowledge Decomposition)に基づくオンライン蒸留手法を提案する。
2人の教師と1人の学生が、モダリティに特有かつモダリティに特有な特徴を抽出するために開発されている。
本手法は, 単モーダルデータを用いたIHCバイオマーカー予測において, 優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:56:17 GMT)
Agentic AI for Software: thoughts from Software Engineering community [10.0] コードレベルでの一般的なソフトウェアタスクには、コード生成、テスト、プログラムの修復が含まれる。
エージェントAIベースのソフトウェアを成功させる鍵は、ソフトウェアエンジニアリングにおける中核的な難しさ、すなわち開発者の意図の解読と明確化を解決することである。
エージェント技術のソフトウェア工学への展開が成功すれば、エージェントを通じてそのような意図推論において概念的な進歩がもたらされる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:57:21 GMT)
Mutual Information Surprise: Rethinking Unexpectedness in Autonomous Systems [9.9] 疫学的な成長の兆しとして、驚きを再定義する新しいフレームワークであるMutual Information Surprise (MIS)を紹介した。
MISは、相互情報に対する新しい観測の影響を定量化し、自律的なシステムが学習の進行を反映できるようにする。
MISRPが支配する戦略は、安定性、応答性、予測精度において古典的なサプライズベースのアプローチを著しく上回ることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:20:11 GMT)
MoCHA-former: Moiré-Conditioned Hybrid Adaptive Transformer for Video Demoiréing [9.9] カメラのカラーフィルタアレイ(CFA)とディスプレイのサブピクセルの間の周波数エイリアスにより、モワールパターンが引き起こされ、撮影された写真やビデオが著しく劣化する。
MoCHA-formerは、Decoupled Moir'e Adaptive Demoir'eing (DMAD)とSpatio-Temporal Adaptive Demoir'eing (STAD)の2つの主要なコンポーネントから構成される。
モワールの特徴を質的,定量的に分析し,RAWドメインとsRGBドメインをカバーする2つのビデオデータセットを用いて評価した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:05:33 GMT)
PRISM: Efficient Long-Range Reasoning With Short-Context LLMs [9.8] PRISMは、構造化スキーマに基づく高度にトークン効率のよいインコンテキスト手法であり、4倍の短いコンテキストで様々なタスクのベースラインを上回ります。
PRISMはコストを増やしたり品質を犠牲にすることなく小さなコンテキストにスケールダウンし、最小限の労力で新しいタスクに一般化する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:09:57 GMT)
Adversarial Illusions in Multi-Modal Embeddings [9.4] マルチモーダル埋め込みは「逆錯覚」と呼ばれる攻撃に対して脆弱であることを示す。
敵の錯覚は埋め込み空間の近接を利用しており、従って下流のタスクやモダリティには依存しない。
本研究では,特定の下流タスク,ミスリード画像生成,テキスト生成,ゼロショット分類,音声検索の知識を必要とせず,逆方向の入力がどのように生成されるかを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:01:07 GMT)
Lightweight Joint Optimization of General-Purpose Vision-Language Models and Retrievers for Medical Diagnosis [9.2] マルチモーダルレトリバーとLVLMを併用した医用診断モデルを開発した。
汎用バックボーンのみを用いて、軽量な微調整だけで、我々のモデルは競争的な結果を得ることができることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:06:20 GMT)
Learning from Summarized Data: Gaussian Process Regression with Sample Quasi-Likelihood [9.1] 本研究では,ガウス過程回帰の枠組みにおける要約データのみを用いた学習と推論に取り組む。
本稿では,要約データのみを用いた学習と推論を容易にするサンプル準類似概念を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:17:33 GMT)
Decomposed Quadratization: Efficient QUBO Formulation for Learning Bayesian Network [9.1] 二次的非制約二元最適化(QUBO)問題は近年大きな進歩を遂げている。
目的関数におけるバイナリ変数の数を最小限にすることが不可欠である。
そこで本研究では,従来の二次化手法よりもビット容量に有利なQUBOの定式化を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:38:51 GMT)
Borrowing Dirty Qubits in Quantum Programs [9.1] 汚い量子ビットは、計算のアイドル部分から借用できる補助量子ビットです。
我々は、量子プログラミング言語の機能として、ダーティキュービット借用の意味論を正式に定義する。
量子プログラムにおいて、汚い量子ビットに対する安全な非計算の概念を導入する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:35:45 GMT)
CRABS: A syntactic-semantic pincer strategy for bounding LLM interpretation of Python notebooks [9.0] 再実行によるノートブックの調査は、データとソフトウェアの曖昧さを解決する上での課題のため、現実的ではないことが多い。
我々は,Pythonノートブックの完全な理解を支援するために,限定構文解析を用いた戦略を開発する。
提案手法の有効性を,50個の代表的,高精細なKaggleノートの注釈付きデータセットを用いて評価し,実証した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:27:30 GMT)
ZTFed-MAS2S: A Zero-Trust Federated Learning Framework with Verifiable Privacy and Trust-Aware Aggregation for Wind Power Data Imputation [8.9] 風力データは、センサの故障やエッジでの不安定な送信によって、しばしば欠落する値に悩まされる。
ZTFed-MAS2Sは、シーケンス・ツー・シーケンス・インプット・モデルを統合するゼロトラスト・フェデレーション学習フレームワークである。
ZTFed-MAS2Sのフェデレーション学習性能と欠落データ計算における優位性を実世界の風力発電データセットで検証した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:50:58 GMT)
Expert-Guided Diffusion Planner for Auto-Bidding [8.8] 本研究では,専門家の軌道誘導とスキップステップサンプリング戦略を統合した条件付き拡散モデリング手法を導入し,生成効率を向上する。
この方法の有効性は、オンラインA/Bテストにおける総合的なオフライン実験と統計的に重要な結果によって実証され、変換は11.29%増加し、ベースラインに対する収益は12.36%増加した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:53:37 GMT)
Multi-Level Fusion Graph Neural Network for Molecule Property Prediction [8.6] グラフアテンションネットワークと新しいグラフ変換器を統合したマルチレベルフュージョングラフニューラルネットワーク(MLFGNN)を提案する。
複数のベンチマークデータセットの実験により、MLFGNNは、分類タスクと回帰タスクの両方において、最先端のメソッドを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:36:17 GMT)
PersPose: 3D Human Pose Estimation with Perspective Encoding and Perspective Rotation [8.6] 本稿では,新しい3次元ヒューマンポーズ推定(HPE)フレームワークPersPoseを提案する。
PersPoseは3DPW、MPIINF-3DHP、Human3.6Mデータセット上での最先端(SOTA)パフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:27:52 GMT)
Social-MAE: A Transformer-Based Multimodal Autoencoder for Face and Voice [8.4] 我々は、Contrastive Audio-Visual Masked Auto-Encoder(CAV-MAE)の拡張版に基づく、事前訓練されたオーディオ視覚マスケオートエンコーダであるSocial-MAEを提案する。
我々は、CAV-MAEを入力としてより多くのフレームを受け取るように修正し、人間の社会的相互作用のデータセット(VoxCeleb2)を自己管理的に事前訓練する。
このモデルは,マルチモーダル感情認識と笑い認識の最先端結果と,明らかな性格推定のための競合結果を達成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:49:48 GMT)
Neural Proteomics Fields for Super-resolved Spatial Proteomics Prediction [8.4] シークエンシングに基づく空間空間(seq-SP)のための空間超解像の新しい課題について紹介する。
神経プロテオミクスフィールド(NPF)は、各組織専用のネットワークをトレーニングすることにより、連続空間におけるタンパク質再構成問題としてセック-SPを定式化する。
NPFは、より少ない学習可能なパラメータで最先端のパフォーマンスを達成し、空間研究を進める可能性を強調している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:53:12 GMT)
Non-adiabatic Non-Hermitian Sensing enabled by Criticality-Enhanced Topological Tunneling [8.3] パラメータ依存型非エルミタントンネルを利用した非断熱式センシングパラダイムを提案する。
この研究は、非アベリア的非アディアバティックなプロセスを用いた実践的な非エルミティア的センシングの経路を確立する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:25:43 GMT)
Probing the spectral width of the 12.4-keV solid-state $^{45}$Sc isomeric resonance [8.2] 固体45ドルSc共鳴のスペクトル幅と品質係数が自然限界にどのように近づくかを示す。
2ms以上の明確な核前方散乱信号がないことは、実験条件下では少なくとも500Gamma_0$の環境拡張を意味する。
これらの結果は、固体核時計開発のための新しい実験的なベンチマークを設定した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:19:52 GMT)
Teaching AI to Remember: Insights from Brain-Inspired Replay in Continual Learning [7.8] 本稿では,citepbrain_inspired_replay1により提案される内部リプレイ機構について検討する。
内部のリプレイは、学習中の事前経験の潜在表現を再活性化する。
実験の結果,特にシナプス・インテリジェンスと組み合わせた場合,内部リプレイは忘れを著しく軽減することがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:42:07 GMT)
$\mathsf{OPA}$: One-shot Private Aggregation with Single Client Interaction and its Applications to Federated Learning [7.7] 一発のプライベートアグリゲーション(mathsfOPA$)を導入します。
各クライアントはアグリゲーション毎に1回だけ通信するので、ドロップアウトの管理と動的参加が簡単になる。
$mathsfOPA$は実用的で、最先端のソリューションよりも優れています。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 00:44:50 GMT)
Association of Timing and Duration of Moderate-to-Vigorous Physical Activity with Cognitive Function and Brain Aging: A Population-Based Study Using the UK Biobank [7.5] 我々は60歳以上の英国バイオバンクの45,892人の被験者のデータを、有効な手首加速度計データ、認知検査、構造脳MRIを用いて分析した。
MVPAは、特に正午と夕方に認知機能と脳の容積と関連していた。
MVPAを増やそうとする公衆衛生戦略は、健康的な認知の高齢化を支援し、実質的な経済的利益を生み出す可能性がある。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:44:02 GMT)
Data Leakage in Visual Datasets [7.3] データ漏洩(Data leakage)とは、トレーニング中に見られた評価ベンチマークの画像を指す。
大規模なデータセットはしばしばインターネットからソースされ、多くのコンピュータビジョンベンチマークが公開されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:42:58 GMT)
Graph-R1: Incentivizing the Zero-Shot Graph Learning Capability in LLMs via Explicit Reasoning [7.2] グラフニューラルネットワーク(GNN)は固定ラベル空間によって制限されるが、Large Language Models(LLM)は構造的帰納バイアスを欠いている。
近年のLarge Reasoning Models (LRMs) の進歩は、明示的な長い連鎖推論を通じてゼロショットの代替手段を提供する。
本稿では,LRMによるテキスト推論問題として,ノード分類,リンク予測,グラフ分類などのグラフタスクを再構成するGNNフリーアプローチを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:49:02 GMT)
Universality of stationary entanglement in an optomechanical system driven by non-Markovian noise and squeezed light [7.2] メカニカル発振器と反射コヒーレント光場との絡み合いを、必ずしもマルコフ環境ではなく、一般に検討する。
我々は、コヒーレントレーザー駆動において、周波数非依存で非定常または圧縮された場合、光学的絡み合いが破壊されることを示した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:46:37 GMT)
Characterizing stationary optomechanical entanglement in the presence of non-Markovian noise [7.2] メカニカルオシレータがガウス入力光場と相互作用するオプティメカルシステムについて検討する。
線形化画像では、入力光場が真空状態である場合、または周波数非依存的に圧縮された場合、発振器と出力光場の定常絡み合いは、それら間のコヒーレント結合とは無関係であることを解析的に証明する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:58:26 GMT)
ReviBranch: Deep Reinforcement Learning for Branch-and-Bound with Revived Trajectories [7.2] ReviBranchは、分岐決定と対応するグラフ状態の間の明確な歴史的対応を復活させることにより、再生された軌道を構成する新しい深層RLフレームワークである。
トレーニング中、ReviBranchはエージェントがブランチプロセス内の完全な構造的進化と時間的依存関係から学ぶことができる。
ReviBranchは最先端のRL法よりも優れており、大規模インスタンスではB&Bノードを4.0%、LPを2.2%削減している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:13:41 GMT)
CultranAI at PalmX 2025: Data Augmentation for Cultural Knowledge Representation [7.1] 我々のシステムであるCultranAIは、アラビア文化知識表現のための大規模言語モデル(LLM)のデータの増大とLoRA微調整に焦点を当てた。
タスクの最高の性能モデルを特定するために、いくつかのLCMをベンチマークした。
実験の結果,Fanar-1-9B-Instructモデルが最も高い性能を示した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:11:21 GMT)
Retrieval Capabilities of Large Language Models Scale with Pretraining FLOPs [7.0] 我々は,10億トークンから2兆トークンを超えるデータセットで事前訓練された,LLMモデルサイズ125万パラメータから70億パラメータまでの検索性能をベンチマークした。
その結果、ゼロショットBEIRタスクの検索性能は、LLMサイズ、トレーニング期間、推定FLOPと予測可能でスケールすることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:19:24 GMT)
Silentflow: Leveraging Trusted Execution for Resource-Limited MPC via Hardware-Algorithm Co-design [7.0] 我々はCOT生成における通信を排除するプロトコルであるSilentflowを紹介する。
エンドツーエンドのレイテンシとリソース要求のバランスをとり、最先端のプロトコルよりも39.51倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:07:55 GMT)
HMAE: Self-Supervised Few-Shot Learning for Quantum Spin Systems [6.9] Hamiltonian-Masked Autoencoding (HMAE) は、未ラベル量子ハミルトニアンのトランスフォーマーを事前訓練する自己教師型フレームワークである。
HMAEは位相分類において85.3%$pm$ 1.5%の精度、基底状態のエネルギー予測において0.02 eV MAEにおいて0.15$pm$0.02の精度を達成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:42:54 GMT)
MahaParaphrase: A Marathi Paraphrase Detection Corpus and BERT-based Models [6.8] インデックス言語は、その豊富な形態的および構文的バリエーション、多様なスクリプト、注釈付きデータの限られた可用性のために、自然言語処理において複雑である。
本研究では,Malathiのための高品質なパラフレーズコーパスであるL3Cube-MahaParaphraseデータセットについて述べる。
また、これらのデータセット上で、標準変換器ベースBERTモデルの結果を示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:48:58 GMT)
Defending Deepfake via Texture Feature Perturbation [6.8] 顔のテクスチャの特徴に基づく能動的ディープフェイク検出手法を提案する。
人間の目は滑らかな領域の摂動に敏感であるため、知覚力の低いテクスチャ領域に摂動を目視で挿入する。
我々のテクスチャ誘導摂動フレームワークはまずローカルバイナリパターン(LBP)を介して予備的なテクスチャ特徴を抽出し、次いでテクスチャ摂動の生成と最適化のための2モデルアテンション戦略を導入する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:53:35 GMT)
Neural Posterior Estimation for Cataloging Astronomical Images with Spatially Varying Backgrounds and Point Spread Functions [6.6] 本研究では,空間的に異なる背景とPSFを用いてニューラル・リテラル推定を行う手法を提案する。
ランダムサンプリングPSFと背景推定を用いて,これらのカタログの合成カタログと半合成画像を生成する。
Sloan Digital Sky Surveyデータによる実験では、空間的に異なる背景とPSFの存在下でのNPEの有効性が示されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:27:58 GMT)
Ultrafast Stern-Gerlach and Anomalous Bragg Diffraction Regimes of Low-energy Free Electron Interaction with Light [6.4] 低エネルギー量子電子ウェーブパケット(QEW)のための超高速Stern-Gerlach(USG)方式を提案する。
光相互作用中のQEWの波動-粒子双対性を調べることにより、分散誘起ブラッグ回折系を同定する。
本研究は、高速電子と低速電子の両方に対する光誘起回折規則の包括的分類を提供する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:44:40 GMT)
Predict open quantum dynamics with data-informed quantum-classical dynamics [6.4] 我々は、オープン量子システムの進化を予測するために、データインフォームド量子古典力学(DIQCD)アプローチを導入する。
実験およびシミュレーション量子デバイスにおけるDIQCDの精度と効率を実証する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 00:28:09 GMT)
Probing Entanglement Scaling Across a Quantum Phase Transition on a Quantum Computer [6.4] 強相関量子物質の研究は、次元と複雑な絡み合い構造のために困難である。
完全結合型イオン量子コンピュータ上でのサブシステムトモグラフィーのホログラフィー手法を実装した。
サブシステムエンタングルメントエントロピーの臨界度における対数法則のスケーリングを初めて実証した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:11:08 GMT)
FedKLPR: Personalized Federated Learning for Person Re-Identification with Adaptive Pruning [6.4] 人物の身元確認(Re-ID)は、知的監視と公衆安全の基本的な課題である。
現実のre-IDシステムにフェデレートラーニング(FL)を適用することは、2つの大きな課題に直面します。
我々は、人物再識別のための軽量でコミュニケーション効率の良いフレームワークであるFedKLPRを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:11:41 GMT)
First Place Solution to the MLCAS 2025 GWFSS Challenge: The Devil is in the Detail and Minority [6.3] 我々は,MLCAS 2025 GWFSS Challengeの解決策を提示する。
この挑戦は小麦植物に特化したセマンティックセグメンテーションの競争を主催している。
ビジュアライゼーションを探索することで、キー -- 幹が重要なのです。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:14:18 GMT)
Derivation of the Landau-Zener formula via functional equations [6.2] ランダウ・ツェナーの公式は、線形駆動下での2レベル系のダイアバティック遷移確率を記述する。
関数方程式による基本的異なるアプローチを用いたランダウ・ツェナー遷移確率の導出について述べる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:49:19 GMT)
PosBridge: Multi-View Positional Embedding Transplant for Identity-Aware Image Editing [6.1] ローカライズされた被写体駆動画像編集は、ユーザが指定したオブジェクトをシームレスにターゲットシーンに統合することを目的としている。
PosBridgeは、カスタムオブジェクトを挿入するための効率的で柔軟なフレームワークである。
PosBridgeは、構造整合性、外観の忠実さ、計算効率において、主流のベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:09:01 GMT)
Learning Interpretable Differentiable Logic Networks for Time-Series Classification [6.1] 微分可能論理ネットワーク(DLN)を初めてTSCの領域に適用する。
我々はCatch22とTSFreshに依存した特徴ベース表現を採用し、逐次時系列をDLN分類に適したベクトル化形式に変換する。
その結果、DLNの分類は、この新しい領域における中核的な強みを保っていることが確認された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:27:30 GMT)
On the attainment of the Wasserstein--Cramer--Rao lower bound [6.0] クレーマー-ラオ不等式のワッサーシュタイン類似体は、ワッサースタイン情報行列(オットー計量)を用いて開発されている。
この不等式は、加法雑音に対するロバスト性を定量化する推定器のワッサーシュタイン分散の低い境界を与える。
ワッサーシュタイン-クラマー-ラオ下界を得るための推定器の条件について検討し、これを(漸近的な)ワッサーシュタイン効率と呼ぶ。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:58:14 GMT)
Multi-Agent Visual-Language Reasoning for Comprehensive Highway Scene Understanding [5.8] 本稿では,総合的なハイウェイシーン理解のためのマルチエージェントフレームワークを提案する。
大規模汎用視覚言語モデル(VLM)は、タスク固有のチェーン・オブ・シークレットを生成するために、ドメイン知識と共にコンテキスト化される。
このフレームワークは、気象分類、舗装湿性評価、交通渋滞検出を同時に扱う。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:55:24 GMT)
Evaluating the Impact of Verbal Multiword Expressions on Machine Translation [5.8] 言語多語表現(VMWE)は、複雑でしばしば非構成的な性質のため、自然言語処理において重要な課題を呈している。
我々は3つのVMWEカテゴリー(動詞のイディオム、動詞の粒子構成、軽い動詞構成)が英語から複数言語への機械翻訳品質に与える影響を分析する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:26:58 GMT)
Evaluating Retrieval-Augmented Generation Strategies for Large Language Models in Travel Mode Choice Prediction [5.6] 本研究では,旅行モード選択予測に対する,より柔軟でコンテキスト対応なアプローチとして,LLM(Large Language Models)の可能性を検討する。
我々は,LLMに基づく旅行モード選択予測にRAG(Retrieval-Augmented Generation)を統合するモジュールフレームワークを開発した。
2023年ピュージェット・サウンド地域旅行調査データを用いて,モデル性能を評価するための一連の実験を行った。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:20:55 GMT)
sudoLLM: On Multi-role Alignment of Language Models [5.5] ユーザ認証に基づくアクセス権限は、多くのセーフティクリティカルシステムにおいて重要な機能である。
マルチロールアライメント LLM を実現する新しいフレームワーク SudoLLM を紹介する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:02:06 GMT)
AdaGAT: Adaptive Guidance Adversarial Training for the Robustness of Deep Neural Networks [5.4] 本稿では,AdaGAT(Adaptive Guidance Adversarial Training)法を提案する。
我々はAdaGAT法の一部として2つの個別損失関数を開発し、ガイドモデルがその最適状態を達成するためにバックプロパゲーションに積極的に参加できるようにする。
本研究は,特定の精度範囲内でガイドモデルを適切に調整することにより,種々の敵攻撃に対する目標モデルの堅牢性を高めることを明らかにする。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:11:28 GMT)
OmniMRI: A Unified Vision--Language Foundation Model for Generalist MRI Interpretation [5.3] 我々は、MRIワークフロー全体にわたって一般化するために設計された統合視覚言語基盤モデルであるOmniMRIを紹介する。
OmniMRIは60のパブリックデータセットからキュレートされた大規模で異質なコーパスで訓練されている。
結果は,単一アーキテクチャ内で多様なタスクを実行できるOmniMRIの能力を示している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:11:28 GMT)
Who Wins the Race? (R Vs Python) - An Exploratory Study on Energy Consumption of Machine Learning Algorithms [5.3] 本稿では、機械学習モデルトレーニングと推論に異なるプログラミング言語を採用する際のエネルギーコストの意識を高めることを目的とする。
その結果,95%の症例において,両言語間のコストの統計的に有意な差が認められた。
プログラミング言語の選択は、モデルトレーニング中に99.16%まで、推論時に99.8%まで、エネルギー効率に大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:59:47 GMT)
An LLM-LVLM Driven Agent for Iterative and Fine-Grained Image Editing [5.2] RefineEdit-Agentは、複雑で反復的でコンテキスト対応の画像編集のための、新しい、トレーニング不要なインテリジェントエージェントフレームワークである。
我々のフレームワークは、LVI駆動のインストラクションとシーン理解モジュール、多レベル編集プランナー、反復画像編集モジュール、LVLM駆動のフィードバックと評価ループから構成されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:28:18 GMT)
DropLoRA: Sparse Low-Rank Adaptation for Parameter-Efficient Fine-Tuning [5.1] そこで我々はDropLoRAを紹介した。DropLoRAは、ランク次元のプルーニングに焦点を当てた、新しいプルーニングベースのアプローチである。
学習サブスペースを継続的に適応することにより、DropLoRAは、追加のトレーニングや推論コストを発生させることなく、パフォーマンスを大幅に向上する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:45:36 GMT)
L-XAIDS: A LIME-based eXplainable AI framework for Intrusion Detection Systems [4.7] 人工知能(AI)の最近の発展と重要な産業における応用は、AIにおける説明可能性の研究の急増につながっている。
本稿では,侵入検知システム決定の枠組みを提案する。
我々のフレームワークはUNSW-NB15データセット上での攻撃行動の分類における精度のパーセントを達成することができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:47:39 GMT)
A complete set of transformation rules for reversible circuits [4.6] 可逆回路に対する変換規則の最初の完全集合を提案する。
可逆関数はすべて、正準形式の一意可逆回路によって計算されることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:45:14 GMT)
Mind the (Language) Gap: Towards Probing Numerical and Cross-Lingual Limits of LVLMs [4.6] MMCRICBENCH-3Kは、ODI、T20、テストフォーマットから合成された1,463枚のスコアカード画像からなる。
MMCRICBENCH-E-1.5KとMMCRICBENCH-H-1.5Kの2つのサブセットがあり、視覚的に類似したヒンディー語のスコアカードを含んでいる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:43:27 GMT)
Coherent manipulation of interacting electron qubits on solid neon [4.2] 単一電子オンソリッドネオン (eNe) 電荷量子ビットは、極端に長いコヒーレンス時間と高い操作率を示す。
このプラットフォームの2量子ゲートは、実用的な量子情報処理の次の大きなステップである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:58:34 GMT)
Agentic large language models improve retrieval-based radiology question answering [4.2] 本稿では,大規模言語モデル(LLM)を自律的に分解可能なエージェントRAGフレームワークを提案する。
LLMはRadiopaedia.orgから標的臨床証拠を反復的に回収し、証拠に基づく反応を動的に合成する。
エージェント検索により、ゼロショットプロンプトや従来のオンラインRAGよりも平均診断精度が大幅に向上した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:26:30 GMT)
Security Concerns for Large Language Models: A Survey [4.2] 大きな言語モデル(LLM)は自然言語処理に革命をもたらしたが、その能力は新たなセキュリティ脆弱性も導入している。
この調査は、脅威をいくつかの重要な領域に分類する、これらの新興懸念の包括的概要を提供する。
LLMが安全で有益であることを保証するために、堅牢で多層的なセキュリティ戦略を推進していくことの重要性を強調した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:15:13 GMT)
Are You Sure You're Positive? Consolidating Chain-of-Thought Agents with Uncertainty Quantification for Aspect-Category Sentiment Analysis [4.1] データセットのアノテーションに必要な時間とリソースが限られている場合、ゼロショット設定で大きな言語モデルを活用することは有益である、と我々は主張する。
本稿では,大規模言語モデルのトークンレベルの不確実性スコアを活用することで,複数のチェーンオブ思考エージェントを組み合わせる新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:51:16 GMT)
Harnessing ADAS for Pedestrian Safety: A Data-Driven Exploration of Fatality Reduction [4.1] 歩行者の死者はアメリカ合衆国でも増え続けている。
Advanced Driver Assistance Systems (ADAS)は、歩行者の安全を改善するための有望な道を提供する。
本研究では、FARS(Fatality Analysis Reporting System)を用いた包括的データ駆動分析を行う。
その結果、ADASは事故の重大度を低減し、いくつかの致命傷を予防できるが、その効果は低照度および悪天候下で減少することが示された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:58:55 GMT)
Enhancing Underwater Images via Deep Learning: A Comparative Study of VGG19 and ResNet50-Based Approaches [4.1] 提案手法は、2つの深い畳み込みニューラルネットワークモデル、VGG19とResNet50を巧みに統合する。
2つのモデルの補完的な利点は効果的に統合され、より包括的で正確な画像強調効果が得られる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:10:44 GMT)
Deep Learning-Assisted Detection of Sarcopenia in Cross-Sectional Computed Tomography Imaging [4.0] サルコパニアは、筋肉の腫瘤が進行的に減少し、手術結果の悪化に結びついている。
我々は、CT画像の骨格筋面積を測定するディープラーニングモデルを開発し、このタスクを自動化する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:53:56 GMT)
Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks [3.9] ゲーテッドニューラルネットワーク(RNN)は、適応的な学習速度の振る舞いを暗黙的に誘発する。
効果は状態空間の時間スケールとパラメータ空間のダイナミクスの結合から生じる。
経験的シミュレーションはこれらの主張を裏付ける。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:10:20 GMT)
From Reasoning to Learning: A Survey on Hypothesis Discovery and Rule Learning with Large Language Models [3.9] 人工知能(AGI)の追求において、新たな知識を学習し、推論し、生成するモデルの必要性が高まっている。
このサーベイは、大規模言語モデルに基づく仮説発見を調べるための構造化レンズを提供する。
仮説生成、適用、検証における既存の作業を合成し、重要な成果と臨界ギャップの両方を特定します。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:09:11 GMT)
Federated Reinforcement Learning for Runtime Optimization of AI Applications in Smart Eyewears [3.8] 拡張現実技術は、医療、エンターテイメント、教育などの分野を変革し、スマートアイウェア(SEW)と人工知能(AI)が重要な役割を担っている。
フェデレーション強化学習(FRL)フレームワークを提案し、複数のエージェントがデータのプライバシを保護しながら協調的にトレーニングできるようにする。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:06:44 GMT)
Gumbel-MPNN: Graph Rewiring with Gumbel-Softmax [3.8] 我々は,MPNNの性能が,クラス内の全近傍分布の成分数に依存することを示す。
Gumbel-Softmax-based rewiring method that reduces deviations in neighborhood distributions。
以上の結果から,本手法は,近隣情報性の向上,長距離依存性の処理,過度な監視の軽減,MPNNの分類性能の向上を実現している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:41:19 GMT)
Enhancing Engagement and Learning in Computing Education: Automated Moodle-Based Problem-Solving Assessments [3.8] 本稿では,自動ムードルベース問題解決評価(PSA)の設計と改善について述べる。
従来の試験の代替として開発されたPSAは、Moodleのクイズエンジンを介して、パラメータ化された現実世界のタスクを通じて問題解決スキルを評価する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:45:22 GMT)
Optimizing the Optimizer for Physics-Informed Neural Networks and Kolmogorov-Arnold Networks [3.8] 物理情報ニューラルネットワーク(PINN)は、部分マグニチュード方程式(PDE)をニューラルネットワークのトレーニングプロセスにソフト制約として統合することにより、計算PDEソリューションに革命をもたらした。
さらに、物理インフォームドネットワーク(PIKAN)も有効であり、精度も同等である。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:23:02 GMT)
Risk Assessment and Security Analysis of Large Language Models [3.6] 本稿では,重要なアプリケーションシナリオにおける大規模言語モデル(LLM)のセキュリティ問題に焦点をあてる。
本稿では,動的リスク評価システムと階層型防衛システムの設計について述べる。
実験の結果,システムは隠れた攻撃を識別できることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:34:34 GMT)
High-Order Langevin Monte Carlo Algorithms [3.4] ランゲヴィンアルゴリズムは大規模なサンプリング問題に対するマルコフ連鎖モンテカルロ (MCMC) 法として人気がある。
我々は,P$-th次ランゲヴィン・モンテカルロ(LMC)アルゴリズムを,P$-th次ランゲヴィン・ダイナミクスの離散化に基づいて提案する。
対数凹凸と滑らかな密度を持つ分布からサンプリングするワッサーシュタイン収束保証を得る。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:37:44 GMT)
Reinforcement Learning enhanced Online Adaptive Clinical Decision Support via Digital Twin powered Policy and Treatment Effect optimized Reward [3.3] 本稿では、強化学習がポリシーを提供し、患者デジタルツインが環境を提供し、治療効果が報酬を定義するオンライン適応ツールを提案する。
人工臨床シミュレータの実験では、レイテンシの低下、スループットの安定、安全度の高いクエリ率の低下、標準値ベースラインに対するリターンの改善などが示されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:51:22 GMT)
MoE-Inference-Bench: Performance Evaluation of Mixture of Expert Large Language and Vision Models [3.2] 専門家の混合モデル(MoE)は、大規模言語モデル(LLM)と視覚言語モデル(VLM)のスケーリングを可能にした。
MoEsは、専門家間の負荷不均衡や、追加のルーティング計算オーバーヘッドなど、いくつかの推論時の課題を導入している。
MoE-Inference-Benchは様々なシナリオでMoEの性能を評価するための総合的な研究である。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:49:53 GMT)
Trust Me, I Know This Function: Hijacking LLM Static Analysis using Bias [3.2] 大規模言語モデル(LLM)は、自動化されたコードレビューと静的解析を大規模に実行するようにますます信頼されている。
本稿では,LLMに基づくコード解析において重要な脆弱性を特定し,活用する。
我々は、FPA(Familiar Pattern Attack)をターゲットコードに検出し、注入する、完全に自動化されたブラックボックスアルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:42:48 GMT)
More Women, Same Stereotypes: Unpacking the Gender Bias Paradox in Large Language Models [3.2] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、社会的偏見を反映または増幅する傾向について懸念が持たれている。
本研究では,LSMにおける性別バイアスを明らかにするための新しい評価枠組みを提案する。
10の著名なLSMの体系的な分析は、職業全体にわたって女性キャラクターを過剰に表現する一貫したパターンを示している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:38:56 GMT)
Decentralized Contextual Bandits with Network Adaptivity [3.1] 我々は,NetLinUCBとNet-SGD-UCBという2つのネットワーク対応アッパー信頼境界(UCB)アルゴリズムを開発した。
提案手法は,グローバルおよびローカルなコンポーネントに学習を分解し,エージェントが完全に同期することなく共有構造を活用できるようにする。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:21:47 GMT)
When predict can also explain: few-shot prediction to select better neural latents [2.9] 広く使われている1つのメソッドである$textitco-smoothing$は、潜在変数を共同で推定し、保持されたチャネルに沿って観測を予測する。
高い共平度を持つモデルは、その潜在表現において任意の外部ダイナミクスを持つことができることを示す。
すべてのモデルペアの潜伏変数を高共平滑化でクロスデコードすることにより、最小限の外部ダイナミクスを持つモデルを同定する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:13:46 GMT)
From Language to Action: A Review of Large Language Models as Autonomous Agents and Tool Users [2.8] 本稿では,大規模言語モデルを用いた自律型エージェントとツールユーザの開発状況について概説する。
LLMエージェントのアーキテクチャ設計原則を構造化分析し,アプリケーションを単一エージェントおよびマルチエージェントシステムに分割する。
我々はLSMの検証可能な推論、自己改善能力、LSMをベースとしたエージェントのパーソナライズに関する批判的な知見を同定した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:02:51 GMT)
Unsupervised Urban Tree Biodiversity Mapping from Street-Level Imagery Using Spatially-Aware Visual Clustering [2.8] 都市部の樹木の多様性は、気候の回復力、生態学的安定性、および都市の自由性に重要である。
フィールドベースの在庫はシャノンとシンプソンの多様性の信頼できる見積もりを提供するが、コストと時間を要する。
街路レベルの画像からの視覚的埋め込みと空間的植込みパターンを統合し,ラベルなしで生物多様性を推定する,教師なしクラスタリングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:39:11 GMT)
Universal scaling of higher-order cumulants in quantum isotropic spin chains [2.7] 一次元等方的ハイゼンベルクモデルで高次累積の普遍的スケーリング則を明らかにする。
我々は高次相関にのみアクセス可能な非平衡力学の異常な挙動を示す。
我々の結果は最近の実験結果と一致している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:00:55 GMT)
Efficient Zero-Shot Long Document Classification by Reducing Context Through Sentence Ranking [2.6] BERTのようなトランスフォーマーベースのモデルは短いテキスト分類では優れているが、長い文書分類(LDC)では困難である
モデルアーキテクチャを変更することなく,文のランク付けを利用して入力コンテキストを削減する,効率的なゼロショット手法を提案する。
本手法により,見出しなどの短文で訓練したモデルを,最も情報に富んだ文章を選択することで,長文文書に適応することが可能となる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:52:37 GMT)
Multi-User Contextual Cascading Bandits for Personalized Recommendation [2.5] Multi-User Contextual Cascading Banditモデルは、複数のユーザがシーケンシャルに表示されたアイテムと同時に対話するリアルなオンライン広告シナリオをキャプチャする。
我々はまず,UCBBP(Upper Confidence Bound with Backward Planning)を提案する。この設定に適したUCBスタイルのアルゴリズムで,$widetildeO(sqrtTHN)$が$T$以上,セッションステップが$H$,コンテキストが$N$以上となることを証明している。
多くのユーザが同時にシステムと対話するという事実に感銘を受けて、我々はActive Up Confidence Bound withという第2のアルゴリズムを導入しました。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:18:21 GMT)
Keystroke Detection by Exploiting Unintended RF Emission from Repaired USB Keyboards [2.5] 電子デバイスおよびケーブルは、信号処理及び/または伝送の副産物としてRF放射を不注意に放出する。
このような漏れは、送信範囲が短い弱い弱い信号であるため、施設内に収容できると考えられていた。
従来のケーブル修理プロセスは、細いモノポールアンテナを形成し、エマニュエーションを長距離で送信するのに役立ちます。
拡張バージョンでは、修理されたUSBキーボードに入力されたキーストロークを検出することで、情報抽出のために、このようなエマレーションを長距離で活用できることが示される。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:43:30 GMT)
Agent-Testing Agent: A Meta-Agent for Automated Testing and Evaluation of Conversational AI Agents [2.3] 本稿では,静的コード解析,デザイナの尋問,文献マイニング,ペルソナ駆動の対人テスト生成を組み合わせたメタエージェントであるAgent-Testing Agent(ATA)を提案する。
各対話はLLM-as-a-Judge (LAAJ)ルーブリックでスコアされ、その後の試験をエージェントの最も弱い能力に向けて操るために使用される。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:02:13 GMT)
Particle swarm optimization for online sparse streaming feature selection under uncertainty [2.0] 高次元ストリーミングデータを含む実世界のアプリケーションでは、オンラインストリーミング機能選択(OSFS)が広く採用されている。
本研究は、パーティクルスワム最適化(PSO)により強化されたPOS2FS-不確実性を考慮したオンラインスパースストリーミング特徴選択フレームワークを提案する。
1)PSOによる特徴ラベル関係の不確実性低減,2)教師付き学習における特徴ファジネス管理のための3方向決定理論の導入。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:56:41 GMT)
An experimental approach: The graph of graphs [2.0] 色選択実験の結果に基づいて,ペアワイズ比較の最適パターンとシーケンスに着目した。
比較可能なすべてのパターンが連結されたグラフとなり、完全なデータに対して評価された。
得られた比較実験の最適パターンは、以前のシミュレーションでもベストか2位であった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:05:44 GMT)
PP-STAT: An Efficient Privacy-Preserving Statistical Analysis Framework using Homomorphic Encryption [1.9] PP-STATは、プライバシー保護統計分析のための同型暗号化ベースのフレームワークである。
PP-STATはZスコア正規化、歪度、曲率、変動係数、ピアソン相関係数などの高度な統計測度をサポートし、すべて暗号化データ上で安全に計算される。
実世界のデータセットを評価した結果,PP-STATは平均相対誤差(MRE)が2.4x10-4以下であることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:26:16 GMT)
Solving Constrained Stochastic Shortest Path Problems with Scalarisation [1.9] 本稿では,効率的な探索アルゴリズムを用いて,制約のない最短経路問題(SSP)を解くCARLを紹介する。
我々の実験によると、CARLは既存のベンチマークの最先端よりも50%多くの問題を解決している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:53:04 GMT)
Opening the Black Box: Interpretable Remedies for Popularity Bias in Recommender Systems [1.9] 人気度バイアスは、少数の人気アイテムが不均等な注目を集めるレコメンデーションシステムにおいて、よく知られた課題である。
この不均衡は、しばしば推奨品質の低下とアイテムの不公平な露出をもたらす。
本稿では,Sparse Autoencoder を用いたポストホック手法を提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:59:56 GMT)
Exploring and Reshaping the Weight Distribution in LLM [1.8] 本稿では,異なるタイプの層間の重み分布の相関について検討する。
これらの相関関係が LoRA トレーニングの有効性に与える影響について検討する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:27:14 GMT)
Quantum-Assisted Learning of Time-Dependent Parabolic PDEs [1.8] 一般時間依存偏微分方程式を解くためのハイブリッド量子古典的枠組みを提案する。
QNNアプローチに基づいて、この手法は放物型PDEに広く適用される。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:29:24 GMT)
MSCN: Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles [1.8] マルチビュー構造畳み込みネットワーク(MSCN)はドメイン不変の認識を実現するために設計された新しいアーキテクチャである。
MSCNは、すべてのドメイン変更シナリオにおいて、最先端のクラウド分類方法よりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:41:53 GMT)
Exploring Quantum Bootstrap Sampling for AQP Error Assessment: A Pilot Study [1.7] ブートストラップサンプリングは、人口データ分布が不明な場合でもエラーアセスメントを生成することができる。
量子コンピュータ上でブートストラップサンプルを生成するための量子ブートストラップサンプリングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:41:36 GMT)
Speech-Based Cognitive Screening: A Systematic Evaluation of LLM Adaptation Strategies [1.7] アルツハイマー病と関連する認知症を持つ米国の成人の半数以上が未診断のままである。
DementiaBank音声コーパスを用いた認知症検出のための大規模言語モデル適応手法の比較を行った。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:15:28 GMT)
A Human-In-The-Loop Approach for Improving Fairness in Predictive Business Process Monitoring [1.7] 予測的プロセス監視は、ビジネスプロセスの実行インスタンスに対して、積極的に反応し、介入することを可能にする。
データ駆動型モデルの性質は、データの中に不公平、偏見、あるいは非倫理的なパターンを見つけるのに感受性がある。
本稿では,予測ビジネスプロセスモニタリングモデルにおいて,偏りのある決定を識別・修正するための,新しいモデルに依存しないアプローチを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:05:35 GMT)
Optimal Circuit Size for Fixed-Hamming-Weight Quantum States Preparation [1.6] 回路サイズが$bobinomnk$の任意の$n$-qubit HW-$k$を、最大$max0, n-3$のアシラリー量子ビットを用いて生成する量子回路構成を提案する。
これは、少数の補助量子ビットのみを使用しながら、回路サイズに関する理論的な下界を達成する最初の構成である。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:18:29 GMT)
From Legal Texts to Defeasible Deontic Logic via LLMs: A Study in Automated Semantic Analysis [1.6] 本稿では,大言語モデル(LLM)を用いた法文の自動意味解析への新しいアプローチを提案する。
本稿では、複雑な規範言語を原子スニペットに分割し、デオン規則を抽出し、それらを構文的・意味的コヒーレンスとして評価する構造化パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:17:07 GMT)
Adaptive Physics-Informed Neural Networks with Multi-Category Feature Engineering for Hydrogen Sorption Prediction in Clays, Shales, and Coals [1.6] 本研究では, 適応型物理インフォームドニューラルネットワーク(PINN)フレームワークを導入し, 水素吸着予測を向上する。
PINNは、アダプティブ・ロス関数とモンテカルロ・ドロップアウトにより、不確実な定量化のために最適化された、多面的な注意を伴うディープ・リザーブ・ネットワークを採用している。
このフレームワークは、粘土鉱物、シェール、石炭をまたいだ堅牢なリソロジー特性を示し、85-91%の信頼性スコアを維持している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:41:33 GMT)
MC3G: Model Agnostic Causally Constrained Counterfactual Generation [1.5] モデル非依存型因果関係生成(MC3G)を提案する。
まず、MC3Gはモデルに依存しない: 説明可能な規則に基づく代理モデルを用いて、任意のブラックボックスモデルを近似する。
第二に、このサロゲートは、元のブラックボックスモデルに有利な結果をもたらす反事実を生成するために使用される。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:09:36 GMT)
A Hybrid Surrogate for Electric Vehicle Parameter Estimation and Power Consumption via Physics-Informed Neural Operators [1.5] 電気自動車のパラメータ推定と電力消費のためのハイブリッドサロゲートモデルを提案する。
速度と加速度だけで、時変モーターと再生ブレーキ効率を出力する。
我々はTesla Model 3、Tesla Model S、およびKia EV9の実際のログを評価した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:25:25 GMT)
UI-Level Evaluation of ALLaM 34B: Measuring an Arabic-Centric LLM via HUMAIN Chat [1.3] サウジのデータとAI機関は、アラビアに焦点を当てたモデルのファミリーである$allaM$を導入した。
最も有能な$ALLaM-34B$は、HUMAIN Chatを開発したHUMAINによって採用された。
本稿では,拡張されたUIレベルの$ALLaM-34B$について述べる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:32:15 GMT)
MedLoRD: A Medical Low-Resource Diffusion Model for High-Resolution 3D CT Image Synthesis [1.2] MedLoRDは,計算資源制約環境向けに設計された生成拡散モデルである。
MedLoRDは512$times$512$times$256までの高次元医療ボリュームを生成することができる。
冠動脈CT(Corary Computed Tomography Angiography)や肺CT(Lung Computed Tomography)データセットなど,複数のモードで評価されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:32:09 GMT)
Disentangled Geometry and Appearance for Efficient Multi-View Surface Reconstruction and Rendering [1.1] 本稿では,ニューラルベース多視点表面再構成法の限界に対処する。
提案手法は,最新技術トレーニング (4.84分) とレンダリング (0.023秒) の高速化を実現する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:29:18 GMT)
FLAIRR-TS -- Forecasting LLM-Agents with Iterative Refinement and Retrieval for Time Series [1.1] 本稿では,エージェントシステムを利用したテスト時間プロンプト最適化フレームワークFLAIRR-TSを紹介する。
Forecaster-Adntgenerates forecasts using a initial prompt, which is refineed by a refiner agent, in-formed by past outputs and retrieved analogs。
ベンチマークデータセットの実験では、静的プロンプトと検索拡張ベースラインよりも精度が向上した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 00:57:22 GMT)
MaRVL-QA: A Benchmark for Mathematical Reasoning over Visual Landscapes [1.1] MLLM(Multimodal Large Language Models)の重要なフロンティアは、画像から直接、数学的および空間的推論を行う能力である。
MARVL-QAは、これらのコア推論スキルを定量的に評価するために設計された新しいベンチマークである。
MARVL-QAは、最先端のMLLMでさえ、頑丈な空間的推論ではなく表面的手法に頼って、かなり苦労していることを明らかにしている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:24:56 GMT)
DeeP-Mod: Deep Dynamic Programming based Environment Modelling using Feature Extraction [1.0] DeeP-Modフレームワークは、Deep Dynamic Programming Network (DDPN)の機能を使って環境モデルを構築する。
DDPNから機能を抽出することは、状態情報を保持し、タスクとアクションセットの独立を可能にする。
DeeP-Modフレームワークは、アクションに応じてDDPNから抽出された機能の進化を利用した環境モデルを作成する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 02:42:40 GMT)
CORTEX: Composite Overlay for Risk Tiering and Exposure in Operational AI Systems [0.8] 本稿では,AIシステムの脆弱性を評価し,評価する多層リスクスコアリングフレームワークであるCORTEXを紹介する。
AIインシデントデータベース(AIID)に記録された1200件以上のインシデントを実証分析した。
結果として得られる複合スコアは、AIリスクレジスタ、モデル監査、適合性チェック、動的ガバナンスダッシュボード間で運用することができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:30:25 GMT)
An Efficient Recommendation Filtering-based Trust Model for Securing Internet of Things [0.8] 現在のIoT(Internet of Things)の信頼ベースのメカニズムには,データセキュリティに影響を与える制限がある。
提案モデルでは,ウィンドウ長を動的に決定し,精度の高い信頼計算を実現する。
平均信頼スコアと時間との調和平均を使い、信頼スコアの急激な変動を防ぐ。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:13:51 GMT)
MetaFed: Advancing Privacy, Performance, and Sustainability in Federated Metaverse Systems [0.7] 没入型Metaverseアプリケーションの急速な拡張は、パフォーマンス、プライバシ、環境サステナビリティの交差において複雑な課題をもたらす。
本稿では,Metaverse環境における持続的かつインテリジェントなリソースオーケストレーションを実現する分散型フェデレーション学習フレームワークであるMetaFedを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:53:06 GMT)
A Synthetic Dataset for Manometry Recognition in Robotic Applications [0.7] 本研究は,複雑な産業環境下でのロバストな物体検出モデルをトレーニングするためのデータ不足と高い取得コストの課題に対処する。
我々は、手続き的レンダリングとAI駆動のビデオ生成を組み合わせたハイブリッドデータ合成パイプラインを提案し、検証する。
複合データセット上でトレーニングされたYOLOベースの検出ネットワークが,実画像と合成データとをブレンドすることで,実世界のデータにのみトレーニングされたモデルと比較して,優れた性能を実現することを実証した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:52:13 GMT)
Dynamic Reserve Price Design with Distributed Solving Algorithm [0.7] 本稿では,その隠れたコストをオークション機構に組み込んだ動的リザーブ価格設計手法を提案する。
当社のフレームワークは,広告主がバリュエーションを真実に公開するための長期的なインセンティブを維持しながら,ユーザエクスペリエンスへの影響を最小限に抑える。
オフライン評価とオンラインA/Bテストを含む実験は、この手法がシンプルで効率的であることを示した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:49:54 GMT)
FractMorph: A Fractional Fourier-Based Multi-Domain Transformer for Deformable Image Registration [0.7] クロスイメージ特徴マッチングを向上する新しい3次元デュアル並列変換器アーキテクチャであるFractMorphを提案する。
軽量なU-Netスタイルのネットワークは、変換器に富んだ特徴から密度変形場を予測する。
その結果、FractMorphは、全体のDice similarity Coefficient(DSC)が86.45%$、平均1構造が75.15%$、95セントのHausdorff(HD95)が1.54mathrmmm$で、最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:22:49 GMT)
Optimizing Grasping in Legged Robots: A Deep Learning Approach to Loco-Manipulation [0.7] 本稿では,腕を備えた四足歩行の把握能力を高めるために,深層学習フレームワークを提案する。
我々はジェネシスシミュレーション環境内にパイプラインを構築し、共通物体の把握の試みの合成データセットを生成する。
このデータセットは、オンボードのRGBとディープカメラからのマルチモーダル入力を処理するU-Netのようなアーキテクチャで、カスタムCNNのトレーニングに使用された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:47:56 GMT)
Universal quantum control with dynamical correction [0.4] ここでは、ハミルトニアン系における任意の種類のエラーを動的に補正する普遍的かつリアルタイムな制御戦略を提供する。
これは、補助射影作用素に対するフォン・ノイマン方程式によって活性化される興味のある系に対する複数の誤差耐性経路を与える。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:18:09 GMT)
The future of secure communications: device independence in quantum key distribution [0.4] デバイス非依存の量子鍵分配(DI-QKD)は、セキュリティを確保するためのユニークなアプローチである。
本総説では,DI-QKD実験における非古典性の役割と問題点について概説する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:51:30 GMT)
Evolutionary Brain-Body Co-Optimization Consistently Fails to Select for Morphological Potential [0.3] 本研究では,脳と身体の協調最適化を研究するために,形態的適合性景観を網羅的にマッピングすることを提案する。
我々は、このデザイン空間において、進化的脳-体共最適化アルゴリズムがどのように機能するかを分析する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:47:07 GMT)
Activation Transport Operators [0.3] 残ストリームは、線形読み出しと非線形計算の書き込みを通じてトランスデコーダ層間の通信を仲介する。
本稿では,上流から下流への線形写像である Activation Transport Operators (ATO) を提案する。
本研究では, 線形輸送に係わる残留ストリームの部分空間の大きさ, 輸送効率, 報告効率を実証的に示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:22:09 GMT)
Chemical classification program synthesis using generative artificial intelligence [0.3] 本研究では、生成人工知能を用いて、ChEBI(Chemical Entities of Biological Interest)データベース内のクラスのための化学分類プログラムを自動作成する手法を提案する。
C3PO(ChEBI Chemical Class Ontology)と呼ばれる化学クラス命名法について説明可能な存在論的モデルを構成するプログラムである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:27:40 GMT)
Combining Cost-Constrained Runtime Monitors for AI Safety [0.3] 複数のランタイムモニタを単一の監視プロトコルに効率的に組み合わせる方法について検討する。
我々のフレームワークは、望ましくない振る舞いを検出するために既存のモニターを組み合わせるための原則化された方法論を提供する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:32:49 GMT)
LLM Assertiveness can be Mechanistically Decomposed into Emotional and Logical Components [0.2] LLM(Large Language Models)は、しばしば過剰な自信を示し、高い文脈で不確実性のある情報を提示する。
我々は、人間の注釈付きアサーション性データセットを微調整したオープンソースのLlama 3.2モデルを使用している。
分析により,アサーションのコントラストに最も敏感な層が同定され,高いアサーティブ表現が感情的・論理的クラスタの2つのサブコンポーネントに分解されることが明らかとなった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:43:48 GMT)
Adversarial Examples Are Not Bugs, They Are Superposition [0.2] アドリラルな例は、深層学習の最も難解な現象の1つとして残されている。
重ね合わせは大きな寄与要因かもしれないし、主要な原因かもしれない。
重ね合わせは理論的には様々な逆転現象を説明できる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:19:53 GMT)
CoxNTF: A New Approach for Joint Clustering and Prediction in Survival Analysis [0.1] CoxNTFは、非負のテンソル因子化(NTF)を用いて、生存結果と密接に関連する有意義な潜在表現を導出する新しいアプローチである。
以上の結果から,CoxNTFはCoxnetに匹敵する生存予測性能が得られた。
この新しいアプローチは機能冗長性を効果的に処理し、共同クラスタリングと生存分析の予測に強力なツールとなる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:21:53 GMT)
Modular MeanFlow: Towards Stable and Scalable One-Step Generative Modeling [0.1] 一段階生成モデリングは、単一関数評価において高品質なデータサンプルを生成することを目指している。
本研究では、時間平均速度場を学習するための柔軟で理論的に基礎付けられたアプローチであるModular MeanFlowを紹介する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:00:08 GMT)
VROOM - Visual Reconstruction over Onboard Multiview [0.0] Vroomはフォーミュラ1のサーキットの3Dモデルを、レースカーのカメラ映像のみを使って再構築するシステムである。
私たちのパイプラインでは、DROID-SLAM、AnyCam、Monst3rといったさまざまなメソッドを分析しています。
Vroomは複雑な環境下でトラックや車両の軌道を部分的に復元できることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 00:44:46 GMT)
The Lifecycle Principle: Stabilizing Dynamic Neural Networks with State Memory [0.0] 状態記憶を中心とした正規化機構を提案する。
再生したニューロンを再初期化する代わりに、私の方法はパラメータを最後の既知の有効状態に復元する。
画像分類ベンチマーク実験により, この手法が一般化とロバスト性を向上させることが示された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:20:01 GMT)
The Dual Impact of Virtual Reality: Examining the Addictive Potential and Therapeutic Applications of Immersive Media in the Metaverse [0.0] 本稿では,没入感,対話性,リアルタイムアクセス,パーソナライゼーションなど,ソーシャルメディアの中毒性の特徴を明らかにする。
分析された論文の約半数は、これらの機能がVR中毒に寄与していることを示している。
中毒性行動に寄与する同様の機能は、VRのポジティブな治療介入にも利用することができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:19:50 GMT)
Structured Quantum Baths with Memory: A QuTiP Framework for Spectral Diagnostics and Machine Learning Inference [0.0] 本稿では,QuTiPを用いたオープン量子システムモデリングのためのコンパクトなシミュレーションフレームワークを提案する。
本手法では,浴槽を調整可能な接続を持つ層状キュービットの有限集合としてモデル化する。
スペクトル分析は、理論、シミュレーション、実験にまたがる統一的で量子プラットフォームに依存しないツールとして機能する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:31:15 GMT)
Scaling Graph Transformers: A Comparative Study of Sparse and Dense Attention [0.0] グラフは、さまざまなドメインにまたがる構造化データをキャプチャするための機械学習における中心的な表現となっている。
グラフトランスフォーマーは、ノードが情報をグローバルに交換できるアテンションメカニズムを使用することでこれを克服する。
これら2つの注意機構を比較し、トレードオフを分析し、使用するタイミングを強調します。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 01:12:59 GMT)
SGD Convergence under Stepsize Shrinkage in Low-Precision Training [0.0] 量子化勾配の縮退は等級の縮退をもたらし、勾配の傾きが収束する方法を変える。
この収縮は, 有効段数 (mu_k q_k ) の通常の段数 (mu_k q_k ) に影響を及ぼすことを示す。
精度の低いSGDは依然として収束するが, (q_min ) で設定した速度は遅く, 量子化効果による誤差も高い。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:22:59 GMT)
Rethinking Denial-of-Service: A Conditional Taxonomy Unifying Availability and Sustainability Threats [0.0] 本稿では、レガシーとクラウド時代のDoS攻撃の両方を分類するための、統一された条件ベースのフレームワークを提案する。
このフレームワークは、形式的条件木分類、秩序理論に基づく階層的格子構造、概念的なベン図の3つの相互関係モデルで構成されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:23:09 GMT)
ResLink: A Novel Deep Learning Architecture for Brain Tumor Classification with Area Attention and Residual Connections [0.0] ResLinkは、CTスキャン画像を用いた脳腫瘍分類のための新しいディープラーニングアーキテクチャである。
特徴学習と空間理解を強化するために、新しいエリアアテンション機構と残差接続を統合している。
95%の精度を達成し、強い一般化性を示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:00:30 GMT)
Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer [0.0] 本稿では,環境を取り扱う実時間経路積分形式に基づくオープンシステムの第一原理計算と,コンピュータ上での我々の関心の共有システムを提案する。
我々は、特に量子デコヒーレンスモデルとしてよく知られているカルデイラ・レゲットモデルに焦点を当てる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:24:10 GMT)
Quantum aspects of spacetime: A quantum optics view of acceleration radiation and black holes [0.0] 量子力学の百年紀において、時空と重力物理学の基本的な性質に関わる問題において、量子情報と熱化が果たす中心的な役割について概説する。
これは、正式な量子力学の初期の発展からまだ1世紀も経たない研究領域である。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:19:44 GMT)
Provable Generalization in Overparameterized Neural Nets [0.0] ディープニューラルネットワークは、トレーニング例よりもはるかに多くのパラメータを含むことが多いが、実際には十分に一般化されている。
注意行列の有効ランクに基づいて、注意ベースモデルに対するキャパシティの代替概念について検討する。
この量は,大規模な言語モデルで観測された経験的スケーリング法則に一致した標本サイズに依存した一般化バウンダリを導出することを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 08:46:31 GMT)
Programmable k-local Ising Machines and all-optical Kolmogorov-Arnold Networks on Photonic Platforms [0.0] 単一空間光変調器(SLM)中心のプリミティブを導入し,一ストローク,全光学的k-局所イジング相互作用を実現する。
本稿では,空間フォトニックIsingマシン,インジェクションロックされたVCSELアレイ,およびMicrosoftアナログ光学コンピュータの実装について概説する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:39:09 GMT)
Planckian bound on quantum dynamical entropy [0.0] 非ゼロエントロピー速度は、汎用多体系で観測可能な広帯域の熱ゆらぎを監視して得られる。
熱力学および長期限界におけるエントロピー速度を明示的に計算する。
エントロピー率に対する普遍プランク多様体を予想する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 18:44:28 GMT)
Phantom BTZ Black Holes: Thermal Properties Under Perturbative Corrections [0.0] 本研究では,前向き摂動補正を取り入れたファントムBTZブラックホールの熱力学について検討した。
グラフ解析は、修正されたエントロピーが十分に小さなブラックホールに対して負となることを示している。
熱ゆらぎの影響は、小さなブラックホールにとって重要なものであり、大きなブラックホールに対しては無視可能であることを証明している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:48:38 GMT)
On the Interchangeability of Spin Matrix and Orbital Angular Momentum Operators in the Dirac Theory of the Electron [0.0] 分裂軌道角運動量(英語版)は、スピン軸周りの空間における運動量の流れに電子スピンが部分的に作用するため興味深い。
スピンに存在する軌道角運動量の割合は振動子の速度に依存することが示されている。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:07:26 GMT)
Normalisation of SWIFT Message Counterparties with Feature Extraction and Clustering [0.0] 本稿では,取引相手のクラスタリングを容易にするために,ハイブリッド文字列類似性,トピックモデリング,階層クラスタリング,ルールベースのパイプラインを提案する。
このアプローチは、ルールベースのシステムで見られるほとんどの解釈可能性を保持しており、前者は後者に追加のレベルのクラスタリファインメントを追加する。
制裁調査など、人口のごく一部だけを調査する必要がある場合、この手法は、欠落した個体変動のリスクをよりよく制御することができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:41:44 GMT)
Multimodal Masked Autoencoder Pre-training for 3D MRI-Based Brain Tumor Analysis with Missing Modalities [0.0] BM-MAEはマルチモーダルMRIデータに適したマスク付き画像モデリング事前学習戦略である。
利用可能なモダリティの組み合わせにシームレスに適応し、モダリティ内情報とモダリティ間情報の両方をキャプチャするリッチな表現を抽出する。
欠落したモダリティを迅速かつ効率的に再構築し、その実用的価値を強調します。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:09:02 GMT)
Multi-Level LVLM Guidance for Untrimmed Video Action Recognition [0.0] 本稿では,低レベルの視覚的特徴と高レベルの意味情報とのギャップを埋める新しいアーキテクチャであるイベント・テンポラライズド・ビデオ・トランスフォーマー(ECVT)を紹介する。
ActivityNet v1.3とTHUMOS14の実験では、ECVTは最先端のパフォーマンスを達成しており、平均mAPは40.5%、mAP@0.5は67.1%である。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 16:45:21 GMT)
Modality-Specific Speech Enhancement and Noise-Adaptive Fusion for Acoustic and Body-Conduction Microphone Framework [0.0] 体導マイクロホン信号(BMS)は空中音をバイパスし、強い耐雑音性を提供する。
本稿では,BMSと音響マイクロホン信号(AMS)を組み合わせた新しいマルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:45:34 GMT)
Mind the Gap: From Resolving Theoretical Foundations of Chiral(ity)-Induced Spin Selectivity to Pioneering Implementations in Quantum Sensing [0.0] キラル(シティ)によるスピン選択性(CISS)効果は実験的に広く観測されているが、その理論的基礎は現在も活発に議論されている。
CISS効果の最近の研究は、スピントロニクス、分子センサー、量子情報処理における幅広い概念的関連性と潜在的な応用を強調している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:22:30 GMT)
Literature Review of the Effect of Quantum Computing on Cryptocurrencies using Blockchain Technology [0.0] 本稿では、量子アルゴリズム、特にShorsとGroversが、暗号通貨の基本的なセキュリティメカニズムをいかに破壊するかを評価する。
このレビューでは、Bitcoin、Litecoin、Monero、Zcashにおけるトランザクションおよびコンセンサスプロセスの特定の脆弱性を特定している。
期待されているのは、ポスト量子暗号(PQC)、量子鍵分布(QKD)、メモリ集約型証明アルゴリズムやマルチ署名方式などのプロトコルレベルの修正などである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:53:41 GMT)
Large Language Models as Universal Predictors? An Empirical Study on Small Tabular Datasets [0.0] 大規模言語モデル(LLM)は、下流タスクを明示的に微調整することなく、構造化された入力に対して予測タスクを実行することができる。
分類,回帰,クラスタリングタスクのための小規模構造化データセット上でのLCMの実証関数近似能力について検討した。
以上の結果から,LLMは構造化データの汎用的予測エンジンとして機能する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:00:51 GMT)
Large Language Model-Based Automatic Formulation for Stochastic Optimization Models [0.0] 本稿では,大規模言語モデル(LLM)の性能に関する最初の総合的研究について述べる。
チェーン・オブ・シンキングとモジュール型推論を用いてChatGPTを構造化タスクでガイドするいくつかのプロンプトを設計する。
様々な問題に対して、GPT-4-Turboは部分スコア、変数マッチング、客観的精度で他のモデルよりも優れており、最も効果的なプロンプト戦略として cot_s_instructions が現れる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 03:31:25 GMT)
Kernel Ridge Regression for Efficient Learning of High-Capacity Hopfield Networks [0.0] 我々は,高容量ホップフィールドネットワークを学習するためのカーネルベースの効率的な代替手段として,Kernel Ridge Regression (KRR)を提案する。
KRRはカーネルのトリックを利用し、回帰を通じて双極子状態を予測する。
以上の結果から,KRRはKLRに匹敵する,最先端のストレージ容量(ストレージ負荷1.5)と耐雑音性を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 11:43:47 GMT)
Is the Frequency Principle always valid? [0.0] 極座標(タウ,フィ)における単位球(S2subsetmathbbR3)上の浅部ReLUニューラルネットワークの学習力学について検討した。
固定重みについては、球面の高調波展開は(O(ell5/2ell)) として崩壊する係数を持つ固有の低周波の嗜好を示す。
トレーニング可能なウェイトでは、調和進化方程式における追加の回転項は、崩壊次数(O(ell7/2ell))因子による指数的崩壊を保存する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:03:01 GMT)
Improving time dynamics simulation by sampling the error unitary [0.0] 本稿では, 誤差単位の生成元をランダムにサンプリングすることで, 製品公式の誤差スケーリングを改善するアルゴリズムを提案する。
提案手法は, 誤差が$O(tk+1)$の任意の積公式を$t$, $S_k(t)$とし, 正確な力学に関して, 予想される誤差スケーリングを$O(t2k+2)$とする公式を生成する。
与えられた固定エラー$epsilon$と全進化時間$T$に対して、これは改良されたゲート複雑性を$N=O(T/epsilon)frac1に導く。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:31:15 GMT)
Improving Liver Disease Diagnosis with SNNDeep: A Custom Spiking Neural Network Using Diverse Learning Algorithms [0.0] スパイキングニューラルネットワーク(SNN)は、最近、従来のディープラーニングモデルに対するエネルギー効率が高く、生物学的に妥当な代替手段として注目されている。
本研究は、CT(Computed tomography)機能から肝臓の健康状態のバイナリ分類に最適化されたSNNDeepについて紹介する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:05:30 GMT)
Impact of Neuron Models on Spiking Neural Networks performance. A Complexity Based Classification Approach [0.0] 本研究では,ニューロンモデルの選択と学習規則がスパイキングニューラルネットワーク(SNN)の分類性能に与える影響について検討する。
我々は、スパイクタイピング依存的可塑性(STDP)、テンポトロン、報酬変調更新など、複数の学習ルールで生物学的にインスパイアされたニューロンモデルを比較した。
この研究の新たな要素は、複雑性に基づく決定機構を評価パイプラインに統合することである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:46:59 GMT)
GateTS: Versatile and Efficient Forecasting via Attention-Inspired routed Mixture-of-Experts [0.0] 本稿では,一変量時系列予測のためのトレーニングプロセスを単純化するモデルアーキテクチャを提案する。
提案手法は,従来の1層ソフトマックスルータに取って代わる,スパークスMoE計算と,アテンションにインスパイアされた新しいゲーティング機構を組み合わせたものである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:39:50 GMT)
GUST: Quantifying Free-Form Geometric Uncertainty of Metamaterials Using Small Data [0.0] GUST (Generative Uncertainty Learning via Self-supervised pretraining and Transfer Learning) は、メタマテリアルの製造に固有の自由形式の幾何学的不確実性を定量化するフレームワークである。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:14:59 GMT)
From Taylor Series to Fourier Synthesis: The Periodic Linear Unit [0.0] 周期的非単調性を持つ学習可能な正弦波に基づくアクティベーションである周期線形ユニット(PLU)を導入する。
2つのニューロンのみによる最小限の活性化は、標準的なアクティベーションを用いた等価ネットワークでは不可能なスパイラル分類タスクを解くことができることを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:55:30 GMT)
Fisher-Orthogonal Projection Methods for Natural Gradient Descent with Large Batches [0.0] 本稿ではFOP(Fisher-Orthogonal Projection)を提案する。これは非常に大きなバッチサイズで2階法の有効性を復元する手法である。
FOPは2つのサブバッチを利用して分散対応更新方向を構築し、勾配差の成分で平均勾配を高める。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:07:05 GMT)
FedERL: Federated Efficient and Robust Learning for Common Corruptions [0.0] フェデレーション学習(FL)は、データプライバシを保持しながら、エッジデバイスへのディープラーニングモデルのデプロイを加速する。
既存の堅牢なトレーニング手法は計算コストが高く、リソース制約のあるクライアントには適さない。
我々は,クライアント側における時間とエネルギーの制約下での汚職の堅牢性を明確化するための最初の取り組みとして,効率的で堅牢な学習を目的としたFedERLを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:34:28 GMT)
Explainable AI (XAI) for Arrhythmia detection from electrocardiograms [0.0] 深層学習は心電図(ECG)信号から高い精度の不整脈検出を可能にしているが、臨床応用には限界がある。
本研究では,時系列ECG分析に特化して適応した説明可能なAI(XAI)技術の適用について検討する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 10:44:24 GMT)
Exact Solution for Two $δ$-Interacting Bosons on a Ring in the Presence of a $δ$-Barrier: Asymmetric Bethe Ansatz for Spatially Odd States [0.0] デルタ$関数障壁の存在下でのリング上の2つの1次元短距離相互作用ボソンの問題について検討する。
バリアが粒子-粒子相互作用の強度に等しい$delta$-wellに変換されると、システムは相互作用しない相互作用のスペクトルを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 14:07:15 GMT)
ER = EPR in Loop Quantum Gravity: the Immirzi Parameter and the Continuum Limit [0.0] 我々は、ER=EPRプログラムを支えるアインシュタイン方程式の有限領域解析をループ量子重力フレームワークに再キャストする。
曲率-エネルギー関係をホロノミー-フラックス運動学に変換することにより、絡み合いと量子幾何学の間の正確な辞書を得る。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:03:54 GMT)
Does GPT-4 surpass human performance in linguistic pragmatics? [0.0] 大規模言語モデル(LLM)は、汎用マルチモーダルAIシステムとして日々の生活にますます統合されている。
本研究では,文脈的意味と暗黙的意味を含む言語プラグマティクスをLLMで解釈する能力について検討した。
Grice 通信の原理を用いて,対話型タスクにおける LLMs (GPT-2, GPT-3, GPT-3.5, GPT-4, Bard) と人間の両方の評価を行った。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:13:02 GMT)
Distributed Implementation of Variational Quantum Eigensolver to Solve QUBO Problems [0.0] 本稿では分散アルゴリズムと変分量子固有解法(VQE)の実装について述べる。
DVQEは、分散方式で複数の量子処理ユニット(QPU)にまたがるパラメータ化量子回路の実行を可能にする。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:55:07 GMT)
DinoTwins: Combining DINO and Barlow Twins for Robust, Label-Efficient Vision Transformers [0.0] DINO (Teacher-Student Learning) と Barlow Twins (Landance reduction) を組み合わせて,ラベルが少なく,計算能力も低いモデルを構築します。
予備的な結果は、組み合わせたアプローチは、強い特徴表現を維持しながら、DINOに匹敵する損失と分類精度を達成できることを示している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 20:18:05 GMT)
Deterministic generation of photonic entangled states using decoherence-free subspaces [0.0] 我々は、光の量子状態の決定論的生成のための資源として、物質の集合状態を用いることを提案する。
発光体間の光子による相互作用は、明るい状態と暗い状態の出現をもたらす。
これらのゲートのシーケンシャルな応用は、フォトニックな絡み合った状態を生み出すことを実証する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 00:23:09 GMT)
Design of broadband optical gain in GaSb-based waveguide amplifiers with asymmetric quantum wells [0.0] 2μm以上で動作するGaSb系半導体増幅器においてブロードバンド光利得を実現するための設計戦略を示す。
異なる厚さの非対称GaInSb/AlGaAsSb量子井戸(QWs)を用いることで、平坦で広い利得スペクトルが示される。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:09:11 GMT)
DeepCFD: Efficient near-ground airfoil lift coefficient approximation with deep convolutional neural networks [0.0] VGG法は地上近傍の翼の昇降抵抗係数を予測するために用いられる。
VGG法が他の手法よりも優れているのは、その結果が他のCNN法よりも正確である点である。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:58:58 GMT)
Deep Learning with Self-Attention and Enhanced Preprocessing for Precise Diagnosis of Acute Lymphoblastic Leukemia from Bone Marrow Smears in Hemato-Oncology [0.0] 急性リンパ性白血病(ALL)は、小児と成人の双方で血液学的悪性腫瘍として広くみられる。
骨髄スミア画像からのall自動診断のためのディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 05:30:02 GMT)
Deep Learning Architectures for Medical Image Denoising: A Comparative Study of CNN-DAE, CADTra, and DCMIEDNet [0.0] CNN-DAE, CADTra, DCMIEDNet をMRI脳画像復調法として評価した。
ディープラーニングアプローチはすべて、従来のウェーブレットベースの手法よりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 06:26:27 GMT)
Correlations in the Binding Energy of Triexcitons and Biexcitons in Single CdSe/CdS Nanoplatelets Revealed by Heralded Spectroscopy [0.0] CdSe/CdSナノプレートから発生するトリエクシトン発光について検討した。
その結果, バイエクシトンとトリエクシトンに特徴的な青色変化がみられ, 反発性マルチエクシトン相互作用が示唆された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 09:12:02 GMT)
Convergence and Generalization of Anti-Regularization for Parametric Models [0.0] 反正則化(AR)は、小サンプル体制におけるモデル表現性を意図的に増加させる損失に対して、符号反転報酬項を付加する。
我々は、スペクトル安全性と信頼領域条件を定式化し、投射演算子と勾配クリッピングを組み合わせた軽量な安定安全ガードを設計する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 15:34:17 GMT)
Capturing Legal Reasoning Paths from Facts to Law in Court Judgments using Knowledge Graphs [0.0] 裁判所の判断は、法的規則がどのように解釈され、事実に適用されたかを明らかにする。
法的な推論を捉えるための既存の自動化アプローチは、事実が法的な規範にどのように関係しているかを正確には追跡しない。
本稿では,648件の日本行政裁判所判決から法的知識グラフを構築した。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 12:51:40 GMT)
Bypassing eigenstate thermalization with experimentally accessible quantum dynamics [0.0] 固有状態の熱化は、フォン・ノイマンの初期の量子エルゴード性の研究以来、量子統計力学の妥当性の決定者として重要な役割を果たしてきた。
ここでは、エネルギーレベル間隔を有限エネルギー分解能で粗粒化する制限に対処するために、エネルギーバンド熱化の概念を紹介する。
エネルギーバンドの熱化は、エネルギー固有値や固有状態の微妙な性質に頼ることなく、ほぼ全ての物理的状態における観測可能な熱化を時間スケールで表すことを示す。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:11:22 GMT)
Boltzina: Efficient and Accurate Virtual Screening via Docking-Guided Binding Prediction with Boltz-2 [0.0] 構造に基づく薬物発見では、従来の分子ドッキング法による仮想スクリーニングを迅速に行うことができるが、予測精度の限界に悩まされる。
近年、Boltz-2が提案され、結合親和性予測の精度は極めて高いが、GPU当たりの化合物あたり約20秒を要する。
本研究では,Boltz-2の高精度性を生かし,計算効率を大幅に向上させる新しいフレームワークであるBoltzinaを提案する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 23:40:10 GMT)
Applying Deep Learning to Anomaly Detection of Russian Satellite Activity for Indications Prior to Military Activity [0.0] 本研究は,異常な活動を評価するための統計的および深層学習アプローチについて考察する。
第1次調査期間は、2022年2月24日の侵略までの6ヶ月間に焦点を当てている。
追加分析では、侵略日後にTLEデータをサンプリングすることにより、アクティブな戦闘期間におけるROS活動について調べる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 22:44:11 GMT)
AI-Powered Legal Intelligence System Architecture: A Comprehensive Framework for Automated Legal Consultation and Analysis [0.0] LICESアーキテクチャは、従来のパラグラフベンチマークと比較して、予備的な法的調査とケースアセスメント時間を90%以上削減することができる。
性能評価の結果、LICESアーキテクチャは予備的な法的研究とケースアセスメント時間を98%以上削減できることが示された。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 19:41:26 GMT)
A universal speed limit for spreading of coherence [0.0] 弱相互作用するボース・アインシュタイン凝縮体の形成過程におけるコヒーレンスの拡散を観察する。
我々の結果は、大規模コヒーレンスに依存し、他のシステムで同様の測定を招待する量子技術に関係している。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 21:56:28 GMT)
A Systematic Literature Review on Multi-label Data Stream Classification [0.0] 本稿では,マルチラベルデータストリーム分類の提案を詳細に分析する。
文献における最新の手法を特徴付け、包括的概要を提供し、徹底的な階層を構築し、アプローチが各問題にどのようにアプローチするかについて議論する。
我々は,主要なギャップを特定し,今後の研究の方向性を推奨する。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 17:17:15 GMT)
A New Approach to Unification [0.0] 本稿では, 重力, 電磁, 弱い, 強いプロセスに基づく全ての基本的な相互作用を統一する新しい視点を提案する。
Schr"odinger や Dirac 方程式のような重要な量子的特徴は、古典的なランダム過程から導出することができる。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 07:27:03 GMT)
A Comprehensive Review of Denial of Wallet Attacks in Serverless Architectures [0.0] Denial of Wallet(DoW)攻撃は、サーバーレスアーキテクチャにユニークな脅威をもたらしている。
DoW攻撃は、サービス運用に影響を与えることなくコストの増大に焦点を当てる。
本総説では,DoW研究の進展を,初期認識・攻撃分類から検出・緩和戦略の進展まで遡る。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 13:29:21 GMT)
$\mathrm{TIME}[t]\subseteq \mathrm{SPACE}[O(\sqrt{t})]$ via Tree Height Compression [0.0] Algebraic Replay Engineは、ポインターレスDSSとインデックスなしストリーミングとともに、一定の大きさのフィールド上の一定度マップを持つ。
S(b)=O(b+t/b)$は、残余乗法的ポリログ因子を持たない$O(sqrtt)$空間を与える。
論文参考訳(メタデータ) (Sun, 24 Aug 2025 04:40:20 GMT)