A Survey on Post-training of Large Language Models [185.5] 大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:52:05 GMT)
Meta CLIP 2: A Worldwide Scaling Recipe [112.5] 私たちは,世界規模のWebスケールイメージテキストペア上でCLIPをゼロからトレーニングする最初のレシピであるMeta CLIP 2を紹介する。
ゼロショットイメージネットの分類では、Meta CLIP 2 ViT-H/14は英語のみの分類を0.8%、mSigLIPを0.7%上回る。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:40:13 GMT)
Information-Theoretic Decentralized Secure Aggregation with Collusion Resilience [98.3] 情報理論の観点から分散型セキュアアグリゲーション(DSA)の問題点を考察する。
DSAの最小到達可能な通信量と秘密鍵率を指定する最適レート領域を特徴付ける。
本研究は,DSAの基本性能限界を確立し,信頼性の高い通信効率の高いプロトコルの設計に関する知見を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:51:37 GMT)
Multimodal Referring Segmentation: A Survey [93.2] マルチモーダル参照セグメンテーション(Multimodal reference segmentation)は、テキストやオーディオフォーマットでの参照表現に基づいて、画像、ビデオ、および3Dシーンなどのターゲットオブジェクトを視覚シーンに分割することを目的としている。
過去10年間で、畳み込みニューラルネットワーク、トランスフォーマー、および大規模言語モデルの進歩によって、マルチモーダルコミュニティにおいて大きな注目を集めてきた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:14:00 GMT)
Large AI Model-Enabled Secure Communications in Low-Altitude Wireless Networks: Concepts, Perspectives and Case Study [92.2] 低高度無線ネットワーク(LAWN)は、様々なアプリケーションをサポートすることにより、通信に革命をもたらす可能性がある。
LAWNにおけるセキュア通信のための大規模人工知能モデル(LAM)対応ソリューションについて検討する。
LAWNにおけるセキュア通信のためのLAMの実用的メリットを示すために,新しいLAMベースの最適化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:53:58 GMT)
A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence [87.1] 大きな言語モデル(LLM)は強力な能力を示しているが、基本的に静的である。
LLMはますますオープンでインタラクティブな環境にデプロイされているため、この静的な性質は重要なボトルネックとなっている。
この調査は、自己進化エージェントの体系的で包括的なレビューを初めて提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:17:09 GMT)
Decouple before Align: Visual Disentanglement Enhances Prompt Tuning [85.9] プロンプトチューニング(PT)は、視覚言語モデルのタスク固有の伝達性を改善する際、顕著な効果を示した。
本稿では,従来見過ごされていた情報非対称性の問題について述べる。
本稿では,直感的なデカプリアライン概念に基づく効果的なPTフレームワークであるDAPTを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:46:00 GMT)
LLaVA-Video: Video Instruction Tuning With Synthetic Data [84.6] ビデオ命令追従のための高品質な合成データセット、すなわちLLaVA-Video-178Kを作成する。
このデータセットには、詳細なキャプション、オープンエンド質問回答(QA)、複数選択QAといった重要なタスクが含まれている。
このデータセットをトレーニングすることにより、既存の視覚的インストラクションチューニングデータと組み合わせて、新しいビデオLMMであるLLaVA-Videoを導入する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:40:14 GMT)
Can LLMs Generate Tabular Summaries of Science Papers? Rethinking the Evaluation Protocol [83.9] 文献レビュー表は、科学論文の集合を要約し比較するために欠かせないものである。
学術論文の収集にあたり,ユーザの情報ニーズを最大限に満たす表を作成するタスクについて検討する。
我々の貢献は、現実世界で遭遇する3つの重要な課題に焦点を当てている: (i)ユーザープロンプトは、しばしば未特定である; (ii)検索された候補論文は、しばしば無関係な内容を含む; (iii)タスク評価は、浅いテキスト類似性技術を超えて進むべきである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:12:35 GMT)
DPoser-X: Diffusion Model as Robust 3D Whole-body Human Pose Prior [83.0] DPoser-Xは3次元人体写真の拡散に基づく先行モデルである。
提案手法は,様々なポーズ中心タスクを逆問題として統一し,変分拡散サンプリングにより解決する。
我々のモデルは、常に最先端の代替品よりも優れており、人体全体のポーズを事前モデリングするための新しいベンチマークを確立している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:56:39 GMT)
Preliminary Investigation into Uncertainty-Aware Attack Stage Classification [81.3] この研究は、不確実性の下での攻撃段階推論の問題に対処する。
Evidential Deep Learning (EDL) に基づく分類手法を提案し、ディリクレ分布のパラメータを可能な段階に出力することで予測の不確実性をモデル化する。
シミュレーション環境における予備実験により,提案モデルが精度良く攻撃の段階を推定できることが実証された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:58:00 GMT)
IGL-Nav: Incremental 3D Gaussian Localization for Image-goal Navigation [78.0] IGL-Navは、効率的で3D対応の画像ゴールナビゲーションのためのインクリメンタルな3Dガウスフレームワークである。
より困難な自由視点のイメージゴール設定を処理し、現実世界のロボットプラットフォームにデプロイすることができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:59:56 GMT)
MCPEval: Automatic MCP-based Deep Evaluation for AI Agent Models [76.7] 我々は、エンドツーエンドタスク生成とインテリジェントエージェントの深い評価を自動化するオープンソースのフレームワークであるMCPEvalを紹介する。
MCPEvalはメトリクスを標準化し、ネイティブエージェントツールとシームレスに統合し、評価パイプラインを構築するための手作業を排除する。
実世界の5つのドメインにまたがる実証的な結果から、ニュアンスのある、ドメイン固有のパフォーマンスを明らかにする効果が示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:37:16 GMT)
MASIV: Toward Material-Agnostic System Identification from Videos [76.4] MASIVは、物質に依存しないシステム識別のためのビジョンベースのフレームワークである。
学習可能なニューラルモデルを採用し、シーン固有の物質を事前に仮定することなく、オブジェクトのダイナミクスを推定する。
幾何的精度、レンダリング品質、一般化能力において最先端の性能を達成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:23:45 GMT)
Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models [74.2] 拡散大言語モデルは効率的な並列生成とグローバルモデリングを提供する。
DLLMの主流の応用は、静的に事前定義された生成長の必要性によって妨げられている。
DAEDALは,動的適応長拡張を可能にする新しい学習自由化戦略である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:56:07 GMT)
The Prosody of Emojis [73.7] 本研究は,絵文字が音声の韻律的実現にどのように影響するか,また,聴取者が韻律的手がかりを解釈して意味を回復するかを検討する。
従来の研究とは異なり、我々は、構造化されているがオープンな生産と知覚タスクを通して収集された実際の人間の音声データを分析して、韻律と絵文字を直接リンクする。
その結果、話者は絵文字の手がかりに基づいて韻律を適応し、リスナーは韻律変化のみから意図した絵文字を識別することができ、絵文字間の意味的差異は韻律の発散の増加に対応していることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:24:12 GMT)
MIHBench: Benchmarking and Mitigating Multi-Image Hallucinations in Multimodal Large Language Models [73.2] マルチイメージMLLMにおける幻覚に関する最初の体系的研究を行う。
複数の画像に対してオブジェクト関連幻覚を評価するためのベンチマークであるMIHBenchを提案する。
MIHBenchは、Multi-Image Object Existence Hallucination、Multi-Image Object Count Hallucination、Object Identity Consistency Hallucinationの3つのコアタスクから構成される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:49:29 GMT)
Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [68.4] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する2つの未目標攻撃目標と,ロボット軌道を操作する目標攻撃目標を導入する。
我々は、カメラの視野に小さなカラフルなパッチを配置し、デジタルと物理の両方の環境で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:41:06 GMT)
Efficient Autoregressive Shape Generation via Octree-Based Adaptive Tokenization [68.1] 既存の方法では、すべての形状を固定サイズのトークンにエンコードし、3Dデータにまたがるスケールと複雑さの固有のバリエーションを無視している。
形状の複雑さに応じて潜在表現の次元を調節する新しいフレームワークであるOctoreeをベースとした適応トークン化を提案する。
当社の手法では,同等の視覚的品質を維持しながら,固定サイズの手法に比べてトークン数を50%削減する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:04:27 GMT)
Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training [67.9] 汎用AIエージェントは、次世代人工知能の基礎となるフレームワークとして、ますます認識されている。
現在のエージェントシステムはクローズドソースか、さまざまな有料APIやプロプライエタリなツールに大きく依存している。
我々は,完全オープンソースかつ(最大限に)フリーなマルチモジュールエージェントフレームワークであるCognitive Kernel-Proを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:11:31 GMT)
Gaga: Group Any Gaussians via 3D-aware Memory Bank [66.5] Gagaは、ゼロショットクラス非依存セグメンテーションモデルによって予測される一貫性のない2Dマスクを活用することで、オープンワールドの3Dシーンを再構築し、セグメント化する。
Gagaは、新しい3D認識メモリバンクを通じて、さまざまなカメラのポーズをオブジェクトマスクに関連付ける。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:48:53 GMT)
AllTracker: Efficient Dense Point Tracking at High Resolution [62.8] 問合せフレームとビデオの他のフレーム間のフロー場を推定することで、長距離トラックを推定するモデルであるAllTrackerを導入する。
既存の点追跡法とは異なり,本手法は高分解能かつ高密度(全画素)対応フィールドを提供し,フローマップとして可視化することができる。
モデルは高速かつパラメータ効率(16万のパラメータ)で、高解像度で最先端のポイントトラッキング精度を提供する(つまり、40G GPU上で768x1024ピクセルを追跡する)。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:44:17 GMT)
Web Artifact Attacks Disrupt Vision Language Models [61.6] 視覚言語モデル(VLM)は、大規模で軽量にキュレートされたWebデータセットに基づいて訓練されている。
意味概念と無関係な視覚信号の間に意図しない相関関係を学習する。
これまでの研究は、これらの相関関係をモデル予測を操作するための攻撃ベクトルとして武器化してきた。
非マッチングテキストとグラフィカル要素の両方を使ってモデルを誤解させる新しい操作のクラスである「アーティファクトベース」アタックを導入する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:25:19 GMT)
Dual Adaptivity: Universal Algorithms for Minimizing the Adaptive Regret of Convex Functions [61.4] オンライン学習において、新たなパフォーマンス指標、適応的後悔(adaptive regret)が提案された。
適応的後悔を最小限に抑えるために、いくつかのアルゴリズムが開発されている。
既存のアルゴリズムは1種類の凸関数しか扱えないという意味で普遍性を欠いている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:42:38 GMT)
TensoMeta-VQC: A Tensor-Train-Guided Meta-Learning Framework for Robust and Scalable Variational Quantum Computing [61.0] TensoMeta-VQCは、VQCの堅牢性とスケーラビリティを大幅に向上させるために設計された、TT誘導型メタラーニングフレームワークである。
我々のフレームワークは、量子回路パラメータの生成を古典的なTTネットワークに完全に委譲し、量子ハードウェアから最適化を効果的に分離する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:37:55 GMT)
Trans-Adapter: A Plug-and-Play Framework for Transparent Image Inpainting [60.1] 既存の画像の塗装法は、RGB画像専用に設計されている。
Trans-Adapterは、拡散ベースのインペイントモデルで透過的な画像を直接処理できるプラグイン・アンド・プレイアダプタである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:27:21 GMT)
Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.7] 医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:41:31 GMT)
UIS-Mamba: Exploring Mamba for Underwater Instance Segmentation via Dynamic Tree Scan and Hidden State Weaken [57.8] マンバは本質的に線形な複雑性と大域的受容場を持つ新興状態空間モデルである。
我々は,最初のマンバ型水中インスタンスセグメンテーションモデル UIS-Mamba を提案し,動的ツリースキャン (DTS) と隠れ状態ウィーケン (HSW) の2つの革新的なモジュールを設計した。
DTSモジュールは、パッチを動的にオフセットしスケールさせることで、インスタンスオブジェクトの内部機能の継続性を維持する。
HSWモジュールは複雑なバックグラウンドの干渉を抑制し、状態伝播の情報フローをインスタンス自体に効果的に焦点を合わせる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:21:24 GMT)
Semantic Chain-of-Trust: Autonomous Trust Orchestration for Collaborator Selection via Hypergraph-Aided Agentic AI [57.6] 本稿では,新たなセマンティック・チェーン・オブ・トラストの概念に基づく自律的信頼オーケストレーション手法を提案する。
我々の技術はエージェントAIとハイパーグラフを用いてデバイス間の信頼関係を確立し維持する。
実験により,提案手法が資源効率の高い信頼評価を実現することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:18:06 GMT)
Efficient Solution and Learning of Robust Factored MDPs [57.2] 未知の環境との相互作用からr-MDPを学習することで、性能保証による堅牢なポリシーの合成が可能になる。
本稿では,因子状態表現に基づくr-MDPの解法と学習法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:23:15 GMT)
Reinforcement Learning for Decision-Level Interception Prioritization in Drone Swarm Defense [56.5] 本稿では,この課題に対処する上で,強化学習の実践的メリットを示すケーススタディを提案する。
本研究では,現実的な運用制約を捉えた高忠実度シミュレーション環境を提案する。
エージェントは最適なインターセプション優先順位付けのために複数のエフェクターを調整することを学ぶ。
我々は、何百ものシミュレートされた攻撃シナリオにおいて、手作りルールベースのベースラインに対する学習ポリシーを評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:55:39 GMT)
FARM: Functional Group-Aware Representations for Small Molecules [55.3] 小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された新しいモデルである。
我々は、13のタスクのうち11のタスクで最先端のパフォーマンスを達成するMoleculeNetデータセット上で、FARMを評価した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:16:06 GMT)
HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2] HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:30:42 GMT)
FaceLift: Learning Generalizable Single Image 3D Face Reconstruction from Synthetic Heads [54.2] 1枚の画像から高画質の360度3Dヘッドを復元するための新しいフィードフォワードアプローチであるFaceLiftを提案する。
パイプラインはまずマルチビューの潜伏拡散モデルを用いて、1つの入力から一貫したサイドビューとバックビューを生成する。
FaceLiftは、アイデンティティ保存、ディテールリカバリ、レンダリング品質において、最先端の3D顔再構成方法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:09:31 GMT)
World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [54.0] 本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:47:48 GMT)
Training-free Geometric Image Editing on Diffusion Models [53.4] 画像内の物体が再配置、再配向、あるいは再形成されるような幾何学的画像編集の課題に取り組む。
本稿では、オブジェクト変換、ソース領域のインペイント、ターゲット領域の洗練を分離する分離パイプラインを提案する。
塗装と精錬は、トレーニングフリーの拡散アプローチであるFreeFineを使って実装されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:18:42 GMT)
Dynamic Knowledge Exchange and Dual-diversity Review: Concisely Unleashing the Potential of a Multi-Agent Research Team [53.4] IDVSCIは、大規模言語モデル(LLM)上に構築されたマルチエージェントフレームワークである。
動的知識交換機構とデュアルダイバーシティ・レビュー・パラダイムという2つの重要なイノベーションが組み込まれている。
結果は、IDVSCIが2つのデータセットで常に最高のパフォーマンスを達成していることを示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:35:50 GMT)
Node Duplication Improves Cold-start Link Prediction [53.2] グラフニューラルネットワーク(GNN)は、グラフ機械学習において顕著である。
近年の研究では、GNNは低次ノードで良い結果を出すのに苦労していることが示されている。
我々はNodeDupと呼ばれるシンプルだが驚くほど効果的な拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:55:43 GMT)
The Gittins Index: A Design Principle for Decision-Making Under Uncertainty [52.1] Gittinsインデックスは、不確実性に関わるさまざまな意思決定問題を最適に解決するツールである。
このチュートリアルは、Gittinsインデックスが実践的な問題に実効的に適用可能であることを実証するものだ。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:10:35 GMT)
AutoSchemaKG: Autonomous Knowledge Graph Construction through Dynamic Schema Induction from Web-Scale Corpora [51.8] 完全自律的な知識グラフ構築のためのフレームワークであるAutoKGを提案する。
大規模言語モデルを利用して知識トリプルを同時に抽出し,テキストから直接包括的なスキーマを誘導する。
我々は,9億以上のノードと590億のエッジを持つ知識グラフ群であるATLAS(Automated Triple Linking And induction)を構築した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:39:45 GMT)
Next Tokens Denoising for Speech Synthesis [51.3] Dragon-FMは、ARとフローマッチングを統合する新しいテキスト音声(TTS)設計である。
毎秒12.5トークンのコンパクトレートで48kHzのオーディオトークンをチャンクで処理する。
ポッドキャストデータセットの実験では、高品質なゼロショットポッドキャストを効率的に生成できることが示されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:37:42 GMT)
ULTHO: Ultra-Lightweight yet Efficient Hyperparameter Optimization in Deep Reinforcement Learning [50.5] ULTHOは,1回の走行で深部RLで高速HPOを実現するための,超軽量で強力なフレームワークである。
具体的には、HPOプロセスは、クラスタ化されたアーム(MABC)を備えたマルチアームバンディットとして定式化し、それを長期の戻り値の最適化に直接リンクする。
ALE、Procgen、MiniGrid、PyBulletなどのベンチマークでULTHOをテストする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:43:47 GMT)
SpA2V: Harnessing Spatial Auditory Cues for Audio-driven Spatially-aware Video Generation [50.0] SpA2Vは、生成プロセスをオーディオ誘導ビデオ計画とレイアウト接地ビデオ生成の2つの段階に分解する。
入力音声に意味的・空間的アライメントを持たせた実写映像の制作において,SpA2Vが優れていることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:05:04 GMT)
Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras [49.8] ハイパーコンプレックス画像処理は、代数的および幾何学的原理を含む統一パラダイムで従来の手法を拡張している。
このワークル平均は、自然・生体画像解析のための四元数と2次元平面(四元数 - ピクセルを表す - を2次元平面に分割する)を分割する。
提案手法は、画像の自動処理パイプラインの一部として、カラー外観(例えば、代替リフレクションやグレースケール変換)と画像コントラストを規制することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:44:43 GMT)
YOLO-Count: Differentiable Object Counting for Text-to-Image Generation [49.8] YOLO-Countは、一般的なカウント問題に対処し、テキスト・ツー・イメージ(T2I)生成のための正確な量制御を可能にする、微分可能なオープン語彙オブジェクトカウントモデルである。
コアコントリビューションは、オブジェクトサイズと空間分布のバリエーションを考慮に入れた、新しい回帰ターゲットである「心電図」である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:51:39 GMT)
Representative Action Selection for Large Action Space Meta-Bandits [49.4] バンドイットの族が共有する大きなアクション空間からサブセットを選択する問題について検討する。
我々は、同様の行動がガウス過程によってモデル化された関連する報酬を持つ傾向があると仮定する。
代表サブセットを選択するための簡単なepsilon-netアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:34:04 GMT)
Cross-Dataset Semantic Segmentation Performance Analysis: Unifying NIST Point Cloud City Datasets for 3D Deep Learning [49.2] 本研究では、公共安全アプリケーションに関連する異種ラベル付きポイントクラウドデータセット間のセマンティックセマンティックセマンティクス性能を解析する。
主な課題は、ラベル付きデータ不足、データセット間でクラスラベルを統一することの難しさ、標準化の必要性である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:59:02 GMT)
SparseRecon: Neural Implicit Surface Reconstruction from Sparse Views with Feature and Depth Consistencies [49.0] SparseReconは、ボリュームレンダリングに基づく特徴整合性と不確実性誘導深度制約を有するスパースビューのニューラル暗黙的再構成手法である。
提案手法は,スパースビュー入力による高品質な幾何を生成できる最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:51:32 GMT)
Multi-Layer Attention is the Amplifier of Demonstration Effectiveness [48.3] 本稿では,実証の非効率性の原因について考察する。
勾配フローをゼロにすることで、その情報がモデルによって学習されたり、ユーザクエリに無関係であったりした場合、デモは効果がないと推定する。
現在のデモ選択手法は,モデルがすでに同化している情報を見越しながら,ユーザクエリの関連性に主眼を置いているため,GradSと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:26:39 GMT)
GUIOdyssey: A Comprehensive Dataset for Cross-App GUI Navigation on Mobile Devices [48.0] クロスプラットフォームなモバイルGUIナビゲーションのためのデータセットであるGUIOdysseyを提示する。
GuiOdysseyは8,334エピソードで構成され、平均15.3ステップで6つのモバイルデバイス、212の異なるアプリ、1,357のアプリの組み合わせをカバーしている。
我々は,履歴リサンプラーモジュールを備えた長期横断ナビゲーションのための探索的マルチモーダルエージェントであるOdysseyAgentを開発した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:37:57 GMT)
BOOD: Boundary-based Out-Of-Distribution Data Generation [47.5] 本稿では,境界に基づくOut-Of-Distribution Data Generation(BOOD)という新しいフレームワークを提案する。
BOODは高品質なOOD特徴を合成し、拡散モデルを用いて人間互換の外部画像を生成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:34:27 GMT)
SiM3D: Single-instance Multiview Multimodal and Multisetup 3D Anomaly Detection Benchmark [46.4] 総合的な3次元異常検出・セグメンテーション(ADS)のためのマルチビュー情報とマルチモーダル情報の統合を考慮した最初のベンチマークであるSiM3Dを提案する。
SiM3Dは、製造に高い関心を持つシナリオに焦点を当てている。
SiM3Dには、トップレベルの産業用センサーとロボットを使用して取得される、新しいマルチモーダルマルチビューデータセットが含まれている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:54:34 GMT)
SPENCER: Self-Adaptive Model Distillation for Efficient Code Retrieval [46.2] 本研究では,効率の良いCodE検索のための自己AdaPtive Model Distillationを採用したフレームワークであるSPENCERを提案する。
両エンコーダとクロスエンコーダの組み合わせは,コード検索用のみのデュアルエンコーダベースモデルと比較して,全体的な性能を向上することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:39:32 GMT)
Disentangling Neural Disjunctive Normal Form Models [46.0] ニューラル・ディジャンクティブ・ノーマル・フォーム(英語版)(DNF)に基づくモデルは、ニューラル・シンボリック・ラーニングに対する強力で解釈可能なアプローチである。
ここでは、翻訳中の性能劣化の一部は、ネットワークの重みの形で表現される学習知識を乱すことができないためであることを示す。
ネストしたルールを小さな独立ノードにエンコードするノードを分割することで、モデルの性能をよりよく保存することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:51:05 GMT)
Lost in Benchmarks? Rethinking Large Language Model Benchmarking with Item Response Theory [44.9] Pseudo-Siamese Network for Item Response Theory (PSN-IRT) を提案する。
PSN-IRTは、アイテムの特性とモデル能力の正確かつ信頼性の高い推定に利用することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:56:21 GMT)
Towards Higher Effective Rank in Parameter-efficient Fine-tuning using Khatri--Rao Product [44.5] フルランク法と低ランクのPEFT法の比較を行った。
KRAdapterは、高い有効ランクの行列積を生成する新しいPEFTアルゴリズムである。
我々はKRAdapterによる1Bパラメータまでの視覚言語モデルと8Bパラメータまでの大規模言語モデルの性能向上を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:29:13 GMT)
Lattice Surgery Compilation Beyond the Surface Code [44.5] 表面コード以外のトポロジカルコードに対する格子手術のコンパイルについて検討する。
カラーコードや折り畳まれた表面コードなど,特定の基板やコードについて検討する。
カラーコードでは, マイクロおよびマクロレベルの設計選択が, コンパイルされた論理的$mathrmCNOT+mathrmT$回路の深さにどのように影響するかを数値シミュレーションで解析する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:30:22 GMT)
Spectral Sensitivity Estimation with an Uncalibrated Diffraction Grating [43.9] 本稿では,回折格子を用いたカメラスペクトル感度の実用的,正確な校正法を提案する。
本手法は, 直接照明画像と回折パターンの撮影により, カメラスペクトル感度と回折格子パラメータの両方をクローズドな方法で推定する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:34:08 GMT)
DP-DGAD: A Generalist Dynamic Graph Anomaly Detector with Dynamic Prototypes [43.3] 動的グラフ異常検出(DGAD)は、金融、トラフィック、ソーシャルネットワークなどの分野にわたるグラフの進化における異常を特定するために不可欠である。
本稿では,動的プロトタイプ(DP)を用いたDGADモデルを提案する。
DP-DGADは、ターゲットドメインにおける効果的な自己教師付き適応に信頼に基づく疑似ラベルを用いる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:35:50 GMT)
Sequential, Parallel and Consecutive Hybrid Evolutionary-Swarm Optimization Metaheuristics [43.1] 本稿ではPSOとGAの特徴を連続的・並列的・連続的に組み合わせたハイブリッド進化・スワームメタヒューリスティックスについて検討する。
実験結果から,ハイブリッドアプローチはより優れた収束と一貫性を実現することが示された。
本稿では,PSOとGAステップ間の連続性を明示的な情報伝達機構を通じて保証する,新しいハイブリッドPSO-GA進化アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:23:36 GMT)
Tailoring transport in quantum spin chains via disorder and collisions [41.9] 異方性XXZZスピン鎖の輸送ダイナミクスを形作る際の障害と時間均質衝突雑音の相互作用について検討した。
空間-等質衝突と低速度衝突は、後続の高原の形で局在が設定される領域を形成できる。
本研究は,移動および局在のシーケンスを調整可能なストロボスコーププロトコルの設計に応用できる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:23:41 GMT)
Photon-mediated interactions and dynamics of coherently driven quantum emitters in complex photonic environments [41.9] ボルン・マルコフのマスター方程式は量子光学現象の記述に広く用いられている。
我々は、このモデリング手法を、マクロ場量子化形式に基づく正確な計算に対してエミッタ対の量子力学に対してベンチマークする。
我々の分析では、レーザー駆動と周波数分割の4つの異なる状態が明らかとなり、有効モデルの精度は著しく異なる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:38:07 GMT)
Evolutionary Generative Optimization: Towards Fully Data-Driven Evolutionary Optimization via Generative Learning [41.4] 我々は、生成学習によって強化された完全なデータ駆動型フレームワークを提案する。
EvoGOは進化的最適化プロセスを、データ準備、モデルトレーニング、人口生成の3段階に合理化している。
数値ベンチマーク、古典的な制御問題、高次元ロボットタスクの実験により、EvoGOはわずか10世代で一貫して収束することを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:17:57 GMT)
Do We Need Pre-Processing for Deep Learning Based Ultrasound Shear Wave Elastography? [40.4] 軟組織の弾性度を推定することは、様々な診断応用に有用な情報を提供することができる。
ディープラーニングベースのアプローチは、従来の超音波前処理ステップの必要性とバイアスを減らすことができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:26:46 GMT)
Adacc: Adaptive Compression and Activation Checkpointing for LLM Memory Management [40.4] Adaccは、適応圧縮とアクティベーションチェックポイントを組み合わせたメモリ管理フレームワークで、GPUメモリフットプリントを削減する。
Adaccは、最先端のフレームワークと比較して、LLMトレーニングを1.01倍から1.37倍に加速することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:39:25 GMT)
GECO: Geometrically Consistent Embedding with Lightspeed Inference [39.8] GECOは幾何学的コヒーレントな特徴を生成し、幾何に基づいて部品を意味的に区別する。
最適なトランスポートに基づくトレーニングフレームワークを提案し,キーポイントを超えた監視を可能にする。
GECOは軽量なアーキテクチャで30fps、98.2%の速度で動作している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:21:11 GMT)
HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation [38.6] 大規模マルチモーダルモデル(LMM)は視覚的質問応答(VQA)、画像キャプション、接地といったタスクで広くテストされてきた。
HumaniBenchは、32,000の現実世界の画像検索ペアと評価スイートの新しいベンチマークである。
HumaniBenchは、公正性、倫理、共感、傾倒性、推論、堅牢性、多言語性という7つの主要なアライメント原則にまたがるLMMを評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:38:04 GMT)
Video Color Grading via Look-Up Table Generation [38.1] 本稿では,参照型ビデオカラーグレーティングフレームワークを提案する。
私たちのキーとなるアイデアは、参照シーンと入力ビデオ間の色属性アライメントのためのルックアップテーブル(LUT)を明示的に生成することです。
トレーニングの目的として、参照シーンのルック、ムード、感情などの高レベルな特徴は、入力ビデオと類似すべきである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:43:30 GMT)
Enhanced Vision-Language Models for Diverse Sensor Understanding: Cost-Efficient Optimization and Benchmarking [38.0] 本稿では,センサ画像の理解を大幅に向上させる,コスト効率の高い新しいパラダイムを提案する。
本稿では, 逆負の属性 (DNA) を最適化したセンサ・アウェア・属性・ファイン・チューニング (SAFT) を提案する。
VLMのセンサ固有の理解を厳格に評価するために設計されたVS-TDXは、最初の総合的な公開ベンチマークである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:09:21 GMT)
Learning Plasma Dynamics and Robust Rampdown Trajectories with Predict-First Experiments at TCV [37.9] トカマクにおける可変ランプダウンの時, プラズマ力学を予測するニューラル状態空間モデル(NSSM)を開発した。
NSSMは、原子炉関連高性能システムにおいて、わずか5パルスの311パルスの控えめなデータセットから効率よくダイナミクスを学習する。
TCVの高性能実験は、関連するメトリクスの統計的に有意な改善を示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:12:00 GMT)
Distillation versus Contrastive Learning: How to Train Your Rerankers [37.4] コントラスト学習と知識蒸留という2つの戦略がテキスト・リランカーの訓練に広く用いられている。
本稿では,異なるサイズとアーキテクチャのリランカを同一データ上で両方の手法を用いて訓練することにより,これらの戦略を実証的に比較する。
以上の結果から,知識の蒸留は,より大きな教師モデルからの蒸留において,対照的な学習よりもドメイン内およびドメイン外におけるランク付け性能が向上することが示唆された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:33:29 GMT)
Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving [36.2] 本研究では,レムマ型全耐久推論モデルである textbfSeed-Prover を提案する。
IMOレベルの競合問題を解決するために、深い推論と広い推論の両方を可能にする3つのテストタイム推論戦略を設計する。
シード・プロバーは、過去のIMO問題の78.1%ドルを証明し、ミニF2Fを飽和させ、パットナムベンチで50%以上を達成し、それまでの最先端よりも大きな差を付けた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:36:47 GMT)
PilotRL: Training Language Model Agents via Global Planning-Guided Progressive Reinforcement Learning [36.1] 大規模言語モデル(LLM)はエージェント指向タスクの処理において顕著な進歩を見せている。
現在のアプローチは主に教師付き微調整に依存しており、しばしばモデルが確立されたタスク完了軌跡を記憶させる。
適応的グローバルプランベースエージェントパラダイムであるAdaPlanを導入する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:17:11 GMT)
MAO-ARAG: Multi-Agent Orchestration for Adaptive Retrieval-Augmented Generation [35.9] 質問応答システム(QA)では、応答精度の向上と幻覚の軽減にRAG(Retrieval-Augmented Generation)が重要になっている。
マルチエージェントオーケストレーションを利用するMAO-ARAGという適応型RAGフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:15:22 GMT)
MaPPO: Maximum a Posteriori Preference Optimization with Prior Knowledge [35.7] 本稿では,好みから学習するフレームワークであるPosteriori Preference Optimization (MaPPO)を提案する。
MaPPOは、事前の報酬推定値を、原則的最大値MaP(Posteriori)目標に統合する。
MaPPOはDPOの亜種を一貫して改善したプラグインとして使用できる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:48:02 GMT)
Can Large Pretrained Depth Estimation Models Help With Image Dehazing? [35.5] 現実のシーンにおけるヘイズの性質が空間的に異なるため、画像のデハージングは依然として困難な問題である。
本稿では,様々なデハージングアーキテクチャとシームレスに統合可能なRGB-D融合モジュールを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:14:45 GMT)
MV-MATH: Evaluating Multimodal Math Reasoning in Multi-Visual Contexts [35.0] MV-MATHは,2,009の高次数問題からなる厳密にキュレートされたデータセットである。
それぞれの問題は、K-12シナリオから派生したテキストでインターリーブされた複数の画像を統合し、詳細なアノテーションで富む。
MV-MATHには、複数の選択、自由形式、多段階の質問が含まれており、3つの困難レベルにわたる11の主題領域をカバーしている。
我々は,マルチ視覚数学におけるMLLMの課題が,MV-MATH上での人間の能力に比較してかなりの性能差があることを観察した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:54:16 GMT)
Policy Maps: Tools for Guiding the Unbounded Space of LLM Behaviors [34.9] ポリシーマップは、物理的な地図作成の実践に触発されたAIポリシー設計のアプローチである。
Policy Projectorを使用することで、AI実践者はモデル入力と出力のペアの状況を調査し、カスタムリージョンを定義し、if-thenポリシールールでこれらのリージョンをナビゲートすることができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:19:11 GMT)
Benchmarking LLMs for Unit Test Generation from Real-World Functions [34.7] ULT(UnLeakedTestbench)は,実世界のPython関数から関数レベルのユニットテストを生成するために設計された,新しいベンチマークである。
3,909個の関数レベルのタスクを慎重に選択することで、ULTはLLMのテスト生成能力をより現実的で挑戦的な評価を提供する。
以上の結果から,ULTはより困難であることが示唆された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:08:26 GMT)
Model Stock: All we need is just a few fine-tuned models [34.4] 本稿では,大規模な事前学習モデルに対する効率的な微調整手法を提案し,強力な分布内分散(ID)と分布外分散(OOD)性能を提供する。
最終的な重量を達成するために、はるかに少ないモデルを採用するが、精度は優れている。
事前学習型CLIPアーキテクチャに基づく微調整モデルを用いたモデルストックの有効性を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:30:12 GMT)
OpenSeg-R: Improving Open-Vocabulary Segmentation via Step-by-Step Visual Reasoning [33.9] オープン語彙セグメンテーションのためのステップバイステップ視覚推論フレームワークOpenSeg-Rを提案する。
我々は各画像に対する一般的な推論と画像固有の推論の両方を生成し、粗い方法でオブジェクトの視覚的理由を説明する構造的な三重項を形成する。
実験の結果,OpenSeg-Rは,オープン語彙セマンティックセマンティックセグメンテーションにおける最先端手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:53:45 GMT)
Learning Unified User Quantized Tokenizers for User Representation [33.4] U2QT(Unified User Quantized Tokenizers)は、ドメイン間の知識伝達と異種ドメインの初期融合を統合する新しいフレームワークである。
第1に、マルチビューRQ-VAEは、共有およびソース固有のコードブックを通じて、コンパクトトークンへの因果埋め込みを識別し、セマンティックコヒーレンスを維持しながら効率的なストレージを可能にする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:35:32 GMT)
LAMIC: Layout-Aware Multi-Image Composition via Scalability of Multimodal Diffusion Transformer [32.9] LAMICはレイアウト対応のマルチイメージコンポジションフレームワークである。
単一の参照拡散モデルをトレーニング不要な方法でマルチ参照シナリオに拡張する。
ID-S、BG-S、IN-R、AVGのスコアにおいて、既存のマルチ参照ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:51:54 GMT)
GUAVA: Generalizable Upper Body 3D Gaussian Avatar [32.5] 3Dアバターの再構築には、通常、多視点または単眼ビデオと個々のIDのトレーニングが必要である。
まず,表情能力を高めるための表現型人間モデル(EHM)を提案する。
高速アニマタブルな上体3次元ガウスアバター再構成のための最初のフレームワークであるGUAVAを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:37:59 GMT)
SIDE: Surrogate Conditional Data Extraction from Diffusion Models [32.2] textbfSurrogate condItional Data extract (SIDE) は、データ駆動型サロゲート条件を構築し、任意のDPMからターゲット抽出を可能にするフレームワークである。
SIDEは、いわゆる安全無条件モデルからトレーニングデータを抽出し、条件付きモデルであってもベースラインアタックより優れていることを示す。
我々の研究は、DPMの脅威状況を再定義し、厳密な条件付けを基本的な脆弱性として確立し、モデルプライバシ評価のための新しいより強力なベンチマークを設定します。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:50:22 GMT)
Panopticon: Advancing Any-Sensor Foundation Models for Earth Observation [31.6] DINOv2フレームワーク上に構築された任意のセンサ基盤モデルであるPanopticonを提案する。
光学および合成開口レーダーセンサーの波長とモードを符号化することで、パノプティコンは任意のチャネルの組み合わせを効果的に処理できる。
パノプティコンは、既存の衛星プラットフォームと将来の衛星プラットフォームの両方への即時一般化を可能にする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:36:43 GMT)
The Silent Assistant: NoiseQuery as Implicit Guidance for Goal-Driven Image Generation [31.6] 本稿では,テキストプロンプトなどの明示的なユーザ定義入力を補完する暗黙のガイダンスとして,一致したガウスノイズを活用することを提案する。
NoiseQueryはきめ細かい制御を可能にし、ハイレベルなセマンティクスや低レベルなビジュアル属性よりもパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:14:17 GMT)
DC-AE 1.5: Accelerating Diffusion Model Convergence with Structured Latent Space [31.5] 高分解能拡散モデルのための新しい圧縮オートエンコーダであるDC-AE 1.5を提案する。
この課題に対処するために、構造化潜在空間と拡張拡散訓練という2つの重要なイノベーションを紹介します。
ImageNet 512x512では、DC-AE-1.5-f64c128は、DC-AE-f32c32より4倍高速な画像生成品質を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:11:07 GMT)
Long-LRM: Long-sequence Large Reconstruction Model for Wide-coverage Gaussian Splats [31.4] Long-LRMはフィードフォワード3次元ガウス再構成モデルであり、高速で高解像度、360度広視野、シーンレベルの再構成を行う。
解像度960x540の32の入力イメージを取り込み、1つのA100 GPUでわずか1秒で再構成を生成する。
大規模DL3DVベンチマークとTurps&TemplesでLong-LRMを評価し,最適化手法に匹敵する再現性を示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:29:18 GMT)
How Far Are AI Scientists from Changing the World? [30.5] AI科学者は、世界を変え、科学研究パラダイムを変えるのにどれくらい時間がかかるのか?
我々は、AI Scientistシステムの現在の成果を包括的に分析する展望駆動レビューを提供する。
この調査が、現在のAI Scientistシステムの限界の明確化に寄与することを願っている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:49:36 GMT)
IssueBench: Millions of Realistic Prompts for Measuring Issue Bias in LLM Writing Assistance [30.3] IssueBenchは、大きな言語モデルにおける問題バイアスを測定するための2.49mの現実的なプロンプトのセットである。
現状のLLMでは問題バイアスが一般的で永続的であることを示す。
あらゆるモデルは、一部の問題に関して共和党の有権者の意見よりも、民主党の意見と一致している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:26:57 GMT)
From Generator to Embedder: Harnessing Innate Abilities of Multimodal LLMs via Building Zero-Shot Discriminative Embedding Model [29.9] MLLM(Multimodal Large Language Models)は、汎用的な埋め込みタスクのための有望なソリューションとして登場した。
しかし、その生成的性質を差別的表現学習に適用することは、依然として重要な課題である。
本稿では,2つの相乗的成分を中心としてギャップを埋める,普遍的マルチモーダル埋め込みのための効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:31:24 GMT)
AI-Driven Collaborative Satellite Object Detection for Space Sustainability [29.8] 低地球軌道(LEO)における衛星密度の増大は、宇宙の持続可能性に深刻な課題をもたらす。
従来の地上追跡システムは、レイテンシとカバレッジの制限によって制限されている。
本稿では,複数の衛星間での深層学習(DL)に基づく空間オブジェクト検出タスクの協調実行を可能にする新しい衛星クラスタリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:31:55 GMT)
Sign Spotting Disambiguation using Large Language Models [29.8] 本稿では,Large Language Models(LLMs)を統合して,符号スポッティング品質を大幅に向上させる,学習自由フレームワークを提案する。
提案手法は,グローバル・テンポラル・ハンド形状の特徴を抽出し,その特徴を大規模手話辞書と照合する。
この辞書ベースのマッチングは本質的に、モデルの再訓練を必要とせず、より優れた語彙の柔軟性を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:56:35 GMT)
Co-Reward: Self-supervised Reinforcement Learning for Large Language Model Reasoning via Contrastive Agreement [29.5] 検証可能な報奨(RLVR)による強化学習は、大規模言語モデル(LLM)の推論能力の向上を約束している。
我々は,意味的類似質問間のコントラスト合意を報酬ベースとして活用する新しいRLフレームワークであるtextitCo-Rewardを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:09:14 GMT)
Unlocking Multi-Modal Potentials for Link Prediction on Dynamic Text-Attributed Graphs [28.5] Dynamic Text-Attributed Graphs (DyTAGs)は、リッチテキスト属性とともに進化する時間的イベント(エッジ)をキャプチャする新しいグラフパラダイムである。
MoMentは、リンク予測のためのノード表現を学習するために、各モードを明示的にモデル化し、統合し、調整するマルチモーダルモデルである。
実験の結果、MoMentは最大17.28%の精度向上を実現し、8つのベースラインに対して最大31倍のスピードアップを達成した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:07:08 GMT)
Can User Feedback Help Issue Detection? An Empirical Study on a One-billion-user Online Service System [28.4] 我々は,1億ユーザオンラインサービスシステムにおいて,現実世界の6つのサービスから50,378,766件のユーザフィードバック項目について実証的研究を行った。
以上の結果から,ユーザからのフィードバックがシステム問題に関する無関係な情報を提供することが明らかとなった。
ユーザのフィードバック特性のみに基づいて、容易に検出できない深刻な問題を見つけ出す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:49:07 GMT)
Federated Cross-Training Learners for Robust Generalization under Data Heterogeneity [28.0] これにより、モデルは異なるソースからのデータをトレーニングし、一般化能力を改善することができる。
パーソナライズされた視点からの知識の蒸留は、クライアント固有の特性を保持し、局所的な知識基盤を広げる。
我々は,FedCTが局所的,グローバル的両視点からの知識を緩和し,最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:35:34 GMT)
H-RDT: Human Manipulation Enhanced Bimanual Robotic Manipulation [27.6] H-RDT(Human to Robotics Diffusion Transformer)は、人間の操作データを利用してロボット操作能力を向上する新しいアプローチである。
私たちの重要な洞察は、大規模なエゴセントリックな人間操作ビデオとペアの3Dハンドポーズアノテーションが、自然な操作戦略を捉えたリッチな行動優先を提供するということです。
本研究では,(1)大規模な人間操作データに対する事前トレーニング,(2)モジュール型アクションエンコーダとデコーダを用いたロボット固有のデータに対するクロスエボディメント微調整という2段階の訓練パラダイムを導入する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:30:43 GMT)
YOLOO: You Only Learn from Others Once [27.2] 我々は,新しいマルチモーダル3DMOTパラダイムである textbyoLOO を提案する。
YOLOOはポイントクラウドエンコーダに、ポイントクラウドや他のモダリティ(画像やテキストキューなど)から統一されたトリモーダル表現(UTR)を一度に学習する権限を与える。
特に、YOLOOは、2つのコアコンポーネント: 統一三モードエンコーダ(UTEnc)とフレキシブルな幾何学的制約(F-GC)モジュール。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:47:01 GMT)
GeoMoE: Divide-and-Conquer Motion Field Modeling with Mixture-of-Experts for Two-View Geometry [26.9] ストリーム化フレームワークであるGeoMoEを用いて2次元形状の運動場モデリングを再構築する。
我々はまず,不整合確率信号を利用した確率的事前誘導分解戦略を考案し,運動場の構造を考慮した分解を行う。
次に,空間コンテキストやチャネルセマンティックパスに沿って各サブフィールドを拡大するMoE拡張Biパス整流器を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:45:47 GMT)
The Promise of RL for Autoregressive Image Editing [26.9] 本稿では,幅広い画像編集タスクの性能向上のための3つの戦略について検討する。
我々は,テキストトークンと視覚トークンを統一的に処理する自動回帰マルチモーダルモデルを採用する。
RLと大規模マルチモーダルLLM検証器を組み合わせることで,これらの戦略の最も効果的な方法が分かる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:47:29 GMT)
AniMer+: Unified Pose and Shape Estimation Across Mammalia and Aves via Family-Aware Transformer [26.7] スケーラブルなAniMerフレームワークの拡張バージョンであるAniMer+を紹介します。
AniMer+の重要なイノベーションは、その高容量、家族対応ビジョントランス(ViT)である。
CtrlAni3D for quadrupeds と CtrlAVES3D for birds の2つの大規模な合成データセットを生成した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:53:03 GMT)
Conditional independence testing with a single realization of a multivariate nonstationary nonlinear time series [26.2] 非定常非線形過程を単一実現した条件独立試験のための最初のフレームワークを紹介する。
我々のフレームワークの主な技術要素は、時間変化の非線形回帰、誤差過程の積の局所的長期共分散の推定、分布均一な強いガウス近似である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:24:36 GMT)
Random Walk Learning and the Pac-Man Attack [25.7] 我々は,悪質なノードが訪問する任意のRWを確率的に終了させる,パックマン攻撃(Pac-Man's attack)と呼ぶ敵の脅威を調査する。
このステルスな動作は、ネットワークからアクティブなRWを徐々に排除し、障害アラームを発生させることなく、学習プロセスを効果的に停止させる。
この脅威に対処するために、パックマンの存在下でのRWの消滅を防止するために、RWの完全分散機構である平均交差(AC)アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:27:02 GMT)
Wukong Framework for Not Safe For Work Detection in Text-to-Image systems [25.5] WukongはトランスフォーマーベースのNSFW検出フレームワークである。
初期段階からの中間出力を利用して、U-Netのトレーニング済みのクロスアテンションパラメータを再利用する。
その結果、Wukongはテキストベースの安全ガードを著しく上回り、画像フィルタの精度に匹敵する結果を得た。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:45:30 GMT)
FGBench: A Dataset and Benchmark for Molecular Property Reasoning at Functional Group-Level in Large Language Models [25.4] FGBenchは、625Kの分子特性解析問題と機能的グループ情報を組み合わせたデータセットである。
FGBenchは、分子特性推論のための3つのカテゴリにまたがる245の異なる官能基上の回帰タスクと分類タスクを含む。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:15:29 GMT)
Multi-grained spatial-temporal feature complementarity for accurate online cellular traffic prediction [25.4] 提案手法は,現実的な連続予測シナリオにおいて高精度な予測を実現するために考案された。
4つの実世界のデータセットで実施された実験は、MGSTCが11の最先端のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:33:32 GMT)
Detection, Pose Estimation and Segmentation for Multiple Bodies: Closing the Virtuous Circle [24.6] 新しいマスク条件のポーズ推定モデルであるMaskPoseは、OCHumanにおけるトップダウンアプローチの中でも最高のものである。
BBox-Mask-Poseは、OCHumanデータセット上のSOTAを、検出、インスタンスセグメンテーション、ポーズ推定という3つのタスクすべてでプッシュする。
大規模なインスタンスが重複するシーンでは特に良好で、ベースライン検出器よりも39%検出が改善されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:41:12 GMT)
Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization [24.2] DecisionFocused by Supervised Learningは、ロバストなポートフォリオ最適化のためのフレームワークである。
DSLはDeep Ensembleメソッドを使用し、ポートフォリオ割り当てのばらつきを大幅に低減します。
アンサンブルサイズが大きくなると、中央値のリターンが向上し、リスク調整性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:58:51 GMT)
AudioGen-Omni: A Unified Multimodal Diffusion Transformer for Video-Synchronized Audio, Speech, and Song Generation [24.2] AudioGen-Omniは、入力されたビデオとコヒーレントに同期した高忠実な音声、音声、歌を生成する。
ジョイントトレーニングパラダイムは、大規模ビデオテキストオーディオコーパスを統合している。
密度フレームレベルの表現は、AdaLNベースのジョイントアテンション機構を用いて融合する。
推測時間は8秒間1.91秒であり、効率と一般性の両方で大幅に改善されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:03:57 GMT)
Aesthetics is Cheap, Show me the Text: An Empirical Evaluation of State-of-the-Art Generative Models for OCR [24.0] 我々は,テキスト画像の生成と編集の観点から,最先端の生成モデルの能力を評価する。
我々は、33の代表的なタスクを選択し、それらを文書、手書きテキスト、シーンテキスト、芸術テキスト、複雑でレイアウトに富んだテキストの5つのカテゴリに分類する。
包括的評価のために,クローズド・ソース領域とオープンソース領域の2つの領域にまたがる6つのモデルについて,画像入力とプロンプトを用いて検討した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:44:06 GMT)
Session-Based Recommendation with Validated and Enriched LLM Intents [23.8] セッションベースのレコメンデーション(SBR)は、匿名ユーザの次の項目をタイムリーに予測することを目的としている。
最近の研究は,大規模言語モデル(LLM)を用いたセッションの基盤となるユーザ意図の推測について検討している。
SBRのための検証および拡張LLM生成インテントを利用する2段階フレームワークVELI4SBRを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:11:10 GMT)
Revisiting Adversarial Patch Defenses on Object Detectors: Unified Evaluation, Large-Scale Dataset, and New Insights [23.7] 2つの攻撃目標、13のパッチアタック、11のオブジェクト検出器、および4つの多様なメトリクスを含む、最初のパッチ防御ベンチマークを提示する。
これにより94種類のパッチと94,000のイメージを備えた大規模対向パッチデータセットが実現される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:06:20 GMT)
LeakyCLIP: Extracting Training Data from CLIP [23.7] textbfLeakyCLIPは、CLIP埋め込みから高品質でセマンティックに正確な画像再構成を実現することを目的としている。
CLIPのインバージョンでは,1)非破壊的特徴,2)テキスト埋め込みにおける視覚的セマンティクスの制限,3)再構築精度の低下,の3つの課題が指摘されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:32:48 GMT)
Socrates or Smartypants: Testing Logic Reasoning Capabilities of Large Language Models with Logic Programming-based Test Oracles [23.6] SmartyPatは、難解で自然に表現され、体系的にラベル付けされたベンチマークであり、微妙な論理的な誤りを含む現実世界の高品質なRedditの投稿に由来する。
手動データ収集とラベル付けの限界に対処するため,我々はSmartyPatを紹介した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:43:41 GMT)
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation [23.5] 提案するTextbfReaRecは,レコメンデータシステムのための最初の推論時間計算フレームワークである。
ReaRecはシーケンスの最後の隠された状態をシーケンシャルレコメンデータに自動的にフィードする。
本稿では2つの軽量推論に基づく学習手法,ERL(Ensemble Reasoning Learning)とPRL(Progressive Reasoning Learning)を紹介する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:17:57 GMT)
Hestia: Hierarchical Next-Best-View Exploration for Systematic Intelligent Autonomous Data Collection [23.4] 本研究は,階層的Next-Best-View Exploration for Systematic Intelligent Autonomous Data Collection (Hestia)を紹介する。
Hestiaはデータセットの選択、観察設計、アクション空間、報酬計算、学習スキームなどのコアコンポーネントを提案することで、次のベストビュータスクを体系的に定義する。
実験の結果、HestiaはNVIDIA IsaacLab環境で翻訳された3つのデータセットとオブジェクト設定に対して堅牢に動作していることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:27:23 GMT)
ROVI: A VLM-LLM Re-Captioned Dataset for Open-Vocabulary Instance-Grounded Text-to-Image Generation [23.1] ROVIは,画像生成のための高品質な合成データセットである。
私たちの重要なイノベーションは、リキャプション(recaptioning)と呼ばれる戦略です。
実証的目的のために、ROVIで訓練されたテキスト・ツー・イメージモデルGLIGENは、例えば精度、迅速な忠実度、美的品質において最先端の代替品よりも著しく優れている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:19:51 GMT)
Navigating Distribution Shifts in Medical Image Analysis: A Survey [23.0] 本稿では,分散シフトの影響を受け,深層学習手法をMedIAシステムに適用するアプローチを体系的にレビューする。
既存の作業は、共同トレーニング、フェデレートラーニング、ファインチューニング、ドメインジェネリゼーションに分類する。
これらのトピックを深く掘り下げることで、今後の研究の道筋が浮かび上がる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:00:18 GMT)
Learning an Efficient Multi-Turn Dialogue Evaluator from Multiple Judges [22.7] 選好知識を1つのモデルに集約することで,複数のLLM審査員の集合的知恵を捉える,効率的なマルチターン対話評価器を提案する。
評価コストを大幅に削減しつつ,多様なマルチジャッジフィードバックの利点を保ちながら,高速かつ柔軟な対話品質評価を実現している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:26:01 GMT)
Instruction-Grounded Visual Projectors for Continual Learning of Generative Vision-Language Models [22.6] 継続学習により、事前学習された視覚言語モデルは、以前のタスクからのデータを再学習することなく、新しいタスクからの知識を組み込むことができる。
近年,視覚プロジェクタを更新して視覚情報を新しいタスクに翻訳し,学習済みの視覚エンコーダを大規模言語モデルに接続する手法が提案されている。
本稿では,言語モデルの命令に視覚情報を翻訳する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:08:09 GMT)
FinResearchBench: A Logic Tree based Agent-as-a-Judge Evaluation Framework for Financial Research Agents [22.3] FinResearchBenchはロジックツリーベースのエージェント・アズ・ア・ジャッジであり、金融調査エージェントに特化したターゲットである。
ファイナンシャル・リサーチ・ドメインにおける7つの重要なタスクの総合的かつ自動評価を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:57:18 GMT)
Online Nonsubmodular Optimization with Delayed Feedback in the Bandit Setting [22.2] 帯域幅設定における遅延フィードバックによるオンライン非モジュール最適化について検討する。
本稿では,一点勾配推定器を用いた新しいDBGD-NF法を提案する。
また,ブロック更新機構を用いてDBGD-NFを拡張し,遅延と帯域幅フィードバックの結合効果を分離する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:00:19 GMT)
Time-RA: Towards Time Series Reasoning for Anomaly with LLM Feedback [22.2] Time-RA(Time-Series Reasoning for Anomaly)は、時系列異常検出を生成的、推論集約的なタスクに変換する。
また,実世界のマルチモーダルベンチマークデータセットであるRATs40Kを導入する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:03:05 GMT)
Mobile U-ViT: Revisiting large kernel and U-shaped ViT for efficient medical image segmentation [22.0] 医用画像分割に適した移動体U字型視覚変換器(Mobile U-ViT)を提案する。
この設計は、より軽量で高速なトランスフォーマーのような表現学習能力を示す。
計算要求が減っているにもかかわらず、我々のアーキテクチャは8つの公開2Dおよび3Dデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:45:42 GMT)
Theoretically Unmasking Inference Attacks Against LDP-Protected Clients in Federated Vision Models [22.0] フェデレーション学習は、直接的なデータ共有を避けながら、サーバの調整を通じてクライアント間の協調学習を可能にする。
メンバーシップ推論攻撃(MIA)に関する最近の研究は、この概念に異議を唱えており、未保護のトレーニングデータに対する高い成功率を示している。
完全連結層や自己アテンション層の脆弱性を利用する低ポリノミカル時間MIAの成功率について理論的に低い境界を導出する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:56:30 GMT)
AutoMixer: Checkpoint Artifacts as Automatic Data Mixers [21.9] 本研究では,チェックポイントモデルが学習軌跡の異なる点において出現する能力を示すことを観察する。
これらのアーティファクトモデルをベンチマークでそれぞれの能力に基づいて同定する。
我々はこれらをデータミキサーとして利用し、ソースデータに対する集約された1次影響近似を利用する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:57:07 GMT)
Court of LLMs: Evidence-Augmented Generation via Multi-LLM Collaboration for Text-Attributed Graph Anomaly Detection [21.8] 大きな言語モデル(LLM)は、強力なセマンティック理解と推論能力のために、有望な代替手段として登場した。
本稿では,LLMとグラフニューラルネットワーク(GNN)を組み合わせた新たなフレームワークであるCoLLを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:36:39 GMT)
AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation [21.7] AdaptiVocabは語彙適応のためのエンドツーエンドのアプローチである。
トークンをドメイン固有のn-gramベースのトークンに置き換えることで、語彙を修飾する。
以上の結果から,AdaptiVocabは性能を損なうことなくトークン使用量を25%以上削減できることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:53:31 GMT)
Invariant Graph Transformer for Out-of-Distribution Generalization [21.6] Graph Out-Of-Distribution Generalized Transformer(GOODFormer)を紹介する。
予測グラフ構造とラベルの間の不変関係を捉えることにより、一般化グラフ表現を学習することを目的とする。
本研究では,動的に変化する部分グラフの符号化情報を効果的かつ効率的に取得するために,進化する部分グラフの位置および構造エンコーダを設計する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:11:53 GMT)
Querying Autonomous Vehicle Point Clouds: Enhanced by 3D Object Counting with CounterNet [21.6] 我々は,RETRIEVAL, COUNT, AGGREGATIONの3つのコアクエリタイプを定義することで,ポイントクラウドクエリを形式化する。
CounterNetは、大規模クラウドデータの正確なオブジェクトカウントのために設計された、ヒートマップベースのネットワークである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:27:28 GMT)
Uncertainty-Aware Likelihood Ratio Estimation for Pixel-Wise Out-of-Distribution Detection [21.5] 本稿では,未知の画素特徴と未知の画素特徴を識別するために,不確実性を考慮した確率比推定手法を提案する。
このような不確実性を取り入れることで、より効果的に外周露光を活用できることが示される。
提案手法は,高い平均精度 (90.91%) を維持し, 無視できる計算オーバーヘッドのみを発生させながら, 最先端技術の中で最も低い平均偽陽性率 (2.5%) を達成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:39:16 GMT)
TITAN-Guide: Taming Inference-Time AligNment for Guided Text-to-Video Diffusion Models [21.4] オフザシェルフモデルによるガイダンスによるトレーニングフリーコンディショニングは、ベースモデルのさらなる微調整を避けるための好都合な代替手段である。
本稿では,TITAN-Guide(TITAN-Guide)と呼ばれる,ガイド付きテキスト・ビデオ拡散モデルに対する推論時間アライメントを提案する。
提案手法は,メモリ要求を最小限に抑えるだけでなく,様々な拡散誘導ベンチマークにおけるT2V性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:26:18 GMT)
Un-mixing Test-time Adaptation under Heterogeneous Data Streams [21.4] TTA(Test-Time Adaptation)は、ディープモデル適応のための有望なソリューションとして登場した。
本稿では、新しい周波数ベースの分散適応フレームワークFreDAを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:16:18 GMT)
Multi-Cali Anything: Dense Feature Multi-Frame Structure-from-Motion for Large-Scale Camera Array Calibration [21.3] 大規模カメラアレイの校正には時間を要するため、既知のパターンを専用のキャプチャーする必要がある。
本研究では,シーンデータから直接内在性を洗練する多フレームキャリブレーション手法を提案する。
本手法は, 専用キャリブレーション法とほぼ同等の精度を実現し, 内在性および3次元再構成精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:17:23 GMT)
EFlat-LoRA: Efficiently Seeking Flat Minima for Better Generalization in Fine-Tuning Large Language Models and Beyond [21.2] 低ランク適応のための平らなミニマを求めるために、Flat-LoRAとその効率的なバージョンであるEFlat-LoRAを提案する。
EFlat-LoRAはLoRAに匹敵する効率を同時に達成し,性能も向上することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:59:49 GMT)
Separated-Variable Spectral Neural Networks: A Physics-Informed Learning Approach for High-Frequency PDEs [21.1] 分離可変スペクトルニューラルネットワーク(SV-SNN)は、ニューラルPDE解決におけるスペクトルバイアス問題に対処する新しいフレームワークである。
SV-SNNは1~3桁の精度向上を実現し,パラメータ数を90%以上削減した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:40:10 GMT)
Occlusion-robust Stylization for Drawing-based 3D Animation [20.8] 描画に基づく3DアニメーションのためのOcclusion-robust Stylization Framework(OSF)を提案する。
OSFは以前の2段階ではなく1回の実行で動作し、2.4倍高速な推論と2.1倍少ないメモリを実現している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:52:07 GMT)
A Physical Model-Guided Framework for Underwater Image Enhancement and Depth Estimation [20.3] 既存の水中画像強調手法では、深度や対光といった画像モデルパラメータを正確に推定することができない。
先進的なUIEモデルとDeep Degradation Modelを併用したモデル誘導フレームワークを提案する。
本フレームワークは水中の多様なシーンにまたがって顕著な拡張効果をもたらす。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:14:39 GMT)
A Scoping Review of Natural Language Processing in Addressing Medically Inaccurate Information: Errors, Misinformation, and Hallucination [20.3] 本稿では,自然言語処理による情報の検出,修正,医療的不正確な情報検出の可能性と課題について検討する。
これらの概念を統一することにより、レビューでは、共有された方法論の基礎と、医療への明確な影響を強調している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:48:59 GMT)
Learning Pivoting Manipulation with Force and Vision Feedback Using Optimization-based Demonstrations [20.2] クローズドループのピボット操作を学習するためのフレームワークを提案する。
計算効率のよいCITO(Contact-Implicit Trajectory Optimization)を活用することで,実演指導による深層強化学習を設計する。
また、特権訓練戦略を用いて、ロボットがピボット操作を行うことができるシミュレート・トゥ・リアル・トランスファー手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:33:46 GMT)
Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.2] リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:16:02 GMT)
Semantic and Temporal Integration in Latent Diffusion Space for High-Fidelity Video Super-Resolution [20.2] 我々はSeTe-VSR(Semantic and Temporal Guided Video Super-Resolution)を提案する。
本手法は複雑な詳細の復元と時間的コヒーレンス確保のシームレスなバランスを実現する。
提案手法は高精細な視覚コンテンツを保存するだけでなく,忠実度を著しく向上させる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:47:35 GMT)
Text-Attributed Graph Anomaly Detection via Multi-Scale Cross- and Uni-Modal Contrastive Learning [19.6] 本稿では,テキスト分散グラフ異常検出のための新しいエンドツーエンドパラダイムCMUCLを提案する。
テキストとグラフ構造の両方からのデータを同時にモデル化し、クロスモーダルおよびユニモーダル推定器を用いてテキストとグラフエンコーダを共同で訓練し、潜在的な異常関連情報を明らかにする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:47:07 GMT)
RACE-IT: A Reconfigurable Analog CAM-Crossbar Engine for In-Memory Transformer Acceleration [19.6] Transformer ModelはDeep Neural Networks(DNN)の最先端を表現している。
これらのモデルを処理するには、かなりの計算資源が必要で、結果としてかなりのメモリフットプリントが要求される。
本稿では、より広範な操作をサポートするために、Analog Content Addressable Memories (ACAM)を拡張した再構成可能なAnalog Computing Engine (RACE)を紹介する。
RACEに基づいて、トランスフォーマーモデルの効率的なアナログドメイン実行を実現するための RACE-IT アクセラレータ(インメモリトランスフォーマーの RACE の意味)を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:30:05 GMT)
Learning to Incentivize in Repeated Principal-Agent Problems with Adversarial Agent Arrivals [19.6] 有限地平線上の主エージェント問題の繰り返しを$T$で研究する。
我々はその問題が難解になり、線形後悔に繋がることを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:17:13 GMT)
Steering Guidance for Personalized Text-to-Image Diffusion Models [19.6] 既存のサンプリングガイダンス手法では、出力をバランスの取れた空間へ誘導することができない。
我々は、ヌルテキストプロンプトに条件付き未学習弱モデルを活用する、単純で効果的なパーソナライズガイダンスを提案する。
本手法は,余分な計算オーバーヘッドを伴わずに,バランスの取れた潜在空間への出力を明示的に制御する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:02:26 GMT)
FedGuard: A Diverse-Byzantine-Robust Mechanism for Federated Learning with Major Malicious Clients [18.9] フェデレートラーニングは、50%以上のクライアントが悪意がある場合、ビザンティンの攻撃に対して脆弱である。
既存の防御機構のほとんどは、特定の攻撃タイプ用に設計されている。
我々は,新しいフェデレーション学習機構であるFedGuardを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:51:25 GMT)
Direct Implementation of High-Fidelity Three-Qubit Gates for Superconducting Processor with Tunable Couplers [18.7] 3量子ゲートは1量子ゲートと2量子ゲートの組み合わせで構築できるため、独立性は不要である。
可変カプラを用いたフリップチップ超伝導量子プロセッサにおいて3ビット制御制御Z(CCZ)ゲートを実装するための高忠実性スキームを提案し,実験的に実証した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:02:08 GMT)
Do Large Language Models Know How Much They Know? [18.6] 大規模言語モデル (LLM) は高機能なシステムとして登場した。
インテリジェントシステムの望ましい属性は、自身の知識の範囲を認識する能力である。
このベンチマークは、モデルが過度の、不十分な、あるいは正確な量の情報をリコールするかどうかを評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:33:49 GMT)
Quality-of-Service Aware LLM Routing for Edge Computing with Multiple Experts [18.5] 大きな言語モデル(LLM)は目覚ましい機能を示しており、LLMサービスのユーザ需要が大幅に増加した。
しかしながら、クラウドベースのLLMサービスは、高いレイテンシ、不安定な応答性、プライバシの懸念に悩まされることが多い。
本稿では,持続的高品質LLMサービスのための深層強化学習に基づくルーティングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:45:15 GMT)
Boosting Vision Semantic Density with Anatomy Normality Modeling for Medical Vision-language Pre-training [18.4] 我々は、アライメントの有効性を向上させるために、視覚意味密度を高めることを提案する。
一方,我々は疾患レベルの視覚的コントラスト学習を通じて視覚意味論を強化する。
一方,各解剖学的サンプルの分布をモデル化するための解剖学的正規性モデリング手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:52:05 GMT)
A Unified Toolbox for Multipartite Entanglement Certification [18.4] 本稿では,条件勾配法(CG)に基づく多部交絡特性の統一フレームワークを提案する。
提案手法は,最大10量子ビットの量子系における絡み合い認証を可能にし,任意の絡み合い構造に適用する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:09:50 GMT)
Simultaneous Motion And Noise Estimation with Event Cameras [18.2] イベントカメラは、ノイズを特徴付けるのが難しい視覚センサーが登場しつつある。
既存のイベントカメラのデノイング手法は、しばしば独立して設計される。
本稿では,我々の知る限り,各形態の運動を同時に推定する最初の手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:51:58 GMT)
Algorithmic Recourse in Abnormal Multivariate Time Series [18.1] 本稿では,時系列の異常に対処するフレームワークであるRecourse in time series Anomaly Detection (RecAD)を紹介する。
RecADは、反現実的な説明として正常な状態を回復するためのリコースアクションを予測する。
合成および実世界のデータセットの実験は、その効果を実証している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:55:34 GMT)
DINO-R1: Incentivizing Reasoning Capability in Vision Foundation Models [18.1] 視覚基盤モデルのコンテキスト内推論能力をインセンティブ化する最初の試みであるtextbfDINO-R1 を提案する。
DINO-R1は、新しい強化スタイルのトレーニング戦略である textbfGroup Relative Query Optimization (GRQO) を導入した。
COCO、LVIS、ODinWの実験により、DINO-R1は制御された微調整ベースラインを著しく上回ることが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:10:37 GMT)
PointGauss: Point Cloud-Guided Multi-Object Segmentation for Gaussian Splatting [18.0] 本稿では,ガウススプラッティング表現におけるリアルタイム多目的セグメンテーションのための新しいクラウド誘導フレームワークであるPointGaussを紹介する。
1) ポイントクラウドベースのガウスプリミティブデコーダで、1分以内に3Dインスタンスマスクを生成すること、2) マルチビューの一貫性を保証するGPUアクセラレーションされた2Dマスクレンダリングシステムである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:56:54 GMT)
A Practical and Secure Byzantine Robust Aggregator [17.7] ビザンチンのロバストアグリゲーションは、ベクトルのロバスト平均を計算するアルゴリズムプリミティブである。
入力ベクトルのサイズにおいて準線形時間で動作し、ほぼ最適バイアス境界を持つ最初のロバストアグリゲータを与える。
我々のアルゴリズムは、クリーンベクトルの分布に関する知識を前提とせず、フィルターしきい値の事前計算も必要としない。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:11:21 GMT)
Omni-Scan: Creating Visually-Accurate Digital Twin Object Models Using a Bimanual Robot with Handover and Gaussian Splat Merging [17.6] デジタルツイン」はシミュレーション、バーチャルリアリティ、マーケティング、ロボットポリシーの微調整、部分検査に有用である。
オムニ・スキャン(Omni-Scan)は、物体を1つのグリップでつかみ、静止カメラで物体を回転させるバイマニュアルロボットを用いて、高品質な3Dガウススプラモデルを生成するパイプラインである。
ロボットグリップが保持する物体を識別・分離するために,DepthAny-thing, Segment Anything, RAFT光フローモデルを用いたOmni-Scanロボットパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:36:19 GMT)
Cued-Agent: A Collaborative Multi-Agent System for Automatic Cued Speech Recognition [17.5] Cued Speech (CS) は、唇読取と手話による視覚コミュニケーションシステムであり、聴覚障害のある個人のためのコミュニケーションを容易にする。
自動CS認識(ACSR)は、CSハンドジェスチャと唇の動きをAI駆動方式でテキストに変換することを目的としている。
本稿では,ACSRのための協調型マルチエージェントシステムCued-Agentを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:40:39 GMT)
D3: Training-Free AI-Generated Video Detection Using Second-Order Features [17.3] 差分検出法(D3)は,合成ビデオの新しいトレーニング不要検出法である。
4つのオープンソースデータセット上でのD3の優位性を検証する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:17:51 GMT)
Novice Developers' Perspectives on Adopting LLMs for Software Development: A Systematic Literature Review [17.2] 我々は2022年4月から2025年6月までに発行された80研究の体系的な文献レビューを行い、4つの研究課題(RQ)に答えた。
RQ1では,研究モチベーションと方法論的アプローチを分類した。
RQ2では、初心者開発者がLLMを使用するソフトウェア開発タスクを特定した。
RQ3では,研究で議論されたメリット,課題,レコメンデーションを分類した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:38:59 GMT)
Teaching the Teacher: Improving Neural Network Distillability for Symbolic Regression via Jacobian Regularization [17.0] 複雑なニューラルネットワークを単純で可読な記号式に拡張することは、信頼できる、解釈可能なAIへの有望な道のりだ。
この課題に対処するための新しい訓練パラダイムを提案する。
事前学習されたネットワークを受動的に蒸留する代わりに, 教師のネットワークに, 正確であるだけでなく, 自然にスムーズで, 蒸留に適する機能を学ぶよう積極的に促すtextbfJacobian-based regularizerを導入する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:50:37 GMT)
Core-Set Selection for Data-efficient Land Cover Segmentation [16.9] リモートセンシング画像セグメンテーションデータセットからサンプルの重要なサブセットを選択するための6つの新しいコアセット選択手法を提案する。
本手法は,3つの土地被覆分類データセットのランダム選択ベースラインに対して,これらのアプローチをベンチマークする。
この結果は,リモートセンシング領域におけるデータ中心学習の重要性と可能性を示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:59:41 GMT)
BOOST: Bootstrapping Strategy-Driven Reasoning Programs for Program-Guided Fact-Checking [16.7] BOOSTは、数発の推論プログラムの自動生成のためのブートストラップ方式である。
デモ作成を導くメタルールとして、明示的でデータ駆動のガイドラインを反復的に洗練します。
ゼロショットから少数ショットのプログラム誘導学習へのシームレスな移行を可能にし、解釈可能性と有効性を高める。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:31:39 GMT)
R1-ACT: Efficient Reasoning Model Safety Alignment by Activating Safety Knowledge [16.7] LRMの安全性リスクの根本原因について検討し、モデルに既に十分な安全性知識があるが、推論中にそれを活性化できないことを発見した。
R1-Actは、構造的推論プロセスを通じて安全知識を明示的に引き起こす、シンプルで効率的なポストトレーニング手法である。
R1-Actは推論性能を保ちながら強力な安全性向上を実現し、事前アライメント手法よりも優れている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:14:13 GMT)
SDMatte: Grafting Diffusion Models for Interactive Matting [16.6] 本稿では,拡散駆動型インタラクティブ・マッティングモデルSDMatteを提案する。
まず、拡散モデルの強力な先行性を利用して、テキスト駆動の相互作用能力を視覚的プロンプト駆動の相互作用能力に変換する。
第2に、視覚的プロンプトの座標埋め込みと対象物の不透明埋め込みを統合し、空間的位置情報に対するSDMatteの感度を高める。
第3に,視覚的プロンプトによって特定された領域に集中できるマスキング型自己注意機構を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:00:48 GMT)
NoCode-bench: A Benchmark for Evaluating Natural Language-Driven Feature Addition [16.1] この研究は、現実世界のNL駆動機能追加タスクで大きな言語モデル(LLM)を評価するために設計されたベンチマークであるNoCode-benchを紹介する。
高品質で人間認証された114のインスタンスのサブセット、NoCode-bench Verifiedは信頼性の高い評価を保証する。
我々の実験によると、トークンの使用率が高いにもかかわらず、最高のLCMはタスクの成功率を15.79%に抑え、ファイル間の編集、理解、ツール呼び出しの課題を強調している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:25:14 GMT)
GINO-Q: Learning an Asymptotically Optimal Index Policy for Restless Multi-armed Bandits [16.1] GINO-Qは、レスレスマルチアームバンディット(RMAB)の最適指標ポリシーを学習するために設計された3段階近似アルゴリズムである。
GINO-QはRMABをインデックス化する必要がなく、柔軟性と適用性を高めている。
実験結果から, GINO-Q は非接種可能なRMABに対しても, ほぼ最適に学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:36:37 GMT)
ECGTwin: Personalized ECG Generation Using Controllable Diffusion Model [15.9] これらの課題に対処するために設計された2段階のフレームワークであるECGTwinを紹介します。
第1段階では、対照的な学習を通じて訓練された個別ベースエクストラクタが、参照ECGから個人的特徴をしっかりとキャプチャする。
第2段階では、抽出された個々の特徴と対象心臓状態が拡散ベース生成プロセスに統合される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:58:11 GMT)
FinKario: Event-Enhanced Automated Construction of Financial Knowledge Graph [15.8] 大規模言語モデル(LLM)は投資家の意思決定能力を高め、財務分析を強化する。
金融知識グラフのイベント強化構築(FinKario)について紹介する。
FinKarioは、プロンプト駆動の抽出を通じて、リアルタイムの企業の基本と市場イベントを自動的に統合する。
大規模金融知識の進化を最適化するための2段階グラフ検索戦略(FinKario-RAG)を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:27:35 GMT)
Evading Data Provenance in Deep Neural Networks [15.4] 本稿では,教師モデルがまず著作権データセットから学習し,タスク関連だが識別子に依存しないドメイン知識を代理学生に伝達する統合回避フレームワークを提案する。
提案手法は,すべての著作権識別子を同時に排除し,一般化と有効性の両方において,9つの最先端の回避攻撃を著しく上回っている。
概念実証として,現行のDOV手法の重要な脆弱性を明らかにし,実用性を高めるための長期開発の必要性を明らかにする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:13:45 GMT)
AutoEDA: Enabling EDA Flow Automation through Microservice-Based LLM Agents [15.4] AutoEDAは、標準化されたスケーラブルな自然言語エクスペリエンスに特化したモデルコンテキストプロトコル(MCP)を通じて並列学習を活用する、EDA自動化のためのフレームワークである。
実験の結果、既存の手法と比較して、自動化の精度と効率が向上し、スクリプトの品質も向上した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:23:57 GMT)
Conformal Predictive Distributions for Order Fulfillment Time Forecasting [15.4] 本稿では,オーダー充足時間の分布予測のための新しいフレームワークを提案する。
提案手法は競合する分布予測を生成できるが,機械学習に基づく点予測は既存のルールベースシステムよりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:02:00 GMT)
Systematic Evaluation of Optimization Techniques for Long-Context Language Models [15.4] 大規模言語モデル(LLM)は、さまざまな自然言語処理タスクにまたがるが、リソース要求と限られたコンテキストウインドウに対処する。
本稿では、これらの最適化を体系的にベンチマークし、メモリ使用量、レイテンシ、スループットを特徴付けるとともに、これらの手法がテキスト生成の品質に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:17:24 GMT)
Mitigating Gender Bias via Fostering Exploratory Thinking in LLMs [15.4] 大きな言語モデル(LLM)は、しばしば性別バイアスを示し、男女の扱いが不平等になる。
我々のアプローチは、構造的に同一で道徳的に曖昧なシナリオにおいて、男性と女性の主人公を特徴とするストーリーペアを生成するようモデルに促す。
不整合が発生すると、モデルはバランスのとれた性中立的な判断を生み出すように誘導される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:37:16 GMT)
HumanSAM: Classifying Human-centric Forgery Videos in Human Spatial, Appearance, and Motion Anomaly [15.3] HumanSAMは、人間中心のフォージェリーを、生成されたコンテンツでよく見られる3つの異なる種類のアーティファクトに分類することを目的としている。
HumanSAMは、バイナリとマルチクラスの偽造分類の両方において、最先端の手法と比較して有望な結果をもたらす。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:25:21 GMT)
VAULT: Vigilant Adversarial Updates via LLM-Driven Retrieval-Augmented Generation for NLI [15.3] VAULTは、NLIモデルの弱点を発見し、改善する完全に自動化された対向的なRAGパイプラインである。
VAULTはデータセット間で、従来よりも最大で2.0%パフォーマンスが向上している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:22:54 GMT)
CADDesigner: Conceptual Design of CAD Models Based on General-Purpose Agent [15.3] 大規模言語モデル(LLM)を用いたCAD概念設計のためのエージェントを提案する。
CIP(Context-Independent Imperative Paradigm)に基づいて構築され、高品質なCADモデリングコードを生成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:15:56 GMT)
OR-LLM-Agent: Automating Modeling and Solving of Operations Research Optimization Problems with Reasoning LLM [15.3] 自動オペレーションリサーチ問題解決のためのLLMを推論するAIエージェントフレームワークであるOR-LLM-Agentを提案する。
GPT-o3, Gemini 2.5 Pro, DeepSeek-R1, ORLMなどの高度な手法よりも, OR-LLM-Agentの精度を7%以上向上させることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:52:21 GMT)
Exactly solvable models for universal operator growth [15.2] 一般多体系の量子可観測性は、作用素のクリロフ空間における普遍的な成長パターンを示す。
我々は、普遍作用素成長と整合したランツォ係数の広い族を導入し、探求する。
家族の1つにとって、クリロフ複雑性は正確に計算される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:27:44 GMT)
Representation Shift: Unifying Token Compression with FlashAttention [15.0] 本稿では,各トークン表現の変化度を計測するトレーニングフリーなモデル-aメトリクスを提案する。
これにより、トークン圧縮とFlashAttentionをシームレスに統合する。
提案手法はトランスフォーマーを超えてCNNや状態空間モデルにさらに一般化する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:53:55 GMT)
Oedipus and the Sphinx: Benchmarking and Improving Visual Language Models for Complex Graphic Reasoning [15.0] 図形推論タスクにおける視覚言語モデル(VLM)の性能を評価するためにReasonBenchを提案する。
ReasonBenchには、現実世界のインテリジェンステストからの1,613の質問が含まれている。
我々は11の主流VLMをベンチマークし、現在のモデルの大幅な制限を明らかにした。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:12:38 GMT)
Harnessing the Power of Interleaving and Counterfactual Evaluation for Airbnb Search Ranking [15.0] 評価は,検索・推薦システムにおけるランキングアルゴリズムの開発において重要な役割を担っている。
オンライン環境は因果推論技術の適用に寄与する。
効果的なA/Bテストでは、ビジネスはユニークな課題に直面します。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:28:18 GMT)
Improving Multimodal Contrastive Learning of Sentence Embeddings with Object-Phrase Alignment [14.9] マルチモーダル文埋め込みモデルは、訓練中にテキストデータに加えて、画像キャプチャペアを利用するのが一般的である。
このようなペアは、画像またはキャプション側の冗長または無関係な情報を含む、しばしばノイズを含む。
本稿では,従来の画像キャプションアライメントと並行して,微粒なオブジェクト-フレーズアライメントを組み込むことにより,マルチモーダル文の埋め込みを強化する手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:42:28 GMT)
Foundations of Interpretable Models [14.7] 既存の解釈可能性の定義は、一般、音、頑健な解釈可能なモデル設計についてユーザーに知らせることができず、実行不可能である、と我々は主張する。
本稿では,解釈可能なAIコミュニティにおいて,一般的な,シンプルで,既定の非公式概念を仮定する解釈可能性の定義を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:36:21 GMT)
ITDR: An Instruction Tuning Dataset for Enhancing Large Language Models in Recommendations [14.6] そこで本研究では,2つのコアルートタスクにまたがる7つのサブタスクを含む,十分な命令チューニングデータセット ITDR を構築した。
このデータセットは、13のパブリックレコメンデーションデータセットからのデータを統合し、手作業で標準化されたテンプレートを使用して構築される。
実験の結果,ITDR は主要なオープンソース LLM の性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:51:17 GMT)
M^2VAE: Multi-Modal Multi-View Variational Autoencoder for Cold-start Item Recommendation [14.6] コールドスタートアイテムレコメンデーションはレコメンデーションシステムにおいて重要な課題である。
既存の方法は、コールドスタート問題を緩和するためにマルチモーダルコンテンツを利用する。
本稿では,属性とマルチモーダルの特徴の共通性とユニークなビューをモデル化する上での課題に対処する生成モデルを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:16:26 GMT)
Tackling Size Generalization of Graph Neural Networks on Biological Data from a Spectral Perspective [14.3] グラフニューラルネットワーク(GNN)におけるサイズ誘起分布シフトのタイプを特定し,特徴付ける
サブグラフパターンによって駆動されるスペクトル差は,GNNの大規模で見えないグラフにおける性能と強く相関していることがわかった。
本稿では,GNNの重要部分グラフパターンに対する認識を高めるための3つのモデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:11:16 GMT)
Identifying Unique Spatial-Temporal Bayesian Network without Markov Equivalence [14.2] 空間的時間的因果関係をモデル化するためのベイジアンネットワークの同定は難しい課題である。
高次因果エントロピー(HCE)アルゴリズムも,STBNを時間的複雑性下で一意に同定するために提案されている。
その結果,HCEアルゴリズムは最先端の識別精度が得られることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:57:02 GMT)
CP-FREEZER: Latency Attacks against Vehicular Cooperative Perception [14.1] 本稿では,V2Vメッセージを介して対向摂動を注入することにより,CPアルゴリズムの遅延を最大化する最初の遅延攻撃であるCP-FREEZERを提案する。
以上の結果から,CPシステムの有効性に対する重大な脅威が指摘され,堅牢な防御の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:34:36 GMT)
Do They Understand Them? An Updated Evaluation on Nonbinary Pronoun Handling in Large Language Models [13.9] 大規模言語モデル(LLM)は、公正さと傾きが重要となるセンシティブな状況にますますデプロイされている。
代名詞の使用、特にジェンダーニュートラルやネオ代名詞は、AIの責任を負う上で重要な課題である。
LLMの代名詞忠実度を評価するための拡張および更新されたベンチマークであるMISGENDERED+を紹介する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:11:42 GMT)
LargeMvC-Net: Anchor-based Deep Unfolding Network for Large-scale Multi-view Clustering [13.8] LargeMvC-Netは、アンカーベースのマルチビュークラスタリングのための新しいディープネットワークアーキテクチャである。
提案したモデルは,アンカーベースのクラスタリングプロセスを3つのモジュールに分解する。
いくつかの大規模マルチビューベンチマークの実験では、LargeMvC-Netは、有効性とスケーラビリティの両方の観点から、最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:21:32 GMT)
DocTron-Formula: Generalized Formula Recognition in Complex and Structured Scenarios [13.7] 本稿では、一般的な視覚言語モデルに基づく統合フレームワークDocTron-Formulaを紹介する。
また、CSFormulaは、行、段落、ページレベルの多分野および構造的に複雑な公式を包含するデータセットである。
提案手法は, 様々なスタイル, 科学的領域, 複雑なレイアウトにまたがって, 最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:34:17 GMT)
Veli: Unsupervised Method and Unified Benchmark for Low-Cost Air Quality Sensor Correction [13.6] 都市大気汚染は毎年何百万人もの早死にを引き起こす主要な健康危機である。
低コストのセンサーは、高価なレファレンスグレードステーションに代わるスケーラブルな代替手段を提供する。
彼らの読みはドリフト、校正誤差、環境干渉の影響を受けている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:06:28 GMT)
Catching Dark Signals in Algorithms: Unveiling Audiovisual and Thematic Markers of Unsafe Content Recommended for Children and Teenagers [13.4] ショートフォームビデオプラットフォームの普及は、年齢検証メカニズムの非効率さと相まって、アルゴリズムを改造したオンライン環境において、子供やティーンエイジャーが直面する潜在的な害について懸念を喚起する。
Instagram Reels, TikTok, YouTube Shortsで, 子どもとティーンエイジャーに推奨される4,492本のショートビデオのマルチモーダル特徴分析とテーマ・トピック・モデリングを行った。
この特徴レベルおよびコンテンツレベルの分析により、安全でない(つまり、精神的に苦しむ)ショートビデオは、より暗い視覚的特徴を持ち、明らかな有害なコンテンツと、不安を引き起こす通常のコンテンツによる暗黙の害を含んでいることが明らかとなった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:40:57 GMT)
Fine-grained Spatiotemporal Grounding on Egocentric Videos [13.3] EgoMaskは、エゴセントリックビデオの微細時間グラウンド化のための最初のピクセルレベルのベンチマークである。
EgoMaskは、式やオブジェクトマスクを参照するアノテーションパイプラインによって構築されている。
また、モデル開発を容易にする大規模なトレーニングデータセットであるEgoMask-Trainも作成しています。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:53:27 GMT)
SplatTalk: 3D VQA with Gaussian Splatting [13.2] 言語誘導型3Dシーン理解は、ロボット工学、AR/VR、人間とコンピュータの相互作用における応用を進める上で重要である。
SplatTalkは,3次元ガウススティング(3DGS)フレームワークを用いて,事前学習したLSMへの直接入力に適した3次元トークンを生成する手法である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:43:13 GMT)
EVINET: Towards Open-World Graph Learning via Evidential Reasoning Network [13.1] 本稿では,主観的論理フレームワークにベータ埋め込みを統合するフレームワークであるEvidential Reasoning Network(EVINET)を紹介する。
EVINETには2つの重要なモジュールが含まれている。
大規模な実験により、EVINETは複数のメトリクスで最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:06:28 GMT)
FakeIDet: Exploring Patches for Privacy-Preserving Fake ID Detection [13.0] 本研究は,フィールド内のいくつかの制限をカバーした偽ID検出の話題に焦点を当てた。
この領域で適切な研究を行うために、実際のIDから公開されているデータは存在しない。
ほとんどの論文は、プライバシ上の理由から利用できない独自の内部データベースに依存している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:48:23 GMT)
Mind the Gap: The Divergence Between Human and LLM-Generated Tasks [13.0] 大規模言語モデル(LLM)を用いたエージェントとヒューマンタスク生成の比較を行った。
人間のタスク生成は、個人的価値観や認知スタイルを含む心理的ドライバの影響を一貫して受けている。
我々は,人間の認知の価値観,具体的性質とLLMの統計的パターンとの間には,中核的なギャップが存在すると結論付けた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:00:41 GMT)
UrBLiMP: A Benchmark for Evaluating the Linguistic Competence of Large Language Models in Urdu [13.0] 言語最小ペア(UrBLiMP)のUrduベンチマークについて述べる。
UrBLiMPは10コアの構文現象を対象とする5,696個の最小ペアから構成される。
UrBLiMPアノテーションの人間による評価は96.10%のアノテーション間の合意を得た。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:16:37 GMT)
DONUT: A Decoder-Only Model for Trajectory Prediction [12.9] トラジェクトリをアンロールするデコーダオンリーネットワークであるDONUTを提案する。
我々は、過去の軌跡を符号化し、単一の自己回帰モデルで将来の軌跡を予測する。
我々はArgoverse 2シングルエージェントモーション予測ベンチマークにおいて、最先端の新たな結果を得る。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:07:37 GMT)
Efficient Federated Learning with Encrypted Data Sharing for Data-Heterogeneous Edge Devices [12.7] 我々は,フェデレートラーニングと暗号化データ共有という,エッジデバイス上での新しいフェデレーションラーニング手法を提案する。
FedEDSはクライアントモデルとモデルのレイヤを使用して、データ暗号化をトレーニングし、他のクライアントと共有します。
このアプローチは、フェデレーション学習トレーニングの収束速度を加速し、データ不均一性の負の影響を緩和する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:51:43 GMT)
Boosting Adversarial Transferability with Low-Cost Optimization via Maximin Expected Flatness [12.7] トランスファーベースの攻撃は、サロゲートモデルの敵例を作成し、ブラックボックスターゲットモデルに対してそれらをデプロイし、モデルに依存しない、クエリフリーな脅威シナリオを提供する。
平坦性向上手法が最近出現し転送性の向上が図られているが、その異なる平坦性定義と攻撃設計は、未検討の最適化の制限と理論的基礎の欠如に悩まされている。
この研究は、平坦度最適化における厳密な不均衡なエクスプロレーション探索のダイナミクスを明らかにし、平坦度に基づく転送可能性に関する最初の理論的基礎を確立した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:16:04 GMT)
Transforming Credit Risk Analysis: A Time-Series-Driven ResE-BiLSTM Framework for Post-Loan Default Detection [12.7] 債務不履行の予測は信用リスク管理において重要な課題である。
本研究では,スライドウィンドウを用いたResE-BiLSTMモデルを提案する。
大規模なFreddie Mac US住宅ローンデータセットから44個の独立したコホートで評価されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:13:14 GMT)
Rethinking Irregular Time Series Forecasting: A Simple yet Effective Baseline [12.7] 本稿では,汎用的で効率的な予測フレームワークであるAPNを紹介する。
APNの中核には、新しい Time-Aware Patch Aggregation (ATAPA) モジュールがある。
パッチ表現をタイムアウェアな重み付けで計算し、すべての生の観察を集約する。
このアプローチは、人工的なデータポイントの導入を回避し、設計による完全な情報カバレッジを確保することによって、データの忠実性を維持する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:26:03 GMT)
REACT: A Real-Time Edge-AI Based V2X Framework for Accident Avoidance in Autonomous Driving System [12.5] 本稿では、細調整された軽量VLM上に構築されたリアルタイムV2X統合軌道最適化フレームワークREACTを提案する。
エッジデバイス上でのリアルタイムパフォーマンスを確保するため、REACTはエッジ適応戦略を導入し、モデルの複雑さを低減し、推論を加速する。
ReACTは最先端の性能、衝突率77%の低下、48.2%のビデオパノプティクス品質(VPQ)、およびJetson AGX Orinでの0.57秒の推論遅延を実現している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:16:04 GMT)
Explaining GNN Explanations with Edge Gradients [12.5] 入力レベルの説明と階層的な説明の2つの異なる設定で、GNNの説明を詳しく調べる。
一般的な摂動に基づく手法と古典的な勾配に基づく手法の間には,最初の理論的接続が確立される。
合成データセットと実データセットの両方で実験を行った結果が実際にどのように現れるかを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:05:22 GMT)
Semantic-Aware Adaptive Video Streaming Using Latent Diffusion Models for Wireless Networks [12.2] 本稿では,遅延拡散モデル(LDM)をFF手法に組み込んだリアルタイム適応ビットレートビデオストリーミングのための新しいフレームワークを提案する。
提案手法はLDMを利用してIフレームを潜在空間に圧縮し,ストレージとセマンティックトランスミッションの大幅な節約を実現する。
この作業は、5Gおよび将来の5Gネットワークにおけるスケーラブルなリアルタイムビデオストリーミングの新たな可能性を開く。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:02:11 GMT)
Towards Efficient Verification of Computation in Quantum Devices [12.1] 量子プロセストモグラフィーのような従来の量子デバイスを包括的に検証する手法は、計算資源の指数的な増加のため、重大な制限に直面している。
本稿では,層状割り込み可能な量子回路モデルに着目し,ハードウェア上の計算構造について検討する。
提案手法は,O(d2 t log (n/delta))$の時間的複雑さで回路を完全に再構築し,少なくとも1-delta$の確率で成功を保証している。
提案手法は,量子デバイスにおける計算の完全検証に要する時間を大幅に短縮し,問題サイズの二重対数スケーリングを実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:10:06 GMT)
Is It Really You? Exploring Biometric Verification Scenarios in Photorealistic Talking-Head Avatar Videos [12.1] 本稿では,このようなアバターを介するシナリオにおける生体認証の課題について考察する。
我々の主な疑問は、個人の顔の動きパターンが、アバターの視覚的外観が所有者のファクシミリであるときに、自分の身元を確認するための信頼性のある行動バイオメトリックスとして機能するかどうかである。
実験の結果,顔の動きのランドマークは,80%に近づいたAUC値による有意義な識別を可能にすることが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:23:27 GMT)
Embracing Large Language Models in Traffic Flow Forecasting [12.1] 交通流の予測は,交通状況や道路網に基づいて将来の交通を予測することを目的としている。
本稿では,Large Language Model Enhanced Traffic Flow Predictor (LEAF) という新しい手法を提案する。
LEAFは2つのブランチを採用し、それぞれグラフとハイパーグラフ構造を用いて異なるフロー時間関係をキャプチャする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:20:02 GMT)
Neighbor-Sampling Based Momentum Stochastic Methods for Training Graph Neural Networks [12.0] グラフ畳み込みネットワーク(GCN)は、グラフ表現学習のための強力なツールである。
本稿では,現代のディープラーニングアルゴリズムの実践的要素について述べる。
アダム型手法の標準的な仮定の下では,本手法が最適速度を享受できることが示される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:22:03 GMT)
MOSIC: Model-Agnostic Optimal Subgroup Identification with Multi-Constraint for Improved Reliability [12.0] そこで本研究では,最適部分群を同定するために,初期制約付き最適化問題を直接解決する統一最適化フレームワークを提案する。
我々の鍵となる革新は、勾配降下勾配アルゴリズムによって解決された、制約のない微分可能な min-max の目的として、制約された原始問題の再構成である。
このフレームワークは、モデルに依存しず、幅広いCATE推定器と互換性があり、コスト制限や公正性基準のような追加の制約への適合性がある。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:25:22 GMT)
λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics [11.9] 本稿では,LAMBDA ベンチマーク-Long-Horizon Actions for Mobile-Manipulation Benchmarking of Directed Activityを紹介する。
私たちのベンチマークには、シミュレーションと実世界の設定において、現実性と多様性を提供する、571人の人間によるデモが含まれています。
予備訓練を受けた場合でも,学習方法は成功率を低く抑えるが,ニューロシンボリックな手法では性能が著しく向上し,データ量も少なくなる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:13:36 GMT)
Learn2Synth: Learning Optimal Data Synthesis Using Hypergradients for Brain Image Segmentation [11.8] 合成によるドメインランダム化は、入力画像の領域に関してバイアスのないネットワークをトレーニングするための強力な戦略である。
本稿では,少数の実ラベル付きデータを用いて合成パラメータを学習する新しい手法であるLearner2 Synthを紹介する。
我々は,セグメンテーションネットワークの性能を向上させる方法で合成画像を強化するためのパラメトリックおよび非パラメトリック戦略を開発した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:54:41 GMT)
A hierarchy tree data structure for behavior-based user segment representation [11.8] 振舞いに基づくユーザコホート(BUS)は、様々なユーザのカテゴリ属性でユーザ宇宙を階層的に分割する新しいツリーベースのデータ構造である。
より偏りを増し、公平性を向上させるために、ユーザの接続ベースのBUSセグメントを導出するためにソーシャルグラフを使用する。
我々のオフライン分析は、BUSベースの検索が従来のユーザーベースの集計よりも格段に優れていることを示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:33:48 GMT)
Combining Discrete Wavelet and Cosine Transforms for Efficient Sentence Embedding [11.2] 我々は、単語と文の埋め込みに離散ウェーブレット変換(DWT)を適用する力を利用する。
ダウンストリームアプリケーションモデルにおける提案手法の有効性を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:17:41 GMT)
Towards Heterogeneity-Aware and Energy-Efficient Topology Optimization for Decentralized Federated Learning in Edge Environment [11.0] フェデレートラーニング(FL)はエッジコンピューティング(EC)システムにおいて有望なパラダイムとして登場した。
異種認識とコセット有効分散学習(DFL)フレームワークであるHat-DFedを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:07:32 GMT)
A comparative analysis of rank aggregation methods for the partial label ranking problem [11.0] ラベルランキング問題は、学習者が与えられた入力インスタンスのクラスラベルの総順序を予測する教師付き学習シナリオである。
本稿では、スコアベースおよび非パラメトリック確率的ランクアグリゲーションアプローチを含む、この重要なステップに対するいくつかの代替アグリゲーション手法について検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:21:12 GMT)
PanoLlama: Generating Endless and Coherent Panoramas with Next-Token-Prediction LLMs [11.0] パノラマ画像生成(PIG)は任意の長さのコヒーレントな画像を作成することを目的としている。
パノラマ(PanoLlama)は,パノラマ生成と自己回帰パラダイムを融合した,永続的で一貫性のあるパノラマ生成を実現する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:25:54 GMT)
RAG-R1 : Incentivize the Search and Reasoning Capabilities of LLMs through Multi-query Parallelism [10.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
LLMは、静的な内部知識のために、幻覚または時代遅れの応答を生成する傾向にある。
Retrieval-Augmented Generation(RAG)法の最近の進歩は、モデルの探索と推論能力の向上を目的としている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:41:05 GMT)
CPCL: Cross-Modal Prototypical Contrastive Learning for Weakly Supervised Text-based Person Retrieval [10.1] 弱教師付きテキストベースの人物検索は、テキスト記述を用いて対象者の画像を検索しようとする。
主な課題はクラス内の違いであり、モーダル内特徴のバリエーションとモーダル間のセマンティックギャップを含んでいる。
視覚とテキストのインスタンスを共有潜在空間にマッピングするクロスモーダル・プロトタイプ・コントラシティブ・ラーニング(CPCL)手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:09:28 GMT)
Inference of maximum parsimony phylogenetic trees with model-based classical and quantum methods [10.1] 古典的解法と量子的解法の両方と互換性のある3つの最適化モデルを設計する。
本手法は,すべての木トポロジーと祖先状態の完全な解空間を直接探索する。
我々の量子シミュレーションは、小規模インスタンスの正確な最適解を見つけることに成功した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:43:12 GMT)
Privacy-Preserving Driver Drowsiness Detection with Spatial Self-Attention and Federated Learning [10.1] ドライバーの眠気は道路事故の主な原因の1つであり、交通事故による死亡事故の主要な原因と認識されている。
本研究では,不均質データと分散データとを効果的に扱えるよう設計した,眠気検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:12:01 GMT)
Quantum Knowledge Distillation for Large Language Models [10.0] 大規模言語モデルのための量子知識蒸留モデル(QD-LLM)を提案する。
古典的シミュレーションでは、QD-LLMは複数のテキスト分類タスクにおいていくつかの主流蒸留法より優れている。
得られた回路をQuafuプラットフォームを介してBaihua超伝導量子プロセッサ上に展開し,実用性を評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:53:55 GMT)
Consistent DAG selection for Bayesian causal discovery under general error distributions [10.0] 変数集合の因果構造を学習する問題を考察する。
関連するエラーは独立であり、非ガウス的であることが許される。
真のデータ生成指向非巡回グラフ(DAG)構造を特定するためにベイズ階層モデルを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:03:28 GMT)
Demo: TOSense -- What Did You Just Agree to? [9.9] 本稿では,TOSense-Chromeエクステンションを提案する。このエクステンションを使えば,自然言語でToSについて質問したり,簡潔な回答をリアルタイムで得ることができる。
i) ToS コンテンツを自動的に抽出するクローラ "tos-crawl" と,(ii) セマンティック検索のための MiniLM と応答関連性検証のための BART-encoder を組み合わせた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:26:23 GMT)
Diffusion-Based User-Guided Data Augmentation for Coronary Stenosis Detection [9.9] 冠動脈狭窄は虚血性心疾患の主要な危険因子である。
近年のディープラーニングの進歩は、自動位置決めと重度測定の大きな可能性を示している。
本稿では,拡散モデルに基づく塗り絵法を用いて,現実的な病変を生成する新しいデータ拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:52:43 GMT)
An Unconditionally Secure Encryption Scheme for IoBT Networks [9.8] システム内のデバイス間でメッセージを交換するための、無条件でセキュアな暗号化スキームを提供する。
このスキームの背後にある主要なアイデアは、すべてのデバイス間でセキュアに共有されるランダムなバイナリマトリックスを使用してメッセージを交換するための秘密鍵を提供することである。
このスキームはセマンティックに安全であること、すなわち、計算能力を持つ敵がメッセージに関する情報を1ビットも取得できないことを保証している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:39:05 GMT)
Weakly Supervised Virus Capsid Detection with Image-Level Annotations in Electron Microscopy Images [9.8] オブジェクト検出のための現在の最先端の手法は、トレーニングのために巨大なデータセットの注釈付きバウンディングボックスに依存している。
本稿では,画像レベルのアノテーションのみに依存する,ドメイン固有の弱教師付きオブジェクト検出アルゴリズムを提案する。
本手法は、画像中のウイルスの有無を予測するタスクにおいて、事前訓練されたモデルの知識を蒸留し、擬似ラベルのセットを得る。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:02:25 GMT)
Sortblock: Similarity-Aware Feature Reuse for Diffusion Model [9.7] Diffusion Transformer (DiTs) は顕著な生成能を示した。
DiTのシーケンシャルな denoising プロセスは、高い推論遅延をもたらす。
トレーニング不要な推論アクセラレーションフレームワークであるSoltblockを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:10:54 GMT)
GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics [9.5] GateLensは、自動車分野のデータ分析のためのLLMベースのシステムである。
遅くて不透明でメンテナンスにコストがかかる従来のマルチエージェントや計画ベースのシステムとは異なり、GateLensはスピード、透明性、信頼性を強調している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:33:50 GMT)
COSTARR: Consolidated Open Set Technique with Attenuation for Robust Recognition [9.3] 既存のオープンセット認識手法は、慣れ親しんだ特徴の欠如による新規性の検出という、親しみやすい仮説に依存している。
そこで本研究では,訓練期間中に学習した小重量度を2つの役割差分クラスに作用させる,新しい減衰仮説を提案する。
我々は、慣れ親しんだ特徴の要求と馴染みのない特徴の欠如を組み合わせた新しいアプローチであるCOSTARRを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:44:46 GMT)
From EMR Data to Clinical Insight: An LLM-Driven Framework for Automated Pre-Consultation Questionnaire Generation [9.3] 複雑な電子カルテ(EMR)から事前コンサルテーションアンケートを作成するための新しい枠組みを提案する。
この枠組みは、明確な臨床知識を構築することによって直接的手法の限界を克服する。
実世界のEMRデータセットを用いて評価し,臨床専門家が検証し,情報カバレッジ,診断関連性,理解可能性,生成時間に優れた性能を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:24:49 GMT)
Bagged Regularized $k$-Distances for Anomaly Detection [9.1] BRDAD (Bagged regularized $k$-distances for Anomaly Detection) と呼ばれる距離に基づく新しいアルゴリズムを提案する。
我々のBRDADアルゴリズムは、重み付けされた密度推定のための$k$-distances(BWDDE)の実証的リスクの有限標本境界を最小化して重みを選択する。
提案手法は,他の手法と比較してバギング手法を導入することにより,実世界のデータセット上での優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:12:08 GMT)
AAA-Gaussians: Anti-Aliased and Artifact-Free 3D Gaussian Rendering [9.0] エイリアスを緩和する適応型3次元平滑化フィルタを導入し,安定なビュー空間境界法を提案する。
本評価では, エイリアス, 歪み, ポップアップアーティファクトを効果的に除去し, リアルタイム, アーティファクトフリーなレンダリングを実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:12:07 GMT)
Pro2Guard: Proactive Runtime Enforcement of LLM Agent Safety via Probabilistic Model Checking [9.0] 大規模言語モデル(LLM)エージェントは、ロボット工学、仮想アシスタント、Webオートメーションといった分野にまたがる強力な自律能力を示す。
AgentSpecのような既存のルールベースの執行システムは、リアクティブな安全ルールの開発に重点を置いている。
本稿では,確率的到達可能性解析に基づくプロアクティブ実行時実行フレームワークPro2Guardを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:24:47 GMT)
Learning Network Dismantling without Handcrafted Inputs [8.9] 注意機構を導入し、メッセージイテレーションプロファイルを用いて、小さな合成ネットワークの構造的に多様なトレーニングセットを生成する。
これにより、表現力のあるメッセージパッシングフレームワークを構築し、ネットワークディスマントリングのNPハード問題を効率的に解決する。
提案モデルでは,数百万のノードを持つ大規模で目に見えない実ネットワークに一般化し,最先端のネットワーク分割手法より優れている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:22:37 GMT)
Integrating Generative Artificial Intelligence in ADRD: A Roadmap for Streamlining Diagnosis and Care in Neurodegenerative Diseases [8.9] 医療システムは、特にアルツハイマー病と関連する認知症において、神経学的ケアの需要が増大するのに苦慮している。
LLMに基づく生成AIシステムは,ADRDケアにおける専門レベルの評価と意思決定に大規模にアプローチするために臨床能力を高めることができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:21:40 GMT)
Backdoor Attacks on Deep Learning Face Detection [8.9] 本稿では,顔検出におけるオブジェクト生成攻撃の有効性を示す。
顔検出装置が行う座標回帰タスクをバックドアとするランドマークシフトアタックを初めて実演する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:29:26 GMT)
Multi-Agent Game Generation and Evaluation via Audio-Visual Recordings [8.9] 我々はAudioVisual Recordings (AVR) を用いたマルチメディアコンテンツ品質の新しい指標を構築した。
オーディオ-Evalは、コンテンツが壊れたり、不一致だったりして、良さを適切に識別する。
マルチメディア資産の銀行からJavaScriptコードを生成するマルチエージェントシステムである build-Agent を構築。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:45:13 GMT)
VQ-DeepISC: Vector Quantized-Enabled Digital Semantic Communication with Channel Adaptive Image Transmission [8.9] 意味的特徴の離散化は、意味的コミュニケーションシステムとデジタルコミュニケーションシステムの相互運用を可能にする。
チャネル適応画像伝送を用いたベクトル量子化(VQ)対応ディジタルセマンティック通信システムを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:35:34 GMT)
KFS: KAN based adaptive Frequency Selection learning architecture for long term time series forecasting [8.8] そこで我々は,これらの課題に対処するために,KAを用いた適応周波数選択学習アーキテクチャ(KFS)を提案する。
このフレームワークは、クロススケールノイズ干渉と複雑なパターンモデリングから生じる予測問題に対処する。
複数の実世界の時系列データセットにまたがる実験により、KTは単純で効果的なアーキテクチャとして最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:50:57 GMT)
Your other Left! Vision-Language Models Fail to Identify Relative Positions in Medical Images [8.8] 医用画像上の相対的な位置を正確に決定できる最先端のビジョンランゲージモデル(VLM)の能力を評価する。
解剖学的構造の上に置かれるアルファ数値や着色マーカーなどの視覚的プロンプトが、性能を高めることができるかどうかを検討する。
以上の結果から,医用画像では,VLMは実際の画像内容よりも解剖学的知識に頼っていることが示唆された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:44:06 GMT)
Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning [8.7] 本稿では,55言語における競合レベルの問題を特徴とする多言語数学ベンチマークMCLMを紹介する。
テスト時間スケーリングの3つのメソッドをテストします - Outcome Reward Modeling(ORM)、Process Reward Modeling(ORM)、Budget Forcing(BF)です。
実験の結果,Qwen2.5-1.5B Math with ORMはMCLMでは35.8,MR1-1.5BではBFは35.2であった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:09:29 GMT)
Breaking the mould of Social Mixed Reality -- State-of-the-Art and Glossary [8.6] 本稿では,MR(Mixed Reality)技術における重要なギャップについて考察する。
進歩はあるものの、MRは人間の体現と社会運動の相互作用を完璧に再現するのに苦戦している。
我々は,人間と仮想自律エージェントの社会的相互作用と協調を促進するMRシステムを提唱する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:05:12 GMT)
Edge-ASR: Towards Low-Bit Quantization of Automatic Speech Recognition Models [8.6] 量子化、特にPTQ(Post-Training Quantization)は、再トレーニングせずにモデルサイズと推論コストを削減する効果的な方法を提供する。
本稿では、WhisperとMoonshineの2つのエッジASRモデルファミリーに適用した8つの最先端(SOTA)PTQ手法のベンチマークを示す。
提案手法は効率と精度のトレードオフを特徴とし,3ドルビット量子化さえも高容量モデルで成功できることを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:13:43 GMT)
Sampling-enabled scalable manifold learning unveils discriminative cluster structure of high-dimensional data [8.5] 大規模・高次元データに対して一様および識別的埋め込み(SUDE)を可能にする,サンプリングベースでスケーラブルな多様体学習手法を提案する。
合成データセットと実世界のベンチマークにおけるSUDEの有効性を実証的に検証し, 単細胞データの解析と心電図信号の異常検出に応用した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:18:05 GMT)
AI-Educational Development Loop (AI-EDL): A Conceptual Framework to Bridge AI Capabilities with Classical Educational Theories [8.5] 本研究では、古典的学習理論とAIを融合した理論駆動型フレームワークであるAI-Educational Development Loop(AI-EDL)を紹介する。
このフレームワークは透明性、自己統制型学習、教育的監視を強調している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:44:19 GMT)
Rethinking Pan-sharpening: Principled Design, Unified Training, and a Universal Loss Surpass Brute-Force Scaling [8.5] PanTinyは、効率性とロバストなパフォーマンスの両方のために設計された、シングルステップのパンシャーピングフレームワークである。
1つのコンパクトなモデルを3つの異なる衛星データセット上で同時に訓練する、マルチインワントレーニングパラダイムを導入する。
私たちの研究は、パンシャーピングのための効率的で汎用的でデータ指向のモデルを作成するための、コミュニティ全体のシフトを提唱しています。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:06:11 GMT)
ContestTrade: A Multi-Agent Trading System Based on Internal Contest Mechanism [8.5] 大規模言語モデル(LLM)に基づくエージェントは、金融取引において大きな可能性を示す。
マーケットノイズに対する高い感度は、LLMベースのトレーディングシステムの性能を損なう。
本稿では,現代企業経営構造にインスパイアされた内部競争機構を特徴とする新しいマルチエージェントシステムを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:48:13 GMT)
XFMNet: Decoding Cross-Site and Nonstationary Water Patterns via Stepwise Multimodal Fusion for Long-Term Water Quality Forecasting [8.4] XFMNetは、リモートセンシング降水画像を統合する段階的なマルチモーダル核融合ネットワークである。
XFMNetは長期トレンドと短期変動の両方をキャプチャする。
実世界のデータセットの実験は、最先端のベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:11:36 GMT)
SynAdapt: Learning Adaptive Reasoning in Large Language Models via Synthetic Continuous Chain-of-Thought [8.3] CoT(Chain-of-Thought)推論は、離散CoTトークン(DCoT)の生成によってかなりの時間コストを発生させる
既存のContinuous CoTメソッドは、間接的な微調整、限定されたアライメント、一貫性のないターゲットによって妨げられます。
我々は、革新的な効率的な推論フレームワークである textitSynAdapt を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:17:35 GMT)
UTrace: Poisoning Forensics for Private Collaborative Learning [8.2] 我々は、マシンラーニング(PPML)における中毒攻撃のユーザレベルトレースバックのためのフレームワークであるUTraceを紹介する。
UTraceは低毒性率で有効であり、複数のデータ所有者に分散した攻撃に対して耐性がある。
10件の中毒に対するUTraceの有効性を示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:31:33 GMT)
The Missing Parts: Augmenting Fact Verification with Half-Truth Detection [8.1] 多くの現実世界の主張は半真実であり、実際は正しいが、批判的な文脈が欠落しているために誤解を招く。
我々は,半真実検出の課題を紹介し,文レベルの証拠アライメントと推論されたクレーム意図を付加した15kの政治的クレームを備えた新しいベンチマークであるPolitiFact-Hiddenを提案する。
提案するTRACERは,エビデンスを整理し,インプリートを推定し,隠されたコンテンツの因果的影響を推定することにより,省略に基づく誤報を識別するモジュラー・リアセスメント・フレームワークである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:06:38 GMT)
Matrix Decomposition and Applications [8.0] 1954年、Alston S. Householder は行列分解に関する最初の近代的な研究の1つである Principles of Numerical Analysis を出版した。
行列分解は、主にニューラルネットワークに適合するバックプロパゲーションアルゴリズムの開発によって、機械学習のコア技術となった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:54:22 GMT)
Expressive Power of Graph Transformers via Logic [7.9] Dwivedi and Bresson (2020) によるグラフトランスフォーマー (GT) の表現力と Ramp'asek et al. (2022) による GPS-networks について検討する。
実数では、GPSネットワークは、グローバルなモダリティを持つグレードド・モーダル論理(GML)と同じ表現力を持つことを示す。
フロートでは、GPSネットワークはグローバルなモダリティを数えながら、GMLと同等に表現できることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:59:13 GMT)
Sound and Complete Neurosymbolic Reasoning with LLM-Grounded Interpretations [7.8] 大規模言語モデル(LLM)は、自然言語の理解と生成において印象的な能力を示している。
パラ一貫性論理に対する形式的意味論の解釈関数に LLM を直接統合する手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:30:02 GMT)
AugInsert: Learning Robust Visual-Force Policies via Data Augmentation for Object Assembly Tasks [7.6] 本研究は,ペグ・イン・ホール・アセンブリ・タスクにおける多感覚ポリシーの堅牢性を評価することを目的とした,新しい因子に基づく評価フレームワークを提案する。
オブジェクトアセンブリにおいて,どの要素が最大の一般化課題となるのかを考察し,簡易な多感覚データ拡張手法について検討する。
我々は、力覚センサーが、我々のコンタクトリッチアセンブリータスクにおいて最も情報に富むモダリティであり、視覚が最も情報に乏しいことを発見した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:53:38 GMT)
TrajSurv: Learning Continuous Latent Trajectories from Electronic Health Records for Trustworthy Survival Prediction [7.5] 我々は、信頼できる生存予測のための長手EHRデータから連続潜時軌道を学習するモデルであるTrajSurvを開発する。
TrajSurvは、臨床経過を生存結果に透過的に関連付けるために、2段階の分割とコンカマーの解釈プロセスで潜在軌道を使用する。
MIMIC-IIIとeICUの2つの実世界の医療データセットの評価は、TrajSurvの競合精度と既存のディープラーニング手法よりも優れた透明性を示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:18:51 GMT)
FFGAF-SNN: The Forward-Forward Based Gradient Approximation Free Training Framework for Spiking Neural Networks [7.3] Spiking Neural Networks (SNN)は、エネルギー効率の良いニューロモルフィックコンピューティングのための生物学的に妥当なフレームワークを提供する。
SNNを効率よく訓練することは困難である。
本稿では,スパイキングニューラルネットワークのためのフォワードフォワード(FF)に基づく勾配近似自由トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:34:09 GMT)
LeakSealer: A Semisupervised Defense for LLMs Against Prompt Injection and Leakage Attacks [7.1] LeakSealerは、法医学的な洞察のための静的分析とHuman-In-The-Loopパイプラインの動的防御を組み合わせた、モデルに依存しないフレームワークである。
筆者らはLeakSealerを,(1)公開ベンチマークデータセットを用いたジェイルブレイクの試み,(2)ラベル付きLLMインタラクションのキュレートデータセットによってサポートされているPIIリークの2つのシナリオで実証的に評価した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:04:28 GMT)
Integrating clinical reasoning into large language model-based diagnosis through etiology-aware attention steering [7.1] LLM(Large Language Models)は、医学的テキスト理解と生成において重要な機能を示す。
本研究の目的は,LSMの診断精度と臨床推論能力を高めることである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:05:43 GMT)
MetaAgent: Toward Self-Evolving Agent via Tool Meta-Learning [7.0] 実践と継続的な自己改善を通じて専門知識を育成するメタエージェントを提案する。
知識ギャップに遭遇すると、MetaAgentは自然言語ヘルプリクエストを生成し、最も適切な外部ツールにルーティングする。
MetaAgentはタスクを解決するため、自己修正と回答の検証を継続的に行い、実行可能な経験を簡潔なテキストに蒸留する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:30:32 GMT)
Bidirectional Action Sequence Learning for Long-term Action Anticipation with Large Language Models [6.9] ビデオベースの長期的な行動予測は、自動運転やロボット工学といった分野における早期のリスク検出に不可欠である。
従来のアプローチでは、エンコーダを使用して過去のアクションから特徴を抽出し、デコーダによる将来のイベントを予測する。
提案手法であるBiAntは,大言語モデルを用いた前方予測と後方予測を組み合わせることで,この制限に対処する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:07:24 GMT)
Dynamically Adaptive Reasoning via LLM-Guided MCTS for Efficient and Context-Aware KGQA [6.8] 本稿では,知識グラフ質問応答(KGQA)のための動的適応MCTSベースの推論(DAMR)を提案する。
DAMRはシンボリックサーチと適応経路評価を統合し,KGQAを効率よく認識する。
複数のKGQAベンチマークの実験では、DAMRは最先端の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:38:21 GMT)
The Inter-Intra Modal Measure: A Predictive Lens on Fine-Tuning Outcomes in Vision-Language Models [6.7] Intra Modal Measure (IIMM) は、モーダル内画像の類似性とモーダル間不一致の関係を定量化する予測指標である。
既存の転送可能性測定と比較して、IIMMはデュアルエンコーダモデルにおける微調整後の精度変化に対して、はるかに強い予測力を示す。
我々は、IIMMの変化が、事前と後調整の埋め込みの間のワッサーシュタイン距離によって制限されていることを証明した理論的境界を与える。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:18:42 GMT)
Multimodal Quantitative Measures for Multiparty Behaviour Evaluation [6.7] 骨格運動データにおける多人数社会的行動の客観的評価のための統合的介入駆動型フレームワークを提案する。
3つの理論駆動摂動による計量感度の検証を行った。
混合効果分析により、予測可能な、共同非依存的なシフトが明らかになる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:46:12 GMT)
iSafetyBench: A video-language benchmark for safety in industrial environment [6.7] iSafetyBenchは、産業環境でのモデルパフォーマンスを評価するために設計された新しいビデオ言語ベンチマークである。
iSafetyBenchは、現実世界の産業環境から得られた1100本のビデオクリップで構成されている。
ゼロショット条件下で8つの最先端ビデオ言語モデルを評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:55:53 GMT)
When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Exploratory Recommendation [6.7] 大規模言語モデル(LLM)は、その多様なコンテンツ生成能力でポテンシャルを示す。
既存のLLM拡張デュアルモデルフレームワークには2つの大きな制限がある。
まず、グループアイデンティティによって引き起こされる長期的な嗜好を見落とし、関心モデリングのバイアスにつながる。
第二に、1回のアライメントプロセスでは、クローズドループ最適化にインクリメンタルなユーザデータを活用することができないため、静的な最適化の欠陥に悩まされる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:10:56 GMT)
A Context-Aware Dual-Metric Framework for Confidence Estimation in Large Language Models [6.6] 大規模言語モデル(LLM)に対する現在の信頼度推定法は,応答と文脈情報の関連性を無視する。
本稿では,2つの新しい指標を用いた信頼度推定のためのコンテキスト忠実度と一貫性を統合したCRUXを提案する。
3つのベンチマークデータセットに対する実験は、CRUXの有効性を示し、既存のベースラインよりも高いAUROCを達成した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:58:34 GMT)
Coherent manipulation of interacting electron qubits on solid neon [6.6] 単一電子オンソリッドネオン (eNe) 電荷量子ビットは、極端に長いコヒーレンス時間と高い操作率を示す。
このプラットフォームの2量子ゲートは、現実的な量子情報処理の次の大きなステップである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:45:43 GMT)
Lossless Token Merging Even Without Fine-Tuning in Vision Transformers [6.6] トークン圧縮技術は、しばしば深刻な情報損失に悩まされる。
本稿では、ロスレストークンのマージを保証する新しい手法であるAdaptive Token Merging(ATM)を提案する。
我々は、幅広い事前訓練されたモデルにまたがって、我々の手法を実証的に検証する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:01:05 GMT)
Enhancing Time Series Forecasting via Multi-Level Text Alignment with LLMs [6.6] 大規模言語モデル(LLM)を用いた時系列予測のための多段階テキストアライメントフレームワークを提案する。
本手法は,時系列をトレンド,季節,残留成分に分解し,コンポーネント固有のテキスト表現に再プログラムする。
複数のデータセットに対する実験により,提案手法は高い解釈性を提供しながら,最先端のモデルよりも精度が高いことを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:54:29 GMT)
ExeKGLib: A Platform for Machine Learning Analytics based on Knowledge Graphs [6.6] ExeKGLibはグラフィカルなインターフェース層で拡張されたPythonライブラリで、最小限のML知識を持つユーザがMLパイプラインを構築することができる。
これは、MLの知識を単純な言葉で、非MLの専門家にエンコードする知識グラフに依存することで達成される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:45:49 GMT)
EPANet: Efficient Path Aggregation Network for Underwater Fish Detection [6.6] 水中魚類検出(UFD)のための効率的な経路集約ネットワーク(EPANet)を提案する。
EPANetは2つの重要なコンポーネントで構成されている: 効率的な経路集約機能ピラミッドネットワーク(EPA-FPN)と、マルチスケールの多様な分割ショートパスボトルネック(MS-DDSPボトルネック)である。
ベンチマークUFDデータセットの実験では、EPANetは検出精度と推論速度の点で最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:09:13 GMT)
Rethinking Backbone Design for Lightweight 3D Object Detection in LiDAR [6.6] Dense Backboneは、高速な処理速度、軽量なアーキテクチャ、堅牢な検出精度の利点を組み合わせた軽量なバックボーンです。
我々は、PillarNetのような複数のSoTA 3dオブジェクト検出器をバックボーンで適用し、バックボーンでは、これらのモデルが計算コストを大幅に削減して、ほとんどの検出能力を維持できることを示す。
PillarNetの適応であるDensePillarNetは、モデルパラメータの29%の削減とレイテンシの28%の削減を実現し、nuScenesテストセットでの検出精度はわずか2%低下した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:19:51 GMT)
HuiduRep: A Robust Self-Supervised Framework for Learning Neural Representations from Extracellular Recordings [6.6] スパイクソートは、脳の感知パイプラインにおける重要なステップである。
HuiduRepは、堅牢な自己教師型表現学習フレームワークである。
ハイブリッドおよび実世界のデータセットの実験は、HuiduRepが強い堅牢性を達成することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:30:21 GMT)
AutoDebias: Automated Framework for Debiasing Text-to-Image Models [6.6] テキスト・ツー・イメージ(T2I)モデルはテキスト・プロンプトから高品質な画像を生成するが、しばしば意図しない社会的偏見を示す。
本稿では,T2Iモデルにおける有害バイアスを自動的に識別・緩和するフレームワークであるAutoDebiasを提案する。
このフレームワークを25以上のバイアスシナリオをカバーするベンチマークで評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:05:45 GMT)
ThermoCycleNet: Stereo-based Thermogram Labeling for Model Transition to Cycling [6.6] スポーツ医療における強力なツールとして、赤外線サーモグラフィーが登場している。
本研究では, トレッドミル走行からエルゴメーターサイクリングへのステレオ・マルチモーダル・ラベリング手法の移行を目指す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:55:00 GMT)
Wind Power Scenario Generation based on the Generalized Dynamic Factor Model and Generative Adversarial Network [6.6] 本研究では,空間的および時間的相関,波形,境界傾斜率,統計特性を用いて,分散風力発電所の長期風力シナリオを同時に合成する。
GDFMとGANの利点を組み合わせるために、GANを用いて観測データから時間的情報を用いて動的因子を抽出するフィルタを提供し、そのフィルタをGDFMに応用して、可塑性波形の空間および周波数の両方を表す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:08:03 GMT)
Leveraging Large Language Model for Information Retrieval-based Bug Localization [6.5] 我々はGenLocと呼ばれる,LLMに基づく新しいバグローカライズ手法を提案する。
バグレポートが与えられた場合、GenLocはコード探索機能を備えたLLMを活用して、コードベースを反復的に分析し、潜在的なバグファイルを特定する。
GenLocは6つの大規模Javaプロジェクトから9000以上の現実世界のバグレポートで評価されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:48:10 GMT)
Guiding Diffusion-Based Articulated Object Generation by Partial Point Cloud Alignment and Physical Plausibility Constraints [6.5] 本稿では,新しい拡散モデルに基づく音声オブジェクト生成手法であるPhysNAPを提案する。
予測SDFを用いて計算した点雲アライメント損失を用いて逆拡散過程を導出する。
また、より物理的に妥当なオブジェクトを生成するために、モデルを誘導する部分SDFに基づいて、非ペネティフィケーションとモビリティの制約を課す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:56:03 GMT)
Towards Fair In-Context Learning with Tabular Foundation Models [6.5] トランスフォーマーを用いたインコンテクスト学習(ICL)におけるフェアネスの最初の研究について述べる。
最近提案された3つの基盤モデル(TabPFNv2、TabICL、TabDPT)をベンチマークデータセットで評価した。
実験の結果、不確実性に基づく戦略は、予測精度に最小限の影響を伴って、グループフェアネスの指標を一貫して改善することが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:57:48 GMT)
CountingFruit: Language-Guided 3D Fruit Counting with Semantic Gaussian Splatting [6.5] FruitLangGSは言語誘導型3Dフルーツカウントフレームワークである。
適応密度のガウススプラッティングパイプラインを用いてオーチャードスケールのシーンを再構成する。
マルチビューセグメンテーション融合エラーを回避し、Fuji-SfMオーチャードデータセット上で最大99.2%のリコールを達成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:31:48 GMT)
Can the latent signatures of quantum superposition be detected through correlation harvesting? [6.4] 本稿では,量子重ね合わせにおける相関収穫について検討する。
我々は、質量重畳されたBTZブラックホール時空において、量子場と相互作用する2つのUnruh-DeWitt検出器によって抽出された絡み合いと相互情報に焦点を当てた。
最終時空重畳状態が初期時空状態と整合するように条件付けされた場合, 絡み合いと相互情報が最大値に達することが判明した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:30:17 GMT)
CorrCLIP: Reconstructing Patch Correlations in CLIP for Open-Vocabulary Semantic Segmentation [6.4] Contrastive Language-Image Pre-Training (CLIP) は、画像パッチとカテゴリ埋め込みの整合に苦慮している。
本研究は,CLIPのセグメンテーション性能を損なう要因として,クラス間相関が重要であることを明らかにした。
パッチ相関のスコープと値を再構成するCorrCLIPを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:25:34 GMT)
FMPlug: Plug-In Foundation Flow-Matching Priors for Inverse Problems [6.3] FMPlugは,基礎フローマッチング(Foundation Flow-matching, FM)の先行性を高める新しいプラグインフレームワークである。
FMPlugはドメイン特化や訓練されていない事前のアプローチとは異なり、シンプルだが強力な2つの洞察を賢く活用する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:40:37 GMT)
HiPrune: Training-Free Visual Token Pruning via Hierarchical Attention in Vision-Language Models [6.3] HiPruneは、ビジョンエンコーダのためのトレーニング不要でモデルに依存しないトークンプルーニングフレームワークである。
視覚エンコーダ内の階層的アテンション構造を利用する。
33.3%のトークンで99.3%のタスク精度を維持し、11.1%のトークンで99.5%の精度を維持している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:48:11 GMT)
Type 1 Diabetes Management using GLIMMER: Glucose Level Indicator Model with Modified Error Rate [6.1] 本稿では,血糖値を予測する機械学習モデルであるGLIMMERを紹介する。
GLIMMERはグルコース値を正常および異常な範囲に分類し、新しいカスタム損失関数を用いる。
これらの結果は、RMSEが23%改善し、MAEが31%改善したことを示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:00:41 GMT)
GV-VAD : Exploring Video Generation for Weakly-Supervised Video Anomaly Detection [6.1] ビデオ異常検出(VAD)は、インテリジェント監視などの公共安全アプリケーションにおいて重要な役割を果たす。
本稿では, 意味制御可能な, 物理的に可視な合成ビデオを生成するために, 映像強化弱教師付きVADフレームワークを提案する。
提案するフレームワークは,UCF-Crimeデータセットの最先端手法より優れている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:42:40 GMT)
Optimal Scheduling Algorithms for LLM Inference: Theory and Practice [6.0] 本稿では,大規模言語モデル推論システムにおけるルーティングとスケジューリングをモデル化する理論的枠組みを開発する。
スループット向上に不可欠な設計原則として,最適化タイリングと動的リソース割り当ての2つがあげられる。
本稿では,リソース・アウェア・ダイナミック(RAD)スケジューラが軽度条件下でスループットの最適化を実現することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:12:21 GMT)
SAMSA 2.0: Prompting Segment Anything with Spectral Angles for Hyperspectral Interactive Medical Image Segmentation [6.0] ハイパースペクトル医療画像のための対話型セグメンテーションフレームワークSAMSA 2.0を提案する。
空間的手がかりとともにスペクトル類似性を用いて、Segment Anything Model (SAM) を誘導するためにスペクトル角プロンプトを導入する。
リトレーニングなしでは、SAMSA 2.0はRGBのみのモデルに比べて最大+3.8%高いDiceスコアを獲得し、以前のスペクトル融合法より最大+3.1%高い。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:16:26 GMT)
An Investigation into Value Misalignment in LLM-Generated Texts for Cultural Heritage [5.9] 大型言語モデル(LLM)は、文化遺産に関連するタスクでますます普及している。
古文書の翻訳、口伝の保存、教育内容の制作など、歴史的記念物の記述を作成するのに用いられる。
しかし、歴史的事実の誤表現、文化的なアイデンティティの侵食、複雑な文化的な物語の単純化など、文化的な価値の誤認識は発生した文献に存在している可能性がある。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:05:21 GMT)
Advancing Quantum Information Science Pre-College Education: The Case for Learning Sciences Collaboration [5.9] 我々は,この課題を達成するためには,学習科学との強い学際的な連携が必要であると論じている。
量子情報科学(QIS)教育における学習科学の2つの重要な貢献について論じる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:41:18 GMT)
The Role of Active Learning in Modern Machine Learning [5.9] データ拡張(DA)、半教師付き学習(SSL)、アクティブ学習(AL)など、この低データシナリオに対処するためのさまざまな方法の影響について検討する。
ALは低いデータ問題を解決する最も効率的な方法であり、ランダムサンプリングよりもわずか1-4%のリフトを生成する。
ALと強力なDAとSSLのテクニックが組み合わさると、驚くほど改善が得られます。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:39:14 GMT)
Stable at Any Speed: Speed-Driven Multi-Object Tracking with Learnable Kalman Filtering [5.9] マルチオブジェクトトラッキング(MOT)により、自動運転車は動的物体を継続的に知覚することができる。
Speed-Guided Learnable Kalman Filter (SG-LKF)は、エゴ車速に不確実性を適用し、高ダイナミックなシナリオにおける安定性と精度を著しく向上する。
SG-LKF は KITTI 2D MOT の79.59% HOTA で全ての視覚ベースの手法の中で第1位であり、KITTI 3D MOT では 82.03% HOTA で強い結果を出し、nuScenes 3D MOT では SimpleTrack を 2.2% AMOTA で上回っている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:42:33 GMT)
YOLO-FireAD: Efficient Fire Detection via Attention-Guided Inverted Residual Learning and Dual-Pooling Feature Preservation [5.8] 本研究は, 意識誘導型逆残差・デュアルプールダウンスケール核融合(YOLO-FireAD)による火災検出に一度だけ注目することを提案する。
注意誘導型逆残差ブロック(AIR)は、ハイブリッドチャネル空間の注意と逆残差を統合し、火災特性を適応的に増強し、環境騒音を抑制する。
Dual Pool Downscale Fusion Block (DPDF)は、最大平均プール出力の学習可能な融合を通じて、マルチスケールの火災パターンを保存する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:40:20 GMT)
Rethinking Multimodality: Optimizing Multimodal Deep Learning for Biomedical Signal Classification [5.8] 本研究では,生体信号分類における多モード深層学習の新たな視点を提案する。
相補的特徴領域がモデルの性能に与える影響を系統的に分析する。
最適領域融合は、モダリティの数ではなく、それらの固有の相補性の質であることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:12:10 GMT)
Efficient and Universal Watermarking for LLM-Generated Code Detection [5.8] 大規模言語モデル(LLM)はAI生成コードのユーザビリティを大幅に向上させた。
説明責任については、コードの一部がAI生成されているかどうかを検出することが不可欠である。
本稿では,ACWと呼ばれるAI生成コード検出のためのプラグアンドプレイ型透かし手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:17:22 GMT)
Accurate Cross-modal Reconstruction of Vehicle Target from Sparse-aspect Multi-baseline SAR data [5.8] マルチアスペクトマルチベースラインSAR3Dイメージングは、都市マッピングとモニタリングを約束する重要なリモートセンシング技術である。
過去には, 圧縮センシング(CS)がスパース3D SAR再建の主流であった。
ディープラーニング(DL)は強力な代替手段として登場し、再構築の質と効率を大幅に向上させた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:17:40 GMT)
Interpreting Performance Profiles with Deep Learning [5.7] この論文では、パフォーマンスプロファイルとプログラムセマンティクスをディープラーニングアプローチと組み合わせるための、新たな方向性を探求する。
Async Profilerによって生成されたプロファイルと、微調整されたCodeBERTベースのモデルからのコード要約を組み合わせる。
本システムは,多くのJavaベンチマークの分析を効果的に支援することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:23:41 GMT)
Team "better_call_claude": Style Change Detection using a Sequential Sentence Pair Classifier [5.7] PAN 2025では、共有タスクは参加者に対して、最もきめ細かいレベルでスタイルを検出するよう呼びかけている。
本稿では,Sentence Pair Pair (SSPC)アーキテクチャを用いて各インスタンスの内容をモデル化し,この問題に対処することを提案する。
EASY媒体でそれぞれ0.92328、0.724、HARDデータで強いマクロスコアを得る。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:48:17 GMT)
Observation of anomalous information scrambling in a Rydberg atom array [5.6] 量子情報スクランブル(quantum information scrambling)は、局所情報の伝播と効果的な損失を記述する。
本稿では,支配的なファン・デル・ワールス相互作用を持つ原子トウィーザーアレイの異常情報の観察について報告する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:48:32 GMT)
Coordinate-based Speed of Sound Recovery for Aberration-Corrected Photoacoustic Computed Tomography [5.6] 光音響CT(PACT)は、超音波と同様の非侵襲的な画像モダリティであり、広範囲の医療応用がある。
従来のPACT画像は、組織内の音の異種速度(SOS)による波面歪みによって劣化する。
本稿では,リングアレイPACTシステムにおいて,SOSと高品質な画像を復元する,効率的な自己教師型共同再構築手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:56:32 GMT)
NyayaRAG: Realistic Legal Judgment Prediction with RAG under the Indian Common Law System [5.6] 法的判断予測(LJP)は、司法結果の予測を自動化し、法的推論における解釈可能性を高めることを目的として、法律のためのAIの重要領域として登場した。
我々は,現実的な法廷シナリオをシミュレートする検索補助生成フレームワークであるNyayaRAGを提案する。
以上の結果から,構造化された法的知識による事実入力の増大は,予測精度と説明品質の両方を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:23:20 GMT)
Online Fine-Tuning of Carbon Emission Predictions using Real-Time Recurrent Learning for State Space Models [5.5] 本稿では,構造化状態空間モデル(SSM)の予測を実時間繰り返し学習を用いて推論時に微調整する手法を提案する。
組込み自動車ハードウェアから収集した小さな炭素排出量データセットを用いて,線形再帰単位SSMに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:37:19 GMT)
Biorthogonal Neural Network Approach to Two-Dimensional Non-Hermitian Systems [5.5] 非エルミート量子多体系は、豊富な物理現象を示す。
非エルミート皮膚効果と例外点は、既存の数値技術にはほとんどアクセスできない。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:02:41 GMT)
Are LLM-Powered Social Media Bots Realistic? [5.5] 我々は、合成ボットエージェントのペルソナとそのツイートとそのインタラクションを作成し、それによってソーシャルメディアネットワークをシミュレートする。
我々は,LLM駆動ボットのネットワーク特性と言語特性がWild Bots/Humansと異なることを観察し,経験的ボット/人間データと比較した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:06:13 GMT)
UAV-ON: A Benchmark for Open-World Object Goal Navigation with Aerial Agents [5.4] UAV-ONは、オープンワールド環境における航空エージェントによる大規模目標航法(NavObject)のベンチマークである。
多様な意味領域と複雑な空間レイアウトを備えた14の高忠実なUnreal Engine環境で構成されている。
1270のアノテートされたターゲットオブジェクトを定義し、それぞれがカテゴリ、物理フットプリント、視覚ディスクリプタをエンコードするインスタンスレベルの命令によって特徴付けられる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:23:06 GMT)
Accurate Latent Inversion for Generative Image Steganography via Rectified Flow [5.4] 拡散モデルに基づくステレオグラフィーは、高品質な画像を生成し、強靭性を示す能力によって注目されている。
我々は,新しい画像ステガノグラフィー手法である textbfRF-Stego を提案する。
RF-Stegoは, 抽出精度, 画質, 堅牢性, セキュリティ, 生成効率において, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:46:32 GMT)
Gradient Leakage Defense with Key-Lock Module for Federated Learning [5.4] Federated Learning(FL)は、プライバシ保護機械学習アプローチとして広く採用されている。
最近の発見は、プライバシーが侵害され、共有勾配から機密情報が回収される可能性があることを示している。
秘密鍵ロックモジュールを用いて任意のモデルアーキテクチャをセキュアにするための新しい勾配リーク防御手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:37:44 GMT)
Memory as Structured Trajectories: Persistent Homology and Contextual Sheaves [5.2] 本稿では,メモリをスパースなトポロジカルなアトラクタの集合として形式化するデルタホモロジーのアナロジーを導入する。
ディラックデルタのような記憶トレースは、認知状態の潜在多様体上の非自明なホモロジー生成器と同一視される。
我々はこれらのデルタホモロジー生成体を低エントロピー量変数と解釈し、高エントロピー文脈変数は濾過、コホモロジークラス、あるいは層として二重に表現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:03:13 GMT)
Experimental Evaluation of Dynamic Topic Modeling Algorithms [5.2] ソーシャルメディア上で毎日発生するテキストの量は巨大であり、このテキストを分析することは多くの目的に有用である。
大量のテキストの下にあるものを理解するためには、セルフパワーのトピックモデルからの信頼性と効果的な計算技術が必要である。
本研究では,これらのモデルを比較し,トピックが時間とともにどのように変化するかを示す評価指標を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:26:27 GMT)
Diffusion-Scheduled Denoising Autoencoders for Anomaly Detection in Tabular Data [5.2] 拡散型ノイズスケジューリングとコントラスト学習を統合し,異常検出を改善するフレームワークであるDiffusion-Scheduled Denoising Autoencoder (DDAE)を提案する。
提案手法は半教師付きセッティングにおいて優れ,非教師付きセッティングにおいて競争結果が得られ,PR-AUCを最大65%(9%)改善し,OC-AUCを16%(6%)改善する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:33:18 GMT)
HannesImitation: Grasping with the Hannes Prosthetic Hand via Imitation Learning [5.1] ロボット工学において、模倣学習は、把握と複雑な操作タスクを学ぶための有望なアプローチとして現れてきた。
本稿では,ハンネス義手を制御する模擬学習法であるHannesImitationPolicyを提案する。
我々はそのようなデータを利用して単一の拡散政策を訓練し、それを義手に展開し、手首の向きを予測し、手首をつかむために手首を閉じる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:09:38 GMT)
ExclaveFL: Providing Transparency to Federated Learning using Exclaves [5.1] 悪意のあるデータプロバイダは、検出されることなく、適切なトレーニングプロトコルから切り離すことができる。
ExclaveFLは、エンドツーエンドの整合性と透明性を提供するFLプラットフォームである。
実験により、ExclaveFLはTEEのない同じFLフレームワークと比較して10%未満のオーバーヘッドを導入していることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:58:43 GMT)
MultiSHAP: A Shapley-Based Framework for Explaining Cross-Modal Interactions in Multimodal AI Models [5.0] マルチモーダルAIモデルは、視覚や言語など、複数のモーダルからの情報の統合を必要とするタスクにおいて、目覚ましいパフォーマンスを達成した。
マルチモーダルAIモデルにおけるクロスモーダルインタラクションを説明するには、依然として大きな課題である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:19:18 GMT)
MoSSDA: A Semi-Supervised Domain Adaptation Framework for Multivariate Time-Series Classification using Momentum Encoder [5.0] 半教師付きドメイン適応(SSDA)はこの問題に対処するための主要なアプローチである。
時系列分類のための新しい2段階の運動量エンコーダを用いたSSDAフレームワークMoSSDAを提案する。
MoSSDAは、3つの異なるバックボーンと、ターゲットドメインデータのラベルなし比率に対して、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:27:44 GMT)
MMBERT: Scaled Mixture-of-Experts Multimodal BERT for Robust Chinese Hate Speech Detection under Cloaking Perturbations [4.9] 我々は,中国のソーシャルネットワーク上でのヘイトスピーチ検出のための新しいBERTベースのマルチモーダルフレームワークMMBERTを提案する。
MMBERTには、モダリティ固有の専門家、共有自己認識機構、ルータベースのエキスパートアロケーション戦略が組み込まれている。
いくつかの中国のヘイトスピーチデータセットの実証結果は、MMBERTが細調整されたBERTベースのエンコーダモデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:34:57 GMT)
Measurement-device-independent quantum key distribution with asymmetric sources [4.9] 計測デバイスに依存しない量子鍵分布(MDI-QKD)は、エンドツーエンドの量子ネットワークの実装において最も有望な技術の一つである。
この研究は、MDI-QKDネットワークを非対称ソースで解析し最適化するための理論的基盤を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:00:08 GMT)
Unraveling Hidden Representations: A Multi-Modal Layer Analysis for Better Synthetic Content Forensics [4.9] 悪意のあるユーザーは 合成メディアを利用して 偽情報を広め ディープフェイクを広める
堅牢で安定した偽の検知器の必要性は、特に新しい生成モデルが毎日現れるとき、強く迫っている。
本稿では,大規模な事前学習型マルチモーダルモデルを用いて生成物を検知する手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:07:00 GMT)
Is LLM-Generated Code More Maintainable \& Reliable than Human-Written Code? [4.9] 本研究では,LLM生成コードと人手書きコードの内部品質特性を比較した。
我々の分析によると、LLM生成コードにはバグが少なく、全体的な修正に労力がかかりません。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:17:34 GMT)
Reducing Quantum Circuit Synthesis to #SAT [4.9] 普遍的な量子回路合成問題を最大モデルカウントに還元できることを示す。
Clifford+Tゲートセットに、精密で近似的な深さ最適化量子回路合成のための#SAT符号化を定式化する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:13:49 GMT)
E2E Parking Dataset: An Open Benchmark for End-to-End Autonomous Parking [4.9] エンドツーエンドの自律駐車のための高品質なデータセットを作成し、オープンソース化します。
元のモデルを用いて、平均位置と向きの誤差が低い85.16%の総合的な成功率を達成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:21:41 GMT)
Analysing Temporal Reasoning in Description Logics Using Formal Grammars [4.9] 演算子 $bigcirck$ と $mathcalEL$ 記述ロジックの時間拡張である $mathcalTELbigcirc$ との対応を確立する。
この接続は、$mathcalTELbigcirc$がモデルの究極の周期性の性質を持っておらず、$mathcalTELbigcirc$のクエリ応答が決定不能になることを意味する。
また、$mathcalTELbigcirc$の新しい興味深いフラグメントに対して、クエリ応答の決定可能性を確立することもできる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:17:49 GMT)
E2ATST: A Temporal-Spatial Optimized Energy-Efficient Architecture for Training Spiking Transformer [4.8] ペンチェン研究所, (2)南方理工大学, (3)深セン工業大学, 中国科学院, (4)中国科学院
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:50:40 GMT)
Controllable Pedestrian Video Editing for Multi-View Driving Scenarios via Motion Sequence [4.8] 本稿では,映像の描画と人体動作制御を統合して,多視点運転シナリオにおける歩行者映像編集のためのフレームワークを提案する。
我々のアプローチは、複数のカメラビューにまたがる歩行者領域を特定し、一定の比率で境界ボックスを検知し、これらの領域を統一されたキャンバスに変えて縫い合わせることから始まる。
実験により, 視覚的リアリズムのコヒーレンスと視線横断的整合性により, 高品質な歩行者編集を実現することが実証された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:56:57 GMT)
RecPS: Privacy Risk Scoring for Recommender Systems [4.8] インタラクションとユーザレベルでのプライバシリスクを測定するために,MIAベースのプライバシスコア手法であるRecPSを提案する。
重要なコンポーネントは相互作用レベルMIAメソッドRecLiRAであり、高品質なメンバシップ推定を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:19:56 GMT)
C-DOG: Multi-View Multi-instance Feature Association Using Connected δ-Overlap Graphs [4.6] C-DOG(Connected delta-Overlap Graph)は,ロバストな幾何学的特徴結合のためのアルゴリズムである。
C-DOGグラフでは、異なるビューから2D特徴点を表す2つのノードが、同じ3D点に対応する場合、エッジで接続される。
合成ベンチマークの実験では、C-DOGは幾何学ベースのベースラインアルゴリズムよりも優れているだけでなく、要求条件下でも非常に堅牢であることが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:03:20 GMT)
Objective Metrics for Evaluating Large Language Models Using External Data Sources [4.6] 本稿では,異なるセメータにまたがるクラステキスト資料から得られた主観的指標を活用するための枠組みを提案する。
このフレームワークは、スコアリングにおける自動化と透明性を強調し、人間の解釈への依存を減らす。
本手法は, 主観評価手法の限界に対処し, 教育, 科学, その他の高度な分野のパフォーマンス評価のためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:24:19 GMT)
Contact-Aware Amodal Completion for Human-Object Interaction via Multi-Regional Inpainting [4.6] コンピュータビジョンとロボット工学における人間と物体の相互作用を理解するためには、アモーダル・コンプリートが不可欠である。
我々は,物理知識と,HOI用に設計された特殊多領域塗装技術を用いた新しいアプローチを開発した。
実験の結果,本手法はHOIシナリオにおける既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:33:45 GMT)
Convergence of Implicit Gradient Descent for Training Two-Layer Physics-Informed Neural Networks [4.6] 暗黙的勾配降下(IGD)は、ある種のマルチスケール問題を扱う場合、共通勾配降下(GD)アルゴリズムより優れている。
IGDは線形収束速度で大域的最適解に収束することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:28:47 GMT)
Coflex: Enhancing HW-NAS with Sparse Gaussian Processes for Efficient and Scalable DNN Accelerator Design [4.5] ハードウェア・アウェア・ニューラルサーチ(HW-NAS)は、ニューラルネットワークの性能とハードウェアエネルギー効率を自動的に最適化する効率的なアプローチである。
我々は,Sparse Gaussian Process(SGP)と多目的ベイズ最適化を統合した新しいHW-NASフレームワークであるCoflexを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:38:03 GMT)
Frugal, Flexible, Faithful: Causal Data Simulation via Frengression [4.4] 本研究は,Fragalパラメータ化の深い生成的実現であるFragressionを紹介する。
frengressionは正確な推定と、時間変化データのフレキシブルで忠実なシミュレーションを提供する。
我々は、この枠組みが因果的マージンモデリングのための生成的アプローチに新たな研究を巻き起こすことを期待している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:43:59 GMT)
MMRAG-DocQA: A Multi-Modal Retrieval-Augmented Generation Method for Document Question-Answering with Hierarchical Index and Multi-Granularity Retrieval [4.4] 本研究の目的は,質問理解と回答生成のために,複数のページに分散したマルチモーダルエビデンスを特定し,統合することである。
MMRAG-DocQAと呼ばれる新しいマルチモーダルRAGモデルが提案され、テキスト情報と視覚情報の両方を長距離ページにわたって活用した。
共同類似性評価と大規模言語モデル(LLM)に基づく再分類により,多粒度意味検索法が提案された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:22:53 GMT)
Three-dimentional reconstruction of complex, dynamic population canopy architecture for crops with a novel point cloud completion model: A case study in Brassica napus rapeseed [4.4] 本研究では, 複雑でダイナミックな個体群キャノピーの3次元再構築手法を提案する。
トレーニングデータセットの自動アノテーションのために、完全なポイントクラウド生成フレームワークが開発された。
次に,多分解能動的グラフ畳み込みエンコーダ (MRDG) と点ピラミッドデコーダ (PPD) を用いて,閉鎖点の予測を行った。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:35:41 GMT)
Assessing Racial Disparities in Healthcare Expenditures via Mediator Distribution Shifts [4.4] 本研究は,媒介変数の分布の変化を通じて,このような相違を分解する枠組みを開発する。
我々は,保険アクセスや健康行動,健康状態などの仲介者が人種集団間で平等化されている場合,支出格差が持続または減少する程度について検討した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:16:08 GMT)
Agentic large language models improve retrieval-based radiology question answering [4.3] エージェント検索はゼロショットプロンプトよりも平均診断精度が有意に向上した。
最大の利益は中型モデルで発生した。
臨床的に微調整されたモデルでさえ、有意義な改善が見られた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:18:52 GMT)
Emergent Bifurcations in Quantum Circuit Stability from Hidden Parameter Statistics [4.3] 量子回路の圧縮は、短期量子コンピューティングの基本的な課題である。
本稿では,300個の構造一様回路の大規模数値解析によりこの問題を考察する。
各アンサンブルは、それぞれ異なる頑丈で脆弱なクラスに普遍的に分岐する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:59:19 GMT)
What's Behind the Magic? Audiences Seek Artistic Value in Generative AI's Contributions to a Live Dance Performance [4.3] 我々は、GenAIの有無にかかわらず、技術によって強化されたダンスパフォーマンスの2つのバージョンを開発した。
各バージョンについて、私たちは、パフォーマンスに対する彼らの認識に関する調査の前後で、パフォーマンスの開発について聴衆に知らせました。
その結果、個人は、その使用に気付いていないときに、元内が制作した作品に芸術的価値を重んじる傾向が強かった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:51:17 GMT)
BCR-DRL: Behavior- and Context-aware Reward for Deep Reinforcement Learning in Human-AI Coordination [4.3] 深層強化学習(DRL)は、AIエージェントをトレーニングし、人間のパートナーと協調するための強力なフレームワークを提供する。
DRLは人間とAIの協調において2つの重要な課題に直面している。
本稿では,DRLの探索と活用を最適化する革新的行動認識報酬(BCR)を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:09:26 GMT)
Machines and Mathematical Mutations: Using GNNs to Characterize Quiver Mutation Classes [4.2] グラフニューラルネットワークを使って、あるクイバーを別のクイバーに変換する操作である、Emphquiverの突然変異を調査します。
クラスター代数の研究において、置換同値性の問題は基本的な関心事である。
我々のモデルは、既知の基準を$D$から再構築できるように、その隠された表現内で構造をキャプチャすることを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:07:16 GMT)
AutoSIGHT: Automatic Eye Tracking-based System for Immediate Grading of Human experTise [4.2] 本稿では,専門家と熟練者以外のパフォーマーを分類した,人間の即時彫刻のためのオートライト自動システムを提案する。
本研究で用いたアイリス提示検出(PAD)タスクの結果,評価窓がわずか5秒で平均平均面積が0.751であることが確認された。
この研究は、人間と機械の専門知識の自動測定を人間とAIのペアリングに組み込む方法についての新しい研究領域を開く。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:28:13 GMT)
Segment Anything for Video: A Comprehensive Review of Video Object Segmentation and Tracking from Past to Future [4.1] Video Object and Tracking (VOST) はコンピュータビジョンにおいて複雑だが重要な課題である。
伝統的な手法は、領域の一般化、時間的一貫性、計算効率に悩まされてきた。
Segment Anything Model (SAM) のような基礎モデルとその後継であるSAM2は、パラダイムシフトを導入した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:57:17 GMT)
Theory of Mind Using Active Inference: A Framework for Multi-Agent Cooperation [4.1] 能動推論において心の理論(ToM)を実装することで,マルチエージェント協調への新たなアプローチを提案する。
ToMは、エージェントが自分の行動を計画しながら他人の信念を判断することを可能にする。
我々は、複雑な推論木に基づく計画アルゴリズムを拡張して、共同政策空間を体系的に探索する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:02:35 GMT)
Calibrated Language Models and How to Find Them with Label Smoothing [4.0] 大規模言語モデル(LLM)は、命令追従能力を改善することで、より強力な対話型エージェントとして振る舞うことができる。
自然言語処理(NLP)の最近の進歩は、命令追従能力の向上を通じて、より強力な対話的エージェントとして振る舞うための微調整された大規模言語モデル(LLM)を実現する機会を拡大している。
信頼性の高いモデル出力の 信頼性校正にどう影響するか 完全には研究されていない
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:12:20 GMT)
Blueprint First, Model Second: A Framework for Deterministic LLM Workflow [4.0] 我々は、"Blueprint First, Model Second"哲学に基づいた新しいパラダイムであるSource Code Agentフレームワークを紹介します。
私たちのフレームワークは、ワークフローロジックを生成モデルから切り離します。
我々の研究は、厳格な手続き論理に支配されるアプリケーションに自律エージェントを検証し、信頼性の高い配置を可能にする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:10:00 GMT)
A Novel Modeling Framework and Data Product for Extended VIIRS-like Artificial Nighttime Light Image Reconstruction (1986-2024) [4.0] 本稿では,2段階のプロセス-構築と改良-からなる新しい再構築フレームワークを提案する。
われわれは、1986年から26年間、標準的なデータ記録を遡って延ばし、中国のEVAL(Extended VIIRS-like Artificial Nighttime Light)製品を開発した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:44:55 GMT)
SDSNN: A Single-Timestep Spiking Neural Network with Self-Dropping Neuron and Bayesian Optimization [3.9] Spiking Neural Networks (SNN)は、生物にインスパイアされた新しい計算モデルである。
SNNは離散スパイク信号を通じて情報を伝達し、計算エネルギー消費を大幅に削減する。
本稿では,1段階の計算エネルギー消費を削減し,精度を向上させるシングルステップSNNを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:41:47 GMT)
Latent Knowledge Scalpel: Precise and Massive Knowledge Editing for Large Language Models [3.8] 大規模言語モデル(LLM)は、しばしば事前学習から不正確な情報や時代遅れの情報を保持し、推論中に誤った予測や偏りのある出力をもたらす。
我々はLLMエディタであるLatent Knowledge Scalpel(LKS)を紹介し、軽量なハイパーネットワークを用いて特定のエンティティの潜在知識を操作し、正確かつ大規模な編集を可能にする。
Llama-2とMistralで行った実験では、同時編集数が10,000に達したとしても、LKSは編集されたLLMの一般的な能力を保ちながら知識編集を効果的に行う。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:51:43 GMT)
Anomaly Detection in Double-entry Bookkeeping Data by Federated Learning System with Non-model Sharing Approach [3.8] ジャーナルのエントリーデータは極めて敏感であり、監査会社間で直接共有することは不可能である。
データコラボレーション(DC)分析に基づく新しい異常検出フレームワークを提案する。
提案手法は,8つの医療機関から収集した総合的および実世界のジャーナルエントリデータを用いて評価した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:01:30 GMT)
A Large Sensor Foundation Model Pretrained on Continuous Glucose Monitor Data for Diabetes Management [3.8] CGM-LSMはトランスフォーマーデコーダをベースとしたLarge Sensor Model (LSM) で, 糖尿病, 年齢, 性別の異なる患者から160万のCGMレコードを事前訓練した。
CGMデータに埋め込まれた潜伏知識を学習するために, 患者をグルコース時間ステップのシーケンスとしてモデル化し, 2時間水平線での血糖値の予測に応用する。
従来の方法と比較して、CGM-LSMは予測精度とロバスト性を大幅に改善し、1時間水平線予測におけるルート平均2乗誤差を48.51%削減し、保持された患者群間で一貫したゼロショット予測性能を向上した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:45:11 GMT)
Automated Label Placement on Maps via Large Language Models [3.8] データ編集問題としてタスクを定式化するALP(Automatic label Placement)の新たなパラダイムを導入する。
この方向を支援するため,実世界の地図上でALPを評価するためのベンチマークデータセットとして,MAPLEをキュレートした。
我々は,MAPLE 上で4つのオープンソース LLM を評価し,各種ランドマークの全体的な性能と一般化を解析した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:14:11 GMT)
Flow Matching for Probabilistic Learning of Dynamical Systems from Missing or Noisy Data [3.7] 本稿では,確率的予測のためのフローマッチングの変種を導入し,予測結果の分布として将来の状態を推定する。
また,複雑な力学系の状態を物理的・論理的に摂動する生成機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:35:17 GMT)
HetSyn: Versatile Timescale Integration in Spiking Neural Networks via Heterogeneous Synapses [3.7] Spiking Neural Networks (SNN)は、時間情報処理のための生物学的に妥当でエネルギー効率の高いフレームワークを提供する。
HetSynはシナプス特異的な時間定数でシナプス不均一性をモデル化するフレームワークである。
We demonstrate that HetSynLIF improve the performance of SNNs across various tasks。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:19:56 GMT)
Federated Time Series Generation on Feature and Temporally Misaligned Data [3.7] FedTDDは、クライアント間でシンセサイザーを共同で学習する、新しいフェデレーション時系列拡散モデルである。
従来のフェデレーション学習とは対照的に、FedTDDは、局所的な合成出力の交換を通じて、クライアントの時系列間の相関を学習する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:12:58 GMT)
TerraMesh: A Planetary Mosaic of Multimodal Earth Observation Data [3.7] TerraMeshは、光、レーダー、高度、開口、ランドレディのモダリティをData-Readyフォーマットで組み合わせた、グローバルに多様なマルチモーダルデータセットである。
本研究では,TerraMeshで事前学習した際のモデル性能の向上を示す詳細なデータ処理手順,包括的統計,実証的証拠を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:02:03 GMT)
IN2OUT: Fine-Tuning Video Inpainting Model for Video Outpainting Using Hierarchical Discriminator [3.6] ビデオのアウトパインティングは、与えられたコンテンツとの一貫性を維持しながら境界を拡張するという、ユニークな課題を示している。
判別器の局所的特徴と大域的特徴を両立させる特有な露光損失関数を開発した。
提案手法は, 定量的かつ定性的に, 最先端の手法より優れている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:15:14 GMT)
Analyze-Prompt-Reason: A Collaborative Agent-Based Framework for Multi-Image Vision-Language Reasoning [3.6] マルチイメージ推論のための協調エージェントベースフレームワークを提案する。
提案手法は,多様なデータセットやタスク形式にまたがるマルチモーダル推論のインターリーブ化という課題に対処する。
我々は2025年のMIRAGE Challengeから18種類の多様なデータセットについて評価を行った。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:39:15 GMT)
Compression-Induced Communication-Efficient Large Model Training and Inferencing [3.6] トレーニングと大規模なニューラルネットワークモデルによる推論のエネルギー効率は重要な課題である。
本稿では,エネルギー消費を最小化するために,ファントム並列方式(ファントム並列方式)を提案する。
実験により,提案したファントム並列手法を用いて,FFNの訓練用エネルギーを50%削減できることが示されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:51:40 GMT)
Lost in Space: Finding the Right Tokens for Structured Output [3.6] LLMシステムは構造化出力をますますサポートし、文法に従ってトークンをサンプリングすることでフォーマットを強制する。
意味的に(しばしば視覚的に)人間に似ている文法の間に体系的な違いはあるか?
我々は4つの共通NLPベンチマークで5つの出力形式を持つ4つの一般的なモデルファミリをテストする。
複数選択の文字や数値予測のための実数など,コンベンションを尊重する形式をガイドした場合には,すべてのモデルが最も正確であることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:52:27 GMT)
ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal [3.6] シャドーはいくつかの領域で突然の明るさ変化を引き起こし、下流のタスクの精度に影響を与える可能性がある。
本研究では,影領域,境界領域,非影領域を別々にスキャンする境界領域選択走査機構を提案する。
私たちはShadowMambaと呼ばれる、最初のMambaベースの軽量シャドウ除去モデルを設計した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:05:11 GMT)
Teaching at Scale: Leveraging AI to Evaluate and Elevate Engineering Education [3.6] 本稿では,大規模言語モデルを用いた定性的な学生フィードバックのためのスケーラブルなAI支援フレームワークを提案する。
このシステムは階層的な要約、匿名化、例外処理を用いて、オープンなコメントから実行可能なテーマを抽出する。
大規模な工学系大学への展開が成功したことを報告します。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:27:40 GMT)
EdgeInfinite-Instruct: Bridging SFT-Based Optimization and NPU-Level Efficiency for Edge Devices [3.5] 本稿では,要約や質問応答といった長文タスクに適したS-SFT(Seegmented Supervised Fine-Tuning)戦略を提案する。
長文ベンチマークと実世界のモバイルタスクを用いた実験により,NPU加速エッジデバイス上での効率を維持しつつ,ドメイン固有性能を向上させることができた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:03:16 GMT)
Managing Power Gaps as a Topic of Pair Programming Skill: A Grounded Theory [3.5] 産業で使用されるペアプログラミングにおいて、パワー関連の現象が何が起こるかを理解する。
パワー関連行動に関する基底理論の定式化
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:34:20 GMT)
Centralized Adaptive Sampling for Reliable Co-Training of Independent Multi-Agent Policies [3.5] 独立政策勾配アルゴリズムは、協調型・非競合型ゲームにおけるマルチエージェント強化学習(MARL)に広く用いられている。
これらは、各エージェントのポリシー勾配が準最適均衡に向かっているときに、亜最適収束することが知られている。
共同サンプリング誤差を低減するための適応的な動作サンプリング手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:07:25 GMT)
MetaExplainer: A Framework to Generate Multi-Type User-Centered Explanations for AI Systems [3.5] ユーザ中心の説明を生成するために設計された,ニューロシンボリックなフレームワークであるMetaExplainerを紹介する。
提案手法には3段階のプロセスがある: まず, 現状の大規模言語モデル (LLM) を用いて, ユーザ質問を機械可読形式に分解し, 第二に, システムレコメンデーションを生成するタスクをモデル記述者メソッドに委譲し, そして最後に, 説明者出力を要約した自然言語説明を合成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:01:40 GMT)
Platonic Representations for Poverty Mapping: Unified Vision-Language Codes or Agent-Induced Novelty? [3.4] 本研究では、家庭の富のような社会経済指標が、衛星画像やインターネットソーステキストに復元可能なインプリントを残しているかどうかを検討する。
我々は5つのパイプラインを通して家庭の富を予測するマルチモーダル・フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:07:16 GMT)
From LLMs to MLLMs to Agents: A Survey of Emerging Paradigms in Jailbreak Attacks and Defenses within LLM Ecosystem [3.4] 大規模言語モデル(LLM)は、シングルモーダルシステムからマルチモーダルLLMやインテリジェントエージェントへと急速に進化している。
本稿では,LLMエコシステムにおけるジェイルブレイク攻撃の複雑化とそれに対応する防御機構について,系統的な調査を行った。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:42:39 GMT)
Disaggregated Health Data in LLMs: Evaluating Data Equity in the Context of Asian American Representation [3.4] 大規模言語モデル (LLM) は情報検索に不可欠なツールである。
本研究は,アジア系アメリカ人における非民族集団の健康関連情報を抽出するLLMの能力について検討した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:55:17 GMT)
FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait [3.4] FLOATは,フローマッチング生成モデルに基づく音声駆動型音声画像生成手法である。
本手法は音声による感情強調をサポートし,表現運動の自然な取り込みを可能にする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:23:18 GMT)
Sheaf Graph Neural Networks via PAC-Bayes Spectral Optimization [3.3] グラフニューラルネットワーク(GNN)のオーバースムース化は、異なるノード機能で崩壊を引き起こす。
我々はSGPC(Sheaf GNNs with PAC-Bayes)と呼ばれる新しいスキームを導入する。
我々は,SGPCが未確認ノードに対して信頼区間を提供しながら,最先端のスペクトルおよび層ベースGNNよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:39:28 GMT)
Adaptive Branch Specialization in Spectral-Spatial Graph Neural Networks for Certified Robustness [3.3] 本稿では,グラフニューラルネットワーク(GNN)の各分岐を明示的に専門化する。
スペクトルネットワークは、l0エッジの摂動に耐え、ホモフィル構造を捉えるように訓練され、空間部分はリンフ摂動とヘテロフィルパターンに抵抗するように設計されている。
文脈対応ゲーティングネットワークは2つの表現を適応的に融合させ、各ノードのノードをより信頼性の高い分岐に動的にルーティングする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:21:04 GMT)
MCeT: Behavioral Model Correctness Evaluation using Large Language Models [3.3] AIモデリングアシスタントとしてのLarge Language Models(LLM)の利用の増加に伴い、ダイアグラムの生成により多くの自動化が関与するようになる。
本稿では,行動モデル,特にシーケンス図の正しさを,対応する要求テキストに対して評価する最初の完全自動化ツールMCeTを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:41:58 GMT)
ConfuGuard: Using Metadata to Detect Active and Stealthy Package Confusion Attacks Accurately and at Scale [3.3] パッケージ混乱の脅威を検知する最先端の検出器であるConfuGuardを紹介する。
本稿では,前パッケージ混同データから得られた良性信号の最初の経験的分析について述べる。
パッケージメタデータを活用して良質なパッケージを識別し、サポートを最大7つのソフトウェアパッケージレジストリに拡張します。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:59:14 GMT)
TopoRec: Point Cloud Recognition Using Topological Data Analysis [3.1] 本研究では,TDA(Topological Data Analysis)を用いて局所記述子を点群から抽出するTopoRecを提案する。
我々の手法は広範囲な訓練を必要としないため、新しい環境に容易に適応できる。
標準ベンチマークデータセットでは、最先端の学習ベースと手作りのベースラインの両方を一貫して上回る。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:35:41 GMT)
SynPAIN: A Synthetic Dataset of Pain and Non-Pain Facial Expressions [3.1] 既存の痛み検出データセットは、民族的/人種的多様性の制限、プライバシーの制約、高齢者の過小評価に悩まされている。
我々は,10,710個の表情画像を含む大規模合成データセットSynPAINを提案する。
商業的な生成AIツールを用いて、臨床的に有意な痛み表現を伴う人口動態バランスの取れた合成IDを作成しました。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:06:27 GMT)
A Conditional GAN for Tabular Data Generation with Probabilistic Sampling of Latent Subspaces [3.0] 本稿では,データセットのクラス不均衡を軽減する条件付きGANであるctdGANを提案する。
ctdGANは、入力サンプルにクラスタラベルを割り当てるスペースパーティショニングステップを実行する。
次に、これらのラベルを使用して、新しい確率的サンプリング戦略によってサンプルを合成する。
このように、ctdGANは、元のデータ分布に類似したサブスペースでサンプルを生成するように訓練されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:49:57 GMT)
OID-PPO: Optimal Interior Design using Proximal Policy Optimization by Transforming Design Guidelines into Reward Functions [2.9] 近似ポリシー最適化を用いた最適内部設計のための新しいRLフレームワークであるOID-PPOを提案する。
OID-PPOは、専門家が定義した機能ガイドラインと視覚ガイドラインを構造化報酬関数に統合する。
OID-PPOは、様々な部屋の形状や家具構成の異なる実験により、レイアウト品質と計算効率の観点から、最先端の手法を著しく上回ることを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:49:03 GMT)
What's in a Proof? Analyzing Expert Proof-Writing Processes in F* and Verus [2.8] 我々は,2つの言語で作業する8人の専門家から,詳細なソースコードテレメトリの収集と解析を行うユーザスタディを実施している。
その結果、専門家が証明開発プロセスで遭遇した重要な課題や証明についてどのように考えるかについて興味深い傾向とパターンが明らかになった。
我々はこれらの知見を,AI証明アシスタントのための具体的な設計指針に翻訳する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:16:30 GMT)
Ancilla-free Quantum Adder with Sublinear Depth [2.8] サブ線形深さとアンシラ量子ビットを持たない最初の正確な量子加算器を提示する。
我々の構成は古典的な可逆論理のみに基づいている。
また、量子レジスタに定数を増分し、加算するための新しい構成も提示する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:45:21 GMT)
The Repeated-Stimulus Confound in Electroencephalography [2.7] ニューラルデコード研究では、参加者の刺激に対する反応の記録がモデルの訓練に使用される。
いくつかの研究では、同じ刺激が各被験者に複数回提示され、モデルトレーニングで使用可能な試行回数を増やしている。
復号モデルが訓練され、その後同じ刺激に対する応答に基づいて評価されると、刺激の同一性は正確性のための共同設立者となる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:13:25 GMT)
ranDecepter: Real-time Identification and Deterrence of Ransomware Attacks [2.6] ランサムウェア(Ransomware, RW)は、デジタルランドスケープにおいて、重要かつ広範な脅威である。
RWは、しばしば攻撃者と防御者の間の通信路として機能する。
本稿では,アクティブなサイバー詐欺とリアルタイム分析を組み合わせた新しいアプローチであるrunDecepterを紹介する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:33:20 GMT)
Probabilistic Iterative Hard Thresholding for Sparse Learning [2.6] l0 ノルム」はベクトルの 0 でない成分の数を数える。
勾配のノイズが計算上の必要から評価されなければならないようなビッグデータ設定では、文献は確実に収束する手法に精通している。
我々は、基礎となるプロセスの収束を証明し、機械学習問題における性能を実証する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:29:57 GMT)
Binarizing Physics-Inspired GNNs for Combinatorial Optimization [2.6] PI-GNNの性能は問題グラフの密度の増大とともに低下することを示す。
本稿では,ファジィ論理とバイナライズニューラルネットワークの洞察を基盤として,PI-GNNにおけるナイーブ戦略の原則的代替案を提案する。
提案手法のポートフォリオがPI-GNNの性能を大幅に向上することを示す実験を行った。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:44:43 GMT)
Credible Plan-Driven RAG Method for Multi-Hop Question Answering [2.6] PDCA(Plan-Do-Check-Act)サイクルにインスパイアされた新しいフレームワークであるPAR-RAG(Plan-then-Act-and-Review RAG)を提案する。
Par-RAGは、現在の質問の意味的な複雑さにマッチした例を選び、複雑さを意識したトップダウンプランニングをガイドする。
二重検証機構は、中間誤差を評価し修正し、推論プロセスが事実上基底のままであることを保証する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:44:02 GMT)
Towards High-Resolution Alignment and Super-Resolution of Multi-Sensor Satellite Imagery [2.5] 本研究では,基準データセットとしてHalmonized Landsat Sentinel 10m(HLS10)を用いたLandsat Sentinel 30m(HLS30)画像のスケールアップフレームワークを開発した。
本研究の目的は,これらのセンサ間の解像度ギャップを埋め,超解像ランドサット画像の品質を向上させることである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:28:00 GMT)
Weakly Supervised Intracranial Aneurysm Detection and Segmentation in MR angiography via Multi-task UNet with Vesselness Prior [2.4] 頭蓋内動脈瘤 (IAs) は脳血管の異常な拡張であり、破裂すると生命を脅かす結果をもたらす。
本稿では,脳動脈瘤の検出とセグメンテーションを共同で行うために,血管度を組み込んだ3次元マルチタスクUNetを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:45:46 GMT)
MinionsLLM: a Task-adaptive Framework For The Training and Control of Multi-Agent Systems Through Natural Language [2.4] MinionsLLMは環境、エージェント、行動プリミティブを定義するための標準化されたインターフェイスを提供する。
大規模言語モデル(LLM)と挙動木(BT)と形式文法を統合し、マルチエージェントシステムの自然言語制御を可能にする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:10:29 GMT)
How LLMs are Shaping the Future of Virtual Reality [2.4] LLM(Large Language Models)とVR(Virtual Reality)ゲームの統合は、没入型、適応型、インテリジェントなデジタルエクスペリエンスの設計におけるパラダイムシフトである。
本稿では,これらのモデルがどのように物語生成,非プレイヤーキャラクタ(NPC)インタラクション,アクセシビリティ,パーソナライゼーション,ゲームマスタリングを変換しているかを検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:08:05 GMT)
Hierarchical Multi-Label Contrastive Learning for Protein-Protein Interaction Prediction Across Organisms [2.4] タンパク質間相互作用予測のための階層的コントラストフレームワークであるHIPPOを提案する。
提案手法は、タンパク質の機能クラス間の構造的関係をエミュレートする階層的コントラスト損失関数を含む。
ベンチマークデータセットの実験では、HIPPOが最先端のパフォーマンスを達成し、既存のメソッドを上回り、低データのレシエーションにおいて堅牢性を示すことが示されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:04:52 GMT)
Exploring the Evidence-Based SE Beliefs of Generative AI Tools [2.3] 実験ソフトウェア工学(SE)による5つの生成AIツールを対象とした17のエビデンスに基づくクレームを調査する。
我々の研究結果は、生成型AIツールは、研究の主張に関して曖昧な信念を持ち、回答を支援するための信頼できる証拠が欠如していることを示しています。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:27:59 GMT)
Quantum circuit for implementing AES S-box with low costs [2.2] これにより、行列乗算における$CNOT$ゲートの数を減らすことにより、Sボックスの実装に必要な量子リソースオーバーヘッドを低減することができる。
線形鍵スケジュールにより、AES-128量子回路は回路幅の積を102800ドルに減らした。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:17:13 GMT)
Quantum Key-Recovery Attacks on FBC Algorithm [2.2] 本稿では,異なるクエリ機能を持つFBC量子敵の包括的セキュリティ解析について述べる。
FBC-KF/FK構造に対して、古典的なクエリと量子コンピューティング機能を持つ敵を考慮し、低データ量子鍵回復攻撃を実演する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:08:53 GMT)
Functional vs. Object-Oriented: Comparing How Programming Paradigms Affect the Architectural Characteristics of Systems [2.2] 本研究では,OOPとFPがソフトウェアシステムのアーキテクチャ特性に与える影響を比較検討する。
Kotlin(OOPを表現)とScala(FPを表現)で開発されたDigital Walletシステムの設計と実装について検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:06:06 GMT)
$MV_{Hybrid}$: Improving Spatial Transcriptomics Prediction with Hybrid State Space-Vision Transformer Backbone in Pathology Vision Foundation Models [2.1] ビジョントランスフォーマー(ViT)のバックボーンをベースとした病理学における現在のビジョン基礎モデル(VFM)は、臨床基準以下である。
状態空間モデル(SSM)とViTを組み合わせたハイブリッドバックボーンアーキテクチャであるMV_Hybrid$を紹介する。
LOSO評価では、$MV_Hybrid$57%高い相関性を示し、性能劣化は43%小さい。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:23:45 GMT)
Local Poisson Deconvolution for Discrete Signals [2.1] 結合ポアソン畳み込みモデルから原子信号を復元する問題を解析する。
我々の主な結果は、スムーズな畳み込みカーネルの幅広いクラスに対して$mu$を推定する局所的ミニマックスリスクの定量化である。
これらの結果はポアソン・デコンボリューション問題に対する楽観的な見解を描いている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:59:57 GMT)
Tobler's First Law in GeoAI: A Spatially Explicit Deep Learning Model for Terrain Feature Detection Under Weak Supervision [2.1] 本稿では,物体検出を弱教師付きで行う深層学習モデルの開発について報告する。
このモデルは、地球や他の惑星の表面の自然と人造の両方の特徴に一般化される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:47:50 GMT)
CoRGI: Verified Chain-of-Thought Reasoning with Visual Grounding [2.1] textbfCoRGI(textbfChain textbfof textbfReasoning with textbfGrounded textbfInsights)を提案する。
我々は、VCRベンチマーク上でCoRGIを評価し、2つの代表的なオープンソースVLMバックボーンの推論性能を改善することを発見した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:17:12 GMT)
Loop Invariant Generation: A Hybrid Framework of Reasoning optimised LLMs and SMT Solvers [2.1] 現代, 推論に最適化された大規模言語モデルが, シンボリックアプローチよりも優れているかどうかを考察する。
OpenAIのO1、O1-mini、O3-miniを、Z3 SMTソルバと密結合した生成とチェックのパイプラインに統合します。
私たちのフレームワークは、100%のカバレッジ(133のうち133)を達成し、133のうち107よりも優れています。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:15:15 GMT)
Automated Type Annotation in Python Using Large Language Models [2.1] 我々はPythonで型アノテーションを生成するための生成チェック修復パイプラインを開発した。
ManyTypes4Pyベンチマークから6000のコードスニペット上で4つのLLM変種を評価する。
この結果から,汎用性および推論性に最適化されたLCMは一貫性のある型アノテーションを生成するのに有効であることが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:24:14 GMT)
A Note on Code Quality Score: LLMs for Maintainable Large Codebases [2.0] 本稿では,コード変更による問題を自動的に検出するコード品質スコア(CQS)システムを提案する。
コアとなるCQSシステムは、(SFTとオフラインのRLアプローチで)微調整された2つのLlama3モデルによって駆動される。
優れたユーザエクスペリエンスを維持するため、手作りのルールでシステムを階層化し、誤った応答/幻覚をフィルタリングする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:09:45 GMT)
Light-Weight Diffusion Multiplier and Uncertainty Quantification for Fourier Neural Operators [2.0] 本研究では拡散型ニューラル演算子パラメトリゼーションであるDINOZAURを紹介する。
提案手法は,複数のPDEベンチマークにおいて,競合や優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:57:19 GMT)
Constructive Disintegration and Conditional Modes [2.0] 機械学習における民話の結果は、確率密度関数の制限と解離の構成を混同する。
条件モード」の概念は、一般に分解によって得られる条件測度のモードと一致しないことを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:25:59 GMT)
Loss Landscape Degeneracy and Stagewise Development in Transformers [1.9] これらの変化は内部の計算構造やインプット・アウトプットの挙動の著しい変化と一致している。
この発見は、縮退と発展がトランスフォーマーに結びついていることの示唆的な証拠であり、近代的な深層学習を理解するための縮退に基づく視点の可能性を強調している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:20:40 GMT)
Fundamental trade-off relation in probabilistic entanglement generation [1.9] 異なるプロセスの重ね合わせから新しい量子過程を合成することにより、2つの非相互作用系間の絡み合いの発生について検討する。
本研究は,量子過程の重畳による絡み合い生成の一般的な原理を確立し,絡み合い生成を制御する新しい方法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:53:31 GMT)
Accurate and Consistent Graph Model Generation from Text with Large Language Models [1.9] 自然言語記述からグラフモデルを生成することは、ソフトウェア工学における多くのアプリケーションにとって重要なタスクである。
大規模言語モデル(LLM)の台頭に伴い、グラフモデル生成にLLMを使うことへの関心が高まっている。
本稿では,生成したグラフモデルの一貫性と品質を向上させる新しい抽象化・拡張フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:52:25 GMT)
Exploring Fourier Prior and Event Collaboration for Low-Light Image Enhancement [1.9] イベントカメラは低照度画像強調のための性能向上を提供する。
現在、既存のイベントベースのメソッドは、フレームとイベントを直接単一のモデルにフィードする。
本稿では,振幅-位相絡み付き可視性回復ネットワークを提案する。
第2段階では、空間的ミスマッチを軽減するために、動的アライメントを伴う融合戦略を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:25:00 GMT)
Privacy Enhancement for Gaze Data Using a Noise-Infused Autoencoder [1.8] 潜在雑音オートエンコーダを用いた視線信号のプライバシー向上機構を提案する。
生体認証および視線予測タスクにおけるプライバシー利用トレードオフを評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:46:52 GMT)
Cross-Domain Web Information Extraction at Pinterest [1.8] 本稿では,Pinterestの属性抽出システムについて述べる。
これにより、eXtreme Gradient Boosting(XGBoost)のような単純なモデルが、より複雑なLarge Language Model(LLM)よりも正確に属性を抽出できることを示す。
提案手法は,高速で,毎秒1,000URL以上を処理できるシステムであると同時に,最も安価なGPT代替品の1000倍の費用対効果があることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:22:35 GMT)
Mathematical Foundations of Geometric Deep Learning [1.7] 本稿では,幾何学的深層学習研究に必要な重要な数学的概念について概説する。
このコースは、幾何学的深層学習研究に必要な重要な概念を、学生に深く理解することを目的としている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:02:39 GMT)
Desyan: A Platform for Seamless Value-Flow and Symbolic Analysis [1.7] Desyanは、バリューフローとシンボリック推論をシームレスに統合したプログラム分析を書くためのプラットフォームである。
バリューフロー解析では、エンジンはクラスで最高のデータログ評価器である。
完全なSMTを必要とするアプリケーションに対しては、エンジンは主要なSMTソルバを活用している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:39:09 GMT)
Video Forgery Detection with Optical Flow Residuals and Spatial-Temporal Consistency [1.7] 本稿では,RGBの外観特徴と光流動残差を組み合わせ,空間的時間的整合性を利用する検出フレームワークを提案する。
これらの相補的特徴を統合することにより,提案手法は広範囲の偽動画を効果的に検出する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:51:35 GMT)
Insect-Wing Structured Microfluidic System for Reservoir Computing [1.7] 本研究では,トンボにインスパイアされたマイクロ流体チップを用いたハイブリッド貯水池計算システムについて検討する。
このシステムは、3つの染料ベースの入江チャネルと3つのカメラ監視された検出領域で動作し、離散空間パターンを動的カラー出力信号に変換する。
その結果、粗い解像度と限られたトレーニングデータであっても、一貫した分類精度が91%$まで上昇した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:43:14 GMT)
Diagnostic Accuracy of Open-Source Vision-Language Models on Diverse Medical Imaging Tasks [1.7] このデータセットは, 胸部X線撮影, 大腸病理検査, 内視鏡検査, 新生児黄体診, 網膜内視鏡検査を含む7,461例の22,349枚の画像を含む。
Qwen2.5 は胸部X線写真 (90.4%) と内視鏡画像 (84.2%) で最高精度を達成し、他のモデル (p.001) よりも大幅に優れていた。
Qwen2.5とGemma3は18.6%(比較可能、p=.99)で、他の試験されたモデル(p.001)よりもはるかに優れている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:28:37 GMT)
Synthetic Biology meets Neuromorphic Computing: Towards a bio-inspired Olfactory Perception System [1.6] 本稿では,3つの重要な特徴を持つ合成感覚ニューロンのハイブリッドシステムを提案する。
この研究は、超感度で特異的でエネルギー効率の良い匂い検出のためのプラットフォームを開発することを目指している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:21:53 GMT)
Transfer learning-enhanced deep reinforcement learning for aerodynamic airfoil optimisation subject to structural constraints [1.5] 本稿では,任意の翼の形状を最適化可能な移動学習型深部強化学習法を提案する。
本手法を実証するために,翼の構造的整合性を保ちながら,昇降抵抗比$C_L/C_D$を最大化する。
DRL剤の性能を従来の勾配なし法であるParticle Swarm optimization (PSO)と比較した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:55:12 GMT)
Out-of-Context Abduction: LLMs Make Inferences About Procedural Data Leveraging Declarative Facts in Earlier Training Data [1.5] 大規模言語モデル(LLM)は大規模コーパスで訓練されているが、トレーニングデータに含まれる情報について推論できるかどうかは不明である。
本研究は,LLMにおける文脈外推論(out-of-context abduction)について検討した。
この結果は,LLMの状況認識や,AIの安全性に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:12:23 GMT)
LesiOnTime -- Joint Temporal and Clinical Modeling for Small Breast Lesion Segmentation in Longitudinal DCE-MRI [1.5] 縦断画像とBIRADSスコアを併用して臨床診断を模倣する新しい3Dセグメンテーション手法であるLesiOnTimeを提案する。
我々のアプローチは、Dice Ablation研究で最先端のシングルタイムポイントと長手ベースラインを5%上回ります。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:19:53 GMT)
3D Reconstruction via Incremental Structure From Motion [1.5] 本稿では,幾何推定の整合性およびバンドル調整による反復的改善の効果に着目し,逐次SfMパイプラインの詳細な実装について述べる。
その結果、視覚的に構造化された環境下でのスパース3次元再構成のための信頼性の高い方法として、インクリメンタルSfMの実用性をサポートした。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:45:05 GMT)
HyPCV-Former: Hyperbolic Spatio-Temporal Transformer for 3D Point Cloud Video Anomaly Detection [1.5] HyV-Formerは、複数の異常カテゴリにわたる最先端の異常検出を実現し、TIMoデータセットは7%改善され、DADデータセットは5.6%向上した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:50:20 GMT)
Learning to optimize with guarantees: a complete characterization of linearly convergent algorithms [1.5] 高度な工学的応用では、最適化アルゴリズムは数学的に定義された問題のクラスよりも証明可能な証明可能なケースを保証する必要がある。
非滑らかな合成最適化問題のクラスに対して線形収束を実現するアルゴリズムのクラスを記述する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:56:42 GMT)
DACTYL: Diverse Adversarial Corpus of Texts Yielded from Large Language Models [1.5] 既存のAI(AI生成)テキスト検出器は、内部テストに成功しながらも、現実世界の設定に苦労する。
この問題に対処するために、これらの検出器を構築するための機械学習手順を厳格に検討する。
現在のAIGテキスト検出データセットのほとんどはゼロショット世代に焦点を当てているが、少数ショットまたはワンショット世代ではほとんど行われていない。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:28:01 GMT)
The Urban Impact of AI: Modeling Feedback Loops in Next-Venue Recommendation [1.4] 次世代のレコメンデータシステムは、ロケーションベースのサービスにますます組み込まれている。
我々は,次世代の勧告を支える人間とAIのフィードバックループをモデル化するためのシミュレーションフレームワークを提案する。
当社のフレームワークは,次回の勧告でフィードバックループを運用し,AI支援モビリティの社会的影響を評価するための新たなレンズを提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:02:57 GMT)
On learning functions over biological sequence space: relating Gaussian process priors, regularization, and gauge fixing [1.4] 我々は、予測シーケンス・トゥ・ファンクション・マップの推測や、シーケンス・ファンクション・マップの分解といった関連するタスクに興味を持っている。
各列関数写像は、複数の方法で部分列上の重み付け和として書くことができるので、これらの重みを有意に解釈するにはゲージ固定が必要である」。
任意の明示的なガウス過程を様々なゲージと組み合わせて正規化子を構築する方法を示し、最も一般的な重み空間正規化子に付随する暗黙関数空間を特徴付ける。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:40:09 GMT)
Classification of Psychiatry Clinical Notes by Diagnosis: A Deep Learning and Machine Learning Approach [1.4] 決定木(Decision Tree)とeXtreme Gradient Boost(eXtreme Gradient Boost)モデルは、機械学習のアプローチの中で最高の精度を達成した。
DistilBERTとSciBERTモデルは、ディープラーニングカテゴリで96%の精度を達成した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:11:39 GMT)
GHTM: A Graph based Hybrid Topic Modeling Approach in Low-Resource Bengali Language [1.4] GHTM(Graph-based Hybrid Topic Model)と呼ばれる新しいグラフ畳み込みネットワーク(GCN)モデルを提案する。
提案モデルでは,文書の入力ベクトルをグラフ内のノードとして表現し,GCNが意味的にリッチな埋め込みを生成する。
実験結果は,トピックコヒーレンスと多様性において,他のモデルよりも優れた性能を示すことによって,提案モデルの有効性を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:08:26 GMT)
Revisiting Step-Size Assumptions in Stochastic Approximation [1.4] この仮定は、収束とより微細な結果には必要ないことが初めて示される。
標準アルゴリズムおよびPolyakとRuppertの平均化手法を用いて得られた推定値に対して収束率を求める。
数値実験の結果,乗法雑音とマルコフ記憶の組み合わせにより,$beta_theta$が大きくなる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:52:01 GMT)
Search for Dark Matter Scattering from Optically Levitated Nanoparticles [1.3] 通過する粒子状ダークマターの散乱から生じる運動量移動を探索する。
また、暗黒物質信号を背景から分離するために、これらのセンサの本来の方向感度を利用する能力を示す。
ここで開発された技術の今後の拡張により、既存のサーチを超える数桁の感度に到達可能な、軽い暗黒物質と巨大なニュートリノの探索が可能になる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:49:06 GMT)
Learning to Optimize Feedback for One Million Students: Insights from Multi-Armed and Contextual Bandits in Large-Scale Online Tutoring [1.3] 本稿では,学生が誤った質問に答えた後,効果的なフィードバックを提供することを学習するオンライン学習システムを提案する。
このシステムは、100万人の学生のデータを使って、各質問に対してどの支援行動を提供するかを学習し、生徒の学習を最適化する。
166,000件の実践セッションで得られたMAB政策を評価し,学生の成果に有意な改善が認められた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:30:29 GMT)
Robustly self-testing all maximally entangled states in every finite dimension [1.2] 我々は、すべての有限次元$d$における最大絡み合った状態のデバイスに依存しない耐雑音性証明を証明した。
このプロトコルは、標準的なハイゼンベルク・ワイル演算と計算ベースで対角線となる非クリフォード位相ゲートを使用する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:02:07 GMT)
Explainable AI and Machine Learning for Exam-based Student Evaluation: Causal and Predictive Analysis of Socio-academic and Economic Factors [1.2] 学業成績は、社会学と財政学の多変量ネクサスに依存する。
本研究では,学生のCGPAを最適化するための効果的な戦略を開発するために,これらの影響について検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:09:49 GMT)
Embryology of a Language Model [1.2] 本研究では, モデルの構造的発達を可視化するために, UMAPを感受性マトリックスに適用する胚学的アプローチを提案する。
我々の可視化は、誘導回路のような既知の特徴の形成と、以前に未知の構造を発見したことのグラフを、明確なボディプランの出現を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:39:41 GMT)
Efficient Solving of Large Single Input Superstate Decomposable Markovian Decision Process [1.2] ベルマン動的プログラミングアルゴリズムの重要なステップはポリシー評価である。
我々は,この構造に基づく,正確かつ効率的な政策評価手法を開発した。
これにより、平均値と割引値の両方の報酬 MDP に適用可能なスケーラブルなソリューションが得られる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:49:27 GMT)
Cyber-Physical Co-Simulation of Load Frequency Control under Load-Altering Attacks [1.2] 最近登場したLoad Altering Attacks (LAA) は、負荷変動を起こすために高ワット装置のボットネットを利用している。
本稿では,電力網と対応する通信網をモデル化し,グリッド保護機構を実装したオープンソースの協調シミュレーション環境を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:52:09 GMT)
MPCA-based Domain Adaptation for Transfer Learning in Ultrasonic Guided Waves [1.1] マルチ線形主成分分析(MPCA)に基づく新しい伝達学習(TL)フレームワークを提案する。
ソースドメインとターゲットドメインにMPCAを併用することにより、共有潜在特徴を抽出し、効果的なドメイン適応を可能にする。
提案したMPCAを用いたTL法は, 異なる複合材料とセンサアレイを含む12種類のケーススタディに対して試験を行った。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:02:26 GMT)
Thematic and Task-Based Categorization of K-12 GenAI Usages with Hierarchical Topic Modeling [1.1] 授業室における未成年者の匿名インタラクションデータを数ヶ月間, 学校, 科目で分析した。
我々は,学生,教師,チャットGPTが生成する17,000件以上のメッセージを,コンテンツ(自然や人など)とタスク(文章や説明など)の2次元に分類する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:38:21 GMT)
LEO: An Open-Source Platform for Linking OMERO with Lab Notebooks and Heterogeneous Metadata Sources [1.0] 顕微鏡研究では、異なるプラットフォームにまたがる大量のデータを管理および統合することが大きな課題である。
分散データシステム間のリンクを作成・管理するWebベースのプラットフォームであるLEOについて述べる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:15:45 GMT)
ControlMed: Adding Reasoning Control to Medical Language Model [1.0] 医療領域において、精度と説明性を高めた大規模言語モデル(LLM)の推論が採用されつつある。
既存の推論 LLM は、必要以上に長い推論プロセスを生成し、計算オーバーヘッドと応答遅延を増大させる。
推論時に推論プロセスの長さをアクティブに制御できる医療言語モデルである textbfControlMed を導入する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:34:23 GMT)
Leveraging Synthetic Data for Question Answering with Multilingual LLMs in the Agricultural Domain [1.0] 本研究は,インドの農業特化資料から多言語(ヒンディー語,パンジャービ語)の合成データセットを生成する。
人為的データセットの評価は、事実性、関連性、農業コンセンサスにおいて著しく改善されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:04:46 GMT)
Cryptanalysis of Isogeny-Based Quantum Money with Rational Points [1.0] 量子マネー(quantum money)は、量子非閉化定理の暗号的応用である。
本稿では,有理点座標を用いた分割評価の効率性を活用して,具体的な暗号解析を提案する。
このアルゴリズムは2次ツイストの性質を活用し、楕円曲線の重ね合わせの基数検証に有理点を利用する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:35:26 GMT)
Connectivity Management in Satellite-Aided Vehicular Networks with Multi-Head Attention-Based State Estimation [1.0] 本文は, 衛星支援型マルチヘッドセルフアテンション(MAAC-SAM)を用いたマルチエージェントアクタクリティカルについて紹介する。
MAAC-SAMは、車両からサテライト(V2S)、V2I(V2I)、V2V(V2V)への接続を自律的に管理できる新しいマルチエージェント強化学習フレームワークである。
私たちのキーとなるイノベーションは、車両間の情報共有の変動や制限があっても、堅牢な状態推定を可能にするマルチヘッドアテンション機構の統合です。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:29:03 GMT)
Sample-Aware Test-Time Adaptation for Medical Image-to-Image Translation [0.9] 画像から画像への変換は医用画像の強力な技術として登場し、画像の認知やモダリティ変換といったタスクを可能にしている。
パフォーマンスを低下させることなく、アウト・オブ・ディストリビューションのサンプルを扱う際の制限に悩まされる。
本稿では,各テストサンプルの特性に基づいて動的に翻訳プロセスを調整する新しいテスト時間適応フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:41:15 GMT)
How to Evaluate Participant Contributions in Decentralized Federated Learning [0.9] TRIP-Shapleyは分散学習(DFL)のための新しいコントリビューション評価手法である
TRIP-Shapleyは、ラウンドワイドなローカルなコントリビューションの伝播をトレースすることで、クライアントの全体的なコントリビューションを定式化します。
実験によると、TRIP-Shapleyは地道なShapleyの値に十分近く、大規模シナリオにスケーラブルで、不正直なクライアントの存在下では堅牢である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:05:03 GMT)
Tool-Assisted Conformance Checking to Reference Process Models [0.9] 整合性チェックは、さまざまなプロセスの品質と一貫性を維持するために不可欠です。
本稿では,参照モデルに対する具体的なプロセスモデルの自動適合性チェックについて検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:08:24 GMT)
Dynamic Symbolic Execution for Semantic Difference Analysis of Component and Connector Architectures [0.9] 本稿では,動的シンボリック実行(DSE)のコンポーネント・アンド・コネクタアーキテクチャのセマンティック差分解析への応用について検討する。
既存のMontiArc-to-Javaジェネレータを拡張して、実行時にシンボルデータと具体的な実行データの両方を収集しました。
我々は,実行効率,最小限,完全性の基準に基づいて,様々な実行戦略を評価する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:24:58 GMT)
MR-CLIP: Efficient Metadata-Guided Learning of MRI Contrast Representations [0.8] MR-CLIPは、MR画像とDICOMメタデータを整合させてコントラスト認識表現を学習するマルチモーダルコントラスト学習フレームワークである。
クロスモーダル検索とコントラスト分類におけるその効果を実証し、その拡張性とさらなる臨床応用の可能性を強調した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:46:12 GMT)
Better Embeddings with Coupled Adam [0.8] 我々はAdamの2番目の瞬間が異方性埋め込みの原因であり、問題を緩和するためにCoupled Adamと呼ばれる修正版を提案する。
実験の結果、Coupled Adamは埋め込みの品質を大幅に向上する一方で、大規模なデータセット上での上流および下流のパフォーマンスも向上することが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:28:51 GMT)
MELAC: Massive Evaluation of Large Language Models with Alignment of Culture in Persian Language [0.8] この研究はペルシア語とイラン文化に焦点を当てている。
イラン法、ペルシア語文法、ペルシア語イディオム、大学入試などのトピックについて、LSMを評価するために特別に設計された19の新たな評価データセットを紹介した。
これらのデータセットを用いて41の著名なLCMをベンチマークし,その分野における既存の文化的・言語的評価ギャップを埋めることを目的とした。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:46:57 GMT)
Quantum-Informed Machine Learning for Chaotic Systems [0.8] 偏微分方程式を学習するための量子インフォームド機械学習フレームワークを提案する。
量子回路ボルンマシンはカオス力学系の不変性を学ぶために用いられる。
この枠組みは, 倉本-シヴァシンスキー方程式, 2次元コルモゴロフ流, 乱流流の3つの代表的な系で評価される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:03:13 GMT)
ORFS-agent: Tool-Using Agents for Chip Design Optimization [0.8] 大規模言語モデル(LLM)は、このような高次元最適化タスク内で学習と推論を行う新しい機会を提供する。
LLMをベースとした反復最適化エージェントORFS-agentを導入し,パラメータチューニングをオープンソースのハードウェア設計フローで自動化する。
2つの異なる技術ノードと様々な回路ベンチマークに関する実証的な評価は、ORFSエージェントがルーティングされたワイヤ長と有効クロック期間の両方を13%以上改善できることを示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:36:42 GMT)
Quantum Fisher information from tensor network integration of Lyapunov equation [0.7] 量子フィッシャー情報(Quantum Fisher Information)は、量子状態のアンサンブルをパラメータ化する軌道に沿って計算された状態変形の尺度である。
我々は、対称対数微分とテンソルネットワークの概念を組み合わせたリアプノフ積分に基づく新しい数値的アプローチを導入する。
このアプローチは、時間進化のための基本行列積状態アルゴリズムのみを必要とし、幅広い用途と多体システムへの応用の視点を開く。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:29:03 GMT)
Polynomial time constructive decision algorithm for multivariable quantum signal processing [0.7] マルチ変数量子信号処理(M-QSP)を提案する。
M-QSPは、各変数に対応する信号演算子と信号処理演算子をインターリーブする。
古典的アルゴリズムは、与えられたローラン対をM-QSPで実装できるかどうかを決定するために提案される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:49:11 GMT)
DreamSat-2.0: Towards a General Single-View Asteroid 3D Reconstruction [0.7] 3つの最先端の3D再構築モデルをベンチマークするパイプラインであるDreamSat-2.0を紹介する。
新しいベンチマークが確立され、フンヤン3Dは宇宙船で最高の知覚スコアを得たが、小惑星では最も正確な幾何学的精度を達成した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:23:28 GMT)
Evaluating Angle and Amplitude Encoding Strategies for Variational Quantum Machine Learning: their impact on model's accuracy [0.7] 変分量子回路(VQC)は、量子回路がデータ推論を処理し、古典的な最適化が回路のパラメータを調整するハイブリッドモデルである。
本研究は,アングルエンコーディングモデルとアングルエンコーディングモデルの両方を考慮した解析を行い,ローテーションゲートの種類がモデルの分類性能に与える影響について検討する。
この研究は、同じモデルトポロジの下では、最高のモデルと最悪のモデルの精度の差は10%から30%で、差は最大41%に達することを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:43:45 GMT)
OmniUnet: A Multimodal Network for Unstructured Terrain Segmentation on Planetary Rovers Using RGB, Depth, and Thermal Imagery [0.6] この研究は、RGB、深さ、熱画像を用いたセマンティックセグメンテーションのためのトランスフォーマーベースのニューラルネットワークアーキテクチャであるOmniUnetを提示する。
カスタム・マルチモーダル・センサー・ハウジングは3Dプリンティングを使用して開発され、マーチャン・ローバー・テストベッド・フォー・オートノミーに搭載された。
このデータセットのサブセットは手動でラベル付けされ、ネットワークの教師付きトレーニングをサポートする。
推論テストでは、リソース制約されたコンピュータで平均673msの予測時間を得た。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:23:29 GMT)
Learning Potential Energy Surfaces of Hydrogen Atom Transfer Reactions in Peptides [0.6] 水素原子移動(HAT)反応は、損傷したタンパク質のラジカル移動など、多くの生物学的プロセスにおいて必須である。
機械学習型ポテンシャルは、ほぼ量子精度でポテンシャルエネルギー面を学習できる代替手段を提供する。
そこで我々は,半経験的手法とDFTを用いて大規模データセットを構築するために,ペプチドのHAT構成を体系的に生成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:21:49 GMT)
Learning Zero-Shot Material States Segmentation, by Implanting Natural Image Patterns in Synthetic Data [0.6] この研究は、現実世界の画像から抽出されたパターンを合成データに注入することで、ギャップを埋めることを目的としている。
ゼロショット材料状態セグメンテーションのための総合ベンチマークを初めて提示する。
また,30,000の抽出テクスチャとSVBRDF/PBR材料を共有し,将来の生成を容易にする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:03:25 GMT)
Enhancing Retrieval-Augmented Generation for Electric Power Industry Customer Support [0.5] 本研究は、電力分野におけるロバストな顧客支援システムを構築するための最近の技術の評価である。
クエリ書き換えは,非標準用語を用いたクエリの検索を改善する。
RAG Fusionは、複数の検索をマージすることで、あいまいまたは多面的なクエリのパフォーマンスを向上させる。
インテント認識は、複雑な質問をよりターゲットとしたサブクエリに分解するのをサポートする。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:02:23 GMT)
Context-based Motion Retrieval using Open Vocabulary Methods for Autonomous Driving [0.5] 本研究では,人間中心の多様なシナリオにおける自律走行システムの目標評価を支援する,コンテキスト認識型動き検索フレームワークを提案する。
提案手法は,WayMoCoデータセットで評価した場合,動作コンテキスト検索の精度を最大27.5%向上させる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:41:52 GMT)
On the complex zeros of the wavefunction [0.5] このような波動関数の零点を研究し、新しい情報理論の解釈を与える。
ボソニック量子系の非ガウス的特徴は、その波動関数の零点に符号化されていることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:26:09 GMT)
Detecting quantum non-Gaussianity with a single quadrature [0.5] 1つの四次測定の統計は、恒星のランクによって定量化される任意の非ガウス性を見極めることができることを示す。
本報告では, サンプルの複雑さ, 騒音の堅牢性, および実験的展望について分析する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:20:23 GMT)
Telecommunications fiber-optic and free-space quantum local area networks at the Air Force Research Laboratory [0.5] 通信帯域周波数で動作するQLAN(Quantum Local Area Networks)の開発について報告する。
本稿では3つのネットワークのネットワークトポロジと詳細なリンク特徴データについて述べる。
森林環境下での繊維配置における時間エネルギーベル状態の絡み合い分布を実証した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:14:14 GMT)
GLiDRE: Generalist Lightweight model for Document-level Relation Extraction [0.5] 本稿では,文書レベルの関係抽出のための新しいモデルであるGLiDREを紹介する。
我々は、Re-DocREDデータセット上のさまざまなデータ設定における最先端モデルに対してGLiDREをベンチマークする。
以上の結果から,GLiDREは数ショットのシナリオで最先端のパフォーマンスを実現していることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:33:13 GMT)
SkillFormer: Unified Multi-View Video Understanding for Proficiency Estimation [0.5] SkillFormerは、統合されたマルチビューの熟練度推定のためのパラメータ効率の高いアーキテクチャである。
マルチヘッド・クロスアテンション、学習可能なゲーティング、適応的な自己校正を使って、ビュー特有の特徴を融合する。
マルチビュー設定で最先端の精度を実現し、計算効率を著しく向上させる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:17:53 GMT)
Dominated Actions in Imperfect-Information Games [0.5] 不完全情報ゲームにおける支配的行動の概念を定義し,研究する。
我々の主な成果は、アクションが混合戦略に支配されているかどうかを実証的に決定するアルゴリズムである。
我々は、"All In or Fold" No-Limit Texas Hold'em ポーカー変種における支配的な行動の役割を探求する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:35:21 GMT)
Democratizing Tabular Data Access with an Open$\unicode{x2013}$Source Synthetic$\unicode{x2013}$Data SDK [0.5] 本稿では,高品質なデータを合成するためのオープンソースツールキットMOSTLY AI Synthetic Data Software Development Kit(SDK)を提案する。
SDKは、差分プライバシー保証、公正性を認識したデータ生成、自動品質保証などの堅牢な機能を、フレキシブルでアクセシブルなPythonインターフェースに統合する。
SDKは急速に採用され、現実世界のデータボトルネックに対処し、広範なデータの民主化を促進する実用性を強調している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:36:59 GMT)
Similarity-Based Self-Construct Graph Model for Predicting Patient Criticalness Using Graph Neural Networks and EHR Data [0.5] マルチモーダルEHRデータから患者類似性グラフを構築する類似性に基づく自己構築グラフモデル(SBSCGM)を提案する。
HybridGraphMedGNNアーキテクチャは、患者死亡率と連続臨界スコアを予測するために、このグラフ上で動作する。
我々のフレームワークは、クリティカルケアリスク予測のためのスケーラブルで解釈可能なソリューションを提供し、実際のICUデプロイメントで臨床医を支援する可能性がある。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:25:04 GMT)
Safe machine learning model release from Trusted Research Environments: The SACRO-ML package [0.4] 我々は,オープンソースPythonツールの統合スイートであるSACRO-MLを紹介し,公開リリース前に機密データに基づいてトレーニングされた機械学習(ML)モデルの統計的開示制御(SDC)を容易にする。
SACRO-MLは(i)訓練体制によって引き起こされる開示の脆弱性を評価することによって、一般的なMLモデルを拡張してアンテホックなSDCを提供するSafeModelパッケージと、(ii)訓練後の様々な模擬攻撃を通じてモデルの経験的開示リスクを厳格に評価することによって、ポストホックなSDCを提供するAttacksパッケージを組み合わせる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:49:52 GMT)
Generative AI as a Geopolitical Factor in Industry 5.0: Sovereignty, Access, and Control [0.4] 産業 5.0 は産業の発展の新たな段階であり、先進技術の統合による人間中心性、持続可能性、レジリエンスを強調している。
この進化する状況の中で、ジェネレーティブAI(GenAI)と自律システムは、重要な地政学的手段として現れている。
我々は、これらの技術が主権、アクセス、そして世界的影響力の中心となる国家資産になったと論じる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:43:45 GMT)
Leveraging Convolutional and Graph Networks for an Unsupervised Remote Sensing Labelling Tool [0.4] リモートセンシング画像のための機械学習は、モデルトレーニングとテストのための最新かつ正確なラベルに依存している。
以前のラベル付けツールは、新しい目に見えないデータをラベル付けするために、事前のラベル付きデータをトレーニングに頼っていた。
本研究では,Sentinel-2衛星画像内の類似した状況と内容の地理的領域を探索し,ラベル付けするための教師なしパイプラインを定義する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:35:32 GMT)
Pure interaction effects unseen by Random Forests [0.4] ランダムフォレストは相互作用をうまく捉えていると広く主張されている。
いくつかの単純な例は、それらは特定の純粋な相互作用の存在下では不十分であることを示している。
木の成長過程で用いられる単純な代替パーティショニングスキームは、これらの相互作用の同定を強化することができると論じられている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:30:13 GMT)
On Some Tunable Multi-fidelity Bayesian Optimization Frameworks [0.4] 多重忠実度最適化では、様々なレベルの忠実度からの情報を統合する代理モデルを採用している。
我々は、フィデリティ選択を簡略化する近接ベースの取得戦略を実装した。
また,マルチファイダリティGPと組み合わせることで,マルチファイダリティアッパー信頼境界B戦略を実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:26:39 GMT)
FeatureCuts: Feature Selection for Large Data by Optimizing the Cutoff [0.3] FeatureCutsは、フィルタランキングを実行した後、最適なフィーチャーカットオフを適応的に選択する、新しい特徴選択アルゴリズムである。
性能は15パーセント向上し、モデル性能を維持しながら99.6%の時間を短縮できる。
FeatureCutsのオーバーヘッドは最小であり、エンタープライズアプリケーションで一般的に見られる大規模なデータセットにスケーラブルである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:32:41 GMT)
Bayesian retrodiction of quantum supermaps [0.3] 量子スーパーマップの量子過程を考慮した量子ベイズ則の高次一般化について検討する。
量子チャネルに関する信念を更新する規則は、「逆」量子スーパーマップによって実装できる。
レトロディクション・スーパーマップの潜在的な応用は、量子クラウドコンピューティングにおける誤り訂正の改善例で実証されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:12:40 GMT)
Formal Power Series Representations in Probability and Expected Utility Theory [0.2] 我々は、正統主義の教義に具現化された制限を放棄するコヒーレントな選好の理論を前進させる。
デ・フィネッティの理論とは異なり、我々が提唱した理論は推移性もアルキメデス性も境界性も好みの連続性も必要としない。
実用性による表現可能性(Representability by utility)は、H"older's Theorem"を拡張し、Hhn's Embedding Theoremを強化したこの論文の中心的な結果のまとめである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:34:39 GMT)
Lucy: edgerunning agentic web search on mobile with machine generated task vectors [0.2] 小言語モデル(SLM)は、その制約された能力のため、本質的に知識集約的なタスクに限られている。
本稿では,モデルの内部推論を動的タスクベクトルマシンとして,思考と思考のタグで見る,という新しいパラダイムを提案する。
このことは、構造化された自己構築されたタスク推論を備えた場合、小さなモデルが大きなモデルと競合できることを示している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:45:29 GMT)
GETALP@AutoMin 2025: Leveraging RAG to Answer Questions based on Meeting Transcripts [0.2] 本稿では, GETALP による SIGDial 2025 における Automatic Minuting Shared Task の3回目への提出について報告する。
提案手法は,検索拡張生成(RAG)システムと抽象的意味表現(AMR)に基づく。
以上の結果から,AMRを取り入れた場合,約35%の回答が得られている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:51:05 GMT)
CSDN: A Context-Gated Self-Adaptive Detection Network for Real-Time Object Detection [0.2] 本稿では,人間の視覚知覚に触発されたトランスフォーマーを用いた検出ヘッダを提案する。
このメカニズムにより、各関心領域が特徴次元を適応的に選択し、組み合わせ、異なるパターンから情報をスケールすることができる。
提案する検出ヘッドは,様々なCNN検出器のネイティブヘッドを直接置き換えることができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:32:21 GMT)
PIF-Net: Ill-Posed Prior Guided Multispectral and Hyperspectral Image Fusion via Invertible Mamba and Fusion-Aware LoRA [0.2] マルチスペクトル・ハイパースペクトル画像融合(MHIF)の目的は、豊富なスペクトル情報と細かな空間的詳細を同時に持つ高品質な画像を生成することである。
これまでの研究では、データ修正が原因で生じる不適切な性質を効果的に扱っていなかった。
PIF-Net という名前の融合フレームワークを提案し,多重スペクトル画像とハイパースペクトル画像とを効果的に融合させる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:17:17 GMT)
PnP-DA: Towards Principled Plug-and-Play Integration of Variational Data Assimilation and Generative Models [0.1] 地球系のモデリングは科学計算における根本的な課題である。
最も強力なAIや物理ベースの予測システムでさえ、徐々にエラーが蓄積される。
本稿では,背景予測に基づいて事前学習した事前条件を1つのフォワードパスで,軽量で勾配に基づく解析更新を置き換えるPlug-and-Playアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:19:19 GMT)
Beamformed 360° Sound Maps: U-Net-Driven Acoustic Source Segmentation and Localization [0.1] 球状セマンティックセグメンテーションタスクとして定式化された360deg音響音源定位のためのU-netモデルを提案する。
私たちのデータセットには、DJI Air 3ドローンの実際のオープンフィールド記録が含まれています。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:23:18 GMT)
Towards Efficient Certification of Maritime Remote Operation Centers [0.1] 本稿では,遠隔操作センターの安全と認証を支援するハザードデータベースの概念を提案する。
このハザードデータベースを適切に充足できるハザード分析とリスクアセスメントの手法を,予備的適合性分析により明らかにした。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:30:47 GMT)
ForestFormer3D: A Unified Framework for End-to-End Segmentation of Forest LiDAR 3D Point Clouds [0.1] ForestFormer3Dは、個々のツリーとセマンティックセグメンテーションを正確に記述するための、新しい統合およびエンドツーエンドのフレームワークである。
ForestFormer3Dには、ISA誘導クエリポイントの選択、推論中のスコアベースのブロックマージ戦略、効果的なトレーニングのための1対多のアソシエーションメカニズムが組み込まれている。
本モデルでは,新たに導入されたFOOR-instanceV2データセットを用いて,個々の木分割の最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:36:38 GMT)
Bayesian Optimization of Process Parameters of a Sensor-Based Sorting System using Gaussian Processes as Surrogate Models [0.1] センサベースのソートシステムは、物質の流れを2つの分画に分離することができる。
様々なプロセスパラメータは、材料の流れの性質、システムの寸法、必要なソート精度に応じて設定されなければならない。
本稿では,センサベースソートシステムのプロセスパラメータを最適化し,繰り返し監視し,調整する手法を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:42:27 GMT)
A Segmented Robot Grasping Perception Neural Network for Edge AI [0.1] 本研究は,GAP9 RISC-V System-on-Chip上でのHeatmap-Guided Grasp検出を実装した。
このモデルは、入力次元の削減、モデルの分割、量子化など、ハードウェア対応技術を用いて最適化される。
GraspNet-1Billionベンチマークの実験的な評価は、完全なオンチップ推論の実現可能性を検証する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:24:17 GMT)
Demonstration of an always-on exchange-only spin qubit [0.0] 同時交換パルスを用いた常にオンの交換専用量子ビットの高忠実性量子制御を実証する。
この研究の拡張により、より効率的なEO2量子エンタングゲートが実現され、ロス・ディヴィンチェンツォの単一スピン量子ビットにおけるネイティブ$i$-Toffoliゲートの実装が可能になる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:20:09 GMT)
v-PuNNs: van der Put Neural Networks for Transparent Ultrametric Representation Learning [0.0] V-PuNN (van der Put Neural Networks) は,p進球の特性関数を$mathbbZ_p$で表した最初のアーキテクチャである。
透過的Ultrametric Representation Learning (TURL) の原則の下では、全ての重みはそれ自体が p-進数であり、正確な部分木意味論を与える。
したがって、V-PuNNは数論とディープラーニングを橋渡しし、階層データに対して正確で解釈可能で効率的なモデルを提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:23:38 GMT)
ZetA: A Riemann Zeta-Scaled Extension of Adam for Deep Learning [0.0] ZetAは、ゼータ関数に基づいた動的スケーリングを組み込むことでAdamを拡張する新しいディープラーニングシステムである。
我々は,ZetAがAdamの雑音や高粒度分類タスクにおいて,計算効率が高く,頑健な代替手段であることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:53:29 GMT)
Verification Cost Asymmetry in Cognitive Warfare: A Complexity-Theoretic Framework [0.0] 検証コスト非対称性係数(Verification Cost Asymmetric coefficient)を導入し、同一のクレーム分布下での集団間の検証作業の期待比率として定式化する。
我々は,暗号基盤の欠如する敵対者に対して,超直線的コストを課しながら,信頼度の高い観客の検証を絶え間なく人間の努力に還元する普及プロトコルを構築した。
その結果、認知戦争における工学的優位性のための複雑性理論の基礎が確立され、すぐにコンテンツ認証、プラットフォームガバナンス、情報操作の教義に応用される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:52:05 GMT)
Value of the Teaching Career and Factors in Its Path in Peru [0.0] 本研究の目的は,ペルーの教育キャリアに価値を置く要因について述べることである。
ペルーの教師は、主に彼らの職業に対するコンフォーマリストや楽観的な見解を持っていると結論付けられた。
このハイライトは、メリットに基づく能力向上のトレーニング、モチベーション、進行中のプロフェッショナル開発を強化する必要がある。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:26:05 GMT)
Uncertainty Relation for Pseudo-Hermitian Quantum Systems [0.0] このような系の不確実性関係を拡張し、擬エルミート内積内の標準エルミートの場合と等価性を示す。
位置と運動量に対する不確実性の関係は1/2以上であり、量子力学における非エルミート系の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:06:05 GMT)
Truncating loopy tensor networks by zero-mode gauge fixing [0.0] 局所的結合最適化でさえ、局所的に関連するループ相関に結びついている洞察をより有効に活用できることが示される。
結合を切断することで、結合次元を切り離すために線形依存を使用できる状態の集合を定義する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:55:56 GMT)
Transparent Adaptive Learning via Data-Centric Multimodal Explainable AI [0.0] ほとんどの説明可能なAI(XAI)技術は、技術的なアウトプットに重点を置いているが、ユーザの役割や理解は無視されている。
本稿では,従来のXAI技術と,生成型AIモデルとユーザパーソナライゼーションを統合したハイブリッドフレームワークを提案する。
私たちの目標は、ユーザ中心のエクスペリエンスをサポートしながら透明性を高める、説明可能なAIへの移行です。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:36:16 GMT)
Towards a unified framework for programming paradigms: A systematic review of classification formalisms and methodological foundations [0.0] この体系的な文献レビューは、プログラミングパラダイムの正式な基礎をマッピングする。
既存の概念的な粒度の欠如、統一された形式的基盤、ハイブリッド言語との闘いが判明した。
文献は、分類から有望な形式的、再構築的な枠組みへの大きな知的シフトを反映していると結論付けている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:19:40 GMT)
Towards a Measure Theory of Semantic Information [0.0] 私はフロリディの強い意味的情報の理論を自身の言葉で批判する。
私はユニットサークルに基づいた新しいアプローチを提示します。
矛盾やタウトロジーは情報性がないが、互いに矛盾するメッセージは等しく情報的であることが分かる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:03:39 GMT)
Towards Robust Semantic Correspondence: A Benchmark and Insights [0.0] 有害な条件下での意味的対応を評価するための新しいベンチマークを構築した。
ベンチマークデータセットは、一般的に遭遇する撮像問題を反映した14の異なる挑戦的なシナリオで構成されている。
セマンティック・コンパレンス・アプローチの堅牢性に関するいくつかの重要な洞察を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 02:38:39 GMT)
Toward using explainable data-driven surrogate models for treating performance-based seismic design as an inverse engineering problem [0.0] 本研究では, 逆工学的問題として, 性能に基づく耐震設計を扱う手法を提案する。
説明可能な機械学習モデルを実装することで、この方法論は、設計変数とパフォーマンスメトリクスを直接マッピングする。
開発された手法は、ロサンゼルスとチャールストンの鋼鉄とコンクリートモーメントフレームの2つの異なる在庫に適用される。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:08:19 GMT)
Time-of-Flow Distributions in Discrete Quantum Systems: From Operational Protocols to Quantum Speed Limits [0.0] 本稿では,離散量子系における遷移タイミングを時間流(TF)分布を用いて定量化する枠組みを提案する。
本フレームワークは,時間依存ハミルトニアンの最適化,ショートカット・ツー・アディバティティティプロトコルの解析,およびクローズドおよびオープンな量子システムに対する遷移ベースの量子速度制限(TF-QSL)を導出する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:44:33 GMT)
Thinking Machines: Mathematical Reasoning in the Age of LLMs [0.0] 大規模言語モデル(LLM)は構造化推論や記号的タスクにおいて顕著な能力を示している。
この記事では、最近のモデルとベンチマークに焦点を当て、機械学習と数学的認知の交差における3つの中心的な課題について考察する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:31:48 GMT)
There is no ultrastrong coupling with photons [0.0] 超強結合光マター系の理論は、エミッターと構造によって支持される伝播光子モードとの相互作用から生じると仮定する。
この記述は、エミッタと構造電荷の間のクーロン相互作用を破棄する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:18:06 GMT)
The Second Machine Turn: From Checking Proofs to Creating Concepts [0.0] 本稿では, 技術, 障害, 潜在的な解決策の現状について論じるとともに, 概念の創出そのものを数学化するための予備的試みについて述べる。
論文は、これらの能力がどのように数学と人間と機械のコラボレーションを形作るかを評価することで締めくくられる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:59:10 GMT)
The Role of the Satellite in Quantum Information Networks [0.0] 量子情報ネットワーク(QIN)は、分散組織における複数の量子デバイス間の相互接続を可能にする。
QINの中核となるメカニズムは、量子エンタングルメントを消費するテレポーテーションに基づく量子状態スワッピングである。
衛星は、このような新しいネットワークにおいて、グローバルな接続を支える中心的な役割を果たすと期待されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:16:03 GMT)
The Lattice Geometry of Neural Network Quantization -- A Short Equivalence Proof of GPTQ and Babai's algorithm [0.0] ニューラルネットワークにおける線形単位のデータ駆動量子化は、入力データによって生成される特定の格子に対して最も近いベクトル問題を解くのにどのように対応するかを示す。
我々は、GPTQアルゴリズムがババイのよく知られた最寄り平面アルゴリズムと等価であることを証明した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:20:58 GMT)
The Bose-Hubbard polaron from weak to strong coupling [0.0] 不純物は 正方形格子に閉じ込められた ボゾン粒子の浴槽に浸された
入浴におけるボソン-ボソン相互作用の強度の異なるため, 不純物と浴粒子間の誘引的・反発的結合の機構を解析した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:05:05 GMT)
TensorSocket: Shared Data Loading for Deep Learning Training [0.0] ディープラーニングトレーニングは反復的かつリソース集約的なプロセスである。
本稿では,同時学習プロセスで同じデータローダを共有できるようにすることにより,トレーニングの計算的ニーズを低減するためにSocketを提案する。
評価の結果,データ共有なしでは実現不可能なシナリオを実現し,トレーニングスループットを最大100%向上し,クラウドインスタンスを利用する場合,コストを50%削減できることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:04:28 GMT)
Swapped Entanglement in High-Dimensional Quantum Systems [0.0] まず、エンタングルメントスワッピングの概念を高次元量子系、特にクイディットに拡張する。
以上の結果から,高次元システムでは,量子ビットベースのプロトコルに比べてエンタングルメントの分散能力が向上することが示された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:49:33 GMT)
Swap Network Augmented Ansätze on Arbitrary Connectivity [0.0] 任意の接続グラフに対してキュービットルーティングを最適化するアルゴリズムを導入し、任意のキュービット間の直接通信を可能にするスワップネットワークを実現する。
次に、導出スワップネットワークを層状で接続性に配慮したアンセットに埋め込むことにより、回路層とキュービットルーティングの共設計を提案する。
この構造は、アンザッツの訓練性を大幅に改善し、資源の削減による性能の向上につながった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:34:09 GMT)
Structured Spectral Graph Learning for Anomaly Classification in 3D Chest CT Scans [0.0] 我々は、スペクトル領域の畳み込みによって処理される軸スライス三重項ノードを利用して、CTスキャンを構造化グラフとしてモデル化し、異常分類性能を向上させる新しいグラフベースのアプローチを提案する。
本手法は,z軸変換に頑健性を実現しつつ,強力なクロスデータセットの一般化と競争性能を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:52:34 GMT)
Statistical Mechanics of Random Mixed State Ensembles with Fixed Energy [0.0] 混合状態アンサンブルは、ランダム密度行列の統計的性質を特徴付ける確率分布である。
固定平均エネルギーを持つランダム状態の特性を考慮し、この枠組みを拡張した。
これにより、ランダム混合状態のマイクロカノニカルアンサンブルが生じる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:43:13 GMT)
Spontaneous emission as a bridge from Lindbladian to nonreciprocal reservoirs [0.0] 本研究では,2つの貯水池を接続する状態が,光子の励起および自発的放出によって反トラッピング状態に結合する平衡外量子系について検討する。
そのようなシステムの適切な実効的な記述は、通常のリンドブラディアン形式を超越する必要があることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:03:49 GMT)
Spectral correlations of dynamical Resonance Fluorescence [0.0] スペクトルフィルタリングが単一光子純度を高め、時間ビン符号化量子状態における多重光子雑音を抑制することを示す。
これらの結果は、パルス量子光源の光子統計を調整するための重要なツールとしてスペクトルフィルタリングを確立する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:33:42 GMT)
Small sample-based adaptive text classification through iterative and contrastive description refinement [0.0] 大規模言語モデル(LLM)は、進化する知識とあいまいなカテゴリ境界を持つ領域の一般化に苦慮することが多い。
本稿では,反復的トピック洗練,コントラスト的プロンプト,アクティブラーニングを組み合わせた分類フレームワークを提案する。
このフレームワークはHuman-in-the-loopコンポーネントを備えており、自然言語でカテゴリ定義を導入したり、改訂したりすることができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:12:38 GMT)
SleepLiteCNN: Energy-Efficient Sleep Apnea Subtype Classification with 1-Second Resolution Using Single-Lead ECG [0.0] 睡眠時無呼吸症(Sleep apnea)は、呼吸中断が少なくとも10秒間持続し、1時間に5回以上起こるのを特徴とする一般的な睡眠障害である。
本稿では,高時間分解能のシングルリード心電図(ECG)を用いて睡眠時無呼吸サブタイプを分類するエネルギー効率のよい方法を提案する。
ウェアラブルプラットフォーム用に設計されたコンパクトでエネルギー効率の良い畳み込みニューラルネットワークであるSleepLiteCNNを紹介する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:04:40 GMT)
Security Analysis of Ensemble-Based Quantum Token Protocol Under Advanced Attacks [0.0] 我々は,アンサンブルベースの量子トークンプロトコルに対する高度な攻撃を提示し,特徴付ける。
トークンをコピーする高度な試みは、サブアンサンブルの測定が実行でき、個々のキュービットも測定できると仮定することができる。
トークン数を増やすことにより、量子コインのセキュリティを高くすることができることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:15:04 GMT)
Scalable Ion Fluorescence Collection Using a Trap-Integrated Metalens [0.0] 表面イオントラップの裏面に作製されたメタレンを具備したコンパクトなモノリシック集積システムを提案する。
40$times$100$mu$mアパーチャは、シミュレーションされたポイントソースコレクション効率の0.91%を可能にする。
このような読み出しゾーンの配列は、次世代のトラップイオン量子プロセッサにおいて、高忠実度並列読み出しのためのコンパクトでスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:47:57 GMT)
Sari Sandbox: A Virtual Retail Store Environment for Embodied AI Agents [0.0] Sari Sandboxは、ショッピングタスクにおける人間のパフォーマンスに対する実施エージェントのベンチマークのための高忠実でフォトリアリスティックな3Dストアシミュレーションである。
人間のインタラクションのための仮想現実(VR)と、視覚言語モデル(VLM)を利用したエンボディエージェントの両方をサポートする。
当社のサンドボックスは、エンボディエージェントが小売商品をナビゲートし、検査し、操作し、人間のパフォーマンスに対するベースラインを提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:01:38 GMT)
SU-ESRGAN: Semantic and Uncertainty-Aware ESRGAN for Super-Resolution of Satellite and Drone Imagery with Fine-Tuning for Cross Domain Evaluation [0.0] GAN(Generative Adversarial Networks)は、画像の現実的な超解像(SR)を実現しているが、セマンティック一貫性と画素ごとの信頼性は欠如している。
本稿では,衛星画像にESRGANを統合するための最初のSRフレームワークであるSemantic and Uncertainty-Aware ESRGAN(SU-ESRGAN)を紹介する。
この新モデルは、広視野視野カメラ(FoV)を使用した衛星システムやUAVにおいて、カバー範囲の空間分解能のトレードオフとして有用である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:25:21 GMT)
Relational Dynamics with Periodic Clocks [0.0] 古典的および量子的理論の両方において、周期時計に対して関係力学が確立できることが示される。
本稿では,周期時計に対して周期的に進化するシステムを,非整合性のない周期時計に対して単調に進化させる方法を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:42:34 GMT)
Reducing the gap between general purpose data and aerial images in concentrated solar power plants [0.0] 本稿では,CSPプラントの空中検査のための高品質な合成データセットであるAerialCSPを紹介する。
我々は、AerialCSP上で複数のモデルをベンチマークし、CSP関連視覚タスクのベースラインを確立する。
我々は,AerialCSPの事前トレーニングにより,実世界の故障検出が大幅に改善されることを実証した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:57:02 GMT)
Re-optimization of a deep neural network model for electron-carbon scattering using new experimental data [0.0] 包括的電子-炭素散乱のためのディープニューラルネットワークモデルを提案する。
我々は最近の実験データと、深部非弾性散乱領域における古い測定を取り入れた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:05:38 GMT)
Quantum repeaters based on stationary and flying Gottesman-Kitaev-Preskill qudits [0.0] 我々は、飛行(光)量子ビットと静止(物質)量子ビットの両方に量子エラー補正(QEC)を用いる量子リピータスキームを探索する。
この考え方は、効果的なチャネル伝送と損失スケーリングを向上する、エンコードされた片道と双方向のスキームの利点を組み合わせることを目的としている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:12:39 GMT)
Quantum entanglement of Hawking-Partner modes in expanding cavities [0.0] 本稿では、1つの境界が所定の加速度を受ける1次元キャビティ内で発生する量子絡みについて検討する。
我々は、サブシステム$A$が与えられたモードであり、サブシステム$B$がシステムの残りの部分であるバイパーティションに対する対数ネガティビティを用いて量子相関を定量化する。
以上の結果から,拡張空洞はスキューズ装置として効果的に機能し,ホーキングパートナーペアは2モード圧縮状態として主に機能することが明らかとなった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:25:46 GMT)
QPP-RNG: A Conceptual Quantum System for True Randomness [0.0] 置換選別過程の2つの共役オブザーバブルを測るランダムネス生成のための概念量子システムについて述べる。
量子系との類似により、これらの可観測物は不確実性のような制約によってリンクされる。
我々はこのフレームワークを,システム組み込みでソフトウェアベースの真の乱数生成器であるemphQPP-RNGとして具体化している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:08:52 GMT)
Q-Sylvan: A Parallel Decision Diagram Package for Quantum Computing [0.0] 並列エッジ値DDの効率的な実装を提案する。
我々はこれらのDDを用いて量子回路のシミュレーションと等価チェックという2つのユースケースを実装している。
我々のツールであるQ-Sylvanは、大規模インスタンス上での最先端の量子DDツールMQT DDSIMと競合するシングルコア性能を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:48:52 GMT)
Protecting Student Mental Health with a Context-Aware Machine Learning Framework for Stress Monitoring [0.0] 学生のメンタルヘルスは、学術機関における関心の高まりである。
従来の評価手法は主観的な調査と定期的な評価に依存している。
本稿では,学生のストレスを分類するための文脈対応機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:52:25 GMT)
Proof of Hiding Conjecture in Gaussian Boson Sampling [0.0] 複素ガウス行列を全変動距離で「隠れ予想」する。
これは、実験的に関係のある状態におけるGBSの特性の厳密な証明である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:00:01 GMT)
Prompting Science Report 3: I'll pay you or I'll kill you -- but will you care? [0.0] これは、ビジネス、教育、政策リーダーが厳格なテストを通じてAIを扱う技術的詳細を理解するのを助けるための一連の短いレポートの第3弾である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:23:21 GMT)
Probing graph topology from local quantum measurements [0.0] 本研究では, 平均度, ハブ密度, 固定長の閉路数などの未知の量子ネットワークのグローバルな特性を, 厳密な局所的な量子測定から推定できることを示す。
ノードのごく一部しかアクセスできない悪意のあるエージェントが、量子状態を局所的に初期化し、反復的短時間測定によりネットワーク全体の機密構造情報を抽出できることを実証する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:52:43 GMT)
Polynomially restricted operator growth in dynamically integrable models [0.0] 各ハミルトニアンが同値関係を定義することを示し、作用素空間を同値類に分割する。
本稿では,同値クラスの次元を判定し,木上のXY$チェインやキタエフモデルなど,様々なモデルに対して評価する手法を提案する。
我々の手法は、自由フェルミオンに還元できない$XY$-$ZZ$モデルを含む、シミュラブル量子力学の新しいケースを明らかにするために用いられる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:25:16 GMT)
Phase-Locked SNR Band Selection for Weak Mineral Signal Detection in Hyperspectral Imagery [0.0] キュクライト鉱業地区における鉱物検出の強化のための2段階統合フレームワークを提案する。
第1段階では、各スペクトル帯域の信号-雑音比(SNR)を計算し、低SNR帯域を破棄するために位相同期しきい値法を適用する。
第2段階では、改良されたHSIデータをモデルに再導入し、KMeansクラスタリングを使用して12個の終端スペクトルを抽出する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:26:49 GMT)
Persistent Quantum Memory in Iterated Lifts [0.0] 対称リフト$mathrmHL'_(G)$で生成された完全グラフ上の連続時間量子ウォークにおける量子コヒーレンスを研究する。
このリフトはコヒーレンス保存およびコヒーレンス誘導変換の両方として機能する。
高度に対称な基底グラフにおいて構造化された量子干渉を保存し、スケールし、ランダムまたは弱構造化されたグラフにおいて持続的なコヒーレンスを誘導する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:02:05 GMT)
Performance Analysis and Noise Impact of a Novel Quantum KNN Algorithm for Machine Learning [0.0] そこで本研究では,従来のk-NN技術よりも性能が向上した量子K-nearest neighbors(QKNN)アルゴリズムを提案する。
提案された修正は、アダマールと回転ゲートを用いた量子データの符号化を最適化することに集中し、量子状態における古典データのより効率的なレンダリングを保証する。
スワップテストに基づく新しい量子距離計量を導入し、様々な量子状態間の類似度を測定する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:27:06 GMT)
PaPaformer: Language Model from Pre-trained Paraller Paths [0.0] 本稿では,デコーダのみのトランスフォーマーに基づく言語モデルを,日/週ではなく数時間で学習し,評価する方法について検討する。
我々は、デコーダのみのトランスフォーマーアーキテクチャの変種であるtextitPaPaformerを導入し、低次元の並列パスをより大きなモデルに組み合わせた。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:33:45 GMT)
Nonlinear Computation with Linear Optics via Source-Position Encoding [0.0] 完全線形媒体における非線形計算を実現するための新しい手法を提案する。
本手法は低消費電力で動作可能であり,光システムをデータ依存空間位置で駆動する機能のみを必要とする。
我々は、高度に専門化された光学ニューラルネットワークのための、完全に自動化されたトポロジ最適化ベースのハードウェア設計フレームワークを定式化する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:35:41 GMT)
Nonclassical microwave radiation from the parametric dynamical Casimir effect in the reversed-dissipation regime of circuit optomechanics [0.0] 本稿では, 分散駆動方式と逆散逸方式(RDR)を併用した実験的に実現可能なオプティメカティカルシステムを提案する。
メカニカルモードの断熱除去のためのメカニカルデコヒーレンス時間長よりも、駆動レーザ周波数オン時間スケールの高速変調を行う。
提案した非古典的マイクロ波放射源は、量子情報処理、量子コンピューティング、およびマイクロ波量子センシングに応用される可能性がある。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:36:05 GMT)
NaN-Propagation: A Novel Method for Sparsity Detection in Black-Box Computational Functions [0.0] NaNプロパゲーションは、IEEE 754 Not-a-Number値の普遍的な汚染特性を利用して、入出力依存をトレースする。
この手法を航空機の翼重量モデルで実証し、1.52倍のスピードアップを達成した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:11:12 GMT)
Multispin Physics of AI Tipping Points and Hallucinations [0.0] ChatGPTは、ユーザーが気付くことなく、中間応答を良い状態から悪い状態に導くことができる。
2024年だけで670億ドルの損失と数名の死者を出したと伝えられている。
AIの「原子」の規模で隠れたチップの不安定性を明らかにする
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:24:15 GMT)
Multi-Band Variable-Lag Granger Causality: A Unified Framework for Causal Time Series Inference across Frequencies [0.0] 我々は,MB-VLGC (Multi-Band Variable-Lag Granger Causality) を定式化し,時系列の因果関係を推定するための新しい枠組みを提案する。
MB-VLGCの形式的定義を提供し、その理論的健全性を実証し、効率的な推論パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:22:51 GMT)
Model Misalignment and Language Change: Traces of AI-Associated Language in Unscripted Spoken English [0.0] 近年では、特に科学や教育において、文章言語は言葉の使用に顕著な変化を経験している。
モデルアウトプットと対象のオーディエンスノルムの相違は、ミスアライメントの一形態と見なすことができる。
我々は、会話科学と技術ポッドキャストから引き出された、未記述の音声言語から2210万語のデータセットを構築した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:47:33 GMT)
Mixed State Entanglement Via the Cauchy-Schwarz Inequality [0.0] 密度演算子の集団とコヒーレンスに簡単な依存度を持つコーシー・シュワルツ・ヴァイオレーション(CSV)条件を導入する。
絡み合うのに十分な条件として、対称性のようなシステムの物理的特性へのより直接的な接続を提供する。
本稿では、Jaynes-Cummings Model、Quantum Rabi Model、およびオープンシステムQuantum Rabi Modelに適用することにより、CSV条件から得られるしばしば驚くべき洞察について説明する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:52:36 GMT)
Minimum Data, Maximum Impact: 20 annotated samples for explainable lung nodule classification [0.0] 放射線学者は、確立された診断基準として形状やテクスチャなどの属性を使用し、AI意思決定でそれらを反映する。
このようなモデルの採用は、これらの属性を付加した大規模医療画像データセットの不足によって制限される。
この研究は、データセットの制限を克服する合成データの可能性を強調し、医療画像解析における説明可能なモデルの適用性を高める。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:54:34 GMT)
Mehta's eigenvectors for the finite Hartely transform [0.0] 本稿では,有限ハートレー変換の解析的固有関数を評価するための新しい手法を提案する。
このアプローチは、基本的なツールとして$N=1/2$-supersymmetric quantum mechanicsを使用する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:22:15 GMT)
Masked Omics Modeling for Multimodal Representation Learning across Histopathology and Molecular Profiles [0.0] 自己教師付き学習は、計算病理学に大きな進歩をもたらした。
しかし、病理組織学だけでは分子的特徴や臨床結果の理解に乏しいことが多い。
我々はMORPHEUSを紹介した。MORPHEUSは、組織学とマルチオミクスの両方のデータを共有潜在空間にエンコードする統合トランスフォーマーベースの事前学習フレームワークである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:29:26 GMT)
Managing the unexpected: Operator behavioural data and its value in predicting correct alarm responses [0.0] 心理学的尺度は、コントロールルームオペレーターの行動、認知、精神労働負荷状態に関する洞察を与えることができる。
眼球追跡やEEGキャップなどのウェアラブルな生理計測ツールは、侵入的であり、日常の手術での使用には適さないとみなすことができる。
本稿では,異常シナリオにおけるプロセスとオペレーター-システム間相互作用のリアルタイムデータの利用の可能性について検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:10:16 GMT)
Managing Escalation in Off-the-Shelf Large Language Models [0.0] アメリカ合衆国政府は、シナリオプランニングやアクション・コースの提案に大規模な言語モデルを採用し、今後も継続する。
本研究は,大規模言語モデルの即時導入を認め,それらを国家安全保障目標と整合させる実用的な手段を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:15:45 GMT)
Magic States in the Asymmetric Quantum Rabi Model [0.0] マジックまたは非安定化器性(英: Magic or non-stabilizerness)は、量子コンピューティングのリソースであり、キュートネットワークで広く研究されている。
我々は、量子光学のパラダイムモデルである非対称量子ラビモデルにおいて魔法を研究する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:41:06 GMT)
Macroscopic theory of multipartite correlations in permutation-invariant open quantum systems [0.0] マルコフ進化中のN$相互作用ユニット間の定常多部情報のマクロ的挙動を決定する手法を提案する。
我々は、従来のシステムでは、平均場力学の固定点に緩和するシステムでは相互情報の広範なスケーリングは不可能か、あるいはシステム力学の摂動に頑健でないという結論を延長する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:30:37 GMT)
Localized states and skin effect around non-Hermitian impurities in tight-binding models [0.0] 単純一次元強結合格子系をエルミート結合で結合する。
不純物がエルミート(および$mathcalPT$-対称)であれば、2つの局所化されたエッジ状態がタイト結合バンドから分離されるパラメータ状態が見つかる。
次に, 強結合系の他の部分と同じ結合不純物の一方の方向にホッピングし続けることにより, 非エルミート不純物のシミュレートを行う。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:53:40 GMT)
Localized Sparse Principal Component Analysis of Multivariate Time Series in Frequency Domain [0.0] 周波数領域における高次元時系列の解釈可能な主成分分析のための定式化と一貫した推定手法を提案する。
信号プロセスの低次元主部分空間のスパース局所化推定を計算するために,効率的な周波数系列アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:07:13 GMT)
Local perturbations of potential well arrays [0.0] 我々は、$mathbbRnu,: nuge 2$, built on a line。
ポテンシャル支持アスペクト比の制限の下では、不整合性を保持する有限個の長手シフトからなる摂動が、最低スペクトル帯域のしきい値以下に空でない離散スペクトルを生じさせることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:17:20 GMT)
Learning the action for long-time-step simulations of molecular dynamics [0.0] 動作から導かれるMLインテグレータは,非構造保存ML予測器の病理挙動を除去することを示す。
本手法は,計算コストの低い直接予測器の補正として,反復的に適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 21:01:05 GMT)
Large Deviations of Gaussian Neural Networks with ReLU activation [0.0] 我々は、ガウス重みを持つディープニューラルネットワークと、ReLUのような最も線形に成長する活性化関数に対する大きな偏差原理を証明した。
レート関数の以前の表現を単純化し、ReLUの場合のパワーシリーズ展開を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:53:30 GMT)
JurisTCU: A Brazilian Portuguese Information Retrieval Dataset with Query Relevance Judgments [0.0] 本稿では,ブラジルの法律情報検索データセットJurisTCUを紹介する。
このデータセットは、ブラジル連邦会計裁判所の16,045件の法学文書と、関連判断を注釈した150件のクエリで構成されている。
文書拡張手法は,このデータセット上での標準BM25検索の性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:19:55 GMT)
Jet Image Generation in High Energy Physics Using Diffusion Models [0.0] 本稿では,大型ハドロン衝突型加速器(LHC)における陽子-陽子衝突現象に対応するジェット画像生成のための拡散モデルの適用について述べる。
シミュレーションデータセットから得られたクォーク,グルーオン,Wボソン,Zボソンおよびトップクォークジェットの運動変数を2次元画像表現にマッピングする。
我々は,クラス条件ジェット画像の正確な生成におけるスコアベース拡散モデルと整合性モデルの性能を比較した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:41:27 GMT)
JSON-Bag: A generic game trajectory representation [0.0] Bag-of-Tokensモデル(JSON-Bag)は、ゲーム軌跡を汎用的に表現する手法である。
本稿では,ゲーム軌跡を汎用的に表現する手法として,Bag-of-Tokensモデル(JSON-Bag)を提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:26:45 GMT)
J4CC, A Frame for Communication Control [0.0] 我々は,4つの力(力,資本,道徳,知識)がルール作成にどのように影響するかをマッピングする枠組みであるJ4CCを提案する。
J4CCはルール作成会話を分析するための用語を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 10:01:12 GMT)
Interrelation among Solvable Potentials and Extensions of SWKB Quantization Condition [0.0] ナタンゾンポテンシャルのある種のクラスに対するSWKB量子化条件の拡張形式を導出する。
SWKBの正確性は古典式に関係していると推測する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:07:55 GMT)
Integrating Generative AI with Network Digital Twins for Enhanced Network Operations [0.0] 本稿では,ネットワークディジタル双生児と生成AIの相乗効果について検討する。
生成AIがネットワークデジタル双生児の精度と運用効率をいかに向上させるかを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:19:51 GMT)
Inequalities for Optimization of Classification Algorithms: A Perspective Motivated by Diagnostic Testing [0.0] 診断における2つの主要なタスクが、混乱(またはエラー)行列$boldsymbol rm P$の変動の観点から再キャスト可能であることを示す。
行列 $mathbb I-boldsymbol rm P$ の最大の Gershgorin 半径 $boldsymbol rho_m$ は、分類と有価値推定の両方について一様誤差境界が得られることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:51:32 GMT)
Implementing fault-tolerant non-Clifford gates using the [[8,3,2]] color code [0.0] 非クリフォードゲートを実装した符号化回路の性能改善を観察する。
本結果は,量子ゲートを用いた非自明なアルゴリズムの実装の可能性を示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:07:16 GMT)
ITUNLP at SemEval-2025 Task 8: Question-Answering over Tabular Data: A Zero-Shot Approach using LLM-Driven Code Generation [0.0] 本稿では,SemEval-2025 Task 8: DataBench, Question-Answering over Tabular Dataについて述べる。
我々は、LLM(Large Language Model)ベースのコード生成を活用することに焦点を当てたゼロショットソリューションを開発した。
我々のシステムはSubtask Iでは8位、Subtask IIでは6位となり、オープンソースのモデルカテゴリーではベースラインを上回りました。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:38:18 GMT)
IAMAP: Unlocking Deep Learning in QGIS for non-coders and limited computing resources [0.0] IAMAPは,近年の自己教師型学習戦略の進歩を基盤としている。
これにより、非AI専門家は、最近のディープラーニングアプローチによって提供される高品質の機能を活用することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:39:43 GMT)
Honey Classification using Hyperspectral Imaging and Machine Learning [0.0] データセット作成フェーズでは,クラス間の分離性を最大化するためにクラス変換手法を用いる。
特徴抽出フェーズは、関連する特徴を抽出するために線形識別分析(LDA)技術を用いる。
分類段階では,SVM(Support Vector Machines)とK-Nearest Neighbors(KNN)モデルを用いて,抽出した特徴を植物起源に分類する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:45:42 GMT)
Generative AI Adoption in Postsecondary Education, AI Hype, and ChatGPT's Launch [0.0] 本稿では,生成AIの多面的影響に関する研究に寄与する。
OpenAIのChatGPTが、リリース後6ヶ月の学術的設定で台頭することに焦点を当てている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:14:36 GMT)
Futures with Digital Minds: Expert Forecasts in 2025 [0.0] この調査は2025年初頭に、デジタルマインド研究、AI研究、哲学、予測、関連分野の専門家67名によって実施された。
専門家は、原理的に可能なデジタルマインドに高い確率を割り当て(中期90%)、今世紀(65%×2100)に作成され、2030年までに出現する確率は無視できない(20%)。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:20:42 GMT)
From Wavefunctional Entanglement to Entangled Wavefunctional Degrees of Freedom [0.0] 光子間の絡み合いが、それらの特性体モード間の絡み合いと等価かどうかという問題は、鍵となるオープンな問題である。
私は、この微妙で永続的な問題に関して、光学モード間の相互作用を真の絡み合いに蒸留できる状況を説明することによって、新しく、より深く、物理的な洞察を提供する。
この理解は、文脈的におよび非局所的に絡み合った光子を分離不能な場モードで量子魔法を蒸留するための新しい種類のプロトコルを定式化するために適用することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:57:31 GMT)
From Press to Pixels: Evolving Urdu Text Recognition [0.0] 本稿では,ウルドゥー語新聞における光学文字認識(OCR)のエンドツーエンドパイプラインについて紹介する。
複雑なマルチカラムレイアウト、低解像度スキャン、およびNastaliqスクリプトのスタイリスティックなバリエーションによって引き起こされる課題に対処する。
セグメンテーションにYOLOv11xを微調整し,記事に0.963の精度,コラムに0.970の精度を実現した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 15:56:30 GMT)
From Code to Career: Assessing Competitive Programmers for Industry Placement [0.0] 本研究は、Codeforcesユーザーが様々なレベルのソフトウェアエンジニアリングジョブを確保できる可能性を予測することに焦点を当てる。
Codeforces APIを使用してユーザデータを収集し、キーパフォーマンスメトリクスを処理し、ランダムフォレストを使用して予測モデルを構築します。
このモデルは、さらなる開発を必要とするものから、トップレベルのテック職に準備ができているものまで、ユーザーを4つのレベルに分類する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:52:44 GMT)
Forecasting NCAA Basketball Outcomes with Deep Learning: A Comparative Study of LSTM and Transformer Models [0.0] 本研究は,2025年NCAAディビジョン1男子バスケットボール大会の結果を予測するための高度な深層学習手法を探求する。
私はLong Short-Term Memory(LSTM)とTransformerアーキテクチャの2つの洗練されたシーケンスベースモデルを実装しています。
予測の堅牢性と信頼性を評価するため,BCE(Binary Cross-Entropy)とブリア損失関数(Brier loss function)を用いて,各モデル変種を訓練する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:01:44 GMT)
Financial and symbolic incentives promote 'green' charging choices [0.0] 我々は、金融的・象徴的なインセンティブスキームが「よりグリーン」な充電選択に与える影響について検討する。
金銭的インセンティブと象徴的なインセンティブは、共に「よりグリーン」な課金選択への行動変更に有効であることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:51:19 GMT)
Fast Mølmer-Sørensen gates in trapped-ion quantum processors with compensated carrier transition [0.0] イオン鎖におけるモルマー-ソレンセンゲートのレーザーパルス形状を設計するためのアプローチを提案する。
高速発振キャリア項は、イオンに作用するスピン依存力を効果的に修飾し、レーザーパルスの単純な非線形変換によって補償できることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:13:47 GMT)
False vacuum decay of excited states in finite-time instanton calculus [0.0] 我々は、励起状態の減衰に対応する有限時間振幅を計算するために標準インスタンス形式に適応する。
任意のポテンシャルに対して、主量子補正を含む追従減衰幅を明示的に計算する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:19:01 GMT)
Extracting the spin excitation spectrum of a fermionic system using a quantum processor [0.0] 本稿では,デジタル量子プロセッサを用いた1次元フェルミ・ハバードモデルのスピン励起スペクトルについて検討する。
量子コンピュータ上でのシミュレーションに自然に適するプロトコルを導入し、再学習したスピングリーンの関数を復元する。
我々は、初期状態の準備に必要な量子資源を最小化するためにプロトコルの堅牢性を利用する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:20:21 GMT)
Evaluating LLMs on Real-World Forecasting Against Human Superforecasters [0.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示したが、将来の事象を予測する能力はまだ検討されていない。
メタキュラスから464個の質問を予測し,その性能をヒトのスーパーフォアキャスターと比較した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:18:44 GMT)
Entangling Power and Its Deviation: A Quantitative Analysis on Input-State Dependence and Variability in Entanglement Generation [0.0] 量子演算の絡み合う能力の定量化は、量子情報科学の基本的な課題である。
EPだけでは、複雑な入力状態依存的な絡み合い生成を捉えることはできない。
EPDはエンタングリング構造のより深く、より完全な特徴を提供する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:06:55 GMT)
Entanglement-enhanced randomized measurement in noisy quantum devices [0.0] 量子状態の様々な性質を学習するために、(非絡み合う)単一量子ビットの測定よりも浅い測定の利点を示す。
我々は,デランドマイゼーションなどの応用における単一量子ビット測定と比較して,改善点を実験的に検証した。
その結果,QEC以前にもハードウェアの改良が実現可能なアプリケーションの範囲を広げる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:23:58 GMT)
Entanglement swapping for partially entangled qudits and the role of quantum complementarity [0.0] ESPによる2つの間の平均的な分散絡み合いは、入力ペアの1つの初期絡み合いによって上述されることを示す。
本研究では、ESPにおける量子相補性の役割について論じ、ESPを介して運用可能な絡み合いを局所的に予測可能であるかを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:46:49 GMT)
Entanglement Management in Space-Based Quantum Information Networks [0.0] 衛星は、広範囲にわたる接続を可能にするのに必要不可欠な役割を担っている。
我々は、量子情報ネットワークの展開に衛星が関与する様々な方法を探る。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:21:26 GMT)
Ensemble-Based Quantum Token Protocol Benchmarked on IBM Quantum Processors [0.0] 量子トークン(Quantum tokens)は、個人認証プロトコルに使用されることを目標として、物理的デバイスに不規則な量子状態を保存することを意図している。
本稿では,量子力学的可観測性に基づく単純な汎用モデルを用いて,アンサンブルに基づく量子トークンプロトコルを提案する。
銀行が複数のトークンからなる偽造硬貨を誤って受け入れる確率は10~22ドル以下であり、銀行が自身の硬貨を受け入れる確率は0.999ドル以上であることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:06:24 GMT)
Enhancing material behavior discovery using embedding-oriented Physically-Guided Neural Networks with Internal Variables [0.0] 内部変数を持つ物理的ガイド付きニューラルネットワークは、トレーニングや内部状態関係の解明に可観測データのみを使用するSciMLツールである。
それらの可能性にもかかわらず、これらのモデルは、細粒度空間場や時間進化システムのような高次元データに適用する場合、スケーラビリティの課題に直面している。
本稿では,これらのスケーラビリティの限界に対処するPGNNIVフレームワークの改良について,低次モデリング手法を用いて提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 12:33:21 GMT)
Enhancement of non-Markovianity due to environment-induced indirect interaction [0.0] 非マルコフ性は純粋に軽蔑される単一の2レベルシステムに対して無視可能であることを示す。
また,2段階系の数が増えるにつれて,非マルコビアン性も増大することを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 05:07:25 GMT)
EmissionNet: Air Quality Pollution Forecasting for Agriculture [0.0] 農業排ガスからの大気汚染は、環境問題や公衆衛生問題に大きく貢献するが、しばしば見落とされがちである。
従来の空気質予測モデルは、複雑な非線形汚染物質相互作用を捉えるのに苦労する物理に基づくアプローチに依存している。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:55:36 GMT)
Dynamics in an emergent quantum-like state space generated by a nonlinear classical network [0.0] この作業は、グラフが古典的なシステムと私たちが量子ライク(QL)と呼ぶ状態空間を接続するのに役立つフレームワークを活用する。
グラフを介してQL状態空間にマップする,大規模でダイナミックな古典システムの具体例について検討する。
我々は、非閉定理(すなわち、QLビットの状態はコピーできない)が、QL状態だけでなく、基礎となる古典システムにも適用されることを示す。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:18:39 GMT)
Discovering the underlying analytic structure within Standard Model constants using artificial intelligence [0.0] シンボリック回帰と遺伝的プログラミングを用いて,標準モデル(SM)の基本パラメータの基盤となる解析構造を探索する。
これらの定数のペアを結合する最も単純な解析関係を同定し、相対的精度が1%以上であるいくつかの顕著な表現を報告する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:23:25 GMT)
Deep Operator Networks for Bayesian Parameter Estimation in PDEs [0.0] 本稿では,Deep Operator Networks (DeepONets) と物理インフォームドニューラルネットワーク (PINN) を組み合わせて偏微分方程式 (PDE) を解く新しいフレームワークを提案する。
データ駆動学習を物理的制約と統合することにより,多様なシナリオにまたがる堅牢で正確なソリューションを実現する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:45:08 GMT)
Debunking with Dialogue? Exploring AI-Generated Counterspeech to Challenge Conspiracy Theories [0.0] 我々は,GPT-4o,Llama 3,Mistralが,構造化プロンプトによって提供される心理的研究から得られた対音声戦略を効果的に適用する能力を評価する。
以上の結果から, モデルはしばしば, 汎用的, 反復的, 表面的結果を生成することがわかった。
彼らは恐れを過度に認識し、しばしば事実、情報源、数字を幻覚させ、迅速な使用を問題にしている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 06:19:26 GMT)
DBLP: Noise Bridge Consistency Distillation For Efficient And Reliable Adversarial Purification [0.0] 拡散ブリッジ蒸留法 (DBLP) は, 対向浄化のための新規かつ効率的な拡散ベースフレームワークである。
DBLPは、堅牢な精度、優れた画像品質、約0.2秒の推論時間を実現し、リアルタイムの対向的浄化に向けた重要なステップとなる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:47:36 GMT)
Cryogenic RF-to-Microwave Transducer based on a DC-Biased Electromechanical System [0.0] 可変型静電前増幅器と超伝導電気機械キャビティを組み合わせた2段式ヘテロダインrf-to-microwaveトランスデューサについて報告する。
金属化されたSi$_3$N$_4$膜は、マイクロ波LC共振器内の真空ギャップコンデンサの可動板を形成する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:51:42 GMT)
Cross-Modal Dual-Causal Learning for Long-Term Action Recognition [0.0] 長期的行動認識(LTAR)は、複雑な原子的行動相関と視覚的共同創設者による時間的範囲の延長によって困難である。
本稿では,ビデオとラベルテキスト間の因果関係を明らかにするための構造因果モデルを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 08:19:46 GMT)
Cooperative Perception: A Resource-Efficient Framework for Multi-Drone 3D Scene Reconstruction Using Federated Diffusion and NeRF [0.0] 本提案では,計算限界や低帯域幅通信に関わる問題を解決することを目的とした,革新的なドローン群認識システムを提案する。
このフレームワークは、共有拡散モデルのフェデレート学習とYOLOv12の軽量セマンティック抽出により、効率的なマルチエージェント3D/4Dシーン合成を可能にする。
このアプローチは、ドローンテストベッド上でのシミュレーションと実際のデプロイを通じて検証可能であり、自律システムのためのマルチエージェントAIの破壊的な進歩として位置づけられる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:43:24 GMT)
Context-Aware Visualization for Explainable AI Recommendations in Social Media: A Vision for User-Aligned Explanations [0.0] 本稿では,多様な説明手法を用いた視覚的説明システムを提案する。
私たちのフレームワークは、説明スタイル(ビジュアル vs. 数値)と粒度(エキスパート vs. レイ)を1つのパイプラインで共同で適用する最初のフレームワークです。
30人のXユーザーがいる公共パイロットは、意思決定と信頼への影響を検証する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 14:47:47 GMT)
Composable OS Kernel Architectures for Autonomous Intelligence [0.0] 本研究では、カーネルを静的リソースマネージャからAI統合プラットフォームに変換する、インテリジェントシステムのための新しいOSカーネルアーキテクチャを提案する。
主なコントリビューションは、LKM(Loadable Kernel Modules)を、カーネル空間における高速な知覚および認知処理のためのAI指向ユニットとして扱うこと、(2)Linuxカーネルを、組み込みのディープラーニング推論、浮動小数点加速度、効率的なMLワークロードのためのリアルタイム適応スケジューリングを備えたAIネイティブ環境に拡張すること、などである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 13:07:16 GMT)
Close encounters between periodic light and periodic arrays of quantum emitters [0.0] 本稿では, 微視的量子電磁力学に基づく準曲面共鳴のための初期数モード量子化手法を提案する。
結晶性偏光子間の相互作用は、絡み合った光子対の効率的かつ指向的な生成に繋がることを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:24:07 GMT)
Celestial Quantum Error Correction I: Qubits from Noncommutative Klein Space [0.0] 2次元CFTによるホログラム記述は、そのような冗長性は期待できない。
第1部では、Kleinian hyperk"ahler 時空における非可換幾何学を再考することにより、有限自由度を持つおもちゃモデルを構築している。
符号部分空間は、ソフトな時空変動の下で頑健な2量子安定化状態からなる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:46:40 GMT)
CLIPTime: Time-Aware Multimodal Representation Learning from Images and Text [0.0] 画像とテキストの入力から発生段階とそれに対応する菌糸成長のタイムスタンプの両方を予測するためのフレームワークを提案する。
CLIPアーキテクチャを基盤として,我々のモデルは共同で視覚・テキストの埋め込みを学習し,テスト中に明示的な時間入力を必要とせずに時間認識推論を可能にする。
実験の結果、CLIPTimeは生物学的進行を効果的にモデル化し、解釈可能な時間的基底出力を生成することがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 09:08:10 GMT)
Breakdown of Fermi's Golden Rule in 1d systems at non-zero temperature [0.0] 相互作用量子系では、準粒子の相互作用によって引き起こされるデコヒーレンスにより、単一粒子グリーンの関数は時間内に崩壊すると予想される。
この効果は、弱い相互作用を持つ量子フェルミオン系やボゾン系において広く知られている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 01:51:50 GMT)
Bound energy, entanglement and identifying critical points in 1D long-range Kitaev model [0.0] 共形対称性のない二部量子系の絡み合い構造について検討する。
量子熱力学量である束縛エネルギーは単位系サイズ当たりの絡み合いエントロピーの2乗に線形に比例することを示した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 04:33:01 GMT)
Beyond asymptotic reasoning: a practical ground state projector based on the wall-Chebyshev expansion [0.0] 壁面関数に対するチェビシェフ級数近似に基づく地中準備のための量子アルゴリズムを提案する。
このプロジェクターは、ハミルトン作用素の積として効率的に実装することができる。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 11:15:15 GMT)
Bayesian CART models for aggregate claim modeling [0.0] 本稿では,3種類のベイジアンCARTモデル,すなわち周波数重大度モデル,シーケンシャルモデル,ジョイントモデルを提案する。
各種分布を用いて, 右スクリューおよび重み付きクレーム重みデータに対するBCARTモデルについて検討した。
クレーム数と平均重大度の間の依存性を組み込んだBCARTモデルと共同BCARTモデルが有用であることがわかった。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:58:25 GMT)
Batched Nonparametric Bandits via k-Nearest Neighbor UCB [0.0] バッチ化された非パラメトリックな文脈的包帯における逐次的意思決定について検討する。
適応的k-アネレスト近傍(k-NN)回帰と上位信頼境界(UCB)の原理を組み合わせた非パラメトリックアルゴリズムを提案する。
提案手法であるBaNk-UCBは完全に非パラメトリックであり,コンテキスト次元に適応し,実装が簡単である。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 17:02:02 GMT)
Autonomous Penetration Testing: Solving Capture-the-Flag Challenges with LLMs [0.0] 本研究は,OverTheWireのBanditキャプチャ・ザ・フラッグゲームにモデルを接続することにより,GPT-4oが初心者レベルの攻撃的セキュリティタスクを自律的に解く能力を評価する。
技術的に単一コマンドSSHフレームワークと互換性のある25のレベルのうち、GPT-4oは18の無効化と、全体の80%の成功率を示す最小のプロンプトのヒントの後に2のレベルを解決した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:11:58 GMT)
AttnMod: Attention-Based New Art Styles [0.0] 本稿では,事前学習した拡散モデルにおけるクロスアテンションを変調して,新規でプロンプタブルなアートスタイルを生成する,トレーニング不要なAttnModを紹介する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:49:12 GMT)
Applying Psychometrics to Large Language Model Simulated Populations: Recreating the HEXACO Personality Inventory Experiment with Generative Agents [0.0] 生成エージェントは、洗練された自然言語の相互作用を通して人間のような特性を示す。
事前に定義された人物の伝記に基づいて役割や個性を仮定する能力は、社会科学研究の参加者にとってコスト効率のよい代用品として位置づけられている。
本稿では,このようなペルソナをベースとしたエージェントがヒトの集団を表わすための有効性について検討する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:16:16 GMT)
Advancing Welding Defect Detection in Maritime Operations via Adapt-WeldNet and Defect Detection Interpretability Analysis [0.0] 石油・ガス産業における配管システムの安全性と信頼性を確保するために溶接欠陥検出が不可欠である。
従来の非破壊テスト(NDT)手法は微妙な欠陥や内部の欠陥を検知できないことが多く、潜在的な障害やコストダウンの原因となる。
Adapt-WeldNetは溶接欠陥検出のための適応フレームワークである。
システム透過性を高めるためにDDIA(Defect Detection Interpretability Analysis)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 07:19:23 GMT)
Advances in Intelligent Hearing Aids: Deep Learning Approaches to Selective Noise Cancellation [0.0] 本稿では,AI駆動型補聴器用選択的ノイズキャンセリングの進歩を評価する。
ディープラーニングアーキテクチャ、ハードウェアデプロイメント戦略、臨床検証研究、ユーザ中心設計などにわたる知見を合成する。
主な発見は、従来の手法よりも大幅に向上し、18.3dBのSI-SDRをノイズ-残響ベンチマークで改善した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 18:43:42 GMT)
Addressing Cold Start For next-article Recommendation [0.0] 複製研究は、次の歌のレコメンデーションのために構築された適応線形マッピングモデルであるALMMを、MINDデータセット上のニュースレコメンデーション問題に修正する。
我々のレプリケーションは、このモデルをユーザ読み込みパターンに合わせるように再構成することで、コールドスタートシナリオのレコメンデーションパフォーマンスを改善することを目的としています。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 19:28:57 GMT)
Adaptive Machine Learning-Driven Multi-Fidelity Stratified Sampling for Failure Analysis of Nonlinear Stochastic Systems [0.0] 適応型機械学習メタモデルを用いて,小さな故障確率を推定する多要素階層化サンプリング手法を提案する。
高忠実度データセットを使用してディープラーニングベースのメタモデルをトレーニングし、コスト効率が高く高相関の低忠実度モデルとして機能する。
多要素モンテカルロフレームワークを用いて, 階層的故障確率の偏りのない推定値を求める。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:04:21 GMT)
Adapting to the Unknown: Robust Meta-Learning for Zero-Shot Financial Time Series Forecasting [0.0] 本稿では,メタタスクと下流予測の両方に学習した埋め込みを活用するタスク構築手法を提案する。
複数の潜伏体制に埋め込みを確率的に割り当てることで、GMMはよりリッチで多様なメタラーニングを可能にする。
高ボラティリティ期および複数の国際市場における実世界の財務データを用いて,本手法の有効性を検証した。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 03:38:38 GMT)
Academic Vibe Coding: Opportunities for Accelerating Research in an Era of Resource Constraint [0.0] バイブコーディングは構造化されており、大きな言語モデルでプロンプト駆動のコード生成を行う。
それは、アイデアから分析までのタイムラインを圧縮し、特殊なデータロールに対するスタッフのプレッシャーを減らし、厳格でバージョン管理されたアウトプットを維持することを目的としている。
この記事では、ビブコーディングの概念を定義し、現在の学術的危機に対処し、その実装に初心者フレンドリなツールチェーンを詳述し、ガバナンスとマインドフルなアプリケーションを必要とする固有の制限を分析します。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 00:42:44 GMT)
AURA: A Hybrid Spatiotemporal-Chromatic Framework for Robust, Real-Time Detection of Industrial Smoke Emissions [0.0] AURAは、産業用煙排出の堅牢でリアルタイムな検出のために設計された、新しいハイブリッド・テンポラル・フレームワークである。
本研究の目的は,産業排出の正確な自動監視を可能にすることにより,環境コンプライアンス,運転安全,公衆衛生の成果を大幅に改善することである。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 22:22:05 GMT)
A causal derivation of the algebraic approach to quantum systems [0.0] 一般に、全ての量子系は作用素の代数によって表されると仮定される。
この研究は量子システムの「因果的ビュー」を提案する。
すべての量子系が作用素の唯一のフォン・ノイマン代数に対応することが証明されている。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 23:12:03 GMT)
A Simple and Effective Method for Uncertainty Quantification and OOD Detection [0.0] 分布シフトの不確かさを定量化するために,特徴空間密度に基づく効果的な手法を提案する。
具体的には、カーネル密度推定から得られた情報ポテンシャル場を利用して、トレーニングセットの特徴空間密度を近似する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 16:31:23 GMT)
A Deep Reinforcement Learning-Based TCP Congestion Control Algorithm: Design, Simulation, and Evaluation [0.0] 本稿では,Deep Reinforcement Learningに基づく新しいTCP混雑制御アルゴリズムを提案する。
提案手法は、Deep Q-Networksを用いて、主要なネットワークパラメータを観察し、リアルタイムアクションを取ることで、混雑ウィンドウ(cWnd)を最適化する。
論文参考訳(メタデータ) (Fri, 01 Aug 2025 20:00:17 GMT)