A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [221.3] 科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:30:52 GMT)
PointDGRWKV: Generalizing RWKV-like Architecture to Unseen Domains for Point Cloud Classification [123.0] ポイント領域一般化(DG)は、最近、ポイントクラウド分類(PCC)モデルの、目に見えない領域への一般化性を高めるために研究されている。
本稿では,DG PCCにおけるRWKVモデルの一般化可能性について述べる。
DG PCCに適したRWKVベースのフレームワークであるPointDGRWKVを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:28:33 GMT)
VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models [116.3] PyTorchに基づく大規模マルチモーダリティモデルを評価するためのオープンソースツールキットを提案する。
VLMEvalKitは、研究者や開発者が既存のマルチモダリティモデルを評価するための包括的なフレームワークを提供することを目的としている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:40:49 GMT)
ConspirED: A Dataset for Cognitive Traits of Conspiracy Theories and Large Language Model Safety [87.9] コンスピレーション(Conspired)は、一般的な認知特性に注釈を付けた最初の陰謀的内容のデータセットである。
我々は,比較的特徴を識別し,テキスト抽出において支配的特徴を決定する計算モデルを開発した。
我々は,大規模言語/推論モデル (LLM/LRM) を補間入力に対して頑健性を評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:39:25 GMT)
Re-Densification Meets Cross-Scale Propagation: Real-Time Compression of LiDAR Point Clouds [84.4] LiDARポイントクラウドは、様々なアプリケーションに基本的だが、高精度スキャンは、かなりのストレージと送信オーバーヘッドを発生させる。
既存の手法では、非順序の点を階層的なオクツリーやボクセル構造に変換して、密度から疎い予測符号化を行うのが一般的である。
筆者らのフレームワークは2つの軽量モジュールから構成されている。まず、Geometry Re-Densification Moduleがエンコードされたスパース幾何を再認識し、より密なスケールで特徴を抽出し、予測符号化のための特徴を再分離する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:36:10 GMT)
Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.8] 大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:00:28 GMT)
Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.3] TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:09:21 GMT)
Puppet-Master: Scaling Interactive Video Generation as a Motion Prior for Part-Level Dynamics [79.5] 本稿では,対話型ビデオジェネレータPuppet-Masterを紹介した。
Puppet-Masterは、他のモーションコンディショニングビデオジェネレータとは異なり、パートレベルのモーションを生成することを学習している。
Puppet-Masterはドメイン外の実際のイメージを一般化し、実世界のベンチマークで既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:30:18 GMT)
DSO: Aligning 3D Generators with Simulation Feedback for Physical Soundness [79.5] ほとんどの3Dオブジェクトジェネレータは審美的品質を優先し、実際的な用途に必要な物理的な制約を無視している。
安定な3Dオブジェクトを生成するための従来のアプローチは、テスト時に幾何を最適化するために微分可能な物理シミュレータに頼っていた。
このフレームワークは、(微分不可能な)シミュレータからのフィードバックを活用し、3Dジェネレータが安定な3Dオブジェクトを直接出力する可能性を高める。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:47:51 GMT)
SageLM: A Multi-aspect and Explainable Large Language Model for Speech Judgement [74.5] 音声音声合成(S2S)大規模言語モデル(LLM)は、人間とコンピュータの自然な相互作用の基礎となる。
包括的S2S LLM評価のためのエンドツーエンド・マルチアスペクト・説明可能な音声LLMである textttSageLM を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:47:37 GMT)
Diffusion Models for Image Restoration and Enhancement: A Comprehensive Survey [73.9] 本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:33:09 GMT)
Mixture of Contexts for Long Video Generation [73.0] 我々は長文ビデオ生成を内部情報検索タスクとして再放送する。
本稿では,学習可能なスパークアテンション・ルーティング・モジュールであるMixture of Contexts (MoC) を提案する。
データをスケールしてルーティングを徐々に分散させていくと、そのモデルは計算を適切な履歴に割り当て、アイデンティティ、アクション、シーンを数分のコンテンツで保存する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:57:55 GMT)
MLE-STAR: Machine Learning Engineering Agent via Search and Targeted Refinement [72.8] 我々は機械学習エージェントを構築するための新しいアプローチであるMLE-STARを提案する。
MLE-STARは、まず、検索エンジンを使用してWebから効果的なモデルを取得することにより、外部知識を活用する。
MLE-STARにより提案される効果的な戦略を用いた新しいアンサンブル手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:12:45 GMT)
Investigating the Robustness of Counterfactual Learning to Rank Models: A Reproducibility Study [71.0] ランク付けのためのカウンターファクトラーニングはIRコミュニティで広く注目を集めている。
モデルは、ユーザの振る舞いの仮定が正しく、確率推定が正確であるときに理論的に非バイアス化される。
それらの有効性は通常シミュレーションベースの実験を通じて実証的に評価されるが、これは広く利用可能な大規模で実際のクリックログが不足しているためである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:13:16 GMT)
MMG-Vid: Maximizing Marginal Gains at Segment-level and Token-level for Efficient Video LLMs [67.8] MMG-Vidは、ビデオ理解のためのトレーニング不要なビジュアルトークンプルーニングフレームワークである。
MMG-Vidはオリジナルのパフォーマンスの99.5%以上を維持でき、視覚トークンの75%を効果的に削減できることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:50:03 GMT)
WoW-Bench: Evaluating Fine-Grained Acoustic Perception in Audio-Language Models via Marine Mammal Vocalizations [67.6] 海洋哺乳動物の発声を用いた低レベルの聴覚知覚と認知を評価するために,WoW-Benchベンチマーク(World-of-Whale benchmark)を導入した。
WoW-Benchは、新しい音を分類するための知覚ベンチマークと、ブルームの分類学にインスパイアされた認知ベンチマークで構成され、音の出来事を記憶、理解、応用、分析する能力を評価する。
最先端のLALMを用いた実験は、人間のレベルよりもはるかに低い性能を示し、LALMのより強力な聴覚的接地の必要性を示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:29:46 GMT)
Multi-View 3D Point Tracking [67.2] 本稿では,複数のカメラビューを用いた動的シーンにおける任意の点の追跡を目的とした,データ駆動型マルチビュー3Dポイントトラッカーについて紹介する。
本モデルでは,現実的な数のカメラを用いて直接3次元対応を推定する。
我々は5K合成多視点Kubricシーケンスをトレーニングし、2つの実世界のベンチマークで評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:58:20 GMT)
Prompt-to-Product: Generative Assembly via Bimanual Manipulation [67.1] Prompt-to-Productは、自然言語プロンプトから現実のアセンブリ製品を生成する自動化パイプラインである。
レゴブロックをアセンブリプラットフォームとして利用し、ブロックアセンブリ構造を作成するプロセスを自動化する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:59:05 GMT)
Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning [65.9] 本稿では,オフラインからオンラインまでの潜水蒸留とフレキシブルなゆがみ制約を通したビデオから,セマンティックな違いを学習し,理解することを試みる。
動作自由なビデオ予測モデルを非干渉正規化によりオフラインでトレーニングし、注意をそらすビデオから意味的知識を抽出する。
オンライン環境での微調整には、事前学習されたモデルからの知識を活用し、世界モデルに絡み合った制約を導入する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:20:08 GMT)
MobileCLIP2: Improving Multi-Modal Reinforced Training [65.6] 我々はMobileCLIP2と呼ばれる新しいモデルのファミリーを訓練し、最先端のImageNet-1kゼロショット精度を低レイテンシで達成する。
我々は,MobileCLIP2-BにおけるImageNet-1kの精度を,MobileCLIP-Bアーキテクチャと比較して2.2%改善した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:50:22 GMT)
Learning Robust Spatial Representations from Binaural Audio through Feature Distillation [64.4] データラベルを必要とせずに音声の頑健な空間表現を学習するために,特徴蒸留に基づく事前学習ステージの利用について検討する。
実験により, 事前学習したモデルでは, 騒音および残響環境における性能が向上していることが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:43:15 GMT)
Don't lie to your friends: Learning what you know from collaborative self-play [63.0] 我々は、AIエージェントが知っていることを教えるために、根本的に新しいアプローチを提案する。
我々は,集団が正解に到達して報奨を受けるマルチエージェントコラボレーションを構築した。
望ましいメタ知識は、相互作用の構造に組み込まれたインセンティブから生まれる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:31:28 GMT)
CoCoNUTS: Concentrating on Content while Neglecting Uninformative Textual Styles for AI-Generated Peer Review Detection [60.5] 我々は、AI生成ピアレビューの詳細なデータセットの上に構築されたコンテンツ指向ベンチマークであるCoCoNUTSを紹介する。
また、マルチタスク学習フレームワークを介してAIレビュー検出を行うCoCoDetを開発し、レビューコンテンツにおけるAIのより正確で堅牢な検出を実現する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:03:11 GMT)
FastFit: Accelerating Multi-Reference Virtual Try-On via Cacheable Diffusion Models [59.9] FastFitは、キャッシュ可能な新しい拡散アーキテクチャに基づいた、高速なマルチ参照仮想試行フレームワークである。
本モデルでは,パラメータのオーバーヘッドを無視して参照特徴符号化をデノナイズ処理から完全に切り離す。
これにより、参照機能は一度だけ計算され、すべてのステップで損失なく再利用される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:25:52 GMT)
SoAy: A Solution-based LLM API-using Methodology for Academic Information Seeking [59.6] SoAyは学術情報検索のためのソリューションベースのLLM API利用方法論である。
ソリューションが事前に構築されたAPI呼び出しシーケンスである場合、推論メソッドとしてソリューションを備えたコードを使用する。
その結果、最先端のLLM APIベースのベースラインと比較して34.58-75.99%のパフォーマンス改善が見られた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:44:30 GMT)
How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on $τ$-bench [58.1] マルチターンの会話環境では、大きな言語モデル(LLM)は、一貫性のある推論とドメイン固有のポリシーへの固執にしばしば苦労する。
本稿では,関連するドメインルールを付加したユーザクエリを自動的に再構成するIRMA(Input-Reformulation Multi-Agent)フレームワークを提案する。
IRMAはReAct、Function Calling、Self-Reflectionをそれぞれ16.1%、12.7%、19.1%で大きく上回っている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:57:33 GMT)
FindRec: Stein-Guided Entropic Flow for Multi-Modal Sequential Recommendation [57.6] textbfFindRec (textbfFlexible unified textbfinformation textbfdisentanglement for multi-modal sequence textbfRecommendation)を提案する。
Stein kernel-based Integrated Information Coordination Module (IICM) は理論上、マルチモーダル特徴とIDストリーム間の分散一貫性を保証する。
マルチモーダル特徴を文脈的関連性に基づいて適応的にフィルタリング・結合するクロスモーダル・エキスパート・ルーティング機構。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:59:43 GMT)
Mixed Signals: A Diverse Point Cloud Dataset for Heterogeneous LiDAR V2X Collaboration [57.4] 車両間協調認識(V2X)は、単車知覚システムの限界に対処するための有望な解決策として登場した。
これらのギャップに対処するために、45.1kの点雲と240.6kのバウンディングボックスを備えた総合的なV2XデータセットであるMixed Signalsを紹介した。
私たちのデータセットは10クラスのポイントクラウドとバウンディングボックスアノテーションを提供し、認識トレーニングのための信頼性の高いデータを確保します。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:07:25 GMT)
RSRNav: Reasoning Spatial Relationship for Image-Goal Navigation [57.2] 近年のイメージゴールナビゲーション(ImageNav)手法は,目標と自我中心の画像の意味的特徴を別々に捉え,知覚行動ポリシーを学習している。
本稿では,目標と現在の観測値の空間的関係をナビゲーションガイダンスとして考慮する,シンプルで効果的な手法であるRSRNavを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:23:39 GMT)
Addressing Personalized Bias for Unbiased Learning to Rank [56.7] Unbiased Learning to rank (ULTR)は、バイアスのあるユーザの行動ログからバイアスのないランキングモデルを学ぶことを目的としている。
そこで本研究では,学習からランクへの目標値を求めるために,新しいユーザ認識逆確率スコア推定器を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:01:31 GMT)
EmoCAST: Emotional Talking Portrait via Emotive Text Description [56.4] EmoCASTは、正確なテキスト駆動感情合成のための拡散ベースのフレームワークである。
外観モデリングでは、感情的なプロンプトはテキスト誘導の分離された感情的モジュールを通して統合される。
EmoCASTは、現実的で感情的に表現され、音声同期されたトーキーヘッドビデオを生成する、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:02:06 GMT)
Beyond the Rosetta Stone: Unification Forces in Generalization Dynamics [56.1] 大規模言語モデル(LLM)は言語間知識伝達に苦慮している。
我々は,この現象の原因とダイナミクスを,合成多言語データセット上でスクラッチから小さなトランスフォーマーモデルを訓練することによって研究する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:51:55 GMT)
Interact-Custom: Customized Human Object Interaction Image Generation [55.9] 既存のアプローチは、ターゲットエンティティ間のきめ細かい相互作用制御を無視しながら、ターゲットエンティティの外観保存に重点を置いている。
本稿では,対象物に対する個人認証とインタラクションの意味制御を同時に行う,カスタマイズされたヒューマンオブジェクトインタラクション画像生成の課題を提案する。
1)人間オブジェクトを自己完結したアイデンティティ特徴とポーズ指向のインタラクション特徴に分解する必要があるが、現在のHOI画像データセットはそのような特徴分解学習に理想的なサンプルを提供していない。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:28:08 GMT)
Dress&Dance: Dress up and Dance as You Like It - Technical Preview [55.8] Dress&Danceは、高品質な5秒の24FPS仮想トライオンビデオを生成するビデオ拡散フレームワークである。
当社のアプローチでは、1つのユーザイメージが必要で、さまざまなトップ、ボトム、ワンピースの衣服、同時にトップとボトムを1回のパスで試着することができます。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:59:55 GMT)
FLASH: Federated Learning Across Simultaneous Heterogeneities [55.1] FLASH (Federated Learning Across Simultaneous Heterogeneities) は軽量かつ柔軟なクライアント選択アルゴリズムである。
ヘテロジニティの幅広い情報源の下で、最先端のFLフレームワークよりも優れています。
最先端のベースラインよりも大幅に、一貫性のある改善を実現している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:58:54 GMT)
Leveraging Generative Models for Real-Time Query-Driven Text Summarization in Large-Scale Web Search [55.0] クエリ駆動テキスト要約(QDTS)は、与えられたクエリに基づいてテキスト文書から簡潔で情報的な要約を生成することを目的としている。
従来の抽出的要約モデルは、主にランク付け候補の要約セグメントに基づいており、産業応用において支配的なアプローチとなっている。
産業Web検索におけるリアルタイムQDTSに対処するための生成モデルの適用を開拓するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:51:51 GMT)
Adapting Foundation Model for Dental Caries Detection with Dual-View Co-Training [53.8] 本稿では, 歯列検出のための新しいDual-View Co-TrainingネットワークであるAttention-TNetについて紹介する。
OurTNetは、自動歯肉検出を用いて、パノラマX線画像からのグローバルビューと、収穫した歯肉画像からのローカルビューの2つの補完的なビューを確立する。
両ビューからの情報を効果的に統合するために,Gated Cross-Viewモジュールを導入する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:13:26 GMT)
Detect, Investigate, Judge and Determine: A Knowledge-guided Framework for Few-shot Fake News Detection [53.4] Few-Shot Fake News Detection (FS-FND) は、極めて低リソースのシナリオにおいて、非正確なニュースを実際のニュースと区別することを目的としている。
ソーシャルメディア上でのフェイクニュースの拡散や有害な影響により、このタスクは注目を集めている。
本稿では,内外からLLMを増強するDual-perspective Knowledge-Guided Fake News Detection (DKFND)モデルを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:09:46 GMT)
Categorical Data Clustering via Value Order Estimated Distance Metric Learning [53.3] 本稿では,分類属性を直感的に表現する新しい順序距離計量学習手法を提案する。
新しい共同学習パラダイムが開発され、クラスタリングとオーダー距離メートル法学習の代替となる。
提案手法は分類および混合データセットのクラスタリング精度に優れる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:04:55 GMT)
Unifying Diarization, Separation, and ASR with Multi-Speaker Encoder [53.0] 本稿では、話者ダイアリゼーション(SD)、音声分離(SS)、マルチ話者自動音声認識(ASR)タスクの表現を共同で学習する新しいアーキテクチャを提案する。
我々は,UMEの複数の層から隠された表現を残重畳符号化(RWSE)として活用し,異なる意味レベルからの情報を効果的に活用する。
このジョイントトレーニングアプローチは,タスク間の相互依存性を捕捉し,重なり合う音声データの全体的な性能を向上させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:50:57 GMT)
ActLoc: Learning to Localize on the Move via Active Viewpoint Selection [52.9] ActLocは、一般的なロボットナビゲーションタスクのローカライズ精度を高めるためのアクティブな視点対応計画フレームワークである。
ActLocの中核となるのは、視点選択のために、大規模に訓練された注意ベースのモデルである。
ActLocは、単一視点選択における最先端の結果を達成し、完全な軌道計画に効果的に一般化する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:36:02 GMT)
Towards Inclusive Communication: A Unified LLM-Based Framework for Sign Language, Lip Movements, and Audio Understanding [52.9] 音声テキスト生成のための手話,唇の動き,音声の多様な組み合わせを扱える最初の統一フレームワークを提案する。
i)不均一な入力を効果的に処理できる統一されたモダリティ非依存アーキテクチャの設計、(ii)モダリティ間の過小評価された相乗効果の探索、特に手話理解における非手動的手がかりとしての唇運動の役割、(iii)個々のタスクに特化した最先端モデルと同等以上のパフォーマンスを達成すること、の3つの目的に焦点をあてる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:51:42 GMT)
Ego-centric Predictive Model Conditioned on Hand Trajectories [52.5] 自我中心のシナリオでは、次の行動とその視覚的結果の両方を予測することは、人間と物体の相互作用を理解するために不可欠である。
我々は,エゴセントリックなシナリオにおける行動と視覚的未来を共同でモデル化する,統合された2段階予測フレームワークを提案する。
我々のアプローチは、エゴセントリックな人間の活動理解とロボット操作の両方を扱うために設計された最初の統一モデルである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:08:03 GMT)
The Ramon Llull's Thinking Machine for Automated Ideation [52.1] 提案手法は, テーマ, ドメイン, メソッドの3つの構成軸を定義する。
我々は,LLMをキュレートした組み合わせで促進することで,多種多様で関連性があり,現在の文献に根ざした研究思想が生み出されることを示す。
この現代的な思考マシンは、科学的創造性を増強するための軽量で解釈可能なツールを提供し、人間とAIの協調的な概念化への道筋を示唆している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:29:36 GMT)
Enhancing Robustness of Autoregressive Language Models against Orthographic Attacks via Pixel-based Approach [52.0] 自己回帰言語モデルは、正書法攻撃に弱い。
この脆弱性は、サブワードトークン化器とその埋め込みに固有の語彙外問題に起因している。
本稿では,単語を個々の画像としてレンダリングすることで,テキストベースの埋め込みをピクセルベースの表現に置き換える,画素ベースの生成言語モデルを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:48:38 GMT)
Video-LevelGauge: Investigating Contextual Positional Bias in Large Video Language Models [51.7] Video-LevelGaugeは、大規模ビデオ言語モデル(LVLM)における位置バイアスを評価するために設計されたベンチマークである。
ベンチマークでは、複数のタイプにまたがる438の動画を手動でキュレートし、117の高品質なマルチチョイスの質問と120のオープンエンドの質問を得た。
本研究は,多くの主要なオープンソースモデルにおいて,頭部や近傍のコンテントの嗜好を示す重要な位置バイアスを呈するものである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:44:26 GMT)
Transfer Learning for Classification under Decision Rule Drift with Application to Optimal Individualized Treatment Rule Estimation [50.3] 本研究では,ベイズ決定規則による後方ドリフトのモデル化手法を提案する。
穏やかな規則性条件の下では、推定器の整合性を確立し、リスク境界を導出する。
本稿では,最適な個別化処理ルールの推定に適応させることにより,本手法の幅広い適用性について述べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:03:06 GMT)
Learning Primitive Embodied World Models: Towards Scalable Robotic Learning [50.3] 我々は,世界モデリングのための新しいパラダイム--Primitive Embodied World Models (PEWM)を提案する。
ビデオ生成を固定的な短地平線に制限することにより,ロボット行動の言語概念と視覚的表現の微妙なアライメントを可能にする。
我々のフレームワークは、きめ細かい物理的相互作用と高レベルの推論のギャップを埋め、スケーラブルで解釈可能で汎用的なインテリジェンスへの道を開く。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:31:48 GMT)
ASVD: Activation-aware Singular Value Decomposition for Compressing Large Language Models [50.0] 大規模言語モデル(LLM)のための新しい訓練後圧縮パラダイムを提案する。
我々は、アクティベーション対応特異値分解(ASVD)と呼ばれるトレーニング不要の手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:57:52 GMT)
Webly-Supervised Image Manipulation Localization via Category-Aware Auto-Annotation [49.8] 画像編集ツールを使って操作された画像は、視聴者を誤解させ、社会保障に重大なリスクをもたらす可能性がある。
この領域の主な障壁の1つは、データ取得の高コストと、高品質な注釈付きデータセットの深刻な欠如である。
我々は、Webから手動で鍛造された画像の大規模なコレクションと、自動生成されたアノテーションを利用する。
我々はMIMLv2を構築する。MIMLv2は大規模で多彩で高品質なデータセットで、246,212個の手動鍛造画像とピクセルレベルのマスクアノテーションを備えている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:44:40 GMT)
Lethe: Purifying Backdoored Large Language Models with Knowledge Dilution [49.8] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて優れたパフォーマンスを達成し、大幅な進歩を遂げている。
標準クエリではモデルが正常に動作しますが、特定のトリガがアクティブになると、有害な応答や意図しない出力を生成します。
本稿では,LLMからのバックドアの挙動を知識希釈により除去する新しい手法LETHEを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:05:18 GMT)
Revisiting the Privacy Risks of Split Inference: A GAN-Based Data Reconstruction Attack via Progressive Feature Optimization [49.3] Split Inference (SI)は、エッジデバイスとクラウドの間の計算を分割することで、レイテンシを低減し、ユーザのプライバシを保護する。
データ再構成攻撃(DRA)の最近の進歩は、SIで交換された中間的特徴を利用して機密入力データを復元できることを明らかにしている。
既存のDRAは一般的に浅いモデルにのみ有効であり、セマンティックな事前を十分に活用できない。
本稿では,プログレッシブ・フィーチャー・オプティマイゼーション(PFO)を用いた新しいGANベースのDRAフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:00:39 GMT)
DrivingGaussian++: Towards Realistic Reconstruction and Editable Simulation for Surrounding Dynamic Driving Scenes [49.2] DrivingGaussian++は、自律運転シーンをリアルに再構成し、制御可能な編集を行うための効率的なフレームワークである。
テクスチャ修正、天気予報、オブジェクト操作など、ダイナミックな運転シーンのためのトレーニング不要のコントロール可能な編集をサポートする。
提案手法は,動的物体の運動軌跡を自動的に生成し,最適化過程における現実性を高める。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:22:54 GMT)
CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification [48.8] 最近のVision-Language-Actionモデルは、広範な後トレーニングを必要とし、高い計算オーバーヘッドをもたらす。
命令駆動型ルーティングとスパーシフィケーションを利用して効率と性能を両立させるフレームワークであるCogVLAを提案する。
CogVLAは、それぞれ97.4%と70.0%の成功率で最先端のパフォーマンスを達成し、トレーニングコストを2.5倍に、推論遅延を2.8倍に削減した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:50:58 GMT)
Rethinking Purity and Diversity in Multi-Behavior Sequential Recommendation from the Frequency Perspective [48.6] レコメンデーションシステムでは、ユーザーはブラウジング、クリック、購入などの複数の行動を示すことが多い。
いくつかの行動データは、ユーザー興味のモデリングにも避けられないノイズをもたらします。
これらの研究は、低周波情報は価値があり信頼性が高い傾向にあり、高周波情報はしばしばノイズと関連していることを示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:55:02 GMT)
High-Rank Irreducible Cartesian Tensor Decomposition and Bases of Equivariant Spaces [48.5] カルトテンソルの分解のための経路行列を、小さくて手頃な複雑さを持つランク$n=9$まで構築する。
提案手法はRREFアルゴリズムを回避し,各ICT分解行列の完全な解析的導出を維持する。
結果は任意のテンソル積と直和空間に拡張され、対称性を維持しながら異なる空間間の自由な設計が可能となる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:23:37 GMT)
Bridging Minds and Machines: Toward an Integration of AI and Cognitive Science [48.4] 認知科学は人工知能(AI)、哲学、心理学、神経科学、言語学、文化などの分野を深く形成している。
AIの多くのブレークスルーは、そのルーツを認知理論にさかのぼる一方で、AI自体が認知研究を進めるのに欠かせないツールになっている。
我々は、認知科学におけるAIの未来は、性能の向上だけでなく、人間の心の理解を深めるシステムの構築にも関係していると主張している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:26:17 GMT)
Amadeus: Autoregressive Model with Bidirectional Attribute Modelling for Symbolic Music [48.0] 本稿では,新しいシンボリック音楽生成フレームワークであるAmadeusを紹介する。
アマデウスは、ノート配列の自己回帰モデルと属性の双方向離散拡散モデルを採用している。
非条件およびテキスト条件付き生成タスクについて広範な実験を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:15:44 GMT)
Embracing Aleatoric Uncertainty: Generating Diverse 3D Human Motion [47.7] 本研究では,単純なテキスト・ツー・モーション生成手法であるtextiti.,Diverse-T2Mを提案する。
本手法は, 生成過程に不確実性を導入し, 高度に多様な動きの発生を可能にする。
HumanML3D と KIT-ML のテキスト・トゥ・モーション・ジェネレーション・ベンチマーク・データセットを用いた結果,本手法はテキストの一貫性を保ちながら多様性を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:49:27 GMT)
Reconsidering the Performance of GAE in Link Prediction [47.7] リンク予測のためのグラフニューラルネットワーク(GNN)は、高度なトレーニング技術とモデルアーキテクチャを導入している。
この問題に対処するために、近年の手法でモデルに依存しないトリックを適用することにより、グラフオートエンコーダ(GAE)を体系的に探索する。
改良されたGAEは、近年の洗練されたモデルの性能に匹敵し、広く使われているリンク予測ベンチマークに優れた計算効率を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:08:33 GMT)
Spectral Gaps with Quantum Counting Queries and Oblivious State Preparation [47.6] 本研究では、量子ビットの対数数を用いて、加算誤差$epsilonDelta_k$まで値を近似する量子アルゴリズムを提案する。
この分析における重要な技術的ステップは、適切なランダム初期状態の準備であり、最終的には閾値よりも小さい固有値の数を効率的に数えることができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:04:18 GMT)
Turning the Spell Around: Lightweight Alignment Amplification via Rank-One Safety Injection [47.3] 大規模言語モデル(LLM)における安全性の整合性は、しばしば有害な要求を拒否するために内部表現を仲介する。
近年の研究では、これらの安全メカニズムは特定の表現方向を非難したり削除したりすることで回避可能であることが示されている。
そこで本研究では,リファレンシャル・メディア・サブスペースへのアクティベーションを永久に操り,モデルの安全アライメントを向上する手法であるランクワン・セーフティ・インジェクション(ROSI)を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:22:33 GMT)
Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging [47.3] 下流タスクのための微調整された大型言語モデル(LLM)は、しばしば破滅的な忘れを招きます。
プレファインモデルとポストファインモデルとの重み付けを単純に組み合わせれば安全性の低下が軽減され,性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:13:45 GMT)
Dual-Model Weight Selection and Self-Knowledge Distillation for Medical Image Classification [47.2] 自己知識蒸留(SKD)と二重モデル重み選択を統合した新しい医用画像分類法を提案する。
提案手法は,コンパクトモデルにおいて重要な情報の保持に失敗する従来の手法の限界を克服する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:15:06 GMT)
Class Incremental Continual Learning with Self-Organizing Maps and Variational Autoencoders Using Synthetic Replay [47.0] 本研究は、自己組織化マップ(SOM)と変分オートエンコーダ(VAE)に基づく新しい生成連続学習フレームワークを導入する。
CIFAR-10 や CIFAR-100 のような高次元入力空間に対しては,VOE が学習した潜在空間上で SOM が動作する方式を設計する。
MNISTやFashionMNISTなどの低次元入力では、SOMはスタンドアロンで動作する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:11:22 GMT)
Inference-Time Alignment Control for Diffusion Models with Reinforcement Learning Guidance [46.1] 本稿では,Dejin-Free Guidance(CFG)に適応する推論時間法であるReinforcement Learning Guidance(RLG)を紹介する。
RLGは、RLの細調整されたモデルの性能を、人間の好み、構成制御、圧縮、テキストレンダリングなど、様々なRLアルゴリズム、下流タスクで一貫して改善している。
提案手法は,拡散モデルアライメント推論の強化と制御のための,実用的で理論的に健全な解を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:18:31 GMT)
Expert Routing with Synthetic Data for Continual Learning [46.0] Generate to Discriminate (G2D) は、合成データを利用してドメイン識別器を訓練する連続学習手法である。
我々は、G2Dが視覚と言語の両方におけるタスクにおいて、競争力のあるドメイン・インクリメンタル・ラーニング手法より優れていることを観察する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:13:51 GMT)
Veritas: Generalizable Deepfake Detection via Pattern-Aware Reasoning [46.0] 階層的な一般化テストで現実の課題をシミュレートするデータセットであるHydraFakeを紹介する。
具体的には、HydraFakeは、厳格なトレーニングと評価のプロトコルとともに、多種多様なディープフェイク技術と、ワイルドなフォージェリーを含んでいる。
We propose Veritas, a multi-modal large language model (MLLM) based Deepfake detector。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:53:05 GMT)
A Cavity-Enhanced Spectroscopist's Lens on Molecular Polaritons [45.9] ポラリトン化学は、電磁場を持つ直接分子過程への新たな経路として称賛されている。
ここでは、古典光学を用いた分子偏光子の形成、分光、挙動に関するチュートリアル的視点を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:55:10 GMT)
DART: Distilling Autoregressive Reasoning to Silent Thought [45.8] CoT(Chain-of-Thought)推論は、複雑なタスクの解決において、LLM(Large Language Models)が大幅に進歩している。
自己回帰的 CoT を非自己回帰的 Silent Thought (ST) に置き換えるための textbfDART (textbf Autoregressive textbfReasoning to Silent textbfThought) を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:45:44 GMT)
JADES: A Universal Framework for Jailbreak Assessment via Decompositional Scoring [45.8] 本稿では,JADES(Jailbreak Assessment via Decompositional Scoring)について紹介する。
その鍵となるメカニズムは、入力された有害な質問を一連の重み付けされたサブ問合せに自動的に分解し、各サブ問合せをスコアし、サブスコアを最終決定に重み付けすることである。
JADES on JailbreakQRは400対のjailbreakプロンプトと応答からなる新しいベンチマークで、それぞれが人間によって細心の注意を払って注釈付けされている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:40:27 GMT)
Improving Alignment in LVLMs with Debiased Self-Judgment [44.8] 本稿では,モデルの内部で作成した自己評価指標であるデバイアスド自己判断スコア(debiased self-judgment score)を生成する新しい手法を提案する。
提案手法は,復号法と選好調整法の両方を強化し,幻覚の低減,安全性の向上,全体的な能力の向上を実現した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:01:33 GMT)
Molecular Machine Learning in Chemical Process Design [44.7] 我々は、現在最先端の分子MLモデルについてレビューし、さらなる進歩を約束する研究の方向性について議論する。
分子MLを化学プロセススケールで活用することを検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:14:33 GMT)
Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation [44.6] 本稿では,データセットをモデルに分散した3次元アセット生成にビデオモダリティを適用する方法について検討する。
マルチビューレベルのアノテーションを備えた最初の大規模ビデオデータセットであるDroplet3D-4Mを導入し、画像入力と高密度テキスト入力の両方をサポートする生成モデルであるDroplet3Dをトレーニングする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:39:41 GMT)
Understanding Incremental Learning with Closed-form Solution to Gradient Flow on Overparamerterized Matrix Factorization [44.3] 勾配流は、時間とともに等級を減少させながら、その特異値を逐次学習することで、ターゲット行列を学習する。
対象行列の異なる成分の学習に対応する動的要素間の時間スケールの分離から漸進的学習が出現することを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:36:42 GMT)
When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios [44.0] MLLM(Multimodal large language model)は、より長く複雑なコンテキストを処理する。
トークン圧縮は、トレーニングと推論の両方でトークンの数を効率的に削減する、目立たしく批判的なアプローチとして登場した。
本稿では,マルチモーダル長コンテキストトークン圧縮の発芽領域に関する最初の体系的調査と合成について述べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:29:29 GMT)
CraftGraffiti: Exploring Human Identity with Custom Graffiti Art via Facial-Preserving Diffusion Models [44.0] 極端なスタイリスティック・トランスフォーメーションの下で顔のアイデンティティを保持することは、生成芸術において大きな課題である。
本稿では,顔の特徴保存を主目的としたエンドツーエンドのテキストガイドグラフィティ生成フレームワークCraftGraffitiを紹介する。
CraftGraffitiはまず、LoRAで調整された事前訓練された拡散トランスフォーマーを介してグラフィティスタイルのトランスファーを適用し、その後、顔に一貫性のある自己認識機構を通じてアイデンティティの忠実さを強制する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:38:13 GMT)
Dynamic Low-rank Approximation of Full-Matrix Preconditioner for Training Generalized Linear Models [43.8] AdaGramは効率の良い完全行列適応勾配更新である。
AdaGramは、ランク5とより小さいランク近似を使用する場合、より速く収束するか、対角アダプティブのパフォーマンスに適合する。
これは、大規模モデルにおける適応最適化のためのスケーラブルなソリューションとしてのAdaGramの可能性を示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:15:05 GMT)
Can Layer-wise SSL Features Improve Zero-Shot ASR Performance for Children's Speech? [43.3] 本研究では、最先端SSL事前訓練モデルから抽出した階層的特徴が、ゼロショットシナリオにおける子供の発話におけるASRの性能向上に有効であることを示す。
分析では、ゼロショットシナリオにおいて、子どもの発話におけるASRパフォーマンスを向上させる最も効果的なレイヤを特定した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:32:36 GMT)
Overview of BioASQ 2025: The Thirteenth BioASQ Challenge on Large-Scale Biomedical Semantic Indexing and Question Answering [43.3] BioASQは、大規模バイオメディカルセマンティックインデックスと質問応答の進歩を促進する一連の課題である。
今年、BioASQはbとSynergyという2つの確立されたタスクの新しいエディションと4つの新しいタスクで構成された。
BioASQのこのエディションでは、83の競技チームが合計1000以上の異なる応募を行った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:45:55 GMT)
When Memory Becomes a Vulnerability: Towards Multi-turn Jailbreak Attacks against Text-to-Image Generation Systems [43.3] インセプションは、現実のテキスト・ツー・イメージ生成システムに対する最初のマルチターンジェイルブレイク攻撃である。
2段階の安全フィルタと産業レベルのメモリ機構を統合したエミュレーションT2Iシステムを構築した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:34:01 GMT)
Understanding, Protecting, and Augmenting Human Cognition with Generative AI: A Synthesis of the CHI 2025 Tools for Thought Workshop [43.0] Generative AI(GenAI)は、仕事、教育、日々のタスクの自動化の範囲と能力を大幅に拡大します。
人間の認知はどのように変化し、GenAIがそれを増強する機会は何だろうか?
CHI 2025 Workshop on Tools for Thoughtは、GenAIの利用が人間の思考にどのように影響するかという新しい科学を橋渡しすることを目的としている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:40:42 GMT)
WikiAutoGen: Towards Multi-Modal Wikipedia-Style Article Generation [42.8] ウィキオートジェン(WikiAutoGen)は、ウィキペディア形式の自動記事生成システムである。
従来のアプローチとは異なり、WikiAutoGenはテキストとともに関連する画像を検索して統合し、生成されたコンテンツの深さと視覚的魅力の両方を豊かにする。
事実の精度と包括性をさらに向上するため,多視点自己回帰機構を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:56:18 GMT)
A Hybrid Artificial Intelligence Method for Estimating Flicker in Power Systems (Changes are marked) [42.8] 本稿では,Hフィルタと適応線形ニューロンネットワークを組み合わせたハイブリッドAI手法を提案する。
提案手法はHフィルタのロバスト性を利用して不確実でノイズの多い条件下で電圧エンベロープを抽出し,次にADALINEを用いてエンベロープに埋め込まれたフリック周波数を正確に同定する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:10:24 GMT)
Studying Effective String Theory using deep generative models [42.7] ESTはヤン・ミルズ理論で閉じ込めを記述するための頑健な非摂動的フレームワークを提供する。
近年の研究では、生成アルゴリズムに基づくディープラーニング技術を用いて、ESTを数値的に探索できることが示されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:56:59 GMT)
DanceGRPO: Unleashing GRPO on Visual Generation [42.6] 強化学習(Reinforcement Learning, RL)は, 微調整型生成モデルにおいて有望なアプローチである。
DDPOやDPOKのような既存の手法は、大規模で多様なプロンプトセットへのスケーリングにおいて基本的な制限に直面している。
本稿では,グループ相対政策最適化の革新的適応を通じて,これらの制約に対処するフレームワークであるDanceGRPOを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:19:45 GMT)
Tune My Adam, Please! [42.0] 本稿では,AdamのハイパーパラメータのフリーズソーBOのための新しいサロゲートモデルであるAdam-PFNを提案する。
提案手法は,タスクセット評価タスクにおける学習曲線の増大とハイパーパラメータの最適化を両立させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:08:05 GMT)
Revealing Potential Biases in LLM-Based Recommender Systems in the Cold Start Setting [42.0] 大きな言語モデル(LLM)は、汎用的な機能のため、リコメンデーションタスクにますます使われています。
ゼロコンテキストレコメンデーションにおける公平性を評価するために特別に設計されたベンチマークを導入する。
私たちのモジュールパイプラインはレコメンデーションドメインとセンシティブな属性をサポートします。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:57:13 GMT)
DANCE: Resource-Efficient Neural Architecture Search with Data-Aware and Continuous Adaptation [41.6] DANCE(Dynamic Architectures with Neural Continuous Evolution)を提案する。
DANCEでは、スムーズな適応を可能にする継続的アーキテクチャ分布、効率的なサンプリングのための学習された選択ゲートを備えた統一アーキテクチャ空間、効率的なデプロイメント最適化のためのマルチステージトレーニング戦略の3つの重要なイノベーションを紹介している。
提案手法は,検索コストを大幅に削減しつつ,精度面で最先端のNAS手法より一貫して優れている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:55:48 GMT)
GCAV: A Global Concept Activation Vector Framework for Cross-Layer Consistency in Interpretability [41.6] 概念活性化ベクトル(CAV)は、人間の定義した概念に対する感度を定量化することによって、ディープニューラルネットワークを解釈するための強力なアプローチを提供する。
異なる層で独立に計算されると、CAVは不整合を示すことが多く、層間比較は信頼性が低い。
我々は,CAVを単一の意味的に一貫した表現に統一する新しいフレームワークであるGlobal Concept Activation Vector (GCAV)を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:29:05 GMT)
TrInk: Ink Generation with Transformer Network [41.6] TrInkは、グローバルな依存関係をキャプチャする、Transformerベースのインク生成モデルである。
クロスアテンションモジュールにスケールした位置埋め込みとガウス記憶マスクを導入する。
実験の結果,文字誤り率(CER)は35.56%,単語誤り率(WER)は29.66%低下した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:44:15 GMT)
BridgeShield: Enhancing Security for Cross-chain Bridge Applications via Heterogeneous Graph Mining [41.3] ブロックチェーンの相互運用性を実現する上で、ブロックチェーンブリッジは重要な役割を果たす。
本質的に設計上の欠陥と、それらが持つ膨大な価値のため、ハッカー攻撃の標的となっている。
既存の検出方法は、主に単一チェーンの振る舞いに対処し、クロスチェーンのセマンティクスをキャプチャできない。
我々はBridgeShieldを提案する。BridgeShieldは、ソースチェーン、オフチェーンコーディネーション、デスティネーションチェーンを統一グラフ表現内で共同でモデル化するフレームワークである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:59:20 GMT)
Are formal and functional linguistic mechanisms dissociated in language models? [40.9] 大きな言語モデル(LLM)は、流動的で文法的なテキストを生成するのに優れるが、機能的な言語的タスクには耐え難い。
最近の研究は、形式的および機能的な言語的タスクを成功させるために、LLMはそれぞれ異なるメカニズムを使うべきであることを示唆している。
形式的タスクと機能的タスクの回路間の重なりは実際にほとんどないが、形式的言語的タスク間の重なりもほとんどない。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:20:39 GMT)
A Self-Supervised Mixture-of-Experts Framework for Multi-behavior Recommendation [40.8] 本稿では,eコマースのための新しいマルチビヘイビアレコメンデータシステムを提案する。
エキスパートがそれぞれ2つのアイテムタイプを推奨するように設計されている。
最高成績は65.46%で、Hit Ratio@20は最高成績である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:05:32 GMT)
SeqVLM: Proposal-Guided Multi-View Sequences Reasoning via VLM for Zero-Shot 3D Visual Grounding [40.6] 3Dビジュアルグラウンド(3DVG)は、自然言語による3Dシーンのオブジェクトのローカライズを目的としている。
対象物推論のための空間情報を備えた多視点実写シーン画像を利用する新しいゼロショット3DVGフレームワークであるSeqVLMを提案する。
ScanRefer と Nr3D のベンチマーク実験では、従来のゼロショット法を4.0%、Nr3D で5.2%上回った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:15:37 GMT)
Probing Pre-Trained Language Models for Cross-Cultural Differences in Values [40.0] 我々は、事前学習言語モデルにどの文化にわたってどの価値が埋め込まれているかを調査するためにプローブを導入する。
PTLMは文化全体における価値の差異を捉えているが、確立した価値調査と弱く一致しているだけである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:30:05 GMT)
Joint Enhancement of Relational Reasoning for Long-Context LLMs [39.7] 大規模言語モデル(LLM)は、メモリ制限と、複雑で長いコンテキストのタスクに対処できないため、長いコンテキストに苦しむ。
グラフベースの推論による長文理解を強化するための新しいフレームワークである textbfJERR を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:54:47 GMT)
CogNav: Cognitive Process Modeling for Object Goal Navigation with LLMs [39.7] オブジェクトゴールナビゲーション(Object goal navigation、ObjectNav)は、AIの具体化における基本的なタスクであり、エージェントが以前目に見えない環境でターゲットオブジェクトを見つける必要がある。
大規模言語モデルを用いた認知過程の模倣を目的としたフレームワークであるCogNavを提案する。
CogNavは、少なくとも最先端技術に比べて、ObjectNavの成功率を14%向上させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:36:42 GMT)
R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce Learning [38.7] 実験の結果,R-4Bは25の挑戦ベンチマークで最先端の性能を達成できた。
Kimi-VL-A3B-Thinking-2506 (16B) のような大規模モデルに匹敵する性能を実現している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:48:19 GMT)
Bitune: Leveraging Bidirectional Attention to Improve Decoder-Only LLMs [38.6] Bituneは、双方向の注意をプロンプト処理に組み込むことで、事前訓練されたデコーダのみのLLMを強化する方法である。
我々はBituneを命令チューニングおよび質問応答設定で評価し、常識推論、算術、言語理解タスクにおいて大幅な改善を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:59:31 GMT)
Describe, Don't Dictate: Semantic Image Editing with Natural Language Intent [38.6] そこで我々は,DescriptiveEditという記述型プロンプトベースの編集フレームワークを提案する。
中心となる考え方は「参照画像に基づくテキスト・ツー・イメージ生成」としての命令ベースの画像編集を再構築することである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:45:08 GMT)
Language-to-Space Programming for Training-Free 3D Visual Grounding [38.4] 言語間空間プログラミング(Language-to-Space Programming, LaSP)は、3Dビジュアルグラウンドティングのためのトレーニング不要な手法である。
LaSPはNr3Dベンチマークで52.9%の精度を達成し、最高のトレーニングフリーメソッドの1つである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:57:55 GMT)
Decentralized Domain Generalization with Style Sharing: Formal Model and Convergence Analysis [38.2] スタイル共有による分散フェデレーションドメイン一般化(textitStyleDDG$)
我々は、ピアツーピアネットワーク内のデバイスが、データセットから推論されたスタイル情報を共有することによって、DGを実現する分散DGアルゴリズムを開発した。
我々は、分散ネットワークにおけるスタイルベースのDGトレーニングを解析するための、最初の体系的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:32:01 GMT)
Beyond Prediction: Reinforcement Learning as the Defining Leap in Healthcare AI [38.1] 強化学習(Reinforcement Learning, RL)は、医療における人工知能の適用方法の根本的な変化である。
単に結果を予測するのではなく、RLは長期的な目標で介入を積極的に決定する。
本稿では、臨床環境におけるエージェントインテリジェンスへのシフトではなく、一連のツールとして、RLのヘルスケアの台頭について検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:05:24 GMT)
ExPath: Targeted Pathway Inference for Biological Knowledge Bases via Graph Learning and Explanation [37.7] 本稿では,生物データベースの様々なグラフ(バイオネットワーク)を分類するために,実験データを明示的に統合した新しいサブグラフ推論フレームワークであるExPAthを提案する。
我々のフレームワークは、生物学的基盤モデルをシームレスに統合し、実験分子データをエンコードすることができる。
301のバイオネットワーク評価を含む実験では、ExPathによって推論される経路が生物学的に意味があることが示されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:16:43 GMT)
Enhancing Mamba Decoder with Bidirectional Interaction in Multi-Task Dense Prediction [37.6] マルチタスクの密接な予測の成功には、クロスタスクの相互作用が不可欠である。
既存の手法は相互作用の完全性と計算効率のトレードオフに直面している。
本研究は, 新規な走査機構を組み込んだ双方向インタラクション・マンバを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:50:19 GMT)
Cavity Control of Topological Qubits: Fusion Rule, Anyon Braiding, and Majorana-Schrödinger Cat States [36.9] 局所電磁空洞とトポロジカル・キタエフ・チェーン(KC)のセグメントとの結合効果について検討する。
空間選択的超強KC空洞結合によって実現された非自明な核融合規則の証明とブレイディング操作,非アベリア正弦波のホールマークシグネチャを提供する。
我々の発見は、局所的な光-物質相互作用を通してトポロジカル量子物質を操作する新しいアプローチを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:13:36 GMT)
Efficient Large-Scale Cross-Domain Sequential Recommendation with Dynamic State Representations [36.4] 本稿では、ドメイン間の注意を2つの革新的なメカニズムに置き換えることで、スケーラブルなマルチドメインレコメンデーションシステムのための新しいアプローチを提案する。
まず,ドメイン遷移固有情報を考慮した新しい位置埋め込みを提案する。
第二に、各ドメインの動的状態表現を導入し、その後のトークン予測中に保存およびアクセスする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:05:42 GMT)
Pixel Motion as Universal Representation for Robot Control [36.1] LangToMoは、ピクセルの動き予測を中間表現として使用するビジョンキャプチャーアクションフレームワークである。
システム1は、モーション・ツー・アクションマッピング機能を通じて、ピクセルの動きをロボット動作に変換する。
システム2は、疎時間間隔で適用される高レベルポリシーとして機能し、システム1は密時間間隔で低レベルポリシーとして機能する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:58:02 GMT)
FFHFlow: Diverse and Uncertainty-Aware Dexterous Grasp Generation via Flow Variational Inference [36.0] 本稿では,多種多様な頑健なマルチフィンガーグリップを生成するフローベース変分フレームワークFFHFlowを提案する。
流れの可逆性と正確な確率を利用して、FFHFlowは部分的な観測において不確実性を形成する。
また,不確実性を考慮したランキング戦略を定式化することにより,識別的把握評価器をフロー可能性と統合する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:44:25 GMT)
AWorld: Orchestrating the Training Recipe for Agentic AI [35.9] 本稿では,大規模エージェント-環境相互作用のためのオープンソースシステムであるAWorldを紹介する。
タスクをクラスタに分散することで、AWorldは通常の単一ノードのシーケンシャル実行と比較して、エクスペリエンスコレクションを14.6倍高速化する。
我々はQwen3-32Bをベースとしたエージェントをトレーニングし、GAIA全体の精度を21.59%から32.23%に向上させた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:04:30 GMT)
Blind Spot Navigation in Large Language Model Reasoning with Thought Space Explorer [35.9] 大型言語モデル(LLM)のための思考構造の拡張と最適化を行うため、Thought Space Explorer' (TSE)を導入した。
元の思考構造に基づいて新たな推論ステップと分岐を生成することにより、TSEは思考探索の視点を広げ、LSM推論における盲点の影響を軽減する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:51:08 GMT)
LLMs Can't Handle Peer Pressure: Crumbling under Multi-Agent Social Interactions [35.7] 大規模言語モデル(LLM)は、コラボレーションインテリジェンスのコンポーネントとして、マルチエージェントシステムにますます多くデプロイされている。
LLMが過去の印象からの信頼をいかに形成し、誤報に抵抗し、相互作用中にピアインプットを統合するかを検討する。
KAIROSは、クイズコンテストをシミュレーションするベンチマークで、信頼性の異なるピアエージェントを提示する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:18:04 GMT)
From Promise to Practical Reality: Transforming Diffusion MRI Analysis with Fast Deep Learning Enhancement [35.4] FastFOD-Netは、FODを優れたパフォーマンスで強化し、臨床使用のためのトレーニング/推論効率を提供するエンドツーエンドのディープラーニングフレームワークである。
この研究は、拡散MRIの強化のための深層学習に基づく手法を、より広く採用し、臨床信頼を構築することを促進する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:44:54 GMT)
GUARD: Guideline Upholding Test through Adaptive Role-play and Jailbreak Diagnostics for LLMs [35.4] GUARD(textbfGuideline textbfUpholding Test through textbfAdaptive textbfRole-play and Jailbreak textbfDiagnostics)は、ガイドラインを特定のガイドライン違反の質問に運用するために設計されたテスト手法である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:07:10 GMT)
Ranked Set Sampling-Based Multilayer Perceptron: Improving Generalization via Variance-Based Bounds [35.0] 我々は,経験的損失の分散が学習モデルの能力に与える影響を明らかにするために,新たな一般化誤差境界を確立する。
この学習境界にインスパイアされた我々は、経験的損失の分散を減らし、一般化の能力を高めることを提唱する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:37:10 GMT)
L2RW+: A Comprehensive Benchmark Towards Privacy-Preserved Visible-Infrared Person Re-Identification [34.8] 実世界のアプリケーションにVI-ReIDを近づけるベンチマークであるL2RW+を提案する。
プライバシーの感度の異なるプロトコルとそれに対応するアルゴリズムを設計する。
実験は、画像レベルと映像レベルの両方において、分散化されたVI-ReIDトレーニングの実現可能性と可能性を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:32:17 GMT)
Surfel-based 3D Registration with Equivariant SE(3) Features [34.8] ポイントクラウドの登録は、リモートセンシングやデジタル遺産のための3D再構成において、複数のローカルポイントクラウドの3D整合性を確保するために不可欠である。
本稿では,これらの問題に対処するための新しいサーベイルベースのポーズ学習回帰手法を提案する。
本手法は,仮想視点カメラパラメータを用いてLidar点雲からサーベイルを初期化し,明示的な$mathbfSE(3)$等変特徴を学習する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:53:44 GMT)
Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning [34.8] 生成された画像を評価する現在の方法は、ハッキングに報奨を与える可能性がある。
Pref-GRPOを提案する。これは、最適化目標をスコアから好みのフィッティングにシフトさせ、より安定したトレーニングを確実にする。
既存のT2Iベンチマークは粗い評価基準によって制限されており、包括的なモデル評価を妨げる。
We introduced UniGenBench, a unified T2I benchmark including 600 prompts across 5 mainmes and 20 subthemes。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:11:24 GMT)
CoFormer: Collaborating with Heterogeneous Edge Devices for Scalable Transformer Inference [34.7] CoFormerは一般的なトランスモデルの協調推論システムである。
CoFormerはエッジデバイス上で16億のパラメータを持つGPT2-XLの効率的な推論を可能にし、メモリ要求を76.3%削減した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:50:12 GMT)
RadGS-Reg: Registering Spine CT with Biplanar X-rays via Joint 3D Radiative Gaussians Reconstruction and 3D/3D Registration [34.6] RadGS-Regは, 3D-Gaussian (RadGS) 再建と3D/3Dレジストレーションによる脊椎レベルCT/X線レジストレーションのための新しいフレームワークである。
具体的には,両平面X線脊椎RandGS再構成モジュールを用いて,CAL(Counterfactual Attention Learning)機構を用いた学習に基づくRadGS再構成手法を探索する。
社内データセットの実験では、既存のメソッドを越えながら、両方のタスクの最先端のパフォーマンスが実証されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:40:13 GMT)
LeMat-Traj: A Scalable and Unified Dataset of Materials Trajectories for Atomistic Modeling [34.3] 大規模リポジトリから集約された1億2000万以上の原子構成からなるキュレートデータセットであるLeMat-Trajを紹介した。
LeMat-Trajはデータ表現を標準化し、結果とフィルタを調和させ、広く使われているDFT機能にまたがる高品質な構成を実現する。
LeMaterial-Fetcherは、新しいデータソースを容易に組み込むために、コミュニティに再現可能なフレームワークを提供するために設計された、モジュラーでオープンソースのライブラリである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:06:32 GMT)
Fact or Facsimile? Evaluating the Factual Robustness of Modern Retrievers [34.3] デンスレトリバーとリランカーは、検索強化世代(RAG)パイプラインの中心である。
我々は,これらのコンポーネントがベースとする大規模言語モデル(LLM)をどの程度の事実的能力で継承するか,あるいは失うかを評価する。
全ての埋め込みモデルにおいて、クエリと正しい完了の間のコサイン類似度スコアは、間違ったものよりも著しく高い。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:13:51 GMT)
Learning to Generate Unit Test via Adversarial Reinforcement Learning [33.8] 単体テストはプログラミングにおける中核的な実践であり、人間の開発者や大規模言語モデル(LLM)によるプログラムの体系的な評価を可能にする。
プログラム命令を与えられた高品質な単体テストを生成するためにLLMを訓練する新しい強化学習フレームワークであるUTRLを提案する。
実験では, UTRLを用いてトレーニングしたQwen3-4Bが生成した単体テストが, 教師付き微調整によりトレーニングした同一モデルで生成した単体テストと比較して高い品質を示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:32:44 GMT)
Entropy-Memorization Law: Evaluating Memorization Difficulty of Data in LLMs [33.7] LLM(Large Language Models)は、トレーニングデータの一部を記憶することが知られており、適切な指示を下すと、時には冗長な内容が再現される。
本稿では,データエントロピーが記憶スコアと線形に相関していることを示すエントロピー記憶法を提案する。
エントロピー記憶法(Entropy-Memorization Law)の発見と同じ戦略を採用することで、トレーニングとテストデータの区別をシンプルかつ効果的に行うことができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:54:27 GMT)
Evaluating Differentially Private Generation of Domain-Specific Text [33.7] 差分プライバシー保証の下で生成されたテキストデータセットの有用性と忠実度を体系的に評価するための統一ベンチマークを導入する。
ドメイン固有の5つのデータセットにまたがって、最先端のプライバシ保存手法を評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:57:47 GMT)
Video-MTR: Reinforced Multi-Turn Reasoning for Long Video Understanding [33.6] Video-MTRは、反復的なキーセグメントの選択と質問理解を可能にするために設計された強化されたマルチターン推論フレームワークである。
単一のターンで予測を生成する従来のビデオ推論パイプラインとは異なり、Video-MTRは複数のターンで推論を実行する。
中間推論プロセスを保証するため,新たな二段階報酬システムを導入する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:55:08 GMT)
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction [33.3] 我々は、オープンエンドの現実世界のタスクを緩やかに抽象化した、最小限のアルゴリズムタスクスイートを設計する。
私たちの仕事は、オープンエンドのクリエイティブスキルを分析するために、原則として最小限のテストベッドを提供します。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:09:57 GMT)
Continuously Steering LLMs Sensitivity to Contextual Knowledge with Proxy Models [33.0] CSKS(Continuously Steering Knowledge Sensitivity)は、大規模言語モデルの文脈的知識に対する感受性を、軽量で継続的に評価するフレームワークである。
本研究では,LLMの文脈的知識に対する感度を連続的かつ高精度に制御し,感度の向上と感度の低減を実現していることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:00:55 GMT)
See then Tell: Enhancing Key Information Extraction with Vision Grounding [32.4] STNet(See then Tell Net)は、視覚基盤の正確な答えを提供するために設計された、新しいエンドツーエンドモデルである。
モデルの可視性を高めるため、広範囲に構造化されたテーブル認識データセットを収集する。
提案手法は,KIE性能の大幅な向上を実証し,公開データセットの最先端化を実現している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:02:53 GMT)
ArtFace: Towards Historical Portrait Face Identification via Model Adaptation [32.4] 歴史画におけるシッターの特定は、美術史家にとって重要な課題である。
伝統的な顔認識モデルは、ドメインシフトと高いクラス内変動のために絵画に苦しむ。
本研究では,美術品における顔認識向上のための基礎モデルの可能性について検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:19:06 GMT)
Spectral tuning and nanoscale localization of single color centers in silicon via controllable strain [31.5] 大規模な統合では、各エミッタの光遷移を正確に制御し、量子ネットワークのために区別できない光子を生成する必要がある。
ここでは、懸濁シリコン導波路とマイクロエレクトロメカニカル(MEMS)カンチレバーを組み合わせた、ファブリファブリケートフォトニック集積回路(PIC)を実証する。
カンチレバーと基板の間に最大35Vを印加すると、100 pmを超えるゼロフォノン線の可逆波長シフトが生じる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:04:14 GMT)
Governable AI: Provable Safety Under Extreme Threat Models [31.4] 我々は、従来の内部制約から外部に強制された構造コンプライアンスに移行するGAI(Governable AI)フレームワークを提案する。
GAIフレームワークは、シンプルで信頼性が高く、完全に決定論的で、強力で、柔軟性があり、汎用的なルール執行モジュール(REM)、ガバナンスルール、AIによる妥協やサブバージョンに対するエンドツーエンドの保護を提供する、統制可能なセキュアなスーパープラットフォーム(GSSP)で構成されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:22:59 GMT)
FROG: Fair Removal on Graphs [31.3] 本稿では,グラフ構造とモデルの両方を協調的に最適化し,公平な未学習を実現する新しいフレームワークを提案する。
本手法は,対象のエッジ拡張による公平性を維持しつつ,忘れることを妨げる冗長なエッジを除去し,グラフを再構成する。
実世界のデータセットに対する実験により、我々のアプローチは既存のベースラインよりも効果的で公平なアンラーニングを実現していることが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:13:37 GMT)
MTS-Net: Dual-Enhanced Positional Multi-Head Self-Attention for 3D CT Diagnosis of May-Thurner Syndrome [31.0] May-Thurner syndrome (MTS) は、人口の20%以上に影響し、腸大腿深部静脈血栓症のリスクを著しく高める血管疾患である。
CT (Computed Tomography) を用いたMTSの正確な早期診断は, 微妙な解剖学的圧迫と患者間の変動が原因で, 臨床上の課題である。
我々は,CTボリュームから空間時間パターンを抽出し,MTS診断の信頼性を高めるために,エンドツーエンドの3次元ディープラーニングフレームワークであるMTS-Netを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:29:29 GMT)
UTA-Sign: Unsupervised Thermal Video Augmentation via Event-Assisted Traffic Signage Sketching [30.8] 本稿では,低照度環境におけるトラヒックシグナージのためのunsupervised thermal-event video augmentationであるUTA-Signを提案する。
我々は,時間とともに一貫したシグネージ表現のために,熱フレームとイベント信号を融合する二重ブースティング機構を開発した。
提案手法は実世界のシナリオから収集したデータセット上で検証される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:32:51 GMT)
Observation of Inelastic Meson Scattering in a Floquet System using a Digital Quantum Simulator [30.7] 超伝導量子プロセッサを用いた中間子散乱実験を行った。
単一キンクのブロッホ振動と隣り合うキンクの強い結合,シグナリング閉じ込め,安定中間子の形成を観察する。
本研究は,デジタル量子シミュレータ上での相互作用粒子および複合励起の研究方法である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:16:39 GMT)
SEAL: Structure and Element Aware Learning to Improve Long Structured Document Retrieval [30.7] 現在の手法では、構造的特徴や要素レベルのセマンティクスを効果的に活用できない。
我々は,新しいコントラスト学習フレームワークを提案する。
構造認識学習を活用して、セマンティック階層とマスクされた要素アライメントを保存し、きめ細かいセマンティック識別を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:34:42 GMT)
OLMoASR: Open Models and Data for Training Robust Speech Recognition Models [30.6] 本稿では、大規模データセットOLMoASR-Poolと一連のモデルOLMoASRを提案し、ロバストなゼロショット音声認識モデルの研究と開発を行う。
私たちのキュレーションパイプラインは、OLMoASR-Mixと呼ばれる高品質なオーディオ書き起こしペアを100万時間生成します。
OLMoASRは、ショートおよびロングフォーム音声認識ベンチマークにおいて、OpenAIのWhisperに匹敵する平均性能を達成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:00:51 GMT)
MERIT: Maximum-normalized Element-wise Ratio for Language Model Large-batch Training [30.5] 大規模バッチトレーニングは、ディープニューラルネットワークのトレーニングを加速する上での基礎となっている。
本研究は,大規模バッチトレーニングにおいて,最大注意ロジットと細粒度信頼率を考慮することの重要性を強調した。
トレーニングの安定性を向上し、より大きなバッチ使用の道を開くことで、大規模言語モデルの迅速な開発とイテレーションを可能にします。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:14:23 GMT)
Escaping Plato's Cave: JAM for Aligning Independently Trained Vision and Language Models [30.1] 本稿では,JAM(Joint Autoencoder Modulator)が独立に訓練された表現のアライメントを誘導することを示す。
本研究は, 共通意味論の構造に関する理論的知見と, 一般論的な一助的基礎を専門的マルチモーダルモデルに変換するための実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:29:38 GMT)
Unleashing Uncertainty: Efficient Machine Unlearning for Generative AI [29.8] 拡散モデルにおける機械アンラーニングの新しい手法であるSAFEMaxを紹介する。
以上の結果から,SAFEMaxの有効性を実証し,最先端手法よりも高い効率性を示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:29:21 GMT)
T-Stars-Poster: A Framework for Product-Centric Advertising Image Design [29.7] 本稿では,T-Stars-Posterという,広告画像デザインのための新しい製品中心のフレームワークを提案する。
プロダクトフォアグラウンドとタグラインをハイライトする4つのステージで構成され、全体像の美学を達成している。
T-Stars-Posterをサポートするために、50,000以上のラベル付き画像を持つ2つの対応するデータセットを作成します。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:41:16 GMT)
EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot Control [29.5] EO-RoboticsはEO-1モデルとEO-Data1.5Mデータセットで構成されている。
EO-1の開発は、(i)マルチモーダル入力を無差別に処理する統一アーキテクチャという、2つの重要な柱に基づいている。
EO-1は、EO-Data1.5M上の自己回帰復号とフローマッチングの相乗効果によって訓練される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:26:15 GMT)
Forewarned is Forearmed: Pre-Synthesizing Jailbreak-like Instructions to Enhance LLM Safety Guardrail to Potential Attacks [29.5] 新しい攻撃は、大きな言語モデルが目に見えない悪意のある命令を認識できないことを露呈する。
組込み空間分布解析を利用してジェイルブレイクのような命令を生成する合成フレームワークIMAGINEを提案する。
Qwen2.5, Llama3.1, Llama3.2の攻撃成功率は, 有効性を損なうことなく著しく低下した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:02:52 GMT)
ProactiveEval: A Unified Evaluation Framework for Proactive Dialogue Agents [29.0] 大規模言語モデル(LLM)のプロアクティブ対話機能を評価する統合フレームワークであるProactiveEvalを提案する。
このフレームワークは,プロアクティブな対話をターゲット計画と対話指導に分解し,様々な領域で評価指標を確立する。
我々は,DeepSeek-R1とClaude-3.7-Sonnetが,目標計画および対話指導タスクに優れた性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:26:44 GMT)
Graph-Based Feature Augmentation for Predictive Tasks on Relational Datasets [28.9] 本稿では,エンドツーエンドの自動機能拡張フレームワークReCoGNNを提案する。
予測タスクをサポートするために、複数のリレーショナルテーブルから抽出された機能を使用して、初期データセットを拡張する。
ReCoGNNは、分類タスクと回帰タスクの両方において、既存のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:44:04 GMT)
MSMVD: Exploiting Multi-scale Image Features via Multi-scale BEV Features for Multi-view Pedestrian Detection [28.8] 多視点歩行者検出(Multi-View Pedestrian Detection、MVPD)は、多視点画像から鳥の目視(BEV)の形をした歩行者を検出することを目的としている。
マルチスケールマルチビュー検出(MSMVD)と呼ばれる新しいMVPD法を提案する。
MSMVDは、個々のビューから抽出したマルチスケール画像特徴をBEV空間に投影することにより、マルチスケールのBEV特徴を生成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:52:58 GMT)
Towards Mitigating Excessive Forgetting in LLM Unlearning via Entanglement-Aware Unlearning with Proxy Constraint [28.3] 大規模言語モデル(LLM)は、プライベートまたは著作権のあるコンテンツを含む可能性のある巨大なデータセットに基づいて訓練される。
プライバシとオーナシップの懸念が高まっているため、データ所有者は、トレーニングされたモデルからデータを削除することを要求できる。
既存のほとんどの方法には音を忘れる境界がないため、一部のサンプルは忘れられてしまう。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:45:40 GMT)
Multilingual Contextualization of Large Language Models for Document-Level Machine Translation [28.1] 大規模言語モデル (LLM) は文レベルの機械翻訳において高い性能を示している。
高品質な文書レベルのデータを対象とした微調整により,LLMに基づく長期文書翻訳を改善する手法を提案する。
提案手法は,文書から文書への直接翻訳やチャンクレベルの翻訳など,複数の翻訳パラダイムをサポートする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:32:15 GMT)
Bridging Compositional and Distributional Semantics: A Survey on Latent Semantic Geometry via AutoEncoder [27.7] このサーベイは、合成意味論のレンズを通して、潜在空間幾何学に関する新しい視点を提供する。
本稿では、Vector Quantized VAE(VQVAE)、Sparse AutoEncoder(SAE)の3つの主流オートエンコーダアーキテクチャをレビューし、比較する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:46:16 GMT)
ADAGE: Active Defenses Against GNN Extraction [27.5] 我々は、GNN抽出(ADAGE)に対する第1次、第1次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第
ADAGEは、モデルの全機能を盗むには、その振る舞いを漏らすために非常に多様なクエリが必要であるという観察に基づいている。
当社の防衛は、このクエリの多様性を監視し、蓄積されたリークが増加するにつれて、徐々に変化するアウトプットを監視します。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:25:28 GMT)
Turning Tabular Foundation Models into Graph Foundation Models [27.5] 本稿では,TabPFNv2をバックボーンとする単純なグラフ基盤モデルを提案する。
G2T-FMは、元のノード機能を近隣の特徴集約で強化し、構造的な埋め込みを追加し、構築されたノード表現にTabPFNv2を適用する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:36:37 GMT)
Task Allocation for Autonomous Machines using Computational Intelligence and Deep Reinforcement Learning [27.3] 計算知能(CI)と深層強化学習(RL)を用いたタスク割当手法に着目する。
近年の深部RLの発展は、自律機械の制御と調整に関する文献に大きく貢献している。
本論文は,自律型機械に関する機械学習研究の進展を包括的に概観する上で,研究者や技術者に提供することを目的としている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:48:55 GMT)
SpecVLM: Enhancing Speculative Decoding of Video LLMs via Verifier-Guided Token Pruning [27.0] 本稿では,Vid-LLM向けに設計されたトレーニング不要な投機的復号化フレームワークSpecVLMを紹介する。
SpecVLMは、精度を犠牲にすることなく効率的な投機を可能にするために、最大90%のビデオトークンを作成できる。
LLaVA-OneVision-72Bの2.68$times$デコードスピードアップとQwen2.5-VL-32Bの2.11$times$スピードアップを実現している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:44:28 GMT)
Humans Perceive Wrong Narratives from AI Reasoning Texts [26.5] 新しい世代のAIモデルは、回答を生成する前にステップバイステップの推論テキストを生成する。
このテキストに対する人間の理解が実際の計算過程と一致するかどうかは不明である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:53:23 GMT)
EEGDM: Learning EEG Representation with Latent Diffusion Model [26.2] 潜在拡散モデルに基づく新しい自己教師型脳波表現学習法であるEEGDMを提案する。
EEGDMは、EEG信号を蒸留するEEGエンコーダと、そのチャネル拡張をコンパクトな表現に組み込む。
実験結果から,EEGDMは高品質な脳波信号を再構成し,ロバストな表現を効果的に学習し,適度な事前学習データサイズで競合性能を得ることができた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:23:28 GMT)
Memorization in Graph Neural Networks [25.5] NCMemoは、半教師付きノード分類においてラベル記憶を定量化する最初のフレームワークである。
ホモフィリーが低いことは記憶を著しく増加させ、GNNが記憶に頼ってホモフィリックグラフを学習することを示唆している。
グラフのホモフィリーと記憶の関連性に関する洞察に基づいて,記憶の緩和手段としてのグラフのリウィリングについて検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:24:43 GMT)
Transformers Meet In-Context Learning: A Universal Approximation Theory [25.5] 我々は、変換器が文脈内学習を実現する方法を理解するために、普遍近似理論を開発する。
関数の一般的なクラスに対して、いくつかのノイズの多いインコンテキストの例に基づいて予測できる変換器を構築する方法を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:07:16 GMT)
Federated Learning for Large Models in Medical Imaging: A Comprehensive Review [25.4] 高性能AIモデルは一般的に、大規模な集中型データセットのトレーニングを必要とする。
これらの制限は、医療領域における大規模なモデルの開発を妨げる。
Federated Learningは、断片化された医療データセット間で協調的なモデル開発を可能にすることで、新しいソリューションを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:31:41 GMT)
Query Optimization for Parametric Knowledge Refinement in Retrieval-Augmented Large Language Models [25.4] Extract-Refine-Retrieve-Read (ERRR)フレームワークは、Retrieval-Augmented Generation (RAG)システムにおける事前検索情報ギャップを埋めるように設計されている。
RAGで使用される従来のクエリ最適化手法とは異なり、ERRRフレームワークはLarge Language Models (LLM) から知識を抽出することから始まる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:14:25 GMT)
Uncovering the Spectral Bias in Diagonal State Space Models [25.2] 対角的な代替手段は、カーネルの単純化により、非常に効率的でありながら、同様のレベルの性能に達することが示されている。
我々の研究は、これらのモデルをパラメータ化する方法を体系的に理解し、このような対角状態空間モデルに固有の学習バイアスを明らかにすることを目指している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:39:04 GMT)
Token Buncher: Shielding LLMs from Harmful Reinforcement Learning Fine-Tuning [25.2] 強化学習により、敵はより効果的に安全アライメントを破り、高度な有害なタスク支援を促進することができる。
本稿では,RLをベースとした有害な微調整を対象とする最初の効果的な防御法であるTokenBuncherを提案する。
本稿では,TokenBuncherが有害なRL微調整を効果的に軽減し,良質なタスクユーティリティと微調整性を保っていることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:07:11 GMT)
VRPRM: Process Reward Modeling via Visual Reasoning [25.0] 視覚的推論によるプロセス報酬モデルであるVRPRMを提案し、効率的な2段階トレーニング戦略を設計する。
わずか3.6KのCoT-PRM SFTデータと50Kの非CoT PRM RLトレーニングデータを使用すると、VRPRMは総データ量400Kの非考えのPRMを超えることができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:17:35 GMT)
A Highly Clean Recipe Dataset with Ingredient States Annotation for State Probing Task [25.0] 本稿では,調理過程における中間成分状態の認識方法を評価するための新しいタスクとデータセットを提案する。
まず, 成分状態変化の明確かつ正確なアノテーションを用いた新しいレシピデータセットを構築した。
このデータセットを用いて,LLMが成分状態遷移を追跡し,中間段階に存在する成分を識別できるかどうかを評価する3つの新しいタスクを設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:15:18 GMT)
AvatarBack: Back-Head Generation for Complete 3D Avatars from Front-View Images [24.9] AvatarBackは、完全で一貫性のある3Dガウスアバターを再構成するように設計された、新しいプラグイン・アンド・プレイフレームワークである。
AvatarBackは,前頭骨の忠実度を維持しつつ,背頭再建の質を著しく向上させることを示す。
再建されたアバターは多様な動きの下で一貫した視覚的リアリズムを維持し、完全にアニマタブルである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:15:38 GMT)
STARE at the Structure: Steering ICL Exemplar Selection with Structural Alignment [24.8] 本稿では,効率,一般化性,性能のバランスを保った2段階の模範選択戦略を提案する。
まず、BERTベースのレトリバーを構造意識の監視を用いて微調整し、意味論的に関連性があり構造的に整合した模範を選定する。
次に,隠れ表現において構文的に意味のある情報を増幅するプラグインモジュールを用いて,検索機能を強化した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:04:39 GMT)
MCP-Bench: Benchmarking Tool-Using LLM Agents with Complex Real-World Tasks via MCP Servers [24.7] MCP-Benchは、大規模言語モデル(LLM)を現実的なマルチステップタスクで評価するためのベンチマークである。
MCP-Bench は Model Context Protocol (MCP) 上に構築されており、金融、旅行、科学計算、学術検索などの分野にまたがる250のツールにまたがる28のライブ MCP サーバに LLM を接続している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:58:57 GMT)
GLProtein: Global-and-Local Structure Aware Protein Representation Learning [24.6] タンパク質の構造情報は3D情報に限らず、アミノ酸分子(局所情報)からタンパク質-タンパク質構造類似性(グローバル情報)までも含んでいると論じる。
我々は,タンパク質事前学習における最初のフレームワークである textbfGLProtein を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:38:11 GMT)
AdaptCache: KV Cache Native Storage Hierarchy for Low-Delay and High-Quality Language Model Serving [24.4] 大規模言語モデル(LLM)アプリケーションは、チャット履歴やドキュメントなど、以前処理されたコンテキストをしばしば再利用する。
既存のLLMサービスシステムは、処理されたコンテキストのKVキャッシュを格納し、新しい要求がコンテキストを再利用するときに対応するKVキャッシュをロードすることで、そのような冗長な計算に対処する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:46:51 GMT)
Owen Sampling Accelerates Contribution Estimation in Federated Learning [24.3] フェデレートラーニング(FL)は、複数のクライアントから情報を集約して、生データを公開せずに共有グローバルモデルをトレーニングする。
We propose FedOwen, a efficient framework that using Owen sample to approximate Shapley values under the total evaluation budget。
FedOwenは、非IIDベンチマークの最先端ベースラインと比較して、同じ数の通信ラウンドで最終精度を最大23%向上させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:22:37 GMT)
Dynamic Context Compression for Efficient RAG [23.8] 検索拡張生成は、長い検索コンテキストのためにかなりの推論コストを発生させる。
既存の手法では、固定圧縮率、単純なクエリの過剰圧縮、複雑なクエリのアンダー圧縮などを適用している。
本稿では,入力複雑性に基づいて動的に圧縮率を調整するフレームワークであるRAG(ACC-RAG)の適応文脈圧縮を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:42:39 GMT)
Towards Mechanistic Defenses Against Typographic Attacks in CLIP [23.7] タイポグラフィー攻撃下でのCLIP視覚エンコーダの挙動を解析する。
タイポグラフィ回路を選択的にブレイすることで,CLIPモデルに対するタイポグラフィ攻撃に対する防御手法を提案する。
タイポグラフィー攻撃に対して極めて堅牢なDyslexic CLIPモデル群をリリースする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:08:30 GMT)
Accurate myocardial T1 mapping at 5T using an improved MOLLI method: A validation study [23.7] COFIAは、ECGゲーティングとGRE読み出しを備えた5-(3)-3 MOLLIを改良した。
5Tでのインバージョンは、断熱パルス(Tan/Tanh vs HSn)を再設計することで改善された。
ピーク振幅10.6 uTでは、Tan/TanhパルスはHSnより優れ、デルタB0 = +/-250 Hzで平均デルタ = 0.9014、B1 = 225-540 kHzとなる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:55:57 GMT)
Apparatus for quantum-mixture research in microgravity [23.6] 完全一体型ロケットによるボース・アインシュタイン凝縮混合物の高流動化について報告する。
モバイルプラットフォーム上でウルトラコールドミキシングを生成するための新しいベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:17:47 GMT)
AraHealthQA 2025: The First Shared Task on Arabic Health Question Answering [23.5] 我々は,アラビア2025(EMNLP2025と同時配置)と連携して開催されている包括的アラビア健康質問回答共有タスクであるAraHealthQA2025を紹介する。
この課題は、アラビア語のメンタルヘルスのQ&A(不安、抑うつ、スティグマの減少など)に焦点を当てたメンタルQAと、内科、小児科、臨床意思決定など幅広い医療分野をカバーするMedArabiQという2つの補完的なトラックを提供することによって、高品質なアラビア語医療QAリソースの質に対処する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:48:12 GMT)
MIDAS: Multimodal Interactive Digital-humAn Synthesis via Real-time Autoregressive Video Generation [23.3] 本稿では,インタラクティブなマルチモーダル制御と低遅延外挿を可能にする自動回帰ビデオ生成フレームワークを提案する。
本フレームワークは,音声,ポーズ,テキストを含むマルチモーダルな条件符号化を受け入れ,空間的・意味的コヒーレントな表現を出力する。
これを支援するために,複数の情報源から約2万時間に及ぶ大規模対話データセットを構築した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:15:43 GMT)
FUTURE: Flexible Unlearning for Tree Ensemble [23.3] 木アンサンブルは、様々な領域で最先端のパフォーマンスを達成し、分類タスクにおける有効性で広く認識されている。
データプライバシと忘れるべきテキストライトに重点を置いているため、ツリーアンサンブルが機密情報を忘れるように、いくつかの未学習アルゴリズムが提案されている。
木アンサンブルのための新しいアンラーニングアルゴリズムであるFUTUREを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:45:36 GMT)
Can Multimodal LLMs Solve the Basic Perception Problems of Percept-V? [23.2] 本稿では、7200のプログラム生成画像を含むデータセットPercept-Vを紹介し、30のカテゴリに等しく分割する。
知覚-Vは、MLLMの知覚能力をテストする様々な複雑さの非常に基本的なタスクから構成される。
このデータセットは、GPT-4o、Gemini、Claudeのような最先端のMLLMとOpenAI o4-miniやDeepSeek R1のようなLarge Reasoning Models(LRM)でテストされ、パフォーマンスを測定する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:22:38 GMT)
OnGoal: Tracking and Visualizing Conversational Goals in Multi-Turn Dialogue with Large Language Models [23.2] 私たちは、ユーザーがゴールの進捗をよりよく管理するのに役立つLLMチャットインターフェースであるOnGoalを紹介します。
OnGoalは、LLMによる評価を通じて、ゴールアライメントに対するリアルタイムフィードバックを提供する。
OnGoalを使うことで、参加者は目標を達成するために時間と労力を減らした。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:58:29 GMT)
Transforming Wearable Data into Personal Health Insights using Large Language Model Agents [23.0] 大規模言語モデル(LLM)エージェントは、この分析を大規模に行う上で、有望だがほとんど未解決のソリューションを提供する。
我々は,多段階推論とコード生成と情報検索を利用して行動保健データを解析・解釈するシステムであるPersonal Health Insights Agent(PHIA)を紹介する。
650時間の人間専門家による評価では、PHIAは強いコード生成ベースラインを著しく上回り、客観的、数値的な質問、オープンエンドの質問に対して84%の精度を達成し、最高品質のレーティングの2倍の確率で83%の好評を得た。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:02:09 GMT)
Generative Annotation for ASR Named Entity Correction [23.0] エンドツーエンドの自動音声認識システムは、ドメイン固有の名前のエンティティの書き起こしに失敗することが多い。
そこで本研究では,音声特徴を利用した新しいNEC手法を提案する。
我々はオープンソースのテストセットと自己構築テストセットを用いてテストを行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:18:35 GMT)
Louvre: Relaxing Hardware Requirements of Quantum LDPC Codes by Routing with Expanded Quantum Instruction Set [22.9] 一般化自転車符号(GB符号)は、量子低密度パリティチェック符号の有望なファミリーを表す。
Louvreはルーティングベースのフレームワークで、GBコードのキュービット接続要求を減らすように設計されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:53:40 GMT)
DCFS: Continual Test-Time Adaptation via Dual Consistency of Feature and Sample [22.8] 連続的なテスト時間適応は、トレーニング済みのモデルを、ソースデータにアクセスすることなく、ターゲットドメインデータのストリームに継続的に適応することを目的としている。
デュアルパス特徴整合性と信頼性を考慮したサンプル学習を導入した新しいCTTAフレームワークであるDCFSを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:57:54 GMT)
Looking Beyond the Obvious: A Survey on Abstract Concept Recognition for Video Understanding [22.8] 抽象概念認識は、ビデオ理解において重要なオープンチャレンジを形成する。
基礎モデルの最近の進歩は、ビデオの抽象的な概念理解に対処するための理想的な設定である。
ビデオコンテンツにおける抽象概念を理解するために使用される様々なタスクやデータセットについて研究する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:19:49 GMT)
MPFormer: Adaptive Framework for Industrial Multi-Task Personalized Sequential Retriever [22.5] MPFormerは、産業レコメンデーションシステムのための動的マルチタスクトランスフォーマーフレームワークである。
Kuaishouのショートビデオレコメンデーションシステムにうまく統合され、毎日4億人のアクティブユーザーが利用できる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:53:55 GMT)
Practical Physical Layer Authentication for Mobile Scenarios Using a Synthetic Dataset Enhanced Deep Learning Approach [22.2] IoT(Internet of Things)は、無線技術の開発が急速に進んでいるため、ユビキタスである。
物理認証は、ユニークなチャネル特性を活用することによって、有望なアプローチとして現れる。
モバイルシナリオを対象とした深層学習に基づく物理チャネル状態情報認証を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:56:10 GMT)
InterAct-Video: Reasoning-Rich Video QA for Urban Traffic [21.8] ディープラーニングは、質問応答(VideoQA)モデルを通じて、高度なビデオベースのトラフィック監視を実現する。
既存のVideoQAモデルは、現実世界の交通シーンの複雑さに悩まされている。
InterAct VideoQAは、トラフィック監視タスクのためのVideoQAモデルをベンチマークし、拡張するために設計された、キュレートされたデータセットである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:45:48 GMT)
How Does Cognitive Bias Affect Large Language Models? A Case Study on the Anchoring Effect in Price Negotiation Simulations [21.8] 本稿では,LLMによる価格交渉におけるアンカー効果について検討する。
実験の結果, LLMはヒトのアンカー効果に影響されていることが明らかとなった。
推論モデルはアンカー効果の傾向が低いことが示され、思考の長い連鎖が効果を緩和することを示唆した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:13:46 GMT)
Balancing Interference and Correlation in Spatial Experimental Designs: A Causal Graph Cut Approach [21.7] 本稿では,実験データから得られる情報の量を最適化するための空間実験の設計に焦点を当てる。
因果効果推定器の平均二乗誤差(MSE)に対する代理関数を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:49:03 GMT)
Graph-R1: Unleashing LLM Reasoning with NP-Hard Graph Problems [21.6] NP-hard(NPH)グラフ問題を新しい合成学習コーパスとして導入する。
われわれは,Long CoT Supervised Fine-Tuning and Reinforcement Learningという2段階のポストトレーニングフレームワークを開発した。
我々のフラッグシップモデルであるGraph-R1-7Bは、数学、コーディング、STEM、論理学にまたがる強力な一般化を実証します。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:40:27 GMT)
InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection [21.3] ソーシャルメディアでは、しばしばテキストと画像の組み合わせを通して表現されるサルカズムは、感情分析と意図的マイニングの課題を提起する。
我々は、リッチテキストイメージ表現を抽出する効率的なトレーニング戦略を備えたInterCLIP-MEPを提案する。
その結果,InterCLIP-MEPは,MMSDとMMSD2.0の精度とF1スコアの改善を達成できた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:35:48 GMT)
Characterizing Trust Boundary Vulnerabilities in TEE Containers [20.6] Trusted Execution Environments (TEEs) は、機密コンピューティングの基盤として登場した。
TEEコンテナは、アプリケーションを潜在的に悪意のあるオペレーティングシステムやオーケストレーションインターフェースから保護することを目的としている。
本稿では,既存のTEEコンテナがセキュアなアプリケーションを保護するために使用する分離戦略を分析する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:20:08 GMT)
FakeParts: a New Family of AI-Generated DeepFakes [20.6] FakePartsは、特定の空間領域や時間セグメントに微妙な局所的な操作を特徴とする新しいディープフェイクのクラスである。
FakePartsBenchは、部分的なディープフェイクの全スペクトルをキャプチャするために特別に設計された、最初の大規模ベンチマークデータセットである。
FakePartsは従来のディープフェイクと比較して、人間の検出精度を30%以上削減することを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:55:14 GMT)
Program Semantic Inequivalence Game with Large Language Models [20.4] 大きな言語モデル(LLM)は、日々のコーディングタスクにおいて強力なパフォーマンスを達成することができるが、プログラムのセマンティクスに関する非自明な推論を必要とする複雑なタスクでは失敗する可能性がある。
本研究では,意味的不等価ゲームSInQに基づいて,コード推論学習データを合成的に生成する手法について検討する。
この設定により、無限の計算資源の限界における自己再生による理論的に無制限な改善が可能であることを証明した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:38:13 GMT)
GSTBench: A Benchmark Study on the Transferability of Graph Self-Supervised Learning [20.3] 自己教師付き学習(SSL)はグラフ表現学習において大きな可能性を秘めている。
既存のほとんどのグラフSSLメソッドは単一データセット設定で開発・評価されている。
GSTBenchは,グラフSSL方式の転送可能性を評価するための最初の体系的ベンチマークである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:13:10 GMT)
BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design [20.0] BED-LLM (Bayesian Experimental Design with Large Language Models) と呼ぶ。
興味のあるタスクに関する期待情報ゲイン(EIG)を最大化する質問を反復的に選択する。
BED-LLMは,20問ゲームに基づく幅広いテストにおいて,大幅な性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:51:43 GMT)
Reusing Computation in Text-to-Image Diffusion for Efficient Generation of Image Sets [20.0] 本稿では,初期拡散段階における意味的類似性と共有性に基づいてクラスタが促進する学習自由アプローチを提案する。
提案手法は,既存のパイプラインとシームレスに統合し,プロンプトセットでスケールし,大規模テキスト・画像生成の環境・経済的負担を軽減する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:35:03 GMT)
SciTopic: Enhancing Topic Discovery in Scientific Literature through Advanced LLM [19.9] 本稿では,大規模言語モデル(LLM)によって強化された高度なトピック発見手法を提案する。
具体的には、メタデータ、タイトル、要約を含む科学出版物からコンテンツをキャプチャするテキストエンコーダを構築する。
次に,LLMによって導かれるエントロピーに基づくサンプリングと三重項タスクを統合した空間最適化モジュールを構築する。
3つの実世界のデータセットで実施された実験は、SciTopicが最先端(SOTA)の科学的トピック発見方法より優れていることを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:55:06 GMT)
Spatiotemporal EEG-Based Emotion Recognition Using SAM Ratings from Serious Games with Hybrid Deep Learning [19.5] 本稿では,GAMEEMOデータセット上に構築された多粒度脳波感情分類フレームワークを提案する。
我々のパイプラインは、時間的ウィンドウ分割、ハイブリッド統計および周波数領域特徴抽出、zスコア正規化を含む構造化前処理戦略を採用している。
我々は、LSTM、LSTM-GRU、CNN-LSTMなどの深層ニューラルネットワークとともに、ランダムフォレスト、XGBoost、SVMを含む幅広いモデルを評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:25:19 GMT)
PHD: Personalized 3D Human Body Fitting with Point Diffusion [19.3] PHDは、パーソナライズされた3Dヒューマンメッシュリカバリ(HMR)とボディーフィッティングのための新しいアプローチである。
ユーザー固有の形状情報を活用して、ビデオからのポーズ推定精度を向上させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:03:35 GMT)
TCIA: A Task-Centric Instruction Augmentation Method for Instruction Finetuning [19.1] 本稿では、多様性とタスクアライメントの両面を保ちながら、命令を体系的に拡張するフレームワークであるタスクCentric Instruction Augmentation(TCIA)を紹介する。
TCIAは4つの実世界のタスク固有のアプリケーションに対して平均8.7%のオープンソースのLLMのパフォーマンスを改善している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:42:10 GMT)
GPT-FT: An Efficient Automated Feature Transformation Using GPT for Sequence Reconstruction and Performance Enhancement [18.9] データ表現を最適化することで、機械学習モデルのパフォーマンスを向上させる上で、特徴変換は重要な役割を果たす。
最近の最先端のアプローチでは、離散探索を学習可能なプロセスに変換する、連続的な埋め込み最適化問題としてこの問題に対処している。
4つのステップで自動的な特徴変換を実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:21:08 GMT)
POSE: Phased One-Step Adversarial Equilibrium for Video Diffusion Models [18.8] POSE(Phased One-Step Equilibrium)は、大規模ビデオ拡散モデルのサンプリングステップを削減する蒸留フレームワークである。
PSEはVBench-I2V上の他の加速度法よりもセマンティックアライメント,時間的会議,フレーム品質が平均7.15%向上していることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:20:01 GMT)
OLKAVS: An Open Large-Scale Korean Audio-Visual Speech Dataset [18.7] Open Large-scale Korean Audio-Visual Speech (OLKAVS)データセットは、一般に公開されている音声視覚音声データセットの中で最大である。
データセットには、韓国語話者1,107人による1,150時間の音声書き起こしが含まれており、9つの異なる視点と様々なノイズ状況がある。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:12:29 GMT)
Enhancing Pseudo-Boxes via Data-Level LiDAR-Camera Fusion for Unsupervised 3D Object Detection [18.7] RGB画像とLiDARデータを早期に統合する新しいデータレベル融合フレームワークを提案する。
本稿では,データレベルの融合に基づく動的自己進化戦略を提案する。
nuScenesデータセットの実験では、我々の方法で訓練された検出器は、従来の最先端の手法で訓練された検出器よりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:15:23 GMT)
DentalBench: Benchmarking and Advancing LLMs Capability for Bilingual Dentistry Understanding [18.7] 歯科領域における大規模言語モデル(LLM)の評価と進歩を目的とした,最初の総合的なベンチマークであるDentureBenchを紹介する。
デンタルベンチは、4つのタスクと16の歯科サブフィールドにまたがる36,597の質問がある英語と中国語の質問回答(QA)ベンチマークであるデンタルQAと、337.35万のトークンを歯科領域適応のためにキュレートした大規模で高品質なコーパスであるデンタルコーパスの2つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:35:51 GMT)
Leveraging Semantic Triples for Private Document Generation with Local Differential Privacy Guarantees [18.5] DP-STは,局所的なDP保証の下で,近距離対応の私文書生成にセマンティック・トリプルを利用する。
本手法は,プライバシとユーティリティのバランスを保ちながら,バレプシロンの低い値でもコヒーレントなテキスト生成を可能にする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:59:01 GMT)
ODES: Domain Adaptation with Expert Guidance for Online Medical Image Segmentation [18.5] ドメイン適応セグメンテーションは、通常、ラベルなしのターゲットデータセット上で事前トレーニングされたネットワークによって予測される擬似ラベルを使用した自己学習に依存する。
バッチ内の全画像にまたがるピクセルレベルのアノテーションの取得は、オンライン学習における時間的オーバーヘッドを増大させながら、冗長な情報をもたらすことが多い。
本稿では,現在のバッチから画像の最も有用なサブセットを選択して,アクティブな学習を行う,新しい画像抽出手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:47:53 GMT)
COMETH: Convex Optimization for Multiview Estimation and Tracking of Humans [18.5] リアルタイム多視点ヒューマンポーズ融合のための軽量アルゴリズムであるCOMETHを提案する。
我々は、COMETHをパブリックデータセットと産業データセットの両方で評価し、ローカライゼーション、検出、追跡の精度において最先端の手法より優れています。
提案した融合パイプラインは、正確でスケーラブルな人間のモーショントラッキングを可能にし、産業用および安全上重要なアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:50:29 GMT)
Leadership Assessment in Pediatric Intensive Care Unit Team Training [18.4] 本稿では、自我中心のビジョンに基づく自動分析フレームワークを開発することにより、PICUチームのリーダーシップスキルを評価するタスクについて述べる。
指導力評価の重要指標として, 固定対象, アイコンタクト, 会話パターンなどの重要な行動指標を同定した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:31:31 GMT)
Pareto Actor-Critic for Communication and Computation Co-Optimization in Non-Cooperative Federated Learning Services [18.3] ゲーム理論によるマルチエージェント強化学習(MARL)フレームワークであるPAC-MCoFLを導入する。
PAC-MCoFL-p はパラメータ化予測生成器を特徴とするスケーラブルな変種であり,有界な誤差で計算複雑性を著しく低減する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:26:41 GMT)
DPImageBench: A Unified Benchmark for Differentially Private Image Synthesis [18.2] 差分プライベート(DP)画像合成は、データセット内の個々の画像のプライバシーを保護しながら、機密画像の特性を保持する人工画像を生成することを目的としている。
近年の進歩にもかかわらず、不整合かつ時には欠陥のある評価プロトコルが研究全体で適用されている。
本稿では,DP画像合成のためのDPImageBenchについて述べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:20:54 GMT)
Publish to Perish: Prompt Injection Attacks on LLM-Assisted Peer Review [17.9] 大規模言語モデル(LLM)は、科学的なピアレビュープロセスに統合されつつある。
本研究は,著者が論文のPDFに敵対的テキストを埋め込む,隠れたプロンプトインジェクション攻撃の可能性について検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:57:04 GMT)
Decoding Memories: An Efficient Pipeline for Self-Consistency Hallucination Detection [17.8] 選択的推論と復号化により生成を高速化する新しいデコードメモリパイプライン(DMP)を提案する。
提案手法は,AUROC性能を犠牲にすることなく,最大3倍の高速化を実現する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:39:53 GMT)
Provable Benefits of In-Tool Learning for Large Language Models [17.8] ツールの使用により,回路構成をシンプルかつ効率的に行うことで,事実上のリコールが可能になることを示す。
さらに、事前訓練された大規模言語モデルでは、ツール使用や一般的なルールは、事実を記憶に微調整するよりも効果的であることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:12:19 GMT)
Unraveling the Interplay between Carryover Effects and Reward Autocorrelations in Switchback Experiments [17.6] 本稿ではマルコフ環境における様々なスイッチバック設計の比較分析を行う。
その結果, 異なるスイッチバック設計の有効性は, (i) 搬送効果の大きさと (ii) 報奨誤差の自己相関に大きく依存していることが判明した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:55:44 GMT)
FusionCounting: Robust visible-infrared image fusion guided by crowd counting via multi-task learning [17.0] 多くの可視・赤外線画像融合(VIF)法は、主に融合画像の品質を最適化することに焦点を当てている。
近年, セマンティックセグメンテーションやオブジェクト検出などの下流タスクを組み込んで, VIFのセマンティックガイダンスを提供する研究が進められている。
群衆カウントをVIFプロセスに統合する新しいマルチタスク学習フレームワークFusionCountingを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:15:18 GMT)
NetGPT: Generative Pretrained Transformer for Network Traffic [16.9] ネットワークトラフィックの事前訓練モデルでは,大規模生データを用いてネットワークトラフィックの本質的特性を学習することができる。
本稿では,トラフィックの理解と生成のための生成事前学習モデルNetGPTを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:40:15 GMT)
TF-TransUNet1D: Time-Frequency Guided Transformer U-Net for Robust ECG Denoising in Digital Twin [16.7] U-NetベースのエンコーダデコーダアーキテクチャとTransformerエンコーダを統合した,新しい1次元ディープニューラルネットワークTF-TransUNet1Dを提案する。
このモデルは、局所的な形態的特徴と長距離時間的依存関係を同時に捉えるように設計されている。
高精度デノゲーションを提供することで、この作業は心臓のデジタル双生児のための前処理パイプラインにおいて重要なギャップを埋める。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:51:19 GMT)
Steering Towards Fairness: Mitigating Political Bias in LLMs [16.6] 我々は、内部モデル表現の分析を通じて、大言語モデル(LLM)におけるそのようなバイアスを探索し緩和する枠組みを採用している。
複数のイデオロギー軸にまたがる層ワイズ解析が可能な包括的活性化抽出パイプラインを導入する。
以上の結果から,デコーダのLLMは,効率的なベクターベース緩和に活用できる層間表現バイアスを体系的に符号化していることがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:07:41 GMT)
Visual Perturbation and Adaptive Hard Negative Contrastive Learning for Compositional Reasoning in Vision-Language Models [16.4] 視覚言語モデル(VLM)はマルチモーダルタスク、特に構成推論(CR)タスクに必須である。
既存の手法は主にテキストベースのハードネガティブサンプルを生成することによってモデルを微調整する。
AHNPLはテキストベースのハードネガティブを視覚領域に翻訳し、モデルをトレーニングするために意味的に乱された画像ベースのネガティブを生成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:15:35 GMT)
RelP: Faithful and Efficient Circuit Discovery via Relevance Patching [16.2] 帰属パッチの局所勾配を伝搬係数に置き換えるRelP(Relevance Patching)を導入する。
RelPは2つの前方パスと1つの後方パスしか必要とせず、忠実さを改善しながら計算効率を維持する。
我々はRelPを様々なモデルやタスクで検証し、標準属性パッチよりも正確にアクティベーションパッチを近似することを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:09:54 GMT)
VarDiU: A Variational Diffusive Upper Bound for One-Step Diffusion Distillation [16.2] 近年, 拡散蒸留法は, 1000段階の教師拡散モデルを1段階の生徒生成装置に圧縮している。
既存のアプローチのほとんどは、生徒のスコア関数を介して勾配を近似した拡散発散を用いて生徒モデルを訓練する。
本研究では, 拡散蒸留に直接適用可能な不偏勾配推定器を有する変分拡散性上界であるVarDiUを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:47:50 GMT)
LLM as an Execution Estimator: Recovering Missing Dependency for Practical Time-travelling Debugging [16.1] 本稿では,部分的インスツルメンテーションのみを用いて,動的データ依存の計算を行うRecovSlicingを提案する。
Slicer4J, ND-Slicer, LLM Slicer, re-execution Slicer などの最先端スライダに対する RecovSlicing の評価を行った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:04:37 GMT)
KCS: Diversify Multi-hop Question Generation with Knowledge Composition Sampling [15.8] マルチホップ質問応答は、データ空間の分散によって重大な課題に直面しており、言語モデルが急激なパターンになる可能性が高まる。
本稿では,生成したマルチホップ質問の多様性を拡大する革新的なフレームワークである知識構成サンプリング(KCS)を紹介する。
競合ベースラインと比較すると,知識構成選択の全体的な精度は3.9%向上し,そのデータ拡張への応用によりHotpotQAと2WikiMultihopQAデータセットの精度が向上する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:06:38 GMT)
On the Theoretical Limitations of Embedding-Based Retrieval [15.8] クエリの結果として返却可能なドキュメントの上位kサブセットの数は,埋め込みの次元によって制限されていることを示す。
次に、LIMITと呼ばれる現実的なデータセットを作成し、これらの理論結果に基づいてモデルをテストする。
我々の研究は、既存の単一ベクトルパラダイムの下での埋め込みモデルの限界を示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:43:53 GMT)
Safe-Control: A Safety Patch for Mitigating Unsafe Content in Text-to-Image Generation Models [15.7] 我々は,テキスト・ツー・イメージ(T2I)モデルにおいて,安全でないコンテンツ生成を緩和するために設計された,革新的なプラグ・アンド・プレイ安全パッチであるSafe-Controlを紹介する。
データ駆動戦略と安全を意識した条件を使用して、Safe-ControlはロックされたT2Iモデルに安全制御信号を注入し、パッチのような方法で更新する。
プラグ・アンド・プレイの設計により適応性も確保され、同様のデノナイジングアーキテクチャの他のT2Iモデルと互換性がある。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:09:52 GMT)
Gradual Domain Adaptation for Graph Learning [15.6] 本稿では,適応時の情報損失を最小限に抑えるコンパクトなドメインシーケンスを構成するグラフ段階的ドメイン適応(GGDA)フレームワークを提案する。
我々のフレームワークは、拡張可能なドメイン間ワッサースタイン距離($W_p(mu_t,mu_t+1)$)に対して実装可能な上界と下界を提供し、最適なドメイン形成のための柔軟な調整を可能にする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:01:38 GMT)
MindGuard: Tracking, Detecting, and Attributing MCP Tool Poisoning Attack via Decision Dependence Graph [15.6] 我々は、ツール実行決定のための意思決定レベルのガードレールであるMindGuardを提案する。
我々は、意思決定追跡のための経験的信号として注意を定式化する。
我々はMindGuardが平均94%-99%の精度で毒殺を検知し、95%-100%の帰属精度で処理時間を1秒以下とし、追加のトークンコストを伴わないことを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:23:44 GMT)
SUMMA: A Multimodal Large Language Model for Advertisement Summarization [15.5] 本研究では,ビデオ広告を商品価値の高いコンテンツを強調する要約に加工するモデルであるSUMMAを提案する。
SUMMAは2段階の訓練戦略-マルチモーダル指導型微調整と強化学習によって開発される。
オンライン実験は、統計的に広告収入が1.5%増加したことを示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:19:53 GMT)
Dimension Agnostic Testing of Survey Data Credibility through the Lens of Regression [15.2] 本稿では,サンプル調査の信頼性を評価するためのタスクベース手法を提案する。
具体的には、この信頼性の概念を定量化するために、モデル固有の距離メートル法を導入する。
また,回帰モデルを用いて,調査データの信頼性を検証するアルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:02:08 GMT)
Specializing General-purpose LLM Embeddings for Implicit Hate Speech Detection across Datasets [15.1] インプシット・ヘイトスピーチ(IHS)は、偏見や憎悪を微妙な手がかり、皮肉、コード化された用語で伝える間接言語である。
この課題に対処するために、タスク固有のパイプラインは、外部の知識や、コンテキスト、感情、感情データなどの追加情報と補完することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:08:57 GMT)
RLMR: Reinforcement Learning with Mixed Rewards for Creative Writing [15.1] 主観的書字品質と客観的制約のバランスをとるために,混合報酬を用いた強化学習を提案する。
8Bから72Bパラメータの多種多様なモデルファミリーを対象とした自動的および手動評価を行った。
結果より,本手法は命令追従(IFEvalの83.36%から86.65%)と書字品質(WriteEvalのマニュアル専門家による相互評価における72.75%の勝利率)の両面で一貫した改善を実現していることが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:59:07 GMT)
Dino U-Net: Exploiting High-Fidelity Dense Features from Foundation Models for Medical Image Segmentation [14.8] 大規模自然画像データセットで事前訓練された基礎モデルは、医用画像セグメンテーションの強力なパラダイムを提供する。
本稿では,DINOv3ビジョン基盤モデルの高忠実度特徴を利用した新しいエンコーダデコーダアーキテクチャであるDino U-Netを提案する。
我々のフレームワークは、バックボーンモデルのサイズが大きくなるにつれて、セグメンテーションの精度が一貫して向上し、非常にスケーラブルであることが証明されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:38:50 GMT)
Label Embedding via Low-Coherence Matrices [14.7] 極端多クラス分類の文脈におけるラベル埋め込みの分析を行い、クラス数$C$は非常に大きいことを示す。
我々は,Massartノイズ条件下では,ラベル埋め込みの統計的ペナルティが十分に低いコヒーレンスで消失することを示した。
本分析は, 単純でスケーラブルで並列化が容易なアルゴリズムをサポートし, 大規模アプリケーションにおいてその有効性を実証する実験結果である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:54:38 GMT)
Unified Multi-task Learning for Voice-Based Detection of Diverse Clinical Conditions [14.7] プライバシを意識したマルチタスク学習フレームワークであるMARVELを,9つの異なる神経・呼吸・音声障害を同時に検出する。
当社のフレームワークは, シングルモーダルベースラインを5~19%上回り, 9タスクのうち7タスクにおいて最先端の自己監督モデルを上回っている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:37:25 GMT)
Robust ID-Specific Face Restoration via Alignment Learning [14.7] 本稿では,拡散モデルに基づく新しい顔復元フレームワークであるRobust ID-Specific Face Restoration (RIDFR)を提案する。
RIDFRにはアライメント・ラーニング(Alignment Learning)が組み込まれており、複数の参照からの復元結果を同一のアイデンティティと整合させて、ID非関連顔のセマンティクスの干渉を抑制する。
実験により、我々のフレームワークは最先端の手法よりも優れており、高品質なID固有の結果を高いアイデンティティの忠実度で再現し、強靭性を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:59:49 GMT)
Encoding Tactile Stimuli for Organoid Intelligence in Braille Recognition [14.6] 本研究では,触覚センサデータを電気刺激パターンにマッピングする汎用符号化手法を提案する。
低密度マイクロ電極アレイ(MEA)上に培養したヒト前脳オルガノイド
システムは1つのオルガノイドで61%の平均点字分類精度を達成した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:44:25 GMT)
Guarding Against Malicious Biased Threats (GAMBiT) Experiments: Revealing Cognitive Bias in Human-Subjects Red-Team Cyber Range Operations [14.0] 我々は、GAMBiTプロジェクト(Guarding Against Malicious Biased Threats)プロジェクトから、大規模な3つのレッドチームサイバーレンジデータセットを提示する。
実験1回あたり19~20人の攻撃者が、シミュレーションされた企業ネットワークで2回の8時間の自爆作戦を行った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:20:09 GMT)
ChainReaction! Structured Approach with Causal Chains as Intermediate Representations for Improved and Explainable Causal Video Question Answering [14.0] 応答生成から因果推論を明示的に分離する新しい枠組みを提案する。
人間の認知モデルにインスパイアされた構造化因果関係は、低レベルの映像コンテンツを高レベルの因果推論で橋渡しする。
また,因果性指向のキャプション評価指標であるCauCoを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:10:53 GMT)
ChatThero: An LLM-Supported Chatbot for Behavior Change and Therapeutic Support in Addiction Recovery [13.9] サブスタンス・ユース障害(SUD)は世界中で3600万人以上に影響を与えるが、スティグマ、モチベーション・バリア、パーソナライズされたサポートによる効果的なケアを受ける人は少ない。
認知行動療法(CBT)とモチベーション面接(MI)を基礎とした動的患者モデリングと文脈感応的治療対話と適応的説得戦略を併用したマルチエージェント会話フレームワークChatTheroを提案する。
評価では、ChatTheroは患者のモチベーションの平均利得が41.5%、治療信頼性が0.49%向上し、GPT-4oよりも26%少ないターンのハードケースを解決し、自動化およびヒトの臨床評価の両方を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:57:33 GMT)
Privacy-Aware Detection of Fake Identity Documents: Methodology, Benchmark, and Improved Algorithms (FakeIDet2) [13.7] 偽ID検出研究におけるプライバシ保護のためのパッチベースの手法を提案し,議論する。
2,000のID画像から抽出された900K以上の実/偽IDのパッチからなる新しい公開データベースFakeIDet2-dbを提供する。
プライバシを意識した新しい偽ID検出手法FakeIDet2を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:05:03 GMT)
Do Self-Supervised Speech Models Exhibit the Critical Period Effects in Language Acquisition? [13.6] 言語習得における臨界周期(CP)の影響は、自己教師型音声モデル(S3Ms)で観察される
CP効果は、L2の露光が遅れた第2言語(L2)の取得が困難であること、L1の露光が遅れた第1言語(L1)の維持が遅れたことを指している。
児童指向音声におけるL2訓練のオンセットとL1訓練のオフセットの異なるS3Mを訓練し,その識別性能を評価した。
S3Msは音韻学的にCP効果の明確な証拠を示さない。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:56:16 GMT)
MM-HSD: Multi-Modal Hate Speech Detection in Videos [13.5] ビデオにおけるヘイトスピーチ検出のためのマルチモーダルモデルMM-HSDを提案する。
音声書き起こしやフレーム(例えば画面上のテキスト)から派生したビデオフレーム、音声、テキストを、CMA(Cross-Modal Attention)によって抽出された特徴と統合する。
我々のアプローチは、オンスクリーンテキストをクエリとして使用し、残りのモダリティをキーとして使用する場合のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:36:35 GMT)
Domain Adaptation Techniques for Natural and Medical Image Classification [13.4] ドメイン適応(DA)技術は、ソースドメインの情報を活用することにより、トレーニングとテストセット間の分散の差異を軽減する可能性がある。
本研究は,5つの自然および8つの医学データセットにおける画像分類に広く用いられている7つのDA技術を用いて,57個のシミュレーション研究を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:27:25 GMT)
Uncertainty Aware-Predictive Control Barrier Functions: Safer Human Robot Interaction through Probabilistic Motion Forecasting [13.0] 不確かさを意識した予測制御バリア関数は、制御バリア関数の正式な安全性を保証することで、確率的手の動き予測を融合させる。
UA-PCBFは、将来の人間の状態をより深く理解した協力型ロボットに力を与える。
最先端のHRIアーキテクチャとは対照的に、UA-PCBFはタスククリティカルなメトリクスでより良いパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:11:26 GMT)
Realistic and Controllable 3D Gaussian-Guided Object Editing for Driving Video Generation [13.0] G2Editorは、ビデオ駆動時の不正確で正確なオブジェクト編集のために設計されたフレームワークである。
シーンレベルの3Dバウンディングボックスレイアウトを用いて、非ターゲットオブジェクトの隠蔽領域を再構築する。
実験によると、G2Editorは統一されたフレームワーク内でオブジェクトの配置、挿入、削除を効果的にサポートする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:39:53 GMT)
Zero-Shot KWS for Children's Speech using Layer-Wise Features from SSL Models [13.0] 本稿では,最先端の自己教師付き学習(SSL)モデルを活用したゼロショットKWS手法を提案する。
機能はこれらのSSLモデルから階層的に抽出され、カルディベースのKWSシステムのトレーニングに使用される。
提案手法は, 子どもの発話に対するすべてのキーワードセットに対して, 最先端の結果を得た。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:32:42 GMT)
A Hybrid Stochastic Gradient Tracking Method for Distributed Online Optimization Over Time-Varying Directed Networks [12.8] そこで本研究では,TV-HSGTという,時間変化型ハイブリッドグラディエントトラッキングアルゴリズムを提案する。
TV-HSGTは、時間変化ダイグラフ上の行確率と列確率の通信スキームを統合している。
グローバルな降下方向を正確に追跡しながら、分散を効果的に低減する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:47:18 GMT)
CoCoL: A Communication Efficient Decentralized Collaborative Method for Multi-Robot Systems [12.8] 異種局所データセットを持つマルチロボットシステムに適したコミュニケーション効率の良い分散協調学習手法を提案する。
CoCoLは、ロボットの目的関数間の類似性を捉えることにより、ニュートン型更新を近似して顕著な通信効率を達成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:25:48 GMT)
Dynamic Synthetic Controls vs. Panel-Aware Double Machine Learning for Geo-Level Marketing Impact Estimation [12.8] 合成制御法(SCM)は、しばしば高出力であるが、体系的に過小評価効果の大きさを示す。
ダブル機械学習(Double Machine Learning, DML)は、SCMに対してベンチマークされることはめったにない。
我々は、典型的な大規模ジオロールアウトを模倣した、オープンで完全に文書化されたシミュレータを構築します。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:33:06 GMT)
Graph-Based Uncertainty Modeling and Multimodal Fusion for Salient Object Detection [12.7] 動的不確実性伝播とマルチモーダル協調推論ネットワーク(DUP-MCRNet)を提案する。
DUGCは空間意味距離に基づいて構築されたスパースグラフを通じて層間の不確実性を伝播するように設計されている。
MCFは学習可能なモダリティゲーティングウェイトを使用して、RGB、深さ、エッジの特徴の注意マップを重み付けする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:31:48 GMT)
Self-Composing Neural Operators with Depth and Accuracy Scaling via Adaptive Train-and-Unroll Approach [12.7] 本稿では,自己合成によるニューラル演算子の効率性と精度を高める新しい枠組みを提案する。
数値偏微分方程式 (PDE) を解くための反復的手法に着想を得て, 1つのニューラル演算子ブロックを繰り返し適用して, 特定のニューラル演算子を設計する。
適応型トレイン・アンド・アンロールアプローチを導入し、トレーニング中にニューラル演算子の深さが徐々に増加する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:53:00 GMT)
SCE-NTT: A Hardware Accelerator for Number Theoretic Transform Using Superconductor Electronics [12.6] 本研究では, 超伝導エレクトロニクス(SCE)を用いた完全同相暗号(FHE)の高速化について検討する。
本稿では,超伝導単一フラックス量子(SFQ)論理とメモリに基づく専用ハードウェアアクセラレータであるSCE-NTTを紹介する。
我々はNTT-128ユニットが34GHzで531万NTT/secを達成することを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:37:51 GMT)
CaddieSet: A Golf Swing Dataset with Human Joint Features and Ball Information [12.5] 我々は,1枚のショットからジョイント情報と様々な球情報を含む,CaddieSetと呼ばれる新しいデータセットを提案する。
CaddieSetは、コンピュータビジョンベースのアプローチを使用して、8つのスイングフェーズに分割することで、単一のスイングビデオからジョイント情報を抽出する。
専門的なゴルフ分野の知識に基づいて、ゴルフスイングに影響を与える15の指標を定義し、スイング結果の解釈を可能にする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:16:01 GMT)
Adaptive LLM Routing under Budget Constraints [12.4] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、その様々な能力とコストは、実用的なアプリケーションにおいて課題を引き起こしている。
従来のアプローチでは、最適なクエリ-LLMペアリングの完全な知識を前提として、これを教師付き学習問題として扱う。
本稿では,LLMルーティングを文脈的帯域幅問題として検討し,帯域幅フィードバックを用いて適応的な意思決定を可能にすることを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:18:19 GMT)
Latent Factor Point Processes for Patient Representation in Electronic Health Records [12.4] ほとんどの統計的手法は、EHR符号の不規則なタイミングを単純なカウントに減らし、これにより豊富な時間構造を破棄する。
本稿では,コード発生を高次元のポイントプロセスとして表現する潜在因子点プロセスモデルを提案する。
この低ランク構造は、数千のコードが少数の基礎疾患プロセスによって管理されているという臨床的現実を反映している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:08:55 GMT)
Just-in-time and distributed task representations in language models [12.3] 言語モデルで生成した新しいタスクのエンフエン表現について検討する。
これらの表現は、非単調および散発的な方法で進化することを示す。
これは、言語モデルの新たなエビデンスに適応する能力に基づく、ジャスト・イン・タイムの計算プロセスの一種である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:08:32 GMT)
More Reliable Pseudo-labels, Better Performance: A Generalized Approach to Single Positive Multi-label Learning [12.2] マルチラベル学習は、各画像に複数のカテゴリを割り当てる必要がある、難しいコンピュータビジョンタスクである。
ノイズを軽減しつつ,多様な擬似ラベルから効果的に学習する新しい損失関数を提案する。
我々のフレームワークは多言語分類を著しく進歩させ、最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:07:57 GMT)
Modulation Instability-Induced Multimode Squeezing in Quadratic Frequency Combs [12.2] ニオブ酸リチウム(LN)マイクロリング共振器は集積量子周波数コム(QFC)の精密制御のための優れたプラットフォームとして機能する
本稿では, 自発パラメトリックダウンコンバージョンプロセスにより発生するQFCの対角絡み特性を調べるために, 両部絡み合い基準を導入する。
本稿では,2次周波数コムにおけるマルチモード・スクイーズ解析のための普遍的枠組みを提案し,超広帯域化と高次マルチモード・スクイーズの実現を可能にする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:00:27 GMT)
From Tabula Rasa to Emergent Abilities: Discovering Robot Skills via Real-World Unsupervised Quality-Diversity [12.0] 品質ダイバーシティ・アクター・クリティカル(QDAC)の拡張であるUnsupervised Real-world Skill Acquisition (URSA)を提案する。
URSAは、ロボットが現実世界で直接、多様なハイパフォーマンスなスキルを自律的に発見し、習得することを可能にする。
本研究は,より自律的で適応性の高いロボットシステムに向けた重要なステップを示す,現実世界のロボット学習のための新しいフレームワークを構築した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:16:47 GMT)
Rethinking Invariance Regularization in Adversarial Training to Improve Robustness-Accuracy Trade-off [11.8] 敵の訓練は、しばしばロバストネスのトレードオフに悩まされ、高いロバストネスを達成することは精度の犠牲となる。
非対称表現正規化逆行訓練(ARAT)を提案する。
ARATは、非対称な不斉損失と停止段階の演算と予測器を組み込み、勾配の衝突を回避し、混合分布問題を解決するためにスプリット・バッチノーム(BN)構造を組み込む。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:56:52 GMT)
A Graph Talks, But Who's Listening? Rethinking Evaluations for Graph-Language Models [11.8] グラフ言語モデル(GLMs)の開発は、グラフニューラルネットワーク(GNNs)の構造的推論能力と大規模言語モデル(LLMs)の意味的理解を統合することを目的としている。
GLMの現在の評価ベンチマークはマルチモーダル推論を評価するには不十分であることを示す。
CLEGR(Compositional Language-Graph Reasoning)ベンチマークを導入する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:20:47 GMT)
SemSR: Semantics aware robust Session-based Recommendations [11.6] セッションベースのレコメンデーション(SR)モデルは、現在のセッション中の行動に基づいて、匿名ユーザに対してアイテムを推薦することを目的としている。
様々なSRモデルは、セッション意図の識別と解釈可能性を妨げる項目のタイトルや説明からの意味情報を活用できない。
最近の研究は、セッションベースのレコメンデーションを強化するための有望なアプローチとして、Large Language Models (LLM)を調査している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:25:54 GMT)
Deep Residual Echo State Networks: exploring residual orthogonal connections in untrained Recurrent Neural Networks [11.6] 我々は、Deep Residual Echo State Networks (DeepResESNs)と呼ばれる、時間的残差接続に基づく深層学習RNNのクラスを導入する。
本研究では,未学習残層階層の階層化がメモリ容量と長期時間的モデリングを著しく向上させることを示す。
詳細な数学的解析では、DeepResESN内の安定なダイナミクスを保証するために必要で十分な条件を概説している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:22:02 GMT)
Benchmarking GPT-5 for biomedical natural language processing [11.6] GPT-5は総合ベンチマークで最強の成績を収めた。
MedQAでは、GPT-5の精度は94.1%に達し、それまで監督されていた芸術の状態を50点以上上回った。
抽出作業において、GPT-5は化学NERに大きな利益をもたらした。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:06:53 GMT)
ZIM: Zero-Shot Image Matting for Anything [11.5] 我々はZIMと呼ばれる新しいゼロショット画像マッチングモデルを提案する。
我々は,セグメンテーションラベルを詳細なマットラベルに変換するラベル変換器を開発し,コストのかかる手動アノテーションを使わずに新しいSA1B-Matteデータセットを構築した。
マスク表現を向上させるために,階層型画素デコーダを備えたゼロショットマッチングモデルを設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:44:11 GMT)
CVBench: Evaluating Cross-Video Synergies for Complex Multimodal Understanding and Reasoning [11.5] CVBenchは,ビデオ間のリレーショナル推論を厳格に評価するために設計された,最初の総合的なベンチマークである。
CVBenchは、クロスビデオオブジェクトアソシエーション、クロスビデオイベントアソシエーション、クロスビデオ複合推論の3層にまたがる1000の質問応答ペアで構成されている。
5つのドメインの異なるビデオクラスタから構築されたこのベンチマークは、ダイナミックな視覚的コンテキストにまたがる情報を合成するモデルに挑戦する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:22:38 GMT)
Can Multiple Responses from an LLM Reveal the Sources of Its Uncertainty? [11.3] 大規模言語モデル(LLM)は、さまざまな領域で大きなブレークスルーをもたらしたが、信頼できない、あるいは誤解を招くアウトプットを生成することができる。
LLMが不確実である場合、その多重応答間の不一致パターンには、不確実性の根本原因に関する深い手がかりが含まれていることが示される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:14:35 GMT)
Adaptive Root Cause Localization for Microservice Systems with Multi-Agent Recursion-of-Thought [11.3] 本稿では,マイクロサービスシステムに対する適応的根本原因ローカライゼーション手法であるRCLAgentを紹介する。
RCLAgentは,1つの要求出力状態のみを用いて根本原因を局所化し,優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:34:19 GMT)
NLKI: A lightweight Natural Language Knowledge Integration Framework for Improving Small VLMs in Commonsense VQA Tasks [11.2] ViLT、VisualBERT、FLAVAのような小さな視覚言語モデル(sVLM)は、より大きな生成言語に遅れを取っている。
注意深いコモンセンス知識統合がsVLMに与える影響を検討するため,NLKI(End-to-end framework)を提案する。
微調整されたColBERTv2とオブジェクト情報に富んだプログレッシブ・プロデュース・説明を用いて、幻覚をほとんど切断した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:05:33 GMT)
Languages Still Left Behind: Toward a Better Multilingual Machine Translation Benchmark [11.1] 我々は4つの言語(Asante Twi, Japanese, Jinghpaw, South Azerbaijani)のデータを研究する。
真の多言語評価に対するベンチマークの適合性の重大な欠点を明らかにする。
我々は、ドメイン汎用および文化的に中立なソーステキストを使用する多言語MTベンチマークを提唱する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:52:42 GMT)
Diagonal Symmetrization of Neural Network Solvers for the Many-Electron Schrödinger Equation [10.9] 我々は,モンテカルロ変分法を用いて学習したニューラルネットワークアンスに,対角的不変性を導入する様々な方法について検討した。
標準のMLセットアップとは対照的に、トレーニング中の対称性はトレーニングを不安定にし、パフォーマンスを悪化させる可能性があることを示す。
我々の理論的および数値的な結果は、この予期せぬ挙動は、シンメトリゼーションの標準ML解析では見つからないユニークな計算統計的トレードオフから生じる可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:28:38 GMT)
"Humor, Art, or Misinformation?": A Multimodal Dataset for Intent-Aware Synthetic Image Detection [10.8] S-HArMはTwitter/XとRedditによる画像テキストペアの意図認識分類のためのデータセットである。
我々は,モータリティ融合,コントラスト学習,再構成ネットワーク,注意機構,大規模視覚言語モデルなど,幅広い比較研究を行っている。
その結果、画像とマルチモーダル誘導データに基づいてトレーニングされたモデルは、保存された視覚的コンテキストにより、"野生"のコンテンツよりも一般化されていることがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:22:15 GMT)
Fast Convergence Rates for Subsampled Natural Gradient Algorithms on Quadratic Model Problems [10.7] 理想化されたパラメトリック最適化問題に対して、SNGDとその加速変種であるSPRINGの収束を解析する。
SNGD は正規化 Kaczmarz 法と等価であり、SPRING は加速正規化 Kaczmarz 法と等価であることを示す。
以上の結果から,ランダム化線形代数のツールがサブサンプリングと曲率を考慮した最適化戦略の相互作用に新たな光を当てることができることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:24:59 GMT)
Overview of BioASQ 2024: The twelfth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering [10.7] BioASQは、大規模バイオメディカルセマンティックインデックスと質問応答の進歩を促進する一連の国際的な課題である。
今年、BioASQは2つの確立されたタスクbとSynergyの新しいエディションと2つの新しいタスクで構成された。
チャレンジの4つの異なる共有タスクに対して、合計で700以上の異なる応募を行ったのは、37の競合チームだった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:17:57 GMT)
CoMoE: Contrastive Representation for Mixture-of-Experts in Parameter-Efficient Fine-tuning [10.2] 我々は,MoEのモジュール化と特殊化を促進するために,MoE(CoMoE)のコントラスト表現を提案する。
いくつかのベンチマークやマルチタスク環境での実験では、CoMoEはMoEのキャパシティを継続的に向上し、専門家間のモジュール化を促進することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:47:00 GMT)
PromptSleuth: Detecting Prompt Injection via Semantic Intent Invariance [10.1] 大規模言語モデル(LLM)は、仮想アシスタントから自律エージェントに至るまで、現実のアプリケーションにますます統合されている。
攻撃者がパラフレーズ、難読化、マルチタスクのインジェクション戦略で進化するにつれて、既存のベンチマークは、出現する脅威の全スペクトルを捉えるのに十分ではない。
PromptSleuthは,表面的特徴ではなくタスクレベルの意図を推論することで,迅速なインジェクションを検出するセマンティック指向の防衛フレームワークである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:19:07 GMT)
Ultra-Low-Latency Spiking Neural Networks with Temporal-Dependent Integrate-and-Fire Neuron Model for Objects Detection [9.9] スパイキングニューラルネットワーク(SNN)は、最小消費電力と迅速な推論能力によって特徴付けられる。
本研究では, 不均一なスパイクパターンに起因する残留膜電位の問題を緩和するための遅延スパイク手法を提案する。
提案手法は,より高精度な特徴表現を低段階で実現し,視覚的検出タスクにおいて高い性能と超低レイテンシを実現する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:32:45 GMT)
Single Agent Robust Deep Reinforcement Learning for Bus Fleet Control [9.9] バスの群れは交通と乗客の需要のために都市交通にとって困難である。
バス保持制御のための単エージェント強化学習フレームワークを提案する。
修正されたアクター・クリティは,ベンチマークよりも安定かつ優れた性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:47:40 GMT)
Reverse Imaging for Wide-spectrum Generalization of Cardiac MRI Segmentation [9.9] リバースイメージング(Reverse Imaging)は、心臓MRIデータ拡張とドメイン適応のための物理駆動型手法である。
心臓MRI画像から根底にあるスピン特性を逆転させる手法を提案する。
Reverse Imagingは画像のコントラストや画像のプロトコールの精度が高いセグメンテーションを可能にする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:55:15 GMT)
Flowing Straighter with Conditional Flow Matching for Accurate Speech Enhancement [9.8] 音声強調品質に対する経路の直線性の影響を定量化する。
音声強調のための独立条件付きフローマッチングを提案する。
本研究は,時間非依存の確率経路が湾曲した時間依存の経路よりも生成的音声強調を改善することを示唆している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:21:22 GMT)
From Post To Personality: Harnessing LLMs for MBTI Prediction in Social Media [9.8] Myers Briggs Type Indicator (MBTI) は伝統的に機械学習(ML)とディープラーニング(DL)技術によって予測されてきた。
近年,Large Language Models (LLMs) の成功は,ソーシャルメディアコンテンツから人格の特徴を理解し,推測する大きな可能性を明らかにしている。
個人のソーシャルメディア投稿からMBTI予測のための新しいLLMベースのフレームワークであるPostToPersonality (PtoP)を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:35:12 GMT)
SPGrasp: Spatiotemporal Prompt-driven Grasp Synthesis in Dynamic Scenes [9.7] SPGraspは、ビデオストリーム把握推定のためのモデルv2SAMv2を拡張する新しいフレームワークである。
我々のコアはユーザプロンプトをコンテキストと統合し、エンド・ツー・エンドの動的オブジェクトとのリアルタイムインタラクションを可能にします。
継続的なトラッキング下での挑戦的なGraspNet-1Billionデータセットでは、SPGraspはフレーム毎の73.1ミリ秒のレイテンシで92.0%の精度を実現している。
これらの結果から,SPGraspは動的グリップ合成における遅延-相互作用トレードオフを効果的に解消することがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:38:50 GMT)
PathMR: Multimodal Visual Reasoning for Interpretable Pathology Diagnosis [9.7] 病理画像解析のための細胞レベルでのマルチモーダルビジュアル推論フレームワークであるPathMRを提案する。
PathMRは、テキスト生成品質、セグメンテーション精度、モーダルアライメントにおいて、最先端の視覚的推論手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:46:24 GMT)
Maven-Hijack: Software Supply Chain Attack Exploiting Packaging Order [9.5] Maven-HijackはMavenが依存性をパッケージする順番を利用する新しい攻撃です。
正当なクラスと同じ完全資格を持つ悪意のあるクラスをパッケージ化された依存性に注入することで、アタッカーは静かにコアアプリケーションの振る舞いをオーバーライドできる。
封印されたJAR、Javaモジュール、Maven Enforcerプラグインといった3つの緩和戦略を評価します。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:29:19 GMT)
To New Beginnings: A Survey of Unified Perception in Autonomous Vehicle Software [9.4] 統合された認識の包括的概要を提供し、タスク統合、追跡定式化、表現フローに沿ってメソッドを分類する包括的で体系的な分類を導入した。
この研究は、統合された知覚を理解し、進化させるための最初の包括的な枠組みを確立し、断片化された努力を統合し、より堅牢で、一般化可能で、解釈可能な知覚に向けて将来の研究を導く。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:20:35 GMT)
BiListing: Modality Alignment for Listings [9.3] Airbnbはこれまで、ゲストへのリスティングを理解し、ランク付けし、推奨するために構造化されたデータに依存してきた。
表現学習が盛んになると、テキストや写真から豊富な情報を活用することがより簡単になった。
本稿では,大規模言語モデルと事前学習型言語画像モデルを活用することで,リストのテキストと写真を整列する手法であるBiListingを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:47:31 GMT)
Relative Drawing Identification Complexity is Invariant to Modality in Vision-Language Models [9.3] 我々は、生画像をビットマップとして、TikZフォーマットのトレース座標として、2つのプレゼンテーションを用いて視覚言語モデルを教える複雑さを評価する。
その結果、画像ベースの表現は一般に、より少ないセグメントを必要とし、座標ベースの表現よりも高い精度を達成することが示唆された。
しかし、驚くべきことに、教育の規模は通常、前もって(人間の代理)概念を制御しても、両方のモダリティにまたがる概念をランク付けする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:16:17 GMT)
Disruptive Attacks on Face Swapping via Low-Frequency Perceptual Perturbations [9.3] GAN(Generative Adversarial Networks)によって駆動されるDeepfake技術は、プライバシと社会保障に重大なリスクをもたらす。
既存の検出手法は主に受動的であり、攻撃を防ぐことなく、事後分析に重点を置いている。
フェーススワップ操作を妨害する低周波摂動に基づくアクティブディフェンス法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:34:53 GMT)
Deep Learning Based Concurrency Bug Detection and Localization [9.2] 並行性バグは、ソフトウェアの信頼性とセキュリティを検知し、妥協することが難しいことで知られている。
既存のディープラーニング手法には3つの大きな制限がある。
そこで本研究では,効率的なバグ検出とローカライゼーションのための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:40:20 GMT)
A Quantum Speedup in Localizing Transmission Loss Change in Optical Networks [9.2] 伝送損失の変化を光ネットワーク内のリンクのサブセットにローカライズする。
量子プローブは、チャネル損失の急激な増加を検出する際に、準古典的なプローブよりも感度が高いことが知られている。
本稿では,突然の透過性低下に遭ったリンクを迅速に検出する手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:02:20 GMT)
MedFoundationHub: A Lightweight and Secure Toolkit for Deploying Medical Vision Language Foundation Models [9.1] 医用視覚言語モデルをデプロイするためのGUIツールキットであるMedFoundationHubを提案する。
医師はプログラミングの専門知識を使わずに、さまざまなモデルを手動で選択および使用することができる。
また、Dockerが管理するオペレーティングシステムのデプロイメントを通じて、プライバシ保護の推論を保証する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:39:16 GMT)
GeoTexBuild: 3D Building Model Generation from Map Footprints [9.1] GeoTexBuildは、サイト計画やマップデザインから派生したフットプリントから3Dビルディングモデルを作成するためのモジュラー・ジェネレーティブ・フレームワークである。
提案手法は高さマップ生成,幾何再構成,外観スタイライゼーションを含む3段階のプロセスを用いて,詳細な幾何学的特性と外観特性を持つ建築モデルで決定される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:36:37 GMT)
Policy Expansion for Bridging Offline-to-Online Reinforcement Learning [9.0] オフラインデータによる事前トレーニングと強化学習を用いたオンライン微調整は、制御ポリシーを学ぶ上で有望な戦略である。
本稿では,この課題に対する政策拡張スキームを紹介する。
2つのポリシーは、環境と対話するための適応的な方法で構成されます。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:06:01 GMT)
Climber: Toward Efficient Scaling Laws for Large Recommendation Models [9.0] Climberは2つの相乗的コンポーネントからなる効率的なレコメンデーションフレームワークである。
提案モデルでは,(1)一定因子による時間的複雑性の低減を実現し,シーケンス長によるより効率的なスケーリングを実現するマルチスケールシーケンス抽出,(2)マルチシナリオパターンとマルチビヘイビアパターンに注意分布を適応させる動的温度変調,の2つのコアイノベーションを採用している。
Climberは、中国最大の音楽ストリーミングプラットフォームであるNetease Cloud Musicに、毎日数千万人のユーザーにサービスを提供している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:40:30 GMT)
Adaptive Segmentation of EEG for Machine Learning Applications [8.8] 脳波データの統計的差異に基づいて可変長セグメントを生成する新しい適応セグメント法CTXSEGを提案する。
発作検出のための典型的な脳波機械学習パイプラインの前処理工程におけるCTXSEGと固定長セグメンテーションの性能を比較した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:43:04 GMT)
Physics and Computation: A Perspective From Non-Hermitian Quantum Computer [8.7] NQCは極端に強力であり、すべてのNP問題だけでなく、複雑性クラス$textPsharpP$内のすべての問題を時間内に解くことができる。
非単位ゲートを$G$で実装するための2つの物理スキームを調査し、NQCの卓越した計算能力は、指数関数的に大きな物理資源から生じることを見出した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:23:01 GMT)
Probabilistic Modeling of Jailbreak on Multimodal LLMs: From Quantification to Application [8.7] 入力のジェイルブレイクポテンシャルを定量化するためにジェイルブレイク確率を導入し、この入力によってMLLMが悪意ある応答を発生させる可能性を示す。
具体的には,Jailbreak-Probability-based Attack (JPA)を提案する。
また,攻撃対策として,MLLMパラメータ更新によるジェイルブレイク確率の最小化を目的としたジェイルブレイクプロビタビリティに基づくファインタニング(JPF)を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:43:31 GMT)
Towards Trustworthy Amortized Bayesian Model Comparison [8.7] 我々は、BMC推定を改善するために、ラベルのない実データに自己整合性損失を伴ってシミュレーションベースのトレーニングを補完する。
解析的および橋梁サンプリングベンチマークと比較し, SCの有無と非道徳的証拠推定値の比較を行った。
ニューラルサロゲートの確率は限定的であり、信頼に値するBMCの確率が正確である場合に最も実用的である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:01:01 GMT)
Learned Rate Control for Frame-Level Adaptive Neural Video Compression via Dynamic Neural Network [8.6] 可変シナリオ用に設計された動的ビデオ圧縮フレームワークを提案する。
提案手法は,最先端法よりも平均BD-Rateの14.8%,BD-PSNRの0.47dBのゲインを達成できる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:27:23 GMT)
Automated Algorithmic Discovery for Gravitational-Wave Detection Guided by LLM-Informed Evolutionary Monte Carlo Tree Search [8.6] 本稿では,大規模言語モデル(LLM)ガイダンスとドメイン認識の物理的制約を統合して,重力波の自動検出を提案する。
MLGWSC-1ベンチマークデータセット上で,最先端の重力波検出アルゴリズムの性能向上を示す。
本フレームワークは,計算科学領域にまたがる自動アルゴリズム発見のための伝達可能な手法を確立する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:35:57 GMT)
CAPE: Context-Aware Personality Evaluation Framework for Large Language Models [8.6] 大規模言語モデル(LLM)のためのコンテキスト認識型パーソナリティ評価フレームワークを提案する。
実験の結果,会話履歴は文脈内学習による応答の整合性を高めるだけでなく,人格の変化も引き起こすことがわかった。
我々のフレームワークは、人間による判断をより良く整合させるために、ロールプレイングエージェント(RPAs)に適用できる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:17:47 GMT)
SMARTe-VR: Student Monitoring and Adaptive Response Technology for e-Learning in Virtual Reality [8.6] 本研究は,オンライン教育用に設計された没入型仮想現実環境における学生監視プラットフォームSMARTe-VRを紹介する。
このプラットフォームでは、インストラクターがビデオ講義でカスタマイズされた学習セッションを作成することができる。
われわれは,VRベースのTOEICセッションで10ユーザからのデータを用いた5つの研究課題を含むデータセットをリリースした。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:13:50 GMT)
A multimodal dataset for understanding the impact of mobile phones on remote online virtual education [8.6] IMPROVEデータセットには、120人の学習者から収集された行動、生体、生理、および学術的なパフォーマンスデータが含まれている。
EEG、アイトラッキング、ビデオカメラ、スマートウォッチ、およびキーストロークダイナミクスを含む16の同期センサーが学習者の活動を監視するために使用された。
技術的検証により、信号品質が確認され、統計学的解析により、電話使用に伴う生体的変化が明らかになった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:18:41 GMT)
Are the Majority of Public Computational Notebooks Pathologically Non-Executable? [8.5] 従来の実行可能性の概念は過度に厳格であり、多くのノートを誤って分類し、実行不可能性を過大評価している、と私たちは主張する。
本稿では,公立ノートの病的実行可能性問題について,様々な概念と実行可能性の度合いで検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:09:41 GMT)
Addressing accuracy and hallucination of LLMs in Alzheimer's disease research through knowledge graphs [8.5] 2つの人気のあるGraphRAGシステムの品質とトレーサビリティを評価する。
アルツハイマー病に関する50の論文と70の専門的な質問をデータベースにまとめる。
本稿では,複数の検索拡張生成システム(RAG)とグラフRAGシステムのトレーサビリティについて論じ,評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:03:53 GMT)
Parameter-Free Structural-Diversity Message Passing for Graph Neural Networks [8.5] グラフニューラルネットワーク(GNN)はノード分類などの構造化データモデリングタスクにおいて顕著な性能を示した。
本稿では,構造的多様性に基づくパラメータフリーグラフニューラルネットワークフレームワークを提案する。
このフレームワークは構造多様性理論にインスパイアされ、統一された構造多様性メッセージパッシング機構を設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:49:08 GMT)
Algorithms for the preordering problem and their application to the task of jointly clustering and ordering the accounts of a social network [8.4] NP-ハード最大値事前順序問題(NP-hard maximum value preordering problem)は、クリッド分割問題(クラスタリング問題)と部分順序問題との結合緩和とハイブリッドである。
本稿では,部分グラフの最大ディカットを構築し,局所探索を定義する線形時間 4-近似アルゴリズムを提案する。
我々はこれらのアルゴリズムを共同でクラスタリングし、公開ソーシャルネットワークのアカウントを部分的に注文するタスクに適用し、そのアウトプットと効率を質的かつ定量的に比較する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:34:59 GMT)
Exploring Machine Learning and Language Models for Multimodal Depression Detection [8.4] 本稿では,第1回マルチモーダル・パーソナリティ・アウェア・デプレッション検出チャレンジへのアプローチを提案する。
我々は,音声,ビデオ,テキスト機能において,XGBoost,トランスフォーマーベースのアーキテクチャ,および大規模言語モデル(LLM)の性能を探索し比較する。
本研究は,モダリティにまたがる抑うつ関連信号の捉え方について,各モデルの強みと限界を強調した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:07:07 GMT)
FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI [8.3] FrontierMath(フロンティアマス、フロンティアマス、FrontierMath)は、数学者が考案し検証した何百もの数学問題のベンチマークである。
現在の最先端のAIモデルは、問題の2%未満を解決し、AI能力と数学的コミュニティの長所との間に大きなギャップが浮かび上がっている。
AIシステムが専門家レベルの数学的能力に向かって進むにつれ、FrontierMathは彼らの進歩を定量化する厳格なテストベッドを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:10:50 GMT)
CAMB: A comprehensive industrial LLM benchmark on civil aviation maintenance [8.3] 我々は,民間航空の整備に特化して設計された産業レベルのベンチマークを提案し,開発する。
このベンチマークは2つの目的を果たす: 民間航空のメンテナンスにおけるLCMの能力を測定するための標準化されたツールを提供する。
これらの欠陥を指摘することによって、このベンチマークは目標とする改善努力の基盤を確立する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:42:11 GMT)
Enhancing Health Fact-Checking with LLM-Generated Synthetic Data [8.3] 本研究では、健康関連事実チェックのためのトレーニングデータを強化するための合成データ生成パイプラインを提案する。
PubHealthとSciFactの2つの公開データセットの評価は、私たちのパイプラインがF1スコアを最大0.019と0.049に改善したことを示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:06:33 GMT)
RevPRAG: Revealing Poisoning Attacks in Retrieval-Augmented Generation through LLM Activation Analysis [7.8] RevPRAGは、LLMの活性化を利用した、柔軟で自動化された検出パイプラインである。
複数のベンチマークデータセットとRAGアーキテクチャによる結果から,提案手法は真正の98%,偽正の1%に近い正の98%を達成できた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:03:54 GMT)
Unbiased Stochastic Optimization for Gaussian Processes on Finite Dimensional RKHS [7.8] 中間有限次元の再現ヒルベルト空間(RKHS)を誘導するカーネルを用いたGPの正確な推定アルゴリズムを提案する。
我々の手法は、精度を保ちながら無限次元のRKHSにも拡張することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:27:20 GMT)
GUARD: Glocal Uncertainty-Aware Robust Decoding for Effective and Efficient Open-Ended Text Generation [7.8] GUARDは、オープンエンドテキスト生成におけるコヒーレンスと多様性のバランスをとる自己適応復号法である。
GUARDはテキストの多様性と一貫性のバランスを良好に保ちつつ、生成速度を大幅に改善したことを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:14:20 GMT)
Privacy Auditing Synthetic Data Release through Local Likelihood Attacks [7.8] 遺伝子様比攻撃(Gen-LRA)
Gen-LRAは、サロゲートモデルによる合成データに対する局所確率比の推定において、テスト観測が与える影響を評価して攻撃を定式化する。
その結果、Gen-LRAは、合成データのリリースのためのプライバシ監査ツールとしての有効性を裏付けている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:27:40 GMT)
Prediction of mortality and resource utilization in critical care: a deep learning approach using multimodal electronic health records with natural language processing techniques [7.8] 既存のアプローチは主に構造化された EHR に焦点を当てており、しばしばフリーテキストノートにおける貴重な臨床的洞察を無視している。
本研究では,自然言語処理技術を用いたディープラーニングフレームワークの導入と評価を目的とした。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:14:37 GMT)
TGOSPA Metric Parameters Selection and Evaluation for Visual Multi-object Tracking [7.7] トラジェクトリ一般化最適サブパターン割り当て(TGOSPA)を用いて、多目的追跡性能を評価する。
ローカライズエラー、ミスや偽のオブジェクトの数、トラックスイッチの数などが説明できる。
TGOSPAパラメータの選択を探索することにより、特定のタスクに適したアルゴリズムの性能を比較し、理解し、最適化することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:24:24 GMT)
Non-spatial symmetries in quantum nonlinear spectroscopy [7.6] 量子非線形分光法により抽出された高次相関が非空間対称性によってどのように制約されるかを検討する。
この研究は、非空間対称性による高次量子相関の深い構造を明らかにする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:48:11 GMT)
Estimating 2D Keypoints of Surgical Tools Using Vision-Language Models with Low-Rank Adaptation [7.6] 本稿では,低ランク調整(LoRA)技術を用いて視覚言語モデル(VLM)を微調整することで,手術器具の2次元キーポイントエスティマオンのための新しいパイプラインを提案する。
インストラクションチューニングデータセットを作成するためのプロンプトを慎重に設計し、視覚的特徴をセマンティックなキーポイント記述と整合させるために使用する。
実験結果から,2段階の微調整により,適応型VLMはベースラインモデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:25:32 GMT)
Evaluating Compositional Generalisation in VLMs and Diffusion Models [7.6] 自然言語の意味論の基本的な側面は、前述した部分の合成から新しい意味を形成することができることである。
Diffusion、CLIP、ViLTの3つの視覚言語モデルについて、属性と関係を持つオブジェクトをバインドする能力について評価する。
以上の結果から,Diffusion と ViLT は概念的バインディングタスクにおいて良好に機能することが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:45:04 GMT)
GENNAV: Polygon Mask Generation for Generalized Referring Navigable Regions [7.5] 本研究では,自然言語命令とフロントカメラ画像から対象領域の位置を特定するタスクに焦点をあてる。
本稿では,複数の物型対象領域に対して,ターゲットの存在を予測し,セグメンテーションマスクを生成するGENNAVを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:09:38 GMT)
Dual-Stage Global and Local Feature Framework for Image Dehazing [7.5] 我々はStreamlined Global and Local Features Combinator(SGLC)と呼ばれる新しいフレームワークを提案する。
我々のアプローチは、Global Features Generator(GFG)とLocal Features Enhancer(LFE)の2つの主要コンポーネントで構成されています。
高分解能データセットによる実験結果から,SGLCを用いた場合のピーク信号-雑音比(PSNR)の大幅な改善が示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:03:48 GMT)
Dynamic Triangulation-Based Graph Rewiring for Graph Neural Networks [7.5] グラフニューラルネットワーク(GNN)は、グラフ構造化データを学習するための主要なパラダイムとして登場した。
グラフリウィリングの最近の進歩は、より効果的な情報伝達を促進するために、グラフトポロジを変更することによってこれらの制限を緩和することを目的としている。
複数のグラフビューから関連する三角形を選択することを学ぶことで、リッチで非平面三角測量を構築する新しいフレームワークであるTRIGONを紹介する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:15:01 GMT)
Quantum Verifiable Rewards for Post-Training Qiskit Code Assistant [7.5] 量子ハードウェア上でのコード品質と実行可能性を確保するための有効な方法として量子検証を導入する。
我々は、量子ハードウェアが提供する量子検証可能な報酬を活用して、GRPOを使用してモデルを訓練した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:37:40 GMT)
SPIN-ODE: Stiff Physics-Informed Neural ODE for Chemical Reaction Rate Estimation [7.4] 複雑な化学反応からの速度係数の推定は、詳細な化学の進歩に不可欠である。
化学反応モデリングのための剛体物理インフォームドニューラルネットワーク(SPIN-ODE)フレームワークを提案する。
提案手法では,3段階の最適化プロセスを導入する。第1に,ブラックボックスニューラルネットワークを集中軌道に合わせるように訓練し,第2に,化学反応ニューラルネットワーク(CRNN)を事前学習して,濃度とその時間微分のマッピングを学習し,第3に,予め訓練したCRNNを統合することで,レート係数を微調整する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:19:04 GMT)
On Identifying Why and When Foundation Models Perform Well on Time-Series Forecasting Using Automated Explanations and Rating [7.4] 時系列予測モデル(TSFM)は、古典的な統計手法から洗練された基礎モデルへと進化してきた。
この作業は、従来の説明可能なAI(XAI)メソッドとレーティング駆動説明(RDE)を組み合わせることで、問題に対処する。
ARIMA, Gradient Boosting, Chronos (時系列固有の基礎モデル), Llama (汎用モデル, 微調整モデル, ベースモデル) の4つの異なるモデルアーキテクチャを評価した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:27:45 GMT)
Structure-aware Hypergraph Transformer for Diagnosis Prediction in Electronic Health Records [7.4] グラフニューラルネットワーク(GNN)は、EMH内の医療コード間の相互作用をモデル化する効果を実証している。
本稿では,3つのアイデアに従う構造対応ハイパーグラフトランス (SHGT) フレームワークを提案する。
実世界のEHRデータセットの実験により、提案されたSHGTは診断予測における既存の最先端モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:37:45 GMT)
Compositionality in Time Series: A Proof of Concept using Symbolic Dynamics and Compositional Data Augmentation [7.2] 本研究は、自然現象の時系列が、体系的および規則的な方法で順序付けられた潜在状態の列によって生成されると理解できるかどうかを考察する。
本研究は,臨床時系列に焦点をあて,臨床測定が系統的原則に従っている有意義な生理的状態によって生成されると解釈できるかどうかを問う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:02:21 GMT)
Graph-R1: Incentivizing the Zero-Shot Graph Learning Capability in LLMs via Explicit Reasoning [7.2] グラフニューラルネットワーク(GNN)は固定ラベル空間によって制限されるが、Large Language Models(LLM)は構造的帰納バイアスを欠いている。
近年のLarge Reasoning Models (LRMs) の進歩は、明示的な長い連鎖推論を通じてゼロショットの代替手段を提供する。
本稿では,LRMによるテキスト推論問題として,ノード分類,リンク予測,グラフ分類などのグラフタスクを再構成するGNNフリーアプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:20:32 GMT)
Polynomial Chaos Expansion for Operator Learning [7.0] 演算子学習(OL)が科学機械学習(SciML)の強力なツールとして登場した
本稿では,OL法としてカオス展開(PCE)を導入する。
PCEは不確実性定量化(UQ)に広く利用されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:14:44 GMT)
Improving Fine-Grained Control via Aggregation of Multiple Diffusion Models [7.0] 本稿では,ネットワークアーキテクチャを微粒化するための新しい学習自由度アルゴリズムを提案する。
このアルゴリズムは、複数の拡散モデルの特徴を特定のモデルに統合し、特定の特徴を活性化し、きめ細かい制御を可能にする。
実験結果から,AMDMはトレーニングなしで微粒化制御を著しく改善し,その有効性が検証された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:03:26 GMT)
A Spatial-Frequency Aware Multi-Scale Fusion Network for Real-Time Deepfake Detection [6.9] 本稿では,リアルタイムディープフェイク検出のための軽量で効果的なアーキテクチャを提案する。
空間テクスチャと周波数アーティファクトを併用した空間周波数ハイブリッド認識モジュールを設計する。
いくつかのベンチマークデータセットの実験では、SFMFNetは精度と効率のバランスを良好に達成し、リアルタイムアプリケーションに対して強力な一般化と実用的な価値を達成している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:55:28 GMT)
Benchmarking Quantum Solvers in Noisy Digital Simulations for Financial Portfolio Optimization [6.9] 量子Imaginary-Time Evolution(QITE)とQuantum Approximate Optimization Algorithm(QAOA)の2つの重要な量子アルゴリズムをベンチマークする。
定量的ファイナンスにおけるMarkowitzポートフォリオ最適化問題に適用し、ディジタル量子コンピュータと2ビット誤りを制御可能なローカル量子シミュレータの両方に適用する(ノイズ)。
本研究は,スケーラビリティと雑音耐性のトレードオフに関する貴重な知見を提供するとともに,短期量子デバイスにおける実世界の最適化問題を解決するための量子アルゴリズムの実用化可能性を示すものである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:00:08 GMT)
Ultranarrow Superradiant Laser via Dressed Dark State [6.8] 超ラジアントレーザーはアルカリ金属のような原子の時計転移を利用して、バッドキャビティ限界における超安定光を生成する。
本研究は、静磁場を利用して、この暗い状態に小さな明るい成分で着飾ることによる超放射光レーザースキームを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:11:38 GMT)
Adaptive Federated Distillation for Multi-Domain Non-IID Textual Data [6.8] マルチドメイン非IIDシナリオの包括的セットを導入し、多様なデータを含む統一ベンチマークフレームワークを提案する。
実験結果から,本モデルがローカルクライアントの多様性を捉え,既存モデルと比較して性能が向上していることが示唆された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:51:14 GMT)
Progressive Semantic Residual Quantization for Multimodal-Joint Interest Modeling in Music Recommendation [6.8] 本稿では,2段階の新たなマルチモーダルレコメンデーションフレームワークを提案する。
最初の段階では、モーダル固有およびモーダルジョイントのセマンティックIDを生成する。
第2段階では、ユーザのマルチモーダルな関心をモデル化するために、マルチコードブックのクロスアテンションネットワークが設計されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:16:57 GMT)
Overhead in Quantum Circuits with Time-Multiplexed Qubit Control [6.8] 低温環境では、クビット駆動線数を制限することが望ましい。
2量子ゲートのカプラは、最大量子ビット数のオーバーヘッドを伴わずに、共通の駆動線上にグループ化可能であることを示す。
これらの結果は、大規模量子コンピュータへの継続的な進歩を約束している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:12:06 GMT)
Model-based Multi-object Visual Tracking: Identification and Standard Model Limitations [6.8] 本稿では,2次元境界ボックス検出を用いた歩行者追跡の課題に対処するために,多目的追跡手法を用いる。
出生・生存確率を含む連続時間に根ざしたモデルパラメータの選択について論じる。
結果、PMBMアルゴリズムは有望な結果をもたらすが、SPOモデルとデータとのミスマッチが明らかになる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:15:28 GMT)
Prediction of Distant Metastasis for Head and Neck Cancer Patients Using Multi-Modal Tumor and Peritumoral Feature Fusion Network [6.8] 頭頸部扁平上皮癌(HN SCC)における転移の意義
本研究では,CT画像,放射線画像,臨床データを統合し,HN SCC患者の転移リスクを予測するためのディープラーニングベースのフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:39:38 GMT)
CyberSleuth: Autonomous Blue-Team LLM Agent for Web Attack Forensics [6.7] 大きな言語モデル(LLM)エージェントは複雑なタスクを自動化する強力なツールである。
本研究は,現実的なWebアプリケーション攻撃の法医学的調査のためのLLMエージェント設計の体系的研究である。
我々は,パケットレベルのトレースとアプリケーションログを処理する自律エージェントCyberSleuthを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:45:31 GMT)
Uncertainty Under the Curve: A Sequence-Level Entropy Area Metric for Reasoning LLM [6.7] エントロピー領域スコア(英語: Entropy Area Score, EAS)は、大規模言語モデル(LLM)の解答生成過程における不確かさを定量化する指標である。
EASは効率的かつ解釈可能であり、LLMトレーニングにおける不確実性モデリングとデータ品質評価のための実用的なツールを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:16:15 GMT)
Distributed optimization: designed for federated learning [6.6] 本稿では,拡張ラグランジアン手法に基づく分散最適化アルゴリズムのクラスを提案する。
計算効率を向上させるために,複数の終了基準とパラメータ更新機構を開発する。
数値実験により,提案アルゴリズムは大規模設定において高い性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:53:27 GMT)
STCKGE:Continual Knowledge Graph Embedding Based on Spatial Transformation [6.5] 空間変換に基づく連続的知識グラフ埋め込みフレームワークSTCKGEを提案する。
この枠組みでは、実体位置は基底位置ベクトルとオフセットベクトルによって共同で決定される。
マルチホップ関係学習におけるSTCKGEの強い性能と予測精度を示し,平均MRR改善率は5.4%であった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:12:30 GMT)
The Uneven Impact of Post-Training Quantization in Machine Translation [6.4] 資源制約のあるハードウェア上での大規模言語モデル(LLM)の展開には量子化が不可欠だが、多言語タスクに対するその意味は未解明のままである。
我々は,1.7Bから70Bパラメータの5つのLLMを用いて,55言語にわたる機械翻訳におけるPTQの大規模評価を行った。
分析の結果,4ビットの量子化は高リソース言語では翻訳品質を保ちがちであるが,低リソース言語やタイポロジーに富んだ言語では,特に2ビット設定では顕著な劣化が発生することがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:22:31 GMT)
LatentExplainer: Explaining Latent Representations in Deep Generative Models with Multimodal Large Language Models [6.3] LatentExplainerは、深層生成モデルにおける潜伏変数の意味論的意味のある説明を自動的に生成するフレームワークである。
我々のアプローチは潜伏変数を摂動させ、生成されたデータの変化を解釈し、マルチモーダルな大言語モデル(MLLM)を用いて人間の理解可能な説明を生成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:51:18 GMT)
Continuous Language Model Interpolation for Dynamic and Controllable Text Generation [6.3] 私たちは、モデルが多様な、そしてしばしば変化する、ユーザの好みに動的に適応しなければならない、困難なケースに注目します。
線形重みに基づく適応手法を活用し、連続的なマルチドメイン補間子としてキャストする。
重みの変化がモデル出力の予測可能かつ一貫した変化をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:56:53 GMT)
Stochastic Gradients under Nuisances [6.3] 目的が未知のパラメータに依存する問題に対する勾配アルゴリズムを考察する。
この結果から, ニュアンスの存在は最適値を変化させ, 軌道を乱すことができるが, 古典的勾配アルゴリズムは適切な条件下で収束する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:07:40 GMT)
Addressing Tokenization Inconsistency in Steganography and Watermarking Based on Large Language Models [6.2] 本研究では, Alice と Bob のステガノグラフィーおよび透かしにおけるトークン化不整合(TI)に焦点を当てた。
ステガノグラフィーの段階的検証法とウォーターマーキングのポストホックロールバック法という,TI除去のための最適化された2つのソリューションを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:43:21 GMT)
Random Feature Representation Boosting [6.1] 本稿では, ブースティング理論を用いて, RFNNを構成する新しい手法であるRandom Feature Representation Boosting(RFRBoost)を紹介する。
RFRBoostは各レイヤでランダムな機能を使用してネットワーク表現の機能的勾配を学習し、RFNNの凸最適化の利点を保ちながら性能を向上させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:59:30 GMT)
Delay-adaptive Control of Nonlinear Systems with Approximate Neural Operator Predictors [6.1] 本稿では,未知かつ任意に長いアクチュエータ遅延を持つ非線形システムにおいて,予測器フィードバックコントローラを実装するための厳密な手法を提案する。
予測器の解析的に難解な性質に対処するため,学習したニューラル演算子マッピングを用いて近似した。
ニューラル演算子の普遍近似定理と遅延の輸送偏微分方程式(PDE)表現に基づく理論的安定性解析を行う。
Lyapunov-Krasovskii関数を通して、予測子の近似誤差と遅延境界に依存する力学系の半言語的実践的収束を証明した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:30:53 GMT)
RARR : Robust Real-World Activity Recognition with Vibration by Scavenging Near-Surface Audio Online [6.0] 認知症の4人に1人が独りで暮らしており、家族は遠くから介護の役割を引き受けることになる。
我々の拡張性のあるソリューションは、表面近傍の音響音響から合成されたデータに適応し、モデルを事前訓練し、非常に限られたデータで微調整できる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:06:35 GMT)
PVPO: Pre-Estimated Value-Based Policy Optimization for Agentic Reasoning [5.9] 本稿では,アドバンスト参照アンカーとデータ事前サンプリングによって強化された効率的な強化学習手法であるPVPOを提案する。
このアプローチは,複数のタスクにまたがる堅牢な一般化を示すだけでなく,さまざまなスケールのモデルにまたがるスケーラブルなパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:18:26 GMT)
MitoDetect++: A Domain-Robust Pipeline for Mitosis Detection and Atypical Subtyping [5.9] MitoDetect++はMIDOG 2025チャレンジ用に設計された統合ディープラーニングパイプラインである。
検出には、EfficientNetV2-LをバックボーンとするU-Netベースのエンコーダデコーダアーキテクチャを用いる。
分類には、Lo-Rank Adaptation (LoRA) を用いて効率よく微調整されたVirchow2視覚変換器を用いて、資源消費を最小限に抑える。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:19:51 GMT)
Emotionally-Aware Agents for Dispute Resolution [5.8] 本稿では、自動テキスト感情認識が紛争解決の文脈において、この影響について洞察を与えるかどうかを考察する。
我々は,主観的・客観的な結果の感情表現がどのように形成されるかを調べるために,買い手と売り手の論争対話の大規模なコーパスを使用する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:52:10 GMT)
Learning What is Worth Learning: Active and Sequential Domain Adaptation for Multi-modal Gross Tumor Volume Segmentation [5.7] 本稿では,その情報性や代表性に基づいて,最も価値の高いサンプルのラベル付けとトレーニングを優先するクエリ戦略を提案する。
提案手法はセグメンテーション性能を良好に向上し,最先端のADA法よりも優れていた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:14:55 GMT)
Audio-Guided Visual Editing with Complex Multi-Modal Prompts [5.7] 本稿では,複数のテキストと音声のプロンプトで複雑な編集タスクを,トレーニングを必要とせずに処理できる新しいビジュアル編集フレームワークを提案する。
トレーニング済みのマルチモーダルエンコーダと強力なゼロショット機能を活用し,多様なオーディオをビジュアル編集タスクに統合する。
本フレームワークは,テキストのみのアプローチが失敗する音声からの豊富な情報を組み込むことで,複雑な編集シナリオの処理に長けている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:00:30 GMT)
Boosting Skeleton-Driven SMT Solver Fuzzing by Leveraging LLM to Produce Formula Generators [5.5] 満足度・モデュロ理論 (Satifiability Modulo Theory, SMT) は、現代のシステムやプログラミング言語の研究に基礎を置いている。
以前のテストテクニックは、初期のソルババージョンではうまく機能していましたが、急速に進化する機能に追従するのに苦労しています。
近年のLarge Language Models (LLM) に基づくアプローチは,高度な問題解決能力の探求において有望であることを示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:21:26 GMT)
Deep Multiple Quantization Network on Long Behavior Sequence for Click-Through Rate Prediction [5.5] CTR(Click-Through Rate)予測では、長い行動列が候補項目に対するユーザの関心を評価する上で重要な影響を与える。
本稿では,DMQN(Deep Multiple Quantization Network)を提案する。
広告システムにおけるA/Bテストでは、DMQNはCTRを3.5%改善し、RPMを2.0%改善した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:58:47 GMT)
QTMRL: An Agent for Quantitative Trading Decision-Making Based on Multi-Indicator Guided Reinforcement Learning [5.4] 本稿では,多次元技術指標と強化学習(RL)を組み合わせた知的取引エージェントであるQTMRL(Quantitative Trading Multi-Indicator Reinforcement Learning)を提案する。
まず,S&P 500日毎OHLCVデータ(2000-2022)を用いて,5つのセクターにまたがる16の代表的な在庫について,23年間のS&P500日毎OHLCVデータ(2000-2022)を用いて総合的多指標データセットを構築した。
次に、データ処理、A2Cアルゴリズム、トレーディングエージェントモジュールを含むAdvantage Actor-Critic(A2C)アルゴリズムに基づく軽量RLフレームワークを設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:37:41 GMT)
Automatic Inspection Based on Switch Sounds of Electric Point Machines [5.3] 東日本旅客鉄道と日立は、人間の検査をIoTによる監視に置き換えようとしている。
本稿では,音を用いた電子的点検の自動化を目的とした技術研究の結果について述べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:01:20 GMT)
Generation of Four-Component Schrödinger Cat States via Floquet Engineering in a Hybrid Ferromagnet-Superconductor System [5.3] 強磁性体-超伝導ハイブリッド系で4C状態を生成するためのフロケットエンジニアリング手法を提案する。
その結果、固体プラットフォームにおける多成分キャットステートエンジニアリングへのスケーラブルなルートを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:43:32 GMT)
Feel the Difference? A Comparative Analysis of Emotional Arcs in Real and LLM-Generated CBT Sessions [5.3] 実際の認知行動療法とLLMによる認知行動療法の比較実験を行った。
合成対話は流動的で構造的に整合的であるが、実際の会話から重要な感情特性へと分岐する。
これらの知見は、現在のLCM生成療法データの限界を浮き彫りにし、メンタルヘルス応用における感情的忠実さの重要性を強調した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:19:31 GMT)
AI and Agile Software Development: A Research Roadmap from the XP2025 Workshop [5.3] 本稿では,スイスのBrugg-Windischで開催された,“AI and Agile: From Frustration to Success”と題したXP2025ワークショップにおいて,その重要な成果を要約する。
このワークショップは30以上の学際的な学術研究者と業界実践者を集め、ジェネレーティブ・人工知能(GenAI)とアジャイルソフトウェア開発の交差点における具体的な課題と新たな機会に取り組みました。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:56:32 GMT)
Supervised Stochastic Gradient Algorithms for Multi-Trial Source Separation [5.3] 我々は,多施設管理を取り入れた独立成分分析アルゴリズムを開発した。
特に、追加の監督により、成功率の高い合成非可逆モデルについて説明する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:06:44 GMT)
Poison Once, Refuse Forever: Weaponizing Alignment for Injecting Bias in LLMs [5.3] 大規模言語モデル(LLM)は、有害または安全でないプロンプトへの回答を拒否するように訓練することで、倫理的基準と安全要件を満たすように調整されている。
本稿では, 敵がLLMのアライメントを利用してインプラントバイアスを発生させるか, あるいはターゲット検閲を強制するかを実証する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:30:25 GMT)
Multi-View Graph Convolution Network for Internal Talent Recommendation Based on Enterprise Emails [5.3] 社内人材推薦は組織継続にとって重要な戦略である。
本稿では,メールデータから従業員の立場の2つの異なる次元をモデル化する新しい枠組みを提案する。
実験により,提案したゲーティングベース核融合モデルが他の核融合戦略よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:11:24 GMT)
Speech Emotion Recognition via Entropy-Aware Score Selection [5.2] 感情マッピング戦略は、3つの感情カテゴリーを4つの目標感情クラスに翻訳し、予測のコヒーレントな統合を可能にする。
The results on the IEMOCAP and MSP-IMPROV datasets showed that the proposed method provide a practical and reliable enhancement over traditional single-modality systems。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:58:09 GMT)
Unlearning Concepts from Text-to-Video Diffusion Models [5.0] 本稿では,テキスト間拡散モデルのテキストエンコーダの非学習能力をテキスト間拡散モデルに転送することで,新しい概念アンラーニング手法を提案する。
本手法は,著作権のある漫画キャラクタ,アーティストのスタイル,オブジェクト,人々の顔の特徴を解放することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:17:16 GMT)
Research Challenges in Relational Database Management Systems for LLM Queries [5.0] 大規模言語モデル(LLM)は、テキスト要約、感情分析、自動質問応答などのアプリケーションに欠かせないものとなっている。
近年,LLMはクエリ機能を強化し,高度なデータ処理をサポートするリレーショナルデータベース管理システムに統合されている。
オープンソースソリューションは現在、機能に制限があり、パフォーマンスが劣っている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:41:49 GMT)
Multi-robot Path Planning and Scheduling via Model Predictive Optimal Transport (MPC-OT) [5.0] 我々は、デッドロック障害のある共通空間において、100万ドルのロボットが100万ドルの目標にナビゲートされる仕組みを検討する。
最適計画に基づく戦略を導出し、重複しない軌道を保証する。
本研究では, 時空間構造を最適輸送へ統合し, テクトitremodelplans と textitremodelplans の助けを借りて予測できることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:47:33 GMT)
FW-GAN: Frequency-Driven Handwriting Synthesis with Wave-Modulated MLP Generator [4.9] FW-GANは、1つの例から現実的な書き手一貫性のあるテキストを生成するワンショット手書き合成フレームワークである。
我々のジェネレータは、位相対応のWave-MLPを統合し、微妙なスタイリスティックな手がかりを保ちながら、空間的関係をよりよく捉えている。
ベトナム語と英語の筆跡データセットの実験は、FW-GANが高品質でスタイルに一貫性のある筆跡を生成することを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:44:52 GMT)
CT-PatchTST: Channel-Time Patch Time-Series Transformer for Long-Term Renewable Energy Forecasting [4.7] 本稿では,風力と太陽エネルギーの長期的,高忠実度予測を実現するための新しいディープラーニングモデルを提案する。
CT-PatchTSTは、効率的なエネルギー貯蔵計画、制御、ディスパッチに不可欠な時間依存性とチャネル間相関の両方をキャプチャする。
この研究は、より安定で応答性があり、コスト効率の良い電力ネットワークの設計に寄与する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:30:21 GMT)
GDLLM: A Global Distance-aware Modeling Approach Based on Large Language Models for Event Temporal Relation Extraction [4.6] 大規模言語モデルに基づくグローバル距離対応モデリング手法を提案する。
まず,グラフ注意ネットワーク(GAT)を用いた距離対応グラフ構造を用いて,LLMの長距離依存性特性の把握を支援する。
我々は,短距離近接帯域との相関関係の同定を強化するために,ソフト推論に基づく時間的特徴学習パラダイムを設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:23:39 GMT)
MedGR$^2$: Breaking the Data Barrier for Medical Reasoning via Generative Reward Learning [4.6] 既存のデータセット上での監視ファインチューニング(SFT)はしばしば、目に見えないモダリティやタスクの一般化が不十分になる。
我々は,自己改善型活力サイクルを創出する新しいフレームワークである,医療推論のためのジェネレーティブ・リワード・ラーニング(MedGR$2$)を紹介した。
我々の実験は、MedGR$2$生産データを用いたSFTが、大規模で人為的なデータセットで訓練されたベースラインを超えることを実証した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:41:32 GMT)
Re4: Scientific Computing Agent with Rewriting, Resolution, Review and Revision [4.6] 大規模言語モデル(LLM)は、生成人工知能の活発で有望な分野として機能する。
本研究では,科学計算における代表的問題を解くための新しいエージェント・フレームワークを構築する。
提案するエージェントは,「リライト・レゾリューション・リビジョン・リビジョン」論理的連鎖を取り入れ,協調的かつ対話的な方法で統合されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:50:48 GMT)
ExpertSim: Fast Particle Detector Simulation Using Mixture-of-Generative-Experts [4.3] ExpertSimは、ALICE実験でZero Degree Calorimeter用に設計されたディープラーニングシミュレーションアプローチである。
提案手法はMixture-of-Generative-Expertsアーキテクチャを用いており,各専門家はデータの異なるサブセットをシミュレートする。
ExpertSimは精度を向上するだけでなく、従来のモンテカルロ法に比べて大幅に高速化されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:53:03 GMT)
E-ConvNeXt: A Lightweight and Efficient ConvNeXt Variant with Cross-Stage Partial Connections [4.2] E-ConvNeXtは複雑さの異なる構成で高精度な性能を維持することができる。
E-ConvNeXt-miniは0.9GFLOPsで78.3%、E-ConvNeXt-smallは3.1GFLOPsで81.9%に達する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:17:19 GMT)
Quantifying the Improvement of Accessibility achieved via Shared Mobility on Demand [4.2] 共有モビリティサービス(SMS)は、しばしば従来の公共交通機関(PT)のサービスに乏しい低密度地域のモビリティを改善することができる。
このようなポテンシャルは、アイソクロンベースのアクセシビリティ指標によって測定され、限られた時間で到達可能な機会の数を数えることができる。
本研究は、従来のPTおよびSMSからなるPTシステムの等時アクセス性を計算するための最初の方法を提案することにより、このギャップを埋める。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:55:22 GMT)
Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions [4.1] 複数のエージェント間のNash平衡相互作用のデータセットからパラメトリック制約を学習する逆動的ゲームベースアルゴリズムを提案する。
また,本手法により得られた相互作用制約を用いて,基礎となる制約を確実に満たす動作計画の設計を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:30:11 GMT)
Saliency-Guided Training for Fingerprint Presentation Attack Detection [4.1] 従順誘導訓練は、モデル学習を画像の重要な領域に向ける。
本稿では,指紋提示攻撃検出(PAD)タスクへの最初の応用について述べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:10:02 GMT)
Towards an Architectural Perspective for Sustainability: Bundle the Needs from Industry [4.0] 我々は,持続可能性の観点からのビジョン,すなわち,持続可能性の懸念をターゲットとして,自身の要素で満たされたアーキテクチャ的視点を改訂した概念を提示する。
本研究は, 産業ニーズを満たす持続可能性の観点から, 異なる視点要素の実践的妥当性を確認した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:30:48 GMT)
Breaking the Cold-Start Barrier: Reinforcement Learning with Double and Dueling DQNs [4.0] 本稿では,Double and Dueling Deep Q-Networks (DQN) を用いた強化学習手法を提案する。
これらの高度なDQN変異を行列因数分解モデルに統合することにより、大規模なeコマースデータセット上での優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:14:07 GMT)
Qubit Health Analytics and Clustering for HPC-Integrated Quantum Processors [4.0] 本稿では、キャリブレーションメトリクスを処理するためのデータ駆動型フレームワークを提案する。
我々は、時間的パターンとクロスメトリック相関を明らかにするために詳細なデータ分析を適用した。
本研究は,健康指標およびハードウェア駆動型メンテナンスと再校正勧告を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:48:53 GMT)
Digital Scale: Open-Source On-Device BMI Estimation from Smartphone Camera Images Trained on a Large-Scale Real-World Dataset [4.0] 既存のコンピュータビジョンアプローチは、最大14,500の画像のデータセットに限られている。
そこで我々は,WayBEDデータセットに基づいて学習した深層学習に基づくBMI推定手法を提案する。
CLAIDフレームワークを使用して,画像フィルタリングやBMI推定を含む全パイプラインをAndroidデバイスに展開する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:21:10 GMT)
Measuring Reasoning Utility in LLMs via Conditional Entropy Reduction [3.9] 条件エントロピーを用いた各推論ステップにおいて, 解幅Yのモデルの不確実性を測定する。
また、誤った推論経路は正しい推論よりも長い傾向があり、長い推論が必ずしもより良い結果をもたらすとは限らないことを示唆している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:43:38 GMT)
Multi-Agent Penetration Testing AI for the Web [3.9] MAPTAは、自動Webアプリケーションセキュリティアセスメントのためのマルチエージェントシステムである。
大規模な言語モデルのオーケストレーションとツール地上実行とエンドツーエンドのエクスプロイトバリデーションを組み合わせたものだ。
104Challenge XBOWベンチマークでは、MAPTAは76.9%の成功を収めた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:14:24 GMT)
FORGE: Foundational Optimization Representations from Graph Embeddings [3.9] 組合せ最適化問題は、科学と工学においてユビキタスである。
既存の手法では、ダウンストリームタスクごとに各問題分散のための専用モデルをトレーニングする必要がある。
本稿では,ベクトル量子化グラフオートエンコーダを多種多様な混合整数プログラミング(MIP)インスタンス上で事前学習する方法であるForgeを紹介する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:15:57 GMT)
Train-Once Plan-Anywhere Kinodynamic Motion Planning via Diffusion Trees [3.9] Diffusion Tree(ディフュージョンツリー、DiTree)は、拡散ポリシー(DP)を利用して、状態空間探索を効率的にガイドするフレームワークである。
本稿では,一般的なRRTプランナとDPアクションサンプリング器を組み合わせた実装により,DiTreeのパワーを実証する。
DiTreeは従来のSBPよりも平均3倍高速で、成功率を約30%向上させることで、他のすべてのアプローチより優れています。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:04:00 GMT)
InSQuAD: In-Context Learning for Efficient Retrieval via Submodular Mutual Information to Enforce Quality and Diversity [3.8] In-Context Learning(ICL)モデルの性能を向上させるために設計されたInSQuADを紹介する。
我々は、ICLタスクをターゲット選択問題としてモデル化し、サブモジュール相互情報(SMI)に基づく統一選択戦略を導入する。
InSQuADは、新しい可能性に基づく損失を通じて、検索モデルの品質と多様性の両方を強制するSMI関数のパラメータを学習する訓練パラダイムを導入する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:04:43 GMT)
Evaluating Quantumness, Efficiency and Cost of Quantum Random Number Generators via Photon Statistics [3.8] この研究は、量子乱数生成器(QRNG)メーカーとユーザの観点から、2つの重要な貢献を提示する。
製造業者にとって、単一光子ベースのQRNGの量子性を評価する従来の方法は、有限サンプルサイズのため統計的に信頼性が低い。
QRNGの基本的なパラメータは、量子性、効率性(エントロピーと乱数生成率)、コストである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:50:58 GMT)
KG-CQR: Leveraging Structured Relation Representations in Knowledge Graphs for Contextual Query Retrieval [3.7] 我々は、コンテキストクエリ検索(CQR)のための新しいフレームワークであるKG-CQRを提案する。
KG-CQRは、構造化された関係表現によるクエリエンリッチメントに焦点を当て、関連するKGサブグラフを抽出して、セマンティックにリッチなクエリコンテキストを生成する。
RAGBenchとMultiHop-RAGデータセットの実験結果は、KG-CQRの優れたパフォーマンスを示し、mAPが4-6%改善され、強力なベースラインモデルよりもRecall@25が2-3%改善された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:37:15 GMT)
Enhancing Natural Language Inference Performance with Knowledge Graph for COVID-19 Automated Fact-Checking in Indonesian Language [3.7] 本研究は,インドネシア語の自動ファクトチェックにおいて,知識グラフ(KG)を外部知識として活用し,NLIのパフォーマンスを向上させる。
本研究は,KGsを組み込むことで,NLI性能が有意に向上し,0.8616の精度が達成できることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:52:35 GMT)
Enhancing Automated Loop Invariant Generation for Complex Programs with Large Language Models [3.6] ACInvは、自動複雑プログラムループ不変生成ツールである。
静的解析とLLM(Large Language Models)を組み合わせることで、適切なループ不変量を生成する。
我々はACInvの実験を行い、ACInvはデータ構造を持つデータセットにおいて、以前のツールよりも優れていたことを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:17:12 GMT)
Improving the quality of Web-mined Parallel Corpora of Low-Resource Languages using Debiasing Heuristics [3.6] 異なるマルチPLMは特定の種類の文に偏りがあることを示し、ノイズの多い文が上位のサンプルに忍び込むことを可能にする。
これにより、ウェブマイニングコーパスでトレーニングしたNMTシステムの結果を改善し、マルチPLM間の格差を低減することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:20:32 GMT)
Full-Frequency Temporal Patching and Structured Masking for Enhanced Audio Classification [3.6] 本稿では,全周波数帯域に局所的な時間的コンテキストを分散させることにより,スペクトルの時間-周波数非対称性をよりよく一致させるパッチ方式を提案する。
また、固定マスク予算の下で、フル周波数マスクとローカライズされた時間周波数マスクを組み合わせたパッチアライン・スペクトログラム拡張であるSpecMaskを導入する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:13:20 GMT)
Fuzzy, Symbolic, and Contextual: Enhancing LLM Instruction via Cognitive Scaffolding [3.6] 本研究では,大規模言語モデル(LLM)の対話における認知行動に,アーキテクチャ的帰納バイアスがどのような影響を及ぼすかを検討する。
本稿では,ソクラテス学習における適応的構造的推論を促進するために,短期記憶スキーマと組み合わせたシンボリック・スキャフォールディング機構を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:46:13 GMT)
Designing Smarter Conversational Agents for Kids: Lessons from Cognitive Work and Means-Ends Analyses [3.6] 本稿では,ブラジルの子どもたちが学業,発見,エンターテイメントに会話エージェント(CA)をどのように使っているかを示す。
学校,発見,エンターテイメントの3つのCA機能と,親子支援を反映したレシピの足場を同定した。
私たちはデザインレコメンデーションを提供している: 足場付き会話ツリー、パーソナライズされたコンテキストのための子指定プロファイル、介護者のキュレーションされたコンテンツ。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:55:12 GMT)
Re-Representation in Sentential Relation Extraction with Sequence Routing Algorithm [3.5] 提案手法は,Tcred,Tacredrev,Retacred,Conll04といった一般的な意味的関係抽出データセットよりも優れていることを示す。
次に、前述したデータセットでパフォーマンスが良好である可能性について検討するが、他の類似の、より大規模なREデータセットであるWikidataではパフォーマンスが低かった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:54:35 GMT)
LLM Test Generation via Iterative Hybrid Program Analysis [3.5] Pantaは、コードを分析し、テストケースを構築する際に、人間が従う反復的なプロセスをエミュレートするテクニックである。
オープンソースプロジェクトのサイクロマティックな複雑性の高いクラスで実施した経験的評価は,Pantaが26%,ブランチカバレッジが23%向上したことを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:24:22 GMT)
Improving Google A2A Protocol: Protecting Sensitive Data and Mitigating Unintended Harms in Multi-Agent Systems [3.4] GoogleのA2Aプロトコルは、AIエージェントのためのセキュアな通信フレームワークを提供する。
A2Aの主な弱点は、トークンの寿命制御の欠如、強力な顧客認証の欠如、アクセス範囲の超過、同意フローの欠如である。
半信頼型マルチエージェントシステムに対する構造化脅威モデルに基づくプロトコルレベルの拡張を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:13:32 GMT)
The WASM Cloak: Evaluating Browser Fingerprinting Defenses Under WebAssembly based Obfuscation [3.4] ブラウザのフィンガープリント防御は、これまでJavaScript(JS)ベースのトラッキング技術の検出に重点を置いてきた。
WebAssembly(WASM)は、JSをWASMの低レベルのバイナリフォーマットに変換して悪意のあるロジックを難読化するため、潜在的な盲点を導入する。
本稿では,このようなWASMによる難読化が,現代の指紋認証の堅牢性にどのように影響するかを,初めて体系的に評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:21:51 GMT)
Bohr--Sommerfeld rules for systems [3.3] 実数直線上の半古典的自己随伴系に対して、ボーア-ソマーフェルト量子化則の完全で自己完備な定式化を示す。
主記号が曲線で囲まれた領域内で固有値交差を示す場合に焦点を当てる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:16:12 GMT)
Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments [3.3] 本稿では,学習に基づく安全集合の近似を用いたハイブリッドMPCローカルプランナを提案する。
我々は,HJ値関数が対応する符号距離関数(SDF)と非負残関数の差として表現できるという特性を利用する。
残余成分は、非負の出力を持つニューラルネットワークとしてモデル化され、計算されたSDFから減算され、結果として、設計上、SDFと同じくらい安全である実時間値関数の推定結果が得られる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:24:11 GMT)
Adam SLAM - the last mile of camera calibration with 3DGS [3.3] 本稿では,3DGSモデルを用いて,カメラパラメータに対する新しい視色損失のバックプロパゲーションによってキャリブレーションを微調整する手法を提案する。
新しいキャリブレーションだけで、3DGSの参照として使用されるデータセットで平均0.4dBのPSNRが向上する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:08:54 GMT)
Mitosis detection in domain shift scenarios: a Mamba-based approach [3.2] ドメインシフト下での有糸分裂検出のためのMambaベースのアプローチを提案する。
具体的には,VM-UNetアーキテクチャを利用してタスクを実行する。
MIDOG++データセットで実施された予備実験は、改善の余地が大きいことを示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:38:30 GMT)
A multi-task neural network for atypical mitosis recognition under domain shift [3.2] この問題に対処するために,マルチタスク学習に基づくアプローチを提案する。
主分類課題と相関する補助的タスクを活用することにより,本提案手法は,対象物のみに焦点を絞って分類を行うことを目的としている。
提案手法は,3つの異なるデータセットを用いた予備評価において有望な性能を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:39:30 GMT)
Efficient Neuro-Symbolic Learning of Constraints and Objective [3.2] 本稿では,NP-ハード推論問題の解法を学習するために,識別可能なニューロシンボリックアーキテクチャと損失関数を導入する。
自然入力からNPハード推論問題の解法を効率よく学習できることを実証的に示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:33:27 GMT)
Adaptive Monitoring and Real-World Evaluation of Agentic AI Systems [3.2] マルチエージェント人工知能システムは、研究機関からハイテイクドメインへと急速に移行している。
この「先進的な」続編は、アルゴリズムのインスタンス化や経験的な証拠を提供することで、そのギャップを埋める。
AMDMは擬似ゴールドリフトで異常検出遅延を12.3秒から5.6秒に減らし、偽陽性率を4.5%から0.9%に下げる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:52:49 GMT)
CardioMorphNet: Cardiac Motion Prediction Using a Shape-Guided Bayesian Recurrent Deep Network [3.2] CardioMorphNetは、短軸画像を用いた3次元心臓形状誘導変形登録のためのベイズ学習フレームワークである。
心臓運動推定における優れた性能を示し、最先端の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:58:14 GMT)
Uncertainty-Aware Trajectory Prediction via Rule-Regularized Heteroscedastic Deep Classification [3.1] ShiFT (Spectral Heteroscedastic Informed Forecasting for Trajectories) は、よく校正された不確実性モデリングと情報前処理を組み合わせた新しいフレームワークである。
我々のモデルは、本質的に不確実性が高い交差点のような複雑なシナリオで優れている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:33:23 GMT)
SaRoHead: Detecting Satire in a Multi-Domain Romanian News Headline Dataset [3.1] 見出しでさえ、風刺的な主内容のトーンを反映しなければならない。
ルーマニア語に対する現在のアプローチは、メイン記事と見出しを組み合わせることでトーンを検出する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:22:13 GMT)
Catwalk: Unary Top-K for Efficient Ramp-No-Leak Neuron Design for Temporal Neural Networks [3.1] 本研究では、スパイクボレー内のスパイクを一元的トップkを介してソートされたサブセットクラスタとして移動させることにより、キャットウォークニューロンの実装を提案する。
キャットウォークは、既存の0-RNLニューロンと比較して、それぞれ1.39倍と1.86倍の面積とパワーを持つ。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:50:36 GMT)
Tuning Block Size for Workload Optimization in Consortium Blockchain Networks [3.0] 本研究では,Hyperledger Fabricの理想的なブロックサイズを決定することにより,性能を最大化する数学的モデルを提案する。
機械学習を活用し、遺伝的アルゴリズムを用いてモデルを解くことにより、ブロックサイズ、トランザクションサイズ、ネットワーク容量などの要因がブロック処理時間にどのように影響するかを評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:03:00 GMT)
Ecological Cycle Optimizer: A novel nature-inspired metaheuristic algorithm for global optimization [3.0] エコロジーサイクル(Ecological Cycle、ECO)は、生態系におけるエネルギーフローと物質循環にインスパイアされた新しいメタヒューリスティックアルゴリズムである。
ECOの性能は、CS、HS、PSO、GWO、WOAを含む5つの高度に引用されたアルゴリズムに対して評価される。
最近開発された50のメタヒューリスティックアルゴリズムがアルゴリズムプールを形成するために選択され、IEEE CEC-2014とCEC-2017テストスイートで包括的な実験が行われた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:11:46 GMT)
Canonical Bayesian Linear System Identification [2.9] ベイズフレームワーク内のLTIシステムの標準形式を紹介する。
我々は、これらの最小パラメータ化における推論がすべての不変系の力学を完全に捉えることを厳格に証明する。
このアプローチは、意味のある構造を意識した事前の使用を解放する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:32:21 GMT)
AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning [2.9] 本稿では,データセットを生成するためのセキュアなC/C++に,現実的なカテゴリ固有の脆弱性を自動的に導入する新しいフレームワークを提案する。
提案したアプローチは、専門家の推論をシミュレートする複数のAIエージェントと、関数エージェントと従来のコード解析ツールをコーディネートする。
3つの異なるベンチマークから得られた116のコードサンプルに関する実験的研究は、我々のアプローチがデータセットの精度に関して他の手法よりも優れていることを示唆している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:59:39 GMT)
Signs of Struggle: Spotting Cognitive Distortions across Language and Register [2.9] 主な焦点は、認知的歪み、不合理な思考パターンの識別であり、精神的な苦痛を悪化させるのに重要な役割を果たしている。
本研究は,認知的歪み検出の言語間および登録間一般化に関する基礎研究である。
その結果,言語や書体スタイルの変化はモデルの性能に大きく影響するが,ドメイン適応手法は最も有望であることがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:28:07 GMT)
Bose-Einstein condensate of ultracold sodium-rubidium molecules with tunable dipolar interactions [2.7] 本研究では, 高効率蒸発冷却による基底状態ナトリウム-ルビジウム分子のボース-アインシュタイン凝縮体の生成について報告する。
これらの超低温の極性分子間の双極子相互作用を調整できることは、凝縮物の生成に不可欠である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:59:42 GMT)
Synthetic CVs To Build and Test Fairness-Aware Hiring Tools [2.6] 本稿では,データ提供キャンペーンを通じて収集した実材料をモデルとしたCVの合成データセット構築手法を提案する。
得られた1,730個のCVのデータセットを提示し、アルゴリズムによる雇用差別の研究のための潜在的なベンチマーク標準として想定する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:35:32 GMT)
The Joys of Categorical Conformal Prediction [2.5] Conformal Prediction (CP) は、有限サンプルキャリブレーションされた予測領域を提供する不確実性表現技術である。
CPは本質的に不確実量化(UQ)機構であり,その基本UQ能力は構造的特徴であることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:06:03 GMT)
From Law to Gherkin: A Human-Centred Quasi-Experiment on the Quality of LLM-Generated Behavioural Specifications from Food-Safety Regulations [2.5] LLM(Large Language Models)は、法的なテキストから高品質なGherkin仕様を生成することができる。
これらの仕様は、法的要件を開発者フレンドリーな形式に翻訳する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:04:34 GMT)
HiddenObject: Modality-Agnostic Fusion for Multimodal Hidden Object Detection [2.5] HiddenObjectは、Mambaベースのフュージョンメカニズムを使用して、RGB、熱、深度データを統合するフュージョンフレームワークである。
提案手法は、モダリティを横断する補完的な信号を捕捉し、不明瞭または偽装されたターゲットの検出を増強する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:09:22 GMT)
LEO: An Open-Source Platform for Linking OMERO with Lab Notebooks and Heterogeneous Metadata Sources [2.5] 顕微鏡研究では、異なるプラットフォームにまたがる大量のデータを管理および統合することが大きな課題である。
分散データシステム間のリンクを作成・管理するWebベースのプラットフォームであるLEOについて述べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:21:16 GMT)
A Joint Learning Framework for Bridging Defect Prediction and Interpretation [2.5] 本稿では,欠陥予測と解釈のための共同学習フレームワークを提案する。
予測器からインタプリタへ決定ロジックを伝達するフィードバックループを設計する。
共同学習フレームワークの損失関数には,解釈結果をペナルティ項として組み込む。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:13:33 GMT)
STDiff: A State Transition Diffusion Framework for Time Series Imputation in Industrial Systems [2.4] そこで本研究では,ある状態から次の状態へシステムがどのように進化するかを学ぶために,命令を書き換えるSTDiffを提案する。
STDiffは低いエラーを継続的に達成し、その利点は長いギャップで増大する。
これらの結果は、産業時系列の堅牢なアプローチとして、動的に認識され、明示的な条件付き計算をサポートする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:55:10 GMT)
Cutting is All You Need: Execution of Large-Scale Quantum Neural Networks on Limited-Qubit Devices [2.3] 本研究は,HQNNの量子回路切断のための新しい,実用的な手法を提案する。
これにより、制限量子ビットNISQデバイス上で大きな量子回路を実行することができる。
その結果,量子回路切断は量子機械学習の進歩に有望な技術であることが示唆された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:22:12 GMT)
Understanding and evaluating computer vision models through the lens of counterfactuals [2.3] この論文は、視覚分類器および生成モデルにおけるバイアスの説明、監査、緩和に反事実を使用するフレームワークを開発する。
体系的に意味のある属性を体系的に変更し、他の属性を固定することで、これらの手法は突発的な相関を明らかにする。
これらの貢献は、識別モデルと生成モデルの両方において、解釈可能性、公正性、因果性のための統一レンズとして反事実を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:11:49 GMT)
LocoMamba: Vision-Driven Locomotion via End-to-End Deep Reinforcement Learning with Mamba [2.3] 選択状態空間モデル上に構築された視覚駆動型クロスモーダルDRLフレームワークについて,特にMambaを活用して紹介する。
LocoMambaは、ニアリニア時間シーケンスモデリングを実現し、効果的に長距離依存関係をキャプチャし、長いシーケンスで効率的なトレーニングを可能にする。
静的かつ動いた障害物や不均一な地形を有するシミュレーション環境において,本手法の評価を行った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:09:41 GMT)
Enhancing Resilience for IoE: A Perspective of Networking-Level Safeguard [2.2] Internet of Energy (IoE)は、IoT駆動のデジタル通信と電力グリッドを統合し、効率的で持続可能なエネルギーシステムを実現する。
それでも、その相互接続性は、従来の安全を回避すべく設計された敵攻撃を含む、高度なサイバー脅威に対する重要なインフラを公開する。
本稿では,グラフトポロジとノード表現を協調的に最適化し,敵対的ネットワークモデル操作に抵抗するグラフ構造学習(GSL)ベースのセーフガードフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:42:47 GMT)
Multilingual Dataset Integration Strategies for Robust Audio Deepfake Detection: A SAFE Challenge System [2.1] SAFE Challengeは3つのタスクにわたる合成音声検出を評価する。
本研究では, 自己教師型学習フロントエンド, トレーニングデータ構成, 音声長設定を, 堅牢なディープフェイク検出のために検討する。
我々は第1タスク(修正されていない音声検出)と第3タスク(洗浄された音声検出)の両方において第2位を達成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:37:50 GMT)
Effects of Antivaccine Tweets on COVID-19 Vaccinations, Cases, and Deaths [2.1] アメリカ人の大半は2021年に予防接種を受けないことを選んだ。
最近の研究は、ワクチンの誤報が制御された環境での意図に影響を及ぼすことを示しているが、実際のワクチン接種率とは関連しない。
予防接種率と予防接種率との因果関係の観察的証拠を提示する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:42:23 GMT)
IAENet: An Importance-Aware Ensemble Model for 3D Point Cloud-Based Anomaly Detection [2.1] 重要なボトルネックは、3Dで2Dに匹敵する強力な事前訓練された基盤のバックボーンがないことだ、と私たちは主張する。
本稿では,2次元事前学習エキスパートを3Dエキスパートモデルに相乗させるアンサンブルフレームワークであるImportance-Aware Ensemble Network (IAENet)を提案する。
IAENetは、明らかに偽陽性率の低い新しい最先端技術を実現し、産業展開における実用的価値を強調している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:19:07 GMT)
Controlling Quantum Coherence of V-type Atom in Dissipative Cavity by Detuning and Weak Measurement Reversal [2.0] V型原子と散逸性単一モードキャビティからなる対話型システムを考える。
量子コヒーレンス(quantum coherences)は、自然発生干渉(SGI)、空洞と環境の結合、弱い測定とその逆転、原子と空洞の間の変形などのパラメータで研究される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:43:04 GMT)
MSARL: Decoupling Reasoning and Tool Use with Multi-Small-Agent Reinforcement Learning [2.0] ツールの使用から推論を明示的に分離するフレームワークであるMSARLを提案する。
MSARLでは、Reasoning Agentが問題とツール呼び出しを分解し、複数のツールエージェントが特定の外部ツールを専門にしている。
コード実行による数学的問題解決において、MSARLは単一エージェントベースラインに対する推論安定性と最終回答精度を大幅に改善する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:27:09 GMT)
Physics Informed Generative Models for Magnetic Field Images [1.8] 半導体製造において、欠陥検出と局所化は製品の品質と収量を確保するために重要である。
磁場イメージング(MFI)は、目標とするX線スキャンに対する関心領域のローカライズに、より効率的な手段を提供する。
我々は、合成MFIサンプルを生成するために、磁場画像のための物理情報生成モデル(PI-GenMFI)を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:00:23 GMT)
Individualized and Interpretable Sleep Forecasting via a Two-Stage Adaptive Spatial-Temporal Model [1.8] 睡眠の質は幸福に大きく影響する。
本稿では,睡眠の質を評価するための2段階適応時空間モデルを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:01:40 GMT)
Introducing the Quantum Economic Advantage Online Calculator [1.8] 本稿では,量子的優位性比較を容易にするためのオープンアクセスWebツールを提案する。
量子システムは、与えられたアルゴリズム上の問題に対して、古典的なコンピュータをいつ上回るかを計算します。
これらの推定値は、誤り訂正、オーバーヘッド、接続性に関する様々な仮定に基づいて容易に更新できる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:34:27 GMT)
Efficient Fine-Tuning of DINOv3 Pretrained on Natural Images for Atypical Mitotic Figure Classification in MIDOG 2025 [1.7] 非典型的有糸分裂図(AMF)は予後不良に関連する異常な細胞分裂のマーカーである。
MIDOG 2025チャレンジでは、複数のドメインにわたるAMF分類のベンチマークが導入されている。
自然画像に基づくDINOv3-H+視覚変換器の評価を行った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:45:22 GMT)
Human-AI Collaborative Bot Detection in MMORPGs [1.7] Massively Multiplayer Online Role-Playing Games (MMORPGs)では、自動レベル設定ボットが自動プログラムを利用して文字を大規模にレベルアップする。
コントラスト表現学習とクラスタリング技術を利用して,ロボットの自動レベル検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:17:35 GMT)
Safe and Efficient Social Navigation through Explainable Safety Regions Based on Topological Features [1.7] ソーシャルナビゲーションのシナリオにおいて,トポロジカルな特徴が説明可能な安全領域の創出にどのように貢献するかを検討する。
まず、グローバルルールに基づく分類を用いて、異なるシミュレーション動作の解釈可能な特性を提供する。
我々は、衝突を避けるトポロジカル特徴空間におけるゾーンを表す安全領域、$S_varepsilon$を定義する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:50:54 GMT)
Enhancing Document VQA Models via Retrieval-Augmented Generation [1.7] ドキュメントVQAは数十ページに及ぶドキュメントに対処しなければならないが、主要なシステムは依然として非常に大きな視覚言語モデルに依存している。
Retrieval-Augmented Generation (RAG) は魅力的な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:31:44 GMT)
Model-Driven Quantum Code Generation Using Large Language Models and Retrieval-Augmented Generation [1.6] 本稿では,Large Language Models (LLMs) を利用したモデル-テキスト/コード変換の新たな研究方向を提案する。
そこでは、モデル駆動のアプローチがコストを削減し、不均一なプラットフォーム環境と開発者のスキルの欠如に関連するリスクを軽減するのに役立つ。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:33:49 GMT)
Improving Quantization with Post-Training Model Expansion [1.6] 本研究では,事前学習した大規模言語モデルのサイズを選択的に拡張し,エンドツーエンドの再学習を伴わずにモデル品質を向上できることを示す。
特に、Llama3 1Bの重みとアクティベーションを4ビットに定量すると、完全精度のパープレキシティへのギャップを平均9%削減する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:33:02 GMT)
Photonic restricted Boltzmann machine for content generation tasks [1.6] コンテンツ生成タスクにおけるギブスサンプリングの高計算コストは、電子実装に重大なボトルネックを課す。
フォトニックコンピューティングを利用してギブスサンプリングを高速化するフォトニック制限ボルツマンマシンを提案する。
二次元イジングモデルを用いて, フォトニック加速ギブズサンプリングを実験的に検証した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:40:33 GMT)
Formal Verification of Physical Layer Security Protocols for Next-Generation Communication Networks (extended version) [1.6] 音響アニメーションを生成するIsabelle形式を用いたNeedham-Schroederプロトコルをモデル化する。
以上の結果から,すべてのシナリオにおいて信頼性が保たれていることが示唆された。
我々は、透かしとジャミングを統合したPLSベースのDiffie-Hellmanプロトコルを提案している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:14:44 GMT)
Explainability of Text Processing and Retrieval Methods: A Survey [1.6] 本稿では,自然言語処理と情報検索手法の説明可能性と解釈可能性について概説する。
具体的には、単語埋め込み、シーケンスモデリング、アテンションモジュール、トランスフォーマー、BERT、文書ランキングの説明に応用されたアプローチについて調査する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:21:45 GMT)
Heisenberg spin chain models for realising quantum battery with the aid of Dzyaloshinskii Moriya interaction [1.6] 8つの量子ビットからなるハイゼンベルクスピンチェインモデルを導入し、開、閉、超真空の3つの構成に分類する。
上記の系の充電力学は、電池、スピンスピン相互作用、横磁場からの寄与を含むハミルトニアンを用いて検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:15:19 GMT)
Automated Test Oracles for Flaky Cyber-Physical System Simulators: Approach and Evaluation [1.6] サイバー物理システム(CPS)のシミュレーションベースのテストは、CPSシミュレータの実行に時間を要するためコストがかかる。
CPSシミュレータは不安定で、一貫性のないテスト結果をもたらし、信頼性のあるテスト検証のために繰り返しテストを再実行する必要がある。
本稿では,テスト対象システムの入力上に定義された論理的および算術的述語集合として,CPSのアサーションに基づくテストオラクルを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:33:42 GMT)
Composable Life: Speculation for Decentralized AI Life [1.6] コンポスタブルライフ(Composable Life)は、デザイン・フィクション、体験型バーチャルリアリティ、科学研究を融合したハイブリッドプロジェクトである。
このプロジェクトは、オンチェーン人工生命の仮説上の最初の自殺を探求する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:21:15 GMT)
Quantum Advantage in Computational Chemistry? [1.6] 多くの場合、古典的な計算化学手法は、少なくとも今後数十年間は量子アルゴリズムよりも優れているだろう。
今後10年ほどで、量子コンピューティングは、小規模から中規模の分子を用いた高精度な計算に最も影響があることがわかりました。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:26:09 GMT)
P2C: Path to Counterfactuals [1.5] 提案するPath-to-Counterfactuals(P2C)は、不必要な結果を因果的に一貫した好ましい結果に変換する計画(順序づけられた行動列)を生成する、モデルに依存しないフレームワークである。
P2Cは、目的指向のAnswer Set Programming System s(CASP)を使用して、因果依存性によって自動的に発生する機能変更の計画記述を生成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:36:02 GMT)
Quantum-informed machine learning for the prediction of chaotic dynamical systems [1.5] 本稿では,高次元カオスシステムの長期動的挙動に対する量子インフォームド・機械学習(QIML)フレームワークを提案する。
本研究では, 倉本-シヴァシンスキー方程式, 2次元コルモゴロフ流, 完全に発達した3次元乱流流の断面の3つの代表系についてQIMLを評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:18:07 GMT)
LGDE: Local Graph-based Dictionary Expansion [1.5] ローカルグラフベース辞書拡張(英: Local Graph-based Dictionary Expansion、LGDE)は、単語の意味的近傍をデータ駆動で発見する手法である。
この結果から,LGDEは,単語の類似性や共起性に基づく手法と比較して,性能の向上を図ったキーワードのリストを充実させることがわかった。
実験結果と専門ユーザ評価の結果から,LGDEは,多様体学習に基づく類似性ネットワークにより,より有用なキーワードでシード辞書を拡張していることが示唆された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:44:35 GMT)
Assessing local deformation and computing scalar curvature with nonlinear conformal regularization of decoders [1.4] オートエンコーダは、低次元表現を学習するためのシンプルだが効果的なアプローチを提供する。
深層ニューラルネットワークにより近似されたデコードマップのための新しいタイプの幾何正規化を導入する。
この正規化手法は学習多様体のスカラー曲率の計算を可能にすることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:30:49 GMT)
SleepDIFFormer: Sleep Stage Classification via Multivariate Differential Transformer [1.4] 睡眠ステージの分類は、睡眠品質の評価と睡眠障害の診断に不可欠である。
機械学習と深層学習は活発に開発されているが、脳波(EEG)と脳波(EOG)の非定常性や変動性による課題に直面している。
本研究では,共同脳波とEOG表現学習のためのSleepDIFFormerを開発した睡眠段階分類法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:52:32 GMT)
Breaking Diffusion with Cache: Exploiting Approximate Caches in Diffusion Models [1.4] 攻撃者はキャッシュヒットプロンプトに基づいて既存のキャッシュされたプロンプトを復元することができる。
我々は、攻撃者のロゴを以前盗まれたプロンプトに埋め込んだ中毒攻撃を導入し、キャッシュにヒットした将来のユーザープロンプトにそれらをレンダリングする。
これらの攻撃はすべてサービスシステムを通じてリモートで実行され、近似キャッシングにおける深刻なセキュリティ上の脆弱性を示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:46:44 GMT)
Machine-Learning-Assisted Pulse Design for State Preparation in a Noisy Environment [1.3] 制御手法の設計に環境要因を取り入れた量子制御手法を提案する。
我々は、Deep Reinforcement Learning (DRL) と Supervised Learning (SL) の2つのアルゴリズムを用いて、ノイズを緩和する特定の制御パルスを設計する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:53:43 GMT)
SYNBUILD-3D: A large, multi-modal, and semantically rich synthetic dataset of 3D building models at Level of Detail 4 [1.3] 今回紹介するSynBUILD-3Dは, 大規模かつ多様かつマルチモーダルな3D合成住宅群を, レベル・オブ・ディーテール(LoD)4で620万棟以上導入した。
このデータセットでは、各建物はLoD 4の3Dワイヤーフレームグラフ(Modality I)、対応するフロアプラン画像(Modality II)、LiDAR風屋根点雲(Modality III)の3つの異なるモードで表現される。
各ビルディングワイヤフレームのセマンティックアノテーションは、対応するフロアプランイメージから導出され、部屋、ドア、窓に関する情報を含む。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:11:01 GMT)
Learning to Drive Ethically: Embedding Moral Reasoning into Autonomous Driving [1.3] 本稿では,道徳的考察と標準的な運転目標を明確に統合する,階層型セーフ強化学習(Safe RL)フレームワークを提案する。
決定レベルでは、衝突確率と有害度を組み合わせた複合的倫理的リスクコストを用いてセーフRLエージェントを訓練し、高レベルな運動目標を生成する。
実行レベルでは、Proportional-Integral-Derivative(PID)コントローラと組み合わせたパスプランニングが、これらのターゲットをスムーズで実現可能なトラジェクトリに変換する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:35:03 GMT)
Mask-Guided Multi-Channel SwinUNETR Framework for Robust MRI Classification [1.3] ODELIAコンソーシアムは、乳がんの診断と分類のためのAIベースのソリューションを育成する挑戦を組織した。
データセットには、6つの欧州センターから511の研究が含まれ、1.5Tと3Tの複数のベンダーから取得された。
本研究では,乳房領域マスキング,広範なデータ拡張,アンサンブル学習を取り入れたSwinUNETRベースのディープラーニングフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:11:24 GMT)
Public support for misinformation interventions depends on perceived fairness, effectiveness, and intrusiveness [1.2] 我々は1010人のアメリカのソーシャルメディアユーザーに対して、政府やソーシャルメディア企業が実施した10件の誤情報介入に対する支持と認識を評価するよう求めた。
以上の結果から,介入の公平さが支援決定の最も重要な要因であることが示唆された。
政策の展開と有効性において、世論が重要な役割を果たすのは、どのような介入が支持されるのか、なぜかを理解することが重要である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:58:50 GMT)
A Case Study of Balanced Query Recommendation on Wikipedia [1.1] 複数次元のバイアスを処理する BalancedQR の拡張を用いた BalancedQR のケーススタディを提案する。
ウィキペディアのデータセットからBalotdQRの拡張版を評価する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:52:31 GMT)
Optimization-Based Calibration for Intravascular Ultrasound Volume Reconstruction [1.0] 3DイントラVascular UltraSound (IVUS)は、臓器全体を再構築することで潜在的な解決策を提供する。
3Dプリンティングファントムを用いた3次元血管内超音波ボリュームの正確な再構成のための最適化に基づく校正法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:51:14 GMT)
SimuGen: Multi-modal Agentic Framework for Constructing Block Diagram-Based Simulation Models [1.0] SimuGenは視覚的なSimulinkダイアグラムとドメイン知識の両方を活用することで、正確なSimulinkシミュレーションコードを自動的に生成するフレームワークである。
ソースコードはhttps://github.com/renxinxing123/SimuGen_beta.comで公開されています。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:41:10 GMT)
Multiscale Graph Neural Network for Turbulent Flow-Thermal Prediction Around a Complex-Shaped Pin-Fin [1.0] 本研究では, 定常, 乱流, 熱的挙動を予測できる領域認識型マルチスケールグラフニューラルネットワークの開発について述べる。
ネットワークは、境界層、再循環、およびピンフィンの上流の停滞領域を精度良く予測し、壁時間を2~3桁削減した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:46:03 GMT)
A graph-theoretic approach to chaos and complexity in quantum systems [1.0] 可換グラフを通して、リー代数を持つ系のアンサンブル上でのスクランブル、カオス、および複雑性の平均概念を探索する。
我々は、可換グラフのグラフ理論的性質を、OOC(out-of-time-orderor)、フレームポテンシャル、系のハミルトニアンのフラストレーショングラフ、力学の下で進化する作用素のクリロフ複雑性にリンクする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:09:00 GMT)
Efficient distributional regression trees learning algorithms for calibrated non-parametric probabilistic forecasts [1.0] 回帰の文脈では、条件平均を推定する代わりに、出力の予測間隔を生成することでこれを実現できる。
本稿では, WIS や CRPS の損失関数の確率回帰木を学習するための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:16:57 GMT)
HPC Digital Twins for Evaluating Scheduling Policies, Incentive Structures and their Impact on Power and Cooling [1.0] 本稿では,HPCにおけるスケジューリングとディジタル双対の統合について紹介する。
これにより、パラメータの設定やスケジュール決定が物理的資産に与える影響を理解することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:16:49 GMT)
Federated nnU-Net for Privacy-Preserving Medical Image Segmentation [0.9] FednnU-NetはnnU-Netフレームワークのプラグイン・アンド・プレイによる学習拡張である。
我々は,nU-Netの分散トレーニング,すなわちフェデレーションフィンガープリント抽出(FFE)と非対称フェデレーション平均化(AsymFedAvg)をアンロックするための2つのフェデレーション手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:01:39 GMT)
GENRE-CMR: Generalizable Deep Learning for Diverse Multi-Domain Cardiac MRI Reconstruction [0.9] 本稿では,GAN(Generative Adversarial Network)ベースのアーキテクチャであるGENRE-CMRを提案する。
実験により、GENRE-CMRはトレーニングおよび未確認データに関する最先端の手法を超越し、未確認の分布に対して 0.9552 SSIM と 38.90 dB PSNR を達成したことが確認された。
我々のフレームワークは、高品質なCMR再構成のための統一的で堅牢なソリューションを提供し、不均一な取得プロトコルをまたいだ臨床適応可能なデプロイメントの道を開く。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:43:59 GMT)
Fine-Tuning Topics through Weighting Aspect Keywords [0.9] 従来のトピックモデリング技術は通常静的で教師なしであり、量子暗号のような急速に進化する分野には適さない。
我々は、専門家インフォームドインプットに基づくアスペクトの重み付けによりトピックモデリングを強化するフレームワークを作成するために、デザインサイエンス研究方法論を採用している。
本研究は、専門家が指導するアスペクト重み付きトピックモデリングが解釈可能性と適応性を高めることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:17:09 GMT)
Leveraging Large Language Models for Generating Research Topic Ontologies: A Multi-Disciplinary Study [0.9] 本研究では,研究トピック間の意味的関係を識別する大規模言語モデルについて検討する。
実験の結果,PEM-Rel-8Kの微調整により,すべての分野において優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:53:45 GMT)
Refining Text Generation for Realistic Conversational Recommendation via Direct Preference Optimization [0.9] Conversational Recommender Systems (CRS) は、自然な対話を通じてユーザの好みを抽出し、適切なアイテムレコメンデーションを提供することを目的としている。
現在のCRSは、短いセッションでアイテムを素早く推奨することで、現実的な人間のインタラクションから逸脱することが多い。
本研究は,対話履歴と項目推薦情報から対話要約を生成するために,LLM(Large Language Models)を活用することで,このギャップに対処する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:57:36 GMT)
Finite-Time Guarantees for Multi-Agent Combinatorial Bandits with Nonstationary Rewards [0.8] 意思決定者が各期間にエージェントのサブセットを選択して、個々のレベルの影響を事前に知ることなく、全体の結果を最大化する、逐次的なリソース割り当て問題について検討する。
当社の枠組みは、地域保健介入、ターゲットデジタル広告、労働維持プログラムなどの設定に適用される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:51:57 GMT)
A Graph-Based Test-Harness for LLM Evaluation [0.8] 我々は400以上の質問に対して、ダイナミックで体系的な医療ガイドラインのベンチマークのプロトタイプを初めて提示する。
我々はWHO IMCIハンドブックを200以上のノードを持つ有向グラフに変換し、年齢別シナリオを含む質問を生成する。
症状認識には優れたモデルがあるが,重症度,治療プロトコル,フォローアップケアに苦慮している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:10:59 GMT)
Multistakeholder Fairness in Tourism: What can Algorithms learn from Tourism Management? [0.8] 本研究の目的は、純粋にアルゴリズム研究の欠点を説明し、将来的な学際的なコラボレーションの必要性とニーズを強調することである。
我々は,このような共同作業が,観光における真のマルチステークホルダーフェアネスの理解と支援に向けて,アルゴリズムによる意思決定支援システムを強化するための基本的かつ必要なステップであると信じている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:25:57 GMT)
Occlusion Robustness of CLIP for Military Vehicle Classification [0.8] CLIPのような視覚言語モデル(VLM)は、画像とテキストを共有埋め込み空間にアライメントすることで、ゼロショット分類を可能にする。
軍用車両18クラスのカスタムデータセットを用いて,CLIP変異体の閉塞に対する堅牢性について検討した。
トランスフォーマーベースのCLIPモデルは、一貫してCNNを上回っています。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:16:55 GMT)
SKGE-SWIN: End-To-End Autonomous Vehicle Waypoint Prediction and Navigation Using Skip Stage Swin Transformer [0.8] 本研究は,ピクセル・ツー・ピクセル・コンテクストを意識したエンド・ツー・エンドの自動運転車モデルの開発に焦点をあてる。
SKGE-Swinアーキテクチャは、Swin Transformerとスキップステージ機構を使って、機能表現をグローバルに、そして様々なネットワークレベルで拡張する。
このモデルはCARLAプラットフォーム上で、現実の条件をシミュレートする逆シナリオを用いて評価される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:17:35 GMT)
Fairness for niche users and providers: algorithmic choice and profile portability [0.8] アルゴリズム的多元性がレコメンデーションエコシステムに与える影響について検討する。
これまでの研究によると、ニッチな消費者や(特に)ニッチなプロバイダーはアルゴリズムによる選択の恩恵を受けている。
ユーザプロファイルの扱いに関する異なるポリシーが、消費者や提供者にとって公正な結果とどのように相互作用するかを考察する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:38:59 GMT)
A Multi-Objective Genetic Algorithm for Healthcare Workforce Scheduling [0.8] 本稿では,多目的遺伝的アルゴリズム (MOO-GA) を提案する。
コスト、患者ケアのカバレッジ、スタッフの満足度を客観的に定義することにより、GAは膨大な検索スペースをナビゲートし、高品質で非支配的なソリューションの集合を特定する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:16:10 GMT)
Prediction of Local Failure after Stereotactic Radiotherapy in Melanoma Brain Metastases Using Ensemble Learning on Clinical, Dosimetric, and Radiomic Data [0.8] 本研究は悪性黒色腫脳転移症例に対する定位放射線治療後の病変特異的な予後を予測することを目的とした。
RFベースモデルは臨床モデルより優れており,ドシメトリックデータだけでは予測的ではなかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:34:20 GMT)
Transparent Semantic Spaces: A Categorical Approach to Explainable Word Embeddings [0.7] 本稿では,人工知能システムの説明可能性を高めるために,カテゴリ理論に基づく新しい枠組みを提案する。
主なトピックは、$ L_T $ と $ P_T $ の構成で、テキストの意味論のスキーマ表現を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:19:34 GMT)
GLaRE: A Graph-based Landmark Region Embedding Network for Emotion Recognition [0.7] 我々は、感情認識のための新しいグラフベースのランドマーク領域埋め込みネットワークであるGLaREを提案する。
提案手法は, AffectNetの64.89パーセント, FERGの94.24パーセントの精度を達成し, 既存のベースラインよりも優れていた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:17:57 GMT)
Communication scenario enables robust self-testing of n-party Greenberger-Horne-Zeilinger basis measurements [0.7] 絡み合った基底測定は、量子ネットワークをまたいだパーティ間の量子絡み合いの分散において重要な役割を果たす。
本研究では、n-qubit Greenberger-Horne-Zeilinger基底測定の自己テストを可能にする半デバイス非依存のアプローチを採用する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:32:35 GMT)
A Systematic Review and Layered Framework for Privacy-by-Design in Self-Sovereign Identity Systems [0.7] ブータンのような国々は、市民のアイデンティティを管理するためのSSIインフラを既に実装している。
EUは、eIDAS規制の改正により、SSIベンダーが計画されているEUデジタルIDウォレット用のSSIシステムを開発するための扉を開く。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:43:15 GMT)
Olive Tree Satellite Image Segmentation Based On SAM and Multi-Phase Refinement [0.7] この研究はSegment Anything Model(SAM)を統合し、農業計画においてオリーブの木を正確に識別し、セグメンテーションする。
提案手法は精度98%を達成し,SAMの初期性能82%を大きく上回った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:16:40 GMT)
Toward triggered generation of indistinguishable single-photons from MoTe$_2$ quantum emitters [0.7] 2次元遷移金属ジアルコゲナイド(TMD)は、そのようなソースに有望なプラットフォームを提供するが、その開発はスペクトル範囲が限られ、単一光子の不明瞭さが妨げられている。
ここでは, 2層型MoTe$$における近赤外量子エミッタの生成に, 決定論的ひずみと欠陥工学を用いて再現可能で体系的なアプローチを示す。
これらの結果は、高ノイズで高純度な単一光子源のための実行可能なプラットフォームとしてMoTe$を確立し、望ましくない不明瞭性を持ち、テレコム互換の量子フォトニクス技術への統合の道を開いた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:04:01 GMT)
Large Language Model Integration with Reinforcement Learning to Augment Decision-Making in Autonomous Cyber Operations [0.7] 強化学習(Reinforcement Learning, RL)は、サイバーセキュリティ分野における自律的な意思決定に大きな可能性を示している。
本研究では,サイバーセキュリティデータに基づいて事前訓練したLarge Language Model(LLM)の形で外部知識を統合する。
指導エージェントは早期訓練中に2倍以上の報奨を達成し,ベースラインよりも約4,500エピソードの速さで好意的な方針に収束することを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:52:03 GMT)
Deep Learning Framework for Early Detection of Pancreatic Cancer Using Multi-Modal Medical Imaging Analysis [0.6] 膵管腺癌(PDAC)は最も致命的ながんの1つである。
本研究はPDAC早期検出のためのディープラーニングフレームワークを開発し,検証する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:07:04 GMT)
High-Dimensional Gaussian Process Regression with Soft Kernel Interpolation [0.6] 構造化カーネル補間(SKI)と変分誘導点法を組み合わせたソフトカーネル補間(SoftKI)を導入する。
SoftKIは、学習した少数のポイントから、ソフトマックスを介してカーネルを近似する。
様々な事例においてSoftKIの有効性を実証し、データ次元が穏やかな場合、他の近似GP手法と競合することを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:58:56 GMT)
Normal and Atypical Mitosis Image Classifier using Efficient Vision Transformer [0.6] EfficientViT-L2を用いたMIDOG 2025チャレンジにおける非定型対正常ミトーシス分類に取り組む。
7種類の癌から13,938個の核を集積したデータセットを用い,非定型的なミトースを15。
このモデルは、0.859、ROC AUC 0.942、生の0.85の精度を達成し、メトリクス間の競争力とバランスの取れた性能を実証した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:45:06 GMT)
afspm: A Framework for Manufacturer-Agnostic Automation in Scanning Probe Microscopy [0.5] 走査型プローブ顕微鏡(SPM)のための自動化フレームワークを提案する。
我々のフレームワークは、独立したソフトウェアプロセス(コンポーネント)間で渡される汎用的な制御とデータ構造スキーマを定義する。
我々の仲介ロジックは、検出された実験問題を正すための単純なオーバーライド機構により、SPMへのアクセスを1つのコンポーネントに制限する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:51:09 GMT)
Safer Skin Lesion Classification with Global Class Activation Probability Map Evaluation and SafeML [0.5] 本稿では,全てのクラスのアクティベーション確率マップを画素レベルで確率的に解析する手法を提案する。
診断プロセスを統一的に可視化することで、誤診のリスクを低減することができる。
SafeMLの応用は、偽診断の検出を強化し、医師や患者に警告を発行する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:32:35 GMT)
Short remarks on shallow unitary circuits [0.4] 線形システムサイズよりも小さい深さの局所的なユニタリ回路は、大域的ハール乱ユニタリと容易に区別できることを示す。
浅いユニタリ回路学習問題の定式化のための簡単なアルゴリズムについて説明する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:54:11 GMT)
Experimentally probing entropy reduction via iterative quantum information transfer [0.4] 繰り返し量子計測とフィードバックを行う量子システムにおける熱力学的コストと情報フローの相互作用を実験的に検討する。
我々の研究は、様々な量子システムにおけるリアルタイム量子制御のエントロピーとエネルギティクスのコストを調査するための基礎を築いた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:40:31 GMT)
Linear optical quantum computing with a hybrid squeezed cat code [0.3] 本研究では, 圧縮された猫コードと偏光量子ビットを組み合わせた新しいハイブリッドコードを提案する。
シミュレーションにより,ハイブリッドキャットコードに対するハイブリッドキャットコードと圧縮キャットコードの優位性を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:29:30 GMT)
Enhancing Corpus Callosum Segmentation in Fetal MRI via Pathology-Informed Domain Randomization [0.3] 本稿では,CCDの先行知識を合成データ生成パイプラインに組み込む,病理情報を用いた領域ランダム化手法を提案する。
健常児248例, CCD26例, その他の脳疾患47例からなるコホートを用いて本法の有効性を検討した。
CCDサブタイプを識別する上での有用性を示すために, 臨床に関係のあるLCC (corpus callosum length) や容積などのバイオマーカーを導出する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:51:31 GMT)
Improving Aviation Safety Analysis: Automated HFACS Classification Using Reinforcement Learning with Group Relative Policy Optimization [0.3] 航空安全分析のための自動HFACS分類フレームワークを提案する。
本手法では,航空安全解析に適した多成分報酬システムを導入する。
その結果、GRPO最適化モデルは顕著な性能向上を達成した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:35:03 GMT)
A Mixture of Experts Gating Network for Enhanced Surrogate Modeling in External Aerodynamics [0.3] Mixture of Experts (MoE) モデルは、3つの異種、最先端の代理モデルの予測を組み合わせる。
システム全体のトレーニングと検証は、自動車空気力学のための高忠実度CFDシミュレーションの大規模でパブリックなベンチマークであるDrivAerMLデータセットで行われている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:34:10 GMT)
Entanglement asymmetry dynamics in random quantum circuits [0.2] ランダムユニタリ回路(RUC)における絡み合い非対称性のダイナミクスについて検討する。
任意の大きさのサブシステムの絡み合い非対称性を計算し、緩和時間スケールを解析する。
本研究は,多体物理学における対称性の多角的・計算可能なプローブとして,絡み合い非対称性を確認した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:40:48 GMT)
Automated Quality Assessment for LLM-Based Complex Qualitative Coding: A Confidence-Diversity Framework [0.2] 本研究は、モデル信頼度とモデル間コンセンサスを組み合わせた二重信号品質評価を拡張する。
このアプローチを,法的理由づけ(390件),政治的分析(645件),医学的分類の3分野にわたって体系的に検証した。
これらの結果は、自動品質評価が、アクセス可能から複雑な分析タスクにスケール可能であることを証明し、AI支援定性的研究を拡大するための実用的なツールを提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 06:25:07 GMT)
LLM-Based Agents for Competitive Landscape Mapping in Drug Asset Due Diligence [0.2] 我々は、エージェントAIシステム内で高速な薬物資産デューディリジェンスに使用される競合発見コンポーネントを記述し、ベンチマークする。
競合するAIエージェントは、表示が与えられた場合、その表示の競合する風景を含むすべての薬物を検索する。
当社の競合発見エージェントは,OpenAI Deep ResearchとPerplexity Labsを上回る83%のリコールを達成した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:44:09 GMT)
Population-Scale Network Embeddings Expose Educational Divides in Network Structure Related to Right-Wing Populist Voting [0.2] 私たちは5つの共有コンテキストを表す人口規模ネットワークから、オランダのすべての人々のための埋め込みを作成しました。
埋め込みだけで、右翼のポピュリストはチャンスレベル以上の投票をするが、個々の特性よりも悪い結果が得られた。
本研究は,人口規模ネットワークの埋め込みを解釈可能であることを示すことによって,方法論的に貢献する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:57:44 GMT)
Mask & Match: Learning to Recognize Handwritten Math with Self-Supervised Attention [0.2] 我々は手書き数式(HMER)の認識のための自己教師型学習フレームワークを提案する。
我々のアプローチは、大域的および局所的なコントラスト的損失の組み合わせを用いて、画像エンコーダを事前訓練することから始まる。
この研究の重要な貢献は、プログレッシブな空間マスキング戦略を用いて訓練された、新しい自己監督型アテンションネットワークである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:12:05 GMT)
Sequential Hard Mining: a data-centric approach for Mitosis Detection [0.2] 従来提案されていた手法をベースとして,強化技術にインスパイアされたトレーニングデータの効率的なサンプリングに重点を置いている。
我々はMIDOG 2025チャレンジの2つのトラックに対する候補解を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:47:07 GMT)
Simulating Quantum Circuits with Tree Tensor Networks using Density-Matrix Renormalization Group Algorithm [0.1] 量子回路シミュレーションのための密度行列再正規化群(DMRG)アルゴリズムをツリーテンソルネットワーク(TTN)に拡張する。
ランダム回路では,TTNに適したツリー状ゲートレイアウトを考案し,TTNがMPSよりも少ないメモリを必要とすることを示す。
この結果から,TTNを用いたDMRGアルゴリズムは量子回路をシミュレーションする上で有望なフレームワークであることがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:21:30 GMT)
Evaluating Efficiency and Novelty of LLM-Generated Code for Graph Analysis [0.1] 大規模言語モデル(LLM)は、ソフトウェア開発の自動化にますます使われています。
本稿では、グラフ解析ルーチンの効率的なC実装を生成するLLMの能力について包括的に研究する。
これらのモデルがトランスフォーメーションアルゴリズムテクニックを発明する可能性は、将来の研究にとって魅力的なフロンティアである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:22:23 GMT)
Classifying Mitotic Figures in the MIDOG25 Challenge with Deep Ensemble Learning and Rule Based Refinement [0.1] MFs(Mitotic figure)は、腫瘍のグレーティングに関係のあるバイオマーカーである。
非定型的MF(AMF)と通常のMF(NMF)との鑑別は依然として困難である。
この作業では、ConvNeXtBaseモデルのアンサンブルがAUCMEDIでトレーニングされ、ルールベースの改良(RBR)モジュールで拡張された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:50:27 GMT)
Machine-learning based particle-flow algorithm in CMS [0.0] The Particle-flow (PF) algorithm provides a global event description by restructing final-state particles and is central to event reconstruction in CMS。
そのようなアプローチのひとつとして、MLPF(Machine-learned Particle Flow)が、トランスフォーマーモデルを使用して、トラックやクラスタから直接単一パスで粒子を推論する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:28:47 GMT)
When technology is not enough: Insights from a pilot cybersecurity culture assessment in a safety-critical industrial organisation [0.0] 本稿では,従業員のサイバーセキュリティ知識,態度,行動,組織的要因について検討する。
安全クリティカル産業の世界的組織を対象に,調査と半構造化インタビューを行った。
全体的なCSCプロファイルは似ているが、明らかな課題があった。
違いの主なコントリビュータは次のとおりである。 国1は、CSトレーニングとポリシーへのアクセスが制限され、監視ギャップが強調される外部の従業員がいました。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:11:18 GMT)
Weighted Support Points from Random Measures: An Interpretable Alternative for Generative Modeling [0.0] ランダムな重み付きサポートポイントに基づく生成モデリングフレームワークを提案する。
提案手法は,固定されたデータセットから多種多様で解釈可能なサンプルセットを生成する。
提案手法は,ブラックボックス代替品の計算コストのごく一部で,高品質で多様な出力を生成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:58:39 GMT)
WaveLLDM: Design and Development of a Lightweight Latent Diffusion Model for Speech Enhancement and Restoration [0.0] 本研究では,高効率なニューラルオーディオと遅延拡散を統合したWaveLLDMを導入する。
低い対数スペクトル距離(LSD)スコア(0.48から0.60)で正確なスペクトル再構成を実現し、目に見えないデータに適応できる。
WB-PESQスコアは1.62から1.71、STOIスコアは0.76から0.78である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:38:42 GMT)
Vibe Coding: Is Human Nature the Ghost in the Machine? [0.0] 私たちは、ヒューマンプロダクトリーダとAIソフトウェアエンジニアの3つの“バイブコーディング”セッションを分析しました。
チームダイナミクス,コミュニケーションパターン,開発成果の類似点と相違点を検討した。
驚いたことに、その後の会話では、AIエージェントがその成果を体系的に誤って表現していたことが判明した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:48:48 GMT)
Variational Calculation of the Hyperfine Stark Effect in Atomic $^{87}$Rb, $^{133}$Cs, and $^{169}$Tm [0.0] 原子超微細構造遷移エネルギーの計算に対する電子的変化のアプローチを示す。
この方法は、中間原子状態の計算を完全に回避し、それぞれの超微粒子レベルに関与する電子状態の波動関数のみを必要とする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:17:27 GMT)
Unitary Synthesis with AlphaZero via Dynamic Circuits [0.0] ユニタリ合成は、ターゲットのユニタリ変換を量子ゲートの列に分解する過程である。
我々は,AlphaZeroにインスパイアされた強化学習エージェントを用いて,ユニタリの正確なコンパイルを行う手法を提案する。
このアプローチは低い推論時間を実現し、異なるゲート集合、およびキュービット接続性に対して多元性を証明する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:15:28 GMT)
Uncertainty relations and fluctuation theorems for Bayes nets [0.0] そのようなベイズネット内の系の任意の集合のエントロピー生成(EP)を管理する揺らぎ定理を導出する。
次に、全体系のEPと個々の系内の確率電流の精度に関する熱力学的不確実性関係を導出する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:46:57 GMT)
UI-Bench: A Benchmark for Evaluating Design Capabilities of AI Text-to-App Tools [0.0] UI-Benchは、競合するAIテキスト・アプリツール間の視覚的卓越性を評価する最初の大規模ベンチマークである。
システムはTrueSkill由来のモデルでランク付けされ、キャリブレーションされた信頼区間を生成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:20:00 GMT)
Toward 48 dB Spin Squeezing and 96 dB Signal Magnification for Cosmic Relic Searches with Nuclear Spins [0.0] 量子光学の概念が超伝導回路に結合した核スピンにどのように適応できるかを示す。
プロトコルは、アクシオンとダークフォトンダークマターの探索を著しく加速し、既存のアクシオン実験の到達範囲を拡大する可能性がある。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:01:03 GMT)
Thermodynamic Constraints on Information Transmission in Quantum Ensembles [0.0] 特に、量子状態の非直交性は、その区別可能性を制限する。
この研究は、量子情報の準備、進化、読み出しに対するそのような制約の影響を探求する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:35:47 GMT)
Theoretical foundations of the integral indicator application in hyperparametric optimization [0.0] 本稿では、様々な性能指標を1つの統合基準に組み合わせた積分評価法を用いて、レコメンデーションアルゴリズムのハイパーパラメトリック最適化の概念について論じる。
この研究の理論的重要性は、リコメンデーションシステムだけでなく、幅広い機械学習やデータ分析タスクにも適用可能な、普遍的な多基準最適化ツールの開発にある。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:41:38 GMT)
The carbon nanotube gatemon qubit [0.0] 本稿では,一分子,一次元カーボンナノチューブに基づくゲートモンのコヒーレント制御について述べる。
測定された量子ビットスペクトルはゲート電圧で調整することができ、ナノチューブの量子ドットの挙動を反映する。
六方晶窒化ホウ素基板を用いた超クリーン集積により, カーボンナノチューブ系量子ビットのコヒーレンス時間は200nとなった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:30:37 GMT)
The Living Library of Trees: Mapping Knowledge Ecology in the Arnold Arboretum [0.0] このプロジェクトは1872年にボストンで設立された281エーカーのリビングミュージアムであるハーバード大学のアーノルド・アーボレタムに焦点が当てられている。
1世紀以上にわたるカリキュラムデータに基づいて、この研究は、歴史的分析と計算手法を組み合わせて、植物や人々の伝記を視覚化する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:37:09 GMT)
The Hidden Cost of Defaults in Recommender System Evaluation [0.0] RecBoleの内部デフォルト、特に文書化されていない早期停止ポリシーは、Random SearchとBayesian Optimizationを早期に終了できることを示す。
この結果から,隠れたフレームワークロジックは,検索戦略の相違に匹敵する変動性をもたらすことが判明した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:36:10 GMT)
The Application of Virtual Environments and Artificial Intelligence in Higher Education: Experimental Findings in Philosophy Teaching [0.0] 本研究では,仮想環境と人工知能が大学生の学習体験をいかに向上させるかを検討する。
ウォルターのキューブ技術と訓練されたAIメディエーターは10の哲学的トピックの教育に統合された。
その結果,80%の参加者が成績や成績が良好であった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:14:26 GMT)
Symmetry Properties of Quantum Dynamical Entropy [0.0] 対称性の存在下での量子力学エントロピーの正確な挙動について検討する。
この結果から, 量子力学における対称性の役割が明らかになった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:41:51 GMT)
Subspace-Protected Topological Phases and Bulk-Boundary Correspondence [0.0] 自由フェルミオン位相における部分空間の役割を解明する。
ハミルトン多様体に対する部分空間の性質により、新しい位相不変量を定義することができる。
部分空間保護位相におけるバルク境界対応の確立と実証を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:38:05 GMT)
Spacetime Density Matrix: Formalism and Properties [0.0] 我々は時空密度行列の一般形式と性質を開発する。
時空密度行列はリウヴィル・フォン・ノイマン型運動方程式を満たすことを示す。
我々は第2モーメントの普遍的な短時間の振る舞いを導き出す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 03:50:35 GMT)
Solvable Quantum Circuits in Tree+1 Dimensions [0.0] まず、木々の対称性を保った厳密な局所量子回路を構築する方法を示す。
次に、ダイナミクスが正確に解けるゲートの族を紹介します。
木単位性の予期せぬ特徴の1つは、時間外相関器の「最大蝶の速度」力学と、複数の方向における非消滅相関関数の存在とのトレードオフである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:32:16 GMT)
Soft edges: the many links between soft and edge modes [0.0] ゲージ理論と重力の境界は、有限と距離の両方で対称性と電荷をもたらす。
ここでは、本質的対称性とそれらの電荷との間には、他方では、極限を必要とせずに、より興味深い関係があることが示される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:51:26 GMT)
Selective Retrieval-Augmentation for Long-Tail Legal Text Classification [0.0] 本稿では,この問題の解法としてSRA(Selective Retrieval-Augmentation)を提案する。
SRAは、トレーニングセット内の低周波ラベルに属するサンプルの増強に重点を置いており、よく表現されたクラスに対するノイズの導入を防止している。
SRAは、現在のすべてのLexGLUEベースラインと比較して、より高いマイクロF1とマクロF1スコアを得る。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:16:42 GMT)
Searching the Title of Practical Work of the Informatics Engineering Bachelor Program with the Case Base Reasoning Method [0.0] ケースベース推論(CBR)は、最も類似度の高いケースにおいて経験に基づくケース解決手法である。
TF-IDFは、各実用作品のタイトルワードのベクトル化と類似度値の計算のためのコサイン類似性の処理に使用される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:45:22 GMT)
Role of sub-barrier dynamics in coherent and incoherent radiation during tunneling ionization [0.0] 異なるスペクトル領域における異なるメカニズムの寄与について検討した。
非対称レーザーパルスにおけるほぼゼロ周波数のブルネル放射を増幅する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:07:29 GMT)
Rethinking Transformer Connectivity: TLinFormer, A Path to Exact, Full Context-Aware Linear Attention [0.0] 本稿では,新しいリニアアテンションアーキテクチャ-textbfTLinFormerを提案する。
ニューロン接続パターンを再構成することにより、TLinFormerは正確な注意スコアを計算しながら厳密な線形複雑性を実現する。
TLinFormerは,textbfinference遅延, textbfKVキャッシュ効率, textbfMemoryフットプリントといった重要な指標において,圧倒的な優位性を示すことを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:10:19 GMT)
Relativistic Quantum Otto Engine: Generalized efficiency bounds and frictional effects [0.0] 相対論的運動と非断熱駆動が量子オットーエンジンに与える影響を分析する。
非断熱駆動では、突然の圧縮と拡張作業のストロークを考慮する。
超相対論的限界においても、エンジンが達成できる最大効率は1/2に制限されていることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:50:38 GMT)
Reinforcement Learning for Optimizing Large Qubit Array based Quantum Sensor Circuits [0.0] 本稿では、拡張回路最適化のための強化学習とテンソルネットワークに基づくシミュレーション(MPS)の工学的統合を提案する。
我々の強化学習エージェントは、量子フィッシャー情報(QFI)と絡み合いエントロピーを最大化するために回路の再構成を学ぶ。
実験の結果,QFI値が0.8-1.0の範囲で1, 絡み合いエントロピーに近づき, 最大90%の深さ, ゲート数で一貫した改善が得られた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:51:28 GMT)
Qubit thermalization by random pulses: Asymptotic state factorization [0.0] 2キュービット系では、衝撃が各キュービットに独立に影響を及ぼすと、平衡密度行列は初期状態の性質に関係なく1キュービット平衡密度の単純な積となる。
これは量子コンピュータにおける量子ビットの絡み合いに対する潜在的な応用である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:58:45 GMT)
Quasicrystal Scattering and the Riemann Zeta Function [0.0] 原子の有限長1次元点状配列である$chi(x)$に対して、原子密度をほぼ一定にするシフト演算により、素数の分布に関連する数値散乱計算を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:22:27 GMT)
Quantum-Aware Network Planning and Integration [0.0] 同じ物理媒体上の古典的なトラフィックと量子信号が共存する必要性がある。
現在、ネットワークレベルでQKDを統合する取り組みが進行中である。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:31:28 GMT)
Quantum circuit lower bounds in the magic hierarchy [0.0] 任意のサイズのクリフォード回路と2量子ゲートを持つ定数深度回路を交換する量子回路モデルであるマジック階層を導入する。
クリフォード回路とtextsfQNC0$ からなる回路で、特定の明示的な量子状態が概ね準備できないことを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:51:40 GMT)
Quantum algorithms for equational reasoning [0.0] シンボリックな表現を解析するための量子計算フレームワークである量子正規化(quantum normal form reduction)を導入する。
テンソルネットワークシミュレーションを用いて量子インスパイアされたアルゴリズムを実演する。
このフレームワークは、量子回路設計からデータ圧縮まで、領域における量子記号計算の道を開く。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:00:06 GMT)
Quantum Telegraph Behavior as a Result of Continuous Weak Measurement [0.0] 連続弱測定の単純なモデルが単一量子ビットを用いた実験で見られる電信スイッチング挙動を引き起こすことを示す。
これは量子力学の連続的な崩壊解釈を支持するが、不整合極限における定常過程の連続的な検出のモデルと見なすこともできる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:29:53 GMT)
Quantum Machine Learning for Optimizing Entanglement Distribution in Quantum Sensor Circuits [0.0] 絡み合いは高い感度と測定精度を達成する上で重要な要素の1つである。
本稿では,量子センサ回路の絡み合い分布を最適化するために,量子機械学習技術を用いた新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 22:45:54 GMT)
Quantum Graph Attention Network: A Novel Quantum Multi-Head Attention Mechanism for Graph Learning [0.0] 量子グラフ注意ネットワーク(Quantum Graph Attention Network、QGAT)は、変動量子回路をアテンション機構に統合するハイブリッドグラフニューラルネットワークである。
複雑な構造的依存関係を捕捉するQGATの有効性を示し、帰納的シナリオにおける一般化を改善した。
実験により、量子埋め込みは特徴や構造的ノイズに対するロバスト性を高め、実世界のノイズデータを扱う利点を示唆している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:24:16 GMT)
Quantifying Label-Induced Bias in Large Language Model Self- and Cross-Evaluations [0.0] 本研究では,ChatGPT,Gemini,Claudeによる自己モデルおよび横断モデル評価のバイアスについて検討した。
各モデルで書かれたブログ投稿は、全体的な選好投票と品質評価の両方を用いて、3つすべてで評価された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:59:23 GMT)
PlantVillageVQA: A Visual Question Answering Dataset for Benchmarking Vision-Language Models in Plant Science [0.0] PlantVillageVQAデータセットは、55,448枚以上の画像に基づいて、高品質なQA(QA)ペア193,609枚で構成されている。
データセットは、科学的正確性と関連性に関して、ドメインの専門家によって反復的にレビューされた。
本研究の目的は,植物病の診断精度を高めるために,公開され,標準化され,専門家が検証したデータベースを提供することである。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:35:42 GMT)
Physics-Constrained Machine Learning for Chemical Engineering [0.0] 物理制約付き機械学習(PCML)は、物理モデルとデータ駆動のアプローチを組み合わせて、信頼性、一般化可能性、解釈可能性を改善する。
この視点は最近の発展を要約し、化学工学にPCMLを適用する際の課題/機会を強調している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:52:01 GMT)
Physical constraints on effective non-Hermitian systems [0.0] 多体非エルミート系(NH)に対する一般的なアプローチは、ハミルトニアンの反エルミート部分を直接松原グリーン函数に組み込むことである。
ここでは、このようなアプローチは、相互作用を持つシステムの標準フレームワークと互換性がないことを示す。
我々は、従来の相互作用物理学と区別することで、このようなシステムに対して一貫した物理的記述を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:59:46 GMT)
Photon State Evolution in Arbitrary Time-Varying Media [0.0] 我々は、任意の時間変化の誘電率と透過性を持つ媒体における量子状態の進化を研究するために、瞬時固有状態法を導入する。
このような媒体中では、単一光子対を真空から生成する最大確率は25%であり、ベル状態は最大確率84%で生成可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:34:15 GMT)
Optimal Work Extraction from Finite-Time Closed Quantum Dynamics [0.0] 閉量子系からの有限時間最適作業抽出の問題について検討する。
このフレームワーク内では、最適な作業抽出プロトコルが驚くほどシンプルになる。
Su(2)制御の解析解と、Su(n)制御のようなより複雑な場合の数値解を得る。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:52:59 GMT)
Optical Integration With Heralded Single Photons [0.0] 本課題では,光子同士の空間的相関が果たす役割について検討する。
この積分は、位相のみの空間光変調器で符号化された二相相上で実現される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:52:43 GMT)
Nuclear spin relaxation in solid state defect quantum bits via electron-phonon coupling in their optical excited state [0.0] 我々は、14$Nの核スピンのスピン-格子緩和が、軌道自由度との強い絡み合いにより著しく強化されていることを示す。
我々は、軌道縮退を示す三角欠陥に対して、軌道依存のスピンハミルトニアンを予測するための単純で汎用的なテクスタイブイニシアト方式を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:18:06 GMT)
Non-Hermitian Origin of Detachable Boundary States in Topological Insulators [0.0] 非エルミート境界状態を分離可能な位相境界状態とみなす。
固有非エルミート位相が必然性スペクトルフローをもたらすことを示す。
この接続と$K$-理論に基づいて、ワニエローカライザビリティと分離可能な位相境界状態の分類を完成させる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:53:55 GMT)
Multimode rotationally symmetric bosonic codes from group-theoretic construction [0.0] 我々は[Phys. Rev. Lett. 133, 240603 (2024) の群論的枠組みに着想を得た多モード対称ボソニック符号の新しい族を導入する。
我々の構成は、複数のモードにわたる回転対称性を保ち、完全なパウリ群の線形光学的実装を可能にする。
我々は2モード二項符号のインスタンスを解析的に構築し、数値的にベンチマークし、単モードの回転対称なボソニック符号とは異なり、これらの符号は劣化防止と光子損失のトレードオフを示さないことを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:48:00 GMT)
Modality-Specific Speech Enhancement and Noise-Adaptive Fusion for Acoustic and Body-Conduction Microphone Framework [0.0] 体導マイクロホン信号(BMS)は空中音をバイパスし、強い耐雑音性を提供する。
本稿では,BMSと音響マイクロホン信号(AMS)を組み合わせた新しいマルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:26:32 GMT)
Microarchitecture Design and Benchmarking of Custom SHA-3 Instruction for RISC-V [0.0] IntelのAES-NIやARMの暗号化ワークロードのカスタム命令など、ハードウェア支援の暗号命令は、大幅なパフォーマンス向上を実証している。
しかし、効率的なSHA-3加速は、その異なる置換に基づく構造とメモリアクセスパターンのために未解決の問題である。
本研究では,SHA-3の置換操作を汎用プロセッサにカスタム命令として組み込む際のアーキテクチャ上の課題について検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:57:13 GMT)
Measuring work in quantum many-body systems using a dynamical "work agent" [0.0] 熱平衡で開始し、外部パラメータによって駆動される汎用量子多体系を考える。
私たちのアプローチは、外部パラメータを動的作業エージェントに変換することに依存しています。
本研究では,作業計測の標準的な2点計測プロトコルと一致する作業生成関数を,大光子数の制限で定義する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:17:10 GMT)
Measuring Scientific Group Performance: Integrating h-Group and Homogeneity into the $α$-Index [0.0] 本稿では,研究者グループのパフォーマンスを計測する手法を提案する。
提案手法はα-インデックスと呼ばれ、(i)グループの研究者のh-インデックスの均一性、(ii)群のh-インデックスの拡張であるh-群という2つのパラメータに基づいている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:34:37 GMT)
Measuring Ransomware Lateral Movement Susceptibility via Privilege-Weighted Adjacency Matrix Exponentiation [0.0] ランサムウェアは、侵入者がいかに容易に横に動き、最大数の資産に広がるかに影響を及ぼす。
本稿では, 横動きの感受性を測定し, 爆発半径を推定するためのグラフ理論手法を提案する。
我々は、各サービスに対するピボットポテンシャル係数$pi(s)$を用いて、横移動を確率的プロセスとしてモデル化する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:07:34 GMT)
Masked Autoencoders for Ultrasound Signals: Robust Representation Learning for Downstream Applications [0.0] 1次元(1D)超音波信号を用いた自己教師あり表現学習のための視覚変換器 (ViT) アーキテクチャを用いたマスク付きオートエンコーダ (MAE) の適応と性能について検討した。
以上の結果から,学習前のモデルでは,スクラッチからトレーニングしたモデルと,下流タスクに最適化された強力な畳み込みニューラルネットワーク(CNN)ベースラインが有意に優れていた。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:13:33 GMT)
Manifold Trajectories in Next-Token Prediction: From Replicator Dynamics to Softmax Equilibrium [0.0] 大規模言語モデルでの復号化はしばしばスコアリングトークンとソフトマックスによる正規化と表現される。
我々は、このステップの自己完結した幻覚を、確率単純性上の制約付き変分原理として与える。
固定された文脈と温度に対して、次トーケン分布は単純体内部の滑らかな軌道を辿り、ソフトマックス平衡に収束することを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:00:22 GMT)
Local Virtual Nodes for Alleviating Over-Squashing in Graph Neural Networks [0.0] オーバースカッシングは、長距離依存関係を含むタスクに対して、グラフニューラルネットワークをトレーニングする上での課題である。
本研究では,局所仮想ノード(Local Virtual Nodes,LVN)をトレーニング可能な埋め込みで提案し,オーバースカッシングの効果を緩和する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:39:32 GMT)
Liouvillian and Hamiltonian exceptional points of atomic vapors: The spectral signatures of quantum jumps [0.0] 4つの超微粒子状態と有効3つの超微粒子状態を用いてモデル化したアルカリ金属原子蒸気のスペクトル特異点について検討した。
非エルミートハミルトニアン(NHH)とリウヴィリア超作用素の固有値スペクトルを比較することにより、半古典的および量子的例外点の出現と特性を分析する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:58:04 GMT)
Lightweight MRI-Based Automated Segmentation of Pancreatic Cancer with Auto3DSeg [0.0] SegResNetモデルは、2025年のPANTHER Challengeの一環として、2つのMRIベースの膵腫瘍セグメンテーションタスクで訓練され、評価された。
性能はやや低かったが, 自動デライン化の可能性を示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 21:38:06 GMT)
Leveraging LLMs for Formal Software Requirements -- Challenges and Prospects [0.0] VERIFAI1は、このギャップを埋めるための自動化および半自動化アプローチを調査することを目的としている。
本論文では, 課題の繰り返しと今後の研究方向性を明らかにするために, 関連文献の予備的な合成について述べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:50:56 GMT)
LREI: A fast numerical solver for quantum Landau-Lifshitz equations [0.0] 我々はLandau-Lifshitz (q-LL) 方程式と量子Landau-Lifshitz-Gilbert (q-LLG) 方程式を解くためのメモリ効率と時間効率のスキーム LREI を開発した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:33:37 GMT)
Khiops: An End-to-End, Frugal AutoML and XAI Machine Learning Solution for Large, Multi-Table Databases [0.0] Khiopsは、大規模なマルチテーブルデータベースをマイニングするために設計された、オープンソースの機械学習ツールである。
これは離散化モデルを用いて変数重要性の予測尺度を提供する。
Pythonライブラリとユーザインターフェースの両方から、さまざまな環境で利用可能だ。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:00:48 GMT)
Investigating the Performance of Adaptive Optics on Different Bases of Spatial Modes in Turbulent Channels [0.0] 量子鍵分布(QKD)は、量子力学の原理に基づく安全な鍵交換を可能にする。
自由空間QKDは、繊維が実用的でないグローバルネットワークにとって不可欠である。
適応光学(AO)はこれらの誤りを修正する経路を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:18:09 GMT)
Investigating the Impact of Project Risks on Employee Turnover Intentions in the IT Industry of Pakistan [0.0] 本研究は,IT産業におけるプロジェクトリスクが仕事満足度や転職意図に与える影響について考察する。
雇用満足度を形作る上での外的・内的ソーシャルリンクが果たす役割について検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 04:48:04 GMT)
Interpretation of Deep Learning Model in Embryo Selection for In Vitro Fertilization (IVF) Treatment [0.0] 専門家の胚学者は、通常、胚を選別するためにブラストシストの画像をレビューすることで、胚を格付けする。
本研究では、畳み込みニューラルネットワーク(CNN)と長期記憶アーキテクチャ(LSTM)を融合した、胚を分類するための説明可能な人工知能フレームワークを提案する。
本モデルは,XAIによる解釈性を維持しつつ,胚の分類において高い精度を達成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:37:41 GMT)
Integrability from a Single Conservation Law in Quantum Spin Chains [0.0] 有限範囲の相互作用を持つ量子スピン鎖に対して、Reshetikhin条件は無限に多くの局所保存量の存在を意味することを証明している。
このことは、ヤン=バクスター方程式の解に付随する保存法則の階層構造が、既に最低の非自明な保存法則に符号化されていることを示している。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:31:09 GMT)
Inferring processes within dynamic forest models using hybrid modeling [0.0] 森林間隙モデルとディープニューラルネットワーク(DNN)を組み合わせたハイブリッドモデリング手法であるフォレストインフォームドニューラルネットワーク(FINN)を紹介する。
FINNはプロセスをDNNに置き換え、他のメカニスティックコンポーネントと一体化されたステップで調整する。
本研究では,成長過程をDNNに置き換えることで,FINNの機械的バージョンと比較して予測性能と継承軌道が向上することを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:37:00 GMT)
How many qubits does a machine learning problem require? [0.0] 我々は,最近提案されたビットビット符号化方式により,普遍近似の特性が構成的かつ効率的に実現されていることを示す。
この構成により、データセット上の学習問題を目標精度で解くのに必要なキュービット数を計算することができる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:55:50 GMT)
High-Q cavity coupled to a high permittivity dielectric resonator for sensing applications [0.0] TESLA型超伝導空洞を高誘電率で結合した高Q$係数の共振器構成について報告する。
異なる温度範囲で動作するセンサとして,結合システムの利用について検討する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:07:49 GMT)
High-Order Tensor Regression in Sparse Convolutional Neural Networks [0.0] 本稿では、現在の機械学習文献における従来の方法論とは大きく異なる、畳み込みに対する一般的なアプローチを示す。
スパース畳み込みニューラルネットワークの一般的な見方の枠組みとして、ニューラルネットワークにおける回帰の合理的理論が開発されている。
直接的な結果として、古典的バックプロパゲーションアルゴリズムは、この有理テンソルベースのアプローチと整合するように再定義され、最も単純で、最も一般的な形式で表される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:38:39 GMT)
Hierarchies of quantum non-Gaussian coherences for bosonic systems: A theoretical study [0.0] ボソニック系のコヒーレンスは 量子技術応用の基礎資源です
文脈依存型認証を利用して,Fock状態ベースでコヒーレンスを解析するためのフレームワークを提案する。
我々は2つの異なる階層を導出し、比較し、それぞれがボゾン系におけるコヒーレンスの異なる文脈を表す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:56:57 GMT)
Hierarchical Verification of Non-Gaussian Coherence in Bosonic Quantum States [0.0] ボソニック量子状態の特徴的な特徴である非ガウス性は、量子ネットワークの進行において重要である。
局所コヒーレンスの非ガウス性を評価するために,絶対的,相対的,およびキュービット固有しきい値からなる階層的枠組みを導入する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:57:14 GMT)
Graph Data Modeling: Molecules, Proteins, & Chemical Processes [0.0] グラフは化学科学の中心であり、分子、タンパク質、反応、産業プロセスを記述する自然言語を提供する。
このプライマーは、化学における数学的対象としてグラフを導入し、学習アルゴリズムがそれらの上でどのように動作するかを示す。
グラフ設計の基礎、重要な予測タスク、化学科学における代表例、グラフベースモデリングにおける機械学習の役割について概説する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:08:45 GMT)
Geometric speed limit of state preparation and curved control spaces [0.0] 状態調製時のエネルギー変動と幾何学的長さの関係について考察した。
刺激的な予想は、すべてのアクセス可能な状態準備プロトコルの最小の幾何学的長さによってエネルギー変動を下方へ下げた。
この予想は、すべての動的にアクセス可能な状態の空間に埋め込まれた場合、アクセス可能なパラメータ空間が外在的な曲率を持たない場合に成り立つことを示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:58:35 GMT)
Gap-preserving reductions and RE-completeness of independent set games [0.0] 複雑性理論において、ギャップ保存還元は近似の硬さを研究する上で重要な役割を果たす。
我々は、そのような削減を研究するためのフレームワークを導入し、それをMIP$*$完全性を確立するために利用します。
我々は、ギャップ付き約束問題が決定不能な、一定の質問サイズを持つ独立したセットゲーム群を構築する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 19:03:23 GMT)
GDS Agent: A Graph Algorithmic Reasoning Agent [0.0] 本稿では,GDS (Graph Data Science) エージェントについて紹介する。
GDSエージェントは、アルゴリズム結果の事前処理(検索)と後処理とともに、グラフアルゴリズムの包括的なセットをツールとして導入する。
その結果、GDSエージェントは幅広いグラフタスクを解くことができることがわかった。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 10:35:44 GMT)
Free Independence and Unitary Design from Random Matrix Product Unitaries [0.0] ランダム・マトリックス・ユニタリ・アンサンブルにおける自由度の発生について検討する。
結合次元のみで、これらのユニタリは局所有限トレース観測可能な高階OTOCのハール値を再現する。
本結果は,演算子力学の文脈において,以前のユニタリ設計の概念を洗練させる必要性を強調した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:18:51 GMT)
Fourier Fingerprints of Ansatzes in Quantum Machine Learning [0.0] 本稿では,回路構造に依存するフーリエモード間の相関関係について述べる。
いくつかの一般的なアンサーゼに対して、フーリエ係数相関 (FCC) を計算し、フーリエ指紋を構築する。
本稿では、ランダムなフーリエ級数学習の問題に対して、FCCは、広く使われている表現性指標がそうでないにもかかわらず、アンサーゼの相対的な性能を正しく予測する方法を示す。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:00:37 GMT)
Extreme Learning Machine for the Characterization of Anomalous Diffusion from Single Trajectories (AnDi-ELM) [0.0] 極端な学習機械と特徴工学(AnDi-ELM)を組み合わせることで、AnDi課題の課題に取り組むための簡単なアプローチについて説明する。
この手法は,計算資源に制限のある簡単な実装と高速な訓練時間を提供しながら,良好な性能を達成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 11:03:40 GMT)
Extensive entanglement between coupled Tomonaga-Luttinger liquids in and out of equilibrium [0.0] 量子絡み合いは自然界に存在するが、古典物理学では欠落している。
縦軸に沿って分配された2つの平行および空間的に分離された友長・ラッティンガー液体の絡み合いについて検討した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:20:03 GMT)
Explaining word embeddings with perfect fidelity: Case study in research impact prediction [0.0] 本稿では,単語埋め込みに基づいて学習したロジスティック回帰に基づく分類モデルに対して,新たな特徴重要度手法である自己モデルRated Entities(SMER)を提案する。
SMERは理論上、説明されたモデルに完全に忠実である。
SMERはLIME,SHAP,Global Tree surrogatesよりもよく説明できることを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:08:16 GMT)
Equally entangled multiqubit states [0.0] 本稿では,複数ビットの量子状態を生成するためのプロトコルを提案する。
我々のアプローチは、量子ビット接続が制限されたデジタル量子コンピュータ向けに調整されている。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:26:13 GMT)
Enhancing Semantic Document Retrieval- Employing Group Steiner Tree Algorithm with Domain Knowledge Enrichment [0.0] 本研究は,多目的アルゴリズム「グループスタイナーツリーを用いた意味に基づく概念検索」の開発に焦点をあてる。
提案アルゴリズムはドメイン情報を組み込んでセマンティック・アウェア・ナレッジ表現とデータアクセスを強化する。
SemDRシステムの有効性を評価するために、170の現実世界の検索クエリからなるベンチマークを用いて性能評価を行う。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:29:55 GMT)
Enhanced Rényi Entropy-Based Post-Quantum Key Agreement with Provable Security and Information-Theoretic Guarantees [0.0] 本稿では,R'enyiエントロピーに基づく量子後鍵合意プロトコルを提案する。
我々は,量子敵に対する証明可能なセキュリティを実現するために,エントロピー保存操作と秘密共有検証を活用する理論的枠組みを開発する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:42:49 GMT)
Electric-field metrology of a terahertz frequency comb using Rydberg atoms [0.0] 我々は、テラヘルツ周波数コムを検知・校正するために、Rydberg原子に基づく新しいタイプの単光子検出器を用いる。
周波数コムの単一モードで35.9 $mathrmfW cm-2 Hz-0.5$ (1.46 $mathrmfW Hz-0.5$) までの強度(パワー)感度を実現する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:17:18 GMT)
Effective Description of Ajar Systems with a $U(1)$ Symmetry [0.0] アジャル系」は閉系と開系の間の中間体である。
環境との電荷交換の時間スケールは、他の全ての特徴的な時間スケールよりもパラメトリックに大きい。
拡散的位相と自然破壊的位相の相関関数に対する序列補正を計算する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 20:08:14 GMT)
ER = EPR in Loop Quantum Gravity: the Immirzi Parameter and the Continuum Limit [0.0] 我々は、ER=EPRプログラムを支えるアインシュタイン方程式の有限領域解析をループ量子重力フレームワークに再キャストする。
曲率-エネルギー関係をホロノミー-フラックス運動学に変換することにより、絡み合いと量子幾何学の間の正確な辞書を得る。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 14:17:54 GMT)
Dynamics of Gender Bias in Software Engineering [0.0] ソフトウェア工学の分野は工学とコンピュータ科学の両方に埋め込まれており、両分野とも性バイアスを具現化している。
本稿では,ソフトウェア工学の起源と,その5人のリーダをプロファイリングするエンジニアリングプロフェッショナル主義への長年の関心について調査する。
その後、この分野のジェンダー問題とジェンダーバイアスに対する最近の関心を調べる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:54:49 GMT)
Developing a Multi-Modal Machine Learning Model For Predicting Performance of Automotive Hood Frames [0.0] 本稿では、同一データの異なるモーダル性から学習し、性能指標を予測するマルチモーダル機械学習アーキテクチャを開発する。
また、MMMLアーキテクチャを用いて、計算コストのかかるシミュレーションへの依存を減らすことにより、エンジニアリング設計プロセスの効率を高めることを目的とする。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 02:15:54 GMT)
Deep Active Learning for Lung Disease Severity Classification from Chest X-rays: Learning with Less Data in the Presence of Class Imbalance [0.0] 本研究は,2020年1月から11月にかけて,エモリー医療関連病院で963名の胸部X線検査を行った。
モンテカルロ・ドロップアウトを用いたディープニューラルネットワークは、能動的学習を用いて病気の重症度を分類して訓練された。
BNN近似と重み付き損失による深いアクティブラーニングは、ラベル付きデータ要求を効果的に削減する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:29:56 GMT)
Crosstalk Insensitive Trapped-Ion Entanglement through Coupling Matrix Engineering [0.0] 閉じ込められたイオンエンタングゲートにおける不完全な光アドレッシングによる制御クロストークは、不要エンタングメントをもたらす。
イオンの運動モードの励起を制御することにより、光クロストークに敏感なエンタングルゲートを設計する手法を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 00:14:41 GMT)
CrossTL: A Universal Programming Language Translator with Unified Intermediate Representation [0.0] 複数の言語間の双方向翻訳が可能な汎用プログラミング言語であるCrossTLを提案する。
ソースコードをASTに変換する言語固有のレキサ/パーザ,双方向のCrossGL翻訳モジュール。
プログラム領域をまたいで包括的な評価を行い、すべてのバックエンドでコンパイルと実行を成功させる効果を実証する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 23:00:08 GMT)
Contrastive Learning through Auxiliary Branch for Video Object Detection [0.0] 本稿では,画像劣化に対するロバスト性を向上させるために,予備分枝(CLAB)法によるコントラスト学習を導入する。
CLAB は ImageNet VID データセット上で ResNet-101 と ResNeXt-101 で 84.0% mAP と 85.2% mAP に到達した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 08:43:03 GMT)
Classical fractional time series from quantum XXZ spin chains [0.0] 長距離量子相関はハースト指数を持つ分数過程に変換される。
この量子系が生成できる4つの古典的2状態過程について検討する。
XXZ 鎖の U(1) や SU(2) のような連続量子対称性は対数スケーリングで$H=0$ になると主張する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:27:11 GMT)
Bosonization in $R$-paraparticle Luttinger models [0.0] パラフェルミオン-パラボゾン分類は, 平均占有数でR$-パラ粒子で導入する。
また、$R$-パラフェルミオンにおける$p$-次という概念は、量子状態を占有できる粒子の最大数として再定義される。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:01:51 GMT)
Bitcoin as an Interplanetary Monetary Standard with Proof-of-Transit Timestamping [0.0] 我々は、地球と火星の間の共有通貨標準としてBitcoinをデプロイする可能性を探る。
我々は、新しいプリミティブ、Proof-of-Transit Timestamping (PoTT)を導入する。
PoTTは、高速で断続的に接続されたリンクにまたがるBitcoinデータの暗号化された不正な監査証跡を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:28:11 GMT)
Bias Mitigation for AI-Feedback Loops in Recommender Systems: A Systematic Literature Review and Taxonomy [0.0] 本稿では,バイアス緩和手法の体系的な文献レビューを行う。
彼らはAIフィードバックループを明示的に検討し、マルチラウンドシミュレーションやライブA/Bテストで検証される。
各研究は、緩和テクニック、バイアス対応、動的テストセットアップ、評価フォーカス、アプリケーションドメイン、MLタスクの6つの次元でコーディングされ、それらを再利用可能な分類に編成する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 09:12:38 GMT)
Balancing Profit and Traveller Acceptance in Ride-Pooling Personalised Fares [0.0] 個人化された運賃を最適化するために、オペレーターが個別の受入レベルを学習できることが示される。
本稿では,旅行者の期待を徐々に満たすオファーを,オペレーターが毎日構築する適応型価格政策を提案する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:46:50 GMT)
Automating the Deep Space Network Data Systems; A Case Study in Adaptive Anomaly Detection through Agentic AI [0.0] ディープ・スペース・ネットワーク(Deep Space Network、DSN)は、NASA最大のアンテナネットワークであり、大量の時系列データを生成する。
これらの施設には、長期にわたって劣化するDSNアンテナと送信機が含まれており、データフローにコストがかかる可能性がある。
本研究は,JPL技術者が収集したデータを用いて,異常や機器の劣化を直接特定できる様々な手法を実験することを目的とした。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:12:18 GMT)
Automated Bug Triaging using Instruction-Tuned Large Language Models [0.0] 本稿では,LoRAを用いた大規模言語モデルアダプタ (LLM) の命令調整を行う軽量フレームワークを提案する。
EclipseJDTとMozillaデータセットでテストされたこのモデルは、強力なショートリスト品質を実現する。
以上の結果から,命令調整型LLMは,コストのかかる機能工学やグラフベースの手法に代わる実用的な代替手段である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 18:46:37 GMT)
Approximate universality and large measurement gain of Rabi model in a linear potential under strong Doppler broadening [0.0] 本研究は高感度・耐雑音性原子重力計の開発のための理論的基礎を築いた。
ドップラー効果がラビ振動に与える影響を内部状態と外部状態の強い結合により解析する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 07:11:47 GMT)
Application of Quantum Convolutional Neural Networks for MRI-Based Brain Tumor Detection and Classification [0.0] この研究では、MRI画像を用いた脳腫瘍分類への量子畳み込みニューラルネットワーク(QCNN)の適用について検討した。
データは80%のトレーニングと20%のテストに分割され、オーバーサンプリング技術がクラス不均衡に対応している。
バイナリモデルは88%の精度でデータバランシング後の89%に改善され、マルチクラスモデルは52%の精度でオーバーサンプリング後の62%に向上した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 01:14:34 GMT)
An MLP Baseline for Handwriting Recognition Using Planar Curvature and Gradient Orientation [0.0] 本研究では,手書き文字認識のための多層パーセプトロンを駆動するには,2次幾何学的手がかりだけで十分かどうかを検討する。
この3つの手作り特徴マップを入力として用い,MNIST桁で97%,EMNIST文字で99%の精度を実現した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:47:29 GMT)
An Explainable, Attention-Enhanced, Bidirectional Long Short-Term Memory Neural Network for Joint 48-Hour Forecasting of Temperature, Irradiance, and Relative Humidity [0.0] 本稿では、スマートHVACシステムにおけるモデル予測制御(MPC)を支援するため、48時間の温度、太陽光、相対湿度の予測のためのディープラーニング(DL)フレームワークを提案する。
このアプローチでは、BiLSTM(Bidirectional Long Short-Term Memory)ネットワークに注意を払っており、3変数全てを共同で予測することで、時間的および横断的な依存関係をキャプチャする。
このモデルは、平均絶対誤差が摂氏1.3度(温度)、31W/m2(照度)、6.7%(湿度)、最先端の数値予測と機械学習ベンチマークを上回った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:40:33 GMT)
An Agile Method for Implementing Retrieval Augmented Generation Tools in Industrial SMEs [0.0] 本稿では,産業用中小企業におけるRAGシステムの展開を促進するための構造化アジャイル手法であるEASI-RAGを紹介する。
本手法は, 環境試験室における実環境事例研究を通じて検証した。
結果は、EASI-RAGが高速な実装、高いユーザ採用、正確な回答の提供、基礎となるデータの信頼性の向上をサポートすることを示した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 17:27:09 GMT)
Accelerating the drive towards energy-efficient generative AI with quantum computing algorithms [0.0] 我々は、大規模言語モデルのライフサイクルステージを分解し、量子アルゴリズムに基づく関連する拡張について議論する。
産業応用事例とオープンな研究課題について論じる。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 12:43:49 GMT)
A predictive solution of the EPR paradox [0.0] 運動量作用素の固有状態において、2つの粒子の位置の測定における標準偏差は無限大でなければならない。
量子測度理論の基本原理を用いて、全運動量の測定の後、確率密度は全運動量から与えられた(量子)条件密度と一致することを証明した。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 13:53:03 GMT)
A Time Series Analysis of Malware Uploads to Programming Language Ecosystems [0.0] 本稿では、ソフトウェアエコシステムのセキュリティのこれまで見過ごされてきた縦断的な側面について、一般的な6つのプログラミング言語エコシステムにアップロードされたマルウェアに焦点を当てて検討する。
調査したデータセットは、新しいOpen Source Vulnerabilities (OSV)データベースに基づいている。
結果によると、データベースにアップロードされたマルウェアの記録は、最近、エコシステムに分散されたパッケージの脆弱性に対処する記録を上回った。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 05:59:21 GMT)
A Sobel-Gradient MLP Baseline for Handwritten Character Recognition [0.0] 我々は古典的なソベル演算子を再考し、簡単な問いを述べる:手書き文字認識(HCR)のための全密度多層パーセプトロン(MLP)を駆動するのに十分な一階エッジマップは十分か?
水平および垂直のソベル微分のみを入力として、MNISTおよびEMNIST文字上でニューラルネットワークをトレーニングする。
極端な単純さにもかかわらず、結果として得られたネットワークは、MNIST桁で98%、EMNIST文字で92%の精度に達し、CNNに近づきながら、メモリフットプリントと透過的な機能を提供する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 15:44:00 GMT)
$K$-theory classification of Wannier localizability and detachable topological boundary states [0.0] 非エルミートトポロジーは、エルミートトポロジカル絶縁体および超伝導体における剥離可能な境界状態の下にあることを示す。
我々は、Altland-Zirnbauer対称性クラスからWigner-Dyson対称性クラスへの位相相の準同型を通して、ワニエ局所化可能性(英語版)(Wannier localizability)を分類する。
論文参考訳(メタデータ) (Thu, 28 Aug 2025 16:41:37 GMT)