Never Compromise to Vulnerabilities: A Comprehensive Survey on AI Governance [211.6] 本研究は,本質的セキュリティ,デリバティブ・セキュリティ,社会倫理の3つの柱を中心に構築された,技術的・社会的次元を統合した包括的枠組みを提案する。
我々は,(1)防衛が進化する脅威に対して失敗する一般化ギャップ,(2)現実世界のリスクを無視する不適切な評価プロトコル,(3)矛盾する監視につながる断片的な規制,の3つの課題を特定する。
私たちのフレームワークは、研究者、エンジニア、政策立案者に対して、堅牢でセキュアなだけでなく、倫理的に整合性があり、公的な信頼に値するAIシステムを開発するための実用的なガイダンスを提供します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:06:14 GMT)
GLM-4.1V-Thinking and GLM-4.5V: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning [116.8] 視覚言語モデル(VLM)のファミリーであるGLM-4.1VシンキングとGLM-4.5Vを提案する。
GLM-4.5Vは、ほぼ全てのタスクにおいて、同じ大きさのオープンソースモデル間で最先端のパフォーマンスを達成する。
より小型のGLM-4.1V-9Bシンキングは29のベンチマークでより大型のQwen2.5-VL-72Bよりも競争力に優れていた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:37:03 GMT)
Puppeteer: Rig and Animate Your 3D Models [105.1] Puppeteerは、さまざまな3Dオブジェクトの自動リギングとアニメーションの両方に対処する包括的なフレームワークである。
本システムはまず, 自己回帰変換器を用いて, 可塑性骨格構造を推定する。
その後、注意に基づくアーキテクチャにより、皮膚の重量を推定する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:59:31 GMT)
NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale [101.6] NextStep-1は、テキストから画像生成タスクにおける自動回帰モデルの最先端のパフォーマンスを実現する。
本手法は画像編集において高い性能を示し,統一的アプローチのパワーと汎用性を強調した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:54:22 GMT)
Hybrid Generative Fusion for Efficient and Privacy-Preserving Face Recognition Dataset Generation [87.5] 我々は,顔認識モデルをトレーニングするための高品質な顔データセットの構築に焦点を当てたDataCV ICCV Challengeへのアプローチを提案する。
構築されたデータセットには、既存の公開顔データセットと重複するIDが含まれてはならない。
提案手法は,競技において第1位となる textbf1 を達成し,実験結果から10K,20K,100K 単位のモデル性能の向上が得られた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:14:18 GMT)
FuXi-β: Towards a Lightweight and Fast Large-Scale Generative Recommendation Model [87.4] 本稿では,Transformerライクなリコメンデーションモデルのための新しいフレームワークを提案する。
FuXi-$beta$は従来の最先端モデルより優れ、大幅な加速を実現している。
私たちのコードはパブリックリポジトリで利用可能です。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:12:29 GMT)
ToolACE-R: Model-aware Iterative Training and Adaptive Refinement for Tool Learning [84.7] ツール学習により、LLM(Large Language Models)は複雑なユーザタスクを解決するための外部ツールを活用することができる。
本稿では,ツール学習のための反復学習と適応的洗練の両方を含む新しいフレームワークであるToolACE-Rを提案する。
我々は、いくつかのベンチマークデータセットにわたる広範な実験を行い、ToolACE-Rが高度なAPIベースのモデルと比較して、競争力のあるパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:37:54 GMT)
Confounding is a Pervasive Problem in Real World Recommender Systems [84.1] 観測されていない共生は、経済学、医学、生態学、疫学などの分野における観察的研究を損なう。
本稿では,機能工学やA/Bテスト,モジュール化など,多くの共通プラクティスが,実際にはコンファウンディングをレコメンデーションシステムに導入できることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:31:35 GMT)
Clipping Improves Adam-Norm and AdaGrad-Norm when the Noise Is Heavy-Tailed [83.8] AdaGradやAdamのような適応的なステップサイズを持つ手法は、現代のディープラーニングモデルのトレーニングに不可欠である。
AdaGrad/Adam法はノイズが重く、高い確率収束性を有することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:55:47 GMT)
Hierarchical Fine-grained Preference Optimization for Physically Plausible Video Generation [80.9] PhysHPOは階層的クロスモーダル直接参照最適化のための新しいフレームワークである。
物理的に妥当なビデオ生成のための微妙な好み調整を可能にする。
また,PhysHPOは,高度なモデルの物理的妥当性と全体的な映像生成品質を著しく向上させることを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:30:37 GMT)
GenFlowRL: Shaping Rewards with Generative Object-Centric Flow in Visual Reinforcement Learning [79.7] 本稿では,多種多様な組織間データセットから学習した生成フローから,形状の報酬を導出するGenFlowRLを提案する。
GenFlowRLは、生成したオブジェクト中心の流れから抽出した操作機能を効果的に活用できることを、シミュレーションと実世界のクロスエボディメント評価の両方で実証した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:19:20 GMT)
MM-BrowseComp: A Comprehensive Benchmark for Multimodal Browsing Agents [78.4] MM-BrowseCompは、224の挑戦的で手作りの質問からなる新しいベンチマークである。
これらの質問は、しばしば画像にプロンプトを組み込むが、検索と推論の過程で遭遇する重要な情報は、Webページ上の画像やビデオにも埋め込まれることがある。
MM-BrowseCompによる最先端モデルの総合評価では、OpenAI o3のようなツールを用いたトップモデルでさえ、わずか29.02%の精度しか達成していないことが示されている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:46:47 GMT)
STream3R: Scalable Sequential 3D Reconstruction with Causal Transformer [72.9] 本稿では,ポイントマップ予測をデコーダのみの変換器問題として再構成する新しい3次元再構成手法STream3Rを提案する。
大規模な3Dデータセットから幾何学的先行性を学ぶことで、STream3Rは多様で困難なシナリオにうまく一般化する。
この結果から,オンライン3次元知覚のための因果変換モデルの可能性を浮き彫りにし,ストリーミング環境におけるリアルタイム3次元理解の道を開いた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:58:05 GMT)
Reverse Physician-AI Relationship: Full-process Clinical Diagnosis Driven by a Large Language Model [71.4] 医師とAIの関係を逆転させるパラダイムシフトを提案する。
DxDirector-7Bは先進的な深層思考能力を持つLLMであり,医師の関与を最小限に抑えたフルプロセス診断を可能にする。
DxDirector-7Bは診断精度が優れているだけでなく、医師の作業量を大幅に削減する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:51:20 GMT)
OpenCUA: Open Foundations for Computer-Use Agents [71.2] コンピュータ・ユース・エージェント(CUA)としての視覚言語モデル
商業的ポテンシャルが増大するにつれて、最も有能なCUAシステムの重要な詳細はいまだに閉鎖されている。
我々は,CUAデータと基盤モデルをスケールするためのオープンソースフレームワークであるOpenCUAを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:47:06 GMT)
Quantum Visual Fields with Neural Amplitude Encoding [70.9] 本稿では2次元画像と3次元幾何場学習のための新しいタイプの量子入射ニューラル表現(QINR)を提案する。
QVFは古典的なデータを学習可能エネルギー多様体に接地したニューラル振幅符号化を用いて量子状態ベクトルに符号化する。
我々のアンサッツは、学習可能なパラメトリド量子回路の完全に絡み合った設計に従い、実際のヒルベルト空間で量子(単位)演算を行う。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:59:52 GMT)
From Large Angles to Consistent Faces: Identity-Preserving Video Generation via Mixture of Facial Experts [69.4] 顔の特徴の異なるが相互に強化された側面を捉えた顔専門家の混合(MoFE)を導入する。
データセットの制限を軽減するため、私たちは、Face ConstraintsとIdentity Consistencyという2つの重要な側面を中心としたデータ処理パイプラインを調整しました。
我々は、既存のオープンソースヒューマンビデオデータセットからLFA(Large Face Angles)データセットをキュレートし、洗練しました。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:21:55 GMT)
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction [67.1] そこで,Dual Point Map (DualPM)を導入し,同じ画像一点関連画素からオブジェクト上の3D位置へ,残りのポーズでオブジェクトの標準バージョンへ,一対の点マップを抽出する。
3次元再構成と3次元ポーズ推定はDualPMの予測に還元できることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:23:14 GMT)
M2DAO-Talker: Harmonizing Multi-granular Motion Decoupling and Alternating Optimization for Talking-head Generation [65.5] 我々は,音声音声生成をビデオ前処理,モーション表現,レンダリング再構成を含む統一的なフレームワークに再構成する。
M2DAO-Talkerは2.43dBのPSNRの改善とユーザ評価ビデオの画質0.64アップで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:36:33 GMT)
InterSyn: Interleaved Learning for Dynamic Motion Synthesis in the Wild [65.3] 本稿では,リアルなインタラクション動作の生成を目標とする新しいフレームワークであるInterleaved Learning for Motion Synthesis(InterSyn)を提案する。
InterSynはインターリーブド・ラーニング・ストラテジーを用いて、現実世界のシナリオに固有の自然な動的相互作用とニュアンスド・コーディネーションを捉えている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:00:06 GMT)
Human-in-Context: Unified Cross-Domain 3D Human Motion Modeling via In-Context Learning [64.3] 単一プロセスを通じて統合ドメインモデルをトレーニングするための新しい設定を提案する。
最初にPose-in-Context(PiC)を紹介した。これはコンテキスト内学習を活用して、ポーズ中心のクロスドメインモデルを作成する。
そこで我々は、モーダル性、タスク、データセットの一般化を拡大するPiCの拡張であるHuman-in-Context(HiC)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:59:23 GMT)
Personalized Feature Translation for Expression Recognition: An Efficient Source-Free Domain Adaptation Method [64.1] 表情認識(FER)モデルは、ヒューマンコンピュータのインタラクションや医療モニタリングなど、多くのビデオベースの感情コンピューティングアプリケーションで採用されている。
ディープFERモデルは、しばしば微妙な表現と高いオブジェクト間の変動に悩まされ、現実世界のアプリケーションでの性能を制限します。
本稿では、ソースデータが適応できない難題に対処し、中性表現のみからなるラベル付きターゲットデータのみを利用可能とする。
潜在空間を翻訳することで、PFTは表情生成の複雑さやノイズを回避し、分類に最適化された識別的埋め込みを生成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:05:10 GMT)
CodeJudgeBench: Benchmarking LLM-as-a-Judge for Coding Tasks [63.6] LLM(Large Language Models)は、様々なコーディングタスクにおいて最先端の言語モデルである。
LLMは、他のモデルによって生成された応答の品質を評価し、比較する裁判官としても機能する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:58:50 GMT)
Mastering Collaborative Multi-modal Data Selection: A Focus on Informativeness, Uniqueness, and Representativeness [63.5] 我々は、効果的なデータ選択のために、インフォーマル性、ユニーク性、代表性という3つの重要な原則を活用するコラボレーティブフレームワーク、DataTailorを提案する。
様々なベンチマークの実験により、DataTailorはデータの15%でフルデータの微調整のパフォーマンスの101.3%を達成している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:57:38 GMT)
Empowering Multimodal LLMs with External Tools: A Comprehensive Survey [61.7] MLLM(Multimodal Large Language Models)は、人工知能への有望な経路を指して、様々なマルチモーダルタスクにおいて大きな成功を収めた。
マルチモーダルデータの欠如、複雑な下流タスクの性能の低下、不適切な評価プロトコルがMLLMの信頼性とより広範な適用性を妨げている。
推論と問題解決の強化に外部ツールを活用する人間の能力にインスパイアされたMLLMを外部ツールで強化することは、これらの課題を克服するための有望な戦略を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:25:45 GMT)
AddressVLM: Cross-view Alignment Tuning for Image Address Localization using Large Vision-Language Models [61.4] 大規模視覚言語モデル (LVLM) は, 国土や都市部における粗粒度の地理的局在化において, 顕著な性能を示した。
都市部における街路レベルの微粒化に苦慮している。
本稿では,街路ビュー画像を用いたフレキシブルなアドレス関連質問応答を容易にするため,都市全体のアドレスローカライズ機能をLVLMに統合することを検討する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:06:28 GMT)
ToonComposer: Streamlining Cartoon Production with Generative Post-Keyframing [60.8] ToonComposerは、着色と着色を単一のキーフレーミング段階に統一する生成モデルである。
1つのスケッチと色の付いた参照フレームを必要とするToonComposerは、スパース入力で出力する。
評価の結果,ToonComposerは視覚的品質,動作の整合性,生産効率において,既存の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:50:11 GMT)
GCRPNet: Graph-Enhanced Contextual and Regional Perception Network For Salient Object Detection in Optical Remote Sensing Images [60.3] 本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:31:43 GMT)
Searching for Privacy Risks in LLM Agents via Simulation [60.2] 本稿では、プライバシクリティカルなエージェントインタラクションをシミュレートすることで、攻撃者の改善とディフェンダーの指示を交互に行う検索ベースのフレームワークを提案する。
攻撃戦略は、単純な直接要求から、偽造や同意偽造といった高度な多ターン戦術へとエスカレートする。
発見された攻撃と防御は、さまざまなシナリオやバックボーンモデルにまたがって伝達され、プライバシーに配慮したエージェントを構築するための強力な実用性を示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:49:09 GMT)
Speedy-Splat: Fast 3D Gaussian Splatting with Sparse Pixels and Sparse Primitives [60.2] 3D Gaussian Splatting (3D-GS)は、3D Gaussian のパラメトリック点雲としてシーンをモデル化することで、新しいビューをリアルタイムにレンダリングすることのできる最近の3Dシーン再構築技術である。
レンダリング速度を大幅に向上させるために、3D-GSにおける2つの重要な非効率を同定し、対処する。
われわれのSpeedy-Splatアプローチはこれらの技術を組み合わせて、Mip-NeRF 360、Turps & Temples、Deep Blendingのデータセットから得られる、劇的な$mathit6.71timesで平均レンダリング速度を加速する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:31:15 GMT)
EgoCross: Benchmarking Multimodal Large Language Models for Cross-Domain Egocentric Video Question Answering [59.9] EgoCrossは、EgocentricQAにおけるMLLMのクロスドメイン一般化を評価するためのベンチマークである。
EgoCrossは、手術、産業、極端なスポーツ、動物の観点からの4つの分野をカバーしている。
798のビデオクリップにまたがる約1000のQAペアで構成され、予測、認識、ローカライゼーション、カウントという4つの重要なQAタスクにまたがる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:11:20 GMT)
Measuring Diversity in Synthetic Datasets [59.5] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクのための合成データセットを生成するために広く採用されている。
これらの合成データセットの多様性を正確に測定する - 堅牢なモデルのパフォーマンスに不可欠な側面は、大きな課題である。
分類の観点から,合成データセットの多様性を測定する新しい手法であるDCScoreを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:15:48 GMT)
XQuant: Breaking the Memory Wall for LLM Inference with KV Cache Rematerialization [58.9] LLM推論はメモリフットプリントと帯域幅の要求のために困難である。
XQuantは、ハードウェアプラットフォームの急速に増加する計算能力を利用して、メモリボトルネックを取り除く。
XQuant-CLは、極端な圧縮のためにX埋め込みの層間類似性を利用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:52:38 GMT)
Trajectory-aware Shifted State Space Models for Online Video Super-Resolution [57.9] 本稿では、トラジェクトリ対応シフトSSM(TS-Mamba)に基づく新しいオンラインVSR手法を提案する。
TS-Mambaは、最初にビデオ内の軌跡を構築し、以前のフレームから最もよく似たトークンを選択する。
私たちのTS-Mambaは、ほとんどのケースで最先端のパフォーマンスを実現し、22.7%以上の削減複雑性(MAC)を実現しています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:42:15 GMT)
Advancing 3D Scene Understanding with MV-ScanQA Multi-View Reasoning Evaluation and TripAlign Pre-training Dataset [56.5] MV-ScanQAは、新しい3D質問応答データセットである。
本稿では,大規模かつ低コストな2D-3D言語事前学習コーパスTripAlignについて紹介する。
さらに,MV-ScanQAにおける多視点推論のためのベースライン手法であるLEGOを開発し,事前学習した2次元LVLMの知識をTripAlignで3Dドメインに転送する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:35:59 GMT)
TikZero: Zero-Shot Text-Guided Graphics Program Synthesis [56.4] 本稿では、グラフィックプログラムとキャプション付き画像の独立したトレーニングを可能にするTikZeroを提案する。
本手法は,キャプション対応グラフィックスプログラムでのみ動作可能なベースラインを著しく上回ることを示す。
私たちのコード、データセット、選択モデルが公開されています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:52:03 GMT)
MRFD: Multi-Region Fusion Decoding with Self-Consistency for Mitigating Hallucinations in LVLMs [56.2] MRFD (Multi-Region Fusion Decoding) は、領域間の一貫性をモデル化することにより、現実のグラウンド化を改善する訓練自由復号法である。
MRFDは、クロスアテンションを用いて正常な領域を特定し、それぞれの初期応答を生成し、Jensen-Shannon Divergenceに基づいて信頼性ウェイトを算出する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:17:39 GMT)
HM-Talker: Hybrid Motion Modeling for High-Fidelity Talking Head Synthesis [55.9] HM-Talkerは、高忠実で時間的コヒーレントな話しヘッドを生成するための新しいフレームワークである。
AUs(Action Units)は、解剖学的に定義された顔面の筋肉の動きと、音素と視覚の相違を最小限に抑える暗黙的な特徴を使用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:01:52 GMT)
VMem: Consistent Interactive Video Scene Generation with Surfel-Indexed View Memory [55.7] Surfel-Indexed View Memory (VMem) は、過去のビューを記憶するメモリモジュールであり、それらが観測した3次元表面要素(サーフェル)に基づいて幾何学的にインデックス化することで、過去のビューを記憶する。
VMemは、新しいビューを生成する際に、最も関連性の高い過去のビューを効率的に検索することを可能にする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:03:30 GMT)
Why Do Open-Source LLMs Struggle with Data Analysis? A Systematic Empirical Study [55.1] 大規模言語モデル(LLM)は、データ分析タスクの自動化を約束する。
しかし、オープンソースモデルは、このような推論集約的なシナリオにおいて、重大な制限に直面している。
本研究では,オープンソースLLMのデータ解析機能を強化するための戦略について検討する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:35:54 GMT)
Concepts or Skills? Rethinking Instruction Selection for Multi-modal Models [54.8] 視覚言語指導チューニングは、視覚概念の学習と視覚スキルの学習という2つの主な目的を達成する。
この発見にインスパイアされた我々は、与えられたベンチマークの性能を最適化する単純なトレーニングデータ選択法を設計した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:48:38 GMT)
FreeGAD: A Training-Free yet Effective Approach for Graph Anomaly Detection [54.6] Graph Anomaly Detection (GAD)は、グラフ内の多数から逸脱するノードを特定することを目的としている。
既存のアプローチは、複雑でリソース集約的なトレーニングプロセスのために、高デプロイメントコストとスケーラビリティの不足に悩まされることが多い。
新たなGAD法であるFreeGADを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:37:20 GMT)
Exploiting Discriminative Codebook Prior for Autoregressive Image Generation [54.1] トークンベースの自己回帰画像生成システムは、まずトークンインデックスのシーケンスをコードブックでトークン化し、次にこれらのシーケンスを自己回帰パラダイムでモデル化する。
自己回帰生成モデルはインデックス値のみに基づいて訓練されるが、豊富なトークン類似性情報を含むコードブックにエンコードされた前者は利用されない。
近年の研究では、トークン上に単純なk平均クラスタリングを行い、コードブックを減らした生成モデルのトレーニングを容易にすることで、これを先に組み込もうとしている。
k-meansの代替として、差別的コードブック先駆者(DCPE)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:00:00 GMT)
Shuffle-R1: Efficient RL framework for Multimodal Large Language Models via Data-centric Dynamic Shuffle [53.2] 強化学習(Reinforcement Learning, RL)は、マルチモーダル大言語モデル(MLLM)の推論能力を高めるための効果的なポストトレーニングパラダイムとして登場した。
しかしながら、現在のRLパイプラインは、アドバンテージ・コラプシング(Advantage Collapsing)とロールアウト・サイレンシング(Rollout Silencing)という2つの未解決の問題によって、トレーニングの非効率に悩まされることが多い。
軌道サンプリングとバッチ合成を動的に再構成することにより、RLの微調整効率を向上する、シンプルだが原則化されたフレームワークであるShuffle-R1を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:00:27 GMT)
CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting [53.2] 2Dプリンシパルに依存しているメソッドは、横断的なセマンティクスの不整合という重要な課題に陥る。
CCL-LGSは、多視点セマンティックキューを統合することで、ビューに一貫性のあるセマンティック監視を実現する新しいフレームワークである。
我々の枠組みは、カテゴリー識別性を維持しながら意味的対立を明示的に解決する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:29:24 GMT)
Pose-Robust Calibration Strategy for Point-of-Gaze Estimation on Mobile Phones [52.9] キャリブレーション点と頭部の多様性が推定精度に与える影響を分析する。
実験により、キャリブレーション中により広い範囲の頭部ポーズを導入することで、推定器がポーズ変動を処理する能力を向上させることが示されている。
携帯電話を移動しながらキャリブレーションポイントを固定する動的キャリブレーション戦略を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:28:30 GMT)
AlDBaran: Towards Blazingly Fast State Commitments for Blockchains [52.4] AlDBaranは、50Gbpsのネットワークスループットで、状態更新を効率的に処理できる認証データ構造である。
AlDBaranは、様々な新しい応用を促進する歴史的な状態証明のサポートを提供する。
コンシューマレベルのポータブルハードウェアでは、インメモリ設定で約800万更新/秒、サブ秒間隔でスナップショットで500万更新/秒を達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:52:15 GMT)
SHALE: A Scalable Benchmark for Fine-grained Hallucination Evaluation in LVLMs [52.0] LVLM(Large Vision-Language Models)は、いまだ幻覚に悩まされている。
本稿では,スケーラブルで制御可能で多様な評価データを生成する自動データ構築パイプラインを提案する。
我々は,忠実度と事実性幻覚の両方を評価するためのベンチマークであるSHALEを構築した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:57:08 GMT)
FAIRGAME: a Framework for AI Agents Bias Recognition using Game Theory [52.0] ゲーム理論を用いたAIエージェントバイアス認識フレームワークFAIRGAMEを提案する。
我々は,AIエージェント間の人気ゲームにおけるバイアスのある結果を明らかにするために,その実装と利用について述べる。
全体として、FAIRGAMEはユーザーが望むゲームやシナリオを確実に簡単にシミュレートできる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:12:53 GMT)
LaDi-WM: A Latent Diffusion-based World Model for Predictive Manipulation [51.8] 拡散モデルを用いて将来の状態の潜伏空間を予測する世界モデルLaDi-WMを提案する。
LIBERO-LONGベンチマークでは,LaDi-WMが27.9%,現実シナリオでは20%,政策性能が著しく向上することを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:15:08 GMT)
FRUGAL: Memory-Efficient Optimization by Reducing State Overhead for Scalable Training [51.4] 我々は、新しいメモリ効率最適化フレームワークであるtextbfF$ull-$textbfR$ank $textbfU$pdates with $textbfG$r$textbfA$dient sp$textbfL$ittingを紹介します。
当社のフレームワークは,GaLoreやBAdamなど,さまざまな低ランク更新選択技術と統合することが可能です。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:59:26 GMT)
PRELUDE: A Benchmark Designed to Require Global Comprehension and Reasoning over Long Contexts [50.8] 本論文では,文字の前書きが本書の正統的な物語と一致しているかどうかを判断する作業を通じて,長文理解を評価するためのベンチマークであるPreLUDEを紹介する。
私たちのタスクは、既存のベンチマークよりもグローバルな理解と深い推論の需要が強くなります。
実験結果は、文脈学習、RAG、最先端のLLMによるドメイン内トレーニング、商用DeepResearchサービス、人間の遅れによる遅延といったタスクの課題を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:08:15 GMT)
SynBrain: Enhancing Visual-to-fMRI Synthesis via Probabilistic Representation Learning [50.7] 視覚刺激が皮質反応にどのように変換されるかを理解することは、計算神経科学の基本的な課題である。
視覚的意味論から神経反応への変換をシミュレートする生成フレームワークであるSynBrainを提案する。
そこで本研究では,SynBrainが主観的視覚-fMRI符号化性能において最先端の手法を超越していることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:01:05 GMT)
MinD-3D++: Advancing fMRI-Based 3D Reconstruction with High-Quality Textured Mesh Generation and a Comprehensive Dataset [50.5] 機能的磁気共鳴イメージング(fMRI)データから3次元視覚を再構成することは、認知神経科学とコンピュータビジョンにとって重要な関心事である。
我々は15人の参加者のデータを含むfMRI-3Dデータセットを提示し、合計4,768個の3Dオブジェクトを展示する。
テクスチャ化された3次元視覚情報をfMRI信号から復号する新しいフレームワークMinD-3D++を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:20:11 GMT)
LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization [48.9] 長長適応ポリシー最適化は、理論的長さ制御を外部制約から本質的なモデル能力に変換する。
LAPOは、2段階の強化学習プロセスを通じて適切な推論深度を理解することができる。
数学的推論ベンチマークの実験では、LAPOはトークンの使用量を最大40.9%削減し、精度は2.3%向上した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:13:36 GMT)
Data Pruning by Information Maximization [48.8] コアセット選択(coreset selection)とも呼ばれる新しいデータプルーニング手法であるInfoMaxを提案する。
これによってInfoMaxは、コアセットの全体的な情報性を高める。
実験では、さまざまなデータプルーニングタスクにおいてInfoMaxの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:59:04 GMT)
MEDTalk: Multimodal Controlled 3D Facial Animation with Dynamic Emotions by Disentangled Embedding [48.5] MEDTalkは、きめ細かなダイナミックな会話ヘッド生成のための新しいフレームワークである。
音声と音声のテキストを統合し、フレームワイドの強度変化を予測し、静的な感情特徴を動的に調整し、リアルな感情表現を生成する。
生成した結果は、産業生産パイプラインに便利に統合できます。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:56:46 GMT)
EvTurb: Event Camera Guided Turbulence Removal [48.1] 大気の乱流は、ぼやけや幾何学的な傾きの歪みを導入して画質を劣化させる。
イベントガイドによる乱流除去フレームワークであるEvTurbを提案する。
さまざまな乱流シナリオを特徴とする,最初のリアルタイムデータセットであるTurbEventを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:22:18 GMT)
Pass@k Training for Adaptively Balancing Exploration and Exploitation of Large Reasoning Models [47.1] 検証可能な報酬(RLVR)による強化学習は、探索と搾取のバランスをとる上で問題に直面している。
Pass@kを使ってポリシーモデルをトレーニングし(例えば$textbfPass@k Training$)、探索能力の改善を観察します。
Pass@k Trainingの利点を生かした分析的ソリューションを導き,効率的かつ効率的なプロセスを実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:34:47 GMT)
Improving Learning of New Diseases through Knowledge-Enhanced Initialization for Federated Adapter Tuning [46.4] フェデレートラーニング(Federated Learning, FL)は、医療機関間のプライバシー保護コラボレーションを可能にする広く採用されているフレームワークである。
FedKEI(Federated Knowledge-Enhanced Initialization)は,クロスクライアントおよびクロスタスクを過去の知識から活用する新しいフレームワークである。
我々は,新しい疾患に適応する上でのFedKEIの利点を,最先端の方法と比較した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:02:48 GMT)
PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing [46.1] 研究が深まるにつれ、論文検索の要件はより柔軟になる可能性がある。
PaperRegisterは、従来の抽象的なインデックスを階層的なインデックスツリーに変換する。
様々な粒度の紙探索実験により,PaperRegisterが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:43:46 GMT)
Nautilus: Locality-aware Autoencoder for Scalable Mesh Generation [46.1] アーティストのようなメッシュ生成のための局所性を考慮したオートエンコーダであるNautilusを提案する。
本手法では,顔の近接関係を保存する新しいトークン化アルゴリズムを提案する。
また,マルチスケールガイダンスを提供するDual-stream Point Conditionerを開発した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:08:39 GMT)
SemPT: Semantic Prompt Tuning for Vision-Language Models [46.0] 大量の画像テキストペアで事前訓練された視覚言語モデルは、有望なソリューションを提供する。
本稿では,共有属性レベルの知識を活用することで,一般化課題に取り組む新しいフレームワークであるSemantic Prompt Tuning(SemPT)を紹介する。
SemPTは、ベース・ツー・ノーベル一般化、クロスデータセット転送、クロスドメイン転送、数ショット学習など、さまざまな設定で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:41:59 GMT)
Approaching the Source of Symbol Grounding with Confluent Reductions of Abstract Meaning Representation Directed Graphs [45.5] 実際のデジタル辞書をAMR有向グラフに埋め込む方法について述べる。
そして、回路空間を保存する変換を用いて、これらのグラフを収束的に減少させる。
これらの還元ダイグラフの特性を解析し,シンボル接地問題に関して考察した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:53:43 GMT)
Facilitating Longitudinal Interaction Studies of AI Systems [45.4] UISTの研究者たちは、ユーザの課題に対処するツールを開発した。
AIとのユーザインタラクションは、学習、適応、再利用を通じて時間の経過とともに進化し、一度の評価が不十分になる。
本ワークショップは,これらの課題に対処し,長期研究のための実践的戦略を研究者に提供することを目的としている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:38:23 GMT)
MusiXQA: Advancing Visual Music Understanding in Multimodal Large Language Models [45.3] MusiXQAは、音楽シート理解におけるMLLMの評価と進歩のための、最初の包括的なデータセットである。
我々は、データセットに微調整されたMLLMであるPhi-3-MusiXを開発し、GPT法よりも大きな性能向上を実現した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:29:48 GMT)
Point or Line? Using Line-based Representation for Panoptic Symbol Spotting in CAD Drawings [45.1] ベクトルグラフィカルプリミティブからなるCAD図面におけるパノプティカルシンボルスポッティングの課題について検討する。
既存の手法は通常、画像化、グラフ構築、あるいは点ベースの表現に依存している。
本稿では,プリミティブの行ベースの表現を通じてこれらの課題に対処する新しい手法であるVecFormerを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:38:45 GMT)
Efficiency of Dynamical Decoupling for (Almost) Any Spin-Boson Model [45.0] 構造ボソニック環境と結合した2レベル系の動的疎結合を解析的に検討した。
このようなシステムに対して動的疎結合が機能する十分な条件を見つける。
私たちの境界は、様々な関連するシステムパラメータで正しいスケーリングを再現します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:11:13 GMT)
Beyond the Rosetta Stone: Unification Forces in Generalization Dynamics [44.7] 大規模言語モデル(LLM)は言語間知識伝達に苦慮している。
我々は,この現象の原因とダイナミクスを,合成多言語データセット上でスクラッチから小さなトランスフォーマーモデルを訓練することによって研究する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:44:13 GMT)
Preacher: Paper-to-Video Agentic System [44.7] Preacherは、最初の紙対ビデオのエージェントシステムである。
研究論文を構造化ビデオ要約に分解、要約、再構成する。
5つの研究分野にまたがって高品質なビデオ抽象化を生成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:59:23 GMT)
Technical Report: Facilitating the Adoption of Causal Inference Methods Through LLM-Empowered Co-Pilot [44.3] CATE-Bは,大規模言語モデル(LLM)をエージェントフレームワーク内で使用して,治療効果推定を通じてユーザを誘導する,オープンソースのコパイロットシステムである。
CATE-B は (i) 因果発見と LLM に基づくエッジオリエンテーションによる構造因果モデルの構築、 (ii) 因果構造とデータセット特性に適合した適切な回帰方法を選択することによるロバストな調整セットの同定を支援する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:20:51 GMT)
Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART) [43.7] Scalable Multi-Agent Realistic Testbed (SMART)は、マルチエージェントパス探索(MAPF)アルゴリズムを評価するための、現実的で効率的なソフトウェアツールである。
SMARTは物理工学に基づくシミュレータを使って現実的なシミュレーション環境を作り、ロボットのキノダイナミックスや実行の不確実性のような複雑な現実世界の要因を考慮に入れている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:55:27 GMT)
UI-Venus Technical Report: Building High-performance UI Agents with RFT [43.3] マルチモーダルな大言語モデルに基づいてスクリーンショットのみを入力として取り込むネイティブUIエージェントであるUI-Venusを提示する。
UI-Venusは、数万の高品質なトレーニングサンプルを使用して、UIグラウンディングとナビゲーションタスクの両方でSOTAパフォーマンスを達成する。
コントリビューションには、SOTAオープンソースUIエージェントのパブリッシュ、包括的なデータクリーニングプロトコル、ナビゲーション性能を改善するための新しい自己進化フレームワークなどが含まれます。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:58:07 GMT)
LED-Merging: Mitigating Safety-Utility Conflicts in Model Merging with Location-Election-Disjoint [43.0] LED-Mergingは安全性とユーティリティの対立を解消し、信頼性の高いマルチタスク LLM を構築するための軽量でトレーニング不要なパラダイムを提供する。
$textbfL$ocates task-specific neurons via gradient-based attribution。
$textbfE$lects critical neurons through multi-model importance fusion。
$textbfD$isjointsパラメータ分離による更新の競合。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:15:21 GMT)
Axis-level Symmetry Detection with Group-Equivariant Representation [42.8] 最近の熱マップに基づくアプローチは対称性軸のポテンシャル領域をローカライズすることができるが、個々の軸を特定する精度に欠けることが多い。
本稿では,2つの最も一般的な対称性-反射と回転の軸レベル検出のための新しい枠組みを提案する。
提案手法は最先端の性能を達成し,既存手法より優れている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:26:53 GMT)
ComoRAG: A Cognitive-Inspired Memory-Organized RAG for Stateful Long Narrative Reasoning [42.7] ComoRAGは、新たなエビデンス獲得と過去の知識統合の間の動的かつ進化的な相互作用である。
新しい探索パスを考案するための探索クエリを生成し、検索した新しい側面の証拠をグローバルメモリプールに統合する。
ComoRAGは、グローバル理解を必要とする複雑なクエリに対して特に有利である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:52:09 GMT)
Enabling Differentially Private Federated Learning for Speech Recognition: Benchmarks, Adaptive Optimizers and Gradient Clipping [42.3] DP付きFLは、少なくとも数百万のユーザを抱える場合、強力なプライバシー保証の下で有効であることを示す。
ASR の DP と FL の高 (低い) 個体群に外挿した場合, 単語誤り率を 1.3% に抑えたユーザレベル (7.2, 10-9$)-DP (4.5, 10-9$)-DP を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:55:10 GMT)
Energy-Based Models for Predicting Mutational Effects on Proteins [42.0] 我々は、結合自由エネルギーの変化を予測する新しいアプローチを提案する(DeltaDelta G$)。
我々は新たに$DeltaDelta G$を逆折り畳みモデルとエネルギーモデルで見積もる構造ベースコンポーネントに分解する。
本手法は, しばしば使用されるシーケンス対数比に基づくアプローチをデルタデルタG$予測と, 統計力学に基礎を置く新しいデルタデルタE$項に結合することにより, エネルギーベースの物理的帰納バイアスを組み込む。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:30:19 GMT)
Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances [42.0] 強化学習は、非微分可能、嗜好駆動、時間的に構造化された目的を最適化するための原則化されたフレームワークを提供する。
最近の進歩は、生成タスク間の制御性、一貫性、人間のアライメントを高める効果を実証している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:44:03 GMT)
Memorisation and forgetting in a learning Hopfield neural network: bifurcation mechanisms, attractors and basins [41.9] ヘビアン学習中の81ニューロンホップフィールドネットワークにおける記憶形成機構の解析を行った。
接続重みの発達に影響を及ぼすことにより,応用刺激はピッチフォークを誘導し,サドルノード分岐のカスケードを誘導することを示した。
これにより、真実または刺激的な記憶をコードできる盆地を持つ新たなアトラクションが生成され、古い記憶が突然消滅する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:48:39 GMT)
High-dimensional autocompensating discrete modulation CV-QKD protocol in optical fibers [41.9] 我々は、光ファイバーに沿って摂動する弱コヒーレント状態のN次元積状態を用いる。
我々は、インターセプトと再送攻撃を行う際に、この高次元プロトコルのセキュリティを分析する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:29:24 GMT)
Proxy Model-Guided Reinforcement Learning for Client Selection in Federated Recommendation [41.9] フェデレートされたレコメンデーターシステムは、ユーザの生データを公開せずにパーソナライズされたレコメンデーションサービスを可能にする、有望なプライバシー保護パラダイムとして登場した。
既存のFedRSフレームワークのほとんどは、トレーニングラウンド毎に完全にランダムなクライアント選択戦略を採用しています。
本稿では,クライアント選択に適したプロキシモデル誘導強化学習フレームワークであるProxyRL-FRSを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:03:39 GMT)
AEGIS: Authenticity Evaluation Benchmark for AI-Generated Video Sequences [41.7] AEGISは、多種多様な最先端の生成モデルによって生成される、厳格にキュレートされたリアルビデオと合成ビデオで構成されている。
セマンティック認証記述、動作特徴、低レベル視覚特徴にまたがるマルチモーダルアノテーションを提供する。
高度な視覚言語モデルを用いた実験は、AIGISの最も困難なサブセットにおいて、限られた検出能力を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:55:49 GMT)
Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks [41.1] コンフォーマル予測は、統計的に有効なカバレッジ保証を備えた予測セットでベース予測器を拡張するために使用される。
本稿では、間隔予測モデルとリーチセット・コンフォーマント同定にインスパイアされた新しいアプローチであるゾノ・コンフォーマル予測を導入する。
ゾノコンフォーマル予測器は間隔予測器モデルや標準共形予測法よりも保守的でないことを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:03:28 GMT)
Semantic Structure-Aware Generative Attacks for Enhanced Adversarial Transferability [40.9] 生成的敵攻撃は、ホワイトボックス・サロゲートモデルで摂動発生器を訓練し、工芸品の摂動を見えないブラックボックスの犠牲者モデルに適用する。
これまで、既存の研究は意味情報の保存と活用のために生成モデルの表現能力を完全に活用していなかった。
本稿では,時間的スムーズな特徴参照として機能する意味的構造認識型攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:51:59 GMT)
Position: The Current AI Conference Model is Unsustainable! Diagnosing the Crisis of Centralized AI Conference [40.7] 本稿では, 科学的普及, 株式, 地域福祉の基本的な目標を脅かす構造的危機をデータ駆動で診断する。
1) 著者一人当たりの出版率が過去10年で2倍以上に増加し, 毎年4.5紙以上になる, 2) 環境面では1回の会議の二酸化炭素排出量が1日当たりの排出を上回っている, (3) 心理的には, オンラインコミュニティの71%が否定的な感情を反映し, 35%がメンタルヘルスの懸念を反映している,という4つのストレス領域を同定した。
これに対し、ピアレビュー、プレゼンテーションを分離したCommunity-Federated Conference(CFC)モデルを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:58:44 GMT)
An Efficient Model-Driven Groupwise Approach for Atlas Construction [40.4] DARC(Diffeomorphic Atlas Registration via Coordinate descend)は,アトラス構築のためのモデル駆動型グループワイド登録フレームワークである。
DARCは、幅広い画像差分メトリクスをサポートし、GPUメモリ問題を起こすことなく、任意の数の3Dイメージを効率的に処理する。
本研究では,(1)アトラスのみにアノテートしたラベルを逆変形により対象物に伝播させるワンショットセグメンテーションと,(2)アトラスメッシュをワープすることによって新しい解剖学的変異が生成される形状合成の2つの主要な応用例を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:28:09 GMT)
Request-Only Optimization for Recommendation Systems [39.9] 産業規模のDeep Learning Recommendation Models (DLRMs) は毎日何十億ものユーザにサービスを提供している。
DLRMは、例えば1兆の浮動小数点演算(TFLOP)など、前例のない複雑さまで拡張されている。
このスケールは、大量のトレーニングデータとともに、これらの複雑なレコメンデーションシステムの品質を効率的に改善するために、新しいストレージとトレーニングアルゴリズムを必要とします。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:38:08 GMT)
Mobile-Friendly Deep Learning for Plant Disease Detection: A Lightweight CNN Benchmark Across 101 Classes of 33 Crops [39.6] 植物病は世界の食料安全保障にとって大きな脅威である。
我々は、33の作物で101の植物病を正確に分類できるモバイルフレンドリーなソリューションを開発した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:43:27 GMT)
Accelerating exoplanet climate modelling: A machine learning approach to complement 3D GCM grid simulations [39.6] 本研究の目的は,太陽系外惑星の3次元温度と風構造を予測するために機械学習(ML)アルゴリズムが利用できるかどうかを判断することである。
A、F、G、K、M型ホスト星を公転する60個のホットジュピターを持つ新しい3次元GCMグリッドが導入された。
この格子上に高密度ニューラルネットワーク(DNN)と決定木アルゴリズム(XGBoost)をトレーニングし、水平風や垂直風とともに局所的なガス温度を予測する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:50:38 GMT)
Semantic IDs for Joint Generative Search and Recommendation [39.5] ジェネレーティブモデルは、レコメンデーションと検索の両方をパワーアップするための統一されたソリューションとして登場しつつある。
統一モデルを用いた場合,検索とレコメンデーションの両方でよく機能するセマンティックIDを構築する方法を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:28:49 GMT)
Contrast Sensitivity Function of Multimodal Vision-Language Models [39.1] 人間の視覚の主な特徴はコントラスト感度関数(CSF)であり、低コントラストにおける空間周波数に対する感度を記述する。
チャット型視覚言語モデルのCSFを推定するために,行動心理学に着想を得た新しい手法を提案する。
いくつかのモデルは人間に似たCSFの形や大きさを近似しているが、どちらも完全に再現するものではない。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:07:44 GMT)
Debiasing Multimodal Large Language Models via Penalization of Language Priors [39.0] MLLM(Multimodal Large Language Models)は、コンピュータビジョンや自然言語処理において欠かせないツールとなっている。
生成されたコンテンツは、入力画像よりも、基礎となるLarge Language Models (LLMs) の本質的な先行性によって駆動されることが多い。
本稿では、これらのバイアスを補正し、視覚情報に対するモデルの焦点をリダイレクトするための、単純でトレーニングのない2つの戦略を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:30:25 GMT)
BiasGym: Fantastic LLM Biases and How to Find (and Remove) Them [38.8] BiasGymは、大規模言語モデル(LLM)内の概念的関連性を確実に注入し、分析し、緩和するためのフレームワークである。
BiasGymは2つのコンポーネントで構成されている。BiasInjectはトークンベースの微調整を通じてモデルに特定のバイアスを注入する。
提案手法は,機械的解析のための一貫したバイアス抽出を可能にし,下流タスクの性能低下を伴わずに目標デバイアス化をサポートし,トークンベースの微調整時に見つからないバイアスを一般化する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:57:53 GMT)
MAP Estimation with Denoisers: Convergence Rates and Guarantees [37.9] 簡単なアルゴリズムは、前の$p$の対数共共役仮定の下で近似演算子に収束することを示す。
このアルゴリズムは, 滑らかな近位対象の勾配勾配として解釈できることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:59:47 GMT)
Improving Text Style Transfer using Masked Diffusion Language Models with Inference-time Scaling [37.8] 仮面拡散言語モデル (MDMs) は近年,自然言語生成フレームワークとして注目を集めている。
本稿では,MDMの復調過程において,より優れた候補生成の探索を支援する検証器ベースの推論時間スケーリング手法を提案する。
実験では,標準テキストスタイルの転送タスクへのMDMの適用を実証し,自動回帰言語モデルのより良い代替手段としてMDMを確立する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:01:22 GMT)
Symmetries, Conservation Laws and Entanglement in Non-Hermitian Fermionic Lattices [37.7] 非エルミート量子多体系は、ユニタリダイナミクスと散逸によって駆動される定常な絡み合い遷移を特徴とする。
定常状態は、一粒子の右固有状態に固有値の最大の虚部を埋めることによって得られることを示す。
これらの原理を周期境界条件を持つハナノ・ネルソンモデルと非エルミートス=シュリーファー=ヘーガーモデルで説明する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:29:24 GMT)
Holistic Bioprocess Development Across Scales Using Multi-Fidelity Batch Bayesian Optimization [37.7] 本稿では,バイオプロセス開発を高速化し,実験コストを削減するため,多要素バッチベイズ最適化フレームワークを提案する。
ベンチマークには,中国のハムスターOvaryバイオプロセスのカスタムシミュレーションが用いられている。
ケーススタディは、提案されたワークフローが実験コストの削減と収量の増加を実現する方法を示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:29:34 GMT)
Reinforcement Learning in Vision: A Survey [36.8] この調査は、この分野の批判的かつ最新の合成を提供する。
まず、視覚的RL問題を定式化し、政策最適化戦略の進化を辿る。
カリキュラム駆動型トレーニング、嗜好整合拡散、統一報酬モデリングなどのトレンドを蒸留する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:32:17 GMT)
HGAurban: Heterogeneous Graph Autoencoding for Urban Spatial-Temporal Learning [36.8] 重要な課題は、空間時空間グラフで意味のある領域表現を学習する既存のニューラルネットワークの能力を制限する、空間時空間データのノイズとスパースの性質にある。
都市データ表現のための自己教師付き生成学習を生かしたヘテロジニアスな空間時間グラフマスク型オートエンコーダであるHurbanを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:43:10 GMT)
Dissecting Generalized Category Discovery: Multiplex Consensus under Self-Deconstruction [36.7] 人間の認知プロセスにインスパイアされた、新しい物体理解のためのソリューションを提案する。
提案するConGCDは,高レベルなセマンティック再構築により,プリミティブ指向の表現を確立する。
我々は、クラス識別パターンをキャプチャするために、支配的かつ文脈的コンセンサスユニットを実装している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:11:22 GMT)
Towards Fully Passive Time-Bin Quantum Key Distribution over Moving Free-Space Channels [36.1] フォトニック時間ビン状態の量子情報は、一般に自由空間量子通信の移動には実用的ではないと考えられている。
本稿では,参照フレーム独立時間ビン量子鍵分布を用いた新しい手法を提案する。
このスキームは、急速に動くプラットフォームを含む様々な空間的多モードおよび変動するチャネルに容易に適用できる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:31:06 GMT)
Unifying Locality of KANs and Feature Drift Compensation Projection for Data-free Replay based Continual Face Forgery Detection [35.9] Kolmogorov-Arnold Networks (KAN) は、その活性化機能として、局所的なプラスチックスプラインを利用している。
本稿では,DG-KD(Domain-Group Kan Detector)とKan Drift Compensation Projection(FS-KDCP)によるデータフリーリプレイ特徴分離戦略を含む,KAN-CFD(Continual Face Forgery Detection)フレームワークを提案する。
実験結果から,提案手法は特に忘れを少なくしながら優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:56:05 GMT)
Serial Over Parallel: Learning Continual Unification for Multi-Modal Visual Object Tracking and Benchmarking [35.4] 既存のプラクティスは、すべてのデータセンサータイプを単一のトレーニング手順で混合し、データ中心の観点から並列パラダイムを構築する。
すべての種類のデータが共存する統一ベンチマークが存在しないため、分離されたベンチマークの評価が強制され、トレーニングとテストの間にテキスト整合性が生じる。
UniBench300と呼ばれる統一ベンチマークは、複数のタスクデータを組み込んで、推論を3つから1つに減らし、時間の消費を27%削減することで、一貫性を橋渡しするために導入された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:54:04 GMT)
ReconVLA: Reconstructive Vision-Language-Action Model as Effective Robot Perceiver [35.3] 本稿では,暗黙的な基礎パラダイムを持つ再構成型VLAモデルReconVLAを提案する。
拡散変換器は、モデルの視覚出力に基づいて画像の視線領域を再構成する。
このプロセスにより、VLAモデルはきめ細かい表現を学習し、視覚的注意を正確に割り当てる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:20:19 GMT)
MedRep: Medical Concept Representation for General Electronic Health Record Foundation Models [35.2] 我々は、観察医療成果パートナーシップ(OMOP)共通データモデル(CDM)に基づくEHR基盤モデルのための新しい医療概念表現(MedRep)のセットを提案する。
概念表現学習では,大言語モデル(LLM)による定義の最小化により,OMOP語彙のグラフによるテキストベース表現のプロンプトと補完を行う。
我々の手法は、様々な予測タスクにおいて、バニラEHRファンデーションモデルと、以前に導入された医療コードトークンーザよりも優れています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:34:08 GMT)
WeChat-YATT: A Simple, Scalable and Balanced RLHF Trainer [35.1] WeChat-YATT(Yet Another Transformer Trainer in WeChat)は、シンプルでスケーラブルでバランスの取れたRLHFトレーニングフレームワークである。
WeChat-YATTは最先端のRLHFトレーニングフレームワークに比べてスループットが大幅に向上していることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:38:55 GMT)
HEIR: A Universal Compiler for Homomorphic Encryption [35.1] Homomorphic Encryption Intermediate (HEIR) は、同型暗号化(HE)コンパイラを構築するための統一的なアプローチである。
HEIRはMLIRコンパイラフレームワーク上に構築されており、HE固有の抽象化レイヤを導入している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:19:53 GMT)
Efficient Distributed Optimization under Heavy-Tailed Noise [33.0] TailOPTは、潜在的に勾配のばらつきと局所的な更新を伴うヘビーテールノイズに対処するように設計されている。
Bi2Clip$は、インナーとアウターの両方でコーディネートワイドクリッピングを行い、アダプティブライクなパフォーマンスを実現する。
この$Bi2Clip$は、いくつかの言語タスクやモデルにおいて優れたパフォーマンスを示し、最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:03:00 GMT)
AlgoTune: Can Language Models Speed Up General-Purpose Numerical Programs? [32.0] オープンなベンチマークでアルゴリズムを設計・実装するテストモデルを提案する。
私たちのAlgoTuneベンチマークは、ドメインの専門家から収集された154のコーディングタスクで構成されています。
AlgoTunerは参照ソルバに対して平均1.72倍のスピードアップを達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:04:38 GMT)
SEQ-GPT: LLM-assisted Spatial Query via Example [31.7] 大規模言語モデル(LLM)を利用した空間問合せシステムSEQ-GPTを紹介する。
LLMはSEQプロセスにおける対話的な操作を可能にし、クエリの詳細を明確にし、ユーザからのフィードバックに基づいて検索を動的に調整する。
SEQ-GPTは、現実的なデータとアプリケーションシナリオで空間探索を広げるためのエンドツーエンドのデモを提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:41:55 GMT)
PASS: Probabilistic Agentic Supernet Sampling for Interpretable and Adaptive Chest X-Ray Reasoning [31.4] PASS(Probabilistic Agentic Supernet Smpling)は、Chest X-Ray(CXR)推論の文脈でこれらの課題に対処する最初のマルチモーダルフレームワークである。
PASSは、マルチツールグラフ上でエージェントを適応的にサンプリングし、解釈可能な確率でアノテートされた決定経路を生成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:03:47 GMT)
Curse of High Dimensionality Issue in Transformer for Long-context Modeling [31.3] 注意計算において重要でないトークンを集約することにより冗長性を低減するために,textitDynamic Group Attention (DGA)を提案する。
その結果,DGAは競争性能を維持しながら計算コストを大幅に削減できることがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:51:31 GMT)
A Linear N-Point Solver for Structure and Motion from Asynchronous Tracks [31.1] 点対応からの構造と連続的な動きの推定は、コンピュータビジョンの基本的な問題である。
任意のタイムスタンプを持つ2次元点対応系の構造と線形運動推定のための統一的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:47:10 GMT)
HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs [30.6] HumanSenseは、MLLMの人間中心の知覚と相互作用能力を評価するために設計されたベンチマークである。
評価の結果,先進的なMLLMには改善の余地が残っており,特に高度なインタラクション指向タスクでは改善の余地があることが判明した。
我々は,Omniモデルの推論能力を高めるために,多段階・モダリティ・プログレッシブ強化学習を採用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:14:15 GMT)
A Neurosymbolic Framework for Interpretable Cognitive Attack Detection in Augmented Reality [30.6] CADARは、拡張現実における認知的攻撃検出のための新しいニューロシンボリックアプローチである。
ニューラルVLMを用いてマルチモーダル視覚言語入力を融合し、シンボリックな知覚グラフ表現を得る。
拡張されたAR認知攻撃データセットの実験では、強いベースラインよりも最大10.7%精度が向上した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:59:40 GMT)
Transferable Parasitic Estimation via Graph Contrastive Learning and Label Rebalancing in AMS Circuits [30.4] 本稿では,新しいグラフコントラスト学習フレームワークCircuitGCLを提案する。
表現散乱とラベルリバランシングを統合し、異種回路グラフ間の転送性を高める。
CircuitGCLは全ての最先端(SOTA)メソッドより優れており、R2$は33.64% sim 44.20%$、F1スコアは92タイム sim 2.1times$である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:46:02 GMT)
ChatENV: An Interactive Vision-Language Model for Sensor-Guided Environmental Monitoring and Scenario Simulation [30.4] 本稿では,衛星画像ペアと実世界のセンサデータとを併用した初の対話型VLMであるChatENVを紹介する。
i) GPT-4o と Gemini 2.0 を用いたデータアノテート,および (iii) チャット目的の効率的な低ランク適応 (LoRA) アダプタを用いた細管Qwen-2.5-VL。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:33:44 GMT)
Not There Yet: Evaluating Vision Language Models in Simulating the Visual Perception of People with Low Vision [30.2] 我々は、視覚言語モデル(VLM)が、画像の解釈において、低視野個体の視覚知覚をシミュレートできる範囲を評価する。
まず、40人の低ビジョン参加者を対象にした調査を通じて、ベンチマークデータセットをコンパイルする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:46:03 GMT)
PromptSafe: Gated Prompt Tuning for Safe Text-to-Image Generation [30.2] テキスト・ツー・イメージ(T2I)モデルは、暴力的または明示的なイメージなど、安全でない作業用コンテンツ(NSFW)の生成に脆弱である。
本稿では,軽量でテキストのみを教師付きソフト埋め込みと,推論時間付きゲート制御ネットワークを組み合わせたゲートプロンプトチューニングフレームワークであるPromptSafeを提案する。
PromptSafeはSOTAの安全でない生成率(2.36%)を達成し,高い良性を維持していることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:08:33 GMT)
QB Ground State Energy Estimation Benchmark [30.0] 基底状態エネルギー推定は、量子化学と凝縮物質物理学における中心的な問題である。
この研究は、古典的および量子的解法の両方のパフォーマンスを評価するための構造化ベンチマークフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:45:28 GMT)
A Survey on Diffusion Language Models [30.0] 拡散言語モデル(DLM)は、支配的な自己回帰(AR)パラダイムの代替である。
DLMは、推論遅延を減らし、双方向のコンテキストをキャプチャすることに固有の利点がある。
近年の進歩により、DLMは自己回帰に匹敵する性能を示すようになった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:47:22 GMT)
An Analytical Theory of Spectral Bias in the Learning Dynamics of Diffusion Models [30.0] 本研究では,拡散モデル学習中に生成した分布がどのように進化するかを理解するための解析的枠組みを開発する。
結果の確率フローODEを統合し、生成した分布の解析式を生成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:54:26 GMT)
Translation of Text Embedding via Delta Vector to Suppress Strongly Entangled Content in Text-to-Image Diffusion Models [29.1] 本稿では,特定の単語に強く絡み合ったコンテンツを抑制する新しい手法を提案する。
本手法は, テキスト埋め込みを改良し, 生成画像中の望ましくない内容の影響を弱める。
提案手法は, 定量的および定性的指標の観点から, 既存手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:25:48 GMT)
CURE: Critical-Token-Guided Re-concatenation for Entropy-collapse Prevention [28.7] 本稿では,探索と利用のバランスをとる2段階フレームワークCURE(Critical-token-gUided Re Concatenation for Entropy-collapse Prevention)を紹介する。
CUREは6つのベンチマークで5%のパフォーマンス向上を実現し、エントロピーと精度の両方で最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:40:34 GMT)
MDNS: Masked Diffusion Neural Sampler via Stochastic Optimal Control [28.7] 離散状態空間からサンプルを生成するために,ニューラルサンプリングを学習する問題について検討する。
離散型ニューラルサンプリングのための新しいフレームワークである$textbfM$asked $textbfDtextiffusionを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:27:16 GMT)
Common Data Properties Limit Object-Attribute Binding in CLIP [28.4] 低密度,不完全字幕,およびヒトキャプターが「最も有能な」物体を記述する傾向であるサリエンシバイアスは,結合性能に有害な影響を及ぼすことを示した。
バッチサイズをスケールアップする、すなわち、より強い負を暗黙的に追加したり、あるいはハード負を明示的に生成することで、CLIPは信頼性のあるバインディングを学習できない、ということが分かりました。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:25:35 GMT)
Processing and acquisition traces in visual encoders: What does CLIP know about your camera? [28.3] これまでの研究は、画像変換と腐敗に対するビジュアルエンコーダの堅牢性を分析してきた。
画像取得プロセスと変換のパラメータを分析して、人間の目には微妙な、あるいは知覚できない、異なる視点を採る。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:34:13 GMT)
OrderChain: Towards General Instruct-Tuning for Stimulating the Ordinal Understanding Ability of MLLM [28.2] 本稿では,MLLMの規則的理解能力を,特異性と共通性モデリングにより向上させる,新規で汎用的なプロンプトパラダイムであるOrderChainを提案する。
総合的な実験により、我々のOrderChainを用いたLLaVAモデルは、多様なORデータセットのベースラインLLaVAを大幅に改善することが示された。
OrderChainによるLLaVAは、Adienceデータセットの精度で27%、MAEで0.24で、最先端の手法よりも著しく優れています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:09:20 GMT)
Fake Speech Wild: Detecting Deepfake Speech on Social Media Platform [28.0] 本研究では,4つのメディアプラットフォームから254時間のリアルタイム・ディープフェイク音声を含むFake Speech Wild (FSW)データセットを提案する。
CMとして、実際のシナリオで現在のCMを評価するために、パブリックデータセットと高度な自己教師付き学習(SSL)ベースのCMを使用したベンチマークを確立する。
我々は,実世界のディープフェイク音声検出性能を著しく向上させ,各評価セットの平均等速(EER)を3.54%向上させた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:56:30 GMT)
Federated Cross-Training Learners for Robust Generalization under Data Heterogeneity [28.0] これにより、モデルは異なるソースからのデータをトレーニングし、一般化能力を改善することができる。
パーソナライズされた視点からの知識の蒸留は、クライアント固有の特性を保持し、局所的な知識基盤を広げる。
我々は,FedCTが局所的,グローバル的両視点からの知識を緩和し,最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:39:07 GMT)
Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation [27.9] 拡散に基づくニューラルネットワーク最適化(NCO)は、解生成のための離散拡散モデルを学習し、手作りのドメイン知識を排除し、NP完全(NPC)問題の解決に有効であることを示した。
既存のNCO手法は、クロススケールおよびクロスプロブレムの一般化において課題に直面し、従来の解法と比較して高いトレーニングコストがかかる。
拡散型NCOソルバのゼロショットクロスプロブレム転送とクロススケール一般化機能の両方を、追加のトレーニングを必要とせずに実現可能な、トレーニングフリーな推論時間適応フレームワーク(DIFU-Ada)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:07:37 GMT)
Estimating Covariance for Global Minimum Variance Portfolio: A Decision-Focused Learning Approach [27.8] 決定中心学習(DFL)は、予測誤差ではなく、決定品質を直接最適化する手法である。
DFLに基づく手法は、常に優れた意思決定性能を提供することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:00:52 GMT)
Layer-Wise Analysis of Self-Supervised Representations for Age and Gender Classification in Children's Speech [27.6] 本稿では,PFSTARとCMU Kidsデータセットを用いて,4種類のWav2Vec2変異体を詳細に解析する。
その結果,早期層はより深い層よりも話者固有の手がかりを効果的に捉えていることがわかった。
PCAの適用により、分類がさらに改善され、冗長性が低減され、最も情報性の高いコンポーネントが強調される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:11:44 GMT)
Evaluation of Speech Foundation Models for ASR on Child-Adult Conversations in Autism Diagnostic Sessions [27.3] 音声基礎モデルでは, 成人の発話と比較して, 子どもの発話に対する顕著な性能低下(15-20%絶対WER)がみられた。
低リソース環境では,LoRAを用いた最高のゼロショットモデル(Whisper-large)を微調整し,それぞれ8%と13%の絶対的なWER改善を実現した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:22:42 GMT)
What to Ask Next? Probing the Imaginative Reasoning of LLMs with TurtleSoup Puzzles [26.9] TurtleSoup-Benchは、想像的推論のための、最初の大規模、バイリンガル、インタラクティブなベンチマークである。
また,この環境下でのLLMの性能を評価するための新しいエージェントであるMosaic-Agentを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:55:42 GMT)
Increasing the Utility of Synthetic Images through Chamfer Guidance [26.8] Chamfer Guidanceは、合成データの質と多様性を特徴付けるトレーニング不要なガイダンスアプローチである。
提案手法は,2枚以上の実画像を用いて,最先端の撮影性能を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:31:24 GMT)
Evaluation of Cultural Competence of Vision-Language Models [26.0] 現代の視覚言語モデル(VLM)は、しばしば文化的能力評価とベンチマークで失敗する。
本稿では,視覚文化研究の基盤となる方法論が画像の文化的分析に欠かせないことを論じる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:00:41 GMT)
EXAONE Path 2.0: Pathology Foundation Model with End-to-End Supervision [25.5] 我々は,直接スライドレベルの監視の下でパッチレベルの表現を学習する病理基盤モデルEXAONE Path 2.0を提案する。
EXAONE Path 2.0はトレーニングにたった37kのWSIを使用し、10のバイオマーカー予測タスクで最先端の平均パフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:00:46 GMT)
SOI is the Root of All Evil: Quantifying and Breaking Similar Object Interference in Single Object Tracking [25.1] 類似オブジェクト干渉(SOI)の最初の体系的研究と定量化について述べる。
干渉源の除去は、全てのSOTAトラッカーで大幅な性能改善(AUCは4.35まで向上)をもたらす。
SOIBenchは,SOI課題を対象とする最初の意味認知指導ベンチマークである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:35:19 GMT)
VPOcc: Exploiting Vanishing Point for 3D Semantic Occupancy Prediction [24.9] 3Dシーンを意味的かつ空間的に理解することは、ロボットや自動運転車の安全なナビゲーションに不可欠である。
カメラベースの3Dセマンティック占有予測は、2D画像から完全なボクセルグリッドを推定する。
このタスクは本質的に2D-3Dの相違に悩まされ、カメラからの距離に応じて3D空間で同じ大きさの物体が異なる大きさの2D画像に現れる。
本稿では,2D-3Dの相違を画素レベルと特徴レベルの両方で緩和するために,消失点(VP)を利用するVPOccという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:31:02 GMT)
Conditional Information Bottleneck for Multimodal Fusion: Overcoming Shortcut Learning in Sarcasm Detection [24.9] マルチモーダルサルカズム検出は、モダリティ間の微妙な相補的な信号の区別を必要とする複雑なタスクである。
多くの先進的な手法は、意図した皮肉に関連する特徴を抽出するのではなく、データセットからショートカットを学習することに依存している。
本稿では,マルチモーダル・コンディショナル・インフォメーション・ブートネック(MCIB)モデルを導入し,効率的なマルチモーダル融合によるサルカズム検出を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:39:03 GMT)
SC2Arena and StarEvolve: Benchmark and Self-Improvement Framework for LLMs in Complex Decision-Making Tasks [24.8] StarCraft IIのような既存のタスクのベンチマークは、ゲームの完全な複雑さを捉えていない。
SC2Arenaは、すべてのプレイ可能なレース、低レベルのアクションスペースを完全にサポートし、テキストベースの観察を最適化し、空間的推論の課題に対処するベンチマークである。
戦略計画と戦術実行を統合する階層的なフレームワークであるStarEvolveを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:58:01 GMT)
Hybrid Fiber-Free-Space Entanglement Distribution Using Off-the-Shelf Quantum Devices [24.8] 絡み合いは量子技術の基本的なリソースとして機能し、古典的な限界を超える通信や計算のタスクを可能にする。
本研究では,キャンパススケールの3ノード量子ネットワーク上での偏光結合光子対の分布について報告する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:58:05 GMT)
CrossDenoise: Denoising Implicit Feedback via a Lightweight Entity-Aware Synergistic Framework [24.8] CrossDenoiseは、ノイズ推定をユーザ、アイテム、インタラクション固有の要因に分離する新しいフレームワークである。
ML-1M、Yelp、Amazon-bookデータセットの実験において、最先端のベースラインを一貫して大幅に上回る。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:20:12 GMT)
Improving Value-based Process Verifier via Low-Cost Variance Reduction [24.6] 大規模言語モデル(LLM)は、幅広いタスクにおいて顕著な成功を収めた。
しかし、特に数学のような複雑な分野において、それらの推論能力は依然として重要な課題である。
正解につながる部分的推論連鎖の確率を推定する値ベースのプロセス検証器は、推論を改善するための有望なアプローチである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:22:29 GMT)
STRelay: A Universal Spatio-Temporal Relaying Framework for Location Prediction with Future Spatiotemporal Contexts [23.9] STRelayは全てのケースにおける予測性能を3.19%-1156%改善している。
我々はSTRelayを4つの実世界の軌跡データセット上で4つの最先端位置予測ベースモデルと統合して評価する。
結果、STRelayは全てのケースにおける予測性能を3.19%-1156%改善することを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:44:33 GMT)
A Vision-Language Pre-training Model-Guided Approach for Mitigating Backdoor Attacks in Federated Learning [23.6] Federated Learning(FL)の既存のバックドア防御メソッドは、均質なクライアントデータ分散の仮定やクリーンサーブデータセットの可用性に依存しています。
視覚言語事前学習モデルのゼロショット学習機能を活用したFLバックドアディフェンスフレームワークCLIP-Fedを提案する。
CIFAR-10-LTでは2.03%、CIFAR-10-LTでは1.35%、平均MAでは7.92%、0.48%である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:39:54 GMT)
Physics-Informed Deep Contrast Source Inversion: A Unified Framework for Inverse Scattering Problems [23.5] 本稿では,高速かつ高精度な媒体再構成のための物理インフォームド・ディープコントラスト・ソース・インバージョン・フレームワーク(DeepCSI)を提案する。
コントラスト源インバージョン(CSI)とニューラル演算子法にインスパイアされた残留多層パーセプトロン(ResMLP)は、電流分布をモデル化するために用いられる。
DeepCSIは、完全データ、位相なしデータ、多周波条件下で、高精度で堅牢な再構成を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:50:16 GMT)
DiRW: Path-Aware Digraph Learning for Heterophily [23.5] グラフニューラルネットワーク(GNN)は、グラフ構造化データのための強力な表現学習ツールとして登場した。
DiRWは、ほとんどの空間ベースのDiGNNのためのプラグアンドプレイ戦略であり、新しいダイグラフ学習パラダイムを提供する革新的なモデルである。
9つのデータセットの実験から,(1)プラグアンドプレイ戦略としての空間的手法,(2)新しいディグラフ学習パラダイムとしてのSOTA性能,の2つが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:21:06 GMT)
Beyond conventional vision: RGB-event fusion for robust object detection in dynamic traffic scenarios [23.4] 従来のRGBカメラのダイナミックレンジは、大域的なコントラストを減少させ、高周波の詳細が失われる。
そこで本研究では,光の難易度を最適化した移動キュー融合ネットワーク(MCFNet)を提案する。
MCFNetは、様々な低照度および高速移動トラフィックシナリオにおいて、既存の手法よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:48:21 GMT)
Retrieval-Augmented Prompt for OOD Detection [23.1] Out-of-Distribution (OOD) 検出は、ハードウェア内のマシンラーニングモデルの信頼性の高いデプロイに不可欠である。
我々は、検索補助プロンプト(RAP)と呼ばれる新しいOOD検出法を提案する。
RAPは、外部知識を取得することで、事前訓練された視覚言語モデルのプロンプトを強化し、OOD検出のためのセマンティックインスペクションを強化する。
RAPは大規模OOD検出ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:52:43 GMT)
Psyche-R1: Towards Reliable Psychological LLMs through Unified Empathy, Expertise, and Reasoning [22.9] 我々は,共感,心理学的専門知識,推論を共同で統合した中国初の心理学的大規模言語モデル(LLM)である Psyche-R1 を提案する。
具体的には,75k以上の心理的質問を詳細な論理と組み合わせて生成する包括的データ合成パイプラインを設計する。
実験の結果、いくつかの心理学的ベンチマークでサイクロン-R1の有効性が示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:18:35 GMT)
Just Functioning as a Hook for Two-Stage Referring Multi-Object Tracking [22.7] Referring Multi-Object Trackingは、自然言語表現で指定されたビデオに対象の軌跡をローカライズすることを目的としている。
本稿では,RMOTにおけるトラッキングと参照の2つのサブタスクの内在的関係を系統的に解析する。
サブタスク間のリンクを再定義するためにHookモジュールを最初に設計した新しい2段階RTTフレームワークであるJustHookを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:26:18 GMT)
NAVER: A Neuro-Symbolic Compositional Automaton for Visual Grounding with Explicit Logic Reasoning [22.6] 本稿では,人間の認知のような推論を必要とする手法の課題について考察する。
本研究では,明示的な確率論的論理推論を統合する構成的視覚的接地手法であるNAVERを提案する。
その結果、NAVERは最近のエンドツーエンドや構成ベースラインと比較して SoTA の性能が向上していることがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:58:31 GMT)
CRISP: Contrastive Residual Injection and Semantic Prompting for Continual Video Instance Segmentation [22.5] CRISP(Contrastive Residual Injection and Semantic Prompting)を紹介する。
CRISPは、連続的なビデオインスタンスセグメンテーションにおけるインスタンスワイド、カテゴリワイド、タスクワイドの混乱に対処することを目的としている。
長期連続ビデオインスタンスセグメンテーションタスクにおいて、既存の連続的なセグメンテーション手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:06:01 GMT)
Chain-of-Query: Unleashing the Power of LLMs in SQL-Aided Table Understanding via Multi-Agent Collaboration [22.4] Chain-of-Query (CoQ)は、テーブル理解のための新しいマルチエージェントフレームワークである。
CoQは、構造的ノイズを抽象化し、理解を深めるために、テーブルスキーマの自然言語スタイルの表現を採用する。
4つのモデルによる実験では、Chain-of-Queryの精度は61.11%から74.77%に大幅に向上した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:46:46 GMT)
Building Instruction-Tuning Datasets from Human-Written Instructions with Open-Weight Large Language Models [22.2] 我々は、人間による命令から得られた最先端の命令チューニングデータセットを構築した。
LLMは私たちのデータセットで微調整され、既存のデータセットで微調整されています。
分析によれば、新しい言語での命令チューニングにより、LLMは命令に従うことができるが、チューニングされたモデルは、その言語における文化固有の知識の欠如を顕著に示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:59:56 GMT)
WeatherPrompt: Multi-modality Representation Learning for All-Weather Drone Visual Geo-Localization [22.0] We present WeatherPrompt, a multi-modality learning paradigm that establishs weather-invariant representations through fusing the image embedding with the text context。
我々のフレームワークは、最先端のドローンジオローカライズ手法と比較して、競争力のあるリコール率を達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:05:56 GMT)
MedVLThinker: Simple Baselines for Multimodal Medical Reasoning [21.8] MedVLThinkerは、推論中心の医療用LMMを構築するための、シンプルだが強力なベースラインのスイートである。
完全オープンなレシピは,(1) テキストのみとイメージテキストの両方の医療データに対する体系的なデータキュレーション,(2) 推論の難易度に応じてフィルタリング,(2) 学習パラダイム: 蒸留された推論トレースの超微調整(SFT) および最終回答の正しさに基づく強化学習(RLVR) から構成される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:47:57 GMT)
MedSAMix: A Training-Free Model Merging Approach for Medical Image Segmentation [21.8] 医用画像セグメンテーションのためのトレーニングフリーモデルマージ手法であるMedSAMixを提案する。
MedSAMixは、ドメイン固有の精度と一般化の両方において、一貫して性能を改善していることを示す。
臨床応用として,ドメイン固有性と一般化可能性の要求を満たすための2つの体制を開発する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:35:57 GMT)
Agentic Design Review System [21.7] グラフィックデザインの評価には、アライメント、構成、美学、色選択など、複数の面からそれを評価することが含まれる。
本稿では,複数のエージェントがメタエージェントによって構成された設計を協調的に分析するエージェント設計レビューシステム(AgenticDRS)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:29:24 GMT)
MAC: A Live Benchmark for Multimodal Large Language Models in Scientific Understanding [21.6] 我々は,科学的な進歩とモデル進歩を伴って進化するライブベンチマークであるMultimodal Academic Coverベンチマーク(MAC)を紹介した。
MACは、Nature、Science、Cellといったトップレベルの科学雑誌から得られた25,000以上の画像テキストペアを活用している。
言語空間推論による視覚的特徴の拡張によりMLLMを強化する軽量な推論時間アプローチであるDADを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:22:57 GMT)
Unpacking the Implicit Norm Dynamics of Sharpness-Aware Minimization in Tensorized Models [21.5] 一般的なテンソル化モデルにおけるシャープネス・アウェア最小化(SAM)のノルムダイナミクスを解析する。
SAMのノルム偏差の暗黙的な制御は、コアノルムとその勾配等級の共分散によって制御されていることを示す。
そこで本研究では,データ適応方式でコアノルムをスケーリングすることで,この正規化動作を明示的に模倣する,シンプルで効果的な手法であるemphDeviation-Aware Scaling(DAS)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:17:34 GMT)
Performance of universal machine-learned potentials with explicit long-range interactions in biomolecular simulations [21.3] 普遍的な機械学習ポテンシャルは、構成的および振動的自由度間で伝達可能な精度を約束する。
この研究は、SPICE-v2データセットで訓練された均質なメッセージパッシングアーキテクチャを、明示的な長距離分散と静電効果なしで体系的に評価する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:08:34 GMT)
Jailbreaking Commercial Black-Box LLMs with Explicitly Harmful Prompts [21.2] MDH (Malicious Content Detection based on LLMs with Human aid) というハイブリッド評価フレームワークを提案する。
D-AttackとDH-CoTという2つの新しい戦略を提案することになるのです。
Codes、データセット、判断、検出結果は、リポジトリでリリースされる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:46:56 GMT)
Learning from Natural Language Feedback for Personalized Question Answering [21.1] パーソナライゼーションは、言語技術の有効性とユーザ満足度を高めるために不可欠である。
大規模言語モデル(LLM)をパーソナライズするための現在のアプローチは、しばしば検索強化世代(RAG)に依存している。
我々は、スカラー報酬を自然言語フィードバック(NLF)に置き換える、パーソナライズされた応答生成のための新しいフレームワークであるVacを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:36:53 GMT)
A Production-Ready Machine Learning System for Inclusive Employment: Requirements Engineering and Implementation of AI-Driven Disability Job Matching Platform [20.8] イタリアでは障害者の雇用は依然として極めて低く、強制雇用の定員は3.5%に過ぎなかった。
我々のゴールは、人間による意思決定の監督を維持しつつ、社会的責任要件を統合した障害雇用マッチングのための生産可能な機械学習システムを開発することである。
このシステムは90.1%のF1スコアと100ms以下のレスポンスタイムを達成し、50,000の候補-パートナーの組み合わせを10分以内で処理する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:17:19 GMT)
From Pixel to Mask: A Survey of Out-of-Distribution Segmentation [20.8] AIセキュリティに対する懸念が高まり、アウト・オブ・ディストリビューション(OoD)の検出とセグメンテーションが注目を集めている。
OoDセグメンテーションはこの制限に対処し、画素レベルの粒度で異常なオブジェクトをローカライズする。
この機能は、認識モジュールが検出するだけでなく、OoDオブジェクトを正確にセグメント化する必要がある自律運転のような安全クリティカルなアプリケーションにとって重要である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:26:56 GMT)
INSIGHT: Explainable Weakly-Supervised Medical Image Analysis [20.6] INSIGHTは、熱マップ生成を誘導バイアスとして統合する、弱制御アグリゲータである。
CTとWSIのベンチマークでは、INSIGHTは最先端の分類結果と弱いラベル付きセマンティックセグメンテーション性能を達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:14:10 GMT)
Towards Spatially Consistent Image Generation: On Incorporating Intrinsic Scene Properties into Diffusion Models [20.5] 本研究では,その背景となるシーンについて豊富な情報を提供する固有シーン特性を活用する。
提案手法は,画像とそれに対応する内在性の両方を共同生成し,その基盤となるシーン構造を暗黙的に捉えることを目的としている。
実験により,提案手法は空間的不整合を補正し,より自然なシーンレイアウトを生成することを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:26:36 GMT)
JMA: a General Algorithm to Craft Nearly Optimal Targeted Adversarial Example [20.3] より一般的な、理論的に健全な標的攻撃が提案され、ヤコビアンによって誘導されるマハラノビス距離項の最小化に頼っている。
提案アルゴリズム(JMA)は、もともとSzegedyらによって導入された逆例問題の線形化問題に対する最適解を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:09:49 GMT)
TexVerse: A Universe of 3D Objects with High-Resolution Textures [20.3] TexVerseは、Sketchfabから派生した858K以上のユニークな高解像度3Dモデルのキュレートされたコレクションである。
それぞれのモデルには高解像度のバリエーションがすべて含まれており、合計で1.6Mの3Dインスタンスが提供される。
TexVerse-Skeletonは69Kリギングモデル、TexVerse-Animationは54Kアニメーションモデルである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:43:25 GMT)
A Geometric Unification of Distributionally Robust Covariance Estimators: Shrinking the Spectrum by Inflating the Ambiguity Set [20.2] 制約的な仮定を課さずに共分散推定器を構築するための原理的手法を提案する。
頑健な推定器は効率的に計算可能で一貫したものであることを示す。
合成および実データに基づく数値実験により、我々の頑健な推定器は最先端の推定器と競合していることが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:17:33 GMT)
GenOM: Ontology Matching with Description Generation and Large Language Model [19.9] 本稿では,大規模言語モデル(LLM)に基づくオントロジーアライメントフレームワークであるGenOMを紹介する。
OAEI Bio-MLトラックで行った実験は、GenOMがしばしば競争力を発揮することを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:48:09 GMT)
Hell or High Water: Evaluating Agentic Recovery from External Failures [19.4] 我々は,言語エージェントが目的を達成するための代替手段をいかに探すかを研究するために,特殊エージェント計画ベンチマークを開発する。
私たちのベンチマークでは、突然利用不能になった関数など、ワークフロー内の外部障害にエージェントが直面しています。
全体として,言語エージェントは環境フィードバックに応じて,バックアップ計画の定式化と実行に苦慮している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:21:09 GMT)
MCP-Guard: A Defense Framework for Model Context Protocol Integrity in Large Language Model Applications [19.4] 大規模言語モデルと外部ツールの統合は、重大なセキュリティ脆弱性をもたらす。
LLM-toolインタラクション用に設計されたロバストな層状防御アーキテクチャであるMPP-Guardを提案する。
MCP-AttackBenchも紹介します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:00:25 GMT)
GraphFedMIG: Tackling Class Imbalance in Federated Graph Learning via Mutual Information-Guided Generation [19.2] フェデレーショングラフ学習(FGL)は、複数のクライアントがプライベートな分散グラフデータを共有することなく、強力なグラフニューラルネットワークを協調的にトレーニングすることを可能にする。
本稿では,新たなFGLフレームワークであるGraphFedMIGを提案する。
実世界の4つのデータセットについて広範な実験を行い、提案したGraphFedMIGが他のベースラインと比較して優れていることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:16:56 GMT)
Combating Homelessness Stigma with LLMs: A New Multi-Modal Dataset for Bias Detection [19.2] 社会的スティグマティゼーションは、緩和し、大衆の認識をシフトさせ、政策決定に影響を与える障壁である。
本研究は,公共の意見に基づくホームレスの緩和に寄与する。
Reddit、X(元Twitter)、ニュース記事、市議会の議事録から収集された、手動で注釈付けされた新しいデータセットを米国10都市で提示する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:58:34 GMT)
FROGENT: An End-to-End Full-process Drug Design Agent [19.0] 薬物発見のための強力なAIツールは、孤立したWebアプリ、デスクトッププログラム、コードライブラリに存在する。
この問題に対処するため、FROGENTという名前のフルプロセスduG dEsign ageNTが提案されている。
FROGENTはLarge Language ModelとModel Context Protocolを使用して、複数の動的生化学データベース、ツールライブラリ、タスク固有のAIモデルを統合する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:45:53 GMT)
MSRS: Adaptive Multi-Subspace Representation Steering for Attribute Alignment in Large Language Models [18.9] アクティベーションステアリングは、大規模言語モデルの振る舞いを制御するための有望なアプローチを提供する。
実効的なマルチ属性ステアリングのための新しいフレームワークであるマルチサブスペース表現ステアリング(MSRS)を提案する。
MSRSはサブスペースを各属性に割り当てることで属性間干渉を低減し、モデルの表現空間内での影響を分離する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:40:19 GMT)
Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation [18.9] LayeredDepthは、実世界のベンチマークと合成データジェネレータを含む、多層深度アノテーションを備えた最初のデータセットである。
我々のベンチマークは、様々なシーンから1,500枚の画像で構成され、その上で最先端の深度推定手法を評価することで、透明な物体に苦しむことを明らかにした。
この合成データセットのみをトレーニングしたベースラインモデルは、優れたクロスドメイン多層深さ推定を生成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:33:28 GMT)
STEP: Stepwise Curriculum Learning for Context-Knowledge Fusion in Conversational Recommendation [18.8] 本稿では,事前学習型言語モデルを中心にした対話型レコメンデーションシステムSTEPを紹介する。
STEPはカリキュラム誘導のコンテキスト知識融合と軽量なタスク固有のプロンプトチューニングを組み合わせる。
実験の結果,STEPは2つの公開データセットの推薦精度と対話品質において,主要な手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:08:21 GMT)
Warehouse Spatial Question Answering with LLM Agent [18.8] 本研究では,強い空間推論能力を有するLLMエージェントシステムを提案する。
本システムでは,LLMエージェントが空間推論やAPIツールのインタラクションを行うための複数のツールを統合している。
本システムでは,オブジェクト検索,カウント,距離推定などのタスクにおいて高い精度と効率を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:48:03 GMT)
IBEX: Information-Bottleneck-EXplored Coarse-to-Fine Molecular Generation under Limited Data [18.8] 3次元生成モデルは構造に基づく薬物発見をますます加速させるが、公開されていないタンパク質-リガンド複合体によって制限されている。
IBEX(Information-Bottleneck-Expploed coarse-to-fine Pipeline)は,タンパク質-リガンド複合体の慢性的欠如に対処する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:59:22 GMT)
CapeLLM: Support-Free Category-Agnostic Pose Estimation with Multimodal Large Language Models [18.1] カテゴリーに依存しないポーズ推定(CAPE)は、伝統的に注釈付きキーポイントを持つサポートイメージに依存してきた。
本稿では,CAPE用に設計された最初のマルチモーダル大規模言語モデル(MLLM)であるCapeLLMを紹介する。
提案手法では,MP-100ベンチマークを1ショット,さらに5ショット設定で新たな最先端に設定する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:34:01 GMT)
IADGPT: Unified LVLM for Few-Shot Industrial Anomaly Detection, Localization, and Reasoning via In-Context Learning [18.1] Few-Shot Industrial Anomaly Detection (FS-IAD) は産業品質検査の自動化に重要な応用例である。
我々は,FS-IADを人間的な方法で実行するための統合フレームワーク IADGPT を提案する。
本稿では,400種類の産業製品カテゴリにまたがる100K画像からなる新しいデータセットについて述べる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:24:47 GMT)
DiFaR: Enhancing Multimodal Misinformation Detection with Diverse, Factual, and Relevant Rationales [17.9] DiFaRは、誤情報検出を強化するために、多種多様で、事実的で、関連する有理性を生み出す。
4つの人気のあるベンチマークの実験では、DiFaRは4つのベースラインカテゴリを最大5.9%上回っている。
自動測定と人的評価の両方で、DiFaRは3次元全てで合理的な品質を著しく改善することを確認した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:32:31 GMT)
Improving Viewpoint Consistency in 3D Generation via Structure Feature and CLIP Guidance [17.9] 現在の手法はしばしば幾何学的矛盾に悩まされ、一般にヤヌス問題と呼ばれる。
本稿では,拡散モデルにおけるジャナス問題の根本原因である視点生成バイアスを明らかにする。
本稿では,Attention and CLIP Guidance (ACG) 機構と呼ばれるチューニング不要な手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:28:36 GMT)
The Conditional Regret-Capacity Theorem for Batch Universal Prediction [17.7] 古典的後悔-容量定理の条件付き版を導出する。
我々は、定理をR'enyi情報測度に一般化し、条件付きR'enyi発散と条件付きSibsonの相互情報との深い関係を明らかにする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:17:10 GMT)
EvaDrive: Evolutionary Adversarial Policy Optimization for End-to-End Autonomous Driving [17.6] EvaDriveは、自動運転のための新しい強化学習フレームワークである。
ヒューマンライクな反復的意思決定のためのクローズドループ対向フレームワークを提供する。
NAVSIMとBench2Driveベンチマークの大規模な実験では、SOTAのパフォーマンスが示されている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:22:36 GMT)
Multi-Agent Trust Region Policy Optimisation: A Joint Constraint Approach [17.5] Heterogeneous-Agent Trust Region Policy Optimization (HATRPO) は、Kulback-Leibler (KL) の分散を用いて、訓練の安定化を図る。
各エージェントを同じKL閾値に割り当てると、特に不均一な設定において、遅くて局所的に最適な更新につながる可能性がある。
エージェント間のKL分散しきい値の割当には,グローバルなKL制約下でのしきい値割り当てを最適化するKKT法であるHATRPO-Wと,改善に基づくエージェントの優先順位付けを行うgreedyアルゴリズムであるHATRPO-Gの2つの方法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:48:46 GMT)
HiRef: Leveraging Hierarchical Ontology and Network Refinement for Robust Medication Recommendation [17.5] 我々は、ロバストメディカルレコメンデーション(HiRef)のための階層的オントロジーとネットワークリファインメントを提案する。
我々は、自然に木のような関係を捉え、共有された祖先を通して知識の伝達を可能にする双曲空間に実体を埋め込む。
本モデルは,EMHベンチマーク(MIMIC-IIIおよびMIMIC-IV)において高い性能を達成し,シミュレーションできないコード設定下で高い精度を維持する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:55:03 GMT)
DGNS: Deformable Gaussian Splatting and Dynamic Neural Surface for Monocular Dynamic 3D Reconstruction [17.3] 我々は、UnderlineDeformable UnderlineGaussian SplattingとDynamic UnderlineNeural UnderlineSurfaceを統合するハイブリッドフレームワークであるDGNSを紹介する。
公開データセットを用いて行った実験により、DGNSは3次元再構成において最先端のパフォーマンスを達成し、新規ビュー合成の競争的な結果が得られた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:45:17 GMT)
Boundary-induced Phases in the Dissipative Dicke Lattice Model [17.2] 少数のサイトを持つ散逸ディック格子モデルにおける超ラジカル相転移について検討する。
開境界条件下では、翻訳対称性の破れた超放射相全体の動物園が現れる。
本研究は, 散逸格子モデルの定常位相に対する境界効果の重大な影響を示すものである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:59:21 GMT)
Video-BLADE: Block-Sparse Attention Meets Step Distillation for Efficient Video Generation [17.2] ビデオ推論のためのデータフリーのジョイントトレーニングフレームワークBLADEを提案する。
私たちのフレームワークは、さまざまなスケールで顕著な効率向上を示します。
短いビデオシーケンス長を持つCagVideoX-5Bのようなモデルでは、我々のフレームワークはロバストな8.89倍のスピードアップを提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:58:59 GMT)
Interpretable Reward Model via Sparse Autoencoder [16.9] 本稿では,Sparse Autoencoder-enhanced Reward Model(SARM)を紹介する。
SARMはLLMベースのRMの隠れた活性化を解釈可能でスパースで単意味的な特徴空間にマッピングする。
実験的な評価では、SARMは報酬割り当ての直接的特徴レベルの帰属を促進し、好みのシフトを動的に調整し、従来の報酬モデルよりも優れたアライメント性能を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:21:50 GMT)
Robustness tests for biomedical foundation models should tailor to specifications [16.7] タスク依存の優先順位に応じて堅牢性テストの調整を提案する。
本稿では,実装の指針となる事前定義された仕様にロバスト性という概念を統合することを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:13:10 GMT)
Combining Machine Learning Defenses without Conflicts [16.5] 機械学習(ML)の防御は、セキュリティ、プライバシ、公正性に対するさまざまなリスクから保護される。
しかし、MLモデルにおける防御と相反する相互作用を組み合わせることは効果がない。
本稿では,有効防衛の組み合わせを特定するために,DefConという原理的な組み合わせ手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:44:57 GMT)
ReviewRL: Towards Automated Scientific Review with RL [16.4] 既存の自動レビューアプローチは、事実の正確性、評価の一貫性、分析の深さに苦慮している。
本稿では,総合的かつ現実的な科学的論文レビューを生成するための強化学習フレームワークであるReviewRLを紹介する。
提案手法は,(1)関連する科学的文献を取り入れたArXiv-MCP検索拡張コンテキスト生成パイプライン,(2)基礎的レビュー機能を確立する教師付き微調整,(3)複合報酬機能を備えた強化学習手法を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:26:13 GMT)
Leveraging Large Language Models for Relevance Judgments in Legal Case Retrieval [16.3] 本稿では,大規模言語モデルによる専門家による関連判断の生成を支援する,数ショットのアプローチを提案する。
提案手法は,人間のアノテータのワークフローを模倣して,判断過程をいくつかの段階に分解する。
また、解釈可能なデータラベリングを保証し、関連性評価プロセスにおける透明性と明確性を提供します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:13:17 GMT)
Semantic-Enhanced Time-Series Forecasting via Large Language Models [16.2] 時系列予測は、金融、エネルギー、気象学、IoTアプリケーションにおいて重要な役割を果たす。
近年,大規模言語モデル(LLM)の一般化機能を活用して時系列予測に適応し,有望な性能を実現している。
本稿では,時系列の固有周期性と異常特性を探索し,意味空間に埋め込むセマンティック拡張LDM(SE-LLM)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:25:44 GMT)
Diversity First, Quality Later: A Two-Stage Assumption for Language Model Alignment [16.1] 言語モデル(LM)と人間の好みの整合性は、信頼できるAIシステムを構築する上で重要である。
近年,静的選好データから直接ポリシーを最適化するLMアライメント手法として,直接選好最適化(DPO)が提案されている。
政治上のデータは必ずしも最適ではなく、静的な選好候補と政治上の選好候補の間に体系的な効果差が生じる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:05:18 GMT)
Ultra-High-Definition Reference-Based Landmark Image Super-Resolution with Generative Diffusion Prior [16.0] RefSRは、追加の参照高解像度(参照HR)画像から意味情報とテクスチャ情報を活用することで、低解像度(LR)画像を復元することを目的としている。
既存の拡散ベースのRefSRメソッドは通常、ControlNet上に構築されている。
本稿では、LR画像と基準HR画像とのパターンマッチングを明示的に実現する新しいフレームワークであるTriFlowSRを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:04:39 GMT)
Forgery Guided Learning Strategy with Dual Perception Network for Deepfake Cross-domain Detection [16.0] 現在のディープフェイク検出方法は特定のデータセットでうまく機能するが、未知の偽造技術を持つデータセットに適用すると性能が低下する。
本稿では,検出ネットワークが未知のフォージェリ手法に継続的に適応できるように,FGL(Forgery Guided Learning)戦略を提案する。
また、偽トレース間の差異と関係をキャプチャするDual Perception Network(DPNet)を設計する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:27:21 GMT)
To Theoretically Understand Transformer-Based In-Context Learning for Optimizing CSMA [16.0] バイナリ指数バックオフ方式はWiFi 7で広く使われているが、動的チャネル環境下ではスループットが低下している。
最近のモデルベースアプローチは、既知のノード密度と固定されたノード密度の下でのバックオフ戦略を単純に最適化する。
本稿では、チャネルアクセスを最適化するためのトランスフォーマーベースのインコンテキスト学習(ICL)理論を初めて提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:13:56 GMT)
MSC: A Marine Wildlife Video Dataset with Grounded Segmentation and Clip-Level Captioning [16.0] 海洋ビデオは、ビデオ理解にとって重要な課題である。
既存のビデオキャプションデータセットは、しばしば海洋環境の複雑さを一般化するのに失敗する。
本稿では,2段階の海洋オブジェクト指向ビデオキャプションパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:50:06 GMT)
APFL: Analytic Personalized Federated Learning via Dual-Stream Least Squares [15.8] 解析的パーソナライズド・フェデレーション・ラーニング (APFL) 手法を提案する。
当社のAPFLは,全クライアントを対象としたグローバルな一般化のための共有プライマリストリームと,各クライアントのローカルパーソナライズのための専用リファインメントストリームを組み込んでいる。
さまざまなデータセットにまたがる実証的な結果は、最先端のベースラインよりもAPFLの方が優れていることを証明します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:12:50 GMT)
Hardness-Aware Dynamic Curriculum Learning for Robust Multimodal Emotion Recognition with Missing Modalities [15.8] 本稿では,Hardy-MER という,Hardness-Aware Dynamic Curriculum Learning フレームワークを提案する。
まず、各サンプルの硬度レベルを推定し、次に、トレーニング中の硬度レベルを戦略的に強調する。
ベンチマークデータセットの実験は、HARDY-MERが欠落したモダリティシナリオで既存のメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:06:55 GMT)
Out of Distribution, Out of Luck: How Well Can LLMs Trained on Vulnerability Datasets Detect Top 25 CWE Weaknesses? [15.4] 自動脆弱性検出研究のための3部構成のソリューションを提案する。
まず、手動でキュレートされたテストデータセットであるBenchVulを紹介します。
第2に,38,863個の関数からなる高品質なトレーニングデータセットTitanVulを構築した。
第3に,コンテキスト認識型脆弱性事例を合成するリアリスティック脆弱性生成(RVG)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:16:52 GMT)
Semantic-aware DropSplat: Adaptive Pruning of Redundant Gaussians for 3D Aerial-View Segmentation [15.2] SAD-Splatという新しい3D-AVS-SSアプローチを提案する。
本手法は,ハードコンクリートの分布に基づいて,意味的信頼度を学習可能な疎性メカニズムと統合する。
セグメンテーションの精度と表現のコンパクトさのバランスは良好である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:26:32 GMT)
Med-GLIP: Advancing Medical Language-Image Pre-training with Large-scale Grounded Dataset [15.2] Med-GLIPは、Med-GLIP-5Mでトレーニングされたモダリティ対応の基盤フレームワークである。
多様なトレーニングデータから階層的意味理解を暗黙的に取得する。
複数のグラウンドベンチマークで、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:02:38 GMT)
From Actions to Words: Towards Abstractive-Textual Policy Summarization in RL [15.1] 我々は,SySLLM (Synthesized Summary using Large Language Models)を導入し,抽象的・テクスチュアルな政策説明の新しいパラダイムを提案する。
SySLLMは、エージェントポリシーの構造的で理解しやすい説明を提供するテキスト要約を生成する。
評価の結果,SySLLMは,人的専門家が認識した目標選択や探索戦略などの重要な洞察を捉えていることがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:31:22 GMT)
eMamba: Efficient Acceleration Framework for Mamba Models in Edge Computing [14.9] State Space Model (SSM)ベースの機械学習アーキテクチャは、最近、シーケンシャルデータを処理する上で大きな注目を集めている。
eMambaは、エッジプラットフォームにMambaモデルをデプロイするために特別に設計された、包括的なエンドツーエンドハードウェアアクセラレーションフレームワークである。
我々はeMambaが1.63-19.9$times$ lessパラメータを使って最先端技術に匹敵する精度を達成することを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:08:05 GMT)
Towards Agentic AI for Multimodal-Guided Video Object Segmentation [14.9] 参照ベースのビデオオブジェクトは、外部キューでガイドされたきめ細かいセグメンテーション結果を生成する必要のあるマルチモーダル問題である。
ビジョン言語基礎モデルの最近の進歩は、トレーニングフリーアプローチへの有望な方向性を開いている。
本稿では,この課題を柔軟かつ適応的に解決する新しいエージェントシステムであるMulti-Modal Agentを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:11:15 GMT)
Diffusion is a code repair operator and generator [14.7] 我々は,この類似性を生かして,学習済みのコード拡散モデルを用いて最終マイル補修問題に対する適用範囲を評価する。
まず、壊れたコードスニペットにノイズを加え、拡散過程を再開することで、最後のマイル補修に拡散モデルを利用することができる。
第2に、拡散過程から中間プログラム(入力)と最終プログラム(出力)をサンプリングすることにより、拡散モデルを利用して、最終マイル補修タスク(計算効率が良い)の任意の量のトレーニングデータを生成することができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:27:09 GMT)
Generative Active Adaptation for Drifting and Imbalanced Network Intrusion Detection [14.7] 生成能動適応フレームワークは、モデルロバスト性を高めながらラベリング作業を最小化する。
我々は、シミュレーションIDSデータと実世界のISPデータセットの両方に基づいて、エンドツーエンドフレームワークNetGuardを評価した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:27:49 GMT)
MASH: Cooperative-Heterogeneous Multi-Agent Reinforcement Learning for Single Humanoid Robot Locomotion [14.7] 本稿では, 協調型多エージェント深部強化学習(MARL)による単一ヒューマノイドロボットの移動促進手法を提案する。
実験により,MASHは訓練の収束を加速し,全身協調能力を向上させることが示され,従来の単エージェント強化学習法よりも優れていた。
この研究は、MARLをシングルヒューマノイドロボット制御に統合し、効率的な移動戦略に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:54:31 GMT)
AI Across Borders: Exploring Perceptions and Interactions in Higher Education [14.7] 本研究では,生成人工知能(GenAI)に対する学生の認識について検討する。
我々は、AIに対する認識と認識について、1211人の学生から定量的なLikert評価と質的なコメントを収集した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:25:48 GMT)
NanoControl: A Lightweight Framework for Precise and Efficient Control in Diffusion Transformer [14.6] NanoControlは、制御可能なテキスト・ツー・イメージ生成のためのバックボーンネットワークとしてFluxを使用している。
我々のモデルは、最先端の制御可能なテキスト・ツー・イメージ生成性能を実現する。
パラメータ数は0.024%増加し、GFLOPは0.029%増加し、高効率な制御可能な生成を可能にする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:54:44 GMT)
HAFix: History-Augmented Large Language Models for Bug Fixing [14.6] バグ修正の履歴ラベル付きLLMを表すHAFixを提案する。
私たちは、3つのコードLLM(Code Llama、DeepSeek-Coder、DeepSeek-Coder-V2-Liteモデル)をBugsInPyの51の単一行PythonバグとDefects4Jの116の単一行Javaバグに採用しています。
以上の結果から,HAFixは非史的ベースラインに比べて統計的に有意な改善が見られた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:51:03 GMT)
SproutBench: A Benchmark for Safe and Ethical Large Language Models for Youth [14.6] 子供や青年を対象とするアプリケーションにおける大規模言語モデル(LLM)の急速な普及は、一般的なAI安全フレームワークの根本的な再評価を必要とする。
本稿では,年齢別認知,情緒的,社会的リスクなどの不適切な範囲を含む,既存のLCM安全性ベンチマークにおける重要な欠陥を明らかにする。
SproutBenchは,情緒的依存やプライバシー侵害,危険行動の模倣といったリスクを調査するための,1,283の発達的根拠を持つ敵のプロンプトからなる,革新的な評価スイートである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:21:39 GMT)
Unlocking Robust Semantic Segmentation Performance via Label-only Elastic Deformations against Implicit Label Noise [14.5] NSegment+は、画像とラベルの変換を分離し、セマンティックセグメンテーションのための現実的なノイズに対処するフレームワークである。
NSegment+はパフォーマンスを継続的に改善し、Vayhingen、LoveDA、Cityscapes、PASCAL VOCで平均+2.29、+2.38、+1.75、+3.39までのmIoUゲインを達成する。
これらの利得は、CutMixやLabel Smoothingなど、他のトレーニングトリックと組み合わせることでさらに増幅することができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:27:43 GMT)
ReportBench: Evaluating Deep Research Agents via Academic Survey Tasks [14.4] ReportBenchは、大規模言語モデル(LLM)によって生成された研究レポートの内容品質を評価するために設計されたベンチマークである。
本評価は,(1)引用文献の質と妥当性,(2)報告内容の忠実さと妥当性の2つの重要な側面に焦点をあてる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:33:43 GMT)
Non-Stationary Restless Multi-Armed Bandits with Provable Guarantee [14.2] オンラインレスレス・マルチアーム・バンディット(RMAB)は、各アームが固定状態遷移と報酬を持った静止マルコフ決定プロセス(MDP)に従うと仮定している。
医療やレコメンデーションシステムのような現実世界のアプリケーションでは、これらの仮定は静止しないダイナミクスによって壊れることが多い。
提案手法は,スライディングウィンドウ強化学習(RL)と上位信頼境界(UCB)機構を統合し,遷移力学とその変動を同時に学習する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:26:00 GMT)
Optimistic critics can empower small actors [14.1] 非対称なセットアップの利点、特により小さいアクターの使用について論じる。
一般的に、より小さなアクターはパフォーマンスの劣化と批評家の過度な適合をもたらす。
分析の結果,この行動の主な原因の一つとして,価値過小評価によるデータ収集が不十分であることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:32:40 GMT)
Hummingbird: Fast, Flexible, and Fair Inter-Domain Bandwidth Reservations [13.9] 本稿では,エンドホストに対して詳細なドメイン間予約を提供する軽量システムであるHummingbirdを紹介する。
Hummingbirdは、帯域幅の予約を取引可能な資産として表現し、市場が出現することを可能にする。
本実装では,Hummingbirdのアセットベースコントロールプレーンの効率性とスケーラビリティを実証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:16:33 GMT)
MirGuard: Towards a Robust Provenance-based Intrusion Detection System Against Graph Manipulation Attacks [13.9] MirGuardは、ロジック対応のマルチビュー拡張とコントラスト表現学習を組み合わせた異常検出フレームワークである。
MirGuardは、さまざまなグラフ操作攻撃に対して、最先端の検出器の堅牢性を大幅に上回っている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:35:51 GMT)
Tabularis Formatus: Predictive Formatting for Tables [13.7] 本稿では,テーブルに対するCF提案を生成するための神経シンボル的アプローチであるTaFoを提案する。
TaFoはコンポーネントベースの合成システムからインスピレーションを得て、言語モデルのセマンティックな知識でそれらを拡張します。
以上の結果から,TaFoは現在のシステムよりも正確で多様で完全なフォーマット提案を生成することがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:54:40 GMT)
Sample-efficient LLM Optimization with Reset Replay [13.7] Reset Replay (LoRR) は、任意の好みベースの最適化フレームワークにおいて、サンプリング効率を高めるために設計されたプラグインである。
LoRRは、ネットワークの可塑性を保存する初期データを再利用する定期的なリセット戦略を取り入れている。
実験により,LoRRは数学的および一般的な推論ベンチマークにおいて,様々な選好最適化手法の性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:59:51 GMT)
The Knowledge-Reasoning Dissociation: Fundamental Limitations of LLMs in Clinical Natural Language Inference [13.6] 大規模言語モデルは、データとパラメータをスケーリングすることで、ますます構造化され、一般化可能な内部表現を取得すると仮定されることが多い。
本研究は,4つの理性家族からなる臨床トライアル自然言語帰属ベンチマークを導入することで,この仮定を疑問視する。
各項目は、ターゲットとなるグラウンド知識とメタレベル推論検証プローブと組み合わせて、推論の失敗から事実アクセスの失敗を解離させる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:01:10 GMT)
Rollout Roulette: A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods [13.6] 大規模言語モデル(LLM)は、モデルのサイズやデータのスケールアップを通じて、大幅なパフォーマンス向上を実現している。
既存の推論時間スケーリング手法は、このタスクを検索問題として捉えており、ハックに報いるには弱い傾向にある。
本稿では,粒子ベースのモンテカルロ法を応用した新しい推論時間スケーリング手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:21:40 GMT)
Quantization through Piecewise-Affine Regularization: Optimization and Statistical Guarantees [13.6] Piecewise regularization (PAR) は、統計的視点に基づく柔軟なモデリングを提供する。
グラデーションと交互方向乗算器を用いて問題を解くためにPAR法を用いる方法を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:35:21 GMT)
AnalogSeeker: An Open-source Foundation Language Model for Analog Circuit Design [13.5] 本稿ではアナログ回路設計のためのオープンソースの基礎言語モデルであるAnalogSeekerを提案する。
関連分野にわたる高品質でアクセシブルな教科書は、体系的にキュレーションされ、テキストドメインコーパスにクリーン化される。
実際、我々はQwen2.5-32B-Instructモデルを用いてAnalogSeekerを得る。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:32:07 GMT)
StoryEnsemble: Enabling Dynamic Exploration & Iteration in the Design Process with AI and Forward-Backward Propagation [13.4] 設計プロセスには、ペルソナの生成、問題フレーミング、ソリューションの構想、プロトタイピングなど、相互に結びついた段階にわたる探索、反復、移動が含まれる。
これらの課題をより深く理解するために、UX実践者、学生、インストラクターからなる15人の参加者を対象に、フォーマティブな研究を行った。
この結果に基づいて、私たちは、ノードリンクインターフェースにAIを統合するツールであるStoryEnsembleを開発し、前方および後方の伝搬を活用して、設計プロセス全体の動的探索とイテレーションをサポートする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:28:08 GMT)
Towards Powerful and Practical Patch Attacks for 2D Object Detection in Autonomous Driving [13.4] 特にブラックボックス攻撃は、モデル知識のない攻撃の成功率が高いことで有名である。
従来の転送可能性に基づくブラックボックス攻撃では、平均平均精度(mAP)が評価基準として採用されるのが一般的である。
我々はP$3$Aを提案する。P$3$Aは、自律運転における2次元物体検出のための強力で実用的なパッチアタックフレームワークであり、特に高解像度データセットに最適化されている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:41:32 GMT)
A Market for Accuracy: Classification under Competition [13.2] 提供者、消費者、市場そのものに影響を与えるため、市場環境で学習を研究します。
本稿では,競争相手の存在下での市場シェアを最大化するために,競争対象の分類手法を提案する。
当社のアプローチは,提供者だけでなく消費者にもメリットがあることを示し,市場参入のタイミングとモデル更新が重要であることを明らかにする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:36:30 GMT)
BeyondWeb: Lessons from Scaling Synthetic Data for Trillion-scale Pretraining [13.2] プレトレーニングのための高品質な合成データを生成する合成データ生成フレームワークであるBeyondWebを紹介した。
BeyondWebは、従来のWebスケールデータセットの機能を大幅に拡張した。
オープンなWebデータよりも最大7.7倍、Nemotron-Synthより2.7倍高速なトレーニングを提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:55:47 GMT)
EgoMusic-driven Human Dance Motion Estimation with Skeleton Mamba [13.0] 我々は,エゴセントリックなビデオと音楽の両方から人間のダンスの動きを予測する新しい手法を開発した。
最初にEgoAIST++を紹介した。これは、エゴセントリックなビューと音楽と36時間以上のダンスモーションを組み合わせた、新しい大規模データセットだ。
提案手法は, 最先端の手法より明らかに優れ, 実世界のデータに対して効果的に一般化する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:48:35 GMT)
Privacy-Aware Detection of Fake Identity Documents: Methodology, Benchmark, and Improved Detection Methods (FakeIDet2) [13.0] 偽ID検出研究におけるプライバシ保護のためのパッチベースの手法を提案し,議論する。
2,000のID画像から抽出された900K以上の実/偽IDのパッチからなる新しい公開データベースFakeIDet2-dbを提供する。
プライバシを意識した新しい偽ID検出手法FakeIDet2を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:30:36 GMT)
Episodic Memory Verbalization using Hierarchical Representations of Life-Long Robot Experience [13.0] 本研究では,大規模な事前学習モデルを用いて,エピソードデータの短い(数分間の)ストリームを音声化する。
樹状データ構造をエピソードメモリ(EM)から導出し,その低レベルは生の知覚と固有受容のデータを表す。
シミュレーションされた家庭用ロボットデータ,人間中心ビデオ,実世界のロボット記録について評価を行った。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:53:25 GMT)
Leveraging Motion Estimation for Efficient Bayer-Domain Computer Vision [12.9] 既存のコンピュータビジョン処理パイプラインは、バイエルパターンの画素情報をキャプチャする画像センサを用いて視覚情報を取得する。
次に、まずバイヤー画素データを画素ベースでRGBに変換し、次いでフレームベースでビデオ畳み込みネットワーク(VCN)処理を行う画像信号処理装置(ISP)を用いて生センサデータを処理する。
本稿では,ISPを排除し,モーション推定を利用してバイエル領域の映像ビジョンタスクを直接高速化する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:43:14 GMT)
Failures to Surface Harmful Contents in Video Large Language Models [12.8] Video Large Language Models (VideoLLMs) はますます多くの重要なアプリケーションにデプロイされている。
ビデオに有害なコンテンツが埋め込まれている場合、ビデオLLMは出力中の有害なコンテンツにほとんど言及しない。
根本原因分析の結果、3つの複合設計上の欠陥が明らかになった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:49:36 GMT)
FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference [12.8] FreeKVは、精度を保ちながらKV検索効率を向上させるアルゴリズム-システム共最適化フレームワークである。
実験によると、FreeKVはさまざまなシナリオやモデルでほぼ無作為に精度が向上し、最大で13$times$ Speedupを提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:12:44 GMT)
VERCATION: Precise Vulnerable Open-source Software Version Identification based on Static Analysis and LLM [12.7] オープンソースソフトウェア(OSS)は、そのコラボレーティブな開発モデルとコスト効果の性質から、人気が高まっている。
開発プロジェクトにおける特定のソフトウェアバージョンの採用は、これらのバージョンが脆弱性をもたらす場合にセキュリティリスクをもたらす可能性がある。
本稿では,C/C++で記述されたOSSの脆弱性を識別するVERCATIONを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:00:40 GMT)
Echoes of Automation: The Increasing Use of LLMs in Newsmaking [12.6] 本研究では,大手メディア,地方メディア,大学ニュースメディアの4万件以上のニュース記事を対象としたAI生成コンテンツについて検討する。
近年のGenAI利用は,特に地域ニュースや大学ニュースで顕著に増加している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:40:50 GMT)
Thinking Inside the Mask: In-Place Prompting in Diffusion LLMs [12.6] 拡散大言語モデル (dLLM) は、その双方向の注意機構と反復的改善プロセスを通じて、新たな機会を提示する。
我々は、プレフィックスのみのプロンプトをdLLM用に特別に設計されたインプレースプロンプトに変換する新しいフレームワークICEを紹介する。
GSM8Kでは4.12$times$スピードアップ、MMLUでは276.67$times$アクセラレーションで最大17.29%の精度向上を実現した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:16:25 GMT)
Evaluating LLMs on Chinese Idiom Translation [12.6] 近年の機械翻訳の進展にもかかわらず、中国語のイディオム翻訳についてはほとんど知られていない。
中国語の慣用句翻訳のための包括的な誤り分類を行うフレームワークであるEvalを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:52:56 GMT)
Revisiting Cross-View Localization from Image Matching [12.4] クロスビューのローカライゼーションは、地上画像の3自由度ポーズを航空画像や衛星画像に登録することによって推定することを目的としている。
既存の方法は、直接ポーズを取るか、共有された鳥眼ビュー(BEV)空間で特徴を整列させる。
マッチングとローカライゼーションの両方を改善する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:57:31 GMT)
A Closer Look at Multimodal Representation Collapse [12.4] モーダリティの崩壊は、あるモーダリティからのノイズが、融合ヘッド内のニューロンの共有セットを介して、他のモーダリティからの予測的特徴によって絡み合っているときに起こることを示す。
本稿では,モダリティの欠如に対処する手法として,モダリティの崩壊を防止するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:16:46 GMT)
A Dataset for Distilling Knowledge Priors from Literature for Therapeutic Design [12.3] 実験室で用いられる化合物を記述した文献から抽出した設計問題のデータセットである ourdataset を紹介する。
我々のデータセットは3230万対の自然言語事実と 適切な実体表現で構成されています
学習可能なパラメータが15Mの最良のモデルでは,TDCタスクの回帰と分類の両方において,2B TxGemmaよりも優れていた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:59:37 GMT)
We-Math 2.0: A Versatile MathBook System for Incentivizing Visual Mathematical Reasoning [12.3] We-Math 2.0は、構造化された数学的知識システム、モデル中心のデータ空間モデリング、強化学習(RL)に基づく訓練パラダイムを統合する統合システムである。
We-Math 2.0の主な貢献は、MathBook Knowledge System、MathBook-Standard、MathBook-Pro、MathBookEvalの4つだ。
実験の結果,MathBook-RLは4つの広く使用されているベンチマークにおいて,既存のベースラインと競合することを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:15:41 GMT)
Pruning and Malicious Injection: A Retraining-Free Backdoor Attack on Transformer Models [12.2] Head-wise Pruning and Malicious Injection (HPMI)は、トランスフォーマーに対する新規なリトレーニングフリーバックドア攻撃である。
HPMIは、最も重要でない頭部を刈り取り、訓練済みの悪意のある頭部を注入してバックドアを確立する。
我々はHPMIが無視できるクリーンな精度の損失を発生し、2)少なくとも99.55%の攻撃成功率を達成し、3)先進的な4つの防御機構を回避していることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:13:22 GMT)
iFairy: the First 2-bit Complex LLM with All Parameters in $\{\pm1, \pm i\}$ [12.2] QAT(Quantization-Aware Training)は、量子化をトレーニングループに統合し、LLMが堅牢な低ビット表現を学習できるようにする。
複素数値 LLM のための最初の2ビット量子化フレームワークである Fairy$pm i$ を提案する。
我々は重みを単位の$pm1, pm i$の4番目の根にマッピングし、完全に対称で情報理論的に最適な2ビット表現を形成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:13:26 GMT)
HyperTea: A Hypergraph-based Temporal Enhancement and Alignment Network for Moving Infrared Small Target Detection [12.0] 特徴量の高次時間相関をモデル化するために,グローバルな時間的視点と局所的な時間的視点を統合したHyperTeaを提案する。
我々の知る限り、HyperTeaは、小さなターゲット検出のために畳み込みニューラルネットワーク(CNN)、繰り返しニューラルネットワーク(RNN)、ハイパーグラフニューラルネットワーク(HGNN)を統合する最初の試みである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:22:31 GMT)
Self-Supervised Stereo Matching with Multi-Baseline Contrastive Learning [12.0] BaCon-Stereoは、非閉塞領域と非閉塞領域の両方において、自己教師型ステレオネットワークトレーニングのための対照的な学習フレームワークである。
我々は,教師と生徒に供給されるステレオペアが同じ参照ビューを共有するが,対象ビューが異なる,マルチベースライン入力を持つ教師学生パラダイムを採用する。
実験により,BaCon-Stereoは閉塞領域と非閉塞領域の予測を改善し,強い一般化とロバスト性を実現し,KITTI 2015と2012のベンチマークにおいて,最先端の自己管理手法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:03:47 GMT)
Is Quantum Optimization Ready? An Effort Towards Neural Network Compression using Adiabatic Quantum Computing [12.0] ディープラーニングでは、新しい予測機能をサポートするために、ディープニューラルネットワーク(DNN)が巨大なサイズに達した。
本研究では,畳み込みニューラルネットワークのきめ細かなプルーニングにAQC(adiabatic quantum computing)を採用する可能性について検討する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:38:23 GMT)
Goal-Oriented Time-Series Forecasting: Foundation Framework Design [12.0] 本稿では、予測モデルが関心のあるアプリケーション固有の領域に焦点を合わせることができるようなトレーニング手法を提案する。
このアプローチは、トレーニング中に予測空間をきめ細かなセグメントに分割し、動的に再重み付けされ、アプリケーションによって指定されたターゲット範囲を強調するために集約する。
標準ベンチマークと新たに収集した無線通信データセットによる実験により,本手法は関心領域の予測精度を向上するだけでなく,下流タスクの性能も向上することが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:00:09 GMT)
When Explainability Meets Privacy: An Investigation at the Intersection of Post-hoc Explainability and Differential Privacy in the Context of Natural Language Processing [11.9] 我々はNLPの文脈で、プライバシーと説明可能性のトレードオフを実証的に調査する。
私たちの発見には、プライバシーと説明可能性の複雑な関係についての見解が含まれています。
プライバシーと説明責任が共存する可能性を強調します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:34:29 GMT)
Multi-objective Optimization in CPU Design Space Exploration: Attention is All You Need [11.9] 設計空間探索(DSE)は現代のCPU設計に不可欠であるが、現在のフレームワークは高次元のアーキテクチャ空間で拡張と一般化に苦慮している。
textbfAttentionDSEは、パフォーマンス予測と神経設計ガイダンスを統合した最初のエンドツーエンドDSEフレームワークである。
主要なイノベーションには、アーキテクチャ階層と局所性を活用するtextbfPerception-Driven Attentionメカニズム、スライディングウィンドウ経由で$mathcalO(n2)$から$mathcalO(n)$への注意の複雑さのスケーリングがある。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:32:45 GMT)
+VeriRel: Verification Feedback to Enhance Document Retrieval for Scientific Fact Checking [11.9] 本稿では,文書ランキングにおける検証成功を含む+VeriRelを提案する。
3つの科学的事実チェックデータセットの実験結果は、文書証拠検索のための+VeriRelによる一貫したパフォーマンスを示す。
先進的な科学的事実チェックのために複雑な文書を調べる際に、詳細な関連性を評価するための将来的な取り組みを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:57:40 GMT)
Leveraging large language models for SQL behavior-based database intrusion detection [11.9] データベースシステムは、様々なドメインにまたがる重要なデータを格納するために広く使われている。
内部攻撃や外部攻撃によるデータベース侵入のような異常なデータベースアクセス行動の頻度は上昇し続けている。
現在のアプローチでは、運用レベルで異常を検出するために必要な粒度が不足している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:51:40 GMT)
UniOcc: A Unified Benchmark for Occupancy Forecasting and Prediction in Autonomous Driving [11.6] われわれはUniOccを紹介した。UniOccは総合的に統合されたベンチマークと、占有率予測のためのツールキットである。
UniOccは複数の実世界のデータセット(nuScenes、OpenCOOD)と高忠実な運転シミュレータからのデータを統合する。
評価に最適でない擬似ラベルを頼っている既存の研究とは異なり、UniOccは基幹のラベルに依存しない新しい評価指標を取り入れている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:13:36 GMT)
Collaborative Mean Estimation Among Heterogeneous Strategic Agents: Individual Rationality, Fairness, and Truthful Contribution [11.4] 我々は、$m$エージェントがベクトル$mu =(mu_k, sigma2)_kin[d]$を推定しようとする協調学習問題を研究する。
独立して作業する代わりに、エージェントはデータを交換し、より安価なサンプルを収集し、コストのかかるデータと引き換えにそれらを共有できるため、コストと推定エラーの両方を削減できる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:41:26 GMT)
IAD-R1: Reinforcing Consistent Reasoning in Industrial Anomaly Detection [11.2] 普遍的なポストトレーニングフレームワークであるIAD-R1は、異常検出機能を大幅に強化する。
IAD-R1は7つのVision-Language Model(VLM)で大幅に改善された
IAD-R1はGPT-4.1やClaude-Sonnet-4といった商用モデルを上回るゼロショット設定である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:30:10 GMT)
Advances in Logic-Based Entity Resolution: Enhancing ASPEN with Local Merges and Optimality Criteria [11.1] 本稿では,既存の ASP ベースのシステムである ASPEN+ を,集合体解決のために拡張した ASPEN+ を提案する。
ローカルマージのサポートと、好みのソリューションに対する新しい最適基準を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:05:56 GMT)
MVISU-Bench: Benchmarking Mobile Agents for Real-World Tasks by Multi-App, Vague, Interactive, Single-App and Unethical Instructions [11.0] textbfMVISU-Benchは137のモバイルアプリケーションに404のタスクを含むベンチマークである。
また,リスクを軽減し,モバイルエージェントのユーザ意図を明らかにするために,動的プロンプトプロンプトプロンプトとして機能するプラグイン・アンド・プレイモジュールであるAiderを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:36:45 GMT)
Ask ChatGPT: Caveats and Mitigations for Individual Users of AI Chatbots [11.0] ChatGPTや他のLLM(Large Language Model)ベースのAIチャットボットは、個人の日常生活にますます統合される。
これらのシステムが個々のユーザーにどのような懸念とリスクをもたらすのか?
それらが引き起こす可能性のある潜在的な害は、どのように軽減されるのか?
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:40:13 GMT)
ORBIT: An Object Property Reasoning Benchmark for Visual Inference Tasks [10.8] 本稿では,3つの代表型,複雑性増大の3つの推論レベル,および4つのオブジェクト特性次元の画像を用いた体系的評価フレームワークを提案する。
我々は、このベンチマークをORBITにインスタンス化する。これは、合計1,080のカウントベースの質問と組み合わせた360画像からなるオブジェクト特性のマルチレベル推論VQAベンチマークである。
ゼロショット設定で12の最先端のVLMを用いた実験では、最高のパフォーマンスモデルは40%の精度でしか達成できないため、人間に比べて大きな制限が示される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:28:40 GMT)
A New Query Expansion Approach via Agent-Mediated Dialogic Inquiry [10.8] 本稿では,3つの専門的役割を含む対話的調査を行うエージェント媒介型対話型フレームワークAMDを提案する。
マルチエージェントプロセスを活用することで、AMDは質問やフィードバックの洗練を通じて、よりリッチなクエリ表現を効果的に構築する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:37:14 GMT)
From Diagnosis to Improvement: Probing Spatio-Physical Reasoning in Vision Language Models [10.7] 物理的推論は、堅牢な世界モデルを構築するための重要なステップである。
近年の視覚言語モデル (VLM) は、特殊領域において顕著な進歩を見せている。
しかし、その物理的推論能力はほとんど解明されていない。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:55:48 GMT)
Learning Classifiers That Induce Markets [10.7] 本稿では,学習課題の分析を行い,市場価格の計算アルゴリズムを考案し,新たな設定とアプローチを探求する実験を行う。
私たちのアイデアは単純です – ユーザが肯定的な予測を求めると,重要な機能に対する需要が生まれます。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:33:01 GMT)
Causal Language in Observational Studies: Sociocultural Backgrounds and Team Composition [10.7] 我々は、経験の浅い著者、より少ない研究チーム、男性最後の著者、そして不確実性回避指標が高い国の研究者による作業において、因果関係言語がより一般的であることを示す。
以上の結果から, 因果語の使用は, 証拠の強さだけでなく, 著者の社会的背景やチーム構成によっても引き起こされることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:23:35 GMT)
Gauging the variational optimization of projected entangled-pair states [10.7] 射影エンタングルペア状態(PEPS)は、2次元量子系の基底状態物理学を捉えるための強力な変分アンザッツを構成する。
点群対称性を持つU(1)対称PEPSの場合のゲージ変換の役割を解析する。
本稿では,ゲージ自由度を利用したハウツー最適化手法を示し,テンソルネットワークの収縮がますます不正確になることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:47:58 GMT)
Uncertainty-Aware Adaptation of Large Language Models for Protein-Protein Interaction Analysis [10.7] 大規模言語モデル(LLM)は、タンパク質の構造や相互作用を予測する際、顕著な可能性を示している。
しかし、それらの固有の不確実性は再現可能な発見を導き出す上で重要な課題である。
微調整LLaMA-3とBioMedGPTモデルを利用して,PPI解析のためのLLMの不確実性を考慮した適応を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:03:36 GMT)
Modeling Human Responses to Multimodal AI Content [10.7] MhAIMデータセットには154,552のオンラインポストが含まれている(うち111,153がAI生成)
私たちの人間による研究は、投稿にテキストとビジュアルの両方が含まれている場合、人々はAIコンテンツを特定するのがより優れていることを示している。
マルチモーダル情報に予測応答を組み込むことにより,ユーザの問い合わせに応答するエージェントシステムであるT-Lensを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:55:19 GMT)
DeepWriter: A Fact-Grounded Multimodal Writing Assistant Based On Offline Knowledge Base [10.6] 私たちはDeepWriterを紹介します。DeepWriterはカスタマイズ可能で、マルチモーダルで、長い形式の書き込みアシスタントで、キュレートされたオフラインの知識ベースで動作します。
構造化されたコーパスから情報を深く掘り下げることで、DeepWriterは一貫性があり、事実上基礎があり、専門レベルのドキュメントを生成する。
ファイナンシャルレポート生成実験は,DeepWriterが高品質で検証可能な記事を生成することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:14:12 GMT)
Oranits: Mission Assignment and Task Offloading in Open RAN-based ITS using Metaheuristic and Deep Reinforcement Learning [10.6] オープンLAN(Open RAN)ベースのインテリジェントトランスポートシステム(ITS)におけるミッション割り当てとタスクオフロードについて検討する。
既存の研究はしばしば、ミッション間の複雑な相互依存と、エッジサーバへのタスクのオフロードに伴うコストを見落としている。
我々は、オーラニッツ(Oranits)という、ミッション依存とオフロードコストを明示的に考慮し、車両の協調によって性能を最適化する新しいシステムモデルを紹介した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:59:13 GMT)
LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval [10.6] LeanRAGは知識集約と検索戦略を組み合わせたフレームワークです。
グラフ上のパス検索に関連するかなりのオーバーヘッドを軽減し、冗長な情報検索を最小限にする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:47:18 GMT)
EvRWKV: A Continuous Interactive RWKV Framework for Effective Event-Guided Low-Light Image Enhancement [10.6] イベントカメラは、輝度変化を非同期にキャプチャすることで、高ダイナミックレンジとマイクロ秒の時間分解能を提供する。
EvRWKVは、二重ドメイン処理による連続的な相互モーダル相互作用を実現する新しいフレームワークである。
我々は,EvRWKVが最先端性能を実現し,ノイズを抑制し,構造的詳細を復元し,低照度環境に挑戦する際の視覚的明瞭度を向上させることにより,画像品質を効果的に向上することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:46:48 GMT)
Logical Expressivity and Explanations for Monotonic GNNs with Scoring Functions [10.5] グラフニューラルネットワーク(GNN)はリンク予測のタスクによく使用される。
GNNとスコアリング関数がモノトニックにどのように適応できるかを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:56:48 GMT)
Delayed Feedback Modeling with Influence Functions [10.3] 大きな課題はフィードバックの遅延であり、ユーザインタラクションの長い時間後に変換が発生する可能性があるため、不完全な最近のデータとバイアス付きモデルトレーニングにつながります。
既存のソリューションはこの問題を部分的に緩和するが、しばしば補助的なモデルに依存し、計算的に非効率でユーザーの関心の変化に適応しない。
提案するIF-DFMは、アンダーライン遅延アンダーラインインフルエンスをベースとしたアンダーラインインフルエンスアンダーラインモデルであり、新たに到着した変換と遅延変換がモデルパラメータに与える影響を推定し、効率よく実現できる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:15:41 GMT)
Predictive Multimodal Modeling of Diagnoses and Treatments in EHR [10.3] 電子カルテに記録された臨床ノートやイベントを融合するシステムを提案する。
このモデルは、訓練済みエンコーダ、機能プーリング、モーダル間注意を統合し、モーダル間の最適な表現を学習する。
実験により、これらの戦略は早期予測モデルを強化し、現在の最先端システムより優れていることが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:14:18 GMT)
Certified algorithms for equilibrium states of local quantum Hamiltonians [10.2] 平衡状態における可観測物の予測は、量子多体系において中心的だが悪名高い難しい問題である。
局所観測値の期待値を有限時間で近似できることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:59:17 GMT)
GC-MVSNet: Multi-View, Multi-Scale, Geometrically-Consistent Multi-View Stereo [10.1] 本稿では,学習中の複数のソースビューにまたがる参照ビュー深度マップの幾何的整合性を明確に促進する新しいアプローチを提案する。
この幾何整合性損失を加えることで、幾何学的に矛盾したピクセルを明示的にペナル化することで学習を著しく加速することがわかった。
実験の結果,本手法はDTUおよびBlendedMVSデータセットの新たな最先端化を実現し,Turts and Templesベンチマークの競争結果が得られた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:14:25 GMT)
When Language Overrules: Revealing Text Dominance in Multimodal Large Language Models [10.1] 我々は,画像,ビデオ,オーディオ,時系列,グラフなど多種多様なデータモダリティにまたがるテキスト優位性を,初めて体系的に調査した。
奥行き分析では,非テクスチュアルなモダリティにおける高度トークン冗長性からの注意の希釈,融合アーキテクチャ設計の影響,テキスト入力を暗黙的に好むタスクの定式化という,3つの根本原因を明らかにした。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:44:52 GMT)
HierOctFusion: Multi-scale Octree-based 3D Shape Generation via Part-Whole-Hierarchy Message Passing [10.0] 3Dコンテンツ生成は、3Dデータの本質的な構造的複雑さのため、基本的な課題でありながら難しい課題である。
細粒度および疎粒度オブジェクト構造を生成するための階層的特徴相互作用を強化する部分認識型マルチスケールオクツリー拡散モデルであるHierOctFusionを提案する。
実験により,HierOctFusionは従来の方法よりも優れた形状品質と効率が得られることが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:12:18 GMT)
Stepwise Decomposition and Dual-stream Focus: A Novel Approach for Training-free Camouflaged Object Segmentation [9.9] 我々は、textbfMultimodal textbfStepwise textbfDecomposition Chain of Thought (MSD-CoT) を介して textbfRegion-constrained textbfDual-stream textbfVisual textbfPrompting (RDVP) を相乗化する新しいトレーニングフリーなテスト時間適応フレームワークを提案する。
RDVPは、前景と背景点の視覚的プロンプトを視覚的および独立的にサンプリングする空間的制約を注入し、意味的相違を効果的に緩和する
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:36:22 GMT)
SIFThinker: Spatially-Aware Image Focus for Visual Reasoning [9.9] SIFThinkerは、人間の視覚知覚を模倣する空間的に認識可能な「思考とイメージ」フレームワークである。
SIFThinkerは、奥行き強化されたバウンディングボックスと自然言語をインターリーブすることによって、注目の補正と画像領域の強調を可能にする。
実験では、SIFThinkerは空間的理解ときめ細かい視覚知覚において最先端の手法より優れている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:34:22 GMT)
AtomDiffuser: Time-Aware Degradation Modeling for Drift and Beam Damage in STEM Imaging [9.7] AtomDiffuserは、透過電子顕微鏡を走査するための時間認識分解モデリングフレームワークである。
サンプルのドリフトと減衰をアフィン変換と空間的に変化する減衰写像を予測することによって解する。
高解像度の劣化予測とドリフトアライメントをサポートし、劣化パターンの可視化と定量化のためのツールを提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:56:31 GMT)
A Curriculum Learning Approach to Reinforcement Learning: Leveraging RAG for Multimodal Question Answering [9.7] 本稿では,META CRAG-MMチャレンジに対するDianping-Trust-Safetyチームのソリューションについて述べる。
この課題は、マルチモーダルなマルチターン質問応答が可能な総合的な検索拡張生成システムを構築する必要がある。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:37:56 GMT)
Traffic Intersection Simulation Using Turning Movement Count Data in SUMO: A Case Study of Toronto Intersections [9.7] 本稿では,トロント市からの車両回転数(TMC)データを活用する交差点交通シミュレーションツールを提案する。
本研究で実施したシミュレーションは、ネットワークを介して完全な車両経路を作成することなく、交差点レベルの交通発生に焦点を当てたものである。
シミュレーショントラフィックを実データに対して評価することにより,シミュレーションが実交叉流を密に再現することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:12:50 GMT)
EVCtrl: Efficient Control Adapter for Visual Generation [9.6] モデルを再トレーニングすることなくオーバーヘッドを削減できる軽量なプラグアンドプレイ制御アダプタであるEVCtrlを導入する。
CogVideo-Controlnet,Wan2.1-Controlnet,Fluxの実験により,本手法が訓練を必要とせずに画像および映像制御生成に有効であることを実証した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:11:48 GMT)
UWB-PostureGuard: A Privacy-Preserving RF Sensing System for Continuous Ergonomic Sitting Posture Monitoring [9.6] UWB-PostureGuardは、プライバシー保護のウルトラワイドバンド(UWB)センシングシステムである。
姿勢パターンの時間依存性をキャプチャするPoseGBDTを開発した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:40:37 GMT)
From Surface to Semantics: Semantic Structure Parsing for Table-Centric Document Analysis [9.5] DOTABLERはテーブル中心のセマンティックドキュメント解析フレームワークである。
包括的テーブルアンカレッド意味解析と意味論的関連テーブルの正確な抽出を提供する。
実世界のPDFから1000以上のテーブルを持つ4000ページ近くで評価された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:29:51 GMT)
PTQAT: A Hybrid Parameter-Efficient Quantization Algorithm for 3D Perception Tasks [9.5] ポストトレーニング量子化(PTQ)と量子アウェアトレーニング(QAT)は、2つの主流モデル量子化アプローチを表す。
本稿では,3次元知覚ネットワークの効率的な展開のための新しいハイブリッド量子化アルゴリズムPTQATを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:55:21 GMT)
From Individual to Multi-Agent Algorithmic Recourse: Minimizing the Welfare Gap via Capacitated Bipartite Matching [9.4] 本稿では,マルチエージェント・アルゴリズム・リコースのための新しいフレームワークを提案する。
我々のフレームワークは,システム設定に最小限の修正を加えて,多対多のアルゴリズムでほぼ最適の福祉を実現することができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:04:24 GMT)
JRDB-Reasoning: A Difficulty-Graded Benchmark for Visual Reasoning in Robotics [9.4] 本稿では,詳細な中間アノテーションを用いて,様々な複雑さの質問をカスタマイズ可能なクエリエンジンを提案する。
我々はJRDBデータセットを人間とオブジェクトの相互作用と幾何学的関係アノテーションで拡張し、JRDB-Reasoningを作成する。
本エンジンとベンチマークにより,視覚推論フレームワークのきめ細かい評価と視覚言語モデルの動的評価が可能となった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:31:22 GMT)
Unifying Self-Supervised Clustering and Energy-Based Models [9.3] 自己教師付き学習と生成モデルとの間には,原則的な関連性を確立する。
シンボル接地問題の単純かつ非自明なインスタンス化に対処するために,我々の解法をニューロシンボリックな枠組みに統合できることが示される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:45:40 GMT)
Inductive Bias Extraction and Matching for LLM Prompts [9.2] LLMの出力をプロンプトの一部とすることで、より容易にプロンプトに満足な単語を作成できる。
これはモデル内の帰納バイアスと一致するプロンプトを生成する効果がある。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:56:00 GMT)
Hierarchical Cross-modal Prompt Learning for Vision-Language Models [9.1] HiCroPLは階層型クロスモーダルなPrompt Learningフレームワークである。
テキストと視覚の相補的な強みを活用して知識の流れを導出する。
11のベンチマークで最先端の結果が得られ、大幅な改善がなされている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:06:46 GMT)
ViFusionTST: Deep Fusion of Time-Series Image Representations from Load Signals for Early Bed-Exit Prediction [9.1] ベッド関連の転倒は、病院や長期医療施設で大きな怪我の原因となっている。
本研究は, ベッド脚下に装着した低負荷セルを1個だけ使用して, 早期のベッド出口意図を予測できることを示す。
ラインプロットとテクスチャマップを並列に処理するデュアルストリームスウィントランスであるViFusionTSTを導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:34:15 GMT)
Efficiently Verifiable Proofs of Data Attribution [9.1] 本稿では,データ属性に対する対話型検証パラダイムを提案する。
本稿では,PAC(Probably-Aqua-Correct)検証の意味において,形式的完全性,健全性,効率性を保証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:36:01 GMT)
Minimax Optimality in Contextual Dynamic Pricing with General Valuation Models [9.0] 意思決定者は、観測可能なコンテキストに基づいてパーソナライズされた価格を投稿する。
それぞれのバリュエーションはコンテキストの未知の潜在関数としてモデル化され、独立性と同一に分散された市場ノイズによって破損する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:34:22 GMT)
ESSENTIAL: Episodic and Semantic Memory Integration for Video Class-Incremental Learning [9.0] ESSENTIALは、時間的にスパースな特徴を記憶するためのエピソードメモリと、学習可能なプロンプトで表される一般的な知識を記憶するためのセマンティックメモリから構成される。
本稿では,エピソードメモリとセマンティックプロンプトをクロスアテンションを通じて統合した新しいメモリ検索(MR)モジュールを提案する。
注目すべきは、メモリの大幅な削減により、ESSENTIALはベンチマークで良好なパフォーマンスを達成することだ。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:59:07 GMT)
BadBlocks: Low-Cost and Stealthy Backdoor Attacks Tailored for Text-to-Image Diffusion Models [9.0] 拡散モデルはバックドア攻撃の影響を受けやすい。
BadBlocksは、計算リソースの約30と、以前のバックドア攻撃で通常必要とされる20のGPU時間しか必要としない。
BadBlocksは既存の防御フレームワーク、特に注目ベースのバックドア検出メソッドをバイパスすることができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:27:25 GMT)
Two Means to an End Goal: Connecting Explainability and Contestability in the Regulation of Public Sector AI [8.6] 本研究では, 説明可能性と競争可能性の交差と実装, 異なる研究コミュニティにおける理解について検討する。
本稿では、トップダウンとボトムアップの規制の整合性、責任の割り当て、学際的協力の必要性など、両原則の実現における摩擦の要点について述べる。
当社のコントリビューションは、これらの中核原則の政策決定と規制を通知し、より効果的で公平な設計、開発、信頼性の高い公開AIシステムのデプロイを可能にします。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:48:31 GMT)
Recent Advances in Generative AI for Healthcare Applications [8.6] 拡散モデルとトランスフォーマーアーキテクチャによって導かれる生成AIは、医療画像において大きなブレークスルーを可能にした。
これらの革新は、臨床診断、データ再構成、および薬物表現を増強した。
本論文は、生成型AIの医療応用における最近の進歩を包括的に合成することを目的としている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:43:06 GMT)
An Iterative Algorithm for Differentially Private $k$-PCA with Adaptive Noise [8.6] 任意の$k leq d$に対してトップ$k$固有ベクトルを推定できるアルゴリズムを提案する。
我々のアルゴリズムは、$n = tilde!O(d)$ であっても、ほぼ最適統計誤差を達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:48:45 GMT)
Match & Choose: Model Selection Framework for Fine-tuning Text-to-Image Diffusion Models [8.5] Text-to-image (T2I)モデルは大きなコーパスで事前訓練され、HuggingFaceのようなモデルプラットフォームでオープンに共有されることが多い。
ユーザーは、トレーニング済みのT2Iモデルを採用し、ターゲットデータセットでそれらを微調整することで、メディアコンテンツを生成するなど、AIアプリケーションを構築することができる。
本稿では,モデルプラットフォームから事前学習したT2Iモデルを,対象データセット上で完全に微調整することなく効率的に選択できる,最初のモデル選択フレームワークであるM&Cを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:00:50 GMT)
Glo-DMU: A Deep Morphometry Framework of Ultrastructural Characterization in Glomerular Electron Microscopic Images [8.5] 複雑で多様な超構造的特徴は、腎臓病のタイプ、進行、予後を示す。
我々は超構造評価のための球状形態計測フレームワーク(Glo-DMU)を提案する。
Glo-DMUは、球状基底膜の厚み、足のプロセスの外観の程度、電子線密度の堆積物の位置を同時に定量する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:25:30 GMT)
Physics-Informed Joint Multi-TE Super-Resolution with Implicit Neural Representation for Robust Fetal T2 Mapping [8.3] 胎児脳MRIにおけるT2マッピングは、特に中野(0.55T)における発達脳の特徴を改善する可能性がある
現在、T2マッピングには、各エコー時間(TE)でこれらのスタックの繰り返し取得が含まれており、長いスキャン時間と動きに対する高い感度をもたらす。
TE間でデータを共同で再構築し、厳しい動きに対処する手法により、この問題に対処する。
我々のアプローチは、暗黙の神経表現と物理インフォームド正規化を組み合わせることで、T2崩壊をモデル化し、解剖学的および定量的なT2忠実性を維持しながら、TE間での情報共有を可能にする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:24:10 GMT)
CountCluster: Training-Free Object Quantity Guidance with Cross-Attention Map Clustering for Text-to-Image Generation [8.3] 拡散に基づくテキスト・画像生成モデルは、画像の品質と多様性の点で強い性能を示している。
彼らは今でも、入力プロンプトで指定されたオブジェクトの数を正確に反映した画像を生成するのに苦労している。
textitCountClusterは、入力中の指定されたオブジェクト数に応じてクラスタ化されるオブジェクトのクロスアテンションマップをガイドする手法である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:53:53 GMT)
Tuning-Free Online Robust Principal Component Analysis through Implicit Regularization [8.2] 本稿では,修正勾配降下の暗黙的正則化効果を利用して,OR-PCAチューニングを自由にすることを提案する。
提案手法は、シミュレーションと実世界の両方のデータセットに対して、チューニングされたOR-PCAに匹敵するか、あるいは優れている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:52:12 GMT)
PromptTSS: A Prompting-Based Approach for Interactive Multi-Granularity Time Series Segmentation [8.2] PromptTSS(PromptTSS)は,複数粒度状態を持つ時系列セグメンテーションのための新しいフレームワークである。
PromptTSSは、ラベルと境界情報を利用してセグメンテーションをガイドするプロンプト機構を備えた統一モデルを使用する。
実験の結果、PromptTSSの精度は多粒度セグメンテーションで24.49%、単一粒度セグメンテーションで17.88%、転送学習で599.24%向上した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:53:15 GMT)
Are AI Machines Making Humans Obsolete? [8.1] この章は、どのようにして"ジェネレーティブAI"(GenAI)に到達したかについてのスケッチと、これまでのさまざまな影響の概要から始まります。
そして、GenAIのいくつかの機会について論じ、その後にディストピア的な結果を含む課題と危険が続いた。
GenAIをコントロールし、その危険性に対処する方法について、いくつかの提案で締めくくっている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:24:31 GMT)
LETS Forecast: Learning Embedology for Time Series Forecasting [8.1] 本稿では,非線形力学系モデリングとディープニューラルネットワークを統合するフレームワークDeepEDMを紹介する。
経験的動的モデリング(EDM)にインスパイアされ、Takensの定理に根ざしたDeepEDMは、時間遅れの埋め込みから潜伏空間を学ぶ新しいディープモデルを提供する。
以上の結果から,DeepEDMは入力ノイズに対して頑健であり,精度の予測において最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:19:51 GMT)
A Parametric Contextual Online Learning Theory of Brokerage [8.0] トレーダー間のブローカーのオンライン学習問題における文脈情報の役割について検討する。
このシーケンシャルな問題では、各ステップで、2人のトレーダーが取引したい資産に関する秘密のバリュエーションを持って到着します。
学習者(ブローカー)は、資産と市場条件に関するコンテキストデータに基づくトレーディング(またはブローカー)価格を提案する。
そして、トレーダーは、彼らの評価額がブローカー価格よりも高いか低いかに基づいて、購入または販売する意思を明らかにします。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:53:29 GMT)
A Unified Multi-Agent Framework for Universal Multimodal Understanding and Generation [8.0] マルチモーダルな理解と生成を2つの分離されたフェーズ(認知と熟考)を通じて統合するモジュラーフレームワークを提案する。
コグニションでは、Perceiver、Planner、Reflectorの3つのロール条件のマルチモーダルLLMエージェントが協調対話を行い、構造化された理解と計画を実行する。
Deliberation フェーズには、LSM に基づく推論と拡散に基づく生成を相互に強化する成長意識探索機構が組み込まれている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:52:51 GMT)
DLLMQuant: Quantizing Diffusion-based Large Language Models [8.0] 拡散に基づく大規模言語モデル(Ms)は、非自己回帰的なテキスト生成を約束している。
ポストトレーニング量子化(PTQ)は、アロケーションMに適用した場合、精度が著しく低下し、性能が低下する。
3つの新しい技法を取り入れたPTQフレームワークであるMQuantを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:30:17 GMT)
Quantum-Brain: Quantum-Inspired Neural Network Approach to Vision-Brain Understanding [7.9] 視覚脳理解は、人間の知覚から脳信号に関する意味情報を抽出することを目的としている。
本稿では、視覚脳理解問題に対処する量子インスパイアされたニューラルネットワークを提案する。
提案手法は,fMRIボクセル間の接続性を学習し,人間の知覚から得られる意味情報を強化する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:32:48 GMT)
Generating Compilers for Qubit Mapping and Routing [7.9] 本稿では、任意の量子アーキテクチャのためのキュービットマッピングとルーティングコンパイラを自動生成するアプローチを提案する。
我々の定式化は自然にQMR問題を特定するためのドメイン固有の言語であるMarolにつながります。
マロールで定義されたQMR問題は、強力なパラメトリック解法で解けることを実証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:07:07 GMT)
CorrectNav: Self-Correction Flywheel Empowers Vision-Language-Action Navigation Model [7.8] 既存のヴィジュアル・アンド・ランゲージのナビゲーションモデルは、命令を実行する際に正しい軌道から逸脱することが多い。
本稿では,新しいポストトレーニングパラダイムである自己補正フライホイールを提案する。
我々は,これらの誤差軌跡の偏差を識別する手法を開発し,自己補正データを自動的に生成する革新的な手法を考案した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:39:26 GMT)
STAMP: Multi-pattern Attention-aware Multiple Instance Learning for STAS Diagnosis in Multi-center Histopathology Images [7.8] 肺腺癌(LUAD)における空気空間(STAS)の拡散は新しい浸潤パターンを構成する
深層学習モデルをSTAS診断に活用するためには, プレッシャー的な臨床効果がある。
本稿では,STASの存在を解析・診断するための多パターン対応マルチインスタンス学習フレームワークSTAMPを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:20:29 GMT)
MIDAS: Modeling Ground-Truth Distributions with Dark Knowledge for Domain Generalized Stereo Matching [7.7] 既存の方法は、合成ドメインから実際のドメインへの転送においてドメイン固有の嗜好を示す。
そこで本研究では,これらの2種類の暗黒知識を事前学習ネットワークから抽出することを提案する。
単一ネットワークのドメイン嗜好を緩和するために,ネットワークアンサンブルを採用する。
提案手法は,4つの一般的な実世界のデータセットにまたがる包括的ランキングにおいて,既存の手法よりも優れる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:55:27 GMT)
SLiM: One-shot Quantization and Sparsity with Low-rank Approximation for LLM Weight Compression [7.6] SLIMは新しいワンショット圧縮フレームワークで、ハードウェアフレンドリーな量子化、スパーシティ、低ランク近似を統合する。
SLIMはモデル精度を最大5.66%(LLaMA-2-7B)まで改善し、4ビットの重み量子化で2:4の間隔で計算し、従来の手法より優れている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:13:36 GMT)
RealAC: A Domain-Agnostic Framework for Realistic and Actionable Counterfactual Explanations [7.6] RealACは、現実的で行動可能な対物を生成するためのドメインに依存しないフレームワークである。
RealACは、明示的なドメイン知識に頼ることなく、複雑な機能間の依存関係を自動的に保存する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:51:39 GMT)
Can Multi-modal (reasoning) LLMs detect document manipulation? [7.5] 文書詐欺は、安全で検証可能な文書に依存している産業にとって重大な脅威となる。
本研究では,最先端マルチモーダル言語モデル(LLM)の有効性について検討する。
我々はこれらのモデルを互いに比較し、文書不正検出技術に関する先行研究を行った。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:57:07 GMT)
Learning to Schedule in Parallel-Server Queues with Stochastic Bilinear Rewards [7.5] 本稿では,ジョブサーバの割り当てが不確実なマルチクラス並列サーバシステムにおけるスケジューリングの問題について考察する。
我々の目標は、時間軸上でのジョブサーバ割り当ての累積報酬を最大化することで、後悔を最小限に抑えることです。
提案アルゴリズムは,サブリニア・リセット・バウンドとサブリニア平均保持コストを実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:35:11 GMT)
Motive-level Analysis of Form-functions Association in Korean Folk song [7.5] 韓国の民謡において,音声歌詞上での音声の書き起こしモデルを微調整してモーメント・セグメンテーションを行う手法を提案する。
856曲に適用し,構造的特徴としてモチーフカウントと持続エントロピーを抽出した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:17:47 GMT)
Strongly Coupled Continuous Time Crystal [7.5] 時間結晶は離散時間結晶と連続時間結晶に分類される。
時間結晶にAdS/CFT双対性を導入することにより、熱力学的限界を導出する。
3次元光学格子(イオン)やツイーザー(ツイーザー)などの強い相関性を持つ量子系では、協調多体トンネル法により、時間結晶が自然に振動できることがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:15:42 GMT)
Routing and Wavelength Assignment with Minimal Attack Radius for QKD Networks [7.5] 量子鍵分配(QKD)は、セキュリティを保証された鍵を配布することができるが、物理層脅威による鍵交換の中断の影響を受けない。
まず、単一物理層攻撃による最悪の影響を定量化するために、新しいメトリクスであるNumber of Affected Requests(maxNAR)を導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:10:43 GMT)
BERTector: Intrusion Detection Based on Joint-Dataset Learning [7.4] 侵入検知システム(IDS)は,ネットワークトラフィックの不均一性や攻撃パターンの多様性により,一般化と堅牢性の課題に直面している。
IDSのための新たな統合データセットトレーニングパラダイムを提案し,BERTに基づくスケーラブルなBERTectorフレームワークを提案する。
BERTectorは、トラフィック対応セマンティックトークン化のためのNAS-Tokenizer、ハイブリッドデータセットによる微調整の監督、効率的なトレーニングのためのローランク適応(LoRA)の3つの重要なコンポーネントを統合している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:05:01 GMT)
Promoting Efficient Reasoning with Verifiable Stepwise Reward [7.4] 大規模推論モデル(LRM)は近年、強化学習によって支援された複雑な推論タスクにおいて大きな進歩を遂げている。
LRMは、単純な問題に対する過度な計算を過度に行い、効率を低下させることにしばしば悩まされる。
本稿では,中間状態の推論軌道における性能に基づいて報酬を割り当てる,ルールベースで検証可能なステップワイド報酬機構(VSRM)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:43:53 GMT)
Efficient Methods for Accurate Sparse Trajectory Recovery and Map Matching [7.3] 本稿では,正確な軌道回復とマップマッチングのためのTRMMAとMMAの効率的な手法を提案する。
軌道回復のために、TRMMAはMMAが返す経路のセグメントに焦点を当て、道路セグメントの位置比の欠落点を推測する。
TRMMAとMMAは、しばしばかなりの差で、常に最高の結果の品質を達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:00:37 GMT)
Object Fidelity Diffusion for Remote Sensing Image Generation [7.2] 本稿では,リモートセンシングにおけるオブジェクトの精度と忠実度を高めるために,オブジェクトの忠実度拡散(OF-Diff)を提案する。
我々は、リモートセンシングにおける拡散モデルのためのレイアウトに基づいて、オブジェクトの以前の形状を初めて抽出する。
また、DDPOを導入して拡散過程を微調整し、生成したリモートセンシング画像をより多様でセマンティックに一貫性を持たせる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:24:11 GMT)
Artificial discovery of lattice models for wave transport [7.0] ウェーブトランスポートデバイスは、現代の通信、信号処理、およびセンシング用途に不可欠である。
本稿では,これらのデバイスの概念設計を自動化する手法を提案する。
我々のアプローチは、より高い次元や非線形相互作用で望ましい性質を持つ格子モデルの人工的な発見のような拡張への扉を開く。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:36:38 GMT)
Beyond Semantic Understanding: Preserving Collaborative Frequency Components in LLM-based Recommendation [7.0] FreLLM4Recは、スペクトルの観点からの意味的および協調的な情報のバランスをとるために設計されたアプローチである。
4つのベンチマークデータセットの実験により、FreLLM4Recは協調的な信号減衰を軽減した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:33:02 GMT)
Reinforced Language Models for Sequential Decision Making [7.0] 大規模言語モデル(LLM)は、シーケンシャルな意思決定エージェントとしての可能性を示している。
既存のポストトレーニング手法はシングルターンインタラクション用に設計されており、マルチステップエージェントタスクにおけるクレジット割り当てを処理できない。
この研究は、標的となるポストトレーニングが、シーケンシャルな意思決定エージェントを作成するためのモデルスケールに依存する、実用的で効率的な代替手段であることを実証している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:05:44 GMT)
Hypothesis Spaces for Deep Learning [6.8] 本稿では,ディープニューラルネットワーク(DNN)に基づく深層学習のための仮説空間を提案する。
DNNを入力変数とパラメータ変数の2つの変数の関数として扱うことにより、パラメータ変数が重み行列の空間に属するDNNと、所定の深さと層幅で決定されるバイアスの集合を考える。
得られたバナッハ空間が再生カーネルバナッハ空間(RKBS)であることを証明し、その再生カーネルを明示的に構築する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:04:50 GMT)
A Unified Evaluation Framework for Multi-Annotator Tendency Learning [6.8] 2つの新しい指標を持つ最初の統合評価フレームワークを提案する。
DIC(Inter-Annotator Consistency)の違いは、モデルがアノテータの傾向をいかに捉えるかを示す。
振る舞いアライメント説明可能性(BAE)は、モデル説明がアノテータの振る舞いと意思決定の関連性をうまく反映しているかを評価する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:50:20 GMT)
Clean-Label Physical Backdoor Attacks with Data Distillation [6.5] ディープニューラルネットワーク(DNN)は、バックドア中毒の攻撃に弱いことが示されている。
物理的トリガーは攻撃者にとって有望な代替手段であり、デジタル操作なしでリアルタイムでバックドアを起動できる。
既存の物理バックドア攻撃は汚いラベルであり、攻撃者は有害な入力のラベルをターゲットラベルに変更しなければならない。
トレーニング段階でラベル操作やトリガーインジェクションを必要としない新しい物理バックドアアタックのパラダイムであるクリーンラベル物理バックドアアタック(CLPBA)を導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:23:48 GMT)
MM-Food-100K: A 100,000-Sample Multimodal Food Intelligence Dataset with Verifiable Provenance [6.4] MM-Food-100Kは10万サンプルのマルチモーダル食品インテリジェンスデータセットである。
オリジナル120万の食品画像の約10%のオープンサブセットをキュレートしたもので、さまざまな情報に注釈を付けた高品質の食品画像のコーパスである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:59:31 GMT)
Dimension-Free Bounds for Generalized First-Order Methods via Gaussian Coupling [6.4] 一般化された一階反復アルゴリズムの有限サンプル上に漸近的でない境界を確立する。
一般化された一階法と条件付きガウス過程の反復関係を明示的に結合する。
この結合は、穏やかなリプシッツ条件とモーメントマッチング条件の下で、厳密で次元自由な境界をもたらす。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:08:01 GMT)
Okapi: Efficiently Safeguarding Speculative Data Accesses in Sandboxed Environments [6.4] Okapiは、Transient Execution Side Channel攻撃を軽減するために設計された新しいハードウェア/ソフトウェアクロスレイヤーアーキテクチャである。
コアとなるのは、現在の信頼ドメインによってページが非投機的にアクセスされた後にのみ、メモリページへの投機的なデータアクセスを可能にすることである。
厳しいセキュリティニーズの少ない環境では、すべてのパフォーマンスオーバーヘッドを取り除くために機能を無効にすることができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:41:09 GMT)
SC-Lane: Slope-aware and Consistent Road Height Estimation Framework for 3D Lane Detection [6.4] 我々は3次元レーン検出のための新しい傾斜認識と時間的に一貫した高さマップ推定フレームワークであるSC-Laneを紹介した。
SC-Lane は斜面固有の高さ特徴の融合を適応的に決定し、多様な道路測地に対するロバスト性を向上させる。
OpenLaneベンチマークの大規模な実験により、SC-Laneは高さ推定と3次元レーン検出の両方を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:34:56 GMT)
Multi-Sample Anti-Aliasing and Constrained Optimization for 3D Gaussian Splatting [6.3] 本稿では,マルチサンプル・アンチエイリアスと2つの幾何学的制約を組み合わせた総合最適化フレームワークを提案する。
本システムでは,4重サブサンプルの適応ブレンディングにより画素色を計算し,高周波成分のエイリアスを効果的に低減する。
本手法は,特に高周波テクスチャと鋭い不連続の保存において,詳細な保存における最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:14:36 GMT)
TweezeEdit: Consistent and Efficient Image Editing with Path Regularization [6.2] 我々は、一貫性と効率的な画像編集のためのチューニング不要かつ逆変換のないフレームワークであるTweezeEditを提案する。
本手法は, 逆アンカーのみに依存するのではなく, denoising path全体を正規化することで, これらの制約に対処する。
実験では、TweezeEditのセマンティックな保存とターゲットアライメントにおける優れたパフォーマンスを示し、既存の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:59:45 GMT)
Continual Learning for Multiple Modalities [6.2] 複数のモダリティに対応する新しい連続学習フレームワークを提案する。
我々は、そのリッチなセマンティック情報を利用して、様々なモダリティをテキストと整合させるモデルを訓練する。
過去のモダリティ知識のオーバーライトを軽減するために,モダリティ内知識を統合する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:03:13 GMT)
Performance of GPT-5 Frontier Models in Ophthalmology Question Answering [6.2] GPT-5のような大規模言語モデル(LLM)は、医学的質問応答タスクのパフォーマンスを向上させる高度な推論機能を統合する。
O1高, O3高, GPT-4oとともに, OpenAI の GPT-5 シリーズの12 構成を評価した。
GPT-5-highは、O3-highより1.66倍、理性品質(1.11倍、O3-highより1.11倍)の両方で第1位である。
これらの結果は、GPT-5を高品質眼科データセット上でベンチマークし、推論が精度に与える影響を実証し、スケーラブルな評価のためのオートグラファーフレームワークを導入した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:29:55 GMT)
On Spectral Properties of Gradient-based Explanation Methods [6.2] 我々は,新しい確率的・スペクトル的視点を用いて説明法を解析する。
今回の研究では、勾配によるスペクトルバイアスが広範に広まっており、一般的な設計選択に光を当てています。
提案する形式主義に基づく2つの治療法を提案する。 (i) 標準摂動尺度を決定するメカニズムと, (ii) スペクトルレンズと呼ぶ集約手法である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:37:22 GMT)
Efficient Homomorphically Encrypted Convolutional Neural Network Without Rotation [6.0] 本稿では, HE方式の安全性に影響を与えることなく, 暗号文の回転を除去する新しい構成法とフィルタ係数パッキング方式を提案する。
CIFAR-10/100データセット上のさまざまなプレーン20に対して、私たちの設計は、最高の事前設計と比較して、Conv層とFC層のランニング時間を15.5%削減し、クライアントとサーバ間の通信コストを50%以上削減します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:00:32 GMT)
Sophisticated Learning: A novel algorithm for active learning during model-based planning [6.0] Sophisticated Inference Tree-search framework of Active Inferenceにアクティブパラメータ学習を組み込む計画学習アルゴリズムであるSophisticated Learningを紹介する。
SLとベイズ適応強化学習エージェント,および親アルゴリズムSIを比較した。
この結果から,多段階計画に積極的学習を取り入れることで,根本的不確実性の下での意思決定が大幅に改善されることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:04:52 GMT)
Federated Anomaly Detection for Multi-Tenant Cloud Platforms with Personalized Modeling [6.0] 本稿では,マルチテナントクラウド環境における重要な課題に対処するために,フェデレーション学習に基づく異常検出手法を提案する。
グローバルモデルは最適化されており、データのプライバシを保持しながら、テナント間の協調的異常検出を可能にする。
実験では、クラウドプラットフォームからの実際のテレメトリデータを使用して、シミュレーションされたマルチテナント環境を構築する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:46:24 GMT)
EditGarment: An Instruction-Based Garment Editing Dataset Constructed with Automated MLLM Synthesis and Semantic-Aware Evaluation [6.0] 衣服編集のための自動データセットパイプラインを提案する。
まず,実世界のファッションに整合した6つの編集指導カテゴリを定義し,バランスの取れた命令イメージ三重項の生成を導く。
第二に、Fashion Edit Scoreは、衣服属性間のセマンティックな依存関係をキャプチャし、構築中に信頼できる監視を提供する意味認識評価指標である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:34:27 GMT)
Fast Convergence for High-Order ODE Solvers in Diffusion Probabilistic Models [5.9] 拡散確率モデルは、データをノイズに変換するノイズ注入プロセスの逆転を学ぶことでサンプルを生成する。
重要な展開は、決定論的確率フロー常微分方程式(ODE)としての逆サンプリング過程の再構成である。
本稿では、任意の分散スケジュールを持つ一般的な前処理のためのODEから導出される決定論的サンプルの厳密な収束解析について述べる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:01:23 GMT)
A Segmentation-driven Editing Method for Bolt Defect Augmentation and Detection [5.8] ボルト欠陥検出は送電線の安全性を確保するために重要である。
セグメント化駆動型ボルト欠陥編集法(SBDE)を提案する。
実験の結果,SBDEにより生成されたボルト欠陥画像は,最先端画像編集モデルよりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:24:46 GMT)
A Reference Architecture for Governance of Cloud Native Applications [5.8] この記事では、クラウドネイティブアプリケーション(CNA)のユニークな特徴と、ガバナンスへの影響について説明する。
我々は、CNA間のガバナンスを合理化するために設計された包括的な参照アーキテクチャと、サンプル実装を紹介する。
当社のアーキテクチャは、CNAフレームワーク内に管理をシームレスに統合し、バッテリインクルードの哲学を守ります。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:31:02 GMT)
TD3Net: A temporal densely connected multi-dilated convolutional network for lipreading [5.8] バックエンドアーキテクチャとして高密度スキップ接続と時間的畳み込みを組み合わせた時間密結合型多次元畳み込みネットワークTD3Netを提案する。
2つの大きな公開データセットであるLRW(Lip Reading in the Wild)とLRW-1000(Lip Reading in the Wild)を用いた単語レベルの読解処理の実験結果から,提案手法が最先端の手法に匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:27:28 GMT)
Parity Cross-Resonance: A Multiqubit Gate [5.7] 本稿では,制御対象と制御対象の操作を実現するために,工学的インタラクションを活用するネイティブな3量子エンタングゲートを提案する。
例えば、GHZ三重項状態の調製など、いくつかの方法で利用できることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:26:32 GMT)
Unified Construction of Genuine Multipartite Entanglement Measures Based on Geometric Mean and its Applications [5.7] Genuine multipartite entanglement (GME) は量子情報処理において重要な資源である。
本稿では,二分割の絡み合いの幾何学的平均に基づいて,GMEの測度を体系的に研究する。
個々の非マルコフ過程下での真の四分儀の絡み合いの突然死に影響を与える初期条件を同定する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:09:26 GMT)
LD-LAudio-V1: Video-to-Long-Form-Audio Generation Extension with Dual Lightweight Adapters [5.6] LD-LAudio-V1は、最先端のビデオオーディオモデルの拡張である。
デュアル・ライトウェイトなアダプタを内蔵し、長めのオーディオ生成を可能にする。
クリーンで人間による注釈付きビデオ音声データセットをリリースする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:11:57 GMT)
X-Node: Self-Explanation is All We Need [5.6] グラフニューラルネットワーク(GNN)はコンピュータビジョンと医用画像分類タスクにおいて最先端の結果を得た。
GNNの既存の説明可能性技術は、一般的にポストホックでグローバルである。
本稿では,各ノードが独自の説明を生成する自己説明型GNNフレームワークであるX-Nodeを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:00:45 GMT)
GNN-based Unified Deep Learning [5.6] グラフ表現に各モデルをエンコードし、共有グラフ学習空間における統一を可能にする新しいパラダイムである統一学習を提案する。
統一学習は、モデルが一意分布で訓練され、混合分布でテストされると性能が向上し、見当たらないデータ分散シフトに対して強い堅牢性を示すことを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:22:32 GMT)
On the Complexity-Faithfulness Trade-off of Gradient-Based Explanations [5.5] ReLUネットワークはシャープな遷移を持ち、時には予測のために個々のピクセルに依存する。
GradCAMのような既存の手法は、忠実さを犠牲にして代理モデルを作成することによって、これらの説明を円滑にする。
我々は、スムーズさ、忠実さ、およびそれらのトレードオフを系統的に分析し、定量化する統一スペクトルフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:49:07 GMT)
Data-Driven Abdominal Phenotypes of Type 2 Diabetes in Lean, Overweight, and Obese Cohorts [5.5] AIにより、大規模な3D臨床画像において、腹部構造からサイズ、形状、脂肪の詳細な測定を抽出できる。
これにより、2型糖尿病のリスクと防御に関連する体組成のシグネチャを経験的に定義する機会が生まれる。
以上の結果より,2型糖尿病の腹部ドライバは体重階級で一定である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:48:08 GMT)
Quantization vs Pruning: Insights from the Strong Lottery Ticket Hypothesis [5.5] 量子化はニューラルネットワークをより効率的にするための重要なテクニックですが、理論的には限定的です。
従来の研究では、バイナリネットワークのような超低精度ネットワークは、大規模でランダムに近似されたネットワークを刈り取ることで構築可能であることが示されていた。
我々は数分割問題(Number Partitioning Problem)に基づくボルグスらによる基礎的な結果に基づいて、量子化された環境でランダムな部分集合 Sum 問題に対する新たな理論的結果を導出する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:51:34 GMT)
VIFSS: View-Invariant and Figure Skating-Specific Pose Representation Learning for Temporal Action Segmentation [5.5] 本研究では,ジャンプ運動の3次元的性質と意味的手順の両方を明示的に組み込んだフィギュアスケートジャンプのための新しいTASフレームワークを提案する。
本手法は, 92%以上のF1@50を要素レベルTAS上で達成し, ジャンプタイプと回転レベルの両方を認識する必要がある。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:15:21 GMT)
EDAPT: Towards Calibration-Free BCIs with Continual Online Adaptation [5.4] 脳-コンピュータインターフェース(BCI)は、ニューラルネットワークが時間の経過とともにドリフトし、ユーザによって異なるため、精度の低下に悩まされる。
本稿では,連続モデル適応によるキャリブレーションを排除したタスクおよびモデルに依存しないフレームワークであるEDAPTを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:23:25 GMT)
Relative Advantage Debiasing for Watch-Time Prediction in Short-Video Recommendation [5.4] 本稿では,ユーザグループとアイテムグループで条件付き参照分布と比較することにより,視聴時間を補正する,新たなアドバンテージ・デバイアス化フレームワークを提案する。
このアプローチは、量子的嗜好信号を生成し、2段階アーキテクチャを導入し、配当推定と選好学習を明確に分離する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:52:00 GMT)
Flexible Personalized Split Federated Learning for On-Device Fine-Tuning of Foundation Models [5.3] コラボレーション学習は、ローカルクライアントのデータセットを微調整に利用できるが、限られたクライアントデータと異種データ分散は効果的なコラボレーションを妨げる。
本稿では,クライアントが個別の目的を維持しながら協調学習を行うことのできる,フレキシブルな個別化学習パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:14:00 GMT)
SpaRC-AD: A Baseline for Radar-Camera Fusion in End-to-End Autonomous Driving [5.3] SpaRC-ADは、計画指向の自律運転のためのクエリベースのエンドツーエンドカメラレーダ融合フレームワークである。
本手法は、複数の自律運転タスクにおいて、最先端のビジョンのみのベースラインよりも強力な改善を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:02:41 GMT)
GraspClutter6D: A Large-scale Real-world Dataset for Robust Perception and Grasping in Cluttered Scenes [5.3] GraspClutter6Dは、1,000の散らばったシーンと密集したアレンジメントを特徴とする、大規模な現実世界の把握データセットである。
我々は,最先端のセグメンテーション,オブジェクトポーズ推定,把握検出手法のベンチマークを行い,乱雑な環境における課題に対する重要な洞察を提供する。
トレーニングリソースとしてのデータセットの有効性を検証し、GraspClutter6Dでトレーニングされたネットワークの把握が、シミュレーションと実世界の実験の両方において、既存のデータセットでトレーニングされたネットワークよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:19:42 GMT)
Responsible Machine Learning via Mixed-Integer Optimization [5.3] 混合整数最適化(MIO)は、責任あるMLの考慮事項を直接学習プロセスに埋め込むための強力なフレームワークを提供する。
本チュートリアルでは,理論的側面と実践的側面の両方について論じる,アクセシビリティと包括的紹介を行う。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:28:10 GMT)
Making Qwen3 Think in Korean with Reinforcement Learning [5.2] 韓国語で大規模言語モデルQwen3 14Bを「考える」ための2段階の微調整手法を提案する。
第1段階では、高品質な韓国の推論データセットの微調整(SFT)を監督し、韓国の論理的推論の強力な基盤を確立する。
第2段階では、カスタマイズされたグループ相対ポリシー最適化アルゴリズムを用いた強化学習を採用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:49:34 GMT)
Pinet: Optimizing hard-constrained neural networks with orthogonal projection layers [5.2] 凸制約の満足度を確保するために,ネットワークの出力層を導入する。
我々のアプローチである$Pi$netは、フォワードパスの高速かつ信頼性の高い投影に演算子分割を利用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:32:09 GMT)
Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free [5.1] 本稿では,現行手法の限界に対処する改良された回転行列を構築するための,新しい学習自由な手法を提案する。
主な貢献は、量子化誤差を減らすために類似の周波数成分をクラスタリングする順序順序付けによるウォルシュ・アダマール変換の活用である。
本手法は,WikiText-2上での推論タスクとパープレキシティ(PPL)スコアに頑健な性能を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:02:58 GMT)
FedABC: Attention-Based Client Selection for Federated Learning with Long-Term View [5.1] フェデレートラーニング(FL)により、分散クライアントは、データを直接共有することなく、プライバシを保存することなく、AIモデルを協調的にトレーニングすることができる。
我々は、データ不均一性の管理とクライアント参加の最適化において、長期的視点を取り入れた革新的なクライアント選択アルゴリズムであるFedABCを提案する。
この作業は、異質でリソースに制約のある環境でFLをデプロイするためのステップであり、6GネットワークでのネイティブAI機能をサポートする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:57:03 GMT)
Memory-Augmented Transformers: A Systematic Review from Neuroscience Principles to Technical Solutions [4.9] 記憶は知性の基本であり、生物学的および人工システム間の学習、推論、適応性を可能にする。
トランスフォーマーはシーケンスモデリングにおいて優れているが、長距離コンテキスト保持、連続学習、知識統合において制限に直面している。
このレビューでは、動的多時間記憶、選択的注意、統合など、神経科学の原則をブリッジする統一的な枠組みを提示する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:48:38 GMT)
Layer-Wise Perturbations via Sparse Autoencoders for Adversarial Text Generation [4.9] 本研究では,大規模モデルの解釈可能性を活用するブラックボックス攻撃手法を提案する。
Sparse Feature Perturbation Framework (SFPF) を導入する。
実験結果から,SFPFが生成した対向テキストは,最先端の防御機構をバイパスできることが示された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:12:44 GMT)
Relation between equilibrium quantum phase transitions and dynamical quantum phase transitions in two-band systems [4.9] 両バンドシステムにおけるDQPTの発生に必要かつ十分な条件を与える。
EQPTとDQPTの関係を, クエンチの忠実度の観点から詳細に解析した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:50:11 GMT)
On Understanding of the Dynamics of Model Capacity in Continual Learning [4.9] 本稿では,安定性・塑性バランス点の動的挙動を特徴付けるCLの有効モデル容量について紹介する。
NNアーキテクチャや最適化手法によらず,新しいタスクを表現できるNNの能力は,従来のタスク分布と異なる場合に低下することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:42:10 GMT)
REFN: A Reinforcement-Learning-From-Network Framework against 1-day/n-day Exploitations [4.7] 本稿では,Large Language Models (LLM) を訓練し,ネットワークフィルタを自律的に生成し,1日ないしn日のエクスプロイトを防止する新しいフレームワークであるREFNを紹介する。
REFNは、従来のヒューマンフィードバックではなく、オンラインネットワーク報酬によって駆動される強化学習(RL)を独自に採用することによって、スケーラビリティを保証する。
REFNは有効性(代替品よりも21.1%高い精度)、効率性(平均時間で3.65時間)、スケーラビリティ(簡単に10Kデバイスにスケールできる)を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:45:45 GMT)
Efficient Image Denoising Using Global and Local Circulant Representation [4.7] Haar-tSVDは、Haar変換の前に非局所的な自己相似性を探索する単純なアルゴリズムである。
テンソル-特異値の統一分解により,グローバルおよび局所的なパッチ相関を効果的に捉えることができることを示す。
Haar-tSVDの有効性と有効性を検証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:25:59 GMT)
Driving Accurate Allergen Prediction with Protein Language Models and Generalization-Focused Evaluation [4.6] アレルギーは通常、有害な免疫反応を引き起こすタンパク質であり、公衆衛生上の大きな課題である。
本稿では,100ビリオンパラメータxTrimoPGLMタンパク質言語モデルを利用する計算フレームワークであるApplmを紹介する。
Applmは、難易度の高い現実のシナリオによく似たタスクセットにおいて、7つの最先端メソッドを一貫して上回ります。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:30:20 GMT)
Tightening the mixed integer linear formulation for the piecewise linear approximation in general dimensions [4.6] 本稿では,任意の次元のデータセットの連続分数線形(CPWL)近似に対する混合整数プログラミング(MILP)の定式化について述べる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:17:48 GMT)
The Fellowship of the LLMs: Multi-Model Workflows for Synthetic Preference Optimization Dataset Generation [4.5] 本稿では,マルチモデルを用いた合成優先度最適化(PO)データセットの生成手法を提案する。
データセット生成プロセスの自動化と向上において,これらの有効性と可能性を評価する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:51:16 GMT)
Efficient Sampling for Pauli Measurement-Based Shadow Tomography in Direct Fidelity Estimation [4.5] ランダムなクリフォード測定の定数により、古典的なシャドウプロトコルは高精度で直接忠実度推定(DFE)を行うことができる。
同様の戦略は古典的な影から導き出すことができる。
具体的には,GHZ,W,Dicke状態を用いてDFEを行うために,局所的なパウリ測定のみを用いた効率的な手法について述べる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:42:13 GMT)
SkeySpot: Automating Service Key Detection for Digital Electrical Layout Plans in the Construction Industry [4.5] 我々は、リアルタイム検出、分類、相互運用可能な電気シンボルのためのツールキットであるSkeySpotを開発した。
SkeySpotは構造化された標準化されたアウトプットを生成し、情報構築のためにスケールアップすることができる。
このアプローチにより、建設業における中小企業(中小企業)の電気的レイアウトのデジタル化が容易になる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:36:11 GMT)
MMRAG-DocQA: A Multi-Modal Retrieval-Augmented Generation Method for Document Question-Answering with Hierarchical Index and Multi-Granularity Retrieval [4.4] 本研究の目的は,質問理解と回答生成のために,複数のページに分散したマルチモーダルエビデンスを特定し,統合することである。
MMRAG-DocQAと呼ばれる新しいマルチモーダルRAGモデルが提案され、テキスト情報と視覚情報の両方を長距離ページにわたって活用した。
共同類似性評価と大規模言語モデル(LLM)に基づく再分類により,多粒度意味検索法が提案された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:11:07 GMT)
Programmable few-atom Bragg scattering and ground-state cooling in a cavity [4.4] 我々はトウィーザーアレイを高協調性リングキャビティとキラル原子空洞結合に統合する。
プログラム可能な原子数から高方向ブラッグ散乱を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:32:01 GMT)
Assessing Teleportation of Logical Qubits in a Distributed Quantum Architecture under Error Correction [4.4] 本研究では,Surface Code および qLDPC エンコーディングにおいて,ノード間の量子ビットの非局所的な操作とテレポーテーションが実現可能であることを示す。
回路レベルのシミュレーションを用いて10-1ドルから10-6ドルまでの物理・ネットワークノイズ状態を評価する。
以上の結果から,非局所CNOTは物理誤差率10~3ドル,エビットノイズ10~2ドルで論理誤差率10~12ドルで実行可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:00:55 GMT)
Interpretable Neural ODEs for Gene Regulatory Network Discovery under Perturbations [4.3] 本稿では、生物学的に有意な神経常微分方程式(ニューラル・オード)を組み込んだ新しいフレームワークであるPerturbODEを提案し、摂動下での細胞状態の軌跡をモデル化する。
シミュレーションおよび実際の過剰表現データセット間での軌道予測とGRN推論におけるPerturbODEの有効性を実証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:04:28 GMT)
Emergent Bifurcations in Quantum Circuit Stability from Hidden Parameter Statistics [4.3] 量子回路の圧縮は、短期量子コンピューティングの基本的な課題である。
本稿では,300個の構造一様回路の大規模数値解析によりこの問題を考察する。
各アンサンブルは、それぞれ異なる頑丈で脆弱なクラスに普遍的に分岐する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:43:31 GMT)
"I Want My Chart to Be Just for Me": Community-Engaged Design to Support Outpatient Healthcare for Resettled Communities [4.3] 本稿は,米国大都市圏でHmongコミュニティメンバ30名を対象に,コミュニティベースの参加型デザインワークショップを2回実施した。
我々は,地域社会が徐々に発展してきた4種類の資産を同定し,健康管理の世代間サポートや,相対的・文化的基盤的相互作用を促進するストーリーテリングに基づくコミュニケーションの実践を行った。
参加型デザインワークショップがいかにアセットベースのアプローチを育むかを示し,患者が外来訪問する際の健康管理を支援するために,既存の強みを活用した技術の設計について考察する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:38:04 GMT)
Robustness Enhancement of Universal Noncyclic Geometric Gates via Evolution Optimization [4.3] 非巡回幾何ゲートは、従来の巡回条件の厳密な制約を克服することを目的としている。
また、循環性違反によるエラー問題も回避できる。
この研究は、実用的なフォールトトレラント量子プロセッサに対するロバストゲート実装の重要な基盤を確立する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:49:15 GMT)
Cooperative Face Liveness Detection from Optical Flow [4.3] 本稿では,カメラに近づいた正面向きの顔がゆっくりと移動するように指示する,新しいユーザインタラクションシナリオに基づく,新しい映像ベースの顔の生鮮度検出手法を提案する。
この制御されたアプローチフェースプロトコルと光フロー解析が組み合わさって、我々のアプローチのコアイノベーションを表している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:13:22 GMT)
Decoded Quantum Interferometry Under Noise [4.2] 雑音下でのデコード量子干渉法(DQI)の厳密な解析について述べる。
最大線形充足性問題に対して、ノイズの存在下では、性能はインスタンス行列の雑音重み付き空間パラメータによって制御されることを示す。
現実雑音下でのDQIの潜在的な量子優位性を維持するためのガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:08:09 GMT)
Performance of GPT-5 in Brain Tumor MRI Reasoning [4.2] 大規模言語モデル(LLM)は、画像解釈と自然言語推論を統合する視覚的質問応答(VQA)アプローチを可能にした。
GPT-4o, GPT-5-nano, GPT-5-mini, GPT-5を脳腫瘍VQAで評価した。
その結果, GPT-5-miniのマクロ平均精度は44.19%, GPT-5は43.71%, GPT-4oは41.49%, GPT-5-nanoは35.85%であった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:35:31 GMT)
SurfaceLogicKV: Surface and Logic Attention Behaviors are All You Need for Robust KV Cache Compression [4.1] LLM(Large Language Models)における入力シーケンス長の増大は、キー値(KV)キャッシュストレージに大きな圧力をかける。
個人の注意頭は様々な行動を示すことができ、98.5%近くは、完全に無関係な情報を無視している。
KVキャッシュ圧縮にこれらの注意行動を利用する2段階のSurfaceLogicKV法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:08:58 GMT)
Yet another algorithmic bias: A Discursive Analysis of Large Language Models Reinforcing Dominant Discourses on Gender and Race [4.1] LLM(Large Language Models)は、様々な文脈において広く使われてきた言語モデルである。
より洗練されたバージョンへと進化するにつれて、差別や人種化といったバイアスを再現するかどうかを評価することが不可欠である。
本研究では,このような手法を補完する定性的・非帰的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:22:02 GMT)
Can randomly structured metasurfaces be used for quantum tomography of high-dimensional spatial qudits? [4.1] 光子の量子状態の密度行列を再構成することは、ほとんど全ての量子科学と技術の応用において重要な課題である。
近年の光学メタ曲面の進歩により、このような状態トモグラフィータスクを行う超薄膜ナノ光学素子の設計が可能となった。
我々は,検出器数に十分な冗長性を持つことで,Hermite-Gaussian状態に符号化された量子フォトニック空間カウディトトモグラフィーにおいて,ランダムな準曲面が合理的に動作することを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:46:34 GMT)
Inaccuracy of an E-Dictionary and Its Influence on Chinese Language Users [4.1] 主要なE辞書の精度はほとんど精査されておらず、そのコーパスの作り方にはほとんど注意が払われていない。
本研究は,中国で最も広く使われているE辞書のひとつであるYoudaoについて,実験,ユーザ調査,辞書評定を併用して検討する。
結果は、不完全あるいは誤解を招く定義が深刻な誤解を引き起こす可能性があることを示している。
この研究は、データ処理における問題と辞書構築におけるAIと機械学習技術の統合を強調し、そのような欠陥定義がどのように生まれたかをさらに調査する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:01:03 GMT)
TBAC-UniImage: Unified Understanding and Generation by Ladder-Side Diffusion Tuning [4.1] 本稿では,マルチモーダル理解と生成のための新しい統一モデルであるTBAC-UniImageを紹介する。
我々は、生成はしごとして機能する事前学習拡散モデルとマルチモーダル大言語モデル(MLLM)を深く統合することにより、これを実現できる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:38:47 GMT)
Adaptive Bayesian Optimization for Robust Identification of Stochastic Dynamical Systems [4.0] 本稿では,システム係数と雑音分散を含む線形導出システムの同定について述べる。
ベイズ最適化に基づく標本効率のよい大域最適化法を提案する。
実験により、EGPに基づくBOは定常フィルタリングと期待最大化によりMLEを一貫して上回ることを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:46:37 GMT)
Entanglement area law and Lieb-Schultz-Mattis theorem in long-range interacting systems, and symmetry-enforced long-range entanglement [4.0] 我々は、長距離相互作用が可能な量子多体系において、複数の相互関連、基本的結果を確立する。
十分に長い量子スピン鎖に対して、まず最初に、ハミルトニアンの崩壊における多スピン相互作用が、その範囲が増加し、ハミルトニアンが隙間を埋めるほど速くなった場合、基底状態が絡み合い領域の法則を満たすことが示される。
自然ハミルトニアンの基底状態ではないような異常対称性を持つ純粋な状態は、長距離絡み合わなければならないことを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:05:52 GMT)
Mitigating Exponential Mixed Frequency Growth through Frequency Selection and Dimensional Separation in Quantum Machine Learning [3.9] 量子機械学習(QML)におけるアングル符号化技術は注目度を高めている。
しかし実際には、量子モデルは回帰タスクでしばしば失敗する。
本稿では,パラメータ数を制限する手法として周波数選択と次元分離を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:10:07 GMT)
A Multimodal Neural Network for Recognizing Subjective Self-Disclosure Towards Social Robots [3.8] 我々は、感情認識文献のモデルに基づく、カスタムマルチモーダルアテンションネットワークを開発する。
我々は,新たな損失関数であるクロスエントロピー損失の尺度を構築し,この問題の分類版と回帰版の両方を改善した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:50:51 GMT)
Yet Another Mirage of Breaking MIRAGE: Debunking Occupancy-based Side-Channel Attacks on Fully Associative Randomized Caches [3.8] USENIX Security 2025で発表された最近の研究は、占有率ベースの攻撃は、MIRAGEランダム化されたキャッシュからAESキーを復元できると主張している。
本稿では,これらの主張を検証し,それらが基本的なモデリング上の欠陥から生じることを明らかにする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:04:15 GMT)
Conic Formulations of Transport Metrics for Unbalanced Measure Networks and Hypernetworks [3.8] 本論文は、S'ejourne, Vialard, Peyr'eによって導入されたコニックグロモフ=ワッサーシュタイン距離(CGW)に関するものである。
半カップリングという観点からの新しい定式化を提供し、計量測度空間の設定を超えてフレームワークを拡張する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:55:55 GMT)
Federated Time Series Generation on Feature and Temporally Misaligned Data [3.7] FedTDDは、クライアント間でシンセサイザーを共同で学習する、新しいフェデレーション時系列拡散モデルである。
従来のフェデレーション学習とは対照的に、FedTDDは、局所的な合成出力の交換を通じて、クライアントの時系列間の相関を学習する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:30:09 GMT)
Graph Learning via Logic-Based Weisfeiler-Leman Variants and Tabularization [3.7] 基礎となる論理的枠組みを変更することで得られるWeisfeiler-Leman不変量のクラスについて検討する。
次に、さまざまなドメインにまたがる12のベンチマークデータセットで、2つの選択された変種をテストします。
実験により、我々の手法は最先端のグラフニューラルネットワークとグラフカーネルの精度と一致することを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:47:50 GMT)
Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees [3.7] 2段階のL2D(Learning-to-Defer)は、各入力を固定されたメインモデルまたは複数のオフライン専門家のいずれかに割り当てることで、最適なタスクデリゲートを可能にする。
既存のL2Dフレームワークはクリーンな入力を前提としており、クエリ割り当てを操作できる敵の摂動に弱い。
2段階L2Dシステムにおける対向ロバスト性の最初の包括的研究について述べる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:00:13 GMT)
A Knowledge Graph Informing Soil Carbon Modeling [3.6] 土壌有機炭素は気候変動の緩和と農業の持続可能性に不可欠である。
本稿では,土壌有機炭素知識グラフ(SOCKG)を導入し,農業研究データをクエリ可能な知識表現に変換する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:25:59 GMT)
Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning [3.6] 深層強化学習とグラフニューラルネットワーク(GNN)を用いた一般的な計画は、様々な象徴的計画領域において有望な結果を示している。
既存のアプローチでは、計画状態が完全に連結されたグラフとして表現され、問題スケールが大きくなるにつれて、エッジ情報や相当な間隔が爆発する。
本稿では, 局所的関係を符号化し, 目的に関連する空間的特徴を明示的に統合する, 疎結合なGNN表現を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:30:28 GMT)
Enhancing Fairness in Autoencoders for Node-Level Graph Anomaly Detection [3.5] グラフ異常検出(GAD)は、様々な領域でますます重要になっている。
しかし、GADの公平性に関する考察はいまだに過小評価されている。
我々は,GAD性能を維持しながらバイアスを軽減するフレームワークであるtextbfDistextbfEntangled textbfCounterfactual textbfAdversarial textbfFair (DECAF)-GADを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:12:15 GMT)
Benchmark Dataset Generation and Evaluation for Excel Formula Repair with LLMs [3.5] 大型言語モデル(LLM)は、公式エラーを説明することで有望な支援を提供する。
本稿では,Excel 公式の補修に特化して設計されたベンチマークデータセットを構築するための新しい手法を提案する。
我々のパイプラインはLLMと数発のプロンプトを統合し、堅牢なtextitLLM-as-a-Judgeバリデーションフレームワークを採用している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:43:35 GMT)
A Two-Stage Learning-to-Defer Approach for Multi-Task Learning [3.4] 本稿では,マルチタスク学習のための新しい2段階L2Dフレームワークを提案する。
提案手法は2段階のサロゲート損失ファミリーを利用し,Bayes-consistentと$(mathcalG, MathcalR)$-consistentの両方を証明した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:55:42 GMT)
What Has a Foundation Model Found? Using Inductive Bias to Probe for World Models [3.4] 本研究では,合成データセットへの適応性を評価する基礎モデルの評価手法を開発した。
基礎モデルはトレーニングタスクに優れるが、新しいタスクに適応すると、基礎となる世界モデルに対する帰納的バイアスを発生させることができない。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:55:48 GMT)
Learn to optimize for automatic proton PBS treatment planning for H&N cancers [3.4] 本稿では,データ駆動逆解析手法を提案し,それをPPOベースの自動処理計画フレームワークに統合する。
PPOフレームワークは外部ループ仮想プランナとして機能し、ポリシーネットワークを介して客観的パラメータを自律的に調整する。
L-BFGSBと比較すると、L2Oベースの逆は効率を22.97%、効率を36.41%向上させる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:50:31 GMT)
Direct Nuclear-Level Qubits using Trapped Th-229 Ions: A Platform for Entanglement and Universal Quantum Information Processing [3.3] トリウム229の低エネルギー異性体遷移は、核物理学と原子物理学のユニークな界面を提供する。
我々は,Th-2293+イオンを高忠実度核レベル量子ビットとして利用するための理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:25:26 GMT)
Generation of frequency-bin-encoded dual-rail cluster states via time-frequency multiplexing of microwave photonic qubits [3.3] クラスタ状態は、量子メートル法やワンウェイ量子コンピューティングのような幅広い応用を持つマルチキュービットの絡み合った状態である。
超伝導回路を用いて、周波数ビン符号化されたデュアルレールクラスタ状態を生成するプロトコルを提案する。
我々は、異なる周波数の共伝搬マイクロ波光子を順次出力することで、時間周波数多重化を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:00:13 GMT)
CSNR and JMIM Based Spectral Band Selection for Reducing Metamerism in Urban Driving [3.3] メタメリズム(Metamerism)は、RGB画像において異なる物質が類似している現象である。
本研究は、高スペクトルイメージング(HSI)を用いて、この制限を克服し、可視スペクトルを超えたユニークな物質シグネチャをキャプチャする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:50:51 GMT)
Blending 3D Geometry and Machine Learning for Multi-View Stereopsis [3.3] GC MVSNet plusは、学習中に多視点、多スケールの教師あり幾何的一貫性を強制するための新しいアプローチである。
この統合GCチェックは、幾何学的に一貫性のないピクセルを直接ペナル化することにより、学習プロセスを著しく加速する。
提案手法は,DTUおよびBlendedMVSデータセット上での新たな技術状況を実現し,タンク・アンド・テンプルのベンチマークで2位を確保した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:10:57 GMT)
Advancing Autonomous Incident Response: Leveraging LLMs and Cyber Threat Intelligence [3.2] セキュリティチームは、警告の疲労、高い偽陽性率、および大量の非構造化サイバー脅威情報(CTI)文書に圧倒されている。
本稿では,Large Language Models (LLMs) を利用してIRの自動化と拡張を行う新しいRAGベースのフレームワークを提案する。
提案手法では, CTIベクタデータベース内のNLPに基づく類似性検索と, 外部CTIプラットフォームへの標準クエリを組み合わせたハイブリッド検索機構を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:20:34 GMT)
Natively Trainable Sparse Attention for Hierarchical Point Cloud Datasets [3.2] 本研究では,ErwinアーキテクチャとNative Sparse Attention(NSA)機構を組み合わせることで,大規模物理システムにおけるトランスフォーマーモデルの効率性と受容性を向上させる。
我々は、非シーケンスデータに対してNSAメカニズムを適用し、Erwin NSAモデルを実装し、物理科学の3つのデータセットで評価する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:39:34 GMT)
Vision Transformers in Precision Agriculture: A Comprehensive Survey [3.2] ビジョントランスフォーマー(ViT)は、長距離依存の処理の改善や視覚タスクのスケーラビリティ向上といった利点を提供する。
本研究は、CNNとViTの比較分析と、ハイブリッドモデルとパフォーマンス改善のレビューを含む。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:55:53 GMT)
Grounding Rule-Based Argumentation Using Datalog [3.1] ASPIC+は、AIのルールベースの議論のための主要な一般的なフレームワークの1つである。
本稿では,解析過程の正しさを保ちながら,接地の大きさを管理可能なインテリジェント接地手法を提案する。
また, ASPIC+形式に特有な簡易化を提案し, 推論プロセスに影響を与えない規則の根拠付けを避ける。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:57:32 GMT)
TAR: Teacher-Aligned Representations via Contrastive Learning for Quadrupedal Locomotion [3.1] 強化学習(Reinforcement Learning, RL)による四足歩行運動は、教師/学生のパラダイムを用いて一般的に解決される。
本稿では,自己指導型コントラスト学習による特権情報を活用したTAR(Teacher-Aligned Representations)を提案する。
その結果,最先端のベースラインに比べて2倍のトレーニングが促進され,ピーク性能が得られた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:09:59 GMT)
AI That Helps Us Help Each Other: A Proactive System for Scaffolding Mentor-Novice Collaboration in Entrepreneurship Coaching [3.1] 起業家精神は、未定義のオープンエンドな問題をナビゲートする必要がある。
初心者とメンターの双方を足場とする人間-AIコーチングシステムを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:23:48 GMT)
Triangle Counting with Local Edge Differential Privacy [3.1] エッジ差分プライバシーを持つ局所モデルにおける三角形計数について検討する。
本研究では,非対話的モデルと対話的モデルの両方について検討する。
我々の研究は局所モデルにおける微分プライベートグラフ解析における技術の現状を著しく改善する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:33:06 GMT)
Mathematical Computation and Reasoning Errors by Large Language Models [3.0] 大規模言語モデル(LLM)は、AIによる教育指導と評価にますます活用されている。
本研究は,算術,代数学,数論を含む3分野の数学課題を解く4つの LLM の精度を評価することに焦点を当てる。
推理強化された OpenAI o1 モデルが3つの数学タスクのカテゴリで常に高い精度またはほぼ完璧な精度を達成したことが観察された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:25:18 GMT)
FIND-Net -- Fourier-Integrated Network with Dictionary Kernels for Metal Artifact Reduction [3.0] CT(Computed tomography)画像における高密度金属インプラントによって引き起こされた金属人工物は、非常に劣化した画像品質である。
本稿では,周波数と空間領域処理を統合し,優れたアーチファクト抑圧を実現する新しいフレームワークであるFIND-Netを提案する。
実験により、FIND-Netは最先端のMAR法よりも統計的に有意な改善が得られた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:13:54 GMT)
CLoQ: Enhancing Fine-Tuning of Quantized LLMs via Calibrated LoRA Initialization [3.0] 低ランク適応 (LoRA) を用いた細調整型大規模言語モデル (LLM) は, 下流タスクにおいて極めて効率的なアプローチとなっている。
量子化LLMにLoRA技術を適用すると、量子化重みの表現精度が低下するため、ユニークな課題が生じる。
CLoQは、これらの課題を克服するために設計された、単純化された初期化戦略である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:12:42 GMT)
Knowledge-based Consistency Testing of Large Language Models [3.0] 我々は,大規模言語モデル(LLM)の不整合性と知識ギャップを系統的に公開し,測定する。
テストケースを構築するために知識グラフを活用する自動テストフレームワーク(KonTest)を提案する。
さらに, GPT3.5は知識構築において60%-68%しか有効ではないため, 知識ベース一貫性試験には適さないことを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:12:12 GMT)
Bridging Solidity Evolution Gaps: An LLM-Enhanced Approach for Smart Contract Compilation Error Resolution [3.0] 主要なスマートコントラクト言語であるSolidityは、セキュリティ、機能、開発者エクスペリエンスを向上させるために、頻繁なバージョンアップデートによって急速に進化している。
我々は、Solidityバージョン進化の課題を調査するための実証的研究を行い、調査対象の契約の81.68%が、異なるバージョンにまたがってコンパイルされたときにエラーに遭遇し、86.92%がコンパイルエラーであることを示した。
SMCFIXERは,Solidityコンパイルエラー解決のためのLLMベースの修復機構と専門家知識検索を統合した新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:42:26 GMT)
A Sub-Pixel Multimodal Optical Remote Sensing Images Matching Method [2.9] 位相整合性重み付き最小絶対偏差(PCWLAD)サブピクセルテンプレートマッチング法を提案し,マルチモーダル光学画像のマッチング精度を向上させる。
我々は,PCWLADの性能を評価するために,赤外線ランドサット画像,近赤外近距離画像,赤外線無人航空機(UAV)画像の3種類の画像データセットを構築した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:49:19 GMT)
Communication Cost Reduction for Subgraph Counting under Local Differential Privacy via Hash Functions [2.9] エッジローカル差分プライバシーの下でのサブグラフのカウントにおいて,ハッシュ関数を用いて通信コストを削減することを提案する。
サンプリングレートが$s$であれば,通信コストを$s2$に削減できる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:29:34 GMT)
A Detailed Factor Analysis for the Political Compass Test: Navigating Ideologies of Large Language Models [2.9] 政治コンパステスト(PCT)や同様のアンケートは、LLMの政治的傾きを定量化するために用いられてきた。
標準生成パラメータの変化はモデルのPCTスコアに大きな影響を与えない。
急激な変化や微調整などの外的要因は、個別および組み合わせで同じ影響を及ぼす。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:29:22 GMT)
MAESTRO: Masked AutoEncoders for Multimodal, Multitemporal, and Multispectral Earth Observation Data [2.9] MAESTROはMasked Autoencoderの新たな適応であり、最適化された融合戦略と調整されたターゲット正規化スキームを備えている。
一つの単一時間的モダリティによって支配されるタスクに高い競争力を保ちながら、マルチテンポラルダイナミクスに強く依存するタスクに新しい最先端のタスクを設定した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:58:45 GMT)
Medico 2025: Visual Question Answering for Gastrointestinal Imaging [2.8] メディコ2025チャレンジは、消化器画像(GI)の視覚質問応答(VQA)に対処する。
この課題は、臨床的に関連する質問に答える説明可能な人工知能(XAI)モデルの開発に焦点を当てている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:43:46 GMT)
Audit Cards: Contextualizing AI Evaluations [2.8] 我々は「監査用カード」が、その正当性とともにキークレームを報告するための構造化されたフォーマットを提供することができると論じる。
我々は、監査カードで報告し正当化する6つの重要なコンテキスト特徴を識別する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:25:43 GMT)
The Impact of Large Language Models (LLMs) on Code Review Process [2.8] 本稿では,GitHubプルリクエスト(PR)に対するGPTの影響について検討する。
私たちは9,254のGitHubプロジェクトから25,473のPRのデータセットをキュレートしました。
キーワードベース検出,正規表現フィルタリング,手動検証を組み合わせた半自動手法を用いて,GPT支援PRを同定した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:39:01 GMT)
BKP: An R Package for Beta Kernel Process Modeling [2.7] 両項確率をモデル化するための、完全に非パラメトリックで計算的に効率的なフレームワークであるBeta Kernel Process(BKP)を提案する。
BKPモデルは、局所化されたカーネル重み付き確率と共役ベータ前の確率を結合させ、閉形式後部推論をもたらす。
これは、BKPベースのメソッドを実装するための最初の公開Rパッケージである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:34:47 GMT)
Explainable Attention-Guided Stacked Graph Neural Networks for Malware Detection [2.6] 本稿では,グラフベースのマルウェア検出と説明のための新しいスタックングアンサンブルフレームワークを提案する。
本フレームワークは,マルウェアの行動に関する洞察に富んだ解釈を提供しながら,分類性能を向上させる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:12:03 GMT)
MIRRAMS: Learning Robust Tabular Models under Unseen Missingness Shifts [2.5] 欠落した値はしばしばデータ収集ポリシーのバリエーションを反映し、時間や場所によって変化することがある。
このようなトレーニングとテストインプットの間の不足分布の変化は、堅牢な予測性能を達成する上で大きな課題となる。
この課題に対処するために設計された,新しいディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:57:08 GMT)
M3-Net: A Cost-Effective Graph-Free MLP-Based Model for Traffic Prediction [2.5] トラヒック予測のための費用対効果の高いグラフフリー多層パーセプトロン(M3-MLP)モデルを提案する。
複数の実データセットに対して行われた大規模な実験は、予測性能の観点から提案したモデルの優越性を実証している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:45:48 GMT)
Alternating Approach-Putt Models for Multi-Stage Speech Enhancement [2.5] 本稿では,音声強調モデルによって導入されたアーティファクトの軽減を目的とした後処理ニューラルネットワークを提案する。
本研究では,音声強調モデルと提案したPuttモデルとの交互性により,音声品質が向上することが実証された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:18:42 GMT)
PQ-DAF: Pose-driven Quality-controlled Data Augmentation for Data-scarce Driver Distraction Detection [2.5] 運転注意障害の検出は交通安全の改善と交通事故の低減に不可欠である。
既存のモデルは、現実のシナリオにデプロイされると、しばしば劣化した一般化に悩まされる。
サンプルフィルタリングに視覚言語モデルを活用するPQ-DAF(Pose-driven Quality-control Data Augmentation Framework)を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:54:28 GMT)
STRIDE-QA: Visual Question Answering Dataset for Spatiotemporal Reasoning in Urban Driving Scenes [2.5] STRIDE-QAは、都市運転における時間的推論のための視覚的質問応答データセットとして最大である。
空間的局所化と時間的予測を通じて、オブジェクト中心とエゴ中心の推論の両方をサポートする。
我々のベンチマークでは、既存のVLM(Vision-Language Models)が予測一貫性のほぼゼロのスコアを得るのに苦労していることが示されている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:57:06 GMT)
Feedback stabilization of a nanoparticle at the intensity minimum of an optical double-well potential [2.5] 我々は,光二重井戸電位の不安定強度最小値でナノ粒子を安定化・閉じ込めするための適応フィードバック制御戦略を開発し,解析する。
我々の結果は、現在の吸収加熱限界を超える量子状態の準備に関する将来の実験に有望な経路を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:41:39 GMT)
Columbo: Expanding Abbreviated Column Names for Tabular Data Using Large Language Models [2.4] 我々は芸術の状態を著しく向上させる3つの貢献をしている。
まず、先行研究で使用される合成公開データは、大きな制約があることを示す。
第2に、先行作業で用いられる精度測定が、正確な拡張を真剣に考慮していることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:20:25 GMT)
Privacy-preserving Blockchain-enabled Parametric Insurance via Remote Sensing and IoT [2.3] 簡潔なゼロ知識証明(zk-SNARK)に基づくプライバシー保護パラメトリック保険フレームワークを提案する。
我々は、最近のzk-SNARKを拡張し、複数の異種データソースに対する堅牢なプライバシー保護をサポートする。
概念実証として、現実世界のブロックチェーンプラットフォーム上でパラメトリックブッシュファイア保険の動作プロトタイプを実装しました。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:41:28 GMT)
15,500 Seconds: Lean UAV Classification Using EfficientNet and Lightweight Fine-Tuning [2.3] 本稿では,UAV音声分類におけるデータ不足の課題について,先行作業の拡大による検討を行う。
私たちは、31種類のドローンにまたがる3,100UAVオーディオクリップ(15,500秒)のカスタムデータセットを使用します。
5倍のクロスバリデーション,精度評価,トレーニング効率,堅牢性試験を行った。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:50:40 GMT)
Reliable high-accuracy error mitigation for utility-scale quantum circuits [2.3] 本稿では,QESEMについて紹介する。QESEMは信頼性が高く,信頼性が高く,キャラクタリゼーションに基づくソフトウェアで,効率よく,偏りのない準確率的誤差軽減を実現する。
未バイアス法に基づく最大ユーティリティスケールエラー軽減実験において,その性能を実証する。
結果は、今日利用可能なデバイス上で量子回路を実行するための正確性と信頼性において、大きな進歩を示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:02:44 GMT)
Counterfactual Survival Q Learning for Longitudinal Randomized Trials via Buckley James Boosting [2.3] 最適な動的治療体制を推定するためのBuckley James (BJ) Boost Q 学習フレームワークを提案する。
この手法は、高速化された故障時間モデルと、最小二乗木や回帰木を含む反復的なブースティング技術を統合する。
条件付き生存時間を直接モデル化することにより、BJ Boost Q 学習は制限的な比例的ハザードの仮定を避けることができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:43:56 GMT)
Utilizing Vision-Language Models as Action Models for Intent Recognition and Assistance [2.3] 本稿では,視覚言語モデル (VLM) とテキストのみの言語モデル (LLM) によるGUIDERの拡張について述べる。
ビジョンパイプラインは、候補対象の作物をVLMに供給し、オペレータのプロンプトが与えられた場合、その関連性を評価する。
組み合わせた信念がしきい値を超えると、自律性が変化し、ロボットは所望の領域に移動し、所望の物体を回収することができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:19:09 GMT)
nodeWSNsec: A hybrid metaheuristic approach for reliable security and node deployment in WSNs [2.3] 遺伝的アルゴリズム(GA)とパーティクルスワーム最適化(PSO)は、エネルギー効率と信頼性の高いノード配置の課題に対処するために提案されている。
GA PSOはセンサーノードを15%から25%少なくし、95%以上をカバーしている。
提案アルゴリズムは,CMOMPAよりも高いカバレッジ,接続性の向上,センサノードの少ないデプロイメント時間削減といった点で,長時間の検知と通信範囲の比較において優位である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:06:04 GMT)
From Prompt to Pipeline: Large Language Models for Scientific Workflow Development in Bioinformatics [2.2] 本研究では,最先端の大規模言語モデルが正確なバイオインフォマティクスを生成できるかどうかを考察する。
生成されたデータは,Galaxy Training Network と nf-core のコミュニティによるベースラインに対して評価される。
その結果、Gemini 2.5 FlashはGalaxyで最も正確でユーザフレンドリで、DeepSeek-V3はNextflowパイプライン生成に優れていた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:22:19 GMT)
An Explainable Transformer-based Model for Phishing Email Detection: A Large Language Model Approach [2.1] フィッシングメール(英: Phishing email)は、機密情報を盗んだり、金銭的損害を与える目的で偽のメールを送ることによって、ユーザーを騙そうとする深刻なサイバー脅威である。
大規模な学術研究にもかかわらず、フィッシング検出はサイバーセキュリティの分野で今も進行中で恐ろしい課題である。
フィッシングメールの検出のために最適化された微調整変換器を用いた DistilBERT モデルを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:59:03 GMT)
Contrastive ECOC: Learning Output Codes for Adversarial Defense [2.1] 本稿では,コントラスト学習に基づく自動コードブック学習の3つのモデルを紹介する。
提案モデルでは, 2つのベースラインと比較して, 敵攻撃に対する強靭性が高いことを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:50:50 GMT)
DINOMotion: advanced robust tissue motion tracking with DINOv2 in 2D-Cine MRI-guided radiotherapy [1.9] DINOMotionは、ロバストで効率的な、解釈可能なモーショントラッキングのための新しいディープラーニングフレームワークである。
DINOMotionは、対応するランドマークを自動的に検出し、最適な画像登録を導き、解釈可能性を高める。
ボランティアおよび患者データセットに対する実験は、線形および非線形の変換を推定する上で、その効果を実証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:02:26 GMT)
Reproducible Physiological Features in Affective Computing: A Preliminary Analysis on Arousal Modeling [1.9] 心血管信号と心電図信号から,覚醒レベルに関連する生理的特徴を同定した。
弊社のアプローチは、信頼性が高く信頼性の高いホワイトボックスモデルを必要とする安全クリティカルな環境での応用に特に有望である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:58:36 GMT)
Oops!... They Stole it Again: Attacks on Split Learning [1.9] Split Learning(SL)は、クライアント側でデータを保持しながら、中間出力のみをサーバと共有することで、プライバシを改善する共同学習アプローチである。
本稿では,攻撃者の役割,プライバシリスクの種類,データ漏洩の発生時期,脆弱性の有無といった要因に基づいて,SLに対する様々な攻撃を体系的に評価する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:39:28 GMT)
Hybrid-Hierarchical Fashion Graph Attention Network for Compatibility-Oriented and Personalized Outfit Recommendation [1.9] 本研究では、グラフニューラルネットワークとグラフアテンション機構を活用してこの問題に対処するHFGNモデルに触発されたFGATという新しいフレームワークを紹介する。
提案するフレームワークは,ユーザ,衣装,アイテムの階層的な3階層グラフを構築し,視覚的特徴とテキスト的特徴を統合し,服の互換性とユーザの好みを同時にモデル化する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:09:57 GMT)
Learning State-Space Models of Dynamic Systems from Arbitrary Data using Joint Embedding Predictive Architectures [1.8] 本稿では,任意の観測データから連続時間力学系を用いた世界モデル作成手法を提案する。
提案手法は, ニューラル常微分方程式(ニューラルODE)とシーケンス埋め込みを統合する。
状態遷移における収縮埋め込みとリプシッツ定数を強制する損失関数を用いて、よく組織化された潜在状態空間を構築する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:46:11 GMT)
Chiral Phonons in Graphyne [1.8] キラルフォノンは、フォノンと量子デバイス工学の新しい視点を提供する。
グラニン中のキラルフォノンは、逆転と時間反転対称性が存在するため、未発見のままである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:57:57 GMT)
From Images to Perception: Emergence of Perceptual Properties by Reconstructing Images [1.8] 網膜-V1大脳皮質のいくつかの既知の事実に対応するバイオインスパイアされたアーキテクチャであるPerceptNetは、画像再構成に関連するさまざまなタスクにエンドツーエンドで最適化されている。
以上の結果から,エンコーダの段階は画像歪みに対する人間の知覚的判断と一貫した相関を示すことがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:37:30 GMT)
High-contrast double Bragg interferometry via detuning control [1.7] 二重ブラッグ回折(DBD)に基づく高コントラストマッハ・ツェンダー原子干渉計を提案する。
動的デチューニング制御を用いた三周波レーザー方式を導入し、ディファレンシャルドップラーシフトと実験的不完全性を緩和する。
これらの結果は、精密量子センシングと基礎物理試験のためのDBDベースの干渉計を強化するための実用的な経路を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:04:05 GMT)
Dead Zone of Accountability: Why Social Claims in Machine Learning Research Should Be Articulated and Defended [1.6] 多くの機械学習研究は、新しい手法や技術の潜在的な社会的利益や技術的余裕を記述した言語を使用している。
こうした言語は、私たちが「社会的主張」と呼んでいるもので、機械学習の研究と技術生産に関わる人々にとって、かなりのリソースと影響力を得られる。
本稿では,クレームとリナリティのギャップについて考察し,それに対する説明責任機構の開発を規範的に論じる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:34:49 GMT)
SingleStrip: learning skull-stripping from a single labeled example [1.5] ドメインランダム化と自己学習を用いて3次元頭蓋骨切断ネットワークを訓練する。
ネットワークを微調整するために上位の擬似ラベルを選択する。
この戦略は、新しい解剖学的構造や新しいイメージング技術を含む研究の進行を遅らせるラベル付けの負担を軽減する可能性がある。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:05:19 GMT)
Self-Supervised Temporal Super-Resolution of Energy Data using Generative Adversarial Transformer [1.5] 時系列生成モデル、超解法モデル、計算モデルも潜在的な可能性を示しているが、根本的な課題もある。
時系列超解法モデルや計算モデルでは、入力された低解像度の時系列が希少であるため、アップサンプリングの精度を低下させることができる。
本稿では,GAT(Generative Adrial Transformer)を利用した新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:25:39 GMT)
Large Language Models for Summarizing Czech Historical Documents and Beyond [1.5] 要約は、重要な意味と重要な情報を保持しながら、より大きなテキストを簡潔なバージョンに短縮するタスクである。
我々はMistralやmT5といった大規模言語モデルを用いて、現代のチェコの要約データセットであるSumeCzechの最先端結果を実現している。
本稿では,チェコの歴史的文書をベースラインで要約するための,Posel od vCerchovaという新しいデータセットを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:07:49 GMT)
Comparison of Data Reduction Criteria for Online Gaussian Processes [1.5] ストリーミングのシナリオでは、Sparse GPに対しても、さらに多くのデータポイントが蓄積される。
オンラインGPは、データポイントの最大予算を定義し、冗長なデータポイントを削除することで、この問題を軽減することを目指している。
この研究は、いくつかの還元基準を統一的に比較し、計算複雑性と還元挙動の両方を解析する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:41:18 GMT)
Quantum Otto Heat Engine based on the Dicke-Stark Model under Infinite-Time and Finite-Time Thermodynamic Frameworks [1.4] 有限サイズのディック・スタークモデルを用いた量子オットー熱機関を提案する。
熱機関の出力特性, 効率, パワーに及ぼすスターク磁場強度, 結合強度, 断熱ストローク時間, 等時ストローク時間, DSモデル中の原子数の影響について検討した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:52:25 GMT)
System design and realisation towards optimising secure key bits in free space QKD [1.3] 量子鍵分布(QKD)は、最先端の研究室研究から、確立された通信ネットワークにおける実世界の展開へと急速に移行している。
本稿では,BB84プロトコルに着目したQKD実装のための実践的かつ体系的なフレームワークを提案する。
ハードウェアで容易に実装可能なキーシフティングのための簡単なアルゴリズムを概説する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:57:59 GMT)
Detecting spacelike vacuum entanglement at all distances and promoting negativity to a necessary and sufficient entanglement measure in many-body regimes [1.2] 宇宙のような真空絡み合いは、量子情報処理の基本的な資源である。
対数否定性は、絡み合いの必要かつ十分な尺度であることが示されている。
高精度かつ最適な検出プロファイルを導出することにより、大規模フィールドの絡み合い資源をあらゆる距離で利用できることが示される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:05:51 GMT)
A Lightweight Transformer with Phase-Only Cross-Attention for Illumination-Invariant Biometric Authentication [1.2] 本稿では位相のみのクロスアテンション(POC-ViT)を用いた新しい軽量視覚変換器を提案する。
POC-ViTは顔の額部と外眼部の2つの生体特性を利用しており、顔マスクでも身体に触れることなくよく機能する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:27:24 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における重要な課題、すなわち、統一的な形式的理論的枠組みの欠如と、モデル解釈可能性と倫理的安全性に関する基礎理論の欠如に対処する。
まず、一般的な機械学習段階における存在論的状態とキャリアマッピングを明確に定義し、形式的な情報モデルを構築する。
学習可能な述語と処理可能な述語を導入し、学習と処理機能を導入することにより、機械学習プロセスを管理する因果連鎖論理と制約法を解析する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:58:29 GMT)
Swedish Whispers; Leveraging a Massive Speech Corpus for Swedish Speech Recognition [1.1] スウェーデンのWhisperモデルは、このミッドリソース言語に対して前例のない大きさと可変性のデータセットに基づいてトレーニングされている。
スウェーデンで評価されたOpenAIのWhisperと比較して,モデルサイズ全体の改善が報告されている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:51:04 GMT)
Explainable Sentiment Analysis with DeepSeek-R1: Performance, Efficiency, and Few-Shot Learning [1.1] DeepSeek-R1はOpenAIのGPT-4oとGPT-4o-miniに対するオープンソース推論モデルである。
実験の結果、DeepSeek-R1は5クラスの感情で91.39%のF1スコア、バイナリタスクで99.31%の精度を5ショットで達成した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:03:06 GMT)
Deep Learning for Crack Detection: A Review of Learning Paradigms, Generalizability, and Datasets [1.1] き裂検出は、舗装や建物の検査など、土木インフラにおいて重要な役割を担っている。
近年、ディープラーニングはこの分野を著しく進歩させてきた。
新たなトレンドは、学習パラダイムの移行や一般化可能性の改善など、ランドスケープを変革している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:47:00 GMT)
Deep Learning-Based Automated Segmentation of Uterine Myomas [1.1] 子宮筋線維腫は女性の生殖系において最も一般的な良性腫瘍である。
頻度が70%を超えると、女性の生殖健康に大きな負担がかかる。
深層学習アルゴリズムは、医用画像のセグメンテーションを著しく改善した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:22:14 GMT)
Efficient Patent Searching Using Graph Transformers [1.0] 新しい特許出願を提出するか、または既存の特許を無効にするかを決める際には、関連する先行技術を見つけることが不可欠である。
本稿では,各発明がグラフで表現される特許検索のためのグラフトランスフォーマーに基づく高密度検索手法を提案する。
我々のモデルはこれらの発明グラフを処理し、特許庁検査官からの先行技術引用を関連信号としてトレーニングする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:53:26 GMT)
A Hierarchical IDS for Zero-Day Attack Detection in Internet of Medical Things Networks [1.0] 我々は、ゼロデイ攻撃を検出し、既知の脅威と未知の脅威を区別できるマルチレベルIoMT IDSフレームワークを提案する。
第1層は、新しいデータセットを必要とせず、ゼロデイ攻撃を高精度に検出し、IoMT環境での強い適用性を保証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:08:37 GMT)
Computational Economics in Large Language Models: Exploring Model Behavior and Incentive Design under Resource Constraints [1.0] 大規模言語モデル(LLM)は計算コストによって制限される。
我々は, LLMを資源制約されたエージェントの内部経済として扱う「計算経済学」の枠組みを導入する。
計算が不十分な場合、標準LLMは精度を保ちながら高価値トークンに注意を向ける。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:55:45 GMT)
Prompt Attacks Reveal Superficial Knowledge Removal in Unlearning Methods [1.0] 素早い攻撃下では,特定の機械学習手法が失敗する可能性があることを実証する。
出力ベース,ロジットベース,プローブ分析を用いて,3つのモデルファミリーにまたがる8つのアンラーニング手法を体系的に評価した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:03:53 GMT)
Rule2Text: A Framework for Generating and Evaluating Natural Language Explanations of Knowledge Graph Rules [1.0] Rule2Textは、大規模言語モデルを利用して、マイニングされた論理ルールの自然言語説明を生成するフレームワークである。
その結果,細調整後の説明品質が著しく向上し,特にドメイン固有のデータセットが向上した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:41:47 GMT)
Hallucination vs interpretation: rethinking accuracy and precision in AI-assisted data extraction for knowledge synthesis [1.0] 我々は,大規模言語モデル(LLM)を用いてデータ抽出を自動化する抽出プラットフォームを開発した。
我々は、AIを187の出版物で人間の反応と比較し、スコーピングレビューから17の質問を抽出した。
AIの多様性は幻覚よりも解釈可能性に依存している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:36:46 GMT)
Electromagnetic Simulations of Antennas on GPUs for Machine Learning Applications [1.0] 本研究では,アンテナ設計と最適化の機械学習応用のためのグラフィックス処理ユニット(GPU)を利用したアンテナシミュレーションフレームワークを提案する。
シミュレーション結果と商用電磁(EM)シミュレーションソフトウェアを用いて得られたシミュレーション結果を比較する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:56:04 GMT)
Deblurring in the Wild: A Real-World Dataset from Smartphone High-Speed Videos [0.9] スマートフォンのスローモーションビデオから構築した,世界最大規模の画像デブロアリングデータセットについて紹介する。
240フレームを1秒でキャプチャすることで、フレームの平均化によって現実的な長時間露光のぼかしをシミュレートし、ぼかし画像を生成する。
我々のデータセットには42,000以上の高解像度のぼかしシャープ画像ペアが含まれており、広く使われているデータセットの約10倍の大きさである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:46:57 GMT)
VectorFit : Adaptive Singular & Bias Vector Fine-Tuning of Pre-trained Foundation Models [0.9] 本稿では,VectorFitを紹介する。VectorFitは,その特異ベクトルとバイアスを適応的にトレーニングすることで,$W$に埋め込まれた既存の知識を効率的に活用する。
この方法では、$W$の構造的および変換的性質を利用することで、完全な微調整に匹敵する高階インクリメンタルウェイト行列が$Delta W$となることが示される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:49:01 GMT)
SPHENIC: Topology-Informed Multi-View Clustering for Spatial Transcriptomics [0.9] 本研究では,空間持続的ホモロジー強化近傍クラスタリング手法であるSPHENICを提案する。
SPHENICは、安定した表現学習を実現するために、不変なトポロジ的特徴をクラスタリングネットワークに組み込む。
本研究では,空間クラスタリングタスクにおいてSPHENICが優れた性能を発揮し,既存の最先端手法よりも3.31%-6.54%向上したことを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:43:28 GMT)
Biased AI improves human decision-making but reduces trust [0.9] 現在のAIシステムは、イデオロギー的中立を強制することによってリスクを最小化するが、これは人間の意思決定における認知的関与を抑制することによって自動化バイアスをもたらす可能性がある。
我々は2500人の参加者とともにランダム化試験を行い、文化に偏ったAIが人間の意思決定を促進するかどうかを検証した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:23:09 GMT)
Improving Generative Cross-lingual Aspect-Based Sentiment Analysis with Constrained Decoding [0.9] 本稿では,シーケンス・ツー・シーケンスモデルを用いた制約付き復号法を提案する。
最も複雑なタスクでは、言語間のパフォーマンスを平均で5%向上させる。
我々は7つの言語と6つのABSAタスクにまたがるアプローチを評価した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:07:53 GMT)
Advancing Cross-lingual Aspect-Based Sentiment Analysis with LLMs and Constrained Decoding for Sequence-to-Sequence Models [0.9] 現在の言語横断型ABSA研究は、単純なタスクに重点を置いており、外部翻訳ツールに大きく依存している。
本稿では,複雑なABSAタスクのための新しいシーケンス・ツー・シーケンス方式を提案する。
制約付き復号法を用いる我々の手法は,言語間ABSAの性能を最大10%向上させる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:07:43 GMT)
Exploring near critical lattice gauge simulators with Rydberg atoms facilities [0.8] 我々は、コンパクトアベリア・ヒッグスモデル(英語版)とも呼ばれるスカラー電磁力学の格子ゲージ理論バージョンに対するアナログシミュレータとして、ライドバーグ原子のはしごの使用を動機付けている。
はしごシミュレータの単一コピーから数千枚のショットを使用することで、二部量子フォン・ノイマンエンタングルメントエントロピー$SvN_A$を推定できることを示した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:17:56 GMT)
Variational Time Evolution Compression for Solving Impurity Models on Quantum Hardware [0.8] 動的平均場理論(DMFT)は強相関フェルミオンモデルの解析に有用である。
DMFTでは、モデルの格子は、有効な浴槽に埋め込まれた単一の不純物サイトに置き換えられる。
結果として生じる単一不純物アンダーソンモデル(SIAM)は、量子古典ハイブリッドアルゴリズムで自己整合的に解ける。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:55:41 GMT)
Continuous Bangla Sign Language Translation: Mitigating the Expense of Gloss Annotation with the Assistance of Graph [0.8] 話し言葉を優先する社会では、手話はしばしば過小評価に直面し、社会的排除につながる。
Continuous Bangla Sign Language Translationプロジェクトは、翻訳方法を強化することで、このギャップに対処することを目的としている。
私たちのコントリビューションには、アーキテクチャの融合、さまざまな融合戦略の探索、さまざまな手話データセット上での新たな最先端のパフォーマンスの実現などが含まれています。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:32:31 GMT)
MCP2OSC: Parametric Control by Natural Language [0.8] 本研究は,自然言語によるパラメトリックOSC(OpenSoundControl)制御の探索に焦点をあてる。
Claudeは、自然言語でOSCメッセージを生成するのに有効なMPP2OSCサーバと統合されている。
その結果,LLMに基づくマルチメディアデバイスのためのユニバーサル制御機構の可能性が示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:38:01 GMT)
A Computational Approach to Analyzing Language Change and Variation in the Constructed Language Toki Pona [0.8] 本研究では,約120のコア語を持つ構築言語である Toki Pona の言語変化と変化について検討する。
以上の結果から,社会言語学的な要因が土岐ポナにも自然言語と同様の影響を及ぼし,地域社会が利用する言語体系も自然に進化していくことが示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:26:43 GMT)
LinguaFluid: Language Guided Fluid Control via Semantic Rewards in Reinforcement Learning [0.8] 本研究では,現在状態と目標意味的指示とを一致させて報酬を計算できる意味的整合強化学習手法を提案する。
我々は,手作りの報酬関数がなくても,意味報酬は学習を指導して,競争力のある制御動作を実現することができることを示した。
このフレームワークは、エージェントの振る舞いを自然言語の目標と整合させるための新たな地平を開き、より大きな言語モデルのよりシームレスな統合の基礎となる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:01:16 GMT)
Uncertainty-Aware Prediction of Parkinson's Disease Medication Needs: A Two-Stage Conformal Prediction Approach [0.8] 現在のアプローチは、体系的な予測方法のない試行錯誤決定に依存している。
機械学習の進歩にもかかわらず、ポイント予測に依存するため、臨床導入は限定的である。
医薬品の需要を最大2年間予測するコンフォメーション予測フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:22:41 GMT)
WIP: Leveraging LLMs for Enforcing Design Principles in Student Code: Analysis of Prompting Strategies and RAG [0.7] 本稿では,Large Language Models (LLM) を,コンピュータサイエンスとソフトウェア工学のコースで開発されたオープンソースプロジェクトのコードレビュープロセスに統合することを検討する。
焦点は、学生のコードを主要なオブジェクト指向設計原則に従うために評価する自動フィードバックツールの開発である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:56:03 GMT)
Continuous Parallel Relaxation for Finding Diverse Solutions in Combinatorial Optimization Problems [0.7] 最適解を見つけることが、しばしば最適化(CO)の主要な目標である。
本研究では、教師なし学習(UL)に基づくCOソルバのための計算効率の高いフレームワークであるCPRA(Continuous Parallel Relaxation Annealing)を紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:55:12 GMT)
Data and Context Matter: Towards Generalizing AI-based Software Vulnerability Detection [0.7] 脆弱性検出システムは、しばしば未知の一般化によって制限される。
本研究では,データ品質とモデルアーキテクチャが脆弱性検出システムの一般化可能性に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:30:22 GMT)
Human-in-the-Loop Systems for Adaptive Learning Using Generative AI [0.7] 学生主導のフィードバックループは、AIが生成した応答を修正して、学生の保持とエンゲージメントを改善する。
STEM学生による研究から得られた予備的な知見は、従来のAIツールと比較して学習結果と信頼性が向上したことを示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:44:34 GMT)
From Black Box to Transparency: Enhancing Automated Interpreting Assessment with Explainable AI in College Classrooms [0.7] 本稿では,機能工学,データ拡張,説明可能な機械学習を統合した多次元モデリングフレームワークを提案する。
このアプローチは、構成関連で透明な特徴のみを活用することにより、ブラックボックスの予測よりも説明可能性を重視する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:31:18 GMT)
A Constant-Time Hardware Architecture for the CSIDH Key-Exchange Protocol [0.7] 本稿では,FPGAおよびASICプラットフォーム上でのCSIDHの包括的ハードウェア研究について述べる。
CSIDH-512の定時設計では、鍵発生1回あたりのクロックサイクルは1.03時間108ドルである。
180nmプロセスでのASIC実装では、設計には1.065times108$クロックサイクルが必要であり、アシトールデ180MHzの周波数を実現し、キー生成遅延は591msである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:37:29 GMT)
Functional Analysis of Variance for Association Studies [0.6] 本研究では,ゲノム領域の配列変異と定性特性の関連性をテストするための分散法(FANOVA)の関数解析を提案する。
FANOVAには、(1)一般と稀の両方を含む遺伝子変異のジョイント効果を検査し、(2)リンケージ不均衡と遺伝的位置情報を完全に活用し、(3)保護的またはリスク増進的な因果変異を許容する、という多くの利点がある。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:02:45 GMT)
Frequency principle for quantum machine learning via Fourier analysis [0.6] 本稿では、主周波数範囲内の周波数を優先的に訓練するパラメータ化量子回路の周波数原理を提案する。
我々の研究は、トレーニングプロセスから量子的優位性を理解するための新しい道のりを示唆している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:12:16 GMT)
Towards Reliable Multi-Agent Systems for Marketing Applications via Reflection, Memory, and Planning [0.6] 我々はRAMPと呼ばれるフレームワークを導入し、反復的に計画し、ツールを呼び出し、アウトプットを検証し、生成したオーディエンスの品質を改善するための提案を生成する。
我々は、クライアント固有の事実と過去のクエリの知識ベースである長期記憶ストアにモデルを装備する。
全体として、88個の評価クエリに対して、精度を28ポイント向上するLSM計画とメモリの使用を実証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 23:52:39 GMT)
A MAPE-K-Based Method for Architectural Conformance Checking in Self-Adaptive Systems [0.6] セルフ・アダプティブ・システム(SAS)は、医療、金融、自動運転車、スマートシティといった重要な分野にますます導入されている。
システムの安定性と品質特性を時間とともに維持するためには、アーキテクチャの信頼性を確保することが不可欠です。
本稿では,3つの鍵成分からなるSASのためのACC手法であるREMEDYを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:12:23 GMT)
Scalable platform for qudit-based quantum computing using polar molecules [0.5] 四重項間のゲートの絡み合いは、光学トラップの移動分子によって実現される。
単一のキュービット (d=2) を次元 2 = d = 5 のキュービットと、d=4, 5 の高次元キュービットに写像する符号化スキームを開発する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:20:10 GMT)
Suppression of coherent light scattering in a three-dimensional atomic array [0.5] 光学格子のモット絶縁体を用いて作製した3次元原子配列において,光散乱の強い低減効果を示す。
また,光学格子の多体状態における密度変動に対する感度プローブとして光散乱が有効であることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:32:00 GMT)
FIRESPARQL: A LLM-based Framework for SPARQL Query Generation over Scholarly Knowledge Graphs [0.5] 我々は、RAGとSPARQLクエリ修正層を介してオプションコンテキストで、微調整LDMをコアコンポーネントとしてサポートするモジュラーフレームワークを提案する。
BLEUとROUGEのメトリクスを用いてクエリ精度を測定し、緩和された正確なマッチング(RelaxedEM)を用いてクエリ結果の精度を測定する。
実験結果から,クエリの精度は0.90 ROUGE-L,テストセットの精度は0.85 RelaxedEMに達した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:08:50 GMT)
Insights from the Algonauts 2025 Winners [0.5] アルゴノート2025チャレンジ(Algonauts 2025 Challenge)は、計算神経科学における二年生の挑戦である。
チームは慎重に調整された刺激から人間の脳活動を予測するモデルを構築しようとする。
MedARCチームは大会で4位となった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:11:07 GMT)
Towards Embodied Agentic AI: Review and Classification of LLM- and VLM-Driven Robot Autonomy and Interaction [0.5] 大規模言語モデル(LLM)や視覚言語モデル(VLM)を含む基礎モデルは、ロボットの自律性とヒューマンロボットインタフェースに対する新しいアプローチを実現した。
並行して、視覚言語行動モデル(VLA)や大型行動モデル(LBM)は、ロボットシステムのデクスタリティと能力を高めている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:55:31 GMT)
Beyond Random Sampling: Instance Quality-Based Data Partitioning via Item Response Theory [0.5] 本研究は,モデル検証段階におけるデータセットの分割を特徴付けるために,IRTパラメータを用いた手法を提案する。
IRTインフォームドパーティショニング戦略が機械学習モデルの性能に及ぼす影響を評価した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:29:40 GMT)
Quantum Wavefront Correction via Machine Learning for Satellite-to-Earth CV-QKD [0.5] State-of-the-the-art free-space continuous-variable quantum key distribution (CV-QKD)プロトコルは、位相参照パルスを使用して、受信機における実局所発振器の波面を変調する。
通常、これらの位相基準パルスの波面歪みは、伝送中に多重化される量子信号の波面歪みと同一であると仮定される。
多くの実世界の展開では、参照パルスと量子信号の間に相対的な波面誤差(WFE)が存在し、衛星から地球へのCV-QKDにおける安全な鍵転送を著しく制限することができる。
我が家
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:03:07 GMT)
Digital-GenAI-Enhanced HCI in DevOps as a Driver of Sustainable Innovation: An Empirical Framework [0.5] 本研究では、中国Aシェアインターネット技術企業における、DevOpsにおけるデジタルAI強化ヒューマンコンピュータインタラクション(HCI)の影響について検討する。
運用効率の向上,知識統合の促進,利害関係者の関与向上の3つの主要なメカニズムを同定する。
発見は新興市場における技術導入戦略に実践的な意味を与える。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:05:34 GMT)
Fourier-Guided Attention Upsampling for Image Super-Resolution [0.4] 周波数誘導アテンション(英: Frequency-Guided Attention, FGA)は、単一画像の超解像のための軽量アップサンプリングモジュールである。
試験の結果、PSNRの平均利得は0.120.14dB、周波数領域の整合性は最大29%向上した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:13:17 GMT)
Abundance-Aware Set Transformer for Microbiome Sample Embedding [0.4] 本研究では,固定サイズサンプルレベルの埋め込みを構築するために,Set Transformerのアブリダンス対応版を提案する。
本手法は, 実世界のマイクロバイオーム分類タスクにおいて, 平均プールおよび非重み付きセットトランスフォーマーより優れる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:15:53 GMT)
Clicks Versus Conversion: Choosing a Recommender's Training Objective in E-Commerce [0.4] add-to-cart rate (ACR) と Order-Submit-Rate (OSR) は、eコマースにおける標準のプラクティスである。
オンラインA/Bテストを用いて、これらの目的のいずれかを使用することの効果を比較した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:15:23 GMT)
Semantic Communication with Distribution Learning through Sequential Observations [0.4] 本稿では,セマンティックコミュニケーションにおける分布学習について検討する。
先行状況が不明な場合、ソース統計を学習するための基本的な条件を確立する。
即時セマンティックパフォーマンスに最適化された符号化方式は、長期学習性を犠牲にすることが多い。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:15:05 GMT)
Decentralized Weather Forecasting via Distributed Machine Learning and Blockchain-Based Model Validation [0.3] 本稿では,フェデレートラーニング(FL)とブロックチェーン技術を統合する分散型天気予報フレームワークを提案する。
FLは、機密性の高いローカルデータを公開することなく、協調的なモデルトレーニングを可能にする。
システムのセキュリティをさらに強化するために,提案したモデルの信頼性を評価する評価に基づく投票機構を導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:18:06 GMT)
On Approximate MMS Allocations on Restricted Graph Classes [0.3] 本研究では,接続制約のある不特定商品群を公平に分割する問題について検討する。
完備グラフ、サイクル、固定された$d$に対する$d$-claw-freeグラフのようなグラフのクラスが実際に存在することは知られている。
このようなアロケーションは、ブロックグラフ、cacti、完全多部グラフ、分割グラフなど、よく研究されているクラスに存在していることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:01:13 GMT)
Generalizable Federated Learning using Client Adaptive Focal Modulation [0.3] フェデレートラーニング(FL)は、分散クライアント間での、プライバシー保護、協調トレーニングに不可欠であることが証明されている。
本稿では,サーバ側通信のオーバーヘッドを低減したTransFedの効率的なバージョンを提案する。
我々の発見は、より適応的で、スケーラブルで、一般化可能なトランスフォーマーベースのフェデレーションシステムへの道を開いた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:06:50 GMT)
Iterative Volume Fusion for Asymmetric Stereo Matching [0.3] 非対称ステレオマッチング(IVF-Astereo)のための2相反復ボリュームフュージョンネットワークを提案する。
提案手法は,非対称なシナリオに優れ,視覚的非対称に対して頑健な性能を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:26:11 GMT)
Probing minimal observable length with dark modes in an optomechanical detector [0.2] いくつかの理論は、空間がプランク長に関連する可観測極限分解を持つと仮定している。
この概念は一般化不確実性原理(GUP)とそれに対応する修正可換作用素を導出する。
GUPによって引き起こされた新しい物理学の予測と観測は、量子重力理論の確立にかなりの支持を与えるかもしれない。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:44:31 GMT)
Bias is a Math Problem, AI Bias is a Technical Problem: 10-year Literature Review of AI/LLM Bias Research Reveals Narrow [Gender-Centric] Conceptions of 'Bias', and Academia-Industry Gap [0.2] ACL、FAccT、NeurIPS、AAAIの4つの主要な会場/組織において、AI/LLMバイアスをカバーする研究のレビューを行う。
189件の論文を通じて、偏見研究のパターンと、それらが一般的に注目する人間のアイデンティティの軸について明らかにした。
今後AI/LLMフェアネス研究への推奨で締めくくります。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:53:33 GMT)
Nonlocal Monte Carlo via Reinforcement Learning [0.2] 非平衡非局所モンテカルロ (NMC) アルゴリズムは不均一な温度分布を利用する。
我々は,従来設計されていたNMCの非局所的遷移政策を訓練するために,深層強化学習(RL)を採用している。
構成空間探索のエネルギー変化を観察することで、結果の解法を学習できることを実証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:45:44 GMT)
Towards Efficient Prompt-based Continual Learning in Distributed Medical AI [0.1] 現代のAIモデルは、大規模で高品質なデータセットで最先端のパフォーマンスを達成する。
医療分野における倫理的、社会的、制度的な制約は、データ共有を厳しく制限している。
本稿では,最小拡張戦略を持つ統一的なプロンプトプールを特徴とする,プロンプトベース連続学習(PCL)手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:46:14 GMT)
Prototype-Guided Diffusion: Visual Conditioning without External Memory [0.1] プロトタイプ拡散モデルでは、外部メモリなしで効率的な視覚条件付けを行うために、プロトタイプ学習を直接拡散プロセスに統合する。
PDMは、計算とストレージのオーバーヘッドを低減しつつ、高速な品質を維持し、拡散モデルにおける検索ベースの条件付けに代わるスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:24:11 GMT)
Improving OCR for Historical Texts of Multiple Languages [0.1] 本稿では,光学的文字認識(OCR)と文書レイアウト解析(Document Layout Analysis)の3つのタスクから得られた方法論と知見を,高度なディープラーニング技術を用いて提示する。
The historical Hebrew fragments of the Dead Sea Scrolls, we improve our dataset through extensive data augmentation and using the Kraken and TrOCR model to improve character recognition。
16~18世紀の会議解決タスクの分析では,DeepLabV3+をセマンティックセグメンテーションに組み込んだ畳み込みリカレントニューラルネットワーク(CRNN)を用いた。
現代の英語手書き文字認識タスクでは,ResNet34エンコーダを用いたCRNNを適用した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:52:14 GMT)
Virtual Sensing for Solder Layer Degradation and Temperature Monitoring in IGBT Modules [0.0] 本報告では, 半田層の劣化状態を推定し, 対応する全温度マップを, 限られた物理センサ数に基づいて推定できる可能性について検討する。
劣化した半田面積の推定精度は高く, 最大相対誤差4.56%でIGBTの表面温度を再現できる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:40:46 GMT)
Improved GUI Grounding via Iterative Narrowing [0.0] 本稿では,GUIグラウンディングにおける汎用モデルと微調整モデルの両方の性能向上のために,反復的絞り機構を用いた視覚的プロンプトフレームワークを提案する。
評価のために、様々なUIプラットフォームからなる包括的なベンチマークで手法を検証し、その結果を再現するコードを提供した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:23:09 GMT)
Navigating the New Landscape: A Conceptual Model for Project-Based Assessment (PBA) in the Age of GenAI [0.0] 本稿では,PBL(Project-Based Learning)の再検討や,プロセス指向評価を優先するキャップストーンプロジェクトについて論じる。
このモデルは、プロジェクトライフサイクル中の学習プロセスのオブザーバとして、監督者による(GenAIの支援による)パーソナライズされたフィードバックの使用も強調している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:22:37 GMT)
Magic tricycles: efficient magic state generation with finite block-length quantum LDPC codes [0.0] 有限ブロック長量子LDPC符号のクラスを導入し,そのクラスを三サイクル符号と呼ぶ。
これらの符号は3つの符号ブロック間の論理CCZゲートを実装する物理回路を一定深度でサポートすることができる。
これらの三サイクル符号は単発状態準備と誤り訂正によるマジック状態生成を可能にする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:56:50 GMT)
eDIF: A European Deep Inference Fabric for Remote Interpretability of LLM [0.0] 本稿では,欧州深部推論ファブリック(eDIF)の展開可能性について検討する。
eDIFはNDIF互換のインフラであり、大規模言語モデルにおける機械的解釈可能性の研究をサポートするように設計されている。
このプロジェクトでは、Ansbach University of Applied Sciencesでホストされ、パートナー機関と相互接続するGPUベースのクラスタが導入されている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:45:34 GMT)
Why Cannot Large Language Models Ever Make True Correct Reasoning? [0.0] 著者は、LLMのいわゆる「理解能力」と「推論能力」は、曖昧な概念を持つ人々の錯覚にすぎないと考えている。
本論文は, 動作原理の本質的な限界から, LLMには真の正しい推論能力がないことを説明しようとするものである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:18:18 GMT)
Who Benefits from AI Explanations? Towards Accessible and Interpretable Systems [0.0] 本稿では,eXplainable AI(XAI)のアクセシビリティギャップについて検討する。
包括的XAI設計を運用する4部構成の方法論的概念実証について述べる。
予備的な知見は、説明の簡略化は、詳細な説明よりも視覚的でないユーザにとって理解しやすいことを示唆している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:26:09 GMT)
When Experts Disagree: Characterizing Annotator Variability for Vessel Segmentation in DSA Images [0.0] マルチアノテータによる2次元DSAにおける脳血管の分節間の変動について検討した。
この分析はセグメンテーションの不確実性を定量化し、追加アノテーションのガイドや不確実性を考慮した自動セグメンテーション手法の開発に利用できる方法について議論する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:21:06 GMT)
Visualizing intense laser field driven electron dynamics in a multielectron molecule: dynamic electron localization, bonding properties and multiple ionization bursts [0.0] 本稿では,強い超高速パルスが多光子イオン化,高調波発生,Rabbiフラッピングによる電荷共鳴を駆動する分子における電子動力学の結果と議論を行う。
我々は、励起分子軌道の人口の変調を反映した包絡の振動によって、イオン化速度がどのように振動するかを示す。
超高速レーザーパルスがこれらの条件下での窒素分子イオンの結合性に及ぼす影響を、電子密度と電子密度差、時間依存性平均局所エネルギー、時間依存性電子局在関数の詳細な解析により検討する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:25:40 GMT)
Video-based automatic lameness detection of dairy cows using pose estimation and multiple locomotion traits [0.0] 歩行牛のビデオから9つのキーポイントの動きを抽出した。
キーポイントの軌跡は6つの移動特性を計算するのに使われた。
3つの重要な特徴は、背姿勢測定、頭部ボビング、追跡距離であった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:25:40 GMT)
Variance Reduced Policy Gradient Method for Multi-Objective Reinforcement Learning [0.0] 多目的強化学習(MORL)は、従来の強化学習(RL)の一般化である
目的を非線形スカラー化関数を用いて組み合わせるMORLの問題点を考察する。
この問題を解決しようとする以前の試みは過度に厳密な仮定に依存しており、大規模な状態対応空間への拡張性におけるPGMの利点を失う。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:52:57 GMT)
Using machine learning to inform harvest control rule design in complex fishery settings [0.0] 本研究では, 一部観察, 年齢構造, 余剰魚群に対する収量制御則を設計する際の問題点を考察する。
カナダのアルバータ州にあるWalleyeの漁業では、非常に多様な採用のダイナミクスがマネージャや生態学者を困惑させています。
いくつかの相補的なパフォーマンス指標を使用して、ポリシーを最適化し、評価しました。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:17:57 GMT)
Uplifted Attackers, Human Defenders: The Cyber Offense-Defense Balance for Trailing-Edge Organizations [0.0] 著者: AIの進歩は、サイバーセキュリティに影響を及ぼすと広く理解されています。
ディフェンダーにとっては、AIがすべてのソフトウェアの正式な検証のようなソリューションを可能にするという議論がしばしば行われる。
AIの能力を継続的に改善することは、さらなるリスクをもたらすと我々は主張する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:56:57 GMT)
Unified Theory of Dark Count Rate and System Detection Efficiency for NbN, WSi Based Superconducting Single Photon Detectors [0.0] システム検出効率と暗カウントレートの統一的な定義を提供する光子検出の渦交差理論を提案する。
提案手法は,NbN および WSi ベースの SNSPD におけるシステム検出効率の高原領域を定量的に把握する。
SNSPDの暗カウント率と固有タイミングジッタの温度依存性を同時に予測する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:42:30 GMT)
Time-Independent Parameters in Quantum Systems: Revisiting Berry Phase, Curvature and Gauge Connections [0.0] 創発的な電磁的枠組みの観点から量子断熱理論を再構築する。
従来のアプローチとは対照的に、Berry電場は動的ハミルトン電磁石を持つ系で自然に発生することを実証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:34:00 GMT)
Theoretical Detailed Analyses for DC readout and a Fabri-Pérot gravitational-wave detector [0.0] 鏡運動の初期条件は振り子の基本周波数を中心に集中していることが実証された。
理想的には、高周波数域におけるレーザーのショットノイズは、射出レーザパワーが増大しても減少するというコンセンサスがあるが、得られたノイズスペクトル密度は、射出レーザパワーが上昇してもショットノイズが減少しないことを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:24:56 GMT)
The SET Perceptual Factors Framework: Towards Assured Perception for Autonomous Systems [0.0] 主な関心事は、ロボットの認識の信頼性を保証することだ。
SET (Self, Environment, and Target) Perceptual Factors Framework を導入する。
我々の枠組みは、厳格な安全保証の促進と、自律システムに対する国民の理解と信頼の向上を目的としている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:22:01 GMT)
The GPT-4o Shock Emotional Attachment to AI Models and Its Impact on Regulatory Acceptance: A Cross-Cultural Analysis of the Immediate Transition from GPT-4o to GPT-5 [0.0] 2025年8月、主要なAI企業の前モデルから次世代モデルへの即時かつ強制的な移行が、大衆の反応を広範囲に引き起こした。
2025年8月8日から9日にかけて、複数のソーシャルメディアプラットフォームとビデオ共有サービスから日本語と英語の投稿を150件収集し、感情的な愛着と抵抗の表現を質的に分析した。
アタッチメントが重いモデルでは、安全指向の変更でさえ、行動制御の実用的な窓を狭める、迅速で大規模な抵抗に直面します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:36:58 GMT)
The Effect of Warm-Glow on User Behavioral Intention to Adopt Technology: Extending the UTAUT2 Model [0.0] 温緑化の外部面と内部面の両方を捉えるための2つの追加構造を導入し,UTAUT2+WGモデルを作成する。
その結果,温暖化はユーザの行動に大きく影響し,内面は強い影響を受け,さらにヘドニックなモチベーション,パフォーマンスの期待,そして温暖化の外部側面が続くことがわかった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:21:26 GMT)
The Birth of Quantum Mechanics: A Historical Study Through the Canonical Papers [0.0] 本稿では1900年から1927年にかけての量子力学理論の歴史的発展について考察する。
アインシュタインの光量子仮説の出現、ボーアの原子モデル、および区別不可能な粒子の統計的含意に従う。
古典量子論から現代量子力学への移行に特に重点を置いている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:18:37 GMT)
The Algebra of the Pseudo-Observables I: Why Quantum Mechanics is the ultimate description of Reality [0.0] 本稿では、擬可観測体の代数という、新しい強力な代数を紹介する。
オッカムのカミソリの原理を適用して、身体的現実の最小記述を得る。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:05:22 GMT)
Teleportation Fidelity of Binary Tree Quantum Repeater Networks [0.0] 我々は,4種類の二分木リピータネットワーク(指向性,非指向性,非対称性,対称性)を考える。
本研究は, この測定における方向性と対称性の役割について考察する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:43:51 GMT)
TLE-Based A2C Agent for Terrestrial Coverage Orbital Path Planning [0.0] 低地球軌道(LEO)の混雑は、地球観測衛星の効率的な展開と安全な運用に永続的な課題をもたらす。
本研究では,Advantage Actor-Critic (A2C) アルゴリズムを用いて衛星軌道パラメータを精密な地上被覆のために最適化する強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:44:51 GMT)
Systematic FAIRness Assessment of Open Voice Biomarker Datasets for Mental Health and Neurodegenerative Diseases [0.0] 音声バイオマーカーは、メンタルヘルスと神経変性疾患の非侵襲的な検出とモニタリングのための有望なツールである。
本稿では,27種類の音声バイオマーカーデータセットについて,初めて体系的FAIR評価を行った。
メンタルヘルスデータセットは、FAIRスコアにおいてより多様性を示し、神経変性データセットはわずかに一貫性があった。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:55:27 GMT)
Symmetry-Constrained Multi-Scale Physics-Informed Neural Networks for Graphene Electronic Band Structure Prediction [0.0] 本稿では,Symmetry-Constrained Multi-Scale Physics-Informed Neural Network (SCMS-PINN) v35を紹介する。
グラフェンバンド構造を直接学習し、結晶対称性を厳格に強化する。
このモデルは、理論ゼロの30.3$mu$eVと平均誤差53.9meVとブリルアンゾーンの40.5meV(導電性)でディラック点ギャップを予測する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:59:10 GMT)
Street Review: A Participatory AI-Based Framework for Assessing Streetscape Inclusivity [0.0] この研究は、参加型研究とAIに基づく分析を組み合わせて、街路景観の傾きを評価する混合手法であるStreet Reviewを提示する。
カナダのモンターイールでは、28人の住民がセミダイレクトなインタビューや画像評価に参加し、Mapillaryのストリートビュー画像45,000の画像を分析した。
さまざまなユーザフィードバックを取り入れることで、機械学習モデルが強化されることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:40:56 GMT)
Spontaneously Broken Non-Invertible Symmetries in Transverse-Field Ising Qudit Chains [0.0] 非可逆対称性の自発対称性の破れは、通常の非可逆対称性の破れと類似しているが類似していることを示す。
我々の研究は、既存の量子ハードウェアが探すことのできる非可逆対称性の破れの性質を特定する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:11:14 GMT)
Source Component Shift Adaptation via Offline Decomposition and Online Mixing Approach [0.0] オフライン分解とオンライン混合によるソースコンポーネントシフト適応手法を提案する。
本手法はシフト特性をフル活用し,既存手法よりも優れた適応性能を実現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:51:36 GMT)
Simulating Mass-Dependent Decoherence in Quantum Computers: Baseline Signatures for Testing Gravity-Induced Collapse [0.0] 本稿では、Penroseの重力誘起崩壊仮説にインスパイアされた質量依存デコヒーレンスモデルの量子コンピューティングシミュレーションについて述べる。
このモデルを3つの標準量子コンピューティング実験に適用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:28:28 GMT)
Segal-Bargmann type spaces related to non-rotational measure, and entanglement of bipartite squeezed coherent states [0.0] 2つの複素変数の正則エルミート関数によって生じる二部分断状態の絡み合いについて検討した。
2粒子量子力学系を開発した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:19:30 GMT)
Saturable Quantum Speed Limits for Imaginary-Time Evolution [0.0] 仮想時間進化のための幾何学的量子速度限界(QSL)を導出する。
物理的に動機づけられた2症例に対して,この境界を解析的に評価した。
我々はフレームワーク内でよく知られた対数スケーリングの$T=mathcal O(log N)$を厳格に再現する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:59:30 GMT)
SHLIME: Foiling adversarial attacks fooling SHAP and LIME [0.0] LIMEやSHAPのようなポストホックな説明法はブラックボックス分類器に対する解釈可能な洞察を提供する。
これらの方法は敵の操作に弱いため、有害なバイアスを隠蔽する可能性がある。
バイアスモデルに対するLIMEとSHAPの感受性について検討し、ロバスト性向上のための戦略を評価する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:28:48 GMT)
Risk-Based Prognostics and Health Management [0.0] この章では、リスクアセスメントと障害予測の密接な結合を実現するための、リスクベースのアプローチについて説明する。
基礎となるモデリングフレームワークとして,連続時間ベイズネットワークを用いてこれを実現する方法を示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:31:33 GMT)
Rhythmic sharing: A bio-inspired paradigm for zero-shot adaptive learning in neural networks [0.0] 脳は新しい状況に素早く適応し、限られたデータから学習する。
リンク強度の発振を利用した学習パラダイムを開発し,これらの発振の協調と学習の関連性について検討した。
リンクの発振は、調整を迅速に変更し、ネットワークが監督なしに微妙なコンテキスト変化を感知し、適応できるようにする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:28:36 GMT)
Reservoir-Engineered Mechanical Cat States with a Driven Qubit [0.0] 機械的なシュリンガー・キャット状態のようなマクロ的な量子重ね合わせは、センシングやボソニックな誤り訂正符号における新しい量子技術の中心である。
本稿では,ナノメカニカル共振器をコヒーレントに駆動された2レベルシステムに結合することで,そのような状態を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:03:29 GMT)
Reasoning in Computer Vision: Taxonomy, Models, Tasks, and Methodologies [0.0] 本調査は,視覚的推論を5つの主要なタイプ(関係性,象徴性,時間性,因果性,共通性)に分類することを目的とする。
機能的正当性,構造的整合性,因果妥当性を評価し,その限界を一般化可能性,説明力の観点から批判的に分析する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:53:35 GMT)
Random Permutation Circuits are Quantum Chaotic [0.0] ランダムな置換回路における局所演算子絡み(LOE)の時間発展について検討する。
我々の発見は、量子カオスは基本的に古典力学によって生成できることを示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:57:10 GMT)
Quantum-Guided Cluster Algorithms for Combinatorial Optimization [0.0] 本稿では,イジングスピングラスの基底状態を求めるための新しいアルゴリズムを提案する。
様々な古典的および量子的アルゴリズムを用いて、問題のエネルギー景観に関する情報を具現化する相関関係を生成することができる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:54:56 GMT)
Quantum measurement systems and applications to particle physics and cosmology [0.0] 以前は採用されていなかった量子拡張を利用する新しい検出器の提案とR&Dがある。
例えば超伝導量子センサ、原子干渉計、量子スピンセンサーなどがある。
新しい量子測定システムの優れた可能性を考えると、粒子物理学や宇宙論に応用する新たな提案もある。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:01:17 GMT)
Quantum fault tolerance with constant-space and logarithmic-time overheads [0.0] 一定の空間と$widetildeO(log N)$-timeオーバーヘッドを持つフォールトトレランスプロトコルを構築し、$widetildeO(cdot)$はサブポリログ要素を隠します。
我々の研究は、これまでで最低の時空オーバーヘッドを与えており、これは初めて、古典的な耐故障性からサブポリログ要因までに匹敵する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:07:50 GMT)
Quantum Synchronization of Twin Limit-Cycle Oscillators [0.0] 古典的等価性を持つ量子リエナード系は、系が収束する2つの極限サイクルを特徴とする。
量子の場合、どちらの極限サイクルも1つの定常状態に共存する。
この明らかなパラドックス的な結果に光を当てるために、量子同期のより詳細な測度を導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:06:11 GMT)
Quantitative Comparison of Fine-Tuning Techniques for Pretrained Latent Diffusion Models in the Generation of Unseen SAR Images [0.0] 我々は、SAR(Synthetic Aperture Radar)のモダリティに、オープンソースのテキスト・ツー・イメージ基盤モデルを適用する。
我々は,UNet拡散バックボーン,変分オートエンコーダ(VAE)およびテキストエンコーダの完全な微調整とパラメータ効率の低いローランド適応(LoRA)を比較した。
この結果から,テキストエンコーダと学習トークン埋め込みベストにLoRAを併用したハイブリッド戦略フルUNetチューニングが,SAR形状とテクスチャを保存できることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:29:14 GMT)
Part Segmentation of Human Meshes via Multi-View Human Parsing [0.0] この研究は、大規模なヒューマンメッシュの頂点ごとのセマンティックセマンティックセグメンテーションを可能にすることによって、2つのドメインをブリッジすることを目的としている。
T Human2.1データセットのために、擬似地上真理ラベルパイプラインが開発された。
点雲を効果的にダウンサンプリングするために、空間充填曲線に基づくシリアライゼーションを備えた窓付き反復極端点サンプリング(FPS)という新しいメモリ効率サンプリング戦略を導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:22:32 GMT)
Optimizing Unitary Coupled Cluster Wave Functions on Quantum Hardware: Error Bound and Resource-Efficient Optimizer [0.0] 本稿では、量子ハードウェア上でのユニタリ結合クラスタ波関数の最適化のための射影量子固有解法(PQE)アプローチについて検討する。
我々は、ハミルトニアンの外部対角係数(残差)とアルゴリズムのエネルギー誤差と得られた波動関数によって達成された重なり関係を導出する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:14:41 GMT)
Optical readout of a superconducting qubit using a piezo-optomechanical transducer [0.0] 同軸ケーブルを介して接続された光ファイバによる超伝導トランスモン量子ビットの光学的読み出しを実演する。
復調読み出し手法を用いて, 単発読み出し精度81%を達成する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:50:58 GMT)
Open system dynamics from fundamental Lagrangian [0.0] 我々は、全微分によって異なる2つのラグランジアンが、異なる物理的予測をもたらすことを示した。
熱光子と相互作用する非相対論的電子の主方程式を2次まで導出する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:02:28 GMT)
Online Homogeneity Can Emerge Without Filtering Algorithms or Homophily Preferences [0.0] イデオロギー的に均質なオンライン環境は、偏極化、急進化、誤報の原動力と見なされている。
中心的な議論は、このようなホモフィリーがアルゴリズムによるキュレーションや、同志の仲間に対するユーザの好みに主に起因しているかどうかを問うものである。
本研究は, フィルタリングアルゴリズムとユーザの嗜好の両方が欠如している場合に, 均一性が出現することを示すことによって, この視点に挑戦する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:08:46 GMT)
On the Derivation of Equations of Motion from Symmetries in Quantum-Mechanical Systems via Heisenberg's Uncertainty [0.0] 量子力学系における対称性に基づく運動方程式を構築する。
具体例は「相対論的、非相対論的、より少ない研究事例:超相対論的(Carroll-Schr"odinger)」である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:01:08 GMT)
Novel View Synthesis using DDIM Inversion [0.0] 既存の多くのメソッドは、複数のビューを使用して大きな拡散バックボーンを微調整するか、あるいはスクラッチから拡散モデルを訓練する必要がある。
DDIMインバージョンで観測される固有雑音相関構造を利用した新しい融合手法を提案する。
新規な視点を合成するために, 拡散モデルに先行する生成性を利用して, DDIMサンプリングの初期条件として融合潜水剤を用いる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:32:52 GMT)
Note on Selection Bias in Observational Estimates of Algorithmic Progress [0.0] ここでは,評価戦略の方法論的問題を1つ挙げる。
アルゴリズム品質の一部が潜伏しており、計算選択がアルゴリズム品質に内在的であれば、アルゴリズム品質の見積もりはバイアスを受けることになる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:38:10 GMT)
Nonlinear filtering based on density approximation and deep BSDE prediction [0.0] 後方微分方程式に基づく新しい近似ベイズフィルタを提案する。
フィルタ問題の非線形Feynman-Kac表現と、よく知られたディープBSDE法とニューラルネットワークを用いた非正規化フィルタリング密度の近似を用いる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:31:05 GMT)
Neuronal correlations shape the scaling behavior of memory capacity and nonlinear computational capability of reservoir recurrent neural networks [0.0] 貯留層コンピューティングはリアルタイム情報処理のための強力なフレームワークである。
本稿では,リカレントニューラルネットワーク(RNN)の計算能力について検討する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:10:43 GMT)
Neural Machine Translation for Coptic-French: Strategies for Low-Resource Ancient Languages [0.0] 本稿では,コプト語をフランス語に翻訳する手法に関する最初の体系的研究について述べる。
我々の包括的なパイプラインは、ピボット対直接変換、事前学習の影響、マルチバージョン微調整の利点、ノイズに対するロバスト性など、体系的に評価している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:25:34 GMT)
Multi-Label Plant Species Prediction with Metadata-Enhanced Multi-Head Vision Transformers [0.0] 植生プロット画像におけるマルチラベル植物種予測のためのマルチヘッド・ビジョン・トランスフォーマー手法を提案する。
このタスクでは、単一種の植物イメージのトレーニングモデルと、多種の4つのイメージのテストが含まれており、ドメインシフトが劇的に変化する。
本手法は, 種, 属, および家族予測のための複数の分類先頭を持つ, 事前訓練されたDINOv2 Vision Transformer Base (ViT-B/14) のバックボーンを利用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:56:58 GMT)
Multi-Agent Reinforcement Learning for Adaptive Resource Orchestration in Cloud-Native Clusters [0.0] 本稿では,クラウドネイティブデータベースシステムにおける高資源ダイナミズムとスケジューリング複雑性の課題に対処する。
マルチエージェント強化学習に基づく適応的資源オーケストレーション手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:43:20 GMT)
Modeling Sampling Distributions of Test Statistics with Autograd [0.0] 条件付き1次元サンプリング分布をモデル化する手法が,確率密度比法の代替となるかを検討する。
比較的単純で効果的なニューラルネットワークモデルは、様々な方法で予測の不確実性が定量化される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:14:45 GMT)
Measures and Trajectory Properties in Oscillator Systems [0.0] 可算振動子系の無限次元線形流れは、新しい種類の軌道挙動を示す。
特異測度を持つ連続系に対しては、測度とトーラスについて十分な条件を確立する。
応用として、これらの条件を満たす特異ベルヌーイ測度のクラスを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:48:54 GMT)
Measurement of the Unusual Dielectric Response to Low-Frequency s-Polarized Evanescent Waves in Metals with {\break} Implications for the Casimir Effect [0.0] 銅板から反射する発振磁界の側方成分は、s偏光エバネッセント波によって完全に決定される。
これらの予測は測定データによって除外され,現在使われているドルーデモデルでは,s偏光エバネッセント波に対する金属の電磁応答の完全な説明が得られていない。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:11:02 GMT)
Measurement Incompatibility Based In-equivalence Between Bell and Network Nonlocality [0.0] 非n-局所性は、単一のパーティだけが非互換な測定を行う場合であっても、標準量子ネットワークで検出できる。
2 より大きい任意の有限 n に対して、非 n-局所相関は任意の標準線型 n-局所ネットワークにおいて、すべての当事者が互換の測定を行うときに生成される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:10:37 GMT)
Meanings are like Onions: a Layered Approach to Metaphor Processing [0.0] 意味を玉ねぎとして扱うメタファー処理のモデルを提案する。
第一段階では、メタファーは基本的な概念的要素によって注釈付けされる。
第2のレベルでは、概念の組み合わせをモデル化し、コンポーネントを創発的な意味にリンクする。
第3のレベルでは、話者意図、コミュニケーション機能、文脈効果を捉えるために、実践的な語彙を導入する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 08:50:05 GMT)
Lightweight CNNs for Embedded SAR Ship Target Detection and Classification [0.0] 高レベルの製品を生成するためのオンボード処理は、ダウンリンクが必要なデータ量を減らすことができる。
本研究では,非焦点SARデータに基づくリアルタイム推論のためのニューラルネットワークの提案と評価を行う。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:55:19 GMT)
Learning with Confidence [0.0] 我々は、信条の学習や更新に生じる信頼の概念を特徴づける。
連続体に対する信頼を測定するための2つの標準的な方法を与える。
私たちは常に自信がこのように表現できることを証明します。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 19:45:40 GMT)
Language-Based Bayesian Optimization Research Assistant (BORA) [0.0] ドメイン知識のコンテキスト化は、実りある領域の探索をガイドする強力なアプローチである。
本稿では,検索最適化における言語モデル (LLM) の利用を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:51:01 GMT)
Lameness detection in dairy cows using pose estimation and bidirectional LSTMs [0.0] 本研究では,ポーズ推定とBLSTM(Bidirectional Long-Short-Term Memory)ニューラルネットワークを組み合わせた遅延検出手法を提案する。
提案手法は手作業で設計した特徴に依存した確立された手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:38:48 GMT)
LLM-Driven Adaptive 6G-Ready Wireless Body Area Networks: Survey and Framework [0.0] 6G通信,ポスト量子暗号,エネルギー回収は,WBAN性能を向上させる可能性がある。
本稿では,Large Language Model が認知制御面として機能する,新しいLarge Language Model-Driven Adaptive WBANフレームワークを提案する。
このアプローチは、次世代モバイルヘルスアプリケーションに対して、超信頼性、セキュア、自己最適化のWBANを実現することを目的としている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:38:22 GMT)
KL-based self-distillation for large language models [0.0] 我々はKLの発散による知識蒸留の数学的基礎化手法を提案する。
これにより、生徒モデルは、異なる語彙にもかかわらず、教師から分布的知識を継承することができる。
我々は,KLを用いた蒸留法と従来のクロスエントロピートレーニングを比較し,新しいトークン埋め込みを初期化する手法の評価を行った。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 15:45:50 GMT)
JobPulse: A Big Data Approach to Real-Time Engineering Workforce Analysis and National Industrial Policy [0.0] 我々は、Webスクレイピングツールと新しいデータ処理スキームを使用して、半導体産業向けのジョブポストデータセットを構築します。
各種業務機能の雇用主基盤と相対的ニーズについて報告する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:36:55 GMT)
Introducing CQ: A C-like API for Quantum Accelerated HPC [0.0] 本稿では、量子加速HPCのためのCライクなAPIの仕様であるCQを紹介する。
CQは、古典的なHPCコードへの量子コンピューティングの漸進的な統合の実現に焦点を当てている。
CQ-SimBEはC99で書かれたCQのリファレンス実装であり、状態ベクトルシミュレータQuEST上に構築されている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:26:02 GMT)
Interplay between trimer structure and magnetic ground state in Ba5Ru3O12 probed by Neutron and muSR techniques [0.0] トリマーのルテネートBa5Ru3O12は、TN = 60 Kで長距離反強磁性秩序を呈する。
Ba5Ru3O12は隣り合うRu-Momentsと隣り合うRu-Momentsの交換相互作用が競合するため, スピンフラストレーションを示す。
理論計算により,Ru3O12添加トリマーの基底状態を予測する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:29:13 GMT)
Interference between non-overlapping waves [0.0] 古典力学や電磁気学では、2つ以上の波が時空の同じ点で重なるときに干渉が起こる。
空間的に拡張された原子が同時に2つの遠距離場に結合する理論モデルを開発する。
本稿では,巨大人工原子が2つの独立共振器と相互作用する超伝導回路を用いて実験的に実現可能な実装を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:23:22 GMT)
High-Precision Quantum Dynamics of He$_2$ over the b $^3Π_\mathrm{g}$-c $^3Σ_\mathrm{g}^+$ Electronic Subspace by including Non-adiabatic, Relativistic and QED Corrections and Couplings [0.0] 相対論的量子力学は、ヘリウム二量体のb$3Pi_mathrmg$とc$3Sigma_mathrmg+$電子状態に対して計算される。
量子核運動は、b$3Pi_mathrmg$-c$Sigma_mathrmg+$で計算される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:51:08 GMT)
High Fidelity Text to Image Generation with Contrastive Alignment and Structural Guidance [0.0] 本稿では,既存のテキスト駆動画像生成手法の性能を,意味的アライメントの精度と構造的整合性の観点から考察する。
テキスト画像のコントラスト制約と構造誘導機構を統合することで,高忠実度画像生成手法を提案する。
本手法は,計算複雑性を増大させることなく,意味的アライメントと構造的忠実度とのギャップを効果的に埋めることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 02:15:11 GMT)
Gradient-Based Inverse Optimization of Atom-Chip Wire Currents for BEC Transport [0.0] 原子チップに沿って磁気トラップをシフトさせるワイヤ電流の変調は、ボース・アインシュタイン凝縮体のスムーズな接触のない搬送を可能にするが、加熱と原子損失を引き起こす閉じ込めプロファイルを変形させることができる。
本稿では、原子を輸送し、到着時にトラップ形状を復元するワイヤ電流スケジュールを計算する逆最適化に基づく高速なシミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:27:08 GMT)
Geospatial Diffusion for Land Cover Imperviousness Change Forecasting [0.0] 本稿では,歴史的・補助的なデータソースに規定されたデータ問題としてLULC予測をフレーミングすることにより,土地被覆変化予測のためのジェネレーティブAI(GenAI)を利用した新しいパラダイムを提案する。
本研究では,不確実性予測のための拡散モデルをトレーニングし,その性能を全く変化しないベースラインと比較する。
トレーニング期間中に12大都市圏で1年間にわたり評価した結果,平均分解能が$geq 0.7times0.7km2$の場合,これらのベースラインよりもMAEが低いことが示唆された。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:45:10 GMT)
Gapped spinful phases obtained via Gutzwiller projections of Euler states [0.0] 我々は、相互作用しないオイラー絶縁体の2つのコピーを用いて、スピンフル相互作用するオイラーモデルのクラスを生成する。
相互作用しないキラル位相のグッツウィラー射影は、分数的、位相的に順序付けられたキラル位相を引き起こすことが知られている。
我々は、その絡み合いエントロピーのスケーリングを分析し、領域法則に対する位相的補正は見つからず、その状態が本質的に位相的に順序づけられていないことを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:18:23 GMT)
Exploring the Application of Visual Question Answering (VQA) for Classroom Activity Monitoring [0.0] 近年のVisual Question Answering (VQA)モデルの進歩は、ビデオ記録から教室での対話を自動的に分析するための有望なツールを提供する。
本稿では,LLaMA2,LLaMA3,QWEN3,NVILAなど,最先端のオープンソースVQAモデルの適用性について検討する。
ベトナム銀行学校における実世界授業のビデオ記録から得られたBAV-Classroom-VQAデータセットについて紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:32:44 GMT)
Exploring Quantum Annealing for Coarse-Grained Protein Folding [0.0] 量子コンピュータの折りたたみタンパク質モデルを比較し、古典的および量子的エイブのスケーリングと性能を解析する。
四面体格子上での座標モデルの新しい符号化法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:00:30 GMT)
Exact Sum Rules and Zeta Generating Formulas from the ODE/IM correspondence [0.0] 我々は、$cal PT$-symmetric potential $V_cal PT(x) = x2K (ix)varepsilon with $K,varepsilon in mathbbN, and as the Hermitian potential $V_cal H(x) = x2K$ with $K in mathbb N + 1$によって定義される量子力学の正確な和則(ESRs)とゼータ生成公式(ZGFs)を定式化する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:36:02 GMT)
Equilibrio de carga para transformadores de distribucion electrica mejorando la calidad de servicio en fin de linea [0.0] 本研究は,ネットワークの終端ノードにおける位相バランスと電圧品質を改善するために,どの負荷を再割り当てすべきかを最適に識別する遺伝的アルゴリズムを提案する。
このアルゴリズムは、電力フロー解析ツールであるPandaPowerを用いて、テュークマンの電気システムの実環境特性に基づく単純なネットワークをモデル化し、シミュレーションにより評価した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 22:39:19 GMT)
Entangled Polariton States in the Visible and Mid-Infrared Spectral Ranges [0.0] ポラリトン系の絡み合い生成は、高い損失とデコヒーレンスによって制約される。
偏光子-偏光子相互作用ではなく、光学的相互作用を用いて絡み合った偏光子を生成する概念的に異なるアプローチを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:30:33 GMT)
Enhancing GraphQL Security by Detecting Malicious Queries Using Large Language Models, Sentence Transformers, and Convolutional Neural Networks [0.0] APIの柔軟性は、効率的なデータフェッチには有効だが、従来のAPIセキュリティメカニズムが対処できないようなセキュリティ脆弱性を導入する。
悪意のあるクエリは言語の動的性質を悪用し、サービス障害やインジェクションによるデータ流出などの悪用につながる。
本稿では,悪意のあるクエリをリアルタイムに検出するための,AIによる新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 07:35:11 GMT)
Enhanced multiphoton ionization driven by quantum light [0.0] 我々は、量子光によって駆動される多光子イオン化の完全に相対論的、超同軸理論を示す。
非パロキシャル効果から生じるコヒーレント光と比較して,数桁の断面拡張を予測した。
予測された拡張は、現在の最先端のフォトニックおよび原子技術でアクセス可能である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:57:38 GMT)
Enhanced Sparse Point Cloud Data Processing for Privacy-aware Human Action Recognition [0.0] HAR(Human Action Recognition)は、医療、フィットネストラッキング、環境支援生活技術において重要な役割を担っている。
従来のビジョンベースのHARシステムは効果的だが、プライバシー上の懸念がある。
mmWaveレーダーセンサーは、プライバシーを守る代替手段を提供するが、ポイントクラウドデータの希少でノイズの多い性質のため、課題を提示する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:09:49 GMT)
Enabling Generic Robot Skill Implementation Using Object Oriented Programming [0.0] 作業ロボットシステムのデプロイに要する労力を削減するソフトウェアフレームワークを提案する。
焦点は、現代のロボットシステムのさまざまなインターフェースを単純化するコンセプトを提供することにのみ焦点をあてている。
ターゲットシステムは、薬川モトマンGP4を含むビンピッキングセルである。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:53:41 GMT)
Empirical Investigation into Configuring Echo State Networks for Representative Benchmark Problem Domains [0.0] 様々なパラメータ選択の影響と値調整,およびEcho State Networkへのアーキテクチャ変更は,現場での経験を伴わずに完全に理解することが困難である。
本稿では,Echo State Networkの性能が,アーキテクチャ,設計,パラメータ選択および値の変動に対してどのように影響するかを検討する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:55:47 GMT)
Efficient mutual magic and magic capacity with matrix product states [0.0] 相互のvon-Neumann SREとマジックキャパシティを導入する。
相互SREは、横フィールドイジングモデルの基底状態の臨界点を特徴付ける。
マジックキャパシティは、ハイゼンベルクおよびイジングモデルの基底状態、クリフォード+T回路のランダム性、および典型的および非典型的状態の遷移を特徴付ける。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:14:24 GMT)
Efficient Quantum Information-Inspired Ansatz for Variational Quantum Eigensolver Algorithm: Applications to Atomic Systems [0.0] 本稿では,変分量子解法(VQE)のための量子情報インスピレーションアンサッツについて述べる。
原子系の基底状態エネルギーの計算における有効性を示す。
最大12キュービット(または12スピン軌道)のノイズレス計算では、提案されたアンザッツは99.99%の精度でエネルギーを得る。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:36:06 GMT)
EVOSCAT: Exploring Software Change Dynamics in Large-Scale Historical Datasets [0.0] 長く生きたソフトウェアプロジェクトは、多くのアーティファクトを含んでおり、その歴史を通じて多くの修正がなされている。
EvoScatは、研究者が進化データセットを探索し、特徴付けるのに役立つ、スケーラブルな可視化を作成する手段を提供することを目指している。
この論文は、ヒストリスケーリングとアライメントの柔軟な構成をサポートすることで、ツールを特定の分析ニーズに合わせる方法を示している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 17:20:27 GMT)
Deep Learning in Classical and Quantum Physics [0.0] 機械学習(ML)、特に深層学習(DL)は、量子科学と技術のための変換器となった。
これらの講義ノートは、量子応用のためのDLの包括的かつ大学院レベルの導入を提供する。
彼らは読者に、DLをいつ、どのように効果的に適用するかを判断し、その実践的な制約を理解し、量子物理学、化学、工学にまたがる問題に責任を持ってAIメソッドを適用することを目指している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:05:12 GMT)
Deciding Whether a C-Q Channel Preserves a Bit is QCMA-Complete [0.0] 古典量子(C-Q)チャネルが1つの古典ビットを正確に保存できるかどうかを決定することはQCMA完全であることを示す。
この「ビット保存」問題は、C-Qチャネル上の直交制約付き最適化タスクの特別な場合である。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:03:38 GMT)
Cross-Prompt Encoder for Low-Performing Languages [0.0] 低性能言語の性能向上において,プロンプトエンコーダが中心的な役割を果たすことを示す。
本稿では、エンコーダベースのプロンプトと直接訓練された標準ソフトプロンプトを組み合わせたデュアルソフトプロンプト機構を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:36:21 GMT)
Convergence Analysis of Max-Min Exponential Neural Network Operators in Orlicz Space [0.0] 指数型ニューラルネットワーク演算子を用いた近似関数に対するMax Minアプローチを提案する。
単変数関数に対する点収束と一様収束について検討する。
適切なカーネルとシグモダルアクティベーション関数を通して関数の近似誤差を記述するためのグラフィカルな表現を提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 00:30:56 GMT)
Conditional Independence Estimates for the Generalized Nonparanormal [0.0] 本稿は、非ガウス分布のクラスにおいて、条件独立構造に関する情報が精度行列から推論可能であることを示すために、以前の研究に基づいている。
我々は、この理論を利用して一般化された非正規データから条件付き独立構造を復元する、単純で効率的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:19:30 GMT)
Concentration-Free Quantum Kernel Learning in the Rydberg Blockade [0.0] 量子カーネル法(QKM)は、短期量子コンピュータ上での機械学習に魅力的なフレームワークを提供する。
ここでは指数集中のないQKMを提案するが、古典的なシミュレートは困難である。
我々のQKMは、コヒーレントに駆動される中性原子配列のリドベルク封鎖における弱いエルゴード性破壊多体ダイナミクスを利用する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 16:45:16 GMT)
Comment on "Energy-speed relationship of quantum particles challenges Bohmian mechanics" [0.0] 最近の論文では、エバネッセント状態における量子粒子の「エネルギー-速度関係」を報告している。
著者らは、これらの発見はボヘミア粒子力学の妥当性に挑戦すると主張している。
この主張が誤りであり,実験結果がボヘミア力学と完全に一致している理由を述べる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:21:47 GMT)
Colon Polyps Detection from Colonoscopy Images Using Deep Learning [0.0] 大腸ポリープは大腸癌の前駆体であり、世界中のがん関連死亡の原因となっている。
本研究では,大腸内視鏡画像を用いた早期ポリープ同定へのディープラーニングによる物体検出の適用について検討した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:16:23 GMT)
Codes on any Cayley Graph have an Interactive Oracle Proof of Proximity [0.0] インタラクティブなOracle Proofs of Proximity (IOPP)は、ゼロ知識プロトコルのファミリであるコードベースのSNARKの中心にある。
本稿では, 特定の (2, n) 正規タナー符号に対して [DMR25] で導入された開花 IOPP を, より広い範囲のコードに一般化する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:25:17 GMT)
Code Vulnerability Detection Across Different Programming Languages with AI Models [0.0] 本稿では,CodeBERTやCodeLlamaのようなトランスフォーマーモデルの実装について述べる。
これは、脆弱で安全なコードフラグメント上でモデルを動的に微調整することで、オフザシェルフモデルがモデル内の予測能力をいかに生み出すかを示している。
実験によると、よく訓練されたCodeBERTは97%以上の精度で既存の静的アナライザに匹敵するか、それ以上に優れている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 05:41:58 GMT)
Circulation Statistics and Migdal Area Rule Beyond the Kibble-Zurek Mechanism in a Newborn Bose-Einstein Condensate [0.0] KZM以外の渦数統計の普遍性は、循環統計の特徴づけを可能にする。
我々は、渦対と反渦対の距離に関して、小さなループに対するミグダル領域規則を検証する。
さらに、KZM力学によって決定される非平衡ダイナミクスを発見し、循環統計のモーメントのパワー-ロースケーリングをもたらす。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:18:23 GMT)
Characterization of the optical response from variant InGaN nanowires emitting within the green spectral gap [0.0] InGaNナノワイヤ(NWs)の形態,構造,光学特性を詳細に解析する。
本研究は, インジウム組成不均一性とNWsの発光特性の相関性について検討した。
これらの知見は、成長条件の最適化、色精度の向上、NWの光学効率の向上に寄与し、次世代の高性能LEDや光エレクトロニクスデバイスの可能性を強調している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:32:32 GMT)
Characterization of non-planar ring oscillators at a wavelength of 1064 nm for high precision metrology [0.0] 本研究は1064nmの波長で新たに開発されたシードレーザーと2つの商用NPROを比較した。
新しいレーザーは10倍の電力と周波数ノイズを示す。
このノイズアドバンテージは、その後40Wまで増幅しても保持される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 09:27:48 GMT)
Bootstrapping, Autonomous Testing, and Initialization System for Si/SiGe Multi-quantum Dot Devices [0.0] 現代のQDデバイスの複雑さは、キャリブレーションと制御を進行のボトルネックにする。
大規模なQD量子ビット配列の効率的な特徴付けとチューニングは、自動プロトコルの選択に依存する。
本稿では,QDデバイス評価と校正の合理化を目的としたBATISを紹介する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 10:15:02 GMT)
Bistochastically private release of longitudinal data [0.0] 経時的データ、すなわち 複数の期間にわたって観察された個人は、ますます収集される。
一般的なプライバシーツールのk匿名性に基づく拡張は、長手データによる課題に対処するために提案されているものはほとんどない。
本稿では,匿名化のための簡単なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:48:06 GMT)
BIPOLAR: Polarization-based granular framework for LLM bias evaluation [0.0] 本研究では,大規模言語モデルにおける偏光関連バイアスを評価するために,再利用性,粒度,トピックに依存しないフレームワークを提案する。
我々のアプローチは、偏極感性感情メトリクスと、競合関連文の合成的に生成されたバランスの取れたデータセットを組み合わせる。
ケーススタディでは、ロシアとウクライナの戦争に焦点を当てた合成データセットを作成し、いくつかのLSMのバイアスを評価した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 20:44:19 GMT)
Attosecond Transient Absorption Study of Coherent Hole Oscillation in Ar+ [0.0] 電離アルゴン原子の電子動力学の観察, 特性, 制御について報告する。
我々は、強い中赤外パルスを用いて、イオンのスピン軌道分割基底状態のコヒーレント重ね合わせを生成する。
弱い極紫外パルス(XUV)は、時間分解された過渡吸収分光を通じてホール振動をプローブする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 01:03:59 GMT)
Are Large Pre-trained Vision Language Models Effective Construction Safety Inspectors? [0.0] 建設安全検査は通常、人間の検査官が現場で安全上の懸念を識別する。
強力なビジョン言語モデル(VLM)の台頭に伴い、研究者は、現場画像から安全規則違反を検出するなどのタスクに使用することを模索している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:23:09 GMT)
An Attempt to Devise a Pairwise Ising-Type Maximum Entropy Model Integrated Cost Function for Optimizing SNN Deployment [0.0] スパイクニューラルネットワーク(SNN)は、生物学的ニューロンのスパイク動作をエミュレートし、通常、分散メモリニューロモルフィックハードウェアにデプロイされる。
We model SNN dynamics using a Ising-type pairwise interaction framework, bridging micro neuron interaction with macroscopic network behavior。
我々は、sPyNNakerニューロモルフィックプラットフォーム上に配置された2つのSNNに対するアプローチを評価した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:34:52 GMT)
Addressing Local Realism through Bell Tests at Colliders [0.0] 量子相関の2つの例は、量子絡み合いとベル非局所性である。
ベル非局所性は、局所現実主義が有効な記述である理論の区別において二重の役割を担っているため、特別な位置を占める。
本研究では,検出器が特定の確率で正しい結果を報告する実験においてベル試験について検討した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 18:00:00 GMT)
Adapting SAM via Cross-Entropy Masking for Class Imbalance in Remote Sensing Change Detection [0.0] 基礎モデルはコンピュータビジョンの様々な領域で大きな成功を収めた。
そのような基礎モデルの1つは、イメージ内のオブジェクトを正確にセグメント化できるSegment Any Model (SAM)である。
リモートセンシング変化検出(RSCD)と時空間特徴強調(STFE)とマルチスケールデコーダ融合(MSDF)を用いてSAMエンコーダを微調整し、複数スケールで変化を堅牢に検出することを提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:07:20 GMT)
AR Surgical Navigation With Surface Tracing: Comparing In-SitVisualization with Tool-Tracking Guidance for Neurosurgical Applications [0.0] 本研究では,AR誘導を利用して解剖学的目標を登録し,リアルタイムな計器ナビゲーションを行う新しい手法を提案する。
新規な表面追跡法により標的位置を患者に登録し、リアルタイム赤外線ツールトラッキングを用いてカテーテル配置を支援する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:46:30 GMT)
ALAS: Autonomous Learning Agent for Self-Updating Language Models [0.0] 大規模言語モデル(LLM)は、しばしば知識の切れ目があり、新しい情報に対する正確性を制限する。
我々は、LLMの知識を最小限の介入で継続的に更新するモジュールパイプラインであるALASを紹介する。
ALASは、ターゲットドメインの学習カリキュラムを自律的に生成し、Webから最新の情報を(引用とともに)検索し、質問応答訓練データに蒸留し、教師付き微調整によりモデルを微調整する。
我々は,ALASが知識更新クエリに対して90%の精度でエンジニアリングオーバーヘッドを最小限に抑えることを示す。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 06:55:51 GMT)
AEGISS -- Atomic orbital and Entropy-based Guided Inference for Space Selection -- A novel semi-automated active space selection workflow for quantum chemistry and quantum computing applications [0.0] AVAS(Atomic Valence Active Space)法とAutoCAS法の両方に着想を得た新しい手法を提案する。
本手法は, 化学的, 物理的に有意な活性空間の構築を導くために, 原子軌道投射による軌道エントロピー解析を統一する。
本稿では,光力学的治療に関連する分子系,特にRu(II)-錯体の集合に対するアプローチを検証する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:11:26 GMT)
A Unified Theory of Language [0.0] 統一言語理論は、ベイズ的な言語処理の認知言語モデルを組み合わせたものである。
この理論は、その速さや表現性など、言語の主要な事実を論じている。
それは、インテリジェンスの表示のための性的選択によって進化した言語を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 11:09:15 GMT)
A Transformer-Based Approach for DDoS Attack Detection in IoT Networks [0.0] DDoS攻撃はIoTデバイスのセキュリティにとって大きな脅威となっている。
DDoS攻撃を検出する従来の方法は、IoTネットワークの動的性質に対処するのに十分な効率性はない。
本稿では,自然言語処理タスクにおいて顕著な性能を示すトランスフォーマーモデルを用いた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:33:49 GMT)
A Riemannian Approach to the Lindbladian Dynamics of a Locally Purified Tensor Network [0.0] 近辺結合を持つ多体開量子系においてリンドブレディアン力学を実装するための枠組みを提案する。
本研究では、量子チャネルのクラウス表現に固有のゲージ自由を利用して、分割誤差を改善する。
2つの近接雑音モデルを用いて本手法の有効性を検証し,他の定性保存方式と比較して桁違いの精度向上を実現した。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 04:26:30 GMT)
A Random-Key Optimizer for Combinatorial Optimization [0.0] 本稿では,最適化問題に適した汎用的で効率的な局所探索手法を提案する。
ランダムキーの概念を用いて、RKOは解をランダムキーのベクトルとしてエンコードし、後に実行可能な解に復号する。
RKOフレームワークは古典的メタヒューリスティクスの多元体を組み合わせ、それぞれが独立して、あるいは並列に動作可能であり、エリートソリューションプールを通じてソリューション共有が促進される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 14:41:46 GMT)
A Novel Study on Intelligent Methods and Explainable AI for Dynamic Malware Analysis [0.0] 本研究は、マルウェア検出モデルの解釈可能性と信頼性を高めるために、説明可能なAI(XAI)技術を統合する。
この研究は、ディープラーニングモデルの内部動作を軽視し、サイバーセキュリティの文脈における予測能力のより良い理解と信頼を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:49:29 GMT)
A Guide to Bayesian Optimization in Bioprocess Engineering [0.0] このレビューはベイズ最適化の直感的で実践的な紹介を提供することを目的としている。
また、将来有望なアプリケーション領域とオープンアルゴリズムの課題を概説し、機械学習における将来の研究機会を強調している。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 13:38:23 GMT)
A Graph-Based Framework for Exploring Mathematical Patterns in Physics: A Proof of Concept [0.0] このコーパスは、グラフ注意ネットワークがリンク予測で97.4%のAUCを達成した、重み付き知識グラフとして表現された。
フレームワークの主な価値は、仮説の生成と知識の監査という2つの能力から生まれる。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 12:55:58 GMT)
A Feasibility Experiment on the Application of Predictive Coding to Instant Messaging Corpora [0.0] データ管理のワークフローを利用して、メッセージを日々のチャットにグループ化し、続いて特徴選択とロジスティック回帰分類を行う。
定量的な情報に富んだInstant Bloombergデータセット上で、我々の方法論をテストする。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 21:43:13 GMT)
3D latent diffusion models for parameterizing and history matching multiscenario facies systems [0.0] 本手法は,3次元チャネルレジーマウスシステムのための生成潜伏拡散モデル (LDMs) に基づくパラメータ化手法である。
LDM法を用いて構築された新しい実現法は、参照ジオモデルと密接に類似していることが示されている。
フロー応答分布は、特定の注入と生産井戸のセットに対して、2つのモデルのセット間に密接な一致があることも示される。
論文参考訳(メタデータ) (Thu, 14 Aug 2025 03:40:35 GMT)