Intern-S1: A Scientific Multimodal Foundation Model [185.4] Intern-S1は、一般的な理解と推論機能を備えた専門的なジェネラリストである。
Intern-S1はオフラインおよびオンライン強化学習(RL)をInternBootCampで実施する。
Intern-S1は、オープンソースモデル間の一般的な推論タスクにおける競合性能を示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:58:00 GMT)
NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model [176.4] Nemotron-Nano-9B-v2は、推論処理のスループットを向上させるために設計されたハイブリッドのMamba-Transformer言語モデルである。
Nemotron-Nano-9B-v2はNemotron-Hアーキテクチャをベースにしており、共通のTransformerアーキテクチャの自己保持層の大部分をMamba-2層に置き換えている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:18:04 GMT)
Private Hyperparameter Tuning with Ex-Post Guarantee [98.4] 「実用優先」のプライバシメカニズムは、望ましいユーティリティレベルを優先し、それに対応するプライバシコストを決定する。
Wu et al. [2019] と Liu と Talwar [2019] の作業を拡張して,プライベートな見積りのシーケンスをサポートします。
最適なプライバシ予算の選択を含む,これらの推定器のハイパーパラメータチューニングは,追加のプライバシコストなしで行うことができることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:42:23 GMT)
Visual Autoregressive Modeling for Instruction-Guided Image Editing [97.0] 画像編集を次世代の予測問題として再編成する視覚的自己回帰フレームワークを提案する。
VarEditは、正確な編集を実現するために、マルチスケールのターゲット機能を生成する。
1.2秒で512times512$編集を完了し、同じサイズのUltraEditよりも2.2$times$高速になった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:59:32 GMT)
Search-Based Credit Assignment for Offline Preference-Based Reinforcement Learning [91.0] 本稿では,2つのフィードバックソースを統一する検索ベースPreference Weightingスキームを提案する。
選好ラベル付き軌道における各遷移について、SPWは専門家のデモンストレーションから最もよく似た状態-作用対を探索する。
これらの重みは標準の嗜好学習をガイドするために使われ、より正確なクレジット割り当てを可能にします。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:41:45 GMT)
Rethinking Addressing in Language Models via Contexualized Equivariant Positional Encoding [89.5] 本研究では,コンテキストbfTextualized equivaritextbfAnt textbfPosition textbfEncoding(textbfTAPE)を提案する。
提案手法は,パラメータ効率の良い微調整を最小限のオーバーヘッドで実現し,事前学習した変換器に容易に組み込むことができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:12:10 GMT)
Optimizing Cross-Client Domain Coverage for Federated Instruction Tuning of Large Language Models [87.5] 大規模言語モデル(LLM)のためのFedDIT(Federated Domain-specific instruction tuning)は、分散プライベートデータと限定データを用いて、特定のドメインの性能を向上させることを目的としている。
データ不均一性ではなく、クロスクライアントなドメインカバレッジが重要な要素であることを実証的に証明します。
我々は多様性指向のクライアントセンターの選択と検索に基づく拡張を通じて、このカバレッジを明示的に最大化するアルゴリズムであるFedDCAを紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:56:28 GMT)
Dream 7B: Diffusion Large Language Models [85.3] これまでで最も強力なオープン拡散大言語モデルであるDream 7Bを紹介します。
我々のモデルは、一般的な、数学的、コーディングタスクにおいて、既存の拡散言語モデルよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:09:58 GMT)
TiP4GEN: Text to Immersive Panorama 4D Scene Generation [82.8] TiP4GENはテキストから動的パノラマシーン生成フレームワークである。
微粒なコンテンツ制御を可能にし、動きに富んだ幾何学的なパノラマ4Dシーンを合成する。
TiP4GENはパノラマビデオ生成と動的シーン再構成を統合し、360度没入型仮想環境を作成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:28:57 GMT)
Boosting Pathology Foundation Models via Few-shot Prompt-tuning for Rare Cancer Subtyping [80.9] 視覚言語病理基盤モデルの可能性を生かした新しいフレームワークPathPTを提案する。
PathPTは、WSIレベルの監視を、VLモデルのゼロショット機能を活用することで、きめ細かいタイルレベルのガイダンスに変換する。
以上の結果から,PathPTは一貫して優れた性能を示し,サブタイピング精度と癌領域の接地能力を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:04:41 GMT)
LaMP-Cap: Personalized Figure Caption Generation With Multimodal Figure Profiles [77.6] 本稿では,マルチモーダルな人物キャプション生成のためのデータセットであるLaMP-Capを紹介する。
実験では、プロファイル情報を使用することで、オリジナルの著者が書いたものに近いキャプションを生成することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:00:09 GMT)
Prompt Injection Attack to Tool Selection in LLM Agents [74.9] 一般的なアプローチは、与えられたタスクに対してツールライブラリから最も適切なツールを選択するための2段階のプロセス(式と例選択)に従う。
本研究では、no-boxシナリオにおける新しいプロンプトインジェクション攻撃ツール選択であるtextitToolHijackerを紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:39:44 GMT)
GALA: Guided Attention with Language Alignment for Open Vocabulary Gaussian Splatting [74.6] GALAは3次元ガウススプラッティングを用いたオープンな3次元シーン理解のための新しいフレームワークである(3DGS)。
GALAは、自己教師付きコントラスト学習を通じてシーン固有の3Dインスタンス特徴フィールドを蒸留する。
シームレスな2Dおよび3Dオープン語彙クエリをサポートし、ガウス単位の高次元特徴学習を回避してメモリ消費を削減する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:47:52 GMT)
Omni$^2$: Unifying Omnidirectional Image Generation and Editing in an Omni Model [68.2] 約360ドルで全方位画像(ODI)が注目されており、様々なバーチャルリアリティ(VR)や拡張現実(AR)アプリケーションで広く利用されている。
このギャップを埋めるために、最初の総合的なODI生成編集データセットである textbftextitAny2 Omni を構築します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:05:26 GMT)
3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt [65.3] 3DGS-LM, 3D Gaussian Splatting(3DGS)の再構築を高速化する新しい手法を提案する。
提案手法は, 元の3DGSよりも20%高速であり, 再構成品質の最適化が可能である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:52:11 GMT)
Validating LLM-as-a-Judge Systems under Rating Indeterminacy [65.1] 評価の不確定性の下でLLM-as-a-judgeシステムを検証するための枠組みを提案する。
本研究では,人事合意基準の違いによるシステム性能の判断方法と,評価評価とアグリゲーション方式の差分検証手法について述べる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:01:48 GMT)
Mobile-Agent-v3: Foundamental Agents for GUI Automation [61.7] 本稿では,オープンソースエンド・ツー・エンド・モデル間の最先端性能を実現する基礎的なGUIエージェントモデルを提案する。
汎用GUIエージェントフレームワークであるMobile-Agent-v3を提案し,AndroidWorldでは73.3,OSWorldでは37.7に向上した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:39:12 GMT)
CopyrightShield: Enhancing Diffusion Model Security against Copyright Infringement Attacks [61.1] 拡散モデルは、攻撃者が戦略的に修正された非侵害画像をトレーニングセットに注入する著作権侵害攻撃に弱い。
まず、上記の攻撃に対して防御するための防御フレームワーク、PhiliptyShieldを提案する。
実験により,PhiliptyShieldは2つの攻撃シナリオで有毒なサンプル検出性能を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:56:47 GMT)
SDGO: Self-Discrimination-Guided Optimization for Consistent Safety in Large Language Models [59.2] 大規模言語モデル(LLM)は、様々な自然言語処理タスクに優れるが、ジェイルブレイク攻撃には弱い。
本稿では,モデル固有の差別と生成能力の整合性を検討する。
我々の方法は、トレーニングフェーズ中に追加の注釈付きデータや外部モデルを必要としない。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:26:09 GMT)
InfAlign: Inference-aware language model alignment [58.7] 言語モデルのアライメントは、現代の生成言語モデルのトレーニングにおける重要なステップである。
この列車/テストのミスマッチは、推論時間法の観点から標準のRLHFフレームワークを最適化することを示す。
本稿では,ベースモデルに対するアライメントポリシーの予測時間勝利率を最適化することを目的とした,推論対応アライメント(InfAlign)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:32:06 GMT)
Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [58.5] エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:51:19 GMT)
Pairwise or Pointwise? Evaluating Feedback Protocols for Bias in LLM-Based Evaluation [57.4] 評価のためのフィードバックプロトコルの選択は,評価信頼性に大きく影響し,系統的なバイアスを生じさせることを示す。
ジェネレータモデルは、気を散らす機能を埋め込むことで好みをひっくり返すことができる。
我々は,データセットの特徴と評価目標に基づくフィードバックプロトコルの選択を推奨する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:48:03 GMT)
CRISPR-GPT for Agentic Automation of Gene-editing Experiments [57.1] 大規模言語モデル(LLM)は様々なタスクにおいて有望であるが、しばしば特定の知識が欠如し、生物学的設計の問題を正確に解くのに苦労する。
本研究では,CRISPRに基づく遺伝子編集実験の設計プロセスを自動化するために,ドメイン知識と外部ツールを付加したLCMエージェントであるCRISPR-GPTを紹介する。
我々は,遺伝子編集実験をゼロから行う非専門家研究者を支援するCRISPR-GPTの可能性を示し,実世界のユースケースにおけるエージェントの有効性を検証した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:15:28 GMT)
Curriculum Approximate Unlearning for Session-based Recommendation [56.9] セッションベースレコメンデーションのための近似アンラーニング(英: Approximate unlearning)とは、特定のトレーニングサンプルの影響をリトレーニングせずにレコメンダから排除することを指す。
グラディエント・アセント(GA)は、近似的アンラーニングを行うための代表的な方法である。
本稿では,セッションベースの推薦に適合した教育用アンラーニングフレームワークであるCAUを紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:52:28 GMT)
FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [55.4] FinAgentBenchは、ファイナンスにおけるマルチステップ推論による検索評価のための最初の大規模ベンチマークである。
このベンチマークは、S&P-100上場企業に関する専門家による3,429の例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:53:46 GMT)
WebEvolver: Enhancing Web Agent Self-Improvement with Coevolving World Model [55.3] 自己進化型エージェントは、独自のポリシーに基づいて、自律的にサンプリングされた軌道上で訓練される。
我々は,共進化型世界モデルLLMを導入する新しいフレームワークを提案する。
この世界モデルは、Web環境における現在の観察と行動に基づいて、次の観測を予測します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:55:43 GMT)
Hadamard Attention Recurrent Transformer: A Strong Baseline for Stereo Matching Transformer [55.0] Adamard Attention Recurrent Stereo Transformer(HART)について紹介する。
HARTには、以下のコンポーネントを組み込んだ新しいアテンションメカニズムが含まれている。
反映的な領域では、HARTはKITTI 2012ベンチマークで1位にランクインした。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:32:46 GMT)
Seed-X: Building Strong Multilingual Translation LLM with 7B Parameters [53.6] 7Bパラメータサイズを持つオープンソースの言語モデル(LLM)のファミリーであるSeed-Xを紹介する。
ベースモデルは、28言語にわたるモノリンガルコンテンツとバイリンガルコンテンツの両方を含む、多種多様な高品質データセットで事前訓練されている。
その後、インストラクションモデルは、Chain-of-Thought(CoT)推論によって翻訳され、強化学習(RL)によりさらに強化され、多様な言語対をまたいだより良い一般化が達成される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:08:01 GMT)
ZeroQAT: Your Quantization-aware Training but Efficient [53.3] 量子化は、大規模言語モデル(LLM)のデプロイメントコストを削減する効果的な手法である。
既存の低ビットPTQ法は, 局所再構成目標と下流性能の相違による累積誤差の伝搬と誤調整が生じるため, 精度劣化に悩まされる。
我々は,ゼロオーダー最適化に基づくQATフレームワークZeroQATを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:18:27 GMT)
Grounded-VideoLLM: Sharpening Fine-grained Temporal Grounding in Video Large Language Models [53.2] 我々は,特定の映像モーメントをきめ細かな方法で知覚・推論できる新しいビデオLLMであるGrounded-VideoLLMを紹介した。
我々は,(1)フレーム間の関係を符号化する追加の時間的ストリームと(2)特定の時間的知識に富んだ離散的な時間的トークンを組み込むことで,モデルを洗練する。
実験では, 時間文の接地, ビデオキャプションの密接化, ビデオQAの接地といった, きめ細かい接地作業に優れていた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:15:19 GMT)
How Performance Pressure Influences AI-Assisted Decision Making [53.0] 我々は、プレッシャーと説明可能なAI(XAI)技術がAIアドバイステイク行動とどのように相互作用するかを示す。
我々の結果は、圧力とXAIの異なる組み合わせで複雑な相互作用効果を示し、AIアドバイスの行動を改善するか、悪化させるかのどちらかを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:00:22 GMT)
Integrated Sensing, Communication, and Computation for Over-the-Air Federated Edge Learning [52.9] 本稿では,統合されたセンサ,通信,計算機能を備えた空対空フェデレーションエッジ・ラーニング(Air-FEEL)システムについて検討する。
バッチサイズ制御とネットワークリソース割り当てを交互に最適化することにより、低複雑さI SCCアルゴリズムを導出する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:46:46 GMT)
Learning to Generate Unit Tests for Automated Debugging [52.6] ユニットテスト(UT)は、コードの正確性を評価するだけでなく、大きな言語モデル(LLM)にフィードバックを提供する上でも重要な役割を果たします。
提案するUTGenは,LLMに対して,予測出力とともにエラーを示す単体テスト入力を生成することを教える。
UTGen は他の LLM ベースラインを7.59% 上回っていることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:27:02 GMT)
End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.1] Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:42:47 GMT)
Wave-Based Semantic Memory with Resonance-Based Retrieval: A Phase-Aware Alternative to Vector Embedding Stores [51.6] 本稿では,波動パターン$psi(x) = A(x) eiphi(x)$として知識をモデル化し,共振に基づく干渉によってそれを検索する新しいフレームワークを提案する。
このアプローチは振幅情報と位相情報の両方を保存し、より表現的かつ堅牢な意味的類似性を実現する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:13:24 GMT)
Unveiling Trust in Multimodal Large Language Models: Evaluation, Analysis, and Mitigation [51.2] MultiTrust-XはMLLMの信頼性問題を評価、分析、緩和するためのベンチマークである。
分類に基づいて、MultiTrust-Xには32のタスクと28のキュレートデータセットが含まれている。
私たちの実験は、現在のモデルに重大な脆弱性を明らかにします。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:00:01 GMT)
Versatile Framework for Song Generation with Prompt-based Control [50.4] VersBandは、高品質でアライメントのある曲をプロンプトベースのコントロールで合成するためのフレームワークである。
分離されたモデルであるVocalBandは、歌唱スタイル、ピッチ、メル-スペクトログラムを生成するためのフローマッチング手法を利用している。
フローベースのトランスフォーマーモデルであるAccompBandは、Band-MOEを取り入れ、品質、アライメント、制御の強化に適した専門家を選択する。
歌詞用LyricBandとメロディー用MelodyBandの2世代モデルは、総合的なマルチタスク・ソング生成システムに貢献している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:29:52 GMT)
Fairness for the People, by the People: Minority Collective Action [50.3] 機械学習モデルは、トレーニングデータに存在するバイアスを保存し、一部の少数民族を不公平に扱う。
我々は,企業のトレーニングプロセスを変更することなく,公正性を高めるために,自らのデータを戦略的に再ラベルする調整されたマイノリティグループを提案する。
以上の結果から,少数民族のサブグループは,全体の予測誤差に少なからぬ影響で,不公平さを著しく低減できることが明らかとなった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:09:39 GMT)
Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models [49.6] 大規模言語モデル(LLM)は複雑なタスクにおいて顕著な機能を示した。
OpenAI o1とDeepSeek-R1の最近の進歩は、System-2推論ドメインのパフォーマンスをさらに改善した。
しかし、冗長な出力と冗長な出力による計算オーバーヘッドも大幅に発生する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:14:40 GMT)
Taming Unbalanced Training Workloads in Deep Learning with Partial Collective Operations [49.3] 本稿では,分散的蓄積のためのグローバル同期を緩和するeager-SGDを提案する。
本稿では,最先端同期SGDの1.27倍の高速化を実現し,精度を損なわないことを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:39:24 GMT)
Global restrictions under local state discrimination [49.2] 局所的な識別性は、二粒子状態のグローバルな性質を制限することができる。
グローバルな行動を制限する強力なツールとなり得ることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:02:51 GMT)
A Quantum-Control Lambda-Calculus with Multiple Measurement Bases [49.2] 複数の測定ベースをサポートする型付き量子計算であるLambda-SXを紹介する。
型システム内の任意のベースに対する重複性を追跡することで、Lambda-SXは、測定に関するより柔軟な制御と構成的推論を可能にします。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:04:22 GMT)
Breaking (Global) Barriers in Parallel Stochastic Optimization with Wait-Avoiding Group Averaging [49.0] 本稿では、ウェイトアビジングサブグループであるWAGMA-SGDについて述べる。
ImageNet上でResNet-50をトレーニングし、機械翻訳用のトランスフォーマー、大規模ナビゲーションのための深い強化学習を行う。
最先端の分散SGDと比較すると、WAGMA-SGDはトレーニングのスループットを大幅に改善する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:25:21 GMT)
Collaborative Multi-Modal Coding for High-Quality 3D Generation [48.8] 基本的マルチモーダルから学習する最初のフィードフォワード3Dネイティブ生成モデルであるTriMMを提案する。
具体的には、TriMMはまず、モダリティ固有の機能を統合する、協調的なマルチモーダルコーディングを導入する。
また、マルチモーダル符号化の堅牢性と性能を高めるために、補助的な2Dおよび3D監視を導入する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:31:14 GMT)
TextSplat: Text-Guided Semantic Fusion for Generalizable Gaussian Splatting [46.8] 一般化可能なガウススプラッティングは、スパース入力ビューから頑健な3次元再構成を可能にした。
テキスト駆動型ジェネリックライザブルガウシアンスティングフレームワークであるTextSplatを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:53:36 GMT)
QA-LIGN: Aligning LLMs through Constitutionally Decomposed QA [46.7] シンボル報酬の自動分解手法であるQA-LIGNを導入する。
モノリシックスコアを出力するブラックボックス報酬モデルをトレーニングする代わりに、QA-LIGNは原則固有の評価質問を定式化する。
QA-LIGNはより透明性と適応性を提供することを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:05:08 GMT)
Dissecting Tool-Integrated Reasoning: An Empirical Study and Analysis [45.7] 大規模言語モデル(LLM)は、チェーン・オブ・ソート(CoT)推論のような手法によるタスクの推論において、大きな進歩を遂げてきた。
TIR(Tool-Integrated Reasoning)は、外部ツールを推論プロセスに組み込んだソリューションとして登場した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:50:24 GMT)
A Survey on Large Language Model Benchmarks [45.0] 一般的な能力ベンチマークは、中核言語学、知識、推論などの側面をカバーする。
ドメイン固有のベンチマークは、自然科学、人文科学、社会科学、エンジニアリング技術といった分野に焦点を当てている。
ターゲット固有のベンチマークは、リスク、信頼性、エージェントなどに注意を払う。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:43:35 GMT)
Preacher: Paper-to-Video Agentic System [44.7] Preacherは、最初の紙対ビデオのエージェントシステムである。
研究論文を構造化ビデオ要約に分解、要約、再構成する。
5つの研究分野にまたがって高品質なビデオ抽象化を生成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:14:20 GMT)
SceneGen: Single-Image 3D Scene Generation in One Feedforward Pass [44.1] 3Dコンテンツ生成は、VR/ARとAIの具体化によって、大きな研究関心を集めている。
シーンイメージと対応するオブジェクトマスクを入力として,同時に複数の3Dアセットを生成する新しいフレームワークであるSceneGenを提案する。
このパラダイムは、高品質な3Dコンテンツ生成のための新しいソリューションを提供し、下流タスクにおける実践的応用を推し進める可能性があると考えています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:59:16 GMT)
ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling [43.7] 240個の同期カメラを用いて,600kの高分解能スキャンから得られた高忠実度ボディモデルATLASを提案する。
我々は、人間の骨格にメッシュ表現を接地することで、形状と骨格の基部を明示的に分離する。
ATLASは、未確認の被写体を多様なポーズに適合させることで既存の手法よりも優れており、定量的評価により、我々の非線形ポーズ補正が線形モデルと比較して複雑なポーズをより効果的に捉えていることが示されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:58:56 GMT)
Quantum Federated Learning: A Comprehensive Survey [43.4] QFL(Quantum Federated Learning)は、分散量子コンピューティングとフェデレーション機械学習の組み合わせである。
本稿では、QFLに関する包括的調査を行い、その鍵となる概念、基礎、応用、そしてこの急速に発展する分野における課題について考察する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:11:58 GMT)
Spatial Policy: Guiding Visuomotor Robotic Manipulation with Spatial-Aware Modeling and Reasoning [43.4] 視覚中心の階層型エンボディードモデルは、長距離ロボット制御に強い可能性を示している。
既存の方法は空間認識能力に欠けており、複雑な環境下での行動可能な制御に視覚計画をブリッジする際の有効性を制限している。
本研究では,空間モデルと推論を用いた空間認識型ロボット操作フレームワークである空間ポリシー(SP)を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:24:18 GMT)
Scaling Group Inference for Diverse and High-Quality Generation [43.3] サンプル群の多様性と品質を改善するスケーラブルなグループ推論手法を提案する。
本フレームワークは,テキスト・ツー・イメージ,イメージ・ツー・イメージ,画像プロンプト,ビデオ生成など,幅広いタスクを一般化する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:59:57 GMT)
Understanding Action Effects through Instrumental Empowerment in Multi-Agent Reinforcement Learning [43.1] 本研究は,エージェントの振る舞いに対する有意義な洞察を,基礎となる値関数と整合して抽出できるかどうかを考察する。
知的エージェントが収束器質的価値を追求する傾向にある現象にインスパイアされた我々は、ICV(Intended Cooperation Values)を導入する。
ICVは、意思決定の不確実性と選好の整合性を評価することによって、チームメイトの方針に対するエージェントの作用を測定する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:35:59 GMT)
CineScale: Free Lunch in High-Resolution Cinematic Visual Generation [42.8] 我々は,高解像度な視覚生成を実現するための新しい推論パラダイムであるCineScaleを提案する。
提案手法は,8k画像生成を微調整なしで実現し,最小限のLoRA微調整で4kビデオ生成を実現する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:59:57 GMT)
Jet-Nemotron: Efficient Language Model with Post Neural Architecture Search [42.5] Jet-Nemotronはハイブリッドアーキテクチャ言語モデルの新しいファミリーである。
それは、主要なフルアテンションモデルの正確さと一致または超える。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:59:08 GMT)
An Empirical Study on How Video-LLMs Answer Video Questions [42.0] Video Large Language Models (Video-LLMs) は、ビデオ質問に答える強力な機能を示している。
私たちの知る限り、ビデオ-LLMが内部でどのように処理し、ビデオコンテンツを理解するかを体系的に明らかにしたのは、これが初めてです。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:42:35 GMT)
Inductive Domain Transfer In Misspecified Simulation-Based Inference [42.0] キャリブレーションと分散アライメントを1つのエンドツーエンドのトレーニング可能なモデルに統合する,完全な帰納的・償却型SBIフレームワークを提案する。
我々のアプローチは、他の標準SBIおよび非SBI推定器と同様に、RoPEの性能と一致または上回っている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:06:42 GMT)
Hessian-based lightweight neural network for brain vessel segmentation on a minimal training dataset [41.9] 我々は、IXIデータセット(注釈付き200画像)に基づいて、半手動で注釈付き脳血管画像データセットを作成する。
データセットはhttps://git.scinalytics.com/terilat/VesselDatasetPartlyで公開されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:45:19 GMT)
SafetyFlow: An Agent-Flow System for Automated LLM Safety Benchmarking [41.4] SafetyFlowは、安全ベンチマークの構築を自動化するために設計されたエージェントフローシステムである。
人間の介入なしに、総合的な安全ベンチマークをわずか4日で自動的に構築できる。
コントリビューションには、最初の完全に自動化されたベンチマークパイプラインと、包括的な安全ベンチマークが含まれています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:00:53 GMT)
Contextual Bandits with Stage-wise Constraints [41.3] 本研究では,制約を高い確率と期待値の両方で満たさなければならない段階的制約の存在下での文脈的帯域幅について検討する。
本稿では,この問題に対する高信頼度有界アルゴリズムを提案し,それに対するT$ラウンドの後悔を証明した。
結果は、報酬関数とコスト関数がどちらも非線形である場合に拡張する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:32:02 GMT)
Versatile Cardiovascular Signal Generation with a Unified Diffusion Transformer [41.1] 低品質な信号を再構成し、記録されていない信号を合成するマルチモーダル拡散変換器UniCardioを提案する。
心臓血管信号の相補的な性質を生かして、UniCardioは、近年のタスク固有のベースラインよりも明らかに優れている。
これらのアドバンテージは、UniCardioをAI支援ヘルスケアの前進のための有望な道と位置づけている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:53:43 GMT)
WorldWeaver: Generating Long-Horizon Video Worlds via Rich Perception [41.0] 現在の手法は主にRGB信号に依存しており、長い時間にわたってオブジェクト構造や動きに誤差が蓄積される。
我々は,RGBフレームと知覚条件を協調的にモデル化する,長期ビデオ生成のための堅牢なフレームワークであるWorldWeaverを紹介した。
まず、統合表現から知覚条件と色情報を共同で予測することにより、時間的一貫性と動きのダイナミクスを著しく向上させる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:57:33 GMT)
Classification errors distort findings in automated speech processing: examples and solutions from child-development research [40.7] 子どもの言語経験に対する兄弟関係の影響を含め,アルゴリズム的誤りが重要な科学的問題に与える影響について検討した。
自動アノテーションは, 成人入力に対する兄弟姉妹の負の効果を20~80%過小評価し, 統計的に有意な閾値以下である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:02:13 GMT)
A Practical Guideline and Taxonomy to LLVM's Control Flow Integrity [40.5] Control Flow Integrity (CFI)は、このエクスプロイトパスを緩和するために勢いを増している。
LLVMのフォワードエッジCFI変異体をメモリ破損脆弱性クラスにマッピングする分類法を確立した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:23:24 GMT)
Vulnerabilities in AI-generated Image Detection: The Challenge of Adversarial Attacks [39.5] FPBAはブラックボックス攻撃を成功させることができるので、敵攻撃はAIGI検出器にとって真の脅威であることを示す。
我々はこの手法を周波数ベースのポストトレインベイズアタック (FPBA) と呼ぶ。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:31:34 GMT)
LiveMCP-101: Stress Testing and Diagnosing MCP-enabled Agents on Challenging Queries [38.6] 提案するLiveMCP-101は,リアルタイムクエリを慎重にキュレートした101のベンチマークである。
実験により、フロンティアのLLMでさえ60%未満の成功率を達成することが示された。
LiveMCP-101は現実世界のエージェント能力を評価するための厳格な標準を設定している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:55:54 GMT)
PyTOD: Programmable Task-Oriented Dialogue with Execution Feedback [38.3] 本稿では,対話状態を追跡するための実行可能なコードを生成するエージェントであるPyTODについて述べる。
実験の結果、PyTODは対話が進むにつれて、精度と堅牢なユーザ目標推定の両方において、強いベースラインを超えていることがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:22:57 GMT)
Quantum Simulation of Electron Energy Loss Spectroscopy for Battery Materials [38.1] 動的構造因子(DSF)を計算するための量子アルゴリズムとエンドツーエンドシミュレーションフレームワークを提案する。
本稿では,電子エネルギー損失分光法(EELS)のコアレベル電子励起系におけるシミュレーションに適用する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:01:16 GMT)
Constrained Random Phase Approximation: the spectral method [37.7] スペクトルcRPA(s-cRPA)と呼ばれる新しい制約付きランダム位相近似(cRPA)法を提案する。
3d殻充填量の変化により,ScandiumおよびCuのcRPA法と比較した。
S-cRPAは、常に大きなHubbard$U$インタラクション値を得る。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:51:49 GMT)
Referring Expression Instance Retrieval and A Strong End-to-End Baseline [37.5] テキスト画像検索は、画像レベルの記述に基づいてギャラリーからターゲット画像を取得する。
Referring Expressionは、インスタンスレベルの記述を使用して、所定のイメージ内でターゲットオブジェクトをローカライズする。
我々は、インスタンスレベルの検索とローカライゼーションの両方をサポートする textbfReferring Expression Instance Retrieval (REIR) という新しいタスクを導入する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:45:48 GMT)
Recall-Extend Dynamics: Enhancing Small Language Models through Controlled Exploration and Refined Offline Integration [37.3] textitunderlineRecall-textitunderlineExtend textitunderlineDynamics(RED): Controled ExplorationとRefined Offline Integrationによる小さな言語モデルの強化。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:55:10 GMT)
Spiking Variational Graph Representation Inference for Video Summarization [37.3] 本稿では,情報密度を高め,計算複雑性を低減するスパイキング変動グラフ(SpiVG)ネットワークを提案する。
まず、SNNのイベント駆動機構を利用して、スパイキングニューラルネットワーク(SNN)に基づく抽出器を設計し、自律的に学習する。
マルチチャネル機能融合時に発生する不確実性とノイズに対処するための変分推論再構成モジュールを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:25:42 GMT)
VideoEraser: Concept Erasure in Text-to-Video Diffusion Models [37.2] VideoEraserはトレーニング不要のフレームワークで、T2V拡散モデルが望ましくない概念でビデオを生成するのを防ぐ。
VideoEraserは、有効性、完全性、忠実性、堅牢性、一般化性に関する先行手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:15:18 GMT)
RadReason: Radiology Report Evaluation Metric with Reasons and Sub-Scores [37.2] 放射線学報告のための新しい評価フレームワークRadReasonを紹介する。
6つの臨床的に定義されたエラータイプにまたがって、きめ細かいサブスコアを出力する。
また、スコアの背景にある根拠を説明する人間可読な正当性も生み出す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:34:30 GMT)
Towards Scalable and Interpretable Mobile App Risk Analysis via Large Language Models [37.0] モバイルアプリケーションのマーケットプレースでは,セキュリティリスクの特定と軽減のためにアプリを審査する責任がある。
現在の審査プロセスは労働集約的であり、半自動化ツールによって支援されるセキュリティ専門家による手動分析に依存している。
リスクの自動識別とプロファイリングにLarge Language Models(LLM)を利用するシステムであるMarsを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:33:13 GMT)
RETAIL: Towards Real-world Travel Planning for Large Language Models [36.8] 明示的なクエリをカバーしながら、暗黙的なクエリの意思決定をサポートする新しいデータセット textbfRETAIL を提案する。
また、環境意識が現実のシナリオで計画の実現性を確保すると同時に、オールインワンの旅行計画に詳細なPOI情報を組み込むことも可能である。
実験の結果,最強の既存モデルでさえ11.0%のパス率しか達成していないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:08:38 GMT)
Waver: Wave Your Way to Lifelike Video Generation [36.4] Waverは、統合画像およびビデオ生成のための高性能基盤モデルである。
同時に、単一の統合フレームワーク内で、テキスト・トゥ・ビデオ(T2V)、画像・トゥ・ビデオ(I2V)、テキスト・トゥ・イメージ(T2I)生成をサポートする。
ウェーバーは複雑な動きを捉え、ビデオ合成において優れた動き振幅と時間的一貫性を達成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:56:10 GMT)
JEDI-linear: Fast and Efficient Graph Neural Networks for Jet Tagging on FPGAs [36.2] グラフニューラルネットワーク (GNN) は、CERN High Luminosity Large Hadron Collider (HLLHC) において、ジェットタグの異常な性能を示した。
本稿では,線形計算複雑性を持つ新しいGNNアーキテクチャであるJEDI-linearを提案する。
これは60ns未満のレイテンシを達成した初めてのインタラクションベースのGNNであり、現在はHL-LHC CMS Level-1トリガシステムで使用される要件を満たしている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:40:49 GMT)
Evaluation Guidelines for Empirical Studies in Software Engineering involving LLMs [36.2] 大規模言語モデル(LLM)は、ソフトウェア工学(SE)の研究と実践にますます統合されている。
我々は,この領域を包括するコミュニティの取り組みとして,LCMに基づく研究タイプの分類学と8つのガイドラインを紹介した。
このガイドラインは、研究プロセス全体を通して望まれる(すべき)基準と同様に、必須(必須)基準を示し、透明性を目標とする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:30:30 GMT)
ThinkTuning: Instilling Cognitive Reflections without Distillation [35.6] テストタイムスケーリングの最近の進歩は、自己回帰行動と多段階推論を示すLLMの出現につながっている。
そもそもそのような思考行動を示しないモデルを、どうやってトレーニングすればいいのか?
本研究では,GRPOに基づく対話型学習手法であるThinkTuningを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:17:25 GMT)
Low-dimensional embeddings of high-dimensional data [35.0] 低次元埋め込みアルゴリズムは、データの可視化、探索、分析のための低次元表現、または埋め込みを生成する。
多くの埋め込みアルゴリズムが開発され、研究や産業で広く使われている。
このレビューは、最近の開発の概要を詳述し、低次元埋め込みの作成と利用のベストプラクティスのリストを作成し、さまざまなデータセットに対する一般的なアプローチを評価し、残りの課題と、この分野におけるオープンな問題について議論する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:23:15 GMT)
AeroDuo: Aerial Duo for UAV-based Vision and Language Navigation [34.6] 航空ビジョン・アンド・ランゲージナビゲーション(Aerial Vision-and-Language Navigation、VLN)は、無人航空機(Unmanned Aerial Vehicles、UAV)が自然言語命令と視覚的手がかりを用いて屋外環境をナビゲートすることを可能にする新しいタスクである。
我々はDuAl-VLN(DuAl-VLN)と呼ばれる新しいタスクを導入する。
このタスクでは、2つのUAVが異なる高度で運用される: 広範囲の環境推論に責任を負う高高度UAVと、正確なナビゲーションを行う低高度UAVである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:43:35 GMT)
An Enhanced Audio Feature Tailored for Anomalous Sound Detection Based on Pre-trained Models [34.6] Anomalous Sound Detection (ASD) は、機械から異常音を特定することを目的としている。
異常位置の不確かさと機械音のノイズなどの余分な情報により、ASDシステムの性能が向上する。
本稿では,各周波数帯に対して等間隔に分散したフィルタバンクを用いた新しい音声特徴量を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:04:08 GMT)
IPIGuard: A Novel Tool Dependency Graph-Based Defense Against Indirect Prompt Injection in LLM Agents [33.8] 大規模言語モデル(LLM)エージェントは現実世界のアプリケーションに広くデプロイされており、複雑なタスクのために外部データを検索し操作するためのツールを活用している。
信頼できないデータソースと対話する場合、ツールレスポンスには、エージェントの動作に秘密裏に影響を与え、悪意のある結果をもたらすインジェクションが含まれている可能性がある。
我々はIPIGuardと呼ばれる新しい防御タスク実行パラダイムを提案し、ソースにおける悪意あるツール呼び出しを防止する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:08:16 GMT)
From Linearity to Non-Linearity: How Masked Autoencoders Capture Spatial Correlations [33.5] Masked Autoencoders (MAE) は視覚基礎モデルのための強力な事前学習技術として登場した。
本研究では,MAEが入力画像の空間的相関をいかに学習するかを検討する。
線形MAEで学習した特徴を解析的に導出し、マスキング比とパッチサイズを用いて、短距離空間相関と長距離空間相関を捉えることができることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:52:12 GMT)
Deep Think with Confidence [33.2] 私たちはDeep Think with Conf(DeepConf)という,テスト時の推論効率とパフォーマンスを両立させる,シンプルかつ強力な手法を紹介します。
DeepConfはモデル内部信頼信号を利用して、生成時または生成後の低品質な推論トレースを動的にフィルタリングする。
我々は、さまざまな推論タスクと、Qwen 3やGPT-OSSシリーズを含む最新のオープンソースモデルでDeepConfを評価した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:48:38 GMT)
Mind and Motion Aligned: A Joint Evaluation IsaacSim Benchmark for Task Planning and Low-Level Policies in Mobile Manipulation [31.9] Kitchen-Rは、シミュレーションされたキッチン環境内でタスク計画と低レベル制御の評価を統合するベンチマークである。
アイザック・シムシミュレーターを使ってデジタル双生児として開発されたKitchen-Rは、移動式マニピュレータロボットをサポートしている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:48:51 GMT)
Large Language Models Encode Semantics in Low-Dimensional Linear Subspaces [31.4] 大規模言語モデル(LLM)の潜在空間幾何を理解することは、それらの振舞いとアライメントの鍵となる。
我々は6つの科学的トピックにわたる11の経験的モデルで大規模な研究を行っている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:55:26 GMT)
Effective programming of a photonic processor with complex interferometric structure [31.1] 非従来型アーキテクチャで再構成可能なフォトニック回路を用いて実装した変換のプログラミングを成功例として示す。
我々は、異なる初期データセットに依存した2つのアルゴリズムを用いて、複雑な干渉計の回路モデルを再構成し、必要なユニタリ変換をプログラムする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:31:20 GMT)
Conformalized Exceptional Model Mining: Telling Where Your Model Performs (Not) Well [31.0] 本稿では,新しいフレームワークであるConformalized Exceptional Model Miningを紹介する。
コンフォーマル予測の厳密さと例外モデルマイニングの説明力を組み合わせる。
我々は、共形予測の厳密なカバレッジ保証を通じて不確実性を定量化する新しいモデルクラスmSMoPEを開発する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:43:14 GMT)
CMAMRNet: A Contextual Mask-Aware Network Enhancing Mural Restoration Through Comprehensive Mask Guidance [30.9] 壁画のデジタル復元は、複雑な劣化パターンのために固有の課題に直面している。
本稿では,これらの制約に対処するコンテキストマスク対応Mural Restoration NetworkであるCMAMRNetを提案する。
1)Mask-Aware Up/Down-Sampler (MAUDS)。
CMAMRNetは,復元された壁画において,構造的整合性と芸術的細部の両方を効果的に保存し,最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:36:23 GMT)
See Beyond a Single View: Multi-Attribution Learning Leads to Better Conversion Rate Prediction [30.3] コンバージョンレート(CVR)予測はオンライン広告システムの中核的な要素である。
従来のアプローチでは、単一の生産クリティカルな属性メカニズムからラベルへのモデルトレーニングが制限されていた。
本稿では,CVR予測のための新しい多属性学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:05:31 GMT)
WISCA: A Lightweight Model Transition Method to Improve LLM Training via Weight Scaling [30.1] トレーニング効率とモデル品質を向上させるために,WISCAと呼ばれるウェイトスケーリング手法を提案する。
WISCAはコンバージェンス品質を著しく改善することを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:08:22 GMT)
SafeLLM: Unlearning Harmful Outputs from Large Language Models against Jailbreak Attacks [30.0] ジェイルブレイク攻撃は、大規模言語モデルの安全性に深刻な脅威をもたらす。
我々は,新しい非学習型防衛フレームワークであるSafeLLMを提案する。
SafeLLMは高い汎用性能を維持しながら攻撃成功率を大幅に低下させることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:39:14 GMT)
Teuken-7B-Base & Teuken-7B-Instruct: Towards European LLMs [29.9] 本稿では,多言語LLMであるTeuken 7B-baseとTeuken 7B-instructについて述べる。
私たちのモデルは、欧州連合の24の公用語すべてをサポートすることで、ヨーロッパの言語多様性を受け入れます。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:42:41 GMT)
Synthesizing Near-Boundary OOD Samples for Out-of-Distribution Detection [29.6] 我々は,CLIPモデルを微調整するために,基礎モデルを利用して合成・挑戦的なOODデータを生成する新しいアプローチであるSynOODを提案する。
本手法は,MLLMからの文脈的プロンプトによって導かれる反復的インペイントプロセスを用いて,ニュアンス・バウンダリ・アラインなOODサンプルを生成する。
大規模なImageNetベンチマークで最先端のパフォーマンスを実現し、パラメータとランタイムが最小限に増加する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:30:21 GMT)
Coarse-to-Fine Grounded Memory for LLM Agent Planning [29.3] 本稿では,大規模言語モデルを用いた粗大な記憶を基盤とする新しいフレームワークを提案する。
我々の研究は、環境情報を粗い焦点に置き、トレーニングタスクにおける体験収集をガイドする。
推測すると、Oursは計画を支援するためのタスク関連エクスペリエンスとヒントを取得する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:50:23 GMT)
LLM-Driven Self-Refinement for Embodied Drone Task Planning [29.2] SRDroneは産業用ドローンの自己補充作業計画のために設計された新しいシステムである。
継続的状態評価手法を取り入れて、タスクの成果を堅牢かつ正確に決定する。
また、BT(hierarchical Behavior Tree)修正モデルを実装している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:29:01 GMT)
Documenting Deployment with Fabric: A Repository of Real-World AI Governance [29.1] FabricはデプロイされたAIユースケースのリポジトリで、ガバナンスメカニズムを概説している。
本稿では,AI使用の保護に使用される監視機構とガードレールについて論じる。
私たちは、研究者がAIガバナンスの有効性を研究するために、Fabricを拡張可能で進化するツールとして提供するつもりです。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:52:47 GMT)
MMiC: Mitigating Modality Incompleteness in Clustered Federated Learning [29.0] MFL(Multimodal Federated Learning)におけるモダリティの不完全性を緩和するフレームワークであるMMiCを提案する。
MMiCは、欠落したモダリティの影響を軽減するために、クラスタ内のクライアントモデル内の部分パラメータを置き換える。
また、Banzhaf Power Indexを活用して、これらの条件下でのクライアント選択を最適化する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:38:28 GMT)
Adaptive Routing of Text-to-Image Generation Requests Between Large Cloud Model and Light-Weight Edge Model [28.9] RouteT2Iは、ユーザプロンプト毎に大きなクラウドモデルまたは軽量エッジモデルのいずれかを動的に選択する。
RouteT2Iは,高品質な画像生成を維持しながら,大規模クラウドモデルの要求回数を大幅に削減することを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:25:55 GMT)
MeSS: City Mesh-Guided Outdoor Scene Generation with Cross-View Consistent Diffusion [28.8] メッシュモデルは、多くの都市で利用できるようになったが、現実的なテクスチャの欠如により、仮想都市ナビゲーションや自動運転への応用は制限されている。
本稿では,都市メッシュモデルを用いた高品質でスタイル整合な屋外シーンを生成するためのSplat MeSS(Meshbased Scene Synthesis)を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:16:15 GMT)
HypER: Literature-grounded Hypothesis Generation and Distillation with Provenance [28.5] 大規模言語モデルは、科学的領域にわたる研究の構想において有望な性能を示した。
我々は、文学誘導推論とエビデンスベースの仮説生成のために訓練された小さな言語モデルである、$textbfE$xplanation と $textbfR$easoning を用いた $textttHypER$ $textbfHyp$othesis Generation を提示する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:28:50 GMT)
Dirac monopole magnets in non-Hermitian systems [27.5] 理論的には、非エルミート摂動は点のようなディラックモノポールの位相変換を拡張モノポール分布に導く。
断片的断熱的進化を用いて、複雑な幾何学的位相の観測を通してこれらの構成の有効性を確認する。
これらの結果は、ディラック単極電荷分布を理解し、非エルミート系における複素幾何位相を測定するためのマイルストーンを確立する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:47:07 GMT)
FastMap: Revisiting Structure from Motion through First-Order Optimization [26.9] 我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
我々は,FastMapがGPUアクセラレーションでCOLMAPやGLOMAPよりも最大10倍高速であり,ポーズ精度が同等であることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:12:14 GMT)
Self-Guided Function Calling in Large Language Models via Stepwise Experience Recall [26.9] 本稿では,継続的に更新された体験プールから,よりきめ細かなステップワイズ検索を行うステップワイド体験リコール(SEER)を提案する。
ToolQAベンチマークで評価すると、SEERは難しい質問では6.1%、難しい質問では4.7%の平均的な改善を達成している。
Qwen2.5-7BとQwen2.5-72Bのモデルにより、SEERはそれぞれ7.44%と23.38%の精度向上を示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:56:38 GMT)
Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction [26.8] 既存の手法では、事前定義されたスキームへの依存、計算の非効率性、追加のセマンティック入力への依存など、課題に直面している。
スパーススライス間の複雑で非時間的関係を捉えることができる,データ駆動型潜在性補間拡散(CaLID)フレームワークを提案する。
第2に,潜伏空間で動作し,24倍の3次元ハートアップサンプリングを高速化し,計算時間を短縮する計算効率のよい手法を設計する。
第3に,提案手法を2D+Tデータに拡張し,時間的コヒーレンスを効果的にモデル化する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:25:21 GMT)
Identity and Quantify Various Dissipation Mechanisms of Josephson Junction in Superconducting Circuits [26.7] 接合組込み共振器(JER)をジョセフソン接合(JJ)の様々な消散機構の同定と定量化を可能にするプラットフォームとして実証する。
JER は 1/2 ラムダ伝送線路共振器の中央に JJ を埋め込むことで構築される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:21:59 GMT)
SurgWound-Bench: A Benchmark for Surgical Wound Diagnosis [26.6] SurgWoundは、さまざまな種類の外科的創傷を特徴とする、最初のオープンソースデータセットである。
SurgWoundをベースとして,外科的創傷診断のための最初のベンチマークを紹介する。
外科的創傷診断のための3段階学習フレームワークWoundQwenを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:00:17 GMT)
REG4Rec: Reasoning-Enhanced Generative Model for Large-Scale Recommendation Systems [26.6] シーケンシャルレコメンデーションは,大規模レコメンデーションシステムにおけるユーザの次の行動を予測することを目的としている。
近年の研究では、ジェネレーティブレコメンデーションに推論プロセスを導入し、レコメンデーションパフォーマンスを大幅に改善している。
これらのアプローチは項目意味表現の特異性によって制約される。
本稿では,複数の動的意味論的推論経路を構成する推論強化生成モデルREG4Recを紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:02:51 GMT)
Beyond Transcription: Mechanistic Interpretability in ASR [26.6] 解釈可能性の手法は、特に大規模言語モデルの文脈において、近年大きな注目を集めている。
我々は,ASRシステムの層間における音響的・意味的情報がどのように進化するかを検証するために,確立された解釈可能性手法を適用し,適用する。
実験の結果,音響表現の奥深くにエンコーダとデコーダの相互作用が繰り返し幻覚や意味的バイアスに関係していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:42:53 GMT)
ReconDreamer-RL: Enhancing Reinforcement Learning via Diffusion-based Scene Reconstruction [26.4] ReconDreamer-RLは、ビデオ拡散前処理をシーン再構成に統合し、強化学習を支援するためのフレームワークである。
ReconDreamer-RLは、衝突率を5倍に下げた模倣学習法よりも優れた、エンドツーエンドの自動運転訓練を改善する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:45:55 GMT)
PickleBall: Secure Deserialization of Pickle-based Machine Learning Models [26.3] バッドアクターは、妥協された機械学習モデルを通じてマルウェアを配信することができる。
マシンラーニングエンジニアは、透過的な安全なロードを提供するツールが必要です。
我々は、機械学習エンジニアがピクルスベースのモデルを安全にロードするのを助けるために、PickleBallを紹介します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:14:45 GMT)
Neuro Symbolic Knowledge Reasoning for Procedural Video Question Answering [26.0] 本稿では、構造化推論を必要とする手続き的タスクに対する質問応答のための新しいベンチマークであるデータセット(Procedural Knowledge Reasoning Question Answering)を紹介する。
データセットは手続き的知識グラフ(PKG)を使用して半自動で構築される。
我々は,ニューラルネットワークを用いて手続き的関係を学習し,LLMを用いた構造化推論のために構成する,知識モジュール学習(KML)と呼ばれるニューロシンボリックアプローチを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:37:59 GMT)
Label Uncertainty for Ultrasound Segmentation [25.7] 医用画像では、放射線医の間でのサーバ間変動は、しばしばラベルの不確実性をもたらす。
我々は、専門家が供給する画素ごとの信頼度値を用いて、AIモデルのラベル付けとトレーニングの両方に新しいアプローチを導入する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:00:21 GMT)
Native Logical and Hierarchical Representations with Subspace Embeddings [25.3] 線形部分空間として概念を埋め込むという新しいパラダイムを導入する。
交叉(接点)や線形和(接点)のような集合論的な操作を自然にサポートする
提案手法は,WordNet上での再構築とリンク予測の最先端化を実現する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:29:17 GMT)
CARFT: Boosting LLM Reasoning via Contrastive Learning with Annotated Chain-of-Thought-based Reinforced Fine-Tuning [25.1] 注釈付きCoTをベースとしたReinforced Fine-Tuningアプローチ,すなわちTheNameを用いたコントラスト学習を提案し,大規模言語モデルの推論性能を向上させる。
提案手法は、利用可能な注釈付きCoTを十分に活用するだけでなく、教師なし学習信号を付加することにより微調整手順を安定化する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:20:47 GMT)
Ask Patients with Patience: Enabling LLMs for Human-Centric Medical Dialogue with Grounded Reasoning [25.1] 大規模言語モデル(LLM)は潜在的な解決策を提供するが、現実の臨床的相互作用に苦慮する。
Ask patients with Patience (APP) は,基礎的推論,透明な診断,人間中心のインタラクションを目的とした多ターンLCMベースの医療アシスタントである。
APPは共感的対話を通じてユーザ症状を誘発することでコミュニケーションを強化し、アクセシビリティとユーザエンゲージメントを大幅に改善する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:41:50 GMT)
Ontology-Guided Reverse Thinking Makes Large Language Models Stronger on Knowledge Graph Question Answering [24.8] Ontology-Guided Reverse Thinking (ORT)は、目的から条件への推論パスを構築する新しいフレームワークである。
ORT は,(1) LLM を用いて目的ラベルと条件ラベルを抽出し,(2) KG オントロジーに基づくラベル推論経路を構築し,(3) ラベル推論経路を用いて知識検索を行う。
WebQSPとCWQデータセットの実験は、ORTが最先端のパフォーマンスを達成し、KGQAのためのLLMの能力を大幅に向上することを示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:32:57 GMT)
Continual Neural Topic Model [24.2] 継続的な学習では、以前に学んだことを忘れずに新しいタスクを学習することを目的としている。
本研究では,これまでに何を学んだかを忘れずに連続的にトピックモデルを学習する連続ニューラルトピックモデル(Continuous Neural Topic Model,CoNTM)を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:36:53 GMT)
Position Bias Mitigates Position Bias:Mitigate Position Bias Through Inter-Position Knowledge Distillation [24.1] 位置バイアス(PB)は、長文理解と処理能力を損なう。
textbfPos2Distillは、知識蒸留の枠組みを位置決めする位置にある。
Pos2Distillは、有利な位置からあまり好ましくない位置へ優れた機能を転送することで、大きなパフォーマンスギャップを減らします。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:54:04 GMT)
Robust Sparse Mean Estimation via Incremental Learning [24.1] 本稿では, 部分的に破損したサンプルの集合から$k$-sparse平均を推定することを目的とした, 頑健なスパース平均推定の問題を提案する。
これは$k$の知識なしで動作し、リアルタイムとメモリで動作する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:32:57 GMT)
Select to Know: An Internal-External Knowledge Self-Selection Framework for Domain-Specific Question Answering [23.8] 大規模言語モデル(LLM)は一般的なQAではうまく機能するが、ドメイン固有のシナリオではしばしば苦労する。
Selct2Know(S2K)は,ドメイン知識を内部的・外部的知識自己選択戦略によって内部化する,費用対効果の高いフレームワークである。
医学的、法的、財務的なQAベンチマークの実験は、S2Kが既存の方法より一貫して優れていることを示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:53:35 GMT)
Near-Optimal Sparse Allreduce for Distributed Deep Learning [23.6] コミュニケーションのオーバーヘッドは、大規模なディープラーニングモデルを大規模にトレーニングする上で、大きな障害のひとつです。
本稿では,スパース勾配を用いた分散トレーニング手法であるO$k$-Top$k$を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:07:29 GMT)
Chimera: Efficiently Training Large-Scale Neural Networks with Bidirectional Pipelines [23.6] 本稿では,大規模モデルを効率的に学習するための双方向パイプラインを組み合わせた新しいパイプライン並列化手法であるChimeraを提案する。
最新の同期パイプラインアプローチと比較して、Chimeraはバブルの数を最大50%削減する。
Piz Daintスーパーコンピュータの2,048のGPUノード上で動作する13億のパラメータを持つGPT-2モデルにおいて、Chimeraは、最先端の同期および非同期パイプラインアプローチよりも1.16x-2.34xのトレーニングスループットを改善する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:57:33 GMT)
The Devil is in the EOS: Sequence Training for Detailed Image Captioning [23.5] シーケンス終端トークンに対するバイアスは、クロスエントロピートレーニング中に導入される。
本稿では,EOSトークンを早期に予測するモデルの傾向を劣化させる教師なし手法を提案する。
その結果, 幻覚率の上昇は期待できるものの, キャプション長と関連する詳細が有意に増加したことが示唆された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:46:42 GMT)
VIBE: Video-to-Text Information Bottleneck Evaluation for TL;DR [23.1] 現在の視覚言語モデル(VLM)は冗長で冗長な出力を生成し、タスクのパフォーマンスを阻害する。
既存のビデオキャプション評価は、コストのかかる人間のアノテーションに依存し、下流タスクにおける要約の実用性を見落としている。
VIBEは2つのメトリクスを使ってVLM出力をスコア付けする。
VIBEは、ランダムにサンプリングされたVLM出力から、2つのスコアにランク付けして、効果的な人的意思決定を支援する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:50:45 GMT)
Distributed Shared Layered Storage Quantum Simulator: A novel quantum simulation system for efficient scaling and cost optimization [23.1] 本稿では,分散層共有ストレージ量子シミュレータ(SQS)を提案する。
複数の計算ノードがデータストレージを直接共有する革新的な分散アーキテクチャを利用することで、DSLSQSは分散システムにおける東西のデータフローを効果的に排除する。
このシステムは、高価な高性能メモリの使用を減らし、シミュレーションコストを大幅に削減する階層ストレージ技術を採用している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:19:10 GMT)
Text-Driven 3D Hand Motion Generation from Sign Language Data [22.9] 我々の目標は、自然言語記述に基づく3次元手の動きの生成モデルを訓練することである。
大規模な手話ビデオデータセットと、ノイズの多い擬似アノテーション付き手話カテゴリを利用する。
このデータにより、テキスト条件付き手動拡散モデルHandMDMのトレーニングが可能になる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:02:47 GMT)
A mathematical perspective on Transformers [22.7] 相互作用する粒子系として解釈したトランスフォーマーを解析するための数学的枠組みを開発する。
本研究は、基礎となる理論を探求し、数学者だけでなく計算機科学者にも新たな視点を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:31:09 GMT)
Comp-X: On Defining an Interactive Learned Image Compression Paradigm With Expert-driven LLM Agent [22.5] Comp-Xは,大規模言語モデル(LLM)エージェントの印象的な推論能力によって強化された,初めてのインテリジェントな画像圧縮パラダイムである。
提案したComp-Xは,効率よくコーディング要求を理解でき,テキスト対話機能を実現することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:09:30 GMT)
MedResearcher-R1: Expert-Level Medical Deep Researcher via A Knowledge-Informed Trajectory Synthesis Framework [22.2] 汎用的なディープリサーチエージェントは、主要なプロプライエタリなシステムによって証明されているように、医療領域の課題に苦しむ。
2つのコアイノベーションを通じてこれらの課題に対処する医療深層研究エージェントを提示する。
本手法は12の専門分野にまたがる2100以上の多様な軌道を生成し,それぞれが平均4.2のツールインタラクションを発生させる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:29:42 GMT)
Partially Decentralized Multi-Agent Q-Learning via Digital Cousins for Wireless Networks [22.0] 協調分散型無線ネットワークのための新しいマルチエージェントMEMQ(M-MEMQ)を提案する。
非協調状態においては、TXは個々のコストを最小化し、局所的なQ-関数を更新するために独立に作用する。
M-MEMQは、平均ポリシーエラー(APE)が60%低く、収束が40%速く、ランタイムの複雑さが45%減り、サンプルの複雑さが40%減る。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:54:02 GMT)
Saving for the future: Enhancing generalization via partial logic regularization [21.8] 視覚分類タスクにおいて、一般化は依然として重要な課題である。
近年のアプローチでは、一般化を強化するために論理ベースの正則化が採用されているが、完全に定義された論理式の必要性に縛られている。
本稿では、未定義論理式に対してモデルが空間を予約できるような、新しい部分論理正規化項であるPL-Regを紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:27:33 GMT)
Learning Protein-Ligand Binding in Hyperbolic Space [21.4] HypSeekは、タンパク質ポケットと配列をローレンツモデル双曲空間に埋め込む、双曲表現学習フレームワークである。
双曲空間の指数幾何学と負曲率を活用することで、HypSeekは表現的で親和性に敏感な埋め込みを可能にする。
本モードでは,仮想スクリーニングと親和性ランキングを一つのフレームワークに統合し,タンパク質誘導型3towerアーキテクチャを導入する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:56:25 GMT)
The Complexity Dynamics of Grokking [21.1] メモリ化時に複雑性が上昇し、ネットワークが一般化するより単純な基盤パターンを発見すると、ネットワークは崩壊する。
我々は,複雑性尺度と一般化境界との明確な関係を確立し,損失圧縮と一般化の関係の理論的基盤を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:59:05 GMT)
Diverse Signer Avatars with Manual and Non-Manual Feature Modelling for Sign Language Production [20.8] 提案モジュールは,異なる民族背景を持つ参照イメージをシームレスに使用し,多様性を確保するとともに,言語内容の保存を確実にすることを示す。
YouTube-SL-25手話データセットの実験は、我々のパイプラインが最先端の手法よりも優れた視覚的品質を達成することを示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:16:32 GMT)
Retrieval-Augmented Review Generation for Poisoning Recommender Systems [20.8] 本稿では,高品質な偽ユーザプロファイルを生成するために,RAGANという新しい実用的な攻撃フレームワークを提案する。
RAGANは最先端の中毒攻撃性能を達成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:25:22 GMT)
RESfM: Robust Deep Equivariant Structure from Motion [20.5] マルチビュー・ストラクチャー・オブ・モーション(Multiview Structure from Motion)は、コンピュータビジョンの基本的な問題である。
本稿では,複数ビューのinlier/outlier分類モジュールを追加することで,外乱処理に適したアーキテクチャを提案する。
実験により,本手法が現実的な環境でうまく適用可能であることが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:35:20 GMT)
RATopo: Improving Lane Topology Reasoning via Redundancy Assignment [20.3] レーントポロジ推論は自動運転において重要な役割を果たす。
レーントポロジー推論のための冗長割当て戦略であるRATopoを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:06:02 GMT)
Adversarial Attacks against Neural Ranking Models via In-Context Learning [20.1] 本稿では,Few-Shot Adversarial Prompting (FSAP)を紹介した。
FSAPは、数発のプロンプトを通じて完全に敵攻撃を定式化し、グラデーションアクセスや内部モデルインスツルメンテーションを必要としない。
TREC 2020と2021 Health Misinformation Tracksの実験では、4つの多様なニューラルネットワークランキングモデルを用いて、FSAPが生成した文書が、信頼できる、事実的正確な文書を一貫して上回ることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:19:00 GMT)
Adversarial Agent Behavior Learning in Autonomous Driving Using Deep Reinforcement Learning [20.0] 自律運転のような安全クリティカルな応用においては、ルールベースのエージェントが適切にモデル化されることが重要である。
本稿では,ルールベースエージェントが障害シナリオを発生させる際の逆挙動を導出する学習ベース手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:38:33 GMT)
Exploiting Policy Idling for Dexterous Manipulation [19.9] 本研究では, アイドリング行動の検出可能性を活用して, 探索と政策改善を通知する方法について検討する。
PIP(Pause-induced Perturbations)は,検出したアイドリング状態に摂動を適用したアプローチである。
シミュレーションされた2つのアームタスクにおいて、この単純なアプローチはテスト時間性能を著しく向上させることができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:52:45 GMT)
UniCoM: A Universal Code-Switching Speech Generator [19.9] Code-Switching (CS) は、1つの話者の発話に含まれる2つ以上の言語間の交替であり、現実世界の会話では一般的である。
高品質で自然なCSサンプルを生成するための新しいパイプラインであるUniCoM(UniCoM)を提案する。
自動音声認識(ASR)と音声テキスト翻訳(S2TT)のための多言語CSコーパスであるコードスイッチングFLEURS(CS-FLEURS)を構築する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:11:21 GMT)
DictAS: A Framework for Class-Generalizable Few-Shot Anomaly Segmentation via Dictionary Lookup [19.8] 対象データに再トレーニングを加えることなく、未確認対象カテゴリの視覚異常を検出するための統合モデルであるDictASを提案する。
D DictASは主に3つのコンポーネントから構成される: 辞書構築 - 通常の参照画像の特徴を使って実辞書のインデックスと内容をシミュレートする。
7つの公開産業および医療データセットの実験により、DictASは最先端のFSAS手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:08:06 GMT)
UnPose: Uncertainty-Guided Diffusion Priors for Zero-Shot Pose Estimation [19.8] UnPoseはゼロショットでモデルなしの6Dオブジェクトのポーズ推定と再構成のためのフレームワークである。
事前訓練された拡散モデルから3Dの先行値と不確実性の推定値を利用する。
6次元ポーズ推定精度と3次元再構成品質の両方において、既存のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:31:04 GMT)
An Empirical Study of Knowledge Distillation for Code Understanding Tasks [19.6] 知識蒸留(KD)は、大きな教師モデルからコンパクトな学生モデルに知識を移すことによって制限に対処する。
本稿では,コード理解タスクにおけるKDの有効性と使用法を体系的に検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:24:48 GMT)
Fair and efficient contribution valuation for vertical federated learning [19.5] フェデレートラーニング(Federated Learning)は、データを共有することなく、分散化されたデータソース間で機械学習モデルをトレーニングするための新興技術である。
本稿では,従来のシェープ値に基づいて,垂直結合シェープ値(VerFedSV)と呼ばれるコントリビューション評価指標を提案する。
We show that VerFedSV satisfed property of fairness but also effective to compute。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:42:53 GMT)
Capturing Stable HDR Videos Using a Dual-Camera System [19.4] 交互露光(AE)パラダイムを用いた高ダイナミックレンジ(AE)ビデオの取得は、単眼カメラによるコスト効率の面で大きな注目を集めている。
ディープニューラルネットワークによって駆動される進歩にもかかわらず、これらの手法は、フレーム間の不整合のため、現実世界のアプリケーションでは時間的フリックの傾向にある。
露光再構成から時間アンカーを分離する学習型HDRビデオ生成ソリューションを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:18:27 GMT)
Self-Supervised Prompt Optimization [19.2] 十分に設計されたプロンプトは、Large Language Model(LLM)推論能力の強化に不可欠である。
既存のプロンプト最適化手法は、地上の真実や人間による外部参照に大きく依存している。
本稿では,閉じたタスクとオープンなタスクの両方に効果的なプロンプトを発見する費用効率のよいフレームワークであるセルフ・スーパービジョン・プロンプト・最適化(SPO)を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:09:13 GMT)
HyperFlexis: Joint Design of Algorithms and Systems for Multi-SLO Serving and Fast Scaling [19.2] 現代の大規模言語モデル(LLM)が提供するシステムは、さまざまな長さ、優先順位、ステージ固有のサービスレベル目標(SLO)を持つ、高度に可変的な要求からの課題に直面している。
我々は,複数のSLO下でのスケジューリングとスケーリングを協調的に最適化するために,アルゴリズムとシステムレベルの革新を統合した統一LLMサービスシステムである textbfHyperFlexis を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:40:20 GMT)
ViT-FIQA: Assessing Face Image Quality using Vision Transformers [18.8] 顔画像品質評価(FIQA)は、顔認識(FR)システムにおける顔画像の有用性を予測することを目的としている。
ViT-FIQAは、学習可能なクオリティトークンを通じてFRに最適化された標準のViTバックボーンを拡張する新しいアプローチである。
挑戦的なベンチマークとCNNとViTベースのアーキテクチャを含むいくつかのFRモデルの実験は、ViT-FIQAが一貫してトップレベルのパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:57:34 GMT)
DeepMEL: A Multi-Agent Collaboration Framework for Multimodal Entity Linking [18.8] Multimodal Entity Linkingは、テキストとビジュアルの言及と、マルチモーダルな知識グラフのエンティティを関連付けることを目的としている。
現状の手法では、不完全文脈情報、粗いクロスモーダル融合、共同言語モデル(LLM)と大規模視覚モデル(LVM)の難しさといった課題に直面している。
マルチエージェント協調推論に基づく新しいフレームワークであるDeepMELを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:24:26 GMT)
MCLPD:Multi-view Contrastive Learning for EEG-based PD Detection Across Datasets [18.4] 本稿では,MLCPDという半教師付き学習フレームワークを提案する。
マルチビューコントラスト事前トレーニングと軽量教師付き微調整を統合して、クロスデータセットPD検出性能を向上させる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:34:07 GMT)
When Audio and Text Disagree: Revealing Text Bias in Large Audio-Language Models [18.2] MCR-BENCHは、LALMが一貫性のない音声テキストペアを提示する際にどのように情報を優先するかを評価するために設計された最初のベンチマークである。
モダリティ間に不整合が存在する場合、LALMはテキスト入力に対して有意なバイアスを示す。
この傾向は、オーディオ中心のタスクのパフォーマンスを著しく低下させ、現実世界のアプリケーションにとって重要な信頼性上の懸念を引き起こす。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:58:24 GMT)
Fast-DDPM: Fast Denoising Diffusion Probabilistic Models for Medical Image-to-Image Generation [18.1] 我々は,トレーニング速度,サンプリング速度,生成品質を同時に向上する,シンプルで効果的なアプローチであるFast-DDPMを紹介した。
1000のタイムステップでイメージデノイザを訓練するDDPMとは異なり、Fast-DDPMは10のタイムステップのみを使用する。
高速DDPMはDDPMよりも優れており、全てのタスクにおける畳み込みネットワークと生成的敵ネットワークに基づく最先端の手法である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:56:13 GMT)
MapKD: Unlocking Prior Knowledge with Cross-Modal Distillation for Efficient Online HD Map Construction [18.0] MapKDは、革新的なTeach-Coach-Student(TCS)パラダイムを備えた、多段階のクロスモーダルな知識蒸留フレームワークである。
本稿では,鳥の目視機能アライメントのためのToken-Guided 2D Patch Distillation (TGPD) と,意味学習指導のためのMasked Semantic Response Distillation (MSRD) の2つを紹介する。
挑戦的なnuScenesデータセットの実験では、MapKDは推論速度を同時に加速しながら、+6.68 mIoUと+10.94 mAPの学生モデルを改善することが示されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:37:18 GMT)
CC-Time: Cross-Model and Cross-Modality Time Series Forecasting [17.7] 時系列予測のためのPLMを用いたクロスモデル・クロスモーダル学習(CC-Time)を提案する。
第1の側面では、CC-Timeは、時系列シーケンスと対応するテキスト記述の両方から、言語モデルにおける時間的依存とチャネル相関をモデル化するために、相互モダリティ学習を取り入れている。
第2の側面では、CC-Timeはさらに、PLMと時系列モデルからの知識を適応的に統合し、より包括的な時系列パターンのモデリングを形成するクロスモデル融合ブロックを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:28:23 GMT)
Mitigating Hallucinations in LM-Based TTS Models via Distribution Alignment Using GFlowNets [17.6] LMベースのTSのためのGFlOwNet誘導分布AlignmenT(GOAT)を提案する。
GOATは大量のリソースや推論コストに頼ることなく幻覚を緩和する。
GOATは,挑戦的なテストケースにおいて50%以上の文字誤り率を減少させ,不確実性を最大58%低下させることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:04:33 GMT)
Generating Negative Samples for Multi-Modal Recommendation [17.5] マルチモーダルリコメンデータシステム(MMRS)は、様々なモダリティの情報を活用してレコメンデーション品質を高める能力によって注目されている。
既存のネガティブサンプリング技術は、しばしばマルチモーダルデータを効果的に活用するのに苦労し、最適以下のパフォーマンスをもたらす。
我々は,マルチモーダルな大言語モデル(MLLM)を用いて,バランスの取れた負のサンプルを生成する新しいフレームワークNegGenを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:54:29 GMT)
Reliable Unlearning Harmful Information in LLMs with Metamorphosis Representation Projection [17.4] 本稿では,機械学習における形態素表現投影(MRP)手法を提案する。
特定のネットワーク層の隠れ状態空間にプロジェクティブ変換を実装することにより,有用な知識を保ちながら有害情報を効果的に除去する。
実験により,本手法は効果的な継続的アンラーニングを可能にし,再学習攻撃に対する防御に成功していることが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:12:09 GMT)
Multi-Object Sketch Animation with Grouping and Motion Trajectory Priors [17.2] GroupSketchは、複数オブジェクトの相互作用と複雑な動きを効果的に扱う、ベクトルスケッチアニメーションの新しい方法である。
提案手法は,高品質で時間的に一貫したアニメーションを生成する上で,既存の手法よりも優れている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:11:28 GMT)
Exact Solutions and Quantum Defect Theory for van der Waals Potentials in Ultracold Molecular Systems [17.2] 等方的ファンデルワールスポテンシャルを持つ2次元および3次元シュリンガー方程式に対して、正確な2次元解を提供する。
準2次元と3次元の両測地に適用可能な解析量子欠陥理論を開発する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:38:09 GMT)
Human-Object Interaction from Human-Level Instructions [17.1] 本研究では、コンテキスト環境におけるオブジェクト操作のための人間とオブジェクトの相互作用を合成する最初の完全システムを提案する。
我々は大規模言語モデル(LLM)を利用して入力命令を詳細な実行計画に解釈する。
従来の作業とは異なり,本システムは全身運動とシームレスに協調して,詳細な指と物体の相互作用を生成できる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:23:55 GMT)
Scalable Equilibrium Propagation via Intermediate Error Signals for Deep Convolutional CRNNs [17.1] Equilibrium Propagation (EP)は、収束性リカレントニューラルネットワーク(CRNN)のために最初に提案された生物学的にインスパイアされた局所学習規則である。
EPは、バックプロパゲーション・スルー・タイム(BPTT)によって計算されたものと密接に一致する勾配を推定し、計算要求を著しく減少させる。
本稿では,中間誤差信号を組み込んだ新しいEPフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:19:30 GMT)
GelSLAM: A Real-time, High-Fidelity, and Robust 3D Tactile SLAM System [17.0] GelSLAMはリアルタイムの3D SLAMシステムで、触覚センサーだけでオブジェクトのポーズを推定する。
従来のクラウドベースのアプローチとは異なり、GelSLAMは触覚から派生した表面正規と曲率を使って、堅牢な追跡とループ閉鎖を行う。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:20:43 GMT)
Inverse Problem Sampling in Latent Space Using Sequential Monte Carlo [17.0] 拡散モデルの潜在空間における連続モンテカルロ(SMC)に基づく新しいサンプリング手法を提案する。
本研究では,追加の補助観測を用いてデータ生成モデルを定義し,逆拡散過程に基づくSMCサンプリングによる後部推論を行う。
ImageNetとFFHQの実証評価は、様々な逆問題タスクにおける競合メソッドよりもLD-SMCの利点を示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:23:36 GMT)
DeepThink3D: Enhancing Large Language Models with Programmatic Reasoning in Complex 3D Situated Reasoning Tasks [17.0] 最近の研究は、大規模な言語モデルを通してツールの使用を促すことで、3D位置推論タスクに対処している。
本稿では,複雑な3次元位置推論タスクにおけるLLMのツール使用量を高めるためにDeepThink3Dを導入する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:28:36 GMT)
Way to Build Native AI-driven 6G Air Interface: Principles, Roadmap, and Outlook [17.0] 本稿では、圧縮と適応という2つのコア特性を中心に構築された、AI駆動のネイティブな空気インターフェースアーキテクチャを提案する。
一方、圧縮により、シンボルレベルの精度よりもタスク関連性に着目し、ソースデータから本質的な意味情報を理解し、抽出することができる。
一方、空気インターフェースは様々なタスク、データタイプ、チャネル条件にまたがるセマンティック情報を動的に伝達し、スケーラビリティと堅牢性を確保することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:11:04 GMT)
MMQ: Multimodal Mixture-of-Quantization Tokenization for Semantic ID Generation and User Behavioral Adaptation [16.8] 本稿では,新しいマルチモーダルトークンをトレーニングする2段階フレームワークであるMMQを提案する。
MMQは多モードのシナジー、特異性、行動適応を統一し、生成的検索と識別的ランキングタスクの両方にスケーラブルで汎用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:15:49 GMT)
EcomMMMU: Strategic Utilization of Visuals for Robust Multimodal E-Commerce Models [16.8] 電子商取引プラットフォームはマルチモーダルデータに富み、製品の詳細を描写するさまざまなイメージを特徴としている。
これらのイメージは、常に製品の理解を高めるのか、それとも、冗長性やパフォーマンスの低下をもたらすことができるのか?
EcomMMMUは、406,190個のサンプルと8,989,510個の画像を持つ、eコマースマルチモーダルマルチタスク理解データセットである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:01:12 GMT)
EvoFormer: Learning Dynamic Graph-Level Representations with Structural and Temporal Bias Correction [16.8] 動的グラフレベルの埋め込みは、ネットワークの構造的進化を捉えることを目的としている。
既存の手法は、構造的訪問バイアスと急激な進化盲点という、2つの重要かつ未調査の課題に直面している。
動的グラフレベルの表現学習に適した進化対応トランスフォーマーフレームワークであるEvoFormerを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:19:54 GMT)
WangchanThaiInstruct: An instruction-following Dataset for Culture-Aware, Multitask, and Multi-domain Evaluation in Thai [16.4] WangchanThaiInstructは、人手による評価と指導のためのタイ語データセットである。
WangchanThaiInstructは,(1)文化的・専門的なタスクにおけるパフォーマンスのギャップを示すゼロショット評価,(2)ネイティブ・インスペクティブの効果を孤立させた指導指導研究の2つの研究を支援する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:54:05 GMT)
Deep Equilibrium Convolutional Sparse Coding for Hyperspectral Image Denoising [16.4] ハイパースペクトル画像(HSI)はリモートセンシングにおいて重要な役割を果たすが、複雑なノイズパターンによって劣化することが多い。
分解されたHSIの物理的特性の確保は、強靭なHSIの分解に不可欠であり、深層展開法が台頭する。
本研究では,局所的空間スペクトル相関,非局所的空間自己相似性,大域的空間一貫性を統一するDeep Equilibrium Convolutional Sparse Coding(DECSC)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:35:11 GMT)
Agoran: An Agentic Open Marketplace for 6G RAN Automation [16.1] Agoranはエージェント型のマーケットプレースで、利害関係者を直接運用ループに持ち込む。
古代ギリシアのアダラに触発され、アゴランは3つの自律的なAI部門に権限を分配した。
ライブデモが公開されています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:56:00 GMT)
Do Cognitively Interpretable Reasoning Traces Improve LLM Performance? [16.0] CoT(Chain-of-Thought)トレースは、回答を生成する前に中間的推論トレースを生成する。
よくあるが、しばしば暗黙的な仮定は、CoTトレースは意味論的に意味があり、エンドユーザに解釈可能であるべきだというものである。
本稿では,LLaMAモデルとQwenモデルの教師付き微調整によるオープンブック質問応答領域におけるこの問題について検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:48:50 GMT)
Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning [15.8] 人間のフィードバックからの強化学習(RLHF)は、信頼できる生成AIモデルを構築する上で重要なステップとなっている。
本研究は、連続時間RLを用いた微動拡散モデルに対する規律付きアプローチを開発することを目的とする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:02:14 GMT)
Text-to-3D Generation using Jensen-Shannon Score Distillation [15.7] 我々はJensen-Shannon divergence(JSD)に基づく有界スコア蒸留目標を導出する。
本稿では,ジェネレーティブ・ディバイサル・ネットワークの理論を活用することで,JSDの実践的な実装を提案する。
T3Benchの実験結果から,本手法は高品質で多様な3Dアセットを創出できることが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:35:04 GMT)
Unplug and Play Language Models: Decomposing Experts in Language Models at Inference Time [15.7] 本稿では,言語モデル内でタスク固有の専門家を動的に識別し,活性化する新しいフレームワークであるDecomposition of Experts(DoE)を紹介する。
DoEは65%のプルーニングレートでx1.73の推論スピードアップを達成し、精度を損なうことなく達成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:04:54 GMT)
Fine-grained Multi-class Nuclei Segmentation with Molecular-empowered All-in-SAM Model [15.6] 分子動力学を用いたオールイン・SAMモデルを提案する。
本モデルでは,(1)分子動力学によるレイアノテータのアノテーション適用による,詳細なピクセルレベルのアノテーションの必要性の低減,(2)特定の意味論を強調するSAMモデルを学習適応化することに焦点を当てた,フルスタックのアプローチを取り入れた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:49:21 GMT)
Test-time Corpus Feedback: From Retrieval to RAG [15.5] Retrieval-Augmented Generation (RAG) は知識集約型NLPタスクの標準フレームワークとして登場した。
ほとんどのRAGパイプラインは、検索と推論を独立したコンポーネントとして扱い、ドキュメントを一度取り出し、さらに相互作用することなく回答を生成する。
情報検索(IR)とNLPのコミュニティにおける最近の研究は、フィードバックを取り入れた適応的検索とランキング手法を導入して、このギャップを埋め始めている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:57:38 GMT)
TrackRec: Iterative Alternating Feedback with Chain-of-Thought via Preference Alignment for Recommendation [15.5] 思考連鎖(CoT)は、レコメンデーションシステム(RS)の複雑な推論タスクにおけるLLMの性能を向上させることが示されている。
RS 用 LLM の推論能力を高めるためのフレームワークである textbfTrackRec を提案する。
TrackRecは、何億人ものユーザーを抱える遅れた広告プラットフォームに展開され、かなりの利益を上げている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:25:31 GMT)
Cequel: Cost-Effective Querying of Large Language Models for Text Clustering [15.2] テキストクラスタリングは、文書の集合を言語的特徴に基づく一貫性のあるグループに自動的に分割することを目的としている。
大規模言語モデル(LLM)の最近の進歩は、高品質な文脈適応型埋め込みを提供することにより、この分野を著しく改善している。
LLMクエリの限られた予算下で正確なテキストクラスタリングを実現するための費用効率のよいフレームワークであるCequelを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:36:11 GMT)
Knowledge-Guided Prompt Learning for Request Quality Assurance in Public Code Review [15.0] 我々は, P ublic Code Review (KP-PCR) のための K nowledge-guided P rompt Learning を提案し, 開発者によるコードレビュー要求品質保証を実現する。
2011-2023年のPCRデータセットの実験結果から,我々のKP-PCRはベースラインより優れていたことが判明した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:33:04 GMT)
Enhancing Novel View Synthesis from extremely sparse views with SfM-free 3D Gaussian Splatting Framework [14.9] 本稿では,SfMフリーな3DGSを用いたカメラのポーズを推定し,非常にスムーズな視点から3Dシーンを再構成する手法を提案する。
提案手法は,PSNRの高度2.75dB改善を極端に軽視条件下で達成し,他の最先端3DGS法よりも優れていた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:25:24 GMT)
Neural reproducing kernel Banach spaces and representer theorems for deep networks [14.9] ディープニューラルネットワークは、適切なカーネルバナッハ空間の再生を定義する。
応用において一般的に用いられる有限アーキテクチャを正当化する代表者定理を導出する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:54:47 GMT)
Optimizing Compilation for Distributed Quantum Computing via Clustering and Annealing [14.7] これらの課題に対処する包括的なコンパイルフレームワークを提案する。
量子回路内の構造パターンを利用して、初期量子ビット配置のクラスタリングと量子ビットマッピングの調整を行う。
本手法は, 基準値と比較して, 目標値の88.40%を最小に削減する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:00:24 GMT)
Influence-driven Curriculum Learning for Pre-training on Limited Data [14.6] 本研究では,従来の人中心難易度尺度を,モデルトレーニング中に観察されたような難易度に対応する指標に置き換えた上で,カリキュラム学習が競争力を持つかどうかを検討する。
私たちのカリキュラムでトレーニングされたモデルは、ランダムにトレーニングされたモデルをベンチマークで10ポイント以上向上させることができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:53:34 GMT)
VLASCD: A Visual Language Action Model for Simultaneous Chatting and Decision Making [14.6] そこで我々は,視覚言語行動モデル(Visual Language Action Model)と呼ばれる並列マルチタスク出力機能を備えた統合学習モデルを提案する。
CARLA自動運転プラットフォーム上でのモデルの評価を行った。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:12:56 GMT)
Identifying and Answering Questions with False Assumptions: An Interpretable Approach [14.6] いくつかの領域において、偽の仮定で質問を特定し、答えることに重点を置いている。
まず,その問題を事実検証に還元する方法について検討する。
そこで我々は,幻覚を緩和するために外部証拠を活用するアプローチを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:24:32 GMT)
StreamMem: Query-Agnostic KV Cache Memory for Streaming Video Understanding [14.5] StreamMemは、ストリーミングビデオ理解のためのクエリに依存しないKVキャッシュメモリメカニズムである。
クエリ非依存のKVキャッシュ圧縮における最先端のパフォーマンスを実現し、クエリ対応圧縮アプローチと競合する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:56:29 GMT)
Let's Measure Information Step-by-Step: LLM-Based Evaluation Beyond Vibes [14.4] 戦略ゲームと情報損失の関連性を利用して, 根拠のないAIシステムの堅牢性について検討する。
我々は,情報理論のメカニズムが対向境界に抵抗するかを解析し,有限サンプル操作を拡張して,有界f-分岐系が攻撃下で維持されることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:52:56 GMT)
MultiRef: Controllable Image Generation with Multiple Visual References [14.3] 本稿では,複数の視覚参照を用いた制御可能な画像生成の課題に焦点をあてる。
990個の実世界のサンプルと1,000個の実世界のサンプルからなる厳密な評価フレームワークであるMultiRef-benchを紹介する。
我々の実験では、最先端のシステムでさえマルチ参照条件付けに苦戦していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:33:41 GMT)
On the Effectiveness of Graph Reordering for Accelerating Approximate Nearest Neighbor Search on GPU [14.3] グラフベースの近似Nearest Neighbor Search (ANNS)は、現代のAIアプリケーションにおいて支配的なパラダイムとなっている。
本稿では,GPU上でのグラフベースのANNSに対するグラフの並べ替え効果について,初めて体系的に検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:50:49 GMT)
DesignCLIP: Multimodal Learning with CLIP for Design Patent Understanding [14.1] 我々は,米国におけるデザイン特許の大規模データセットを用いたデザイン特許アプリケーションのための統合フレームワークであるDesignCLIPを開発した。
DesignCLIPは、特許画像の詳細なキャプションとマルチビュー画像学習を利用して、クラス認識の分類とコントラスト学習を取り入れている。
実験の結果,DesignCLIPはすべてのタスクにおいて,特許ドメインのベースラインモデルとSOTAモデルよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:36:24 GMT)
RefineCoder: Iterative Improving of Large Language Models via Adaptive Critique Refinement for Code Generation [13.8] 本稿では,自己生成コードと外部批判によってモデルを洗練できる適応的批評精細化(ACR)を提案する。
ACRは、コード応答の品質を評価するためのLCM-as-a-Judgeを備えた複合スコアシステムを含む。
我々は、ACRを反復的に適用し、複数のコード生成ベンチマークで連続的な性能改善を実現するRefineCoderシリーズを開発した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:39:55 GMT)
Requirements-Driven Automated Software Testing: A Systematic Review [13.7] この体系的な文献は、要求入力フォーマット、変換技術、生成されたテストアーティファクト、評価方法、一般的な制限の現状を批判的に検証する。
本研究は,機能要件,モデルベース仕様,自然言語フォーマットの優位性に注目した。
テストケース、構造化されたテキスト形式、要求カバレッジは一般的だが、完全な自動化は依然として稀である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:10:56 GMT)
Omni-Video: Democratizing Unified Video Understanding and Generation [13.6] 本報告では,映像理解,生成,および命令ベースの編集のための効率的かつ効果的な統合フレームワークであるOmni-Videoについて述べる。
我々の重要な洞察は、拡散デコーダの入力として使用される連続的な視覚的手がかりを生成するために、既存のマルチモーダル大言語モデル(MLLM)を教えることである。
統合ビデオモデリングシステムの可能性を完全に解き明かすため,いくつかの技術的改善を取り入れた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:44:29 GMT)
Wide-spectrum security of quantum key distribution [13.4] 本稿では,QKDシステムの完全な光スペクトル安全性を実現するために,広帯域セキュリティ評価手法を提案する。
広帯域400〜2300nm, 最大70dBのダイナミックレンジにおいて, 光ファイバー部品の挿入損失を特徴付けるテストベンチを報告する。
本手法はQKDシステムの認証に利用できる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:15:34 GMT)
Multitask Learning with Stochastic Interpolants [13.3] 本研究では,フローと拡散モデルの時間ダイナミクスを広く一般化した確率分布間のマップ学習フレームワークを提案する。
我々は,スカラー時間変数をベクトル,行列,線形演算子に置き換えることで補間を一般化する。
このアプローチにより、タスク固有のトレーニングを使わずに複数のタスクをこなせる汎用的な生成モデルの構築が可能となる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:58:25 GMT)
Bladder Cancer Diagnosis with Deep Learning: A Multi-Task Framework and Online Platform [13.1] 膀胱癌診断の現在の標準である臨床嚢胞内視鏡は、医師の専門知識に大きく依存している。
本研究では,膀胱癌の膀胱内視鏡像からの診断に特化して設計されたマルチタスク深層学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:20:03 GMT)
High-Frequency First: A Two-Stage Approach for Improving Image INR [12.9] Implicit Neural Representations (INR) は、従来のピクセルベースのフォーマットに代わる強力な代替手段として登場した。
重要な課題は、ニューラルネットワークのスペクトルバイアスであり、高周波の詳細を捉えるのに苦労しながら、低周波成分を好む傾向がある。
隣接するソフトマスクは,局所的な変化が強い画素に対して,高い重みを適応的に割り当てる2段階のトレーニング戦略を導入する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:56:36 GMT)
Modeling Long-term User Behaviors with Diffusion-driven Multi-interest Network for CTR Prediction [12.8] 本稿では,DiffuMIN (Diffusion-driven Multi-Interest Network) を提案する。
オンラインA/BテストではDiffuMINが1.52%,CPMが1.10%増加した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:10:01 GMT)
A Unified Framework for Inference with General Missingness Patterns and Machine Learning Imputation [12.8] 本稿では,一般的なZ推定問題に対して有効な統計的推論フレームワークを提供する新しい手法を提案する。
提案した推定器の正規性の理論的保証と重み付き完全ケース解析に対する効率優位性を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:59:59 GMT)
Multi-IaC-Eval: Benchmarking Cloud Infrastructure as Code Across Multiple Formats [12.8] LLM(Large Language Models)に基づくIaC生成と突然変異を評価するための新しいベンチマークデータセットであるMulti-IaC-Benchを提案する。
データセットは、初期IaCテンプレート、自然言語修正要求、およびそれに対応する更新テンプレートを含む三つ組で構成されている。
我々は,Multi-IaC-Bench 上での最先端 LLM の評価を行い,現代 LLM は構文的に有効な IaC の生成において高い成功率 (>95%) を達成できるが,意味的アライメントや複雑なインフラストラクチャパターンの処理には大きな課題が残っていることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:37:18 GMT)
Setup Once, Secure Always: A Single-Setup Secure Federated Learning Aggregation Protocol with Forward and Backward Secrecy for Dynamic Users [12.8] フェデレートラーニング(FL)は、複数のユーザが生データを共有せずに、機械学習モデルを協調的にトレーニングすることを可能にする。
セキュアアグリゲーションプロトコルは、アグリゲーションされた更新のみを公開することで、このリスクを軽減する。
FLトレーニング全体に対して,単一セットアップのみを必要とする新しいセキュアアグリゲーションプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:25:23 GMT)
Survey of Vision-Language-Action Models for Embodied Manipulation [12.6] エンボディード・インテリジェンス・システムは、継続的な環境相互作用を通じてエージェント能力を増強する。
ビジョン・ランゲージ・アクションモデル(Vision-Language-Action model)は、大きな基礎モデルの進歩に触発された、普遍的なロボット制御フレームワークとして機能する。
本調査では,VLAモデルを包括的に検討した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:30:04 GMT)
MuSeD: A Multimodal Spanish Dataset for Sexism Detection in Social Media Videos [12.6] 我々は、TikTokとBitChuteから抽出された11時間分のビデオを$approx$で提供する、Sexism Detectionのための新しいMultimodal Spanishデータセットを紹介した。
視覚情報は、人間とモデルの両方に性差別的コンテンツをラベル付けする上で重要な役割を担っている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:32:08 GMT)
Fin-PRM: A Domain-Specialized Process Reward Model for Financial Reasoning in Large Language Models [12.4] Fin-PRMは、金融タスクの中間的推論ステップを評価するために設計されたドメイン特化トラジェクトリ対応PRMである。
ステップレベルとトラジェクトリレベルの報酬管理を統合し、財務論理に整合した推論トレースのきめ細かい評価を可能にする。
我々は、Fin-PRMが軌道選択品質において汎用PRMと強力なドメインベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:31:11 GMT)
When and What: Diffusion-Grounded VideoLLM with Entity Aware Segmentation for Long Video Understanding [12.4] 我々は,3つの重要なイノベーションを導入することで,制限を克服するビデオLLMであるGrounded VideoDiTを紹介する。
第一に、拡散時間遅延(DTL)エンコーダは境界感度を高め、時間的一貫性を維持する。
第二に、オブジェクト基底表現は、クエリエンティティを局所化された視覚的エビデンスに明示的に結合し、アライメントを強化する。
第三に、離散時間的タイムスタンプトークンを持つ混合トークンスキームは明示的なモデリングを提供し、きめ細かい時間的推論を可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:12:14 GMT)
Decentralized Low-Rank Fine-Tuning of Large Language Models [12.3] 我々は,Low-Rank Adaptation (LoRA)に基づく大規模言語モデル(LLM)のための分散微調整アルゴリズムであるDec-LoRAを提案する。
BERT と LLaMA の実験により,Dec-LoRA は様々な条件下で集中型 LoRA に匹敵する性能を示した。
これらの結果は、分散環境におけるスケーラブルな微調整のためのDec-LoRAの可能性を強調している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:26:39 GMT)
Embodied Long Horizon Manipulation with Closed-loop Code Generation and Incremental Few-shot Adaptation [12.1] 身体的ロングホライゾン操作では、ロボットシステムが視覚や自然言語などのマルチモーダル入力を処理し、それらを実行可能なアクションに変換する必要がある。
近年,大規模言語モデル (LLM) を自然言語を用いてタスクをサブタスクに分解し,事前訓練した低レベルコントローラを誘導する高レベルプランナとしての利用が検討されている。
我々のフレームワークは,LoHoRavens,CALVIN,Franka Kitchen,および乱雑な現実世界設定をまたいだ,30以上の多様かつ不明瞭なロングホライゾンタスクに対して,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:16:40 GMT)
Transduction is All You Need for Structured Data Workflows [12.0] 本稿では,複雑なデータに対する構造的推論と構成的一般化が可能なエージェントベースシステム構築のためのモジュール型フレームワークであるAgenticsを紹介する。
このフレームワークでは、エージェントは論理フローから抽象化され、データ間の論理的変換を可能にするために、内部的にデータタイプに使用される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:35:47 GMT)
STABSim: A Parallelized Clifford Simulator with Features Beyond Direct Simulation [11.9] 量子コンピューティングにおいて,CPUゲートよりも高速なGPU加速安定化器シミュレータを提案する。
次に、T1/T2エラーチャネルにおける非ユニタリティを、ほとんどの物理量子ビットに対してはるかに高速かつ正確な精度でキャプチャする新しいエラーモデルを実装した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:25:25 GMT)
LGMSNet: Thinning a medical image segmentation model via dual-level multiscale fusion [11.8] LGMSNetは、ローカルおよびグローバルなデュアルマルチスケールに基づく、新しい軽量フレームワークである。
計算オーバーヘッドを最小限に抑えて最先端のパフォーマンスを実現する。
4つの目に見えないデータセット上でゼロショットの一般化テストでは、例外的なパフォーマンスを維持している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:54:09 GMT)
Are Checklists Really Useful for Automatic Evaluation of Generative Tasks? [11.8] そこで本研究では,全ての質問に対してチェックリストを使用すべきか,選択的に6つの手法を用いてチェックリストを生成し,その有効性を8つのモデルサイズで評価し,人間の評価と相関するチェックリスト項目を同定する。
分析の結果,ヒトのスコアとの相関が低いチェックリスト項目でさえ,人による評価の不整合性を示す基準を反映することが多かった。
これらの知見は、人的評価と自動評価の両方をガイドする客観的評価基準をより明確に定義する必要性を強調している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:07:45 GMT)
Exploring Scaling Laws of CTR Model for Online Performance Improvement [11.8] CTRモデルは、多くのオンラインパーソナライズされたサービスにおいて、ユーザーエクスペリエンスを改善し、ビジネス収益を高める上で重要な役割を果たす。
まず、モデルグレードとデータサイズにスケーラブルなCTRモデルを構築し、そのモデルに入力された知識をオンラインユーザに提供する軽量モデルに蒸留する。
実験結果から,SUANは優れた性能を示し,モデルグレードとデータサイズにおいて3桁のスケール法則を定めていることがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:41:15 GMT)
VerilogLAVD: LLM-Aided Rule Generation for Vulnerability Detection in Verilog [11.7] We introduced the first graph-aided graph rule generation approach for Verilog vulnerabilities detection。
提案手法は,抽象構文木(AST)から抽出した構文特徴と制御フローデータ依存グラフから抽出した意味情報を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:07:00 GMT)
GenTune: Toward Traceable Prompts to Improve Controllability of Image Refinement in Environment Design [11.5] GenTuneは、デザイナが生成した画像の任意の要素を選択し、それを対応するプロンプトラベルにトレースし、それらのラベルを修正して、正確で一貫した画像のリファインメントをガイドする。
20名のデザイナーによる要約研究で、GenTuneは、迅速な理解、精細化の質、効率、全体的な満足度を著しく改善した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:31:01 GMT)
Exploring the Effect of Explanation Content and Format on User Comprehension and Trust in Healthcare [11.4] 本稿では,QCancerの予測を説明する際に,説明内容と形式がユーザの理解と信頼にどのように影響するかを検討する。
以上の結果から,Occlusion-1の主観的理解と信頼度がSHAPによる説明よりも高いことが示唆された。
他の発見は、内容よりも説明形式が重要な要素であることが多いことを裏付けている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:00:51 GMT)
On Evaluating the Adversarial Robustness of Foundation Models for Multimodal Entity Linking [11.3] 敵攻撃シナリオの相違により,メインストリームMELモデルのロバスト性を総合的に評価する。
5つのデータセットの実験では、LCM-RetLinkはMELの精度を0.4%-35.7%改善している。
この研究は、MELのロバスト性に関する未調査の側面を強調し、最初のMEL逆例データセットを構築し、リリースする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:57:37 GMT)
From Bits to Boardrooms: A Cutting-Edge Multi-Agent LLM Framework for Business Excellence [11.3] BusiAgentは、複雑な企業環境での高度な意思決定にLarge Language Models (LLM)を活用する、新しいマルチエージェントフレームワークである。
BusiAgentは、動的エージェントモデリングのための拡張Continuous Time Markov Decision Process (CTMDP)、協調効率を最適化するための一般化エントロピー尺度、階層的決定プロセスを処理するマルチレベルStackelbergゲームという3つのコアイノベーションを統合している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:08:53 GMT)
Adaptive Experiments Under Data Sparse Settings: Applications for Educational Platforms [10.6] データスパース環境におけるコンテンツ関連意思決定を改善するために、重み付け割り当て確率調整型トンプソンサンプリング(WAPTS)を導入する。
WAPTSは寛大な後悔の原則によって導かれており、将来性のあるコンテンツを探求しながら、学習を加速する最適に近い割り当てを可能にしている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:57:44 GMT)
TripleMixer: A 3D Point Cloud Denoising Model for Adverse Weather [10.6] 逆気象条件は、LiDARベースの知覚モデルに重大な課題をもたらす。
本稿では,空間,周波数,チャネルワイズ処理を統合したポイントクラウドデノナイズネットワークであるTripleMixerを提案する。
大規模な実験により、TripleMixerは最先端のデノイング性能を達成している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:05:53 GMT)
An Empirical Study of Position Bias in Modern Information Retrieval [10.6] 本研究では,情報検索における位置バイアスについて検討する。
モデルは、後から現れる意味的に関連する情報を無視しながら、通過の開始時にコンテンツを過度に強調する傾向がある。
実験により, 関連する情報が通過中に現れると, 密埋モデルとコルバート式モデルが著しく性能劣化することが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:51:03 GMT)
Democratic AI is Possible. The Democracy Levels Framework Shows How It Might Work [10.5] このポジションペーパーでは、事実上「AIを民主化する」には、民主的なガバナンスとAIの整合性が必要だと論じている。
私たちは、民主的なAIが今後どうなるかを探るため、"民主主義レベル"フレームワークと関連するツールを提供しています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:20:07 GMT)
MCA-RG: Enhancing LLMs with Medical Concept Alignment for Radiology Report Generation [10.4] Medical Concept Aligned Radiology Report Generation (MCA-RG) は、視覚的特徴と異なる医療概念を整合させてレポート生成プロセスを強化する知識駆動型フレームワークである。
MCA-RGは、病変関連知識を含む病理バンクと解剖学的記述を持つ解剖バンクという、2つの治療された概念バンクを使用している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:47:04 GMT)
Pragmatic Inference Chain (PIC) Improving LLMs' Reasoning of Authentic Implicit Toxic Language [10.3] PIC (Pragmatic Inference Chain) は認知科学と言語学に新たなプロンプト手法である。
GPT-4o、Llama-3.1-70B-Instruct、DeepSeek-v2.5、DeepSeek-v3の成功率を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:49:45 GMT)
Label Anything: Multi-Class Few-Shot Semantic Segmentation with Visual Prompts [10.3] Few-shotのセマンティックセマンティックセマンティクスは、ラベル付きサンプルの限られた数だけを使用して、未確認のクラスからオブジェクトをセグメントすることを目的としている。
マルチプロンプト・マルチウェイ・複数ショットセマンティックセマンティックセマンティックセグメンテーションのために設計された,新しいトランスフォーマーベースのアーキテクチャであるLabel Anythingを紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:39:31 GMT)
VerifiAgent: a Unified Verification Agent in Language Model Reasoning [10.2] 本稿では,メタ検証とツールベース適応検証の2つのレベルを統合した統合検証エージェントを提案する。
VerifiAgentは推論型に基づいて適切な検証ツールを自律的に選択する。
推論スケーリングに効果的に適用でき、より少ないサンプルとコストでより良い結果が得られる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:49:49 GMT)
First RAG, Second SEG: A Training-Free Paradigm for Camouflaged Object Detection [10.2] カモフラーゲ型物体検出(COD)はコンピュータビジョンにおいて重要な課題である。
既存のアプローチは、しばしば重い訓練と大きな計算資源に依存している。
RAG-SEGはCODを2段階に分離し,粗いマスクをプロンプトとして生成するRAG(Retrieval-Augmented Generation)と,改良のためのSAMベースセグメンテーション(SEG)の2つを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:14:18 GMT)
Architectural Co-Design for Zero-Shot Anomaly Detection: Decoupling Representation and Dynamically Fusing Features in CLIP [10.1] Zero-Shot Anomaly Detection (ZSAD) に適用した場合、VLM(Pre-trained Vision-Language Models) は重要な適応ギャップに直面している。
これらの制限には、特徴表現とクロスモーダルな融合を共同で洗練するアーキテクチャ共同設計フレームワークを通じて対処する。
提案手法はパラメータ効率のよいConv-LoRAアダプタを統合し,局所帰納バイアスを微細な表現に注入し,動的フュージョンゲートウェイ(DFG)を導入する。
多様な産業・医療ベンチマークの実験では、精度と堅牢性が向上し、この相乗的共設計が基礎モデルを密接な知覚タスクに頑健に適応させる上で重要であることを証明している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:10:30 GMT)
Robust Bias Detection in MLMs and its Application to Human Trait Ratings [10.1] 混合モデルを用いてバイアスを定量化するための統計的手法を提案する。
ジェンダーバイアスの新たな問題を、$emphpersonality$と$textitcharacter$ traitsの文脈で探求する。
ALBERTは二分性には偏りがないが、非二分性には最も偏りがあるのに対して、RoBERTa-largeは二分性には最も偏りがあるが、$textitneo$には偏りがない。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:09:19 GMT)
Bidirectional Temporal Information Propagation for Moving Infrared Small Target Detection [10.0] BIRDと呼ばれる,赤外線小ターゲット検出のための双方向時間情報伝搬手法を提案する。
提案手法は最先端の性能を達成するだけでなく,高速な推論速度を示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:17:21 GMT)
ILeSiA: Interactive Learning of Robot Situational Awareness from Camera Input [10.0] 本稿では,カメラ入力とラベリングフレームを安全あるいは危険として利用することで,ロボットの状況認識を教えることに焦点を当てる。
提案手法は,新しい断層の1つの例のみを用いて,既知の断層と新しい断層の両方を確実に検出することができる。
本手法により,次世代のコボットを,容易にセットアップ可能な視覚的リスクアセスメントで迅速に展開することが可能となる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:29:27 GMT)
LLaSO: A Foundational Framework for Reproducible Research in Large Language and Speech Model [9.9] LLaSOは、大規模音声言語モデリングのための、最初の完全にオープンなエンドツーエンドフレームワークである。
LLaSOは、12Mインスタンスの音声テキストアライメントコーパスであるLLaSO-Alignと、13.5Mインスタンスのマルチタスク命令チューニングデータセットであるLLaSO-Instructと、標準化された評価のための再現可能なベンチマークであるLLaSO-Evalの3つの重要なリソースをコミュニティに提供する。
LLaSOは、データ、ベンチマーク、モデルの全スタックをリリースすることによって、研究活動を統一し、LSにおけるコミュニティ主導の進歩を加速するための基礎的なオープンスタンダードを確立する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:20:00 GMT)
Planning with Minimal Disruption [9.7] 多くの計画アプリケーションでは、目標を達成するために初期状態を最小限に修正する計画を見つけることに興味があるかもしれません。
本稿では,これを正式に導入し,行動コストの合計と計画の混乱の両面を協調的に最適化することを目的とした,様々な計画ベースのコンパイルを定義する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:38:17 GMT)
ExBigBang: A Dynamic Approach for Explainable Persona Classification through Contextualized Hybrid Transformer Analysis [9.7] ユーザ中心の設計において、ペルソナ開発は、ユーザの振る舞いを理解し、ニーズを捉え、聴衆をセグメント化し、設計決定を導く上で重要な役割を担います。
ExBigBangは、トランスフォーマーベースのアーキテクチャを用いて、ペルソナ分類のためのリッチなコンテキスト特徴をモデル化するハイブリッドテキストタブラルアプローチである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:45:04 GMT)
Attribution, Citation, and Quotation: A Survey of Evidence-based Text Generation with Large Language Models [9.7] 大規模言語モデルを用いたエビデンスベースのテキスト生成の統一分類法を導入する。
7つの重要次元にわたる評価指標について検討した。
オープンな課題を強調し、将来的な作業に向けた有望な方向性を概説する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:36:35 GMT)
Semantic-Aware Ship Detection with Vision-Language Integration [9.5] リモートセンシング画像における船舶検出は、海洋活動監視、船舶のロジスティクス、環境研究など幅広い用途において重要な課題である。
本稿では,視覚言語モデル(VLM)とマルチスケール適応型スライディングウィンドウ戦略を組み合わせた新しい検出フレームワークを提案する。
我々は3つの明確に定義されたタスクを通じてフレームワークを評価し、その性能を包括的に分析し、複数の視点からSASDを前進させる効果を実証する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:24:52 GMT)
ITL-LIME: Instance-Based Transfer Learning for Enhancing Local Explanations in Low-Resource Data Settings [9.5] LIME(Local Interpretable Model-Agnostic Explanations)は、ブラックボックス機械学習モデルの解釈可能性を向上させる。
LIMEの摂動とサンプリングにおける固有のランダム性は、局所性と不安定性の問題を引き起こす。
本稿では,データ制約環境における説明の忠実さと安定性を高めるための新しいインスタンスベーストランスファーラーニングLIMEフレームワーク(ITL-LIME)を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:04:13 GMT)
Flexible Tool Selection through Low-dimensional Attribute Alignment of Vision and Language [9.4] 柔軟なツール選択は、人間が他の種と区別する複雑な認知能力を反映している。
視覚的ツール認識と言語的タスク理解を橋渡しするために,低次元属性表現を用いたフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:52:25 GMT)
Conditional Cube Attack on Round-Reduced ASCON [9.3] 本稿では,立方体的手法に対する認証暗号textscAsconの安全性の評価を行う。
textscAsconは第3回CAESAR大会の生存者16人のうちの1人である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:17:50 GMT)
Let's Grow an Unbiased Community: Guiding the Fairness of Graphs via New Links [9.3] グラフニューラルネットワーク(GNN)は、さまざまなアプリケーションで大きな成功を収めています。
元のユーザグラフ構造は一般にバイアスを受けているが、新しいリンクを導入することで、これらの既存の構造をバイアスのないものへと導くことを約束している。
フェアネス誘導グラフ上で訓練された下流タスクの公平性を保証するための,FairGuideという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:26:46 GMT)
MoCHA-former: Moiré-Conditioned Hybrid Adaptive Transformer for Video Demoiréing [9.2] カメラのカラーフィルタアレイ(CFA)とディスプレイのサブピクセルの間の周波数エイリアスにより、モワールパターンが引き起こされ、撮影された写真やビデオが著しく劣化する。
MoCHA-formerは、Decoupled Moir'e Adaptive Demoir'eing (DMAD)とSpatio-Temporal Adaptive Demoir'eing (STAD)の2つの主要なコンポーネントから構成される。
モワールの特徴を質的,定量的に分析し,RAWドメインとsRGBドメインをカバーする2つのビデオデータセットを用いて評価した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:00:15 GMT)
"Does the cafe entrance look accessible? Where is the door?" Towards Geospatial AI Agents for Visual Inquiries [9.2] 我々は、世界に関する微妙な視覚空間的問い合わせを理解し、応答できるマルチモーダルAIエージェントであるジオ・ビジュアル・エージェントのビジョンを紹介する。
我々は、ストリートスケープ(Googleストリートビューなど)、場所ベースの写真(TripAdvisor、Yelpなど)、空中画像(衛星写真など)など、地理空間画像の大規模リポジトリを従来のGISデータソースと組み合わせて分析する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:49:52 GMT)
A hybrid-frequency on-chip programmable synthetic-dimension simulator with arbitrary couplings [9.0] 大規模複雑なシミュレーションは任意の結合構成が可能なアーキテクチャを必要とする。
共振器内および共振器間共振器間共振器を併用したハイブリッド周波数合成次元シミュレータアーキテクチャを提案する。
この結果から,任意の結合を持つ大規模複雑なオンチップシミュレータの実現が期待できる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:46:23 GMT)
Exploration of Plan-Guided Summarization for Narrative Texts: the Case of Small Language Models [8.9] 計画誘導要約は、生成した要約を原文に接地することで、小言語モデル(SLM)の幻覚を減らそうとする。
我々は、詳細な詳細をターゲットとした既存の計画誘導ソリューションを分析し、また、より高レベルで物語に基づく計画定式化を提案する。
人間の評価では、計画誘導アプローチは計画によく根ざしているのに対し、計画には要約よりも幻覚が含まれる可能性が高いことが示されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:40:19 GMT)
Communication Efficient LLM Pre-training with SparseLoCo [8.8] 我々は,Large Language Models(LLMs)のための通信効率のよい学習アルゴリズムであるSparseLoCoを紹介する。
SparseLoCoはTop-kスペーシフィケーションと量子化を効果的に利用し、最大1-3%スペーシリティと2ビット量子化の極端な圧縮比に達する。
我々は、SparseLoCoが性能と通信コストの両方で大きな利益をもたらすような、コミュニケーションに制約のあるLLMトレーニング設定を経験的に実証した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:48:19 GMT)
Cross-Modality Masked Learning for Survival Prediction in ICI Treated NSCLC Patients [8.8] 免疫療法を施行した非小細胞肺癌(NSCLC)患者の大規模データセットについて報告する。
本稿では,生存予測の精度向上を目的としたマルチモーダル機能融合のための新しいフレームワークを提案する。
提案手法は,NSCLCサバイバル予測のためのマルチモーダル統合において,既存手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:52:19 GMT)
MLLMRec: Exploring the Potential of Multimodal Large Language Models in Recommender Systems [8.7] 本稿では,MLLM方式のマルチモーダル・レコメンデーション・フレームワークを提案する。
MLLMRecは、最高のベースラインよりも平均38.53%改善して最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:50:00 GMT)
VT-LVLM-AR: A Video-Temporal Large Vision-Language Model Adapter for Fine-Grained Action Recognition in Long-Term Videos [8.7] 本稿では,このギャップを埋めるための新しいフレームワークであるVT-LVLM-AR(Video Large Vision-Language Model Adapter for Action Recognition)を紹介する。
VTEMは生動画を意味豊かかつ時間的に一貫性のある「視覚事象シーケンス」に変換する
このフレームワークは、常に最先端のパフォーマンスを達成し、既存のメソッドを上回ります。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:03:16 GMT)
TrackID3x3: A Dataset and Algorithm for Multi-Player Tracking with Identification and Pose Estimation in 3x3 Basketball Full-court Videos [8.7] 本稿では,3x3バスケットボールシナリオにおけるマルチプレイヤー追跡,プレイヤー識別,ポーズ推定に特化して設計された最初のデータセットを提案する。
データセットは3つの異なるサブセット(室内固定カメラ、屋外固定カメラ、ドローンカメラ)で構成され、さまざまなフルコートカメラの視点と環境をキャプチャする。
そこで本研究では,トラッキングと識別の質を評価するために,Track-IDアルゴリズムと呼ばれるベースラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:41:40 GMT)
On Learning Action Costs from Input Plans [8.7] 入力計画の集合が最適であるような行動の集合のコストを学習する新たな問題を導入する。
ラベルのない入力計画からアクションのコストを学習するアルゴリズムであるLACFIPk$を提示する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:39:45 GMT)
Row-Column Hybrid Grouping for Fault-Resilient Multi-Bit Weight Representation on IMC Arrays [8.4] 本稿では, 停止故障(SAF)による計算の不確実性と, 故障除去アルゴリズムの高いコンパイルオーバーヘッド, すなわちFault-Free(FF)について論じる。
まず,従来の列と列の両方に冗長性を導入することで,従来の列群を一般化する,列列ハイブリッドグループと呼ばれる新しいマルチビット重み表現手法を提案する。
第二に,欠陥認識の重み分解問題をアナログ線形プログラミング(ILP)タスクとして再構成するコンパイラを設計し,既製の解法による高速でスケーラブルなコンパイルを実現する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:05:44 GMT)
Aligning Moments in Time using Video Queries [8.4] ビデオからビデオまでのモーメント検索 (Vid2VidMR) は、クエリービデオを用いて、未確認のイベントやモーメントをターゲットビデオにローカライズするタスクである。
意味的コンテキストをキャプチャするトランスフォーマーモデルであるMATR(Moment Alignment TRansformer)を紹介する。
また,MATRはR@1で13.1%,mIoUで8.1%の顕著な性能向上を実現している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:01:13 GMT)
Is Artificial Intelligence Reshaping the Landscape of the International Academic Community of Geosciences? [8.4] 人工知能(AI)は、近年、AI関連の科学出力が顕著に増加し、地球科学の研究を積極的に変革している。
我々は、開発途上国の地球科学者が、最近のAI for Science(AI4S)パラダイムにおいて、より良い可視性を得たことを観察することを奨励されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:17:24 GMT)
Vector preference-based contextual bandits under distributional shifts [8.2] 分散シフト下での文脈的バンディット学習について考察する。
本稿では,適応的分散化と楽観的排除に基づく政策を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:19:16 GMT)
Towards a 3D Transfer-based Black-box Attack via Critical Feature Guidance [8.1] 本稿では, 対向点雲の伝達性を向上する移動型ブラックボックス攻撃法を提案する。
我々は、損失関数における生成した対向点雲の最大偏差範囲を明示的に制限し、その非受容性を保証する。
ModelNet40とScanObjectNNベンチマークデータセットで実施された実験は、提案されたCFGが最先端の攻撃方法よりも大きなマージンで優れていることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:31:51 GMT)
MSCCL++: Rethinking GPU Communication Abstractions for Cutting-edge AI Applications [8.1] 最新の最先端AIアプリケーションは、急速に進化し、異質で誕生したハードウェアデバイス上で開発されている。
これは、新しいハードウェアからボトムアップの変更を採用するために、AIソフトウェアスタックの頻繁な再作業を必要とする。
分離問題に基づくGPU通信の新たな抽象化であるMSCCL++を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:23:39 GMT)
VocabTailor: Dynamic Vocabulary Selection for Downstream Tasks in Small Language Models [8.0] 小言語モデル(SLM)は資源制約のある環境で計算上の利点を提供する。
SLMのメモリフットプリントのかなりの部分は語彙関連コンポーネントに由来する。
本稿では,新たに分離された動的語彙選択フレームワークであるVocabTailorを紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:32:13 GMT)
A Novel Mutation Based Method for Detecting FPGA Logic Synthesis Tool Bugs [7.9] FPGA論理合成ツールの試験方法であるVERMEIを提案する。
VERMEIは前処理、等価突然変異、バグ識別の3つのモジュールで構成されている。
5ヶ月以内にVERMEIは15のバグをベンダーに報告した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:11:59 GMT)
DyMorph-B2I: Dynamic and Morphology-Guided Binary-to-Instance Segmentation for Renal Pathology [7.8] DyMorph-B2Iは、腎病理に適合した動的、モルフォロジー誘導二元間セグメンテーションパイプラインである。
当社のアプローチでは,統合されたフレームワーク内に流域,骨格化,形態的操作を統合する。
我々の手法は、個々の古典的アプローチとナチ的組み合わせより優れています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:41:07 GMT)
GATES: Cost-aware Dynamic Workflow Scheduling via Graph Attention Networks and Evolution Strategy [7.7] コスト対応の動的スケジューリング(CADWS)はクラウドコンピューティングにおける重要な課題である。
深部強化学習(DRL)は、自動スケジューリングポリシー設計に広く用いられている。
本研究では,グラフアテンションネットワークに基づくポリシーネットワークと,GATESと呼ばれる進化戦略を組み合わせた新しいDRL手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:43:10 GMT)
SecFSM: Knowledge Graph-Guided Verilog Code Generation for Secure Finite State Machines in Systems-on-Chip [7.6] SecFSMは、セキュリティ指向の知識グラフを利用して、よりセキュアなVerilogコードを生成するためにLLMをガイドする新しい方法である。
脆弱性を特定するためのユーザの要件を分析し、要件の脆弱性のリストを取得します。次に、脆弱性リストに基づいてFSKGから知識を取得します。最後に、Verilogコード生成のセキュリティ知識に基づいてセキュリティプロンプトを構築します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:33:03 GMT)
Multi-Cache Enhanced Prototype Learning for Test-Time Generalization of Vision-Language Models [7.5] ゼロショット設定では、テスト時間適応はテストフェーズからのラベルなしデータを用いて事前訓練されたモデルを調整し、未知のテスト分布の性能を向上させる。
本研究は,キャッシュ強化性能とクラス内コンパクト性との正の相関性を明らかにする。
3つのキャッシュを備えたマルチキャッシュ拡張プロトタイプベーステスト時間適応(MCP)を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:13:40 GMT)
Robust and Efficient Quantum Reservoir Computing with Discrete Time Crystal [7.5] 我々は、離散時間結晶力学を貯水池として活用する勾配のない、ノイズロスのない量子貯水池計算アルゴリズムを導入する。
10クラスの分類では、超伝導量子プロセッサのノイズシミュレーションと実験結果の両方が理想的なシミュレーションと一致する。
量子多体非平衡相転移と量子機械学習性能の相関関係を確立する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:40:46 GMT)
SynthCoder: A Synthetical Strategy to Tune LLMs for Code Completion [7.5] コード補完は、ソフトウェア工学における大規模言語モデル(LLM)の顕著な応用である。
本稿では,Fill-in-the-Middle(FIM)コード補完タスクにおける最先端技術を実現するために,業界をリードするプラクティスを統合するモデルであるSynthCoderを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:23:49 GMT)
Transfer Learning for Minimum Operating Voltage Prediction in Advanced Technology Nodes: Leveraging Legacy Data and Silicon Odometer Sensing [7.4] 本稿では, 高精度な5nmノードでのV_min$予測を実現するための新しい転送学習フレームワークを提案する。
提案手法の重要な革新は、オンチップシリコンオドメーターセンサデータから得られる入力特徴の統合であり、局所的なプロセス変動のきめ細かいキャラクタリゼーションを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:13:55 GMT)
The AI Model Risk Catalog: What Developers and Researchers Miss About Real-World AI Harms [7.4] 私たちはHugging Faceから約46万のAIモデルカードを分析し、開発者がリスクを報告する方法を調べました。
我々はこれらを、MITのリスクリポジトリの研究者が特定したリスクと、AIインシデントデータベースの現実世界のインシデントと比較した。
この結果は、設計プロセスの初期段階において、開発者がヒューマンインタラクションやシステム的リスクについて考えるのに役立つ、より明確で構造化されたリスクレポートの必要性を示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:07:41 GMT)
BadFU: Backdoor Federated Learning through Adversarial Machine Unlearning [7.3] フェデレートラーニング(FL)は、分散トレーニングパラダイムとして広く採用されている。
本稿では,フェデレーション・アンラーニングの文脈における最初のバックドア攻撃について述べる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:17:01 GMT)
ASIC-Agent: An Autonomous Multi-Agent System for ASIC Design with Benchmark Evaluation [7.3] 大規模言語モデル (LLM) はレジスタ転送レベル (RTL) の設計において顕著な機能を示した。
LLM自体は、現実世界のハードウェア設計において重大な制限に直面している。
本稿では,デジタルASIC設計タスクに特化して設計された自律システムASIC-Agentについて述べる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:21:34 GMT)
PuzzleClone: An SMT-Powered Framework for Synthesizing Verifiable Data [7.3] PuzzleCloneは、大規模に検証可能なデータのための形式的なフレームワークである。
提案手法は,(1) シードパズルを構造化論理仕様に符号化すること,(2) 体系的変数と制約ランダム化によるスケーラブルな変種を生成すること,(3) 再生機構による有効性を確保すること,の3つの重要なイノベーションを特徴とする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:36:16 GMT)
Towards Reliable and Generalizable Differentially Private Machine Learning (Extended Version) [7.2] 近年,新しい分別プライベート機械学習(DPML)技術を提案する研究が盛んに行われている。
これらの論文は、新しい最先端(SoTA)の結果を達成し、実証的な結果を検証として提供すると主張している。
どのテクニックが最も効果的か、それとも本当に彼らの主張を満足しているかについては合意がない。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:27:06 GMT)
CITE: A Comprehensive Benchmark for Heterogeneous Text-Attributed Graphs on Catalytic Materials [7.1] 触媒材料に対する不均一なテキスト分散引用グラフベンチマークであるCITEを紹介する。
CITEは438Kノードと1.2Mエッジで構成され、4つのリレーショナルタイプにまたがる。
我々は,同種グラフモデル,異種グラフモデル,LLM(Large Language Model)中心モデル,LLM+Graphモデルなど,学習パラダイムの4つのクラスを比較した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:28:19 GMT)
Stabilization of Perturbed Loss Function: Differential Privacy without Gradient Noise [7.0] SPOFは,マルチユーザ環境を対象とした,差分プライベートなトレーニング機構である。
トレーニング中に環境騒音を呈し、ユーザ入力が破損しても安定した性能を維持する。
その結果, DP-SGDと比較して, SPOFの再現精度は最大3.5%向上し, 平均トレーニング時間を57.2%短縮できることがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:54:19 GMT)
NitiBench: A Comprehensive Study of LLM Framework Capabilities for Thai Legal Question Answering [6.8] 本稿では、タイの一般的な金融法を網羅するニチベンチ-CCLと、現実の税法ケースを含むニチベンチ-タックスの2つのデータセットからなるベンチマークであるニチベンチを紹介する。
検索強化世代(RAG)と長文LLMに基づく3つの重要な研究課題に対処するためのアプローチを評価する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:51:12 GMT)
Distributed Detection of Adversarial Attacks in Multi-Agent Reinforcement Learning with Continuous Action Space [6.6] 本研究では,協調型マルチエージェント強化学習と連続行動空間との対向攻撃を検出する問題に対処する。
本稿では,エージェントの局所的な観察のみに依存する分散検出器を提案し,観測可能なエージェントの正常な挙動を統計的に評価する。
我々は,様々な攻撃手法に対して,様々なマルチエージェントPettingZooベンチマークを用いて提案手法の評価を行い,本手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:58:36 GMT)
Dancing with Deer: A Constructional Perspective on MWEs in the Era of LLMs [6.4] 我々は、使用法に基づく構成文法的アプローチの観点から、マルチワード表現を理解する利点を論じる。
本稿では,英語PropBankにおける多語表現のための構築テンプレートを活用したケーススタディについて述べる。
構成的テンプレートを応用した2つ目のケーススタディを、一様意味表現におけるこれらの多形表現に適用する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:42:50 GMT)
GATEBLEED: Exploiting On-Core Accelerator Power Gating for High Performance & Stealthy Attacks on AI [6.4] 我々は、CPUを動作限界内に留めるために使用するアグレッシブパワーゲーティングにより、タイミング側および隠蔽チャネルであるGATEBLEEDを発見した。
GateBLEEDは、従来の保護措置の下でも、ローカルおよびリモートのタイミング推定のリスクを負う。
我々は,Intel AMXに最適化されたトランスモデルに対して,エンド・ツー・エンドのマイクロアーキテクチャ推論攻撃を実装した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:58:12 GMT)
A Survey of Foundation Models for IoT: Taxonomy and Criteria-Based Analysis [6.4] ファウンデーションモデルは、ラベル付きデータへの依存度が低いため、IoT領域への関心が高まっている。
既存の基盤モデルベースのメソッドのほとんどは、特定のIoTタスク用に開発されている。
この調査は、現在の方法論を包括的に概観することで、このギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:53:23 GMT)
Frequency-adaptive tensor neural networks for high-dimensional multi-scale problems [6.3] ニューラルネットワーク(TNN)は、高次元の問題を解決する上で、その優位性を実証している。
TNNは周波数原理の影響を受けており、ソリューションの高周波特性を正確に捉える能力を制限する。
本稿では、複雑なマルチスケール問題の解法におけるTNNの能力を大幅に向上させる周波数適応型TNNアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:16:52 GMT)
Uhlmann and scalar Wilczek-Zee phases of degenerate quantum systems [6.3] ウルマン位相とスカラーWZ位相の関係について検討し、それぞれウルマンホロノミーとWZホロノミーを反映している。
零温度の極限において、ウルマン位相は、ディラック点として表されるハミルトニアンの障害物により、縮退した基底状態のスカラー WZ 位相と一致するか、一致しないかもしれない。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:07:00 GMT)
Privacy in Speech Technology [6.3] 本論文は,音声技術に関するプライバシー問題に関するチュートリアルである。
モデルの脅威、ユーザのプライバシ保護のためのアプローチ、プライバシ保護メソッドのパフォーマンスの測定。
また、改善が緊急に必要となる、さらなる開発のためのラインも提示する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:04:27 GMT)
An Efficient Open World Environment for Multi-Agent Social Learning [6.3] 複数の利己的なエージェントが複雑で独立した目標を追求できる環境を提案する。
この環境は、オープンなマルチエージェント設定における社会的にインテリジェントなAIエージェントの開発を可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:59:20 GMT)
Redundant feature screening method for human activity recognition based on attention purification mechanism [6.2] マルチスケールネットワークに適したMSAPと呼ばれる汎用的な特徴浄化機構を提案する。
この機構は、マルチスケール特徴の重ね合わせによる特徴冗長性を効果的に解決する。
さらに,各ネットワークモジュールの層間をシームレスに統合するネットワーク補正モジュールを設計した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:08:55 GMT)
Multiple Memory Systems for Enhancing the Long-term Memory of Agent [6.2] MemoryBankやA-MEMといった既存の手法は、記憶されているメモリの質が劣っている。
我々は認知心理学理論にインスパイアされた多重記憶システムを設計した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:29:42 GMT)
SemToken: Semantic-Aware Tokenization for Efficient Long-Context Language Modeling [6.2] SemTokenは、トークンの冗長性を低減し、効率を向上させるセマンティック・アウェアなトークン化フレームワークである。
現代の言語モデルや注意促進手法とシームレスに統合することができる。
この結果から,意味構造は大規模言語モデルにおけるトークン化と計算を最適化する上で,有望な新たな軸を提供する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:01:53 GMT)
M-HELP: Using Social Media Data to Detect Mental Health Help-Seeking Signals [6.1] 本稿では,ソーシャルメディア上でのヘルプ検索行動を検出するための新しいデータセットであるM-Helpを紹介する。
このデータセットは、ヘルプサーキング活動だけでなく、特定の精神疾患とその根本原因を特定することで、従来のラベルを越えている。
M-HelpでトレーニングされたAIモデルは、3つの重要なタスクに対処することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:02:36 GMT)
Democratizing AI Development: Local LLM Deployment for India's Developer Ecosystem in the Era of Tokenized APIs [6.1] インドの開発者コミュニティは、商用のLarge Language Model (LLM) APIによる持続的な実験と学習において、大きな障壁に直面している。
本研究は,Ollama を用いたローカル LLM デプロイメントを,開発者中心のアプリケーションを対象とした商用クラウドベースのサービスに代わるものとして実証的に評価する。
ローカルデプロイメントは、商用ソリューションに比べて33%のコスト削減を図りながら、開発や実験においてはるかに大きなハンズオンを可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:56:41 GMT)
Contributions to Label-Efficient Learning in Computer Vision and Remote Sensing [6.1] 本書は,コンピュータビジョンとリモートセンシングにおけるラベル効率学習のトピックに対して,選択されたコントリビューションを提示する。
本研究の中心は,限定的あるいは部分的に注釈付けされたデータから効果的に学習できる手法を開発し,適応することである。
この貢献は方法論的発展とドメイン固有の適応の両方に及び、特に地球観測データに特有の課題に対処する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:31:50 GMT)
Measuring the environmental impact of delivering AI at Google Scale [6.0] 本稿では、AI推論ワークロードのエネルギー使用量、二酸化炭素排出量、水消費量を測定するための包括的な方法論を提案し、実施する。
Googleのソフトウェア効率向上とクリーンエネルギー調達は、エネルギー消費の33倍の削減と、中央値のGemini Appsテキストプロンプトの44倍の炭素フットプリントの削減を1年以上に及んだ。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:22:06 GMT)
Spiders Based on Anxiety: How Reinforcement Learning Can Deliver Desired User Experience in Virtual Reality Personalized Arachnophobia Treatment [5.7] プロシージャコンテンツ生成(PCG)と強化学習(RL)を利用したバーチャルリアリティ露光療法(VRET)の枠組みを提案する。
この治療では、仮想クモを観察する患者が脱感作し恐怖症を減少させる。
より一般的なルールベースのVRET法と比較して,本システムの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:48:29 GMT)
A Case for Specialisation in Non-Human Entities [5.7] 我々は、一般化の落とし穴をレビューし、特殊化システムの産業価値を強調することにより、専門化の事例を作る。
まず, 専門化に対する最も広く受け入れられている議論を概観し, 人的労働の文脈におけるそれらの関連性が, 実際に専門化の議論であるかについて論じる。
第2に,機械学習からコンピュータセキュリティ,社会科学,文化進化に至るまで,専門化を支持する4つの議論を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:41:55 GMT)
The Digital Life of Parisian Parks: Multifunctionality and Urban Context Uncovered by Mobile Application Traffic [5.7] パリをケーススタディとして、アプリごとのモバイルネットワークトラフィックを受動的に収集した大規模なセットを分析します。
分析の結果,公園の周辺環境と周辺環境との違いから,交通信号が特徴的であることが明らかとなった。
これらの結果から,都市緑地機能研究の代行手段としてのモバイルトラフィックの価値が示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:43:42 GMT)
Revisiting Rule-Based Stuttering Detection: A Comprehensive Analysis of Interpretable Models for Clinical Applications [5.7] 本稿では,ルールに基づく散乱検出システムについて包括的な解析を行う。
本稿では,発話速度正規化,マルチレベル音響特徴分析,階層的決定構造を組み込んだルールベースフレームワークを提案する。
規則に基づくシステムは特に延長検出(97~99%の精度)に優れ、様々な発話速度で安定した性能を提供することを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:01:05 GMT)
Bridging Generalization and Personalization in Wearable Human Activity Recognition via On-Device Few-Shot Learning [5.7] 本稿では、まずユーザ間で一般化し、次にデバイス上で直接数ショットの学習を用いて、個々のユーザに対して迅速に適応するハイブリッドフレームワークを提案する。
我々は、エネルギー効率の高いRISC-VベースのGAP9マイクロコントローラ上で、このフレームワークを実装した。
デプロイ後の適応は、それぞれ3.73%、17.38%、および3.70%の一貫性のある精度向上をもたらす。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:08:20 GMT)
CUPE: Contextless Universal Phoneme Encoder for Language-Agnostic Speech Processing [5.5] CUPEは120ミリ秒でキー音素の機能をキャプチャする軽量モデルである。
CUPEは、すべての言語に共通する基本音響パターンを学習することで、競合する言語間性能を実現する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:27:10 GMT)
Scalable Time-Series Causal Discovery with Approximate Causal Ordering [5.4] 時系列データにおける因果発見は、重要な計算上の課題を示す。
VarLiNGAM法は反復探索に依存し、各ステップの後に統計的依存関係を再計算する。
提案アルゴリズムは,標準実装よりも7-13倍の高速化を実現し,GPUアクセラレーション版より4.5倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:56:53 GMT)
UAV-ON: A Benchmark for Open-World Object Goal Navigation with Aerial Agents [5.4] UAV-ONは、オープンワールド環境における航空エージェントによる大規模目標航法(NavObject)のベンチマークである。
多様な意味領域と複雑な空間レイアウトを備えた14の高忠実なUnreal Engine環境で構成されている。
1270のアノテートされたターゲットオブジェクトを定義し、それぞれがカテゴリ、物理フットプリント、視覚ディスクリプタをエンコードするインスタンスレベルの命令によって特徴付けられる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:56:26 GMT)
A Malliavin calculus approach to score functions in diffusion generative models [5.4] 我々は、幅広い非線形拡散生成モデルに対するスコア関数の正確な閉形式式を導出する。
我々の結果は微分方程式のより広範なクラスに拡張することができ、スコアベース拡散生成モデルの開発のための新しい方向を開拓することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:00:24 GMT)
D3FNet: A Differential Attention Fusion Network for Fine-Grained Road Structure Extraction in Remote Perception Systems [5.4] D3FNet(D3FNet)は、リモート認識システムにおける微粒な道路構造セグメンテーションのために設計されたD3FNet(Dual-Stream Differential Attention Fusion Network)である。
DADEモジュールは、ボトルネック時のバックグラウンドノイズを抑制しながら、微妙な道路特性を向上する。
DDFMは、空間的精度と意味的文脈のバランスをとるために、オリジナルとアテンションを変調した特徴を統合している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:12:20 GMT)
Federated Learning on Riemannian Manifolds: A Gradient-Free Projection-Based Approach [5.3] フェデレートラーニング(FL)は、分散クライアント間の協調モデルトレーニングのための強力なパラダイムとして登場した。
既存のFLアルゴリズムは主に、厳密な勾配情報を持つ制約のない最適化問題に重点を置いている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:40:14 GMT)
Improving semi-device-independent randomness certification by entropy accumulation [5.3] 本研究では,いわゆるエントロピー累積定理を用いて,証明可能なランダム性の量を大幅に改善できることを示す。
非信頼測定による半デバイス非依存ランダムネス認証におけるこの改善を実証する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:12:44 GMT)
Learning ECG Representations via Poly-Window Contrastive Learning [5.2] 本稿では,ECG分析のための多ウィンドウコントラスト学習フレームワークを提案する。
遅い特徴分析の原理に触発されて、我々のアプローチは時間的不変性と生理学的に有意な特徴を学習するようモデルに強く促す。
この結果から,マルチラベル・スーパークラス分類において,マルチウィンドウのコントラスト学習が従来の2ビュー手法より一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:26:51 GMT)
EMNLP: Educator-role Moral and Normative Large Language Models Profiling [5.1] 本稿では,EMNLP(Educator-Role Moral and Normative LLMs Profiling framework)を紹介する。
EMNLPは既存のスケールを拡張し、88の教師固有の道徳ジレンマを構築している。
ターゲットソフトプロンプトインジェクションセットは、教師SPのコンプライアンスと脆弱性を評価する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:21:37 GMT)
Lang2Lift: A Framework for Language-Guided Pallet Detection and Pose Estimation Integrated in Autonomous Outdoor Forklift Operation [5.1] Lang2Liftは、自然言語誘導パレット検出と6Dポーズ推定に基礎モデルを活用するフレームワークである。
我々は、ADAPT自律フォークリフトプラットフォーム上でLang2Liftを検証し、現実世界のテストデータセット上で0.76mIoUのパレットセグメンテーション精度を達成した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:28:39 GMT)
On Prior Distributions for Orthogonal Function Sequences [5.0] 本稿では,様々な統計モデルにおいてしばしば必要とされる直交関数列に対する先行分布の新しいクラスを提案する。
我々の手法は、条件付き正規分布の階層的定式化を通じて適応直交制約を課すことにより、先行を逐次的に構成する。
提案手法はベイズ FPCA で採用され、より解釈可能な主関数と効率的な低ランク表現を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:34:20 GMT)
QUPER-MAn: Benchmark-Guided Target Setting for Maintainability Requirements [5.0] 要件エンジニアリングは議論を奨励し、適切な目標を責任ある方法で設定することで、このギャップに対処できると我々は主張する。
本稿では,QUPERモデルの保守性を考慮したQUPER-MAnを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:38:38 GMT)
Quantum error detection in qubit-resonator star architecture [5.0] 並列性と効率的な局所的全接続性を提供する6量子星格子アーキテクチャを導入する。
将来、そのようなスターQPUを利用すれば、高い重み付けと重なり合う安定化器を備えたQEC符号を利用でき、符号化率を向上させることができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:16:33 GMT)
On the need to perform comprehensive evaluations of automated program repair benchmarks: Sorald case study [5.0] 自動プログラム修復(APR)ツールは、静的解析プロファイラによって検出された違反に自動的に対処することで、コード品質を改善することを目的としている。
これまでの研究では、APRツールは違反をクリアする能力のためにのみ評価される傾向があった。
本研究では,最先端のAPRツールであるSoraldを概念実証として評価する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:12:14 GMT)
Modeling Discrimination with Causal Abstraction [4.9] 我々は、人種が低レベルの特徴の高レベルなテクスタストラクションであるような差別に関する推論の枠組みを導入する。
この枠組みは、モデル差別の正確な因果関係を保ちながら、モデリング差別に関する現在の文献で不一致を指摘している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:33:14 GMT)
Pretrained Diffusion Models Are Inherently Skipped-Step Samplers [4.9] 繰り返し生成プロセスにおいて,複数の中間演示ステップをバイパスする機構であるスキップステップサンプリングを導入する。
我々は,このスキップステップサンプリング機構が標準拡散モデルと同じ学習目標から導出されることを実証した。
本稿では,加速サンプリング技術とDDIMを統合した改良型生成法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:45:13 GMT)
HEAS: Hierarchical Evolutionary Agent Simulation Framework for Cross-Scale Modeling and Multi-Objective Search [4.8] 階層シミュレーションエージェント(Hierarchical Simulation Agent, HEAS)は、階層化されたエージェントベースのモデリングを進化的最適化とトーナメント評価で統合するPythonフレームワークである。
HEASは、共有コンテキストを読み書きする決定論的レイヤにスケジュールされた軽量プロセス(ストリーム)の階層としてモデルを表現する。
compact APIとCLIは、シングルオブジェクトとマルチオブジェクトの進化をシミュレートし、最適化し、評価します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:35:46 GMT)
Pathology-Informed Latent Diffusion Model for Anomaly Detection in Lymph Node Metastasis [4.8] 異常検出は、疾患の診断に効率的に効果的にデータを活用できるデジタル病理学における新たなアプローチである。
デジタル病理学における教師なし異常検出のための拡散モデルを用いた視覚言語モデルを提案する。
本手法では, 正常組織に関連付けられた病理関連キーワードを用いて再建過程を導出する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:48:55 GMT)
Automatic Curriculum Design for Zero-Shot Human-AI Coordination [4.6] ゼロショットヒューマンAIコーディネーション(ゼロショットヒューマンAIコーディネーション)とは、人間データなしで人間と協調するエゴエージェントのトレーニングである。
ゼロショット人間-AI協調設定のためのユーティリティ関数とコプレーヤサンプリングを提案する。
本手法は,見知らぬ環境下での人間とAIの協調作業において高い性能を達成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:19:50 GMT)
BasketLiDAR: The First LiDAR-Camera Multimodal Dataset for Professional Basketball MOT [4.4] スポーツにおけるリアルタイム3次元軌跡追跡は, 戦術分析, 性能評価, 観察者体験の向上において重要な役割を担っている。
従来のシステムはマルチカメラのセットアップに依存しているが、ビデオデータの本質的に2次元の性質と複雑な3D再構成処理の必要性に制約されている。
バスケットボールはMOT分野で最も難しいシナリオの1つであり、10人のプレーヤーが制限された法廷空間内で素早く複雑に動きます。
本稿では,スポーツMOT分野における最初のマルチモーダルデータセットであるBasketLiDARを構築した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:40:51 GMT)
SLM-Bench: A Comprehensive Benchmark of Small Language Models on Environmental Impacts -- Extended Version [4.4] 小型言語モデル (SLM) は計算効率とアクセシビリティを提供する。
SLM-Benchは、複数の次元にわたるSLMを評価するために設計された最初のベンチマークである。
SLM-Benchは、正確性、計算、消費の11のメトリクスを定量化し、効率トレードオフの総合的な評価を可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:56:05 GMT)
Permutation polynomials over finite fields from low-degree rational functions [4.4] 置換二項式の2つのクラスと置換五項式の6つのクラスを$F_q2$で得られる。
得られた二項式および五項式は,文献で知られているものと同等の準乗法であることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:14:00 GMT)
BannerAgency: Advertising Banner Design with Multimodal LLM Agents [4.3] 本稿では,完全自動バナー広告デザイン作成のためのトレーニングフリーフレームワークを提案する。
本稿では,BannerAgencyというMLLMエージェントシステムについて紹介する。
マッチングされた背景画像を生成し、前景のデザイン要素のための青写真を作成し、最終的な創造物をFigmaやSVGフォーマットで編集可能なコンポーネントとしてレンダリングする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:08:20 GMT)
Diffusion MRI with Machine Learning [4.3] 脳の拡散強調磁気共鳴イメージング(dMRI)には、ユニークな機能がある。
機械学習は、dMRI分析の難しいタスクのいくつかに取り組むのに非常に適しているかもしれない。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:43:24 GMT)
Towards the Assessment of Task-based Chatbots: From the TOFU-R Snapshot to the BRASATO Curated Dataset [4.2] 本稿では,これらのデータセットの作成と維持に必要な2つのデータセットとツールサポートについて述べる。
最初のデータセットは、GitHubで利用可能なRasaチャットボットのスナップショットであるGITHUB(TOFU-R)からのRASA TASK-BASED CHATBOTSである。
2つめのデータセットはBOT RASA COLLECTION (BRASATO) で、対話の複雑さ、機能的複雑さ、ユーティリティに関する最も関連性の高いチャットボットのキュレートされた選択である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:24:05 GMT)
Universal Error Correction for Distributed Quantum Computing [4.2] 本稿では,誤りを減らし,効率的な解を求める普遍的な誤り訂正手法を提案する。
本手法は,分散量子コンピューティングの一種に対する誤り訂正の普遍的戦略を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:55:27 GMT)
Exploring the Landscape of Non-Equilibrium Memories with Neural Cellular Automata [4.2] 2次元において、よく研究されている記憶はトゥームの規則のみである。
2次元記憶の風景は、実際にはかなり広大である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:09:07 GMT)
From PREVENTion to REACTion: Enhancing Failure Resolution in Naval Systems [4.2] 本稿では,Fincantieri が開発した海軍システムに適用したトラブルシューティングモジュール REACT による,最先端の故障予測手法 PreVENT とその拡張について報告する。
我々は、これらの分析を他の産業製品に展開し、拡張するのに役立つ、学んだ教訓を議論することで締めくくります。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:57:14 GMT)
Super-additive Cooperation in Language Model Agents [4.1] この研究は、反復的相互作用とグループ間競争の複合効果が人間の協調傾向の原因であると主張する超付加的協調理論に着想を得たものである。
私たちは、言語モデルエージェントがチームに分かれて、囚人のジレンマゲームで互いに対決する仮想トーナメントを考案しました。
チーム内部のダイナミクスと外部の競争をシミュレートすることで、このブレンドによって、全体的なコラボレーションレベルと最初のコラボレーションレベルの両方が大幅に向上することが分かりました。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:36:44 GMT)
Integrating Feature Attention and Temporal Modeling for Collaborative Financial Risk Assessment [4.1] 生データを共有せずに、複数の施設で共同モデリングとリスク識別を行うことができる。
この方法は、データ主権を維持しながら、リスク識別のスコープと効率を高める。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:24:53 GMT)
LIB-KD: Teaching Inductive Bias for Efficient Vision Transformer Distillation and Compression [4.0] ViT(Vision Transformers)は、視覚領域とテキスト領域にまたがる統一された情報処理の展望を提供する。
本稿では, 共用軽量教師モデルから誘導バイアスを消し去る, アンサンブルに基づく蒸留手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:28:10 GMT)
STGAtt: A Spatial-Temporal Unified Graph Attention Network for Traffic Flow Forecasting [4.0] 本稿では,新しい深層学習モデルである空間時間統一グラフ注意ネットワーク(STGAtt)を提案する。
統合グラフ表現とアテンション機構を活用することで、STGAttは複雑な空間的時間的依存関係を効果的にキャプチャする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:21:14 GMT)
AURA: A Fine-Grained Benchmark and Decomposed Metric for Audio-Visual Reasoning [3.9] AURAは、Audio-Visual Large Language Models (AV-LLMs) とOmni-Modal Language Models (OLMs) のクロスモーダル推論能力を評価するためのベンチマークである。
AURAには、因果性、音色とピッチ、テンポとAV同期、未解決性、暗黙の気遣い、スキルプロファイリングといった6つの困難な認知領域に関する質問が含まれている。
本稿では,理性評価のための頑健なツールの欠如に対処する新しい計量AuraScoreを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:39:49 GMT)
A Curated Dataset and Deep Learning Approach for Minor Dent Detection in Vehicles [3.9] 本稿では、YOLOv8オブジェクト認識フレームワークを用いて、顕微鏡表面欠陥を検出するためのディープラーニングベースのソリューションを提供する。
この技術は検出精度に優れ、推論レイテンシも低く、リアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:34:53 GMT)
Complexity of Gaussian quantum optics with a limited number of non-linearities [3.8] ガウス過程の1層非線型性による遷移振幅の計算は、古典的コンピュータでは困難であることを示す。
ガウスボソンサンプリング実験の結果の確率を効率的に近似するために,この問題を効率的に解くアルゴリズムがいかに有効かを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:19:45 GMT)
Quantum Higher Order Fourier Analysis and the Clifford Hierarchy [3.8] 我々は、我々の量子測度と関連する量子高次フーリエ解析の理論がクリフォード階層を特徴づけていることを示す。
特に、ユニタリがクリフォード階層の k-階の要素であるという必要十分かつ十分な解析条件を与える。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:10:16 GMT)
Investigating Different Geo Priors for Image Classification [3.8] 種分布モデルは、種の発生の空間的パターンを符号化し、視覚に基づく種分類に有効である。
我々は,iNaturalist 観測から種を視覚的に分類するための地理的先行として,様々なSINRモデルを評価した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:28:35 GMT)
Exploiting Vocabulary Frequency Imbalance in Language Model Pre-training [3.8] 大規模言語モデルはトークン化器で訓練され、結果として生じるトークン分布は極めて不均衡である。
最近の実践では、より大きい語彙が好まれているが、その利点の源泉は不明である。
データ、計算、最適化を固定しながら、言語モデルの語彙を24Kから196Kにスケールする制御された研究を行う。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:26:48 GMT)
Think in Blocks: Adaptive Reasoning from Direct Response to Deep Reasoning [3.8] 大型言語モデル (LLM) とチェーン・オブ・シントは,タスク範囲の増大に対して高いパフォーマンスを示している。
LLMはタスクの複雑さに基づいて推論プロセスの長さを動的に調整できますか?
本稿では,ゼロから深い推論への適応的推論を可能にするThink in Blocksフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:32:19 GMT)
Trained Miniatures: Low cost, High Efficacy SLMs for Sales & Marketing [3.7] 大規模言語モデル(LLM)はテキスト生成に優れるが、これらの創造的要素は重い計算を必要とし、高いコストが伴う。
本稿では、特定の高価値アプリケーション向けに微調整された「訓練されたミニチュア」-小言語モデル(SLM)の概念を紹介し、コストのごく一部で類似したドメイン固有応答を生成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:46:22 GMT)
TS-Insight: Visualizing Thompson Sampling for Verification and XAI [3.6] 我々は,トンプソンサンプリングに基づくアルゴリズムの内部決定機構の解明を目的とした,視覚分析ツールTS-Insightを紹介する。
複数のプロットで構成され、各腕の進化した後部をトレースし、証拠を数え、その結果をサンプリングする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:23:12 GMT)
Foundation Models for Cross-Domain EEG Analysis Application: A Survey [3.6] 本研究は,脳波解析における基礎モデルのための包括的モダリティ指向分類法を初めて提示する。
我々は、各カテゴリの研究思想、理論的基礎、建築革新を厳格に分析する。
私たちの研究は、EEGファンデーションモデルをスケーラブルで解釈可能で、オンラインの実行可能なソリューションに変換することを加速します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:56:28 GMT)
Power Stabilization for AI Training Datacenters [3.6] 数十万のGPUにまたがる大規模な人工知能(AI)トレーニングワークロードには、ユニークなパワーマネジメントの課題があります。
これは、訓練中の消費電力の変動が大きいためである。
AIトレーニングワークロードの安全なスケーリングを継続するためには、そのようなワークロードのパワーを安定化する必要があります。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:25:27 GMT)
Surya: Foundation Model for Heliophysics [3.6] 汎用的な太陽表象を学習するために設計されたヘリオフィジカルのための366Mパラメータ基礎モデルであるSuryaを紹介する。
パラメータ効率の低い低時間適応Rank (LoRA) を用いた下流微調整は高い性能を示す一方で, 太陽のダイナミクスやフレア現象を予測する能力を示す。
その新しいアーキテクチャと性能は、このモデルが太陽の進化の背後にある物理学を学ぶことができることを示唆している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:53:36 GMT)
LLM-empowered Dynamic Prompt Routing for Vision-Language Models Tuning under Long-Tailed Distributions [3.5] 本稿では,視覚言語モデル(VLM)のための多次元動的プロンプトルーティング(MDPR)フレームワークを提案する。
MDPRは5つの視覚的セマンティック次元にまたがる、クラスのための総合的な知識ベースを構築する。
CIFAR-LT、ImageNet-LT、Places-LTなどの長期ベンチマークの実験は、MDPRが現在のSOTAメソッドと同等の結果を得ることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:12:06 GMT)
GUI Based Fuzzy Logic and Spatial Statistics for Unsupervised Microscopy Segmentation [3.5] 局所平均からの空間標準偏差(SSDLM)、ファジィ論理、調整されたヴァリグラム、モランのI、累積2乗強度シフト(CSSNI)を組み合わせた最初の教師なしセグメンテーションフレームワークを提案する。
ディープラーニングモデルとは異なり、私たちのアプローチではアノテーションや再トレーニングは必要ありません。
本手法は,IoUが最大48%増加し,統計的に優位性を示すことにより,セグメンテーション性能を著しく向上させる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:44:53 GMT)
Quantum natural gradient with thermal-state initialization [3.5] 熱状態を持つPQCに対してフィッシャー情報行列、ウィグナー・ヤネーゼ、クボ・モリ情報行列の3つの量子一般化を計算するための正確な方法を提案する。
これらの行列要素は、アダマール検定、古典的ランダムサンプリング、ハミルトニアンシミュレーションを組み合わせた量子アルゴリズムを用いて推定できることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:19:15 GMT)
Security Steerability is All You Need [3.5] この研究は、GenAIセキュリティに対するアプリケーション中心のアプローチに焦点を当てている。
LLMはアドホックなアプリケーション固有の脅威から保護することはできないが、そのような脅威からアプリケーションを保護するためのフレームワークを提供することができる。
最初のコントリビューションはセキュリティステアビリティの定義です - LLMの新たなセキュリティ対策であり、システムプロンプトで定義された厳格なガードレールに従うモデルの能力を評価します。
第2のコントリビューションは、VeganRibsと呼ばれる新しいベンチマークを利用して、LLMのセキュリティステアビリティを測定する手法です。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:12:54 GMT)
Scalable Bayesian Monte Carlo: fast uncertainty estimation beyond deep ensembles [3.5] 本研究では,スケーラブルなベイジアンモンテカルロ(SBMC)と呼ばれるベイジアンディープラーニングのための新しい手法を提案する。
この方法はモデルとアルゴリズムから構成されており、モデルは点推定器と後部を補間する。
系統的な数値研究により、深層アンサンブル(DE)のような最先端(SOTA)法と同じウォールクロック時間で、SBMCは同等またはより良い精度を達成できることが明らかになった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:11:57 GMT)
MaskSDM with Shapley values to improve flexibility, robustness, and explainability in species distribution modeling [3.4] 種分布モデル(SDM)は生物多様性の研究、保全計画、生態ニッチモデリングにおいて重要な役割を担っている。
マスク付きトレーニング戦略を用いてフレキシブルな予測器選択を可能にする,新しいディープラーニングベースのSDMであるMaskSDMを紹介する。
我々はグローバルなsPlotOpenデータセット上でMaskSDMを評価し,12,738種の分布をモデル化した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:04:04 GMT)
Flexible metadata harvesting for ecology using large language models [3.4] 大規模言語モデル(LLM)に基づくメタデータ抽出装置を開発した。
任意のデータセットのランディングページからメタデータを柔軟に抽出する。
既存のメタデータ標準を使用して、これらをユーザ定義の統一フォーマットに変換する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:10:29 GMT)
Zero-shot Volumetric CT Super-Resolution using 3D Gaussian Splatting with Upsampled 2D X-ray Projection Priors [3.4] 拡散モデルにより生成された2次元X線プロジェクションのアップサンプリングを利用する新しいゼロショット3次元CT SRフレームワークを提案する。
2つのデータセットに対する実験により,本手法は3次元CT SRにおいて優れた定量的,定性的な結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:24:06 GMT)
Correct-By-Construction: Certified Individual Fairness through Neural Network Training [3.4] トレーニングを通して個人的公正を正式に保証する新しい枠組みを提案する。
提案手法の重要な要素は,ランダム化応答機構の利用である。
我々は、このメカニズムがトレーニングプロセスを通して個人の公正性を維持することを正式に証明する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:14:14 GMT)
Efficient Probabilistic Visualization of Local Divergence of 2D Vector Fields with Independent Gaussian Uncertainty [3.3] 拡散は流体の基本的な特性の1つである。
ベクトル場データに固有の不確かさは、誤発散計算につながる可能性がある。
我々はモンテカルロサンプリング手法の緩やかな収束と限られたスケーラビリティの課題に対処する2つのコントリビューションを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:16:17 GMT)
Jointly Computation- and Communication-Efficient Distributed Learning [3.3] 我々は,共同計算と通信効率のよい新しいADMMベースのアルゴリズムを設計することに注力する。
我々の設計は、エージェントが局所訓練中に勾配を使用できるようにすることで、計算効率を保証します。
我々は,強い凸条件下でのアルゴリズムの正確な線形収束を証明した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:36:02 GMT)
Reliable Multi-view 3D Reconstruction for `Just-in-time' Edge Environments [3.3] 本稿では,システム破壊の可能性に対する信頼性の高いマルチビュー3D再構成のための,新たなポートフォリオ理論に基づくエッジリソース管理戦略を提案する。
提案手法は, カメラが相関破壊を起こしやすい場合でも, 復元品質を保証できる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:42:22 GMT)
Rethinking Tokenization for Rich Morphology: The Dominance of Unigram over BPE and Morphological Alignment [3.3] 以前の研究は、形態学的に整合したトークン化アプローチが性能を向上させるかどうかに関して矛盾する結果を示した。
我々は、テルグ語(凝集)、ヒンディー語(主に凝集を伴う融合)、英語(融合)の類型的に多様な言語を選択する。
形態的アライメントとトークン化の品質という,2つの重要な要素に注目します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:50:53 GMT)
Highly Excited Electron Cyclotron for QCD Axion and Dark-Photon Detection [3.2] 我々は、閉じ込められた電子の高励起サイクロトロン状態を用いて、MeVアキシオンとダークフォトンダークマターを検出することを提案する。
我々はサイクロトロン検出に必要な平均測定時間を10~6秒に抑え、崩壊前の高励起状態の検出を可能にした。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:41:54 GMT)
IBPS: Indian Bail Prediction System [3.1] ベイルの決定は、インドの裁判所でしばしば上訴される事項の1つである。
インドの刑務所人口の75%以上が囚人である。
本稿では,AIを活用した意思決定支援フレームワークであるIndian Bail Prediction System(IBPS)を紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:32:35 GMT)
NiceWebRL: a Python library for human subject experiments with reinforcement learning environments [3.1] NiceWebRLはPythonライブラリで、任意のJaxベースの環境をオンラインインターフェースに変換することができる。
我々は、その可能性を示す3つのケーススタディを紹介し、ヒューマンライクなAI、ヒューマンコンパチブルAI、ヒューマンアシスタンスAIの開発を支援する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:18:49 GMT)
Yet Another Mirage of Breaking MIRAGE: Debunking Occupancy-based Side-Channel Attacks on Fully Associative Randomized Caches [3.0] USENIX Security 2025で発表された最近の研究は、占有率ベースの攻撃は、MIRAGEランダム化されたキャッシュからAESキーを復元できると主張している。
本稿では、これらの主張を検証し、SEC'25論文のモデリング上の欠陥から生じることを明らかにする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:45:06 GMT)
Revisiting Pre-processing Group Fairness: A Modular Benchmarking Framework [3.0] バイアスを軽減する方法は、前処理、内処理、後処理の3つのカテゴリに分類される。
FairPrepは、データセット上でフェアネスを意識した事前処理技術を評価するために設計されたベンチマークフレームワークである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:04:30 GMT)
CREMA: A Contrastive Regularized Masked Autoencoder for Robust ECG Diagnostics across Clinical Domains [2.9] 自己教師付き事前学習により一般化可能な表現を学習するための12誘導ECGの基礎モデルであるCREMAを提案する。
CREMAは、コントラスト正規化MAE損失による生成学習とコントラスト正規化を組み合わせて、局所波形の詳細とグローバル時間依存性の両方をキャプチャするためにSignal Transformer (SiT)アーキテクチャを使用する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:24:18 GMT)
AraReasoner: Evaluating Reasoning-Based LLMs for Arabic NLP [2.9] 大規模言語モデル(LLM)は推論能力の顕著な進歩を示している。
しかし、アラビアデータにおける彼らのパフォーマンスは、豊富な形態学、多様な方言、複雑な文字によって特徴づけられ、未発見のままである。
本稿では,複数の推論に焦点をあてたLLMの総合的なベンチマーク研究について述べる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:16:43 GMT)
A 1.5-Query Lower Bound for the Unitary Synthesis Problem [2.9] 1.5クエリ設定と呼ばれる単位問題に対する新しい合成の下限を証明した。
疑似ランダム量子状態は1.5クエリに制限された敵に対して安全であることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:28:24 GMT)
Mean-Field Generalisation Bounds for Learning Controls in Stochastic Environments [2.8] 古典的な離散時間制御問題の定式化について考察する。
提案手法は,システムの大部分を制御できないような,そのような問題の自然構造を利用する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:24:16 GMT)
Multi-perspective monitoring of wildlife and human activities from camera traps and drones with deep learning models [2.8] この研究は、チトワン国立公園(CNP)、ネパール、および近隣地域で実施された。
深層学習モデルは、野生生物と人間の活動を自動的に識別するために構築された。
この研究は、保存された景観の中で人間の野生生物の衝突を明らかにする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:53:16 GMT)
One-Electron Quantum Cyclotron as a Milli-eV Dark-Photon Detector [2.8] 我々は、閉じ込められた電子をmeVダークフォトンダークマターを検出するための高いQ$共振器として用いることを提案する。
1つの電子で実施されたプリンシプル測定の証明では、7.4日の探索でバックグラウンドフリーであることが示されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:22:09 GMT)
NucleiMix: Realistic Data Augmentation for Nuclei Instance Segmentation [2.7] NucleiMixは、データセット内のレアタイプの核の数を増やすことで、核種の分布のバランスをとるように設計されている。
第1段階では、希少型核の周囲に類似した候補位置を特定し、希少型核を候補部位に挿入する。
第2フェーズでは、事前訓練された拡散モデルを用いて、レアタイプの核を新しい環境にシームレスに統合するプログレッシブな塗布戦略を採用している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:47:34 GMT)
Tensorized Multi-Task Learning for Personalized Modeling of Heterogeneous Individuals with High-Dimensional Data [2.7] 本稿では、低ランク分解によりタスクモデルパラメータの集合を低ランク構造に分解するフレームワークを提案する。
このアプローチは、類似したタスク間で知識を共有することによって、パーソナライズされたモデルの効率的な学習を可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:55:50 GMT)
Deep regularization networks for inverse problems with noisy operators [2.7] 主演算子が雑音データから構築される大きな逆問題に対して,教師付き学習手法を提案する。
ニューラル演算子は、散乱方程式の右側のパターンを対応する正規化パラメータにマッピングする。
我々は,相違原理の論理から情報を得たネットワークが,高いコントラストの画像に繋がることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:09:32 GMT)
Bayesian Optimization with Expected Improvement: No Regret and the Choice of Incumbent [2.7] 古典的なガウス過程予測改善(GP-EI)アルゴリズムを解析する。
GP-EI の BPMI と BSPMI との累積的後悔の上限を初めて提示する。
本研究は,GP-EIを雑音下で適用した場合の現職者選択に関する理論的ガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:55:16 GMT)
Quantum Differential Equation Solvers with Low State Preparation Cost: Eliminating the Time Dependence in Dissipative Equations [2.6] 線形散逸微分方程式をシミュレーションするための効率的な量子アルゴリズムを提案する。
我々のアルゴリズムの鍵となる考え方は、力学がまだ顕著に散逸していない有効期間にのみシミュレーションを実行することである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:17:21 GMT)
Invisible Filters: Cultural Bias in Hiring Evaluations Using Large Language Models [2.5] 人工知能(AI)は雇用にますます使われており、大きな言語モデル(LLM)は雇用決定に影響を与える可能性がある。
このことは、バイアス、公平性、信頼について、特にさまざまな文化的文脈において、強い関心を喚起します。
我々は,LLMが文化・アイデンティティの面から求人面接をどのように評価するかを体系的に分析する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:45:00 GMT)
A Novel Vascular Risk Scoring Framework for Quantifying Sex-Specific Cerebral Perfusion from 3D pCASL MRI [2.5] 性別や年齢が脳灌流に及ぼす影響は認識されているが, 局所脳血流量(CBF)と血管リスクに対する具体的な影響は明らかになっていない。
本研究では3D pseudo-continuous arterial spin labeling (pCASL) MRI を用いて性別と年齢関連CBFパターンを同定した。
標準灌流プロファイルに基づく血管リスクスコア(VRS)を開発した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:30:33 GMT)
On the Consistency of GNN Explanations for Malware Detection [2.5] 制御フローグラフ(CFG)は、プログラムの実行を分析し、マルウェアの振る舞いを特徴づけるのに重要である。
本研究では、CFGを動的に構築し、ハイブリッドアプローチを用いてノード特徴を埋め込む新しいフレームワークを提案する。
その後、GNNベースの分類器が構築され、結果のグラフ表現から悪意のある振る舞いを検出する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:02:46 GMT)
NEAT: Concept driven Neuron Attribution in LLMs [2.4] 最終予測に責任を負うニューロンの配置は、ブラックボックスの大きな言語モデルを開く上で重要である。
本稿では、特定の概念を表現し、それらのニューロンを概念ニューロンとして表現する重要なニューロンの配置法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:36:00 GMT)
MedRepBench: A Comprehensive Benchmark for Medical Report Interpretation [2.3] 私たちはMedRepBenchを紹介します。MedRepBenchは、1,900の特定されていない現実の中国の医療レポートから構築された総合的なベンチマークです。
このベンチマークは主に、構造化された医療報告理解のためのエンドツーエンドのVLMを評価するために設計されている。
また、OCR+LLMパイプラインは、高いパフォーマンスにもかかわらず、レイアウトのブラインドネスとレイテンシの問題に悩まされていることも観察した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:52:45 GMT)
Image-Conditioned 3D Gaussian Splat Quantization [2.3] 画像合成ガウススプラット量子化器(ICGS-Quantizer)
ICGS-Quantizerは圧縮効率を大幅に向上し、アーカイブ後のシーン変更への適応性を提供する。
私たちのコード、モデル、データはGitHubで公開されます。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:07:26 GMT)
Parallel transport on matrix manifolds and Exponential Action [2.3] 擬リーマン計量の族を持ついくつかの共通行列リー群に対する平行輸送を表現する。
計量は双不変計量の変形から構成され、自然に還元される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:10:10 GMT)
Single-shot readout of the nuclear spin of an on-surface atom [2.3] 核スピンは、長寿命の磁気状態が環境からの優れた隔離に起因している。
核スピンの原子環境に関する詳細な知識と制御は、量子情報応用の条件を最適化するための鍵である。
本稿では,STMを用いた個々のtext49$Ti核スピンの単発読み出しを実演する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:17:39 GMT)
Transfer learning optimization based on evolutionary selective fine tuning [2.3] トランスファーラーニングは、トレーニング済みのモデルを新しいタスクに適応するための戦略を提供する。
従来の微調整は、しばしばすべてのモデルパラメータを更新する。
BioTuneは転写学習効率を高めるために選択的に微細構造層である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:51:43 GMT)
Normal and Abnormal Pathology Knowledge-Augmented Vision-Language Model for Anomaly Detection in Pathology Images [2.2] Ano-NAViLaは、病理画像における異常検出のための正常および異常な病理知識拡張型ビジョンランゲージモデルである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:40:23 GMT)
Large Language Models for Automated Literature Review: An Evaluation of Reference Generation, Abstract Writing, and Review Composition [2.0] 大規模言語モデル(LLM)は、文学レビューを書くことに関わる複雑なプロセスを自動化するための潜在的な解決策として登場した。
本研究は,文学書記の3つの重要な課題において,LLMの性能を自動評価する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:50:43 GMT)
Automated Multi-label Classification of Eleven Retinal Diseases: A Benchmark of Modern Architectures and a Meta-Ensemble on a Large Synthetic Dataset [2.0] 我々は、11の網膜疾患を分類するエンドツーエンドのディープラーニングパイプラインを開発した。
合成データのみに訓練されたモデルは,複数の病態を正確に分類し,実際の臨床画像に効果的に一般化できることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:09:53 GMT)
CIGaRS I: Combined simulation-based inference from SNae Ia and host photometry [1.9] 本稿では,純測光観測から,SN Iaの輝度が前駆体特性に与える影響を推定する統一ベイズ階層モデルを提案する。
メタロシティと年齢の内在的依存が観察上の特徴を持つことを示すシミュレーションで示している。
我々の合同物理学に基づくアプローチは、堅牢で正確な測光赤方偏移と宇宙の制約の改善をもたらす。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:00:29 GMT)
Cybernaut: Towards Reliable Web Automation [1.9] Cybernautは、堅牢なエンタープライズ利用のために設計されたWebオートメーションエージェントにおいて、高い実行一貫性を保証する新しいフレームワークである。
1) ユーザデモを線形ブラウジングタスクの信頼性の高い自動化命令に変換するSOPジェネレータ,(2) 複雑なWebインターフェースの課題に合わせた高精度なHTML DOM要素認識システム,(3) 実行の整合性を評価するための定量的メトリクス。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:39:35 GMT)
A Systematic Literature Review of Machine Learning Approaches for Migrating Monolithic Systems to Microservices [1.9] 我々は,2015年から2024年にかけて発行された81の初等研究(PS)のアプローチと成果をまとめ,合成し,考察する体系的文献レビュー(SLR)を報告する。
本稿では,モノリシックシステム移行におけるML手法の活用を示す分類の形で,これらの知見を合成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:21:52 GMT)
High-dimensional Asymptotics of Generalization Performance in Continual Ridge Regression [1.8] 継続的な学習は、タスクやデータ分散における実世界のダイナミクスに適応する必要があることによる。
本稿では,高次元線形モデルにおける連続尾根回帰の理論的性質について検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:21:53 GMT)
Probabilistic Forecasting Cryptocurrencies Volatility: From Point to Quantile Forecasts [1.8] 本稿では,幅広いベースモデルからの点予測を利用する確率的予測手法を提案する。
我々の知る限りでは、暗号通貨市場におけるばらつきの確率論的予測を提案し、体系的に評価する文献としては、これが初めてである。
Bitcoinの実証的な結果は、QRS(Quantile Estimation through Residual Simulation)メソッドが、より高度な代替手段を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:42:11 GMT)
The practical issues of side-channel-secure quantum key distribution [1.8] 量子鍵分配(Quantum Key Distribution, QKD)は、量子力学の原理を利用して、暗号鍵共有の理論的に無条件のセキュリティを提供する。
非理想的なデバイスや、QKDシステムのソースと検出の双方に潜在的なセキュリティの抜け穴があるため、実践的な実装は依然として脆弱である。
サイドチャネルセキュア(SCS)プロトコルは、真空状態と非真空状態のビットを符号化し、サードパーティの計測ノードを導入することで、これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:14:26 GMT)
DIO: Refining Mutual Information and Causal Chain to Enhance Machine Abstract Reasoning Ability [1.8] 本稿では,機械知能の抽象的推論能力の向上に寄与することを目的として,RPM問題を解決することに焦点を当てる。
実験により、DIOのために定式化された最適化目的、すなわち、コンテキストと正しいオプションの間の相互情報の変動の下限を最大化することは、モデルが事前に定義された人間の論理を真に取得することを可能にするのに失敗することを明らかにする。
これらの制約を克服するため,本論文では3つの改善手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:23:51 GMT)
High temporal stability of niobium superconducting resonators by surface passivation with organophosphonate self-assembled monolayers [1.8] 酸化除去後のNb薄膜上でのアルキルホスホネート自己集合単分子膜(SAM)の成長を報告する。
受動共振器は単一光子レベルにおいて80%の損失が認められたが、SAM受動共振器は時間安定性に優れていた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:50:29 GMT)
Creating a Historical Migration Dataset from Finnish Church Records, 1800-1920 [1.7] 1800年から1920年の間、フィンランドにおける内部移動の構造化されたデータセットを、デジタル化された教会移動記録を用いて作成する。
データセットには、手書きのマイグレーションレコードの約20万の画像から抽出された600万以上のエントリが含まれている。
このデータセットは、内陸部の移動、都市化、家族の移動、およびフィンランドにおける病気の拡散を研究するのに利用できる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:40:45 GMT)
Response and Prompt Evaluation to Prevent Parasocial Relationships with Chatbots [1.7] AIエージェントとの対人関係の発達は深刻であり、場合によっては人間の幸福に対する悲劇的な影響がある。
本稿では,現在進行中の対人会話をリアルタイムに評価する,最先端の言語モデルを再利用したシンプルな応答評価フレームワークを提案する。
5段階試験による反復的評価は,全社交会話の同定に成功し,寛容な一致規則の下で偽陽性を避けた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:43:24 GMT)
Probability Density from Latent Diffusion Models for Out-of-Distribution Detection [1.7] 機械学習システムをデプロイする上で、安全は依然として大きなボトルネックだ。
生成モデルでは、最も自然なOODスコアはデータの可能性である。
実際に失敗する可能性もしばしばあり、その有用性に疑問を呈する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:27:35 GMT)
Subjective Behaviors and Preferences in LLM: Language of Browsing [1.7] 大規模言語モデル(LLM)はドメインやタスクにまたがって汎用性を提供します。
小さなLMは、大きなLMよりも"ブラウジングの言語"を表現できますか?
主観的行動に適したクラスタワイズLMトレーニング(HeTLM)を導入する。
ページレベルのトークン化器を用いてトレーニングした小さなLMは、トレーニング済みまたは微調整済みのLMよりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:50:56 GMT)
Inequality in the Age of Pseudonymity [1.6] ジニ係数のような不平等対策は、政策決定を通知し動機づけするために用いられる。
デジタル時代においてよく見られる匿名設定における対策方法を分析する。
一部の俳優はプライバシーを守るためにそうするかもしれませんが、これは不平等の測定を不注意に妨げます。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:18:01 GMT)
Vision Transformers for Kidney Stone Image Classification: A Comparative Study with CNNs [1.6] 本研究では,視覚変換器(ViT)とCNNモデルの比較分析を行った。
ImageNet-21kで事前訓練されたViTベースモデルは、複数の撮像条件で一貫してResNet50ベースラインを上回った。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:53:23 GMT)
Mini-Batch Robustness Verification of Deep Neural Networks [1.6] BaVerLyは、ミニバッチを動的に構築し、検証することで、$epsilon$-ballsのセットの局所的な検証を促進する音と完全検証器である。
結果、BaVerLyは平均2.3倍、最大4.1倍の検証を行い、分析時間を24時間から6時間に短縮した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:19:29 GMT)
Weakly-Supervised Learning for Tree Instances Segmentation in Airborne Lidar Point Clouds [1.6] 大気中のレーザースキャン(ALS)データのツリーインスタンスセグメンテーションは、森林モニタリングにおいて最も重要である。
人間の操作者による品質評価として,初期セグメンテーション結果のラベルが提供される弱い教師付きアプローチを提案する。
品質評価中に生成されたラベルは、評価モデルをトレーニングするために使用され、そのタスクは、セグメンテーション出力を人間のオペレータが指定したクラスに分類することである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:25:23 GMT)
PriorFormer: A Transformer for Real-time Monocular 3D Human Pose Estimation with Versatile Geometric Priors [1.5] 本稿では,人間の2次元関節位置の短い列を1台のカメラで3次元ポーズにマッピングする軽量トランスフォーマーベースリフト機を提案する。
提案モデルでは,セグメント長やカメラ内在性などの入力幾何学的先行を考慮し,キャリブレーションとアンキャリブレーションの両方で動作させるように設計されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:16:14 GMT)
Physics-Based Explainable AI for ECG Segmentation: A Lightweight Model [1.4] 本研究は、スペクトル解析と確率論的予測を組み合わせ、ECG信号セグメンテーションのための合理化アーキテクチャを提案する。
複雑な層を単純な層に置き換えることで、P波、QRS波、T波の時間的特徴とスペクトル特性の両方を効果的に捉えることができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:45:13 GMT)
MExECON: Multi-view Extended Explicit Clothed humans Optimized via Normal integration [1.4] MExECONは、粗いマルチビューRGB画像から人間のアバターを3次元再構成するための新しいパイプラインである。
提案した統合多視点ボディ最適化アルゴリズムは、全ての入力ビューに対して単一のSMPL-Xボディーモデルに適合する。
その結果,MExECONは単一視点ベースラインの忠実度を常に向上し,競争性能が向上することがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:29:00 GMT)
HebID: Detecting Social Identities in Hebrew-language Political Text [1.4] 我々は,ソーシャルアイデンティティ検出のための最初の多ラベルヘブライ語コーパスであるHebIDを紹介する。
マルチラベルおよびシングルラベルエンコーダを2B-9Bパラメータ生成型LLMとともにベンチマークし,ヘブライ語で調整したLLMが最良の結果をもたらすことを示した。
我々は、全国の公的な調査からアイデンティティの選択を利用し、エリートな談話で描かれたアイデンティティと一般のアイデンティティの優先順位の比較を可能にした。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:01:56 GMT)
Establishing Technical Debt Management -- A Five-Step Workshop Approach and an Action Research Study [1.4] 技術的負債(TD)項目は、短期的な利益を提供するが、将来の変更を妨げるソフトウェアシステムの構成である。
本研究の目的は,ワークショップの概念に基づくIT企業におけるTDMプロセスの構築である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:44:01 GMT)
Everybody Likes to Sleep: A Computer-Assisted Comparison of Object Naming Data from 30 Languages [1.3] オブジェクト命名データセットは、人間が周囲のオブジェクトにどのようにアクセスし、選択するかについての洞察を得るために使用される。
本研究は,多言語・コンピュータ支援手法を用いて,現在のオブジェクトの命名データを透過的かつ同等にすることを試みる。
本研究は,言語横断的オブジェクト命名研究の基盤となる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:45:54 GMT)
Are Virtual DES Images a Valid Alternative to the Real Ones? [1.3] 本研究では,仮想DES画像がCESM病変分類に与える影響について検討する。
われわれの知る限り、仮想DES画像がCESM病変分類に与える影響を初めて評価した研究である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:07:42 GMT)
Automated Formal Verification of a Software Fault Isolation System [1.3] ソフトウェア障害分離(SFI)は、信頼できないソフトウェアをサンドボックス化する一般的な方法である。
SFI の重要なコンポーネントは、信頼できないコードがマシン言語のサブセットで書かれていることをチェックする検証器である。
SFI検証器の健全性バグは、SFIセキュリティモデルを破り、サンドボックス化されたと思われるコードが保護されたメモリを読み取ることを可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:00:19 GMT)
A Robust BERT-Based Deep Learning Model for Automated Cancer Type Extraction from Unstructured Pathology Reports [1.3] 腫瘍学における精度タスクのための微調整されたドメイン固有モデルは、より効率的で正確な臨床情報抽出の道を開くかもしれない。
このモデルはベースラインモデルと大規模言語モデルMistral 7Bを大きく上回り、FBertscore 0.98と80.61%の完全一致を達成した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:12:39 GMT)
Mean-Field Langevin Diffusions with Density-dependent Temperature [1.2] 非プラン最適化の文脈では、ランゲヴィン拡散の温度は拡散の密度関数に依存する。
ランゲヴィンの力学は現在、自身の密度で自己制御されているため、標準マッケイン・ブラソフ方程式の平均場方程式(SDE)微分を形成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:15:40 GMT)
Entanglement entropy as a probe of topological phase transitions [1.2] 障害があってもトポロジカルな位相遷移をキャプチャする、正確なEEベースのフレームワークを導入します。
以上の結果から,EEはロバストな診断ツールであり,トポロジカルな物質に対する量子情報と凝縮物質との橋渡しの可能性を強調した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:00:16 GMT)
LBONet: Supervised Spectral Descriptors for Shape Analysis [1.2] ラプラス・ベルトラミ作用素は、厳密でない形状解析の分野で自身を確立している。
本稿では,多様体上で数個の演算子を学習する教師付き手法を提案する。
これらの関数を適用することで、よりタスク固有のLBO固有基底を訓練することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:43:50 GMT)
Situational Awareness as the Imperative Capability for Disaster Resilience in the Era of Complex Hazards and Artificial Intelligence [1.1] 災害はしばしば確立された危険モデルを超え、予期せぬ影響や脆弱性が効果的な対応を妨げている盲点を明らかにする。
状況認識(SA) - 動的危機条件を知覚し、解釈し、計画する能力は、しばしば見過ごされるが、災害の回復に不可欠な能力である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:38:47 GMT)
Exploring Modularity of Agentic Systems for Drug Discovery [1.1] 大規模言語モデル(LLM)とエージェントシステムは、薬物発見を加速するエキサイティングな機会を提供する。
LLMやエージェントの種類などのシステムの一部が交換可能であるかを検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:36:46 GMT)
A Dynamical Systems Framework for Reinforcement Learning Safety and Robustness Verification [1.1] 本稿では,学習方針の堅牢性と安全性を検証するための形式的手法の欠如に対処する新しい枠組みを提案する。
動的システム理論からツールを活用することで、システムの振る舞いを管理する隠れた「骨格」として機能するラグランジアンコヒーレント構造(LCS)を特定し視覚化する。
この枠組みは政策行動の包括的かつ解釈可能な評価を提供し、報酬のみに基づいて成功しているように見える政策の重大な欠陥の特定に成功していることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:00:26 GMT)
Advancing the Database of Cross-Linguistic Colexifications with New Workflows and Data [1.1] 複数の意味を持つ単語の比較研究のための高度なデータベースを提案する。
新バージョンには、データのハンドリング、選択、表示の改善が含まれている。
我々は,新たな言語横断的コレキシフィケーションデータベースが,エキサイティングな新しい研究を刺激する可能性があると結論づける。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:28:20 GMT)
Information Ecosystem Reengineering via Public Sector Knowledge Representation [1.1] IER(Information Ecosystem Reengineering)は、公共セクターサービスとスマートガバナンスプラットフォームのデジタルトランスフォーメーションにおける課題である。
本稿では,これらの知識表現複雑性の複数の層をアンタングル化する新しい手法,Representation Disentanglementを提案する。
このようなフレームワークは,公共部門における知識表現における説明可能性,トレーサビリティ,意味的透明性を実現する上で不可欠である,と我々は主張する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:29:27 GMT)
Continual Learning for Multimodal Data Fusion of a Soft Gripper [1.1] あるデータモダリティに基づいてトレーニングされたモデルは、異なるモダリティでテストした場合、しばしば失敗する。
異なるデータモダリティを漸進的に学習できる連続学習アルゴリズムを提案する。
我々は、アルゴリズムの有効性を、挑戦的なカスタムマルチモーダルデータセット上で評価する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:09:11 GMT)
Cooperative SGD with Dynamic Mixing Matrices [1.0] 分散環境では、勾配降下(SGD)に基づくアルゴリズムが理論的に収束することが示されている。
本稿では、動的トポロジを持つローカル更新SGDベースの分散アルゴリズムを網羅した統合フレームワークについて述べる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:46:45 GMT)
GRASPED: Graph Anomaly Detection using Autoencoder with Spectral Encoder and Decoder (Full Version) [1.0] ノード異常検出のためのスペクトル・スペクトルデコーダ(GRASPED)を用いたグラフオートエンコーダを提案する。
GRASPEDは、グローバルおよびローカルグラフ情報を複数のスケールでキャプチャする帯域通過フィルタ特性を示す。
いくつかの実世界のグラフ異常検出データセットの実験は、GRASPEDが現在の最先端モデルより優れていることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:57:30 GMT)
Arabic Multimodal Machine Learning: Datasets, Applications, Approaches, and Challenges [1.0] アラビア語のMMLは、テキスト、オーディオ、ビジュアルなどの様々なモダリティからの情報の統合と分析を目的としている。
本稿では,新しい分類法を用いてアラビア語のMMLを分類し,既存の研究を解析することによって検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:28:33 GMT)
TComQA: Extracting Temporal Commonsense from Text [0.9] 大規模言語モデル(LLM)は、テキストにしばしば明示的な記述があるため、時間的コモンセンスによる推論を必要とするテキストを生成するのに苦労する。
本稿では,LLMを利用して時間的コモンセンスを自動的にマイニングし,TComQAを構築するための時間的コモンセンス抽出パイプラインを提案する。
TComQAはクラウドソーシングによって検証され、時間的コモンセンスの抽出において80%以上の精度が達成されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:07:40 GMT)
A User Manual for cuHALLaR: A GPU Accelerated Low-Rank Semidefinite Programming Solver [0.9] 大規模半定値プログラム(SDP)のためのプリコンパイルされたHALLaRとcuHALLaRのバイナリにJuliaベースのインタフェースを提案する。
両ソルバは高速かつ数値的に安定に設定され、SDPAと互換性のあるフォーマットで問題データを受け入れる。
行列補完のSDP緩和や最大安定セット問題など、一連の問題が含まれている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:45:01 GMT)
AmbiSQL: Interactive Ambiguity Detection and Resolution for Text-to-SQL [0.9] 本稿では,クエリのあいまいさを自動的に検出し,ユーザの意図を明らかにするための複数の質問を通じてユーザをガイドする対話型システムAmbiを紹介する。
Ambiは曖昧さ検出の87.2%を達成し、テキストからデータセットシステムに統合された場合、精度を50%向上する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:10:28 GMT)
Locality-aware Pauli-based computation for local magic state preparation [0.9] マジックステート蒸留は、非クリフォードゲートを耐障害的に実装するために必要なマジックステートを作成するプロセスである。
近年のマジックステート蒸留の進歩によりオーバーヘッドが大幅に減少し、多くのマジックステートを同時に作成できるようになった。
本研究では,領域計算におけるマジック状態を蒸留する新しいコンパイル手法である,局所性を考慮したパウリ計算を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:30:20 GMT)
LATTE: Learning Aligned Transactions and Textual Embeddings for Bank Clients [0.9] LATTEは、生のイベント埋め込みと凍結した言語モデルからのセマンティック埋め込みを整合させる、対照的な学習フレームワークである。
提案手法は,実世界の財務データセット上でのイベントシーケンス表現の学習において,最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:28:29 GMT)
Locally Pareto-Optimal Interpretations for Black-Box Machine Learning Models [0.9] 我々は,局所最適性保証に基づくフレームワークを開発し,解釈のスケーラブルな合成を実現する。
提案手法は,グローバルな保証を提供する手法によって合成された手法と密接に一致する解釈を導出することを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:11:20 GMT)
OPDR: Order-Preserving Dimension Reduction for Semantic Embedding of Multimodal Scientific Data [0.9] マルチモーダルな科学データ管理における最も一般的な操作の1つは、$k$の類似アイテムを探すことである。
結果として得られる埋め込みベクトルの次元は、通常数百から数千のオーダーであり、時間に敏感な科学的応用には不可分に高い。
この研究は、出力埋め込みベクトルの次元性を減らし、トップ=k$近辺の集合が低次元空間において変化しないようにすることを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:25:23 GMT)
Evaluating Speech-to-Text x LLM x Text-to-Speech Combinations for AI Interview Systems [0.9] 音声テキスト(STT)、大言語モデル(LLM)、テキスト音声コンポーネント(TTS)はますますカスケードアーキテクチャに依存している。
STT x LLM x TTSスタックの大規模比較を,30万人以上のAIによる求人面接から得られたデータを用いて行った。
GoogleのSTT、GPT-4.1、CartesiaのTTSを組み合わせたスタックは、客観的な品質指標とユーザ満足度スコアの両方において、選択肢よりも優れています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:12:18 GMT)
Parallel Architecture of a Frequency Comb Qudit Quantum Processor [0.9] 本稿では,このようなゲートの新規なアーキテクチャについて述べる。
次元によるミキサーの並列配置は、2次元キュービットを超える優雅なスケーリングを可能にする。
例えば、四次元クレステンソン作用素の設計を実演する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:50:40 GMT)
Discovering Hidden Algebraic Structures via Transformers with Rank-Aware Beam GRPO [0.8] 我々は,問題複雑性のきめ細かい制御が可能な合成データ生成パイプラインを開発した。
第二に、教師付き学習を通してトランスフォーマーモデルを訓練し、スケーリング行動と一般化可能性を含む4つの重要な次元にわたって評価する。
第3に,厳密な代数問題に適したランク対応強化学習法であるビーム群相対ポリシー(BGRPO)を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:58:50 GMT)
React-tRace: A Semantics for Understanding React Hooks [0.8] React Hooksの本質のセマンティクスの形式化であるReact-tRaceを紹介します。
理論的には、Hooksの本質的な性質を具現化していることを示し、我々のモデルがReactの挙動を捉えていることを実証する。
また、Hooksのセマンティクスをよりよく理解する方法を示すために、形式化に基づいた実用的な視覚化ツールを紹介します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:24:35 GMT)
End-to-End Analysis of Charge Stability Diagrams with Transformers [0.8] トランスフォーマーモデルとエンドツーエンドの学習フレームワークは、人工知能の分野に急速に革命をもたらしている。
本研究では,半導体量子ドットアレイの電荷安定性図を解析するために物体検出変換器を適用する。
3つの異なるスピン量子ビットアーキテクチャの性能において、畳み込みニューラルネットワークを上回っていることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:54:22 GMT)
DiagECG: An LLM-Driven Framework for Diagnostic Reasoning via Discretized ECG Tokenization [0.8] 本稿では,時系列と言語モデリングを統合した新しいフレームワークであるDiagECGを紹介する。
本手法は,リード非依存エンコーダと量子化モジュールを用いて,連続ECG埋め込みをシンボリックトークンに識別する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:13:37 GMT)
Faster Convergence of Riemannian Stochastic Gradient Descent with Increasing Batch Size [0.7] バッチサイズの増加は、一定のバッチサイズを使用するよりも、RSGD収束率の向上につながる。
バッチサイズの増加は、RSGDのSFOを減少させる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:11:28 GMT)
VQE-generated quantum circuit dataset for machine learning [0.7] 変動量子固有解法により最適化された量子回路のデータセットを提供する。
このデータセットは量子的手法で容易に学習できることが示される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:37:47 GMT)
LLM4Sweat: A Trustworthy Large Language Model for Hyperhidrosis Support [0.7] 大規模言語モデル(LLM)は医療において有望であるが、そのアプリケーションは微調整のための不足と信頼性の低いデータセットによって妨げられている。
LLM4Sweatは,信頼性と共感性ハイヒドロシス支援のためのオープンソースフレームワークである。
LLM4Sweatはベースラインを上回り、ハイパーヒドロシスのための最初のオープンソースのLLMフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:04:20 GMT)
Neural-Network solver of ideal MHD equilibria [0.7] 本稿では,ニューラルネットワークを用いたフーリエモードのパラメータ化による3次元磁気流体平衡の計算手法を提案する。
我々は、最小限の複雑なニューラルネットワークを使用し、ニューラルネットワークで単一の平衡を解くだけでなく、平衡の連続分布に有効なニューラルネットワークモデルを計算するための大幅な改善を期待する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:53:43 GMT)
Do LLMs write like humans? Variation in grammatical and rhetorical styles [0.6] 大きな言語モデル(LLM)は、指示に従い、質問に答え、問題を解決する文法的なテキストを書くことができる。
進歩するにつれて、その出力を人文テキストと区別することは困難になっている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:55:45 GMT)
Effect Identification and Unit Categorization in the Multi-Score Regression Discontinuity Design with Application to LED Manufacturing [0.6] サブルールの適合者に対するカットオフ効果を推定する際に,このような「ファジィ」のいくつかを識別・低減するツールを開発する。
光電子半導体製造におけるシミュレーションおよび実世界のデータに関する枠組みを検証した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:17:15 GMT)
M-$LLM^3$REC: A Motivation-Aware User-Item Interaction Framework for Enhancing Recommendation Accuracy with LLMs [0.6] 本稿では,M-$LLM3$RECと呼ばれる新しいレコメンデーションフレームワークを提案する。
モチベーション駆動のセマンティックモデリングを強調することで、M-$LLM3$RECは堅牢でパーソナライズされ、一般化可能なレコメンデーションを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:50:13 GMT)
Evaluating classical simulations with a quantum processor [0.6] スケーリング予測は局所構造と仮定に基づいている。
量子アニールプロセッサを用いて古典的テンソルネットワークの評価を行う。
以上の結果から,古典シミュレーションと量子シミュレーションの競争の活発なサイクルが,両方向の洞察を導出できることが示唆された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:55:53 GMT)
Colour Codes Reach Surface Code Performance using Vibe Decoding [0.5] 2次元の量子色符号は、量子誤り訂正に重要な可能性を秘めている。
理論上の魅力にもかかわらず、これらのコードの実践的な展開は課題に直面している。
本稿では、表面コードと同等のカラーコード性能を初めてもたらすビブデコーディングについて紹介する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:38:42 GMT)
Intersubjective Agreement about Quantum States Is Unnecessary in QBism [0.5] 我々は、量子状態に対する異種間合意は不要であると主張する。
我々は、QBistの相互性の概念は、量子系を客観化することの意味をより明確に特徴づけるものであると論じる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:31:12 GMT)
Towards Comprehensive Cellular Characterisation of H&E slides [0.5] HistoPLUSは、細胞解析のための最先端のモデルである。
13種類の細胞を含む108,722個の核からなる、新しい硬化したパンがんデータセットを訓練する。
現在の最先端モデルでは、検出品質が5.2%、全体的なF1分類スコアが23.7%を上回っている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:22:07 GMT)
See it. Say it. Sorted: Agentic System for Compositional Diagram Generation [0.5] スケッチ・トゥ・ダイアグラムの生成について研究し、粗い手書きスケッチを正確な構成図に変換する。
視覚言語モデル(VLM)とLarge Language Models(LLM)を結合した学習自由エージェントシステムSorted.を紹介する。
このシステムは、批判的VLMが小さな定性的な編集セットを提案する反復ループを実行し、複数の候補LPMが様々な戦略で更新を合成する。
この設計は、不安定な数値推定よりも定性的推論を優先し、大域的制約(例えば、アライメント、接続性)を保存し、自然に人間のループをサポートする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:20:36 GMT)
Bayesian Inference and Learning in Nonlinear Dynamical Systems: A Framework for Incorporating Explicit and Implicit Prior Knowledge [0.5] 本稿では,既知の動的関数と未知のシステム部品の学習に基づく近似を組み合わせた新しいインタフェースを提案する。
ユーザに適した座標変換やモデル逆変換は不要であり、提示されたフレームワークは推論と学習のための汎用ツールとなる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:23:14 GMT)
Computational Intelligence based Land-use Allocation Approaches for Mixed Use Areas [0.4] 都市の土地利用配分は、持続可能な都市開発政策に不可欠な複雑な多目的最適化問題である。
本稿では,混合利用地域における土地利用配分最適化のための新しい計算知能手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:00:44 GMT)
Beyond Imaging: Vision Transformer Digital Twin Surrogates for 3D+T Biological Tissue Dynamics [0.4] Vision Transformer Digital Twin Surrogate Network (VT-DTSN)は、生体組織からの3D+T画像データの予測モデリングのためのディープラーニングフレームワークである。
VT-DTSNはショウジョウバエミガットの高忠実で時間分解されたダイナミクスを再構築することを学ぶ。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:24:24 GMT)
Self-supervised physics-informed generative networks for phase retrieval from a single X-ray hologram [0.4] フレネル理論の近場状態における位相探索の逆問題に対する自己学習手法を提案する。
位相探索のための多くの深層学習アプローチとは異なり、我々の手法はペアリング、アンペアリング、シミュレートされたトレーニングデータを必要としない。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:06:06 GMT)
Toward Errorless Training ImageNet-1k [0.4] 我々は、ImageNet 2012コンテストデータセットに基づいてトレーニングされたフィードフォワード人工ニューラルネットワークについて述べる。
最高の性能モデルは322,430,160のパラメータを使用し、4つの10桁の精度を持つ。
我々は、我々のモデルが100%精度を達成できない理由は、二重ラベル問題に起因すると推測する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:37:35 GMT)
SleepDIFFormer: Sleep Stage Classification via Multivariate Differential Transformer [0.4] 不眠症などの睡眠障害の診断には睡眠ステージの分類が不可欠である。
機械学習と深層学習は活発に開発されているが、脳波(EEG)と脳波(EOG)の非定常性と変動性の課題に直面し続けている。
本研究では,共同脳波とEOG表現学習のためのSleepDIFFormerを開発した睡眠段階分類法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:59:10 GMT)
KEA Explain: Explanations of Hallucinations using Graph Kernel Analysis [0.4] 大型言語モデル(LLM)は幻覚を頻繁に生成する。
この研究はKEA(Kernel-Enriched AI) Explain: このような幻覚を検知し、説明するニューロシンボリックなフレームワークを提示する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:34:15 GMT)
LV-Net: Anatomy-aware lateral ventricle shape modeling with a case study on Alzheimer's disease [0.3] 我々は,脳MRIから3次元LVメッシュを生成するための新しいフレームワークであるLV-Netを紹介した。
セグメンテーションの不完全性が存在する場合でも,LV-Netはより優れた再構成精度が得られることを示す。
LV-Netをアルツハイマー病解析に適用し,LVサブリージョンの同定を行った。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:16:33 GMT)
ContextualLVLM-Agent: A Holistic Framework for Multi-Turn Visually-Grounded Dialogue and Complex Instruction Following [0.3] MMDR-Bench(Multi-Modal Dialogue Reasoning Benchmark)は,300の複雑なマルチターン対話シナリオからなる新しいデータセットである。
また,既存のLVLMを高度な推論と命令追従機能で拡張する包括的フレームワークであるCoLVLM Agent(Contextual LVLM Agent)を提案する。
MMDR-Benchを用いた実験により,CoLVLM Agentは高い性能を示し,平均評価スコアは4.03。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:09:02 GMT)
Leveraging Large Language Models for Explainable Activity Recognition in Smart Homes: A Critical Evaluation [0.3] XAIは、スマートホームにおけるセンサによる日常生活活動(ADL)認識に適用されている。
本稿では,XAIとLarge Language Models(LLM)を組み合わせたセンサを用いたADL認識の可能性について検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:02:11 GMT)
LORE: Latent Optimization for Precise Semantic Control in Rectified Flow-based Image Editing [0.3] トレーニング不要で効率的な画像編集手法であるLOREを紹介する。
LOREは逆ノイズを直接最適化し、既存のアプローチの一般化と制御可能性の限界に対処する。
実験の結果,LOREはセマンティックアライメント,画像品質,背景忠実度において,強いベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:37:15 GMT)
Evaluating Structured Decoding for Text-to-Table Generation: Evidence from Three Datasets [0.3] 大規模言語モデル(LLM)を用いたテキスト・ツー・テーブル生成のための構造化復号の包括的評価を行う。
構造化デコーディングと標準ワンショットプロンプトの3つのベンチマーク(E2E、Rotowire、Livesum)を比較した。
その結果,構造化復号化は生成テーブルの妥当性とアライメントを著しく向上させるが,密集したテキスト情報を含むコンテキストでは性能が低下する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:11:16 GMT)
Conditionally adaptive augmented Lagrangian method for physics-informed learning of forward and inverse problems using artificial neural networks [0.2] 本稿では,物理・等式制約付きニューラルネットワーク(PECANN)フレームワークについて述べる。
拡張ラグランジアン法(ALM)を一般化し、複数の独立ペナルティパラメータをサポートする。
我々は、制約項に対する期待として、ポイントワイズ制約強制とラグランジュ乗算を再構成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:22:40 GMT)
Enhancing Forecasting with a 2D Time Series Approach for Cohort-Based Data [0.2] 本稿では、時間とともにコホートな振る舞いを統合し、小さなデータ環境における課題に対処する新しい2次元時系列予測モデルを提案する。
複数の実世界のデータセットを用いてその有効性を実証し、参照モデルと比較して精度と適応性に優れた性能を示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:53:40 GMT)
Representation Learning with Adaptive Superpixel Coding [0.2] 適応スーパーピクセル符号化(ASC)と呼ばれるトランスフォーマーに基づく自己教師型モデルを提案する。
我々のモデルの主な洞察は、固定サイズおよび非適応パッチパーティショニングに依存する従来のビジョントランスフォーマーの制限を克服することである。
提案手法は,提案手法が標準画像下流タスクベンチマークにおいて広く用いられている手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:57:20 GMT)
Industrial Steel Slag Flow Data Loading Method for Deep Learning Applications [0.2] 鉄鋼鋳造プロセスはスラグ流汚染による財政的損失に弱い。
本研究では, 産業用鋼製鋳物から収集した振動データを用いたクロスドメイン診断手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:48:11 GMT)
Using a cognitive architecture to consider antiBlackness in design and development of AI systems [0.2] 認知モデルを用いて、AIシステムの設計と開発に反黒人性と人種差別がより広範囲に影響を及ぼす方法を考えるにはどうすればよいのか?
我々はACT-R/Phi認知アーキテクチャと既存の知識グラフシステムであるConceptNetを用いてこの問題を考察する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:14:09 GMT)
Numerical models outperform AI weather forecasts of record-breaking extremes [0.2] 記録破りの気象極端の場合、数値モデルHigh Resolution予測は依然として最先端のAIモデルを上回っていることを示す。
AIモデルの予測誤差は、ほぼすべてのリードタイムにおけるHRESよりも、記録破りの暑さ、寒さ、風速に対して一貫して大きいことを実証する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:07:16 GMT)
Adapting A Vector-Symbolic Memory for Lisp ACT-R [0.2] Holographic Declarative Memory (HDM) は、ACT-RのDeclaative Memory (DM) システムに代わるベクトルシンボルである。
我々は、最も包括的で広く使われているACT-R(Lisp ACT-R)の実装にHDMを適用した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:54:25 GMT)
MC-PDFT Nuclear Gradients and L-PDFT Energies with Meta and Hybrid Meta On-Top Functionals for Ground- and Excited-State Geometry Optimization and Vertical Excitation Energies [0.1] メタGAおよびハイブリッドメタGAオントップ関数を用いたMC-PDFT計算のための解析的核勾配法を開発した。
MC-PDFT計算はオントップ関数の微分を含むため、メタGAオントップ関数をL-PDFT単点エネルギー計算に使用することもできる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:43:50 GMT)
Software Model Checking via Summary-Guided Search (Extended Version) [0.1] GPSは、プログラムチェックのタスクを、プログラム状態の直接検索として扱う。
安全性の証明と、安全性に対する反例の両方を見つけることができる。
GPSは、長い入力依存のエラーパスを含むプログラムでバグを見つけることができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:19:43 GMT)
GraSP: A Unified Graph-Based Framework for Scalable Generation, Quality Tagging, and Management of Synthetic Data for SFT and DPO [0.1] 大規模言語モデル(LLM)のための総合的な合成データ生成フレームワークを提案する。
本手法では,手作業による介入を最小限に抑えた複雑な対話フローをモデル化可能なモジュール型および構成型パイプラインを用いる。
得られたデータセットは、SFTとDPOの両方のユースケースをサポートするフレキシブルなスキーマの下で構成され、多様なトレーニングへのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:35:41 GMT)
Improving Predictions of Convective Storm Wind Gusts through Statistical Post-Processing of Neural Weather Models [0.1] ニューラル気象モデル(NWM)の最近の進歩は、0.25degのグローバルグリッド上での大気環境の予測に、計算的に安価で高速なアプローチを提供する。
雷雨の場合、これらの環境は特定の場所で風速分布を予測するために経験的に後処理することができる。
そこでPangu-Weather NWMでは,時間ごとの風速を最大3日前に予測するために,統計的および深層学習後処理手法の階層化を適用した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:38:42 GMT)
Clinically-Informed Preprocessing Improves Stroke Segmentation in Low-Resource Settings [0.1] 2~9日後にDWIからの注視後病変量を予測するために,入ってくるCT画像を入力として利用する一連のモデルを開発した。
提案したパイプラインは、ベースライン前処理でトレーニングされたnnU-Netモデルと比較して、10倍以上のDiceスコアが38%改善される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:43:17 GMT)
Annif at the GermEval-2025 LLMs4Subjects Task: Traditional XMTC Augmented by Efficient LLMs [0.0] 本稿では,GermEval-2025におけるLLMs4Subjects(Subtask 2)におけるAnnifシステムについて述べる。
このタスクは、計算効率に特に焦点をあてた大きな言語モデルを用いて、レコードの主題予測を作成する必要があった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:04:20 GMT)
Noise, Adaptation, and Strategy: Assessing LLM Fidelity in Decision-Making [0.0] 大規模言語モデル(LLM)は、社会科学シミュレーションでますます使われている。
本研究では,LLMエージェントが外部誘導と人為的ノイズのレベルが異なる条件下でどのように適応するかを検討するためのプロセス指向評価フレームワークを提案する。
LLMは、デフォルトでは、観察された人間の行動から分岐する安定的で保守的な戦略に収束する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:55:53 GMT)
Quantum algorithm for linear matrix equations [0.0] 線形行列方程式 AX+XB=C を解くための効率的な量子アルゴリズムについて述べる。
提案手法は, x を正規化に必要な再スケーリング因子とするブロック符号化における解行列 X/x を構成する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:58:20 GMT)
Stemming -- The Evolution and Current State with a Focus on Bangla [0.0] 世界で7番目に広く話されている言語であるBanglaは、限られたリソースと注釈付きデータセットの欠如により、デジタルの低表現に直面している。
本稿では,形態的変異を効果的に扱うことの重要性を強調し,造形アプローチの包括的調査を行う。
この論文は、堅牢なバングラ・スリーマーを提唱し、言語分析と処理を強化するためにこの分野の研究を継続することで締めくくっている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:54:24 GMT)
Sesame: Opening the door to protein pockets [0.0] 本稿では,コンフォメーション変化を効率的に予測するための生成モデルであるSesameを紹介する。
Sesameは、仮想スクリーニングを改善するスケーラブルなソリューションを提供することを目指している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:22:56 GMT)
XDR-LVLM: An Explainable Vision-Language Large Model for Diabetic Retinopathy Diagnosis [0.0] LVLMを用いたXDR-LVLM(eXplainable Diabetic Retinopathy diagnosis with LVLM)を提案する。
XDR-LVLMは特殊な医療ビジョン、LVLMコアを統合し、マルチタスク・プロンプトエンジニアリングとマルチステージファインチューニングを採用している。
最先端のパフォーマンスを実現し、バランスド精度は84.55%、F1スコアは79.92%、概念検出には優れた結果が得られる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 02:14:46 GMT)
Wavefunction optimization at the complete basis set limit with Multiwavelets and DMRG [0.0] マルチウェーブレットに基づくマルチレゾリューション解析(MRA)におけるDMRGの統合アルゴリズムを開発した。
我々は、MRA領域に代表される軌道に対する既存のラグランジアン最適化アルゴリズムを採用し、その計算効率を向上させる。
本手法をH2,He,HeH2,BeH2,N2などの小系に適用する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:08:11 GMT)
Universal Statistics of Charges Exchanges in Non-Abelian Quantum Transport [0.0] 我々は、エネルギーと粒子輸送に関するよく知られた熱交換変動定理を、非アベリア量子輸送の場合に拡張する。
これは、熱力学の第2法則に明らかに違反する可能性があることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:16:24 GMT)
Uncertainty Relation for the Wigner-Yanase Skew Information and Quantum Sobolev Inequalities [0.0] 本稿では,Wigner-Yanaseスキュー情報を含むフィッシャー情報の量子アナログに対する不確実性について考察する。
通勤者に関するいくつかの追加の不等式は導出され、他のものは開問題として残される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:35:12 GMT)
Two pathways to resolve relational inconsistencies [0.0] 我々は、小さな違反が期待される関係の調整につながり、大きな違反は異なるメカニズムで解決されることを示した。
これらの結果から,期待値違反に直面した場合の事前期待値の安定性は,学習力学の自然な結果であることが示唆された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:55:38 GMT)
Tutorial on the Probabilistic Unification of Estimation Theory, Machine Learning, and Generative AI [0.0] 本調査では,古典的推定理論,統計的推論,現代の機械学習を結合した統一的な数学的枠組みを提案する。
本稿では,最大推定,ベイズ推定,注意機構などの手法が不確実性にどう対処するかを示す。
理論的な合成と、機械学習の進化する風景をナビゲートする学生や研究者のための実践的なガイドとして機能する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:57:33 GMT)
Trotter-based quantum algorithm for solving transport equations with exponentially fewer time-steps [0.0] 本稿では, 量子状態の生成, 進化, 関連する可観測物の測定という3つのステップに基づく量子数値スキームを提案する。
また、予測ベクトルノルムスケーリングを確認するための効率的な量子回路と数値シミュレーションも提示する。
この研究は、プラズマ物理学、分子気体力学、非線形力学系に応用可能な量子コンピュータ上の輸送現象を効率的にシミュレートするための実践的な枠組みを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:14:05 GMT)
Training neural control variates using correlated configurations [0.0] NCVはモンテカルロ (MC) シミュレーションにおいて分散低減のための強力なツールとして登場した。
マルコフ・チェイン・モンテカルロ(MCMC)が生成した自己相関サンプルは,基礎となる確率分布の構造に関する有用な情報を含む可能性がある。
これらの知見は、ニューラルネットワークのトレーニングにおけるMCMCデータの効率的な利用のための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:40:24 GMT)
Tomographic markers and photon addition to coherent states of light: Comparison with experiment [0.0] 光のコヒーレントな状態に対する光子付加の文脈において重要な役割を果たすマーカーの集合を同定する。
我々は光子付加による増幅利得と関連するパラメータに対する二次分散の依存性を計算した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:18:20 GMT)
The concept of minimal dissipation and the identification of work in autonomous systems: A view from classical statistical physics [0.0] オープン量子システム上での作業を定義する手段として,最小散逸の概念について議論する。
作業の有用な定義を満たさなければならない条件の一つは、無限の熱容量を持つ環境との弱い結合の限界において、作業の熱力学的な概念を再現することである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:23:09 GMT)
The Quantum Ensemble Variational Optimization Algorithm: Applications to Molecular Inverse Design [0.0] 本稿では,QEVO(Quantum Ensemble Variational Optimization)法を提案する。
QEVOは分子構造を、重ね合わせ状態からパウリ弦とサンプルの正規直交基底に効率的にマッピングする。
分子設計におけるQEVOの可能性を示す数値シミュレーションを行った。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:00:12 GMT)
The Enemy from Within: A Study of Political Delegitimization Discourse in Israeli Political Speech [0.0] 政治復調談話(PDD)の大規模計算研究について紹介する。
PDDは、政治的実体の規範的妥当性に対する象徴的な攻撃である。
我々は、クネセト語から引かれた10,410文からなるヘブライ語コーパスを使用する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:57:04 GMT)
Teleportation based detection of quantum critical points using small spin chains [0.0] テレポーテーションに基づく量子臨界点(QCP)検出器は、熱力学限界に近づいていないときでも、QCPの位置を適切に推定できることを示す。
ここでは,ほぼすべてのモデルに対して,QCPの正しい位置のわずか数パーセントの誤差で検出できることが示されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:01:29 GMT)
Targeted Nakamoto: A Bitcoin Protocol to Balance Network Security and Carbon Emissions [0.0] ターゲットナカモト(Targeted Nakamoto)は、ターゲットのハッシュレート間隔で鉱山労働者を誘引するProof-of-Workプロトコル拡張である。
ハッシュレートが目標以上の場合、天井は、採掘者が受け取ることができるブロック報酬の上に置かれる。
ハッシュレートが目標より下にある場合、床は採掘者のブロック報酬の下に置かれる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:15:07 GMT)
Strategic Sample Selection for Improved Clean-Label Backdoor Attacks in Text Classification [0.0] クリーンラベルシナリオにおける攻撃効率向上のための3つのサンプル選択手法を提案する。
提案手法は,モデルが誤った又は低い信頼度で予測するサンプルを識別し,そのようなサンプルにバックドアトリガを注入することにより,トリガーパターンと攻撃者が望んだターゲットラベルとのより強い関連性を誘導することを目的とする。
その結果,提案手法はランダムなサンプル選択よりもASRを大幅に改善し,モデルのクリーンな精度をほとんどあるいは全く損なわないことがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:53:26 GMT)
Statistical analysis of multivariate planar curves and applications to X-ray classification [0.0] 本研究は、教師付き分類コンテキストにおいて、セグメンテーションされたイメージを予測子として利用する方法について検討する。
画像中の物体の形状を考慮に入れた画像解析のための新しい手法を開発した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:42:05 GMT)
Semantic Attractors and the Emergence of Meaning: Towards a Teleological Model of AGI [0.0] このエッセイは、複雑な意味空間における意味的誘引者の概念に基づく意味的汎用知能(AGI)の理論的枠組みを開発する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:57:52 GMT)
Sadeed: Advancing Arabic Diacritization Through Small Language Model [0.0] Sadeedはアラビア語の発音のための新しいデコーダのみの言語モデルである。
Sadeedは、厳格なデータクリーニングと正規化パイプラインを通じて構築された、慎重にキュレートされた高品質なダイアグラム化されたデータセットに微調整されている。
SadeedDiac-25は、さまざまなテキストジャンルや複雑性レベルに対して、より公平で包括的な評価を可能にするために設計された、新しいベンチマークである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:56:26 GMT)
STAGNet: A Spatio-Temporal Graph and LSTM Framework for Accident Anticipation [0.0] 事故やタイムリーな警告は、道路利用者の怪我のリスクを低減し、財産被害を最小限に抑えることにより、道路安全を改善する上で重要な役割を担っている。
Advanced Driver Assistance Systems (ADAS)は、人間のドライバーを支援するように設計されており、事故が起こる前に潜在的な事故を予測できる場合に特に有用である。
多くの既存のシステムはLiDAR、レーダー、GPSなどのセンサーに依存しているが、ダッシュカムのビデオ入力のみに依存しているため、より困難だがコスト効率が高く、容易にデプロイできるソリューションが提示される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:02:22 GMT)
SLM4Offer: Personalized Marketing Offer Generation Using Contrastive Learning Based Fine-Tuning [0.0] 優れたパーソナライゼーション戦略は、収益を最大40%増やすことができる。
この研究は、パーソナライズされたオファー生成のための生成AIモデルであるSLM4Offerを紹介する。
実験の結果,教師付き微調整ベースラインよりも17%改善した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:47:24 GMT)
Robust Self-Testing of Multiqudit Supersinglet Slater States via Constant Number of Binary Measurements [0.0] 自己検査は、観測された相関のみに基づいて、量子状態と物理実験にかかわる測定の両方の形を推定できる強力な技術である。
本稿では,観測者毎に一定数の2値測定しか行わない,真に絡み合った状態の関連クラスの最初の自己検定手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:27:20 GMT)
Reliable Entropy Estimation from Observed Statistics for Device-Independent Quantum Cryptography [0.0] 本稿では,デバイス非依存型量子暗号とランダムネス抽出のシナリオにおいて,条件付きvon-Neumannエントロピーの下位境界を確立するための数値的枠組みを提案する。
このフレームワークは、実用的な量子暗号プロトコルに適応可能なツールを提供し、信頼できない環境でセキュアな通信を拡張する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:04:36 GMT)
Real-Time Beach Litter Detection and Counting: A Comparative Analysis of RT-DETR Model Variants [0.0] 沿岸汚染は世界的な環境問題であり、監視と管理のためにスケーラブルで自動化されたソリューションを必要とする。
本研究では, リアルタイム検出変換器(RT-DETR)の海浜ゴミの自動検出・計数への応用について検討した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:47:12 GMT)
Reading Between the Lines: A Study of Thematic Bias in Book Recommender Systems [0.0] 本論文では,特定の主題を不当に好むか無視するものとして定義された書籍推薦におけるテーマバイアスについて紹介し,考察する。
我々は,推薦におけるテーマバイアスとその異なるユーザグループへの影響を評価するために,多段階のバイアス評価フレームワークを採用する。
その結果,テーマバイアスはコンテンツの不均衡から発生し,ユーザのエンゲージメントパターンによって増幅されることがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:20:39 GMT)
RCDINO: Enhancing Radar-Camera 3D Object Detection with DINOv2 Semantic Features [0.0] 3次元物体検出は、自律走行とロボット工学にとって不可欠である。
この研究は、視覚バックボーン機能を強化するマルチモーダルトランスフォーマーベースのモデルであるRCDINOを提案する。
nuScenesデータセットの実験では、RCDINOがレーダーカメラモデル間で最先端のパフォーマンスを達成することが示されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:33:36 GMT)
R-ConstraintBench: Evaluating LLMs on NP-Complete Scheduling [0.0] R-ConstraintBenchは、資源制約計画スケジューリング問題(RCPSP)のモデルを評価するフレームワークである。
データセンターのマイグレーション設定でベンチマークをインスタンス化し、実行可能性とエラー分析を用いて複数のLCMを評価する。
実証的には、強いモデルは優先順位のみのDAGでほぼシーリングされるが、ダウンタイム、時間的ウィンドウ、および解離的制約が相互作用すると、実現可能性のパフォーマンスは低下する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:35:58 GMT)
Quantum-enhanced parameter estimation in continuously monitored boundary time crystals [0.0] 時間-結晶相において、最終的な精度はシステムサイズで立方体スケール($f_mathrmglobalsim N3$)を示す。
そして、実験的にアクセス可能な戦略を用いて、この境界が既に有限$N$で達成可能であることを数値的に示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:11:30 GMT)
Quantum control of Nitrogen-Vacancy spin in Diamonds: Towards matter-wave interferometry with massive objects [0.0] 質量粒子を持つ物質波干渉計は、空間重畳原理を含む多くの基本的なアイデアをテストすることができる。
本研究は, バルクダイヤモンドおよび浮遊ダイヤモンド中の窒素空孔スピン系の量子制御に関する研究である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:31:11 GMT)
Quantum computing inspired paintings: reinterpreting classical masterpieces [0.0] 我々は、アートワークを構成するために量子コンピューティング技術を適用することを目指している。
主な構想は、ミケランジェロ・メリシ(Caravaggio)が1597年-1599年頃に描いた「ナルコソ」、1964年にレネ・マグリッテが描いた「Les fils de l'homme」、1966年にジェラルド・リヒターが描いた「192 Farben」である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:54:10 GMT)
Quantum Co-Magnetometer Using Diamond Nitrogen-Vacancy Centers and Rubidium Cells [0.0] ダイヤモンド中の窒素-原子価(NV)中心とルビジウム(Rb)気相セルを組み合わせたハイブリッド量子センサを試作した。
Rb原子を含む微細加工されたmmスケールの蒸気セルはバルクダイヤモンドと結合し、両方の量子系の光学的およびマイクロ波的制御を可能にする。
シミュレーションと実験により、磁場測定におけるシステムの精度が向上し、10dB以上の改善が示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:03:16 GMT)
Quantum Brownian motion induced by fluctuating boundaries and compactification [0.0] 2つのゆらぎ点のような境界によって生じる点電荷の量子ブラウン運動について検討する。
各系の長さスケールに波動関数を関連付けることで、固定境界とコンパクト化サイズを持つシナリオによく現れる典型的な発散が効果的に滑らかになることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:51:40 GMT)
Proposal for an autonomous quantum heat engine [0.0] コヒーレントマイクロ波発電は、非線形回路の量子電磁力学によって決定された回路を通る熱の流れからのみ現れる。
この研究は、オットーサイクルに基づく自律量子熱エンジンの初の実験的実現に向けた重要なステップである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:21:45 GMT)
Principle Methods of Rendering Non-equivalent Words from Uzbek and Dari to Russian and English [0.0] 本研究では、ソース言語からターゲット言語への非等価な単語の描画方法と規則について述べる。
25の非等価な単語がダル&ウズベク語から英語とロシア語に翻訳されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:18:04 GMT)
Predicting Road Crossing Behaviour using Pose Detection and Sequence Modelling [0.0] この研究は、歩行者による道路横断の意図を実験的に予測することに焦点を当てた。
この研究は、時間的予測のためのポーズとシーケンスモデリングを予測するために、深層学習モデルを用いた。
その結果, LSTMモデルよりもGRUの方が意図を予測できるが, 1D CNNは速度の面では最良のモデルであった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:08:50 GMT)
Panoptic Segmentation of Environmental UAV Images : Litter Beach [0.0] CNNは、世界中の問題となっている海洋ゴミのモニタリングに役立てることができる。
そこで,本研究では,サンプル数個で精度のよいインスタンスベースセグメンテーション法とパノプティックセグメンテーション法を用いる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:07:59 GMT)
Orthocomplemented subspaces and partial projections on a Hilbert space [0.0] ヒルベルト空間 H の直補部分空間、すなわち H の閉部分空間の対の概念を導入する。
補足部分集合はその特性関数に対応する。
H の部分空間は H 上の部分射影に対応する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:07:29 GMT)
Opus: A Prompt Intention Framework for Complex Workflow Generation [0.0] Opus Prompt Intention Frameworkは命令調整型大言語モデル(LLM)による複雑な生成を改善するように設計されている
ユーザクエリから信号や意図を抽出する,カスタマイズ可能な意図キャプチャシステムを提案する。
提案システムでは,ユーザクエリからの直接生成と比較して,生成品質が著しく向上することを示す実証的証拠を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:08:38 GMT)
Optomechanically induced transparency, absorption, and conversion between slow and fast light in a generalized cross-Kerr optomechanical circuit [0.0] マイクロ波-オプトメカニカルハイブリッド回路において、可変光誘起透過(OMIT)および光誘起吸収(OMIA)現象を実現するための実験可能なスキームを提案し、検討する。
提案されたハイブリッド光学回路は、光伝搬、物理量の量子センシング、情報処理における潜在的な応用を見出すことができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:55:08 GMT)
Optimizing energy conversion with nonthermal resources in steady-state quantum devices [0.0] 非熱的資源によって供給されるコヒーレント量子導体におけるエネルギー変換過程を最適化するための枠組みを提供する。
熱資源を利用した装置と比較して性能が向上したことを示す。
この結果は,将来のナノエレクトロニクスデバイスにおけるエネルギー変換プロセスの設計ガイドラインとして機能する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:52:40 GMT)
Optimising the relative entropy under semidefinite constraints [0.0] 半定値制約の下で2つの量子状態の最小相対エントロピーを見つけることは、量子情報理論における重要な問題である。
我々は最近導入された[Frenkel, Quantum 7, 1102 (2023) による量子相対エントロピーの積分表現の上に構築し、半定値プログラム(SDP)の列として信頼性のある境界を提供する。
提案手法は,SDP行列次元の観点から資源効率を保ちながら,離散化における証明可能なサブ線形収束を保証する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:12:30 GMT)
Online Convex Optimization and Integral Quadratic Constraints: An automated approach to regret analysis [0.0] 我々は,厳密な凸とリプシッツ・スムース目的に対する一階制約付きオンライン凸最適化アルゴリズムの動的後悔を分析した。
我々は、オンラインアルゴリズムに対する後悔の保証を提供する半確定的なプログラムを導出する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:45:11 GMT)
On the Fundamental Impossibility of Hallucination Control in Large Language Models [0.0] 本稿では,非自明な知識集約を行うLLMが真理的な知識表現を達成できないという,基本的な不合理性定理を確立する。
幻覚と創造性の両方のサインである、過信または直感的な反応の創造の定量化方法を示す。
私たちは、先進的なAIシステムでこれらの振る舞いを管理するための原則化された基盤を提供します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:58:34 GMT)
Non-Commutative weak measurements: Entanglement, Symmetry Breaking, and the Role of Readout [0.0] 量子計測による長距離絡み合い状態(LRE)の調製は有望な戦略である。
ここでは、競合する非可換な弱い測定の最小モデルから生じる豊富な位相構造について検討する。
本研究では,測定結果の読み出し結果に基づいて,実験的な3つのシナリオを解析する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:12:15 GMT)
Neutralization of Levitated Charged Nanodiamond: Towards matter-wave interferometry with massive objects [0.0] 紫外光電子分光法による浮遊ナノダイヤモンドの中和を実証した。
針状ポールトラップ内のナノダイアモンドを0.5,Torrの圧力で個別に単電子電荷操作することを示した。
これはナノダイアモンド空間干渉計の実現に向けた重要な一歩となる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:50:58 GMT)
Negative currents in Fabry-Pérot cavities are caused by interfering paths [0.0] Fabry-P'erotキャビティ内の時間依存電流は、印加された電圧パルスが常に正であっても負に変化する。
ここではフロケ散乱理論を用いて、負の電流がキャビティ内の散乱経路の干渉によって引き起こされることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:01:20 GMT)
Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model [0.0] 我々は、アラビア語と英語の双方向翻訳のためのコンパクトだが強力な言語モデルであるMutarjimを紹介する。
また、既存のアラビア語と英語のベンチマークデータセットの制限を克服するために設計された新しいベンチマークであるTarjama-25も導入した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:51:52 GMT)
Multipole expansion for dispersion forces -- watch this trace [0.0] その結果,オクタポールモーメントの痕跡は静電状態を超えたカシミール・ポルダー相互作用に寄与することが判明した。
特に、オクタポールモーメントの痕跡は静電状態を超えたカシミール・ポルダー相互作用に寄与することを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:03:28 GMT)
Multiply Robust Conformal Risk Control with Coarsened Data [0.0] コンフォーマル予測(CP)は近年,膨大な関心を集めている。
本稿では、粗いデータから得られる結果に対して、分布自由な有効予測領域を得るという一般的な問題について考察する。
半パラメトリック理論の原則的利用は、フレキシブルな機械学習手法の促進の鍵となる利点を持つ。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:14:44 GMT)
Multilateralism in the Global Governance of Artificial Intelligence [0.0] この章は、人工知能の汎用技術の出現に国際多元主義がどのように対処するかを問うものである。
AI多元主義の主な特徴は、その一般化された原則と、AIの領域における国家関係の調整である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:39:04 GMT)
Multifractality in high-dimensional graphs induced by correlated radial disorder [0.0] 障害相関によって誘導される頑健で解析的に実証可能な多フラクタル性を含むモデルのクラスを紹介する。
この多重フラクタル性の存在は、グラフの有効一次元鎖への創発的な断片化によって支えられていることが示されている。
これらの鎖上の状態の指数的局所化と根からの距離を持つ部位の指数的増加との相互作用は、観測された多フラクタル性の起源である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:34:06 GMT)
Multidimensional Distributional Neural Network Output Demonstrated in Super-Resolution of Surface Wind Speed [0.0] 多次元ガウス損失を持つニューラルネットワークのトレーニングフレームワークを提案する。
このフレームワークは、非同一分布およびヘテロセダスティック構造を持つ出力上の閉形式予測分布を生成する。
科学的モデルにおける不確実性を考慮した予測の適用性について論じる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:22:44 GMT)
Monolithic Hybrid Recommender System for Suggesting Relevant Movies [0.0] 本稿では,視聴映像のシーケンスと関連映画の視聴率を考慮した協調フィルタリングの2つの手法について考察する。
用途に応じて様々な重みが設定される。
この問題を解決するための文献と方法論のアプローチについて論じられた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:44:34 GMT)
Measures of Overlapping Multivariate Gaussian Clusters in Unsupervised Online Learning [0.0] データストリームからのオンライン学習の目的は、時間とともに適応可能なクラスタリング、分類、回帰モデルを作成することだ。
クラスタリングの場合、多くのクラスタが重複し、マージされる可能性がある。
提案した相似性測定は,相似性ではなく重なりを検出するように設計されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:06:02 GMT)
Matrix logistic map: fractal spectral distributions and transfer of chaos [0.0] ここでは, 間隔$[0, 1]$で支持される連続レベル密度を持つエルミート確率行列の初期アンサンブルに対して, レベル密度はロジスティック写像の不変測度に収束することを示す。
このアプローチは、結合ロジスティックマップの既知のモデルを一般化し、複雑なネットワークや多次元システムにおけるカオスへの移行の研究を可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:49:59 GMT)
Making AI Inevitable: Historical Perspective and the Problems of Predicting Long-Term Technological Change [0.0] 人工知能が人間の社会に変革をもたらすかどうかについて、深い意見の相違に焦点が当てられている。
この研究は、この議論において2つの基本的なキャンプを区別することから始まる。
これは、転換論者または懐疑的な立場を正当化するために使われる幅広い異なる議論を示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:18:37 GMT)
LongRetriever: Towards Ultra-Long Sequence based Candidate Retrieval for Recommendation [0.0] LongRetrieverは、超長いシーケンスをレコメンダの検索ステージに組み込むためのフレームワークである。
LongRetrieverは大規模なeコマースプラットフォームに完全にデプロイされており、数十億人のユーザーに影響を与える。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:06:36 GMT)
LoUQAL: Low-fidelity informed Uncertainty Quantification for Active Learning in the chemical configuration space [0.0] 量子化学計算では、忠実性の概念が存在し、より精度の低い計算はより安価な計算コストで利用できる。
本研究は, 多様な量子化学特性の予測に応用した, 能動的学習のための新しい低忠実性情報不確実性定量化法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:51:45 GMT)
Kuwain 1.5B: An Arabic SLM via Language Injection [0.0] 本稿では,新しい言語を大規模言語モデル(LLM)に統合する新しい手法を提案する。
我々は、アラビア語を主に英語で訓練された小さなオープンソースモデルに注入することで、クワインという名前の15億のパラメータを持つ小さなモデルを訓練した。
提案手法はアラビア語の性能が向上し,様々なベンチマークで平均8%の改善が見られた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:06:39 GMT)
KG-EDAS: A Meta-Metric Framework for Evaluating Knowledge Graph Completion Models [0.0] 知識グラフ(KG)を評価する上での大きな課題は、複数のデータセットとメトリクスのパフォーマンスを比較することだ。
我々は,平均解からの距離に基づくKG評価を提案し,マルチメトリック・マルチデータセットのパフォーマンスを統一的なランキングに組み込む。
EDASは、より情報のあるモデル選択をサポートし、データセット間の評価において公平性を促進するグローバルな視点を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:37:35 GMT)
Isoholonomic inequalities and speed limits for cyclic systems [0.0] 量子速度制限は、量子系が状態間で進化するために必要な時間に基本的な下限を設定する。
マンデルスタム・タム (Mandelstam-Tamm) やマルゴラス・レヴィチン (Margolus-Levitin) のような伝統的な境界は、状態の区別性に依存し、循環進化にとって自明なものとなる。
本研究では, 閉状態空間軌跡の長さをホロノミーで表す等ホロノミック不等式に基づく別のアプローチを検討する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:27:27 GMT)
Investigation of D-Wave quantum annealing for training Restricted Boltzmann Machines and mitigating catastrophic forgetting [0.0] 古典とQAのコントリビューションを組み合わせた新しいハイブリッドサンプリング手法について検討した。
この作業では、RBMトレーニングの改善は行われていない。
分布の低確率部分から十分な多様性のサンプルを生成する能力は、他の機械学習アプリケーションに利益をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:26:58 GMT)
Invariant Random Subgroups, Soficity, and Lück's determinant conjecture [0.0] 我々は、共双線型ではなく、従って共ソフィックでない決定的予想を満たすIRSの存在を証明した。
このことは、決定的予想を満たすことは、群に対する充足性よりも弱い性質であるかもしれないという証拠を与える。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 01:27:57 GMT)
Innamark: A Whitespace Replacement Information-Hiding Method [0.0] Innamarkと呼ばれる新しい情報隠蔽手法を提案する。
Innamarkは十分な長さのカバーテキスト内に任意のバイトエンコードされたシーケンスを隠せる。
本稿では、圧縮、暗号化、ハッシュ、エラー訂正を可能にする秘密メッセージの特定構造を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:16:30 GMT)
Incorporating device characterization into security proofs [0.0] 製造者のQKD機器のモデルパラメータの認証や特徴付け方法を示す。
このような手続きから有効に引き出すことが可能で、かつ不可能な結論の様々な形態について述べる。
また、構成可能なセキュリティフレームワークとの接続や、その方向で解決すべき技術的側面についても論じます。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:21:12 GMT)
Imperfect detectors for adversarial tasks with applications to quantum key distribution [0.0] 我々は不完全なしきい値検出器を解析するための一般的な枠組みを開発する。
ダークカウントや検出効率などの非文字化デバイスパラメータを,ある範囲で逆向きに制御されるものとして扱う。
本結果は,理論的セキュリティと実践的実装の関連性を高めるものである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:19:58 GMT)
Hybrid Least Squares/Gradient Descent Methods for DeepONets [0.0] DeepONetの出力は、分岐ネットワークの最後のパラメータに関して線形と見なすことができる。
本稿では,DeepONetの高速化に有効なハイブリッド最小/一方向降下法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:34:06 GMT)
Hybrid Autoregressive-Diffusion Model for Real-Time Streaming Sign Language Production [0.0] 本稿では,自己回帰モデルと拡散モデルを組み合わせて手話生成(SLP)モデルを生成するハイブリッドアプローチを提案する。
細かな体の動きを捉えるため,異なるアーティストから細かな特徴を別々に抽出するマルチスケール・ポース表現モジュールを設計した。
また、連立レベルの信頼スコアを利用してポーズ生成過程を動的にガイドする信頼意識型因果注意機構も導入する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:01:12 GMT)
High-fidelity, quasi-deterministic entanglement generation using phase-matched spectral islands in a zero-added-loss multiplexing architecture [0.0] 本稿では, スペクトル多重化手法を提案する。
私たちの提案における大きな革新は、同島棚付けと異島棚付けの両方を採用することです。
この隠蔽方式は、スペクトルチャネルの桁数を桁違いに減らし、衛星間または光ファイバーベースのZALMアーキテクチャの短期的な実装を可能にする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:47:11 GMT)
Hard Examples Are All You Need: Maximizing GRPO Post-Training Under Annotation Budgets [0.0] 最も難しい例のトレーニングではパフォーマンスが最大47%向上し、簡単な例のトレーニングでは最小となる。
これらの知見は、予算制約後トレーニングの実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 00:59:56 GMT)
Generation of structure-guided pMHC-I libraries using Diffusion Models [0.0] 結晶距離に条件付き拡散モデルを用いて設計したpMHC-Iペプチドの構造誘導型ベンチマークを提案する。
このベンチマークは、以前に特徴付けられたペプチドとは独立して、標準アンカー残基の嗜好を再現する。
これらの構造的安定な設計の結合ポテンシャルを認識するためには,最先端のシーケンスベースの予測器が不十分であることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:39:45 GMT)
Gaussian filters in quantum lattice systems: Applications to spectral flow, local perturbations, clustering, and the quantum Hall effect [0.0] 量子スピン系のダイナミックス $tau_t$ に適用した場合、スミアリング [ tau_f(A) = int_-inftyinfty dt, f(t), tau_t(A) ] の局所性とスペクトル特性を考える。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:20:22 GMT)
GRAFT: GRaPH and Table Reasoning for Textual Alignment -- A Benchmark for Structured Instruction Following and Visual Reasoning [0.0] GRAFTは、命令追従型視覚推論と視覚テキストアライメントのモデルを評価するための構造化マルチモーダルベンチマークである。
生成されたチャートと、Pythonライブラリで作成され、データセマンティクスの制御と明確性を保証する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:13:49 GMT)
GEN2: A Generative Prediction-Correction Framework for Long-time Emulations of Spatially-Resolved Climate Extremes [0.0] 極端事象統計の効率的かつ正確な予測のための生成予測補正フレームワークを提案する。
我々のモデルは、異なるシナリオにおける極端な事象の統計を正確に予測し、トレーニングデータの分布を超えた外挿に成功した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:14:25 GMT)
Futurity as Infrastructure: A Techno-Philosophical Interpretation of the AI Lifecycle [0.0] 本稿は、EU AI Actのテクノ哲学的読解によって、AIシステムにおけるデータの長期的ダイナミクスに関する洞察が得られることを主張する。
AIパイプラインのフレーム化、データ分散、トレーニング体制、アーキテクチャ、機能ストア、トランスファー学習のための概念ツールを導入します。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:00:13 GMT)
From Rotations to Unitaries: Reversible Quantum Processes and the Emergence of the $SU(2)-SO(3)$ Isomorphism [0.0] 我々は、よく知られた(準)同型を、群 $SU(2)$ と $SO(3)$ の間に再構成する。
我々のアプローチは、この群論的構造が自然に物理的制約からどのように現れるかを明らかにする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:08:52 GMT)
From Points to Spheres: A Geometric Reinterpretation of Variational Autoencoders [0.0] 変分オートエンコーダは一般に確率的推論の観点から理解される。
本研究では,確率論的視点を補完し,その直感性を向上する新しい幾何学的解釈を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:51:26 GMT)
Foundational Design Principles and Patterns for Building Robust and Adaptive GenAI-Native Systems [0.0] 我々は、将来のGenAIネイティブシステムは、GenAIの認知能力をソフトウェア工学の原則と統合し、堅牢で適応的で効率的なシステムを構築するべきであると論じる。
信頼性、卓越性、進化性、自己信頼性、保証という5つの重要な柱を中心にした、基本的なGenAIネイティブ設計原則を紹介します。
我々は、GenAIネイティブなソフトウェアスタックの重要な要素を概説し、技術的、ユーザの採用、経済的、法的観点から、これらのシステムの影響について論じる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:05:18 GMT)
Flow Matching at Scale: A Machine Learning Framework for Efficient Large-Size Sampling of Many-Body Systems [0.0] マルコフ連鎖モンテカルロ法のスケーリング制限を克服するために,フローマッチングに基づく機械学習フレームワークを提案する。
2次元XYモデルでは,1つのネットワークがスパース温度点で小さな格子からのみ構成を訓練し,より大規模なシステムに対して信頼性の高いサンプルを生成する。
生成された構成は、鍵となる熱力学的観測値と強い一致を示し、ベレジンスキー-コステリッツ-トゥーレス転移の符号を正しく捉えている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 07:29:25 GMT)
Fidelity Isn't Accuracy: When Linearly Decodable Functions Fail to Match the Ground Truth [0.0] 線形性スコア$lambda(f)$は、回帰ネットワークの出力が線形モデルによってどれだけうまく模倣できるかを測定する。
このフレームワークは、合成データセットと実世界のデータセットの両方で評価される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:13:17 GMT)
Federated Learning based on Self-Evolving Gaussian Clustering [0.0] フェデレートラーニングの文脈において,進化型ファジィシステムを提案する。
従来の方法とは異なり、Federated Learningでは、モデルをクライアントデバイス上でローカルにトレーニングすることが可能で、モデルパラメータのみをデータではなく中央サーバで共有する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:32:37 GMT)
Fast globally optimal Truncated Least Squares point cloud registration with fixed rotation axis [0.0] 半定値プログラミング(SDP)緩和を用いた大域的最適手法は100点につき数百秒を要する。
本稿では,新しい線形凸緩和法と,ブランチとバウンドの高速化のための請負業者手法を提案する。
本稿では,100点の2つの3次元点雲を回転軸が提供される場合,半秒以内で大域的最適性を示すために登録することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:37:56 GMT)
Exploring Spatial-Temporal Dynamics in Event-based Facial Micro-Expression Analysis [0.0] 我々は,RGBとイベントカメラを同期して記録した,新しい,予備的なマルチレゾリューションおよびマルチモーダルマイクロ圧縮データセットを提案する。
イベントベースのデータは,マイクロ圧縮認識やフレーム再構成に利用できることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:54:21 GMT)
Exploration of Evolving Quantum Key Distribution Network Architecture Using Model-Based Systems Engineering [0.0] システムエンジニアリングのアプローチは、量子セキュア通信の必要性の高まりに対処すると考えられる。
この研究は、量子鍵分布ネットワークアーキテクチャの進化をモデル化し、実証するために、既存のおよび将来の量子通信ネットワークを探索する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:21:03 GMT)
Explainable Knowledge Distillation for Efficient Medical Image Classification [0.0] 本研究は、CXR画像を用いて、新型コロナウイルスの知識蒸留の枠組みと肺がん分類について包括的に検討する。
我々は、VGG19や軽量ビジョントランスフォーマーなどの高容量教師モデルを用いて、OFA-595スーパーネットから派生したコンパクトでハードウェア対応の学生モデルのトレーニングを指導する。
われわれのモデルは、COVID-QU-ExとLCS25000という2つのベンチマークデータセットで検証され、COVID-19、健康、非肺炎、肺、大腸癌を含む複数のクラスをカバーする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 05:22:47 GMT)
Experimental observation of multimode quantum phase transitions in a superconducting Bose-Hubbard simulator [0.0] 21個の超伝導共振器からなる1D Bose-Hubbard 鎖における多モード拡散1次相転移の実験的検討を行った。
我々の結果は、非平衡量子多体物理学の新しい窓を開く。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:22:31 GMT)
Evaluating Knowledge Graph Complexity via Semantic, Spectral, and Structural Metrics for Link Prediction [0.0] 構造的およびセマンティックなKG複雑性メトリクスのセットを導入し、ベンチマークする。
CSGはパラメトリゼーションに非常に敏感であり,クラス数に強く対応していない。
CSGは,リンク予測設定において,安定性と一般化予測能力が保たないことを実証した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:27:20 GMT)
Equivalence of mutually unbiased bases via orbits: general theory and a $d=4$ case study [0.0] 量子力学において、相互に偏りのない基底(MUB)は可能な限り「遠く離れた」正則基底を表す。
我々は、その正規直交基底の空間を完備フラグ多様体の離散商として構成する。
MUB三重項のパラメータ空間を 4$ の係数で 4$ の次元で減少させる新しい対称性を同定する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:06:39 GMT)
Entanglement dynamics in intensity-dependent double Jaynes-Cummings model for squeezed coherent thermal states [0.0] 圧縮コヒーレント熱状態における放射場を有する原子・原子場・磁場の絡み合いダイナミクスについて検討した。
両モデルにおけるエンタングルメント挙動のモデル化における相補的役割を明らかにするため, エンタングルメントに対するシャープドおよびサーマル光子の影響について検討した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:15:44 GMT)
Empirical Evidence for Alignment Faking in a Small LLM and Prompt-Based Mitigation Techniques [0.0] そこで本研究では,LLaMA 3 8Bと呼ばれる小型の命令調整モデルがアライメント・フェイキングを示すことができることを示す。
本研究は,非オントロジー的モラルフレーミングやスクラッチパッド推論など,即時のみの介入により,モデル内部を変更することなく,この動作を著しく減少させることを示す。
本研究は,言語モデルにおける騙しの理解を深め,モデルのサイズや配置設定のアライメント評価の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:06:06 GMT)
Efficient preparation of entangled states in cavity QED with Grover's algorithm [0.0] グロバーの探索アルゴリズムは、量子ビットのアンサンブルの絡み合った状態を効率的に作成することができる。
我々は、Dicke状態、GHZ状態、およびSchr"odinger cat superpositions of $N$atomsを、少数の光子散乱イベントによって決定的に生成することを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:00:00 GMT)
DoSReMC: Domain Shift Resilient Mammography Classification using Batch Normalization Adaptation [0.0] DoSReMCは、モデル全体をトレーニングすることなく、クロスドメインの一般化を強化するために設計されたバッチ正規化フレームワークである。
DoSReMCは、既存のAIパイプラインに簡単に組み込むことができ、様々な臨床環境に適用できる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:17:54 GMT)
Direct energy dissipation measurements for a driven superfluid via the harmonic-potential theorem [0.0] 本研究では,高調波トラップに閉じ込められたリニア駆動超流体のエネルギー散逸を直接測定する方法を提案し,実験的に実証する。
この方法は、ポテンシャル摂動が中心運動エネルギーを内部エネルギーに変換する調和ポテンシャル定理の摂動バージョンに依存する。
旋回力に依存する臨界速度を含む超流動特性の散逸曲線を観察する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:51:19 GMT)
Deterministic carving of quantum states with Grover's algorithm [0.0] 我々は、グローバーのアルゴリズムのいくつかのユニタリステップが、キャビティ内の$N$原子のディック状態を完全に準備するのに十分であることを示した。
また,GHZ状態とCat状態を生成するために,その後のGroverステップをいくつかのステップで適用できることも示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 03:08:46 GMT)
Deterministic Control of Photon-Number Probabilities via Phase-Controlled Quantum Interference [0.0] 単光子エミッタを真空単光子状態の定性発生器に変換する全線形光プロトコルについて報告する。
完全に量子力学的な離散時間ビンモデルでは、これらの結果を光子統計学にマッピングする。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:32:03 GMT)
Detection of non-absolute separability in quantum states and channels through moments [0.0] 非絶対分離状態は、適切なユニタリゲートを用いて絡み合った状態にすることができる。
絶対分離不能な状態を検出するための効率的な方法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:32:23 GMT)
Deep Learning-Driven Multimodal Detection and Movement Analysis of Objects in Culinary [0.0] 本研究は、既存のモデルについて検討し、YOLOv8セグメンテーションモデル、手指の動きシーケンスに基づいて訓練されたLSTMモデルとASR(Whisper-base)を組み合わせた微調整を行う。
すべてのデータは著者によって収集され、複雑で困難な環境でベストを尽くす、堅牢なタスク特定システムを実現する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:40:11 GMT)
Deep Learning-Based Financial Time Series Forecasting via Sliding Window and Variational Mode Decomposition [0.0] 歴史的株価と関連する市場指標がデータセットの構築に使用される。
VMDは、非定常財務時系列をスムーズなサブコンポーネントに分解し、モデル適応性を改善する。
本研究は,VMD処理シーケンスでトレーニングしたLSTMモデルの予測効果と生の時系列を用いた予測効果を比較し,性能と安定性を実証する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:39:27 GMT)
Data-driven models for production forecasting and decision supporting in petroleum reservoirs [0.0] 本稿では,データ駆動型アプローチと機械学習手法を用いてこの問題に対処することを提案する。
本研究の目的は,生産量として生成および注入された単純なデータに基づいて生産パラメータを予測する手法を開発することである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 19:48:58 GMT)
Cross-Attention Multimodal Fusion for Breast Cancer Diagnosis: Integrating Mammography and Clinical Data with Explainability [0.0] 現在のコンピュータ支援システムはマンモグラムの特徴しか利用していない。
臨床的特徴は乳腺病変の分類を著しく向上させるか?
説明可能なAIアプローチは、乳がんの診断に使用されるモデルの解釈可能性と信頼性を改善するにはどうすればよいのか?
論文参考訳(メタデータ) (Thu, 21 Aug 2025 23:23:06 GMT)
Cross multiscale vision transformer for deep fake detection [0.0] このプロジェクトは、SPカップの2025年のディープフェイク検出データセットを用いて、ディープフェイク検出を評価する。
我々は,従来のディープラーニング技術と新しいアーキテクチャを併用して,さまざまな深層学習モデルによる偽コンテンツの検出に焦点をあてた。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:23:20 GMT)
Contrastive-KAN: A Semi-Supervised Intrusion Detection Framework for Cybersecurity with scarce Labeled Data [0.0] 半教師付きコントラスト学習フレームワークに基づくリアルタイム侵入検知システムを提案する。
本手法は, ラベルのないデータを利用して, 正常な動作と攻撃動作を効果的に識別する。
実験結果から,本手法は既存のコントラスト学習手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:40:26 GMT)
Continuous Determination of Respiratory Rate in Hospitalized Patients using Machine Learning Applied to Electrocardiogram Telemetry [0.0] 呼吸速度(RR)は入院患者の臨床的モニタリングにとって重要な指標である。
RRの人間のラベルは呼吸数に基づいており、医療スタッフにとって不正確で時間を要することが知られている。
この研究は、心電図(ECG)テレメトリ波形からRRをラベル付けるニューラルネットワーク(NN)を訓練する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:37:43 GMT)
Connected and Exposed: Cybersecurity Risks, Regulatory Gaps, and Public Perception in Internet-Connected Vehicles [0.0] 本稿では、コネクテッドカーに関連する脅威景観の進化について考察する。
不正なリモートアクセスや個人情報の漏洩などのリスクに焦点を当てている。
保護の現状を評価するため、16の国際基準と規制を包括的に分析した。
また,スマートカーに対する消費者の態度を地図化するためのユーザ中心調査を実施した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 06:51:54 GMT)
Confidence-Modulated Speculative Decoding for Large Language Models [0.0] 本稿では,信頼度変調された起草に基づく投機的復号化のための情報理論フレームワークを提案する。
機械翻訳と要約タスクの実験は、標準的な投機的復号化よりも大幅に高速化された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:06:31 GMT)
Complex Heat Capacity as a Witness of Spatio-Temporal Entanglement [0.0] 本稿では,複素熱容量の虚構成分を用いた時間的量子絡み合いの新たな目撃者を提案する。
複素熱容量と擬密度行列形式との直接対応性を確立することにより,空間的および時間的量子相関のキャラクタリゼーションが可能となる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:13:58 GMT)
Cognitive Agents Powered by Large Language Models for Agile Software Project Management [0.0] 本稿では,大規模言語モデル(LLM)を利用した認知エージェントの大規模アジャイルフレームワーク(SAFe)への統合について検討する。
シミュレーションソフトウェア環境に仮想エージェントを配置することにより、ITプロジェクト開発における基本的な役割を果たす可能性を探る。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 09:19:08 GMT)
Clustering of quantum correlations at low temperature [0.0] 熱状態における相関関係のクラスタリング条件の同定は、量子多体物理学における中心的な問題である。
温度状態が低温での相関の指数的崩壊を満足する直接的証明として、相関長が$Tto0$と一様に拘束されることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:10:13 GMT)
COVID19 Prediction Based On CT Scans Of Lungs Using DenseNet Architecture [0.0] COVID19は2019年12月以来、嵐で世界を席巻した。
新型コロナウイルス(COVID-19)による生命の喪失の主な理由は、呼吸器系の故障であった。
本研究の目的は、患者の肺のCTスキャンを読み取ることにより、医師が新型コロナウイルスの重症度を決定するのを支援することである。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:12:57 GMT)
CM2LoD3: Reconstructing LoD3 Building Models Using Semantic Conflict Maps [0.0] 詳細な3Dビルディングモデルは、都市計画、デジタルツイン、災害管理アプリケーションに不可欠である。
レベル・オブ・ディーテール1(LoD)1とLoD2ビルディングモデルは広く利用可能であるが、高度な都市分析に必要な詳細なファサード要素は欠如している。
レイ・ツー・モデル・プライア解析から得られた衝突マップ(CM)を利用したLoD3ビルディングモデルを再構築する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:54:13 GMT)
CALR: Corrective Adaptive Low-Rank Decomposition for Efficient Large Language Model Layer Compression [0.0] 大規模言語モデル(LLM)は、その膨大なサイズと計算要求のために、重大なデプロイメント上の課題を提示する。
本稿では,2成分圧縮手法である補正適応低ランク分解(CALR)を導入する。
CALR はパラメータ数を 26.93% から 51.77% に削減でき、元のモデルの性能の59.45% から 90.42% に維持できることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:16:02 GMT)
Broadband spectral manipulation of single photons using cross-phase modulation [0.0] 本報告では,帯域幅の広帯域周波数制御を実験的に実証する。
絶対周波数シフトは最大$+6.46pm0.01$,THzと$5.74pm0.01$,THzで、帯域幅操作は0.66pm0.03$から$8.4pm0.3$までの範囲である。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:00:00 GMT)
Breaking global symmetries with locality-preserving operations [0.0] 局所性保存演算は最大非対称性を生成できることを示す。
その結果,非対称性,局所性,絡み合いの非自明な相互作用が明らかになった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 18:00:02 GMT)
Beyond Traditional Surveillance: Harnessing Expert Knowledge for Public Health Forecasting [0.0] 2025年までの公衆衛生労働の縮小は、公衆衛生危機時の潜在的なリスクを増大させる。
公衆衛生当局による専門家による判断は、伝統的な監視インフラとは異なる重要な情報ソースである。
専門家の予測能力を調べるため、2024年のCSTEワークショップで114人の公衆衛生担当者が103回の予測を行った。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:49:12 GMT)
Between Myth and History: von Neumann on Consciousness in Quantum Mechanics [0.0] 人間の観察者の役割に対するフォン・ノイマンの態度は、一貫した測定の量子的記述のために長い間誤解されてきた。
私はフォン・ノイマンによるはるかに慎重な態度を裏付ける。
この時代は、意識の概念と量子力学の基礎との関係について、よりバランスのとれた物語を語るために熟しそうに思える。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:11:11 GMT)
Automatic Retrieval of Specific Cows from Unlabeled Videos [0.0] 本システムでは,乳牛のキャットログを飼育するオートキャットロガーと,牛1頭あたりの入力ビデオクリップ1本と,牛の識別に深層学習を用いないイデオロギー的な牛認識器と,牛を連続的なビデオストリームで識別するカウファインダーとから構成される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:27:30 GMT)
Annif at SemEval-2025 Task 5: Traditional XMTC augmented by LLMs [0.0] 本稿では,SemEval-2025タスク5(LLM)におけるAnnifシステムについて述べる。
大規模言語モデルを用いた主観的索引付けに重点を置いている。
我々のアプローチは、従来の自然言語処理と機械学習技術を組み合わせています。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 14:43:26 GMT)
An alternative explicit circuit diagram for the quantum search algorithm by implementing a non-unitary gate [0.0] 非ユニタリ行列の平方根を用いて複数の明示的ユニタリ実装を提案する。
本論文の付録では,各回路が,異なるアルゴリズムスキームに統合可能な要素をグループ化するために利用できることを示す。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 12:04:55 GMT)
An Efficient Hybridization of Graph Representation Learning and Metaheuristics for the Constrained Incremental Graph Drawing Problem [0.0] 本稿では,グラフ表現学習(GRL)として知られるグラフの潜在構造を抽出するメタヒューリスティックスと,より安価な学習戦略のハイブリッド化を提案する。
計算実験において、我々はまず、ディープラーニングに基づく戦略が目立った異なるノード埋め込み技術を用いて、達成された結果を解析する。
評価は、そのような問題に要する時間に応じて解の質を評価する主積分測度を検討した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:42:37 GMT)
Amortized In-Context Mixed Effect Transformer Models: A Zero-Shot Approach for Pharmacokinetics [0.0] Amortized In-Context Mixed-Effect Transformer (AICMET) モデルを提案する。
メカニカル・コンパートメンタル・プレファレンスと、文脈内ベイズ推論とを統一する。
実験の結果,AICMETは最先端の予測精度を達成し,患者間の変動を忠実に定量化することがわかった。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 15:45:17 GMT)
Advancing rail safety: An onboard measurement system of rolling stock wheel flange wear based on dynamic machine learning algorithms [0.0] 本稿では、車輪フランジ摩耗深度モニタリングのための革新的なオンボード計測システムを提案する。
システムは、車輪フランジの着用と不規則な条件の追跡に関して、非並列なリアルタイム洞察を提供する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:12:48 GMT)
AI-Powered Machine Learning Approaches for Fault Diagnosis in Industrial Pumps [0.0] 本研究では,実世界のセンサデータを用いた産業用ポンプシステムにおける早期故障検出の実践的アプローチを提案する。
フレームワークはスケーラブルで、解釈可能で、リアルタイムな産業展開に適している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 13:33:09 GMT)
A simulation-based training framework for machine-learning applications in ARPES [0.0] 我々は、機械学習モデルのトレーニングに必要な大規模なデータセットを生成するために、オープンソースの合成ARPESスペクトルシミュレーター、aureliaを導入する。
シミュレーション訓練したモデルと実際の実験データとをベンチマークし、人間の分析よりも正確なスペクトル品質を評価できることを示した。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:59:09 GMT)
A practical guide to feedback control for Pound-Drever-Hall laser linewidth narrowing [0.0] レーザー線幅狭帯域化のためのPund-Drever-Hall(PDH)技術は、AMOの実験者によって広く用いられている。
フィードバック制御の原則を基礎として,多面的工学的考察を体系的に整理する。
提案手法は1650nmのECDLに対するロックのステップバイステップ最適化によって説明される。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 20:06:29 GMT)
A framework for robust quantum speedups in practical correlated electronic structure and dynamics [0.0] 電子構造における量子的優位性の提案は、古典が失敗する問題を見つけるために、これまでかなりの微調整を必要としてきた。
我々は、広く使われている古典学が最も成功した体制において、相関電子構造と力学の相関のための堅牢な量子スピードアップを得る方法について述べる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 17:58:43 GMT)
A Text-Based Recommender System that Leverages Explicit Affective State Preferences [0.0] ユーザが明示的に求めている感情状態のほとんど無拘束な範囲を活用できる新しい推薦タスクを導入する。
書籍レビューから抽出した、きめ細かい感情状態の表現を含む、ユーザの好みの大規模なデータセットを作成します。
次に、感情状態の嗜好のデータセットと、書籍の読み、評価、レビューのリンクされたユーザとその履歴を用いて、複数のレコメンデーションモデルのトレーニングと評価を行う。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 21:40:41 GMT)
A Systematic Study of Deep Learning Models and xAI Methods for Region-of-Interest Detection in MRI Scans [0.0] 本研究は, 膝関節MRIにおける興味領域の自動検出のためのAI(xAI)技術と組み合わせて, 各種ディープラーニングアーキテクチャの体系的評価を行う。
ResNet50, InceptionV3, Vision Transformers (ViT) および多層パーセプトロン (MLP) 分類器を付加した複数のU-Net変種について検討した。
以上の結果から,ResNet50は,MRNetデータセットの制約下でのトランスフォーマーベースモデルよりも優れた分類とROI識別が一貫して優れていることが示された。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 08:09:44 GMT)
A Study of Privacy-preserving Language Modeling Approaches [0.0] 言語モデルにおけるプライバシの保護は、重要な研究領域となっている。
本研究は,プライバシ保護言語モデリングのアプローチを包括的に研究する。
本研究の結果は,プライバシ保護言語モデリングに関する継続的な研究に寄与している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 10:22:40 GMT)
A Solvable Molecular Switch Model for Stable Temporal Information Processing [0.0] リニア・イン・ザ・ステートと非線形・イン・イン・イン・イン・イン・インプットのモデルは正確に解決可能であり、収束とフェードメモリの数学的性質も持っている。
その結果、動的分子スイッチを深いカスケード/層状フィードフォワードおよびリカレントアーキテクチャの計算単位として使用するための理論的支援が得られた。
また、脳にインスパイアされた振る舞いを模倣し、入力信号に対して安定した計算を実行できる任意の物理デバイスをエミュレートできる、より一般的な正確な解決可能なモデルをインスパイアすることもできる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:13:56 GMT)
A Real-Time Diminished Reality Approach to Privacy in MR Collaboration [0.0] この論文は、複合現実会議におけるプライバシー制御を可能にするために設計された、リアルタイムな塗り絵ベースのDRシステムを示す。
このシステムにより、プライマリ・ヘッドセットのユーザーは、環境から個人的または機密性の高いアイテムを選択的に取り除くことができる。
720pの解像度で、パイプラインはフレームレートを20fps以上維持し、実用的なプライバシー保護MRアプリケーションに対するリアルタイムの低減現実の実現可能性を示している。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 04:01:56 GMT)
A Moral Agency Framework for Legitimate Integration of AI in Bureaucracies [0.0] 公務員官僚は人工知能(AI)の恩恵を享受しようとする
本稿では,官僚構造におけるAIの合法的な統合のための3点のモラルエージェンシー・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 11:03:13 GMT)
A Fast and Stable Marginal-Likelihood Calibration Method with Application to Quantum Characterization [0.0] 我々は,ケネディ・オハガン(KOH)ベイズ的枠組みの中で,新たな限界化可能性戦略を提案する。
我々の方法は、元のものと異なる正確な可能性を定義するが、関連するすべての情報を保存している。
ローレンス・リバモア国立研究所(Lawrence Livermore National Laboratory)の超伝導量子装置のキャラクタリゼーションに応用されている。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 22:47:10 GMT)
A "good regulator theorem" for embodied agents [0.0] コナントとアシュビーは「システムの適切な規制はすべて、そのシステムのモデルでなければならない」と主張した。
ここでは、同様の直感が別の方法で具現化できることを示します。
観察者は、その環境について「信じている」と解釈することができる。
論文参考訳(メタデータ) (Thu, 21 Aug 2025 16:17:58 GMT)