Pushing the Limits of Safety: A Technical Report on the ATLAS Challenge 2025 [167.9] 本稿では,Adversarial Testing & Large-model Alignment Safety Grand Challenge (ATLAS) 2025の成果を報告する。
このコンペティションには、ホワイトボックスとブラックボックス評価という2つのフェーズで、敵対的な画像テキスト攻撃を通じてMLLM脆弱性をテストする86のチームが含まれていた。
この課題はMLLMの安全性評価のための新しいベンチマークを確立し、より安全なAIシステムを改善するための基盤を配置する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:03:17 GMT)
Scaling Probabilistic Circuits via Monarch Matrices [109.7] 確率回路(PC)は確率分布の抽出可能な表現である。
そこで本研究では,PCの和ブロックに対する新しいスパースパラメータと構造化パラメータ化を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:39:15 GMT)
VideoQA in the Era of LLMs: An Empirical Study [108.4] Video Large Language Models (Video-LLMs) は盛んであり、多くのビデオ直感的なタスクを進歩させている。
本研究は,ビデオQAにおけるビデオLLMの行動に関するタイムリーかつ包括的な研究を行う。
分析の結果,ビデオ-LLMはビデオQAで優れており,文脈的手がかりを相関させ,様々な映像コンテンツに関する質問に対して妥当な応答を生成できることがわかった。
しかし、時間的コンテンツ順序の推論とQA関連時間的モーメントのグラウンド化の両方において、ビデオの時間性を扱うモデルが失敗する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:40:12 GMT)
OpenUnlearning: Accelerating LLM Unlearning via Unified Benchmarking of Methods and Metrics [101.8] 我々は,大規模言語モデル(LLM)のアンラーニング手法とメトリクスをベンチマークするための標準フレームワークであるOpenUnlearningを紹介する。
OpenUnlearningは、9つのアンラーニングアルゴリズムと16のさまざまな評価を3つの主要なベンチマークで統合する。
また、多様なアンラーニング手法をベンチマークし、広範囲な評価スイートとの比較分析を行う。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:16:37 GMT)
Immune: Improving Safety Against Jailbreaks in Multi-modal LLMs via Inference-Time Alignment [97.4] 訓練時安全アライメントにもかかわらず、Multimodal Large Language Models (MLLM) はジェイルブレイク攻撃に対して脆弱である。
我々は,ジェイルブレイク攻撃に対する防御のために,制御復号化による安全な報酬モデルを活用する推論時防御フレームワークImmuneを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:20:06 GMT)
Video Understanding with Large Language Models: A Survey [97.3] 言語・マルチモーダルタスクにおける大規模言語モデル(LLM)の顕著な機能を考えると,近年の映像理解の進歩について概観する。
Vid-LLMの創発的能力は驚くほど進歩しており、特にオープンな多粒性推論能力がある。
本調査は,Vid-LLMのタスク,データセット,ベンチマーク,評価方法論に関する総合的研究である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:23:06 GMT)
Will Pre-Training Ever End? A First Step Toward Next-Generation Foundation MLLMs via Self-Improving Systematic Cognition [89.5] 自己改善認知 (SIcog) は、マルチモーダル知識によって次世代のMLLMを構築するための自己学習フレームワークである。
ステップバイステップの視覚的理解のためのChain-of-Descriptionを提案し、詳細なマルチモーダル推論をサポートするために構造化されたChain-of-Thought(CoT)推論を統合する。
実験は、マルチモーダル認知を増強したMLLMの開発におけるSIcogの有効性を示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:17:01 GMT)
NaturalReasoning: Reasoning in the Wild with 2.8M Challenging Questions [86.2] NaturalReasoningは、複数のドメインにまたがる280万の質問からなる包括的なデータセットである。
本研究では,NaturalReasoningが強力な教師モデルから推論能力を効果的に引き出すことができることを示す。
また、NaturalReasoningは、外部報酬モデルや自己回帰モデルを用いて教師なしの自己学習に有効であることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:49:26 GMT)
MS4UI: A Dataset for Multi-modal Summarization of User Interface Instructional Videos [77.6] 本研究の目的は,テキスト・インストラクションとキー・ビデオ・フレームの形式での学習を効果的に行うための指導ビデオのマルチモーダル・サマリゼーションをユーザに提供することである。
このギャップを埋めるために,ユーザインタフェース(UI)の命令映像要約のための新しいベンチマークを提案する。
2,413のUIインストラクショナルビデオのデータセットを収集し、167時間以上にわたっています。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:39:32 GMT)
Training-free LLM Merging for Multi-task Learning [74.9] Hi-Mergingは、異なる特殊なLSMを単一のモデルに統合するためのトレーニング不要の方法である。
中国語と英語の両方における複数選択および質問応答タスクの実験は、マルチタスク学習におけるHi-Mergingの能力を検証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:21:11 GMT)
DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [73.7] 野生のブラインド画像品質評価(IQA)は重大な課題を呈している。
大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。
事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:22:43 GMT)
Learning to Rank Chain-of-Thought: An Energy-Based Approach with Outcome Supervision [66.8] 本稿では,エネルギ・アウトカム・リワード・モデル(EORM)について紹介する。
数学的ベンチマークでは、EORMは最終回答の精度を大幅に改善する(例えば、Llama 3 8B、GSM8kで90.7%、MATHで63.7%)。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:52:14 GMT)
MoH: Multi-Head Attention as Mixture-of-Head Attention [63.7] 我々は、トランスフォーマーモデルのコアであるマルチヘッドアテンション機構をアップグレードし、以前の精度を維持したり、超えたりしながら効率を向上させる。
そこで我々は,Mixture-of-Head attention (MoH)を提案する。
まず、MoHは各トークンが適切なアテンションヘッドを選択することを可能にし、精度を損なうことなく推論効率を向上させる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:38:00 GMT)
Segment Concealed Objects with Incomplete Supervision [63.6] 不完全なスーパービジョン・コンセサイテッド・オブジェクト(ISCOS)は、周囲の環境にシームレスにブレンドするオブジェクトを分割する。
このタスクは、不完全な注釈付きトレーニングデータによって提供される限られた監督のため、非常に難しいままである。
本稿では,これらの課題に対処するためのISCOSの統一手法について紹介する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:52:36 GMT)
A Gradient Meta-Learning Joint Optimization for Beamforming and Antenna Position in Pinching-Antenna Systems [63.2] マルチ導波路ピンチアンテナシステムの新しい最適化設計について検討する。
提案したGML-JOアルゴリズムは,既存の最適化手法と比較して,様々な選択や性能に頑健である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:35:27 GMT)
Farseer: A Refined Scaling Law in Large Language Models [62.3] 本稿では,新たなスケール法であるFarseerを紹介した。
モデル損失曲面 $L(N,D)$ を体系的に構築することにより、Farseer は以前の法則よりも経験的データに非常によく適合する。
我々の手法は正確で頑健で、非常に一般化可能な予測をもたらし、優れた外挿能力を示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:44:54 GMT)
CoLLM: Integrating Collaborative Embeddings into Large Language Models for Recommendation [60.3] 我々は,協調情報をLLMにシームレスに組み込んでレコメンデーションを行う,革新的なLLMRec手法であるCoLLMを紹介する。
CoLLMは、外部の伝統的なモデルを通して協調情報をキャプチャし、LLMの入力トークン埋め込み空間にマッピングする。
大規模な実験により、CoLLMはLLMに協調情報を包括的に統合し、レコメンデーション性能が向上することが確認された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:45:48 GMT)
Understanding and Benchmarking the Trustworthiness in Multimodal LLMs for Video Understanding [59.8] この研究では、真理、安全性、公正、プライバシの5次元にわたるビデオLLMを評価するベンチマークを紹介します。
現状の映像LLMを23本評価したところ,動的シーン理解とクロスモーダルレジリエンスに大きな限界が認められた。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:04:54 GMT)
Transformers without Normalization [58.8] トランスフォーマーの正規化レイヤのドロップイン置換として、DyT($x$) = tanh(alpha $x$)$という要素演算式であるDynamic Tanh(DyT)を導入する。
我々は、認識から生成、教師付き学習、教師付き学習、コンピュータビジョンから言語モデルまで、様々な環境において、DyTを用いたトランスフォーマーの有効性を検証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:10:48 GMT)
Speech-Language Models with Decoupled Tokenizers and Multi-Token Prediction [58.6] 音声合成モデル(SLM)は、音声とテキストの理解と生成を統一するための有望な経路を提供する。
本研究では,SLMの性能に及ぼすキーコンポーネント(音声トークン化,音声ヘッド,話者モデルなど)の影響について検討する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:26:31 GMT)
Plan Your Travel and Travel with Your Plan: Wide-Horizon Planning and Evaluation via LLM [58.5] 旅行計画は、多様な現実世界の情報とユーザの好みを統合する必要がある複雑な作業である。
我々はこれをL3$プランニング問題として定式化し、長いコンテキスト、長い命令、長い出力を強調する。
計画の多面的側面 (MAoP) を導入し, LLM が複雑な計画問題の解決のために広義の思考を行えるようにした。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:37:59 GMT)
TL;DR: Too Long, Do Re-weighting for Efficient LLM Reasoning Compression [55.4] 高度なデータアノテーションに依存しない動的比に基づくトレーニングパイプラインを提案する。
我々は、DeepSeek-R1-Distill-7BとDeepSeek-R1-Distill-14Bのモデルと、様々な難易度を持つ様々なベンチマークのモデルに対するアプローチを検証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:11:38 GMT)
SMILE: Speech Meta In-Context Learning for Low-Resource Language Automatic Speech Recognition [55.2] 音声メタインコンテキスト学習(SMILE)は、メタラーニングと音声インコンテキスト学習(SICL)を組み合わせた革新的なフレームワークである
SMILEは、トレーニング不要な多言語ASRタスクにおいて、ベースライン手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:46:01 GMT)
Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.1] フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:52:12 GMT)
Reparameterized LLM Training via Orthogonal Equivalence Transformation [54.8] 直交同値変換を用いてニューロンを最適化する新しいトレーニングアルゴリズムPOETを提案する。
POETは、目的関数を安定して最適化し、一般化を改善する。
我々は、大規模ニューラルネットワークのトレーニングにおいて、POETを柔軟かつスケーラブルにするための効率的な近似を開発する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:13:08 GMT)
AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents [54.3] 本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentVigilを提案する。
我々はAgentVigilをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:50:21 GMT)
EKPC: Elastic Knowledge Preservation and Compensation for Class-Incremental Learning [53.9] クラスインクリメンタルラーニング(Class-Incremental Learning, CIL)は、AIモデルを、時間とともに異なるクラスのシーケンシャルに到着したデータから継続的に学習可能にすることを目的としている。
本稿では, 重要度を考慮した重要度正規化 (IPR) と CIL のためのトレーニング可能なセマンティックドリフト補償 (TSDC) を統合したElastic Knowledge Preservation and Compensation (EKPC) 法を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:19:58 GMT)
AI Flow: Perspectives, Scenarios, and Approaches [53.8] 私たちは最先端のITとCTの進歩を統合するフレームワークであるAI Flowを紹介します。
まず、デバイスエッジクラウドフレームワークは、エンドデバイス、エッジサーバ、クラウドクラスタを統合する基盤として機能する。
第2に,家族モデルの概念を導入し,同列に隠れた特徴を持つ様々なサイズのモデルに言及する。
第3に、コネクティビティとインタラクションに基づくインテリジェンスの出現は、AI Flowの新たなパラダイムである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:43:07 GMT)
Model Merging for Knowledge Editing [53.8] 大規模言語モデル(LLM)は、世界が進化するにつれて正確で現在の知識を維持するために継続的な更新を必要とする。
既存の知識編集アプローチは知識更新のための様々なソリューションを提供するが、しばしば連続的な編集シナリオに苦労する。
本稿では,頑健な教師付き微調整(R-SFT)とモデルマージを組み合わせた2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:42:39 GMT)
StreamMel: Real-Time Zero-shot Text-to-Speech via Interleaved Continuous Autoregressive Modeling [50.5] StreamMelは、継続的メル-スペクトログラムをモデル化する、先駆的なシングルステージストリーミングTSフレームワークである。
高い話者類似性と自然性を保ちながら、低レイテンシで自己回帰的な合成を可能にする。
オフラインシステムに匹敵するパフォーマンスを実現し、効率的なリアルタイム生成もサポートしている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:53:39 GMT)
Beyond Laplace and Gaussian: Exploring the Generalized Gaussian Mechanism for Private Machine Learning [49.7] 一般化ガウス機構(英語版)を考察し、ある$beta geq 1$に対して$e-frac| x |sigmabeta $ に比例した付加雑音項 $x$ をサンプリングする。
GGメカニズムとその変種に対するプライバシ会計は独立であり、プライバシ会計の計算コストを大幅に向上させることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:49:25 GMT)
Privacy-preserving and reward-based mechanisms of proof of engagement [49.2] この研究は、DLTや集中型システムに基づく確立した技術など、さまざまなソリューションを探求する。
私たちが考慮する主な側面は、ユーザに保証されるプライバシーのレベル、PoA/PoEの範囲(時間と空間の両方)、証明の転送可能性、インセンティブメカニズムとの統合などです。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:33:39 GMT)
UniDet-D: A Unified Dynamic Spectral Attention Model for Object Detection under Adverse Weathers [48.4] 各種気象条件下での物体検出に挑戦する統合フレームワークUniDet-Dを提案する。
具体的には、UniDet-Dは、非関連成分を抑えつつ、情報的スペクトル成分を適応的に強調するダイナミックスペクトルアテンション機構を組み込んでいる。
広汎な実験により、UniDet-Dは各種の悪天候劣化に対して優れた検出精度が得られることが示された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:23:29 GMT)
An Exploration of Mamba for Speech Self-Supervised Models [48.0] 我々はTransformerベースのSSLアーキテクチャに代わるものとして,MambaベースのHuBERTモデルを探求する。
HuBERTモデルは、計算量を大幅に削減した長文ASRの微調整を可能にする。
これらの結果から,マンバをベースとしたSSLは,時系列モデリング,リアルタイム音声モデリング,音声単位抽出において,有望かつ補完的な方向であることがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:00:44 GMT)
Less is More: Improving LLM Alignment via Preference Data Selection [46.9] DPO(Direct Preference Optimization)は,大規模言語モデルと人間の嗜好を整合させる,有望なアプローチである。
DPOトレーニングにおけるデータセットキュレーションのための新たなマージン最大化原理を提案する。
提案手法は反復的DPOにシームレスに拡張され,約3%の改善が達成され,25%のオンラインデータが得られた。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:50:43 GMT)
Not All Tokens and Heads Are Equally Important: Dual-Level Attention Intervention for Hallucination Mitigation [46.3] 大規模視覚言語モデル(LVLM)は、幅広いマルチモーダルタスクにおいて顕著な能力を示している。
視覚幻覚(VH)の傾向があり、しばしば自信はあるが誤った視覚内容の記述を生み出す。
提案するVisFlowは,推論中の注意パターンを直接操作することで,VHを緩和する,効率的でトレーニングのないフレームワークである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:10:22 GMT)
Exploring Audio Cues for Enhanced Test-Time Video Model Adaptation [46.3] テスト時間適応(TTA)は、テストフェーズ中に自己教師なし学習を行うことで、訓練されたモデルの一般化能力を高めることを目的としている。
本稿では,音声情報をビデオTTAに組み込む新しい手法を提案する。
提案手法は,音声による擬似ラベルを生成するために,音声のリッチなセマンティックコンテンツを活用する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:44:58 GMT)
Bridging Relevance and Reasoning: Rationale Distillation in Retrieval-Augmented Generation [45.4] 本稿では,Rationale DistillatiOnを用いた新規かつ実用的な嗜好アライメントフレームワークであるRADIOを提案する。
まず,Large Language Models (LLMs) の推論能力を活用して,問合せに要する有理を抽出する理性抽出手法を提案する。
その後、抽出された有理性に基づいて文書を再引用する合理性に基づくアライメントプロセスが設計され、その選好を調整するために再帰者を微調整する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:41:37 GMT)
Survey on Algorithms for multi-index models [45.1] マルチインデックスモデルを用いてインデックス空間を推定するアルゴリズムに関する文献をレビューする。
主な焦点は、ガウス空間における計算効率のよい(多項式時間)アルゴリズム、これらの方法によって一貫性が保証される仮定、およびそれらのサンプル複雑性である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:32:37 GMT)
Branch, or Layer? Zeroth-Order Optimization for Continual Learning of Vision-Language Models [44.3] 本稿では、視覚言語連続学習(VLCL)のためのゼロ次最適化(ZO)の体系的探索を開拓する。
まず,VLCLにおけるNuive full-ZO導入の不適合性について検討した。
我々は、浅層と深層表現の不均一な学習力学を活かして、ZOとFOをネットワーク層にインターリーブする階層最適化パラダイムを開発した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:59:19 GMT)
Disclosure Audits for LLM Agents [44.3] 大規模言語モデルエージェントは、パーソナルアシスタント、カスタマーサービスボット、臨床助手として登場し始めている。
本研究では、これらのリスクを定量化し、監査する会話プライバシのための監査フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:16:24 GMT)
Tiered Agentic Oversight: A Hierarchical Multi-Agent System for AI Safety in Healthcare [43.8] Tiered Agentic Oversight(TAO)は階層的なマルチエージェントフレームワークで、階層化された自動監視を通じてAIの安全性を高める。
臨床階層(看護師、医師、専門家など)にインスパイアされたTAOは、タスクの複雑さとエージェントの役割に基づいてエージェントルーティングを実行する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:46:10 GMT)
Doctor Approved: Generating Medically Accurate Skin Disease Images through AI-Expert Feedback [43.1] 本稿では,データ拡張のための臨床的精度の高い皮膚疾患像を合成する新しいフレームワークMAGICを提案する。
提案手法は,専門家定義基準を,DM画像合成のための実用的なフィードバックに創造的に変換する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:15:09 GMT)
Is Smaller Always Faster? Tradeoffs in Compressing Self-Supervised Speech Transformers [43.1] 本研究では, 重み付け, 頭部刈り込み, 低ランク近似, 自己教師型音声変換器における知識蒸留の4つの共通圧縮法について検討した。
結果は,それぞれの方法に異なる利点があることを示唆している。
さらに,最近の圧縮技術について,DistilHuBERT,FitHuBERT,LightHuBERT,ARMHuBERT,STaRHuBERTを比較した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:10:16 GMT)
Towards Safety and Security Testing of Cyberphysical Power Systems by Shape Validation [42.4] サイバー物理パワーシステムの複雑さは 攻撃面を大きくし 悪質なアクターに悪用される
我々は,これらのリスクを,サイバーパワーシステムを記述する宣言的アプローチで満たし,セキュリティと安全性の制御を自動的に評価することを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:07:44 GMT)
RATIONALYST: Mining Implicit Rationales for Process Supervision of Reasoning [42.0] 本稿では,事前学習に基づく推論のプロセス・スーパービジョンのモデルであるRATIONALYSTを紹介する。
We extract 79k rationales from web-scale unlabelled dataset (the Pile) and a combination of reasoning datasets with minimal human intervention。
LLaMa-3-8Bの微調整により、RATIONALYSTは7つの代表的な推論ベンチマークで平均3.9%の推論精度を向上させる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:29:00 GMT)
Emergent Fracton Hydrodynamics of Ultracold Atoms in Partially Filled Landau Levels [41.9] 我々は、その非平衡量子力学において、分数量子ホール系のキーシグネチャを確立する。
最下層のランダウでは、系は半拡散的に緩和することを示した。
我々は、この非伝統的な緩和ダイナミクスを観察するために、光学格子における回転量子ガスと超低温原子の展望について論じる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:35:38 GMT)
FauForensics: Boosting Audio-Visual Deepfake Detection with Facial Action Units [40.9] 本稿では,オーディオ・ビジュアル・ディープフェイク検出のためのFauForensicsという新しいフレームワークを提案する。
本手法は, フレーム単位の音響視覚的類似性を, 専用の融合モジュールを用いて計算する。
FakeAVCelebとLAV-DFの実験では、最先端(SOTA)性能と、平均4.83%のクロスデータセットの一般化性が示された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:13:20 GMT)
Fixing the Loose Brake: Exponential-Tailed Stopping Time in Best Arm Identification [39.8] 固定された信頼設定では、アルゴリズムはデータ依存的に停止し、推定されたベストアームを正当性保証で返さなければならない。
私たちは、この不可能なイベントが、いくつかの人気のあるアルゴリズムで実際に起こりうることを証明しています。
最初のアルゴリズムはSequential Halvingと呼ばれる固定予算アルゴリズムと2倍のトリックに基づいている。
第2のアルゴリズムは、確度の高い任意の信頼度アルゴリズムを高い確率で阻止し、指数関数的に制限された停止時間を楽しむアルゴリズムに変換するメタアルゴリズムである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:12:51 GMT)
Breakdown of Measurement-Induced Phase Transitions Under Information Loss [39.4] 量子マンボディシステムは、測定誘起相転移(MIPT)を特徴付けることができる
MIPTは、平均的な観測器を通しては明らかにできないが、それぞれの軌道を別々に識別する能力が必要である。
観測者の各測定結果の識別能力の低下の下でMIPTの運命を探究する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:30:18 GMT)
Watch Out Your Album! On the Inadvertent Privacy Memorization in Multi-Modal Large Language Models [39.3] タスク非関連なプライベートコンテンツが、ミニバッチトレーニングのダイナミクスにより、下流の目標といかに素早い相関関係を持つかを示す。
実験の結果,MLLMはタスク非関連透かしを埋め込んだ部分的なミニバッチ設定において,異なるトレーニング行動を示すことがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:35:53 GMT)
OneEval: Benchmarking LLM Knowledge-intensive Reasoning over Diverse Knowledge Bases [38.6] textbftextscOneEvalは、LLM(Large Language Models)の知識集約推論能力を評価するベンチマークである。
textscOneEvalは、慎重にキュレートされた4,019のインスタンスで構成され、特に難しいケースが1,285である、挑戦的なサブセットであるtextscOneEvaltextsubscriptHardを含んでいる。
我々は、構造化知識推論の継続的な進歩を促進するためのリーダーボードを伴って、textscOneEvalデータセット、評価スクリプト、ベースライン結果を公開した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:16:05 GMT)
Group then Scale: Dynamic Mixture-of-Experts Multilingual Language Model [38.1] 18言語から128言語の実験結果から,本手法は言語間の負の移動を減らし,パラメータの少ない多言語性能を著しく向上させることが示された。
このような専門家の言語グループ専門化は、新しい言語適応の恩恵を受け、学習した過去の多言語知識に対する推論を減らす。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:56:18 GMT)
OS-Kairos: Adaptive Interaction for MLLM-Powered GUI Agents [37.9] 本稿では,各インタラクションステップにおける信頼度を予測可能な適応GUIエージェントOS-Kairosを紹介する。
我々はOS-Kairosが複雑なシナリオを特徴とするキュレートデータセットの既存モデルを大幅に上回っていることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:07:11 GMT)
The Foundation Cracks: A Comprehensive Study on Bugs and Testing Practices in LLM Libraries [37.6] 大規模言語モデル(LLM)ライブラリは、今日のAI革命を支える基盤インフラストラクチャとして登場した。
LLMエコシステムにおけるそれらの重要な役割にもかかわらず、これらのライブラリは、それら上に構築されたAIシステムの信頼性を脅かすような、頻繁な品質の問題とバグに直面している。
本稿では,近代LLMライブラリにおけるバグの特徴とテスト実践に関する総合的研究について紹介する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:00:36 GMT)
CORONA: A Coarse-to-Fine Framework for Graph-based Recommendation with Large Language Models [37.3] 大規模言語モデル(LLM)はドメイン間で強力な機能を示している。
提案手法は,候補フィルタリング過程におけるLLMの推論能力を活用することである。
我々は,候補項目の範囲を徐々に狭めるために,検索の連鎖(Chein Of Retrieval ON grAphs)を導入する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:20:15 GMT)
Fine-Grained HDR Image Quality Assessment From Noticeably Distorted to Very High Fidelity [36.8] 高ダイナミックレンジ(SDR)および広色域(WCG)技術は、標準ダイナミックレンジ(SDR)や標準色域(SDR)と比較して色再現性を著しく向上させる。
しかし、HDRはデータ要求を増大させ、帯域幅の効率と圧縮技術に挑戦する。
圧縮および表示技術の進歩は、より正確な画像品質評価を必要とする。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:36:15 GMT)
InverTune: Removing Backdoors from Multimodal Contrastive Learning Models via Trigger Inversion and Activation Tuning [36.6] InverTuneは、最小限の攻撃仮定の下で、マルチモーダルモデルのための最初のバックドアディフェンスフレームワークである。
InverTuneは、3つの主要なコンポーネントを通じてバックドアアーティファクトを効果的に識別し、削除し、バックドアアタックに対する堅牢な保護を実現する。
実験の結果、InverTuneは最先端(SOTA)攻撃に対して平均攻撃成功率(ASR)を97.87%削減した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:08:34 GMT)
Is your batch size the problem? Revisiting the Adam-SGD gap in language modeling [36.1] 言語モデルでは、AdamはGradient Descent(SGD)よりもはるかに優れていることが知られている。
我々は,SGDとAdamのギャップに運動量,勾配クリッピング,バッチサイズがどのような影響を及ぼすか,徹底的に検討した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:37:31 GMT)
Learning Best Paths in Quantum Networks [35.9] 量子ネットワーク(QN)は、ノイズの多い量子チャネルをまたいだ繊細な量子情報を伝達する。
本稿では,オンライン学習環境におけるQNの学習経路について述べる。
そこで我々は,BeQuP-LinkとBeQuP-Pathという2つのオンライン学習アルゴリズムを導入し,最適経路の同定を行った。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:01:16 GMT)
AntiGrounding: Lifting Robotic Actions into VLM Representation Space for Decision Making [35.8] AntiGroundingは、命令のグラウンディングプロセスをリバースする新しいフレームワークである。
候補アクションをVLM表現空間に直接持ち上げる。
複数のビューからトラジェクトリを描画し、命令ベースの意思決定に構造化された視覚的質問応答を使用する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:11:44 GMT)
Fino1: On the Transferability of Reasoning-Enhanced LLMs and Reinforcement Learning to Finance [35.6] FinReasonは、マルチテーブル分析、長期コンテキスト推論、方程式ベースのタスクをカバーする最初の財務推論ベンチマークである。
7つのQAデータセットから抽出した、ファイナンスのための最初のオープンな高忠実度CoTコーパスであるFinCoTを紹介する。
我々は、教師付き微調整とGRPOベースのRLを用いて訓練された最初のオープンファイナンシャル推論モデルであるFin-o1を開発した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:19:54 GMT)
Cross-Domain Conditional Diffusion Models for Time Series Imputation [34.4] クロスドメイン時系列計算は、探索されていないデータ中心の研究課題である。
既存のアプローチは主に単一ドメインの設定に焦点を当てています。
提案手法は、ドメイン固有の時間構造を維持しながら、両方のドメインから共有されるスペクトル成分を統合する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:09:07 GMT)
Reading Between the Lanes: Text VideoQA on the Road [33.0] RoadTextVQAは、ビデオ質問応答(VideoQA)タスクのための新しいデータセットである。
RoadTextVQAは、複数の国から集められた3222ドルのドライビングビデオで構成され、10,500ドルの質問が付録されている。
RoadTextVQAデータセット上で、最先端のビデオ質問応答モデルの性能を評価する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:45:01 GMT)
Good Noise Makes Good Edits: A Training-Free Diffusion-Based Video Editing with Image and Text Prompts [32.9] 画像とテキストの両方に条件付けされた、最初のゼロショットでトレーニング不要なビデオ編集手法であるImEditを提案する。
提案手法では,コヒーレントかつ高精度な編集を行うためのノイズマップを構築するために,$rho$-startサンプリングと拡張二重マスキングを導入する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:23:25 GMT)
Language Surgery in Multilingual Large Language Models [32.8] 大規模言語モデル(LLM)はタスクや言語にまたがる顕著な一般化機能を示している。
本稿では, LLMにおける自然に出現する表現アライメント, 特に中層における表現アライメントについて検討する。
本稿では,言語間言語制御の高精度化と言語混乱を軽減するため,ITLC(Inference-Time Language Control)を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:09:50 GMT)
CoT-based Synthesizer: Enhancing LLM Performance through Answer Synthesis [32.0] 本稿では,CoTをベースとした新しい推論スケーリング戦略であるSynthesizerを提案する。
複数の候補応答から相補的な情報を解析することにより、優れた回答を合成する。
その結果,Llama3-8Bは11.8%,GPT-4oは10.3%向上した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:58:51 GMT)
Performance Plateaus in Inference-Time Scaling for Text-to-Image Diffusion Without External Models [31.9] テキストから画像への拡散モデルの初期ノイズを最適化するアルゴリズムにベスト・オブ・Nの推論時間スケーリングを適用する。
本研究では,テキストから画像への拡散モデルに対する推論時間スケーリングが急速に性能高原に達することを実証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:25:08 GMT)
AgentOrchestra: A Hierarchical Multi-Agent Framework for General-Purpose Task Solving [31.6] Projectnameは汎用タスク解決のための階層的なマルチエージェントフレームワークである。
Projectnameは、複雑な目的を分解し、サブタスクを専門エージェントのチームに委譲する中央計画エージェントを特徴とする。
各サブエージェントは、汎用プログラミングおよび分析ツールと、幅広い現実世界固有のタスクに取り組む能力を備えている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:45:37 GMT)
Refract ICL: Rethinking Example Selection in the Era of Million-Token Models [31.2] LLM(Long-context large language model)は、インコンテキスト学習(ICL)に数百、あるいは数千のデモを利用可能にしている。
本稿では、ICLの例とテスト入力の類似性をバランスさせる従来のICL選択戦略が、多数の実演を利用する場合の有効性について検討する。
本稿では, LLM に着目した新しい ICL 選択アルゴリズム Refract ICL を紹介する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:51:34 GMT)
RealFactBench: A Benchmark for Evaluating Large Language Models in Real-World Fact-Checking [31.0] 本稿では,Large Language Models(LLM)とMultimodal Large Language Models(MLLM)のファクトチェック機能を評価するためのベンチマークであるRealFactBenchを紹介する。
RealFactBenchは、権威のあるソースから引き出された6Kの高品質なクレームで構成され、マルチモーダルコンテンツと多様なドメインを含んでいる。
評価フレームワークはさらにUnknown Rate(UnR)メトリクスを導入し、不確実性を扱うモデルの能力をよりきめ細やかな評価を可能にします。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:27:44 GMT)
Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios [30.8] テキスト画像超解像(SR)の拡散モデルの一般化能力向上を目的とした新しいフレームワークを提案する。
本稿では,様々な訓練段階における多様な画像型を取り入れ,収束を安定化し,一般化を改善するプログレッシブなデータサンプリング戦略を提案する。
実世界のデータセットを用いた実験により、我々のアプローチはよりリアルな視覚的外観を持つテキスト画像を生成するだけでなく、テキスト構造の精度も向上することが示された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:27:27 GMT)
Profiling News Media for Factuality and Bias Using LLMs and the Fact-Checking Methodology of Human Experts [30.0] 本稿では,プロのファクトチェッカーがアウトレット全体の事実と政治的偏見を評価するために使用する基準をエミュレートする新しい手法を提案する。
メディアの人気と地域がモデル性能に与える影響を詳細に分析する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:49:20 GMT)
Efficient Reasoning Through Suppression of Self-Affirmation Reflections in Large Reasoning Models [29.6] 自己確認反射は、事前の内容を肯定する冗長な反射ステップであり、しばしば既に正しい推論ステップの後に起こる。
自己確認反射の抑制は複数のモデル間で精度を低下させることなく出力長を減少させることを示す。
また、そのような反射を明示的に抑制することで、現行の列車方式も改善する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:30:09 GMT)
Instruction Learning Paradigms: A Dual Perspective on White-box and Black-box LLMs [29.2] 両パラダイムの長所をシームレスにマージする新しいフレームワークを導入する。
私たちのアプローチは、最先端のベースラインを一貫して上回ります。
このブラックボックスの初期化と高度なセマンティックリファインメントの融合は、スケーラブルで効率的な解をもたらす。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:27:54 GMT)
Monitoring Decomposition Attacks in LLMs with Lightweight Sequential Monitors [28.0] 現在のLLMの安全防衛は分解攻撃で失敗し、悪意のあるゴールは拒否を回避する良質なサブタスクに分解される。
より粒度の高い会話を観察する外部モニタの追加を提案する。
念入りに設計した軽量モニタは93%の防衛成功率を達成し、モニタとしてo3 miniのような推論モデルを上回る結果となった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:17:52 GMT)
Adapt-Pruner: Adaptive Structural Pruning for Efficient Small Language Model Training [27.9] スモール言語モデル (SLM) はエッジデバイスにおける幅広い応用のために注目されている。
高い性能を持つSLMを得るには、計算コストがかなりかかるスクラッチからモデルを事前訓練するか、既存の大規模言語モデル(LLM)を圧縮し、事前訓練に比べて性能が低下し低下する。
1) レイヤーワイド適応プルーニング (Adapt-Pruner) は, LLM において極めて有効であり, 既存のプルーニング技術よりも顕著な改善が得られ, 2) さらなるトレーニングを施した適応プルーニングは, スクラッチから事前学習したプルーニングに匹敵するモデルとなる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:51:27 GMT)
Merlin: Multi-View Representation Learning for Robust Multivariate Time Series Forecasting with Unfixed Missing Rates [27.8] 本稿では,既存のモデルが不完全観測と不完全観測のセマンティックアライメントを達成するのに役立つマルチビュー表現学習(Merlin)を提案する。
Merlinは、予測精度を保ちながら、未固定の欠落率に対して既存のモデルの堅牢性を効果的に強化することができる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:55:18 GMT)
How Grounded is Wikipedia? A Study on Structured Evidential Support [27.6] Wikipedia*lead*セクションのクレームの約20%が記事本体によってサポートされていないことを示す。
また, *are* が支持されているという主張に対する複雑な根拠的証拠の回収は, 標準的な検索手法の課題であることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:40:14 GMT)
Image Corruption-Inspired Membership Inference Attacks against Large Vision-Language Models [27.0] 大規模視覚言語モデル(LVLM)は多くの下流タスクにおいて優れた性能を示した。
画像がLVLMのトレーニングに使用されるかどうかを検出することが重要である。
最近の研究は、LVLMに対するMIA(メンバシップ推論攻撃)について研究している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:22:36 GMT)
GSDNet: Revisiting Incomplete Multimodal-Diffusion from Graph Spectrum Perspective for Conversation Emotion Recognition [26.4] 会話におけるマルチモーダル感情認識は,複数の情報源からの発話情報を分析し,話者の感情状態を推定することを目的としている。
モダリティの欠如は、実用的なシナリオにおけるMERCの性能を著しく制限する。
本稿では,ガウス雑音をモダリティのグラフスペクトル空間にマッピングするグラフスペクトル拡散ネットワーク(GSDNet, Graph Spectral Diffusion Network)を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:24:19 GMT)
HYPER: A Foundation Model for Inductive Link Prediction with Knowledge Hypergraphs [26.0] リンク予測の基礎モデルとしてHYPERを提案する。
HYPERは、各ハイパーエッジのエンティティをエンコードすることで、さまざまなアリティの異なる関係タイプを学習し、転送することができる。
HYPERは、ノードのみとノードとリレーショナルの両方のインダクティブ設定において、既存のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:53:49 GMT)
Conditional Average Treatment Effect Estimation Under Hidden Confounders [25.6] 擬似共同生成器とCATEモデルに基づくCATE推定手法を提案する。
我々の方法は、特にプライバシーが懸念される多くの実践的なシナリオに当てはまる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:43:07 GMT)
Delving into Instance-Dependent Label Noise in Graph Data: A Comprehensive Study and Benchmark [25.4] グラフニューラルネットワーク(GNN)はノード分類タスクでは最先端のパフォーマンスを達成したが、実世界のデータではラベルノイズに悩まされている。
BeGINは、様々なノイズタイプでリアルなグラフデータセットを提供する新しいベンチマークである。
ノイズ処理戦略を包括的に評価することにより、BeGINは、その効果、効率、および重要なパフォーマンス要因に関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:14:15 GMT)
CATE Estimation With Potential Outcome Imputation From Local Regression [25.0] 本研究では,条件付き平均処理効果推定のためのモデルに依存しないデータ拡張手法を提案する。
このアイデアにインスパイアされた我々は、潜在的に欠落する可能性を確実に示唆する対照的な学習手法を提案する。
提案手法の有効性を実証する理論的保証と広範な数値的研究の両方を提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:32:21 GMT)
ArchShapeNet:An Interpretable 3D-CNN Framework for Evaluating Architectural Shapes [24.7] ArchForms-4000は2000人の建築家が設計し、2000人のエボマスが生成した3Dフォームを含むデータセットである。
ArchShapeNetはアーキテクチャフォームの分類と解析に適した3D畳み込みニューラルネットワークである。
我々のモデルは、フォーム起源の区別において人間の専門家より優れており、94.29%の精度、96.2%の精度、98.51%のリコールを達成している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:43:59 GMT)
QiMeng-Attention: SOTA Attention Operator is generated by SOTA Attention Algorithm [24.1] 我々は,LLMがGPU上での高レベル最適化ロジックの生成と低レベル実装を分離するためのLLMフレンドリーな思考言語(LLM-TL)を提案する。
2段階の推論ワークフロー、TL-Codeの生成と変換に加えて、LLMはさまざまなGPU上でFlashAttention実装を自動的に生成できる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:38:19 GMT)
IndoorWorld: Integrating Physical Task Solving and Social Simulation in A Heterogeneous Multi-Agent Environment [24.1] IndoorWorldは、物理と社会のダイナミクスを密に統合した異質なマルチエージェント環境である。
エージェントの動作に対するマルチエージェント協調,資源競争,空間的レイアウトの影響を検討するために,オフィス環境における一連の実験を行い,その可能性を実証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:44:09 GMT)
FlexRAG: A Flexible and Comprehensive Framework for Retrieval-Augmented Generation [24.0] RAGは現代の大規模言語モデルアプリケーションにおいて重要な役割を担い、多くの既存のフレームワークが幅広い機能を提供している。
アルゴリズムの複製と共有の難しさなど,これらのフレームワークにおけるいくつかの永続的な課題を特定してきた。
これらの制限に対処するために、研究とプロトタイプ用に特別に設計されたオープンソースフレームワークである textbfFlexRAG を紹介します。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:16:31 GMT)
From Outcomes to Processes: Guiding PRM Learning from ORM for Inference-Time Alignment [23.5] 報酬誘導探索(RGS)にプロセス報酬モデル(PRM)を導入する。
本研究では,SP-PRMを提案する。SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM,SP-PRM。
対話、要約、推論タスクの実験は、SP-PRMが既存のRGSメソッドを大幅に強化し、全タスクでGPT-4の評価スコアが3.6%-10.3%向上したことを示している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:58:38 GMT)
Theoretical Tensions in RLHF: Reconciling Empirical Success with Inconsistencies in Social Choice Theory [23.0] 人間のフィードバックからの強化学習は、社会的選択論の基本的な公理にほとんど違反することが示されている。
本稿では,RLHFが2対の過半数とコンドルチェットの整合性を満足することを示す。
報酬モデリングの目的を少し変更することで、一般的な嗜好プロファイルの下でもペアの多数派やコンドルセットの一貫性を確保することができる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:14:49 GMT)
Path-specific effects for pulse-oximetry guided decisions in critical care [23.0] 本研究は, 酸素濃度測定における人種的差異がICU環境の侵入換気に与える影響を因果的に検討した。
我々は、経路特異的効果を用いた因果推論に基づくアプローチを用いて、人種による偏見が臨床的意思決定に与える影響を分離する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:45:53 GMT)
Control Tax: The Price of Keeping AI in Check [22.9] 我々は、AIパイプラインに制御手段を統合するための運用的および財政的コストである制御税の概念を導入する。
我々は,現在最先端の言語モデルに関する総合的な評価を,敵対的設定で実施する。
制御プロトコルに対する実証的な金銭的コスト見積を行い、最適化されたモニタリング戦略を開発する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:09:16 GMT)
Synthetic Socratic Debates: Examining Persona Effects on Moral Decision and Persuasion Dynamics [22.9] 実世界の道徳ジレンマに関するAI-AI討論会において,多次元ペルソナ効果の大規模研究を行った。
以上の結果から,ペルソナは政治的イデオロギーや人格特性に強く影響していることが示唆された。
説得力のある成功は特徴によって異なり、リベラルでオープンな個性はより高いコンセンサスと勝利率に達する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:14:49 GMT)
Towards Seamless Borders: A Method for Mitigating Inconsistencies in Image Inpainting and Outpainting [22.5] 拡散型塗布モデルにおける不一致問題に対処する2つの新しい手法を提案する。
まず,色不均衡を補正する修正変分オートエンコーダを導入する。
次に,拡散過程において生成した画像と既存の画像のブレンディングを改善するための2段階のトレーニング戦略を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:02:56 GMT)
Sparse Interpretable Deep Learning with LIES Networks for Symbolic Regression [22.3] 記号回帰は、データを正確に記述する閉形式の数学的表現を発見することを目的としている。
既存のSR手法は、しばしば人口に基づく探索や自己回帰モデリングに依存している。
LIES(Logarithm, Identity, Exponential, Sine)は,シンボル表現のモデル化に最適化された,解釈可能なプリミティブアクティベーションを備えたニューラルネットワークアーキテクチャである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:24:10 GMT)
Interpretable Text-Guided Image Clustering via Iterative Search [22.0] 特定のユーザーは、異なる基準を使って同じデータにクラスタを作りたいかもしれない。
我々は、教師なしクラスタリングの目的によってガイドされる反復的な発見プロセスを利用する、ITGCという新しいテキスト誘導クラスタリング手法を提案する。
画像クラスタリングやきめ細かい分類ベンチマークにおいて,既存の手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:58:56 GMT)
DR-SAC: Distributionally Robust Soft Actor-Critic for Reinforcement Learning under Uncertainty [21.5] 深層強化学習(英語版)(RL)は大きな成功を収めているが、実世界のシナリオにおけるその応用は、環境の不確実性に対する堅牢性の欠如によってしばしば妨げられている。
本研究では,最新技術であるSoft Actor-Critic(SAC)アルゴリズムのロバスト性を高めるために,分散ロバストなSoft Actor-Critic(DR-SAC)を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:36:44 GMT)
Unifying Lane-Level Traffic Prediction from a Graph Structural Perspective: Benchmark and Baseline [21.4] 本稿では,レーンレベルの交通予測のための最初の体系的分類フレームワークについて述べる。
我々は,2つの実世界の道路網から3つの代表的データセットを構築し,レギュラーレーン構成と不規則レーン構成の両方を網羅した。
この統合されたフレームワークは、データセットとモデリングパラダイムをまたいだ一貫した評価を可能にする。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:23:49 GMT)
Med-U1: Incentivizing Unified Medical Reasoning in LLMs via Large-scale Reinforcement Learning [20.9] 医療質問回答(英語版)(QA)は、複数の選択質問(MCQ)、オープンエンドテキスト生成、複雑な計算推論を含む幅広いタスクを含む。
この多様性にもかかわらず、高品質な医療用QAを提供するための統一されたフレームワークはまだ現れていない。
医療用QAタスクを多種多様な出力形式で頑健な推論を行うための統合フレームワークであるMed-U1を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:00:36 GMT)
Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries [20.8] 本稿では,SPTI(Synsration via Private Textual Intermediaries)と呼ばれる新しい手法を提案する。
SPTIはまず、各プライベート画像をテキストモデルに画像を用いた簡潔なテキスト記述に要約し、その後、修正されたPrivate Evolutionアルゴリズムを適用してDPテキストを生成し、最終的に画像モデルにテキストを使用したイメージを再構成する。
プライベートデータセットが与えられた場合、SPTIは以前のDPアプローチよりもかなり高品質な合成画像を生成する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:19:44 GMT)
Gradient-based Fine-Tuning through Pre-trained Model Regularization [20.8] 重み行列の行や列を更新する効率的な勾配ベースおよび正規化微調整法(GRFT)を提案する。
GRFTは最先端のパフォーマンスを実現し、GPS、Adapter Tuning、LoRAといった既存の手法を超越している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:41:03 GMT)
DinoCompanion: An Attachment-Theory Informed Multimodal Robot for Emotionally Responsive Child-AI Interaction [20.5] DinoCompanionは、感情に反応する児童とAIのインタラクションのための、アタッチメント理論に基づく最初のマルチモーダルロボットである。
発達的にインフォームドされたAIアーキテクチャの欠如、安全性とエンゲージメントのバランスの必要性、アタッチメントベースの機能のための標準化された評価フレームワークの欠如、という3つの重要な課題に対処する。
DinoCompanionは最先端のパフォーマンス(57.15%)、GPT-4o(50.29%)、Claude-3.7-Sonnet(53.43%)を上回っている
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:54:07 GMT)
Scholar Inbox: Personalized Paper Recommendations for Scientists [20.5] Scholar Inboxは、研究者が現在の状態を維持する上で直面する課題に、急速に増大する科学文献に対処するために設計された、新しいオープンアクセスプラットフォームである。
我々は、パーソナライズされたレコメンデーション、オープンアクセスアーカイブからの継続的な更新、ビジュアルペーパー要約、セマンティック検索、そしてオープンな研究アクセスを効率化し促進するための様々なツールを提供する。
プラットフォームのパーソナライズされたレコメンデーションシステムは、個々の研究者の関心に合わせたレコメンデーションを保証するために、ユーザのレーティングに基づいてトレーニングされている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:27:19 GMT)
Efficient Unified Caching for Accelerating Heterogeneous AI Workloads [20.2] 現代のAIクラスタは、データ前処理やトレーニング、推論など、さまざまなワークロードをホストしている。
コード侵入の複雑さを回避し、キャッシュスペースの浪費を最小限にするため、すべてのワークロードで共有される統一キャッシュを維持することが望ましい。
我々は,現代AIクラスタのための統合された高効率キャッシュIGTCacheを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:36:54 GMT)
Sliding-Window Thompson Sampling for Non-Stationary Settings [20.1] NS-MAB(Non-stationary Multi-armed Bandits)は、シーケンシャルな意思決定問題をモデル化する。
我々は既存の作業の修正と一般化を行うNS-MABのためのトンプソンサンプリングインスパイアされたアルゴリズムを解析する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:39:19 GMT)
Contrastive Representation for Interactive Recommendation [20.0] 対話型レコメンデーション(CRIR)のためのコントラスト表現を提案する。
CRIRは、明示的な相互作用から潜在的、高レベルな選好ランクの機能を効率的に抽出する。
また、CRIRを深層強化学習のバックボーンに適応させるためのデータ活用機構とエージェント訓練機構を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:20:18 GMT)
MEraser: An Effective Fingerprint Erasure Approach for Large Language Models [19.8] 大規模言語モデル(LLM)は、様々な分野に広まり、モデルの所有と知的財産保護に関する重要な懸念を提起している。
モデル性能を維持しつつ, LLMからバックドアベースの指紋を効果的に除去する手法であるMismatched Eraser(MEraser)を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:48:53 GMT)
On the existence of consistent adversarial attacks in high-dimensional linear classification [19.8] 我々は、一貫した敵攻撃に対するモデルの脆弱性を定量化する新しいエラー指標を導入する。
我々の主な技術的貢献は、よく特定されたモデルと潜在空間モデルの両方において、これらの指標の正確かつ厳密な特徴付けである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:25:35 GMT)
Feature Complementation Architecture for Visual Place Recognition [19.8] 視覚的位置認識(VPR)は、ロボットのローカライゼーションとナビゲーションにおいて重要な役割を果たす。
既存の手法では、典型的には畳み込みニューラルネットワーク(CNN)や視覚変換器(ViT)を特徴抽出器として採用している。
並列CNN-ViTハイブリッドアーキテクチャと動的特徴融合モジュール(DFM)を統合したVPRのためのローカル・グローバル特徴補完ネットワーク(LGCN)を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:32:55 GMT)
PHOENIX: Pauli-Based High-Level Optimization Engine for Instruction Execution on NISQ Devices [19.6] 本研究はPHOENIXについて紹介する。PHOENIXは、一般的なハミルトンシミュレーションプログラムのための、主にハイレベルなPauliベース中間表現(IR)で動作するコンパイルフレームワークである。
実験の結果、PHOENIXは様々なプログラムカテゴリ、バックエンドISA、ハードウェアトポロジでSOTA VQAコンパイラより優れていることが示された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:48:42 GMT)
Generalized Category Discovery under the Long-Tailed Distribution [19.6] 本稿では,長期分布下での一般カテゴリー発見(GCD)の問題に対処する。
これらの課題に対処するために,自信あるサンプル選択と密度に基づくクラスタリングに基づくフレームワークを提案する。
本手法の有効性を実証するために, 長い尾を持つGCDデータセットと従来のGCDデータセットの比較実験を行った。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:06:40 GMT)
Intersectional Bias in Japanese Large Language Models from a Contextualized Perspective [19.2] 本研究では,大規模言語モデル(LLM)における交叉バイアスを評価するために,JBBQ間ベンチマークを構築した。
社会的属性の等しい組み合わせであっても, バイアス出力は文脈によって異なることがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:30:07 GMT)
Measuring Diversity: Axioms and Challenges [18.5] 既存の尺度はいずれも3つの性質を持ちておらず,多様性の定量化には適していないことを示す。
望ましい性質をすべて備えた測度の2つの例を構築し、公理のリストが自己矛盾ではないことを証明した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:52:16 GMT)
Feeling Machines: Ethics, Culture, and the Rise of Emotional AI [18.2] 本稿では,批判的・学際的なレンズによる感情応答型人工知能の存在感の高まりについて考察する。
それは、人間の感情をシミュレートし、解釈するAIシステムが、教育、医療、メンタルヘルス、介護、デジタルライフなどの分野における私たちのインタラクションをどう変えているかを探求する。
この分析は、感情的AIの倫理的意味、人間と機械の相互作用の文化的ダイナミクス、脆弱な人口のリスクと機会、そして新たな規制、設計、技術的考察の4つの中心的なテーマに基づいて構成されている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:28:26 GMT)
Exploiting AI for Attacks: On the Interplay between Adversarial AI and Offensive AI [18.2] 攻撃対象としてのAI(Adversarial AI')と、攻撃対象に対する攻撃を開始する手段としてのAI(Offensive AI')
この記事では、AIに関連する2つの脅威と、それら間の相互作用について説明する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:21:01 GMT)
Automating Versatile Time-Series Analysis with Tiny Transformers on Embedded FPGAs [18.2] 本稿では,組み込みFPGA上でのTiny Transformersの統一的かつ完全に自動化されたデプロイメントフレームワークを提案する。
我々のフレームワークは、3つの典型的な時系列タスクにまたがるコンパクトエンコーダのみのトランスフォーマーアーキテクチャをサポートしている。
その結果,AMD Spartan-7では,1推論あたり0.033mJとミリ秒のレイテンシで達成できる,整数のみのタスク固有のトランスフォーマーアクセラレータを作成した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:45:46 GMT)
MVP-CBM:Multi-layer Visual Preference-enhanced Concept Bottleneck Model for Explainable Medical Image Classification [17.9] 概念ボトルネックモデル(CBM)は、予測と人間の理解可能な概念をリンクすることで、解釈可能性を改善する。
MVP-CBM(Visual Preference-enhanced Concept Bottleneck Model)を提案する。
MVP-CBMは、多層視覚情報を包括的に活用して、より微妙で正確なモデル決定の説明を提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:52:04 GMT)
Exploring the Secondary Risks of Large Language Models [17.8] 良心的衝動時の有害または誤解を招く行動に特徴付けられる二次的リスクを導入する。
敵の攻撃とは異なり、これらのリスクは不完全な一般化から生じ、しばしば標準的な安全メカニズムを回避する。
本研究では,ブラックボックス型多目的検索フレームワークSecLensを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:31:52 GMT)
M3Depth: Wavelet-Enhanced Depth Estimation on Mars via Mutual Boosting of Dual-Modal Data [17.0] 火星探査機に適した深度推定モデルであるM3Depthを提案する。
火星の地形のスムーズでスムーズなテクスチャを考えると,このモデルにはウェーブレット変換に基づく畳み込みカーネルが組み込まれている。
M3Depthは、深さ推定における他の最先端手法と比較して、深さ推定精度が16%向上した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:34:14 GMT)
Existence of Adversarial Examples for Random Convolutional Networks via Isoperimetric Inequalities on $\mathbb{so}(d)$ [16.9] これは特殊群 $mathbbso(d)$ 上の等尺不等式による比較的単純な結果であることを示す。
これは、ランダムに完全に接続されたネットワークに対して同様の結果を示す最近の作業ラインを拡張し、単純化する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:48:44 GMT)
Overview of the NLPCC 2025 Shared Task: Gender Bias Mitigation Challenge [16.2] 中国語cOrpus foR Gender bIas Probing and Mitigation (CORGI-PM)を提案する。
中国語の文脈で性バイアスに特化して開発された注釈スキームに従って、高品質なラベルを持つ32.9kの文を含む。
注意すべき点は、CORGI-PMは5.2kの性別バイアスのある文と、人間のアノテーションによって書き直されたバイアスを除去したバージョンを含んでいることである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:06:04 GMT)
FAIR-TAT: Improving Model Fairness Using Targeted Adversarial Training [16.1] FAIR-TAT(Fair Targeted Adversarial Training)と呼ばれる新しいアプローチを導入する。
敵の対人訓練(標的外攻撃ではなく)に標的の対人攻撃を使用することで、敵の対人公正性に関してより有利なトレードオフが可能になることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:10:21 GMT)
KVCache Cache in the Wild: Characterizing and Optimizing KVCache Cache at a Large Cloud Provider [15.5] 大規模言語モデル(LLM)の実現はクラウドプロバイダにとって重要であり、各要求処理後の中間結果(KV$)をキャッシュすることで、スループットとレイテンシが大幅に向上する。
我々は、主要なLLMサービスプロバイダの1つから、KV$ワークロードパターンを初めて体系的に評価した。
本稿では,特にキャッシュ容量の制限により,実世界のトレース下でのサービス性能を向上させる,ワークロード対応のキャッシュ消去ポリシーを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:39:21 GMT)
Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control [14.9] 本稿では,動的グラフニューラルネットワーク(DGNN)とトポロジカルデータ解析(TDA)を統合した新しいMARLフレームワークを提案する。
大規模言語モデル (LLMs) におけるMixture of Experts (MoE) アーキテクチャに着想を得て, 位相支援型空間パターンアンタングリング (TSD) 強化型MoEを提案する。
実世界の交通シナリオにおいて行われた大規模な実験は、包括的な理論的分析とともに、提案フレームワークの優れた性能を検証した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:18:12 GMT)
PLD: A Choice-Theoretic List-Wise Knowledge Distillation [14.8] 我々は,教師のロジットを「価値」スコアと解釈することで,プラケット・ルーシモデルの下で知識蒸留をリキャストする。
そこで我々は,教師モデルがクラスの全ランキングに関する知識を伝達する,重み付きリストレベルのランキング損失であるPlockett-Luce Distillation (PLD)を紹介した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:31:54 GMT)
Deep Fictitious Play-Based Potential Differential Games for Learning Human-Like Interaction at Unsignalized Intersections [14.8] 我々はDeep Fictitious Playを用いて,未署名の交差点で人間のようなインタラクティブな運転ポリシーを学習する。
私たちの知る限りでは、Deep Fictitious Playを使ってインタラクティブな運転ポリシーをトレーニングするのはこれが初めてです。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:08:33 GMT)
Efficient Star Distillation Attention Network for Lightweight Image Super-Resolution [14.7] 我々は,HDNL特徴空間における情報蒸留による識別表現学習を強化するために,スター蒸留モジュール(SDM)を提案する。
さらに,多形多大カーネルアテンション(MM-LKA)モジュールを提案する。
モデル複雑性の低いSDANは、量的にも視覚的にも優れた性能をもたらす。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:24:15 GMT)
Scalable Precise Computation of Shannon Entropy [14.7] 本稿では、スケーラブルな精密ツールPSEを実装するために、Boolean制約でモデル化されたプログラムに焦点を当てる。
ADDANDはプログラムの可能な出力の列挙を回避し、トラクタブルエントロピー計算をサポートする。
PSEとEntropyEstimationの両方が解決したベンチマークの98%に対して、PSEはEntropyEstimationの少なくとも10倍の効率である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:48:40 GMT)
Smurfs: Multi-Agent System using Context-Efficient DFSDT for Tool Planning [14.6] Smurfsは、DFSDTをモジュール的で、文脈効率が高く、トレーニング不要な設計で強化する新しいマルチエージェントシステムである。
Smurfsは、オープンエンドのStableToolBenchとクローズドエンドのHotpotQAタスクのベースラインメソッドを上回っている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:36:54 GMT)
PKU-SafeRLHF: Towards Multi-Level Safety Alignment for LLMs with Human Preference [14.5] PKU-SafeRLHFデータセットは、大規模言語モデル(LLM)における安全性アライメントの研究を促進するために設計された。
SafeRLHF と BeaverTails の兄弟プロジェクトとして,質問応答ペアに対する有用性と無害性のアノテーションを分離する。
全体として、44.6kの精巧なプロンプトと、265kの質問応答ペアに、安全メタラベルを19の有害カテゴリーと3つの重度レベルを付与する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:04:31 GMT)
Macroscopic entanglement of three magnon modes in three cavities via optical parametric amplifier [14.4] 3つのキャビティ系において3つのマグノンモードの2部および三部を交互に生成する手法を提案する。
絡み合いは浴槽温度に対して頑丈である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:36:18 GMT)
GrokAlign: Geometric Characterisation and Acceleration of Grokking [14.3] ネットワークのヤコビアンをトレーニングデータと整合させることによって、低ランクのヤコビアン仮定の下でグルーキングが保証されることを示す。
この結果は、深いネットワークの最適化にヤコビ正規化を用いるための強力な理論的動機を与える。
我々はジャコビアンアライメントのトラクタブルかつ解釈可能な簡易化としてセントロイドアライメントを導入する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:16:11 GMT)
ConsistencyChecker: Tree-based Evaluation of LLM Generalization Capabilities [14.1] 大きな言語モデル(LLM)の一貫性を評価することは、信頼性を確保するために不可欠である。
従来の自己整合性メソッドは、自然言語の微妙な意味的変化や、コードや方程式の関数的シフトを見逃すことが多い。
可逆変換のシーケンスによる一貫性の測定を目的とした木に基づく評価フレームワークであるConsistencyCheckerを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:18:33 GMT)
Wireless Channel Identification via Conditional Diffusion Model [14.0] 無線システムにおけるチャネルシナリオの識別は、チャネルモデリング、無線指紋位置決め、トランシーバ設計において重要な役割を果たす。
本稿では,その識別タスクをMAP推定の最大値として定式化する,新しいチャネルシナリオ同定手法を提案する。
条件生成拡散モデルの逆過程における複数の遅延雑音空間における隠れチャネル特徴を捕捉するために、トランスフォーマネットワークを利用する。
実験の結果,提案手法は,畳み込みニューラルネットワーク(CNN),バックプロパゲーションニューラルネットワーク(BPNN),ランダム森林分類器など,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:34:45 GMT)
Glocal Smoothness: Line Search can really help! [13.4] 一階最適化アルゴリズムの反復複雑性は、一般に勾配の大域リプシッツ定数の項で記述される。
実際に発生する多くの客観的関数は、より大きなステップサイズを使うことができる小さなリプシッツ定数を持つ領域を持つ。
局所的な滑らかさはPolyakとAdGDのステップサイズの改善に繋がることを示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:18:53 GMT)
Machine Learning Methods for Small Data and Upstream Bioprocessing Applications: A Comprehensive Review [13.2] データは機械学習(ML)アプリケーションには不可欠だが、大規模なデータセットの取得にはコストと時間を要する可能性がある。
このレビューでは、小さなデータによって生じる課題に対処するために設計されたML手法について検討し、それらを分類学に分類し、実践的な応用を導く。
これらのメソッドがさまざまな観点から小さなデータ課題にどのように対処するかを分析することで、このレビューは実行可能な洞察を提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:13:05 GMT)
Does learning the right latent variables necessarily improve in-context learning? [13.2] Transformersのような大規模な自己回帰モデルは、新しい重みを学習することなく、コンテキスト内学習(ICL)によってタスクを解決できる。
本稿では,タスクラテントを明示的に推論する効果について検討する。
タスク関連潜伏変数への偏りは、分配性能を向上させるには至らない。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:01:59 GMT)
PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation [13.1] 本稿では,この課題に対処するため,PoGDiffと呼ばれる汎用的な微調整手法を提案する。
実世界のデータセットを用いた実験により,拡散モデルにおける不均衡問題に効果的に対処できることが示されている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:48:17 GMT)
Toward Reasonable Parrots: Why Large Language Models Should Argue with Us by Design [13.1] 我々は、現在、この目的には大きな言語モデル(LLM)が不十分であると主張している。
これには、LLMを置き換えるのではなく、批判的な思考スキルを行使するためのツールとして再定義することが含まれる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:10:42 GMT)
Optimization-Free Diffusion Model -- A Perturbation Theory Approach [12.8] 拡散モデルは、生成モデリングの強力なフレームワークとして登場した。
最適化フリーとフォワードSDEフリーの両方の代替手法を提案する。
本研究では,高次元ボルツマン分布と実世界のデータセットに対する本手法の有効性を示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:04:11 GMT)
CMI-Bench: A Comprehensive Benchmark for Evaluating Music Instruction Following [12.6] CMI-Benchは、様々な音楽情報検索(MIR)タスクにおいて、オーディオテキストLLMを評価するために設計された総合的な音楽指示に従うベンチマークである。
以前のベンチマークとは異なり、CMI-Benchは従来の最先端のMIRモデルと一致する標準化された評価基準を採用している。
LTU,Qwen-audio,SALMONN,MusiLingoなど,オープンソースの音声テキストLLMをサポートする評価ツールキットを提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:18:44 GMT)
Generalized Multi-Objective Reinforcement Learning with Envelope Updates in URLLC-enabled Vehicular Networks [12.3] 我々は,無線ネットワーク選択と自律運転ポリシーを協調的に最適化する,新しい多目的強化学習(MORL)フレームワークを開発した。
ベルマン方程式の一般化版を適用し、多目的Q値の凸包絡を最適化し、最適ポリシーを生成することができる統一パラメトリック表現を学習する。
数値計算により, エンベロープ型MORLソリューションの有効性を検証し, 車両動特性, HOs, 通信データ率の相互依存性に関する興味深い知見を示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:16:33 GMT)
Ultrabright Entanglement Based Quantum Key Distribution over a 404 km Optical Fiber [12.2] 絡み合った光子は量子情報処理にとって重要な資源である。
我々は, 周期的に偏極したニオブ酸リチウム導波路をベースとした光子源を提案する。
我々は、長距離ファイバリンク上で量子鍵分布実験を行うことにより、音源の実用性を実証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:35:39 GMT)
Unveiling Confirmation Bias in Chain-of-Thought Reasoning [12.2] 大型言語モデル(LLM)の推論能力を高めるために、チェーン・オブ・シークレット(CoT)プロンプトが広く採用されている。
本研究は認知心理学におけるテキスト確認バイアスのレンズを通してCoTの行動を理解する新しい視点を示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:30:17 GMT)
Causality-aware Safety Testing for Autonomous Driving Systems [12.1] 総合的な評価には、異なる条件下でさまざまな種類の違反を引き起こす可能性のある、さまざまなシナリオにわたるテストが必要である。
本稿では,自律運転システムの効率的な総合的なテストを実現するためのファジリング手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:29:28 GMT)
Real-Time Per-Garment Virtual Try-On with Temporal Consistency for Loose-Fitting Garments [11.7] 本稿では,ロバストなセマンティックマップ推定のための2段階のアプローチを提案する。
まず、原画像から衣服不変表現を抽出する。
この表現は、セマンティックマップを推定するために補助ネットワークに渡される。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:57:21 GMT)
SOSBENCH: Benchmarking Safety Alignment on Scientific Knowledge [11.6] SOSBenchは、大規模な言語モデルのための規制対象のハザード中心のベンチマークである。
化学、生物学、医学、薬理学、物理学、心理学の6つのリスクの高い分野をカバーしている。
SOSBenchを用いた統合評価フレームワークにおけるフロンティアモデルの評価を行った。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:43:42 GMT)
GroupNL: Low-Resource and Robust CNN Design over Cloud and Device [11.3] クラウドの助けを借りて、ユビキタスモノのインターネット(IoT)デバイスに畳み込みニューラルネットワーク(CNN)モデルをデプロイすることで、さまざまな高品質なサービスを提供している。
既存のほとんどの手法は、IoTデバイスが収集した劣化した画像データの処理におけるロバストネスの低さと、(II)計算および送信リソースの高消費という2つの制限がある。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:02:35 GMT)
Shape-aware Sampling Matters in the Modeling of Multi-Class Tubular Structures [11.3] 深層学習は,ボリュームオーバーラップ精度を優先することで,自動形状モデリングを可能にする。
微粒な管状形状の固有の複雑さは、重なり合う精度によって完全に強調されないため、トポロジカルな保存が減少する。
本研究では,オンラインサンプリングのためのパッチサイズ割り当てを最適化し,目的関数のための位相保存骨格表現を抽出するShapeaware Sampling (SAS)を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:20:08 GMT)
ReFrame: Layer Caching for Accelerated Inference in Real-Time Rendering [11.3] ReFrameは、レンダリングワークロードの品質とパフォーマンスのトレードオフを最適化するために、さまざまなキャッシュポリシを検討する。
3つのリアルタイムレンダリングタスクにおいて、品質損失を無視して平均1.4倍のスピードアップを達成する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:17:43 GMT)
INTERPOS: Interaction Rhythm Guided Positional Morphing for Mobile App Recommender Systems [11.2] 自動回帰型モバイルアプリレコメンデータシステムのための対話リズムガイド型位置定位方式であるInterspectPOSを導入する。
InterPOS は NDCG@K と HIT@K のメトリクスで 7 つのモバイルアプリレコメンデーションデータセットを用いて,最先端のモデルより優れていることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:40:49 GMT)
Uniform convergence of the smooth calibration error and its relationship with functional gradient [10.9] この研究は滑らかな校正誤差(CE)に焦点を当て、一様収束境界を提供する。
我々は3つの代表的なアルゴリズムを解析する: 勾配の押し上げ木、カーネルの押し上げ、2層ニューラルネットワーク。
この結果は,信頼性のある確率モデルを設計するための新たな理論的洞察と実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:11:32 GMT)
MaskGaussian: Adaptive 3D Gaussian Representation from Probabilistic Masks [10.9] 3D Gaussian Splattingは、新しいビュー合成とリアルタイムレンダリングにおいて顕著な性能を示した。
しかし、数百万ガウスの使用によるメモリ消費の増大は、その実用性を制限している。
ガウスを恒久的に除去するのではなく確率的実体としてモデル化するMaskGaussianを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:30:25 GMT)
DecoderTracker: Decoder-Only Method for Multiple-Object Tracking [10.8] 本稿では,新しいエンドツーエンドトラッキング手法であるDecoderTrackを開発する。
動的データから生じる最適化課題に対処するため,本稿ではDecoderTrack+を紹介した。
提案手法は,複数のベンチマークでMOTRを上回り,推定速度はMOTRの2.06倍と3.03倍である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:48:28 GMT)
NSegment : Label-specific Deformations for Remote Sensing Image Segmentation [10.6] リモートセンシング(RS)画像セグメンテーションデータセットのラベル付けエラーは、曖昧なクラス境界、混合ピクセル、影、複雑な地形の特徴、主観的アノテータバイアスのため、暗黙的かつ微妙なままであることが多い。
NSegmentは、この問題を軽減するために、シンプルだが効果的なデータ拡張ソリューションである。
従来の方法とは異なり、セグメンテーションラベルのみに弾性変換を適用し、各トレーニングエポックにおける各サンプル毎の強度を変化させて、アノテーションの不整合に対処する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:30:16 GMT)
Multi-modal Traffic Scenario Generation for Autonomous Driving System Testing [10.5] TrafficComposerは、自律運転システム(ADS)テストのためのマルチモーダル交通シナリオ構築アプローチである。
CARLAやLGSVLなどのシミュレータで対応するトラフィックシナリオを生成する。
120のトラフィックシナリオのベンチマークでは、TrafficComposerは97.0%の精度を達成し、最高のパフォーマンスのベースラインを7.3%上回っている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:53:15 GMT)
Note on Follow-the-Perturbed-Leader in Combinatorial Semi-Bandit Problems [10.4] 小型不変半帯域問題におけるFollow-the-Perturbed-Leader(FTPL)ポリシーの最適性と複雑性について検討する。
我々は条件付き幾何再サンプリング(CGR)をサイズ不変半帯域設定に拡張し、計算の複雑さをオリジナルのGRの$O(d2)$から$Oleft(mdleft(log(d/m)+1right)$に縮める。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:06:30 GMT)
Advanced Gesture Recognition in Autism: Integrating YOLOv7, Video Augmentation and VideoMAE for Video Analysis [10.3] 本研究は, 子どもが日常活動を行う際に, 自然環境下で撮影した映像を分析し, 自閉症を示唆する反復行動を特定することを目的とする。
焦点は、回転、ヘッドバンピング、腕の羽ばたきといったリアルタイムの反復的なジェスチャーを正確に分類することである。
提案手法の重要な構成要素は、ビデオデータの空間的・時間的分析を改善するモデルである textbfVideoMAE の利用である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:46:14 GMT)
Restoring Gaussian Blurred Face Images for Deanonymization Attacks [10.1] 我々は、ぼやけた顔を復元するRevelioと呼ばれるデブロアリング手法を開発した。
再同定精度は95.9%で、既存のソリューションより優れている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:41:05 GMT)
ID-Booth: Identity-consistent Face Generation with Diffusion Models [10.0] 我々はID-Boothと呼ばれる新しい生成拡散に基づくフレームワークを提案する。
このフレームワークは、事前訓練された拡散モデルの合成能力を保ちながら、アイデンティティ一貫性のある画像生成を可能にする。
本手法は、画像の多様性を向上しつつ、競合する手法よりもアイデンティティ間の一貫性とアイデンティティ間の分離性を向上する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:29:46 GMT)
Activation-Informed Merging of Large Language Models [10.0] 本稿では,大規模言語モデルのアクティベーション空間から情報を統合する手法である Activation-Informed Merging (AIM) について述べる。
我々は、AIMが複数のベンチマークでマージされたモデルの性能を大幅に向上させることを実証的に実証した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:35:36 GMT)
ClusterKV: Manipulating LLM KV Cache in Semantic Space for Recallable Compression [10.0] ロングコンテキストは推論効率に重大な課題をもたらす。
本稿では,意味クラスタの粒度でトークンをリコールするClusterKVを紹介する。
実験結果から、ClusterKVは32kのコンテキスト長を持つ様々なタスクにおいて、無視可能な精度の損失が得られることがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:17:33 GMT)
Step-by-Step Reasoning Attack: Revealing 'Erased' Knowledge in Large Language Models [9.7] 未学習のテクニックは、その知識を表面下で抑制し、残すことで、正しいプロンプトで取り出すことができる。
我々は、段階的に推論に基づくブラックボックス攻撃であるSleekを導入し、非学習障害を体系的に暴露する。
生成した敵のプロンプトのうち62.5%がWHPの未発表のラマから忘れられたハリー・ポッターの事実を回収し、50%は不当な知識の抑制を暴露した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:22:17 GMT)
MTL-KD: Multi-Task Learning Via Knowledge Distillation for Generalizable Neural Vehicle Routing Solver [9.6] 本研究は知識蒸留(MTL-KD)による新しいマルチタスク学習手法を提案する。
提案手法は,複数の異なるRLベースの単一タスクモデルから単一重デコーダモデルへのポリシー知識の転送,ラベルなしトレーニング,多種多様なタスクにおけるモデルの一般化能力の向上を効果的に行う。
最大1000ノードのVRP変異体6種と10種のVRP変異体に対する実験結果から,提案手法が一様および実世界のベンチマークにおいて常に優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:50:30 GMT)
Dynamical non-Hermitian systems: Fingerprints and pure dephasing induced protection effect [9.6] 非エルミート量子ビット系における情報フローと絡み合いを定量化するトレース距離と収束のダイナミクスについて検討する。
純粋なデファスティングは、反パリティ時間対称性のない非エルミート系において、情報フローと絡み合いの固有緩和を遅くすることができる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:23:42 GMT)
Domain Generalization for Person Re-identification: A Survey Towards Domain-Agnostic Person Matching [9.4] 人物再識別(ReID)は、重複しないカメラビューで撮影された同一人物の画像を取得することを目的としている。
従来のReIDメソッドは、視点、背景、照明条件の変化によって引き起こされるドメインシフトによって、目に見えない領域に一般化できない。
近年,多様な環境における一般化を促進するための様々な手法が研究されている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:15:00 GMT)
How Developers Use AI Agents: When They Work, When They Don't, and Why [9.4] ソフトウェアエンジニアリングエージェント(SWEエージェント)は、SWE Benchのようなベンチマーク上で、自律的に開発タスクを実行することができる。
SWEエージェントは、しばしば開発者との対話を可能にし、協調的な問題解決を可能にするように設計されている。
私たちは、以前コントリビュートしたリポジトリの33のオープンイシューを解決するために、IDEエージェントを使用した19の開発者を観察しました。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:52:01 GMT)
Levels of Autonomy for AI Agents [9.3] エージェントの自律性のレベルは、その能力と運用環境とは別に、意図的な設計上の決定として扱うことができると論じる。
エージェントと対話する際の役割を特徴とし,エージェントの自律性を高める5つのレベルを定義した。
シングルエージェントおよびマルチエージェントシステムにおけるエージェントの動作を管理するために、AI自律性証明書に対する私たちのフレームワークの潜在的な応用を強調します。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:14:36 GMT)
Unsupervised Classification of English Words Based on Phonological Information: Discovery of Germanic and Latinate Clusters [9.2] 言語横断的に、母語と借用語は異なる音韻規則に従う。
英語の語彙におけるゲルマン語とラテン語の区別は、個々の単語の音韻情報から学べる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:12:40 GMT)
Improving Factuality for Dialogue Response Generation via Graph-Based Knowledge Augmentation [9.2] 大きな言語モデル(LLM)は、対話における応答生成を含む特定のタスクで問題を引き起こす可能性がある。
本稿では,対話応答生成の現実性を高めるための新しいフレームワークを提案する。
我々のフレームワークは、より正確で基礎的な対話応答を生成するために、知識トリプルレトリバー、対話書き直し、知識強化された応答生成を組み合わせる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:17:27 GMT)
Algorithms with Calibrated Machine Learning Predictions [9.2] 予測を伴うアルゴリズムの分野は、リアルタイムのパフォーマンスを改善するためのオンラインアルゴリズムの設計に機械学習のアドバイスを取り入れている。
既存のアプローチでは、ユーザが総合的な信頼レベルを指定する必要があることが多いが、現代の機械学習モデルは、予測レベルの不確実性を見積もることができる。
このギャップを埋めるための原則的かつ実践的なツールとしてキャリブレーションを提案し、2つのケーススタディを通じてキャリブレーションされたアドバイスの利点を実証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:49:49 GMT)
MTLM: Incorporating Bidirectional Text Information to Enhance Language Model Training in Speech Recognition Systems [9.0] MTLMは、3つのトレーニング目標を通じて一方向と双方向の方法を統一する新しいトレーニングパラダイムである。
浅い融合、一方向/双方向のn-best再構成など、複数の復号化戦略をサポートしている。
LibriSpeechデータセットの実験は、MTLMが複数のデコード戦略で一方向トレーニングを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:43:36 GMT)
Graph of Verification: Structured Verification of LLM Reasoning with Directed Acyclic Graphs [8.8] LLMを検証するためのグラフ・オブ・バリデーション(GoV)フレームワークを提案する。
GoVは、下層の導出過程を有向非巡回グラフ(DAG)として明示的にモデル化する。
DAGのトポロジカルな順序を強制し、段階的に検証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:46:03 GMT)
Exploiting Task Relationships for Continual Learning Using Transferability-Aware Task Embeddings [8.8] 連続学習(CL)は、現代のディープニューラルネットワークアプリケーションにおいて重要なトピックである。
本稿では、H埋め込みと呼ばれるトランスファービリティを考慮したタスク埋め込みを提案し、そのガイダンスに基づいてハイパーネットフレームワークを構築する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:40:38 GMT)
MM-R5: MultiModal Reasoning-Enhanced ReRanker via Reinforcement Learning for Document Retrieval [8.7] 文書検索のための強化学習によるマルチモーダル推論強化ReRankerMM-R5を提案する。
MM-R5は教師付き微調整(SFT)と強化学習(RL)の2段階で訓練される
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:55:00 GMT)
Automating Financial Statement Audits with Large Language Models [8.6] ファイナンシャルステートメント監査を自動化するために,大規模言語モデル(LLM)を活用している。
本研究は、実世界の財務表と合成トランザクションデータを組み合わせた、キュレートされたデータセットを用いたベンチマークを提案する。
我々のテストでは、現在最先端のLLMが、過去のトランザクションデータを与えられたときの財務諸表の誤りを識別することに成功した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:07:06 GMT)
Information Suppression in Large Language Models: Auditing, Quantifying, and Characterizing Censorship in DeepSeek [8.5] 本研究では中国で開発されたオープンソースの大規模言語モデル(LLM)であるDeepSeekにおける情報抑制機構について検討する。
我々は、監査フレームワークを提案し、それを646の政治的に敏感なプロンプトに対するモデルの応答を分析するために利用する。
調査では,DeepSeekにおける意味レベルの情報抑圧の証拠を明らかにした。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:01:50 GMT)
Extending Memorization Dynamics in Pythia Models from Instance-Level Insights [8.5] 本稿では, Pythia モデルファミリーの様々なスケールおよびトレーニングステップにおける記憶の詳細な解析について述べる。
粒度の計測値を用いて、モデルアーキテクチャ、データ特性、摂動が記憶パターンにどのように影響するかを検討する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:02:42 GMT)
Trust-MARL: Trust-Based Multi-Agent Reinforcement Learning Framework for Cooperative On-Ramp Merging Control in Heterogeneous Traffic Flow [8.5] 本研究では,信頼に基づくマルチエージェント強化学習(Trust-MARL)フレームワークを提案する。
Trust-MARLは、エージェント間信頼を利用して、ボトルネックスループットを改善し、トラフィック衝撃波を軽減することで、グローバルなトラフィック効率を向上させる。
広範囲にわたるアブレーション研究と比較実験は、提案したTrust-MARLアプローチの有効性を検証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:35:10 GMT)
CLImage: Human-Annotated Datasets for Complementary-Label Learning [8.3] 補完ラベル学習(Complementary-label Learning, CLL)は、補完ラベルのみを用いて多クラス分類器を訓練することを目的とした、弱い教師付き学習パラダイムである。
多くのアルゴリズムによるCLLの提案にもかかわらず、その実用性は2つの理由により検証されていない。
CLLアルゴリズムの実際の性能に関する知見を得るため,人間のアノテータから補完ラベルを収集するプロトコルを開発した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:47:45 GMT)
A Transfer Learning Framework for Multilayer Networks via Model Averaging [8.3] 多層ネットワークにおけるリンク予測は、レコメンデーションシステムやタンパク質-タンパク質相互作用予測といったアプリケーションにおいて重要な課題である。
バイレベルモデル平均化手法を用いた多層ネットワークのための新しいトランスファー学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:32:31 GMT)
Agentic Surgical AI: Surgeon Style Fingerprinting and Privacy Risk Quantification via Discrete Diffusion in a Vision-Language-Action Framework [8.0] 本稿では,ロボット手術における外科医固有の行動予測のためのエージェントモデリング手法を提案する。
Gジェスチャ予測は、手術ビデオ、意図言語、パーソナライズされた外科医のアイデンティティとスキルの埋め込みを含むマルチモーダル入力に条件付けされた構造化シーケンス認知タスクとしてフレーム化される。
本手法をJIGSAWSデータセット上で評価し,各外科医固有の意味ある動作指紋を学習しながら,ジェスチャーシーケンスを正確に再構築できることを実証した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:02:06 GMT)
LLMs and Childhood Safety: Identifying Risks and Proposing a Protection Framework for Safe Child-LLM Interaction [8.0] 本研究では,子育て型アプリケーションにおけるLarge Language Models (LLMs) の利用拡大について検討する。
これは、バイアス、有害なコンテンツ、文化的過敏といった安全性と倫理上の懸念を強調している。
本稿では,コンテンツ安全性,行動倫理,文化的感受性の指標を取り入れた安全・LLMインタラクションのための保護フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:43:35 GMT)
TimeInf: Time Series Data Contribution via Influence Functions [8.0] TimeInfは時系列データセットのモデルに依存しないデータコントリビューション推定手法である。
影響スコアを活用することで、TimeInfは、時間点間の時間構造を保ちながら、個々の時間点にモデル予測を属性付ける。
実験の結果,TimeInfは時系列異常を効果的に検出し,既存のデータ属性技術より優れていることがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:36:42 GMT)
SPIRE: Conditional Personalization for Federated Diffusion Generative Models [7.9] Shared Backbone Personal Identity Representation Embeddings (SPIRE)は、FLで条件付き生成としてクライアント拡散ベースの生成をキャストするフレームワークである。
SPIREは、ネットワークを(i)人口レベルのスコア関数を学習する高容量なグローバルバックボーンと、(ii)ローカルデータ統計を符号化する軽量で学習可能なクライアント埋め込みに分解する。
我々の分析は、クライアントの埋め込みが共有スコアネットワークをパーソナライズするバイアスとしてどのように振舞うかを示唆している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:40:31 GMT)
Speeding up Speculative Decoding via Sequential Approximate Verification [7.8] 投機的復号法 (SD) はLarge Language Models (LLM) を用いた高速推論手法である。
本稿では,SPRINTERを提案する。SPRINTERは,LLMから生成されたトークンが目標のLLMに受け入れられるかどうかを予測するために訓練された,低複雑さの検証器である。
逐次近似検証を行うことで、SPRINTERは目標のLSMによる検証を必要とせず、トークンが受け入れられないと判断された場合にのみ呼び出される。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:09:12 GMT)
Automated Heuristic Design for Unit Commitment Using Large Language Models [7.3] ユニットコミット(UC)問題は、電力システムの最適スケジューリングにおける古典的な課題である。
本稿では,大規模言語モデルに基づく関数空間探索(FunSearch)手法を提案する。
結果から,FunSearchはサンプリング時間,評価時間,システム全体の運用コストの面で,優れた性能を示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:16:53 GMT)
Quantum Register Machine: Efficient Implementation of Quantum Recursive Programs [7.0] 本稿では、量子制御フローに対する命令レベルサポートを提供する最初の量子アーキテクチャ(命令セットを含む)である量子レジスタマシンの概念を提案する。
本稿では,量子レジスタマシンをベースとして,量子再帰プログラムの包括的な実装プロセスについて述べる。
量子アルゴリズムの効率的な実装は、量子アルゴリズムの自動並列化も提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:21:49 GMT)
Perspective on Utilizing Foundation Models for Laboratory Automation in Materials Research [6.8] 本総説では, 材料・化学分野における実験室の自動化を推し進める基礎モデルの可能性について考察する。
実験計画とデータ分析のための認知機能と、ハードウェア操作のための物理的機能である。
近年の進歩は、大規模言語モデル(LLM)とマルチモーダルロボットシステムを用いて、複雑でダイナミックな実験室タスクを処理できることを実証している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:22:28 GMT)
Detection, Classification, and Mitigation of Gender Bias in Large Language Models [6.8] 性別バイアスの検出,分類,緩和において,大規模言語モデル(LLM)の能力を高める方法について検討する。
我々は、強化学習、思考の連鎖推論を採用し、異なるサブタスクを扱うための微調整を監督する。
NLPCC 2025Shared Task 7の3つのサブタスクのうち、第1位にランクインした。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:53:25 GMT)
Between Predictability and Randomness: Seeking Artistic Inspiration from AI Generative Models [6.7] 本稿では,創造性の刺激としてAIが生成した詩行を用いる方法について検討する。
LSTM-VAE線は,共振画像と生産的不確定性の組み合わせにより,その誘発的影響を実証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:34:26 GMT)
Toward End-to-End Bearing Fault Diagnosis for Industrial Scenarios with Spiking Neural Networks [6.7] マルチスケールResidual Attention SNNは、SNN手法の効率、性能、堅牢性を改善する。
MRA-SNNは、精度、エネルギー消費、ノイズロバスト性の観点から、既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:22:47 GMT)
Similarity as Reward Alignment: Robust and Versatile Preference-based Reinforcement Learning [6.6] Reward Alignment(SARA)との類似性は、ノイズの多いラベルに耐性を持ち、多様なフィードバックフォーマットやトレーニングパラダイムに適応可能な、単純なコントラストのフレームワークである。
SARAは好みのサンプルの潜伏表現を学び、学習した潜伏者との類似性として報酬を計算する。
連続制御オフラインRLベンチマークのベースラインと比較して高い性能を示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:01:59 GMT)
TagRouter: Learning Route to LLMs through Tags for Open-Domain Text Generation Tasks [6.6] モデルルーティングは、クエリを適切なモデルに割り当て、コストを削減しながらシステムパフォーマンスを改善する。
多言語多言語モデル(LLM)間の相乗効果を最適化する訓練不要なモデルルーティング手法であるTagを提案する。
実験の結果、Tagは13の基準法を上回り、システムの受け入れ率を6.15%向上し、コストを17.20%削減し、最適なコスト効率を実現した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:17:47 GMT)
Generalizable Trajectory Prediction via Inverse Reinforcement Learning with Mamba-Graph Architecture [6.6] 本稿では,人間的な意思決定を捉える新しい逆強化学習フレームワークを提案する。
学習した報酬関数を用いてエンコーダ・デコーダアーキテクチャによる出力の可能性を最大化する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:18:19 GMT)
SheetMind: An End-to-End LLM-Powered Multi-Agent Framework for Spreadsheet Automation [6.4] SheetMindは、自然言語によるスプレッドシート自動化のためのフレームワークである。
スクリプティングや公式知識を必要とせずにリアルタイムインタラクションをサポートする。
本結果は,マルチエージェント分解と文法に基づく実行の有効性を強調した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:22:15 GMT)
Brain-Inspired Stepwise Patch Merging for Vision Transformers [6.1] 本稿では、その後の注意機構をよりよく見る能力を高めるステップワイド・パッチ・マージ(SPM)を提案する。
コードはhttps://github.com/Yonghao-Yu/StepwisePatchMerging.comでリリースされた。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:11:04 GMT)
Automatic Expert Discovery in LLM Upcycling via Sparse Interpolated Mixture-of-Experts [6.1] SIMoEは、高密度トレーニング済みのLarge Language Model(LLM)をMoEスタイルのモデルに微調整するために設計されたエンドツーエンドのアルゴリズムである。
命令チューニング中、SIMoEは指定された空間制約の下で複数の専門専門家を自動的に識別する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:34:38 GMT)
Interpretable Multimodal Learning for Tumor Protein-Metal Binding: Progress, Challenges, and Perspectives [6.0] 本稿では,腫瘍タンパク質-金属結合の予測に機械学習を用いる際の進歩と課題について要約する。
主な課題は、高品質で腫瘍特異的なデータセットの不足、複数のデータモダリティの考慮不足、結果の解釈の複雑さである。
本稿では,腫瘍タンパク質データ不足と腫瘍タンパク質-金属結合の予測モデル数に対処する手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:13:18 GMT)
Comparative Analysis of Deep Learning Strategies for Hypertensive Retinopathy Detection from Fundus Images: From Scratch and Pre-trained Models [5.9] 本稿では,眼底画像から高血圧性網膜症を検出するためのディープラーニング手法の比較分析を行った。
我々は、カスタムCNN、トレーニング済みトランスフォーマーベースモデルのスイート、AutoMLソリューションの3つの異なるアプローチについて検討する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:11:33 GMT)
Fairness Research For Machine Learning Should Integrate Societal Considerations [5.6] 適切に定義された公正度尺度の重要性はいまだ過小評価されている。
理由としては、MLシステムが広く展開されているため、識別が重要であることが挙げられる。
人間とAIのフィードバックループは、小さな社会的バイアスと政治的バイアスだけが持続してもバイアスを増幅する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:54:45 GMT)
Towards Building General Purpose Embedding Models for Industry 4.0 Agents [5.2] 私たちは、エンジニアの意思決定をガイドし、アセットダウンタイムを最小限に抑えるために、アセットメンテナンスに対する言語モデルの理解を改善することに重点を置いています。
産業4.0ドメインの自然言語で表されるタスクの集合が、それぞれ特定の資産に関連するクエリに関連するものであることを前提として、関連する項目を推奨し、類似資産のクエリを一般化したい。
当社のアプローチは,9つのアセット固有のタスクデータセットを構築するために,定性的な専門家による知識ベースを収集することから始まります。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:02:07 GMT)
FSSUWNet: Mitigating the Fragility of Pre-trained Models with Feature Enhancement for Few-Shot Semantic Segmentation in Underwater Images [5.0] Few-Shot Semantic (FSS)は、最近データスカースドメインで進歩している。
既存のFSS法は水中環境への一般化に苦慮することが多い。
機能強化を伴う水中画像のためのFSSフレームワークFSSUWNetを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:48:18 GMT)
DejaVid: Encoder-Agnostic Learned Temporal Matching for Video Classification [5.0] DejaVidは、アーキテクチャの再トレーニングや変更を必要とせずに、モデルパフォーマンスを向上させるエンコーダに依存しない方法である。
この学習タスクのために,従来の時系列アライメントアルゴリズムにインスパイアされた新しいニューラルネットワークアーキテクチャを導入する。
評価の結果,DejaVidは最先端の大規模エンコーダの性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:39:03 GMT)
LIFELONG SOTOPIA: Evaluating Social Intelligence of Language Agents Over Lifelong Social Interactions [4.8] 本稿では,言語エージェントの総合評価を行うための新しいベンチマークLIFELONG-SOTOPIAを提案する。
私たちがテストするすべての言語モデルの目標達成と信頼性が、インタラクション全体を通じて低下していることに気付きました。
以上の結果から,生涯にわたる社会的相互作用による言語エージェントの社会的知性評価にはLIFELONG-SOTOPIAが有効であることが示唆された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:57:54 GMT)
Understanding the Effect of Knowledge Graph Extraction Error on Downstream Graph Analyses: A Case Study on Affiliation Graphs [4.8] 知識グラフ(KG)は、社会構造、コミュニティダイナミクス、制度的メンバーシップ、その他の複雑な関係を分析するのに有用である。
大規模言語モデル(LLM)の最近の進歩は、大規模テキストコーパスから自動KG抽出のスケーラビリティとアクセシビリティを改善している。
下流分析における抽出誤差の影響はよく理解されていないが、特に実世界の洞察のために正確なKGに依存している応用科学者にとってはよく理解されていない。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:14:06 GMT)
The Budget AI Researcher and the Power of RAG Chains [4.8] 研究アイデア生成への現在のアプローチは、しばしばジェネリック・大型言語モデル(LLM)に依存している。
私たちのフレームワークであるThe Budget AI Researcherは、検索強化ジェネレーションチェーン、ベクトルデータベース、トピック誘導ペアリングを使用して、数百の機械学習論文の概念を再結合します。
このシステムは、機械学習の広大なサブフィールドにまたがる9つの主要なAIカンファレンスから論文を取り込み、それらを階層的なトピックツリーに整理する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:40:35 GMT)
MALM: A Multi-Information Adapter for Large Language Models to Mitigate Hallucination [4.7] 大型言語モデル(LLM)は、入力競合、コンテキスト競合、ファクト競合の3種類の幻覚の傾向にある。
大規模言語モデル(MALM)のための多言語適応器を提案する。
このフレームワークは、元の入力、文脈情報、および外部の事実知識の間の相互関係を明らかにするために設計された、調整されたマルチグラフ学習アプローチを採用している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:47:32 GMT)
Noninvasive precision modulation of high-level neural population activity via natural vision perturbations [4.6] 本研究では,高位霊長類腹側視覚路における神経活動の精密かつ非侵襲的調節の可能性について検討した。
予測モデルと生物学的に実現された効果との間に定量的な一致が認められた。
これらの結果は、現在の腹腔ストリームのマシン実行可能なモデルが、非侵襲的で視覚的に提供され、おそらく受容不能な神経介入を設計できることを強調している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:47:11 GMT)
Towards End-to-End Neuromorphic Voxel-based 3D Object Reconstruction Without Physical Priors [4.5] ニューロモルフィックカメラを用いた高密度ボクセル3次元再構成のためのエンドツーエンド手法を提案する。
本手法は, ベースライン法に比べて54.6%の再現精度向上を実現している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:36:21 GMT)
Towards Physics-informed Diffusion for Anomaly Detection in Trajectories [4.4] 我々は,GPSスプーフィングの可能性を示す異常な軌跡(偽の軌跡など)を見つけることを目指している。
この問題は、違法な漁業や違法な石油輸送などの国際水域での違法な活動を抑制するために社会的に重要である。
近年,データ間隔に拘わらず生成モデルを用いた異常軌道検出の有望な結果が示されている。
物理法則に従わない軌道を同定するために運動論的制約を統合する物理インフォームド拡散モデルを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:09:16 GMT)
How Does A Text Preprocessing Pipeline Affect Ontology Syntactic Matching? [4.2] 第1相のテキスト前処理は第2相のテキスト前処理よりも効果的であることがわかった。
本稿では,第2相テキスト前処理による不要な偽マッピングを修復する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:57:14 GMT)
A Pluggable Multi-Task Learning Framework for Sentiment-Aware Financial Relation Extraction [4.2] 本稿では,金融 RE の強化を目的としたマルチタスク学習手法である Sentiment-Aware-SDP-Enhanced-Module (SSDP-SEM) を提案する。
具体的には、SSDP-SEMはREモデルとプラグ可能な補助的な感情知覚タスクを統合し、REモデルがテキストの感情と共に注意重みを同時にナビゲートすることを可能にする。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:12:34 GMT)
Analysis of quantum neural network performance via edge cases [4.2] グラフ分類タスクにおいて,異なる量子機械学習ネットワークの性能を評価する。
内部対称性の異なる量子回路は、グラフの対称性に完全に、部分的には参照せず、データセット上で異なる性能を示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:56:01 GMT)
Wasserstein Barycenter Soft Actor-Critic [4.1] 本稿では、時間差学習のための悲観的アクターと探索を促進する楽観的アクターの恩恵を受けるWBSACアルゴリズムを提案する。
We show that WBSAC is more sample- efficient on MuJoCo continuous control task。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:29:34 GMT)
Optimal Transport-Guided Safety in Temporal Difference Reinforcement Learning [4.1] 本稿では,環境条件下での安全性を,より予測可能な結果を伴う行動とみなす。
この不確実性スコアを意思決定目的に統合することにより、エージェントはより予測可能な結果のアクションを推奨する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:48:51 GMT)
Fourier-Invertible Neural Encoder (FINE) for Homogeneous Flows [4.1] 可逆ニューラルネットワークは、そのコンパクト性、解釈可能性、および情報保存特性に注目されている。
本稿では,可逆な単調活性化関数と可逆なフィルタ構造を組み合わせたフーリエ可逆ニューラルネットワーク(FINE)を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 06:53:29 GMT)
Semivalue-based data valuation is arbitrary and gameable [4.1] ゲーム理論によるセミバリューの概念は、マシンラーニングにおける信用属性とデータアセスメントの一般的なフレームワークを提供する、と我々は主張する。
ユーティリティ関数の小さいが妥当な変更は、データポイント間でのバリュエーションの大幅なシフトを引き起こす可能性がある。
この曖昧さを活かし、データポイント間で体系的に価値を再分配するために、低コストの敵戦略が存在する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:20:15 GMT)
Oversmoothing, Oversquashing, Heterophily, Long-Range, and more: Demystifying Common Beliefs in Graph Machine Learning [4.0] 我々は,過密・過密,ホモフィリー・ヘテロフィリー二分法,長期的課題に焦点をあてる。
このことが研究課題の曖昧さを招き、研究者が正確な研究課題に焦点を合わせるのを妨げていると我々は主張する。
私たちのコントリビューションは、このような共通の信念を明確にし、これらのトピックに関して批判的な思考を奨励したいと思っています。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:29:48 GMT)
Multimode Bosonic State Tomography with Single-Shot Joint Parity Measurement of a Trapped Ion [3.9] 捕捉されたイオンのフォノン状態のジョイントパリティの直接単発測定を用いて、連続可変量子状態の再構成を行う新しいスキームを実証する。
単発継手パリティ測定はパリティフリップ誤りをリアルタイムで検出できることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:05:06 GMT)
Lightweight Sequential Transformers for Blood Glucose Level Prediction in Type-1 Diabetes [3.8] 1型糖尿病(T1D)は世界中の数百万人に影響を与え、重度の低血糖や高血糖症を予防するために継続的なモニタリングを必要とする。
本稿では,T1Dにおける血糖予測のための新しい軽量シーケンストランスモデルを提案する。
2つのベンチマークデータセットであるOttoT1DMとDiaTrendの実験では、提案されたモデルは、グルコース濃度の予測と有害事象の検出において最先端の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:43:35 GMT)
Optimizing Federated Learning using Remote Embeddings for Graph Neural Networks [3.8] グラフニューラルネットワーク(GNN)は,グラフデータ構造から意味のある表現を学習する能力によって,近年急速に進歩している。
Federated Learning(FL)は、分散データ上で共有モデルをトレーニングするための、実行可能な機械学習アプローチとして登場した。
遠隔プルーニングを用いたGNNトレーニングフレームワークであるOPESを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:52:24 GMT)
Topology-Aware 3D Gaussian Splatting: Leveraging Persistent Homology for Optimized Structural Integrity [3.8] 本研究はトポロジーを意識した3次元ガウス散乱(トポロジー-GS)を紹介する。
トポロジー-GSは、不完全な初期幾何学的カバレッジのためにピクセルレベルの構造的整合性を損なう。
3つの新しいビューベンチマーク実験により、PSNR、SSIM、LPIPSの指標で、Topology-GSが既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:10:30 GMT)
Hierarchical Deep Feature Fusion and Ensemble Learning for Enhanced Brain Tumor MRI Classification [3.8] 脳磁気共鳴画像(MRI)の包括的前処理とデータ拡張を組み込んだフレームワーク
新規性は二重レベルのアンサンブル戦略(特徴レベルのアンサンブル、分類器レベルのアンサンブル)にある。
2つのパブリックなKaggle MRI脳腫瘍データセットの実験は、このアプローチが最先端の手法を大幅に超えることを示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:53:54 GMT)
Investigating the Effects of Cognitive Biases in Prompts on Large Language Model Outputs [3.7] 本稿では,認知バイアスがLarge Language Models(LLM)出力に及ぼす影響について検討する。
確認や可用性バイアスなどの認知バイアスは、プロンプトを通じてユーザーの入力を歪ませる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:18:34 GMT)
Fixed Point Explainability [3.7] 本稿では「なぜ回帰」原理に着想を得た固定点説明の形式的概念を紹介する。
固定点説明は極小性、安定性、忠実さなどの特性を満たすことを示し、隠れたモデル行動と説明的弱点を明らかにする。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:59:13 GMT)
Revisiting Clustering of Neural Bandits: Selective Reinitialization for Mitigating Loss of Plasticity [3.4] Selective Reinitialization (SeRe)は、進化する環境におけるCNBアルゴリズムの適応性を動的に保存する新しいバンディット学習フレームワークである。
我々は,SeReが断片的な定常環境におけるサブ線形累積後悔を可能にすることを証明した。
6つの実世界のレコメンデーションデータセットの実験では、SeReで強化されたCNBアルゴリズムが、後悔の少ないプラスチックの損失を効果的に軽減できることを示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:58:27 GMT)
Regulating Next-Generation Implantable Brain-Computer Interfaces: Recommendations for Ethical Development and Implementation [3.4] 我々は,BCIの設計において開発者を支援するための9つの勧告と,BCIの適用において政策立案者を支援するための9つの勧告を行う。
目標は、新しいBCIの設計と応用を支援し、医療実践への安全で倫理的な統合を保証することである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:29:41 GMT)
Demographics-Informed Neural Network for Multi-Modal Spatiotemporal forecasting of Urban Growth and Travel Patterns Using Satellite Imagery [3.4] 本研究は,都市空間の変容を予測するために設計された,新しい階層情報深層学習フレームワークを提案する。
提案モデルは,衛星画像と人口統計データを統合した,時間的にゲートされた残差接続を備えたエンコーダ・デコーダアーキテクチャを用いている。
この研究は、衛星画像シーケンスと、それに対応する人口動態と旅行行動特性を組み合わせた総合的なマルチモーダルデータセットにも貢献する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:33:40 GMT)
FAMSeg: Fetal Femur and Cranial Ultrasound Segmentation Using Feature-Aware Attention and Mamba Enhancement [3.3] 本稿では, 特徴知覚とマンバ強調に基づく胎児大腿骨・頭蓋骨超音波画像分割モデルを提案する。
FAMSegネットワークは、様々なサイズと向きのイメージに対して、最も高速な損失低減と最高のセグメンテーション性能を達成した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:40:44 GMT)
Enabling Precise Topic Alignment in Large Language Models Via Sparse Autoencoders [3.2] 大規模言語モデル層に適用されるスパースオートエンコーダ(SAE)は、解釈可能な概念に対応するニューロンを持つ。
提案手法は,SAEの観測および修正特性を利用して,任意のトピックのアライメントを可能にする。
このアプローチのアライメント能力は、Amazonのレビュー、メディカル、Sycophancyなど、さまざまなパブリックトピックデータセットに基づいて評価する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:11:48 GMT)
A Comprehensive Survey of Deep Research: Systems, Methodologies, and Applications [3.0] 2023年以降に登場した80以上の商用および非商用実装を分析します。
本稿では,4つの基本的技術的側面に基づいてシステムを分類する新しい階層型分類法を提案する。
私たちの分析は、現在の実装の重要な機能と、それらがもたらす技術的、倫理的課題の両方を明らかにします。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:19:05 GMT)
Behavioral Generative Agents for Energy Operations [2.9] 本稿では,動的エネルギー運用における顧客の意思決定を現実的にシミュレートする,大規模言語モデルを利用した生成エージェントを活用した新しい手法を提案する。
これらのエージェントは、より単純な市場シナリオにおいてより最適かつ合理的に振る舞う一方で、タスクの複雑さが増大するにつれて、そのパフォーマンスがより変動し、より最適になることを示す。
本研究は,エネルギー政策とインセンティブプログラムの設計と効果を改善するため,生成剤をエネルギー管理シミュレーションに統合する可能性を強調した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:51:45 GMT)
Mapping Neural Signals to Agent Performance, A Step Towards Reinforcement Learning from Neural Feedback [2.9] NEURO-LOOPは、人間とエージェントの相互作用を促進するために、本質的な人間報酬システムを利用する暗黙のフィードバックフレームワークである。
この研究は、NEURO-LOOPフレームワークにおける重要な第一歩である脳信号をエージェントのパフォーマンスにマッピングする可能性を示している。
従来の機械学習手法を用いて,fNIRSデータとエージェント性能の関係を検証した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:38:31 GMT)
SALT: A Lightweight Model Adaptation Method for Closed Split Computing Environments [2.8] SALTは、閉じた制約下でのSplit Computingのための軽量なモデル適応フレームワークである。
クライアント側でコンパクトでトレーニング可能なアダプタを導入し、ヘッドネットワークから潜在機能を洗練します。
微調整法に比べてトレーニング遅延が小さく,精度が向上した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:41:57 GMT)
Are We Really Measuring Progress? Transferring Insights from Evaluating Recommender Systems to Temporal Link Prediction [2.6] 最近の研究は、タスク設計、方法論の厳密さ、データ適合性に関する懸念を引用して、グラフ学習ベンチマークの信頼性を疑問視している。
この拡張要約では、時間リンク予測(TLP)の評価戦略に焦点を当て、この議論に貢献する。
現状の評価プロトコルは,(1)無矛盾なサンプリング基準,(2)頑健性を改善する手段としてしばしば導入されるハードネガティブサンプリングへの依存,(3)予測を組み合わせることで,ソースノード間の等質なベース確率を暗黙的に仮定する指標などによって影響を受けることが多い。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:53:10 GMT)
Inference-Time Gaze Refinement for Micro-Expression Recognition: Enhancing Event-Based Eye Tracking with Motion-Aware Post-Processing [2.5] イベントベースの視線追跡は、きめ細かい認知状態の推測に重要な可能性を秘めている。
本稿では、既存の事象に基づく視線推定モデルの出力を高めるために、モデルに依存しない推論時間改善フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:48:11 GMT)
Discovering New Shadow Patterns for Black-Box Attacks on Lane Detection of Autonomous Vehicles [2.4] 本稿では,自律走行車線検出システムに対する新たな物理世界攻撃を提案する。
私たちの方法は、完全に受動的で、パワーフリーで、人間の観察者にとって目立たないものです。
ユーザー調査では、攻撃のステルス性が確認され、83.6%の参加者が運転中に検出できなかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:08:28 GMT)
Multi-RAG: A Multimodal Retrieval-Augmented Generation System for Adaptive Video Understanding [2.3] Multi-RAGは、情報集約的な状況下で人間に適応的な支援を提供するために設計された検索拡張生成システムである。
本システムは,マルチソース情報ストリームの統合と推論により,状況理解の改善と認知負荷の低減を目的としている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:12:01 GMT)
ShED-HD: A Shannon Entropy Distribution Framework for Lightweight Hallucination Detection on Edge Devices [2.2] 大規模言語モデル(Ms.LS)は、幅広いタスクにおいて印象的な能力を示してきたが、幻覚を生み出す傾向にある。
本稿では,特徴的不確実性パターンを効率的に検出する新しい幻覚検出フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:57:53 GMT)
Robust Flower Cluster Matching Using The Unscented Transform [2.1] 本稿では,RGB-Dデータから生成された記述子を用いて,花クラスタをマッチングする手法を提案する。
提案手法はUnscented Transformを利用してプラント記述の不確かさ耐性を効率的に推定する。
モンテカルロシミュレーションは、アンセント変換の結果を検証するために用いられる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:05:03 GMT)
A Framework for Generating Conversational Recommendation Datasets from Behavioral Interactions [2.1] ConvRecStudioは、リアルタイムなマルチターンダイアログをシミュレートするフレームワークで、タイムスタンプによるユーザとイテムのインタラクションとレビューに基礎を置いている。
我々は、MobileRec、Yelp、Amazon Electronicsの3つのドメインにConvRecStudioを適用する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:58:48 GMT)
GNSS Spoofing Detection Based on Opportunistic Position Information [2.0] 位置に基づく攻撃検出スキーム(PADS)は、位置の回帰分析と不確実性分析を利用する確率的フレームワークである。
PADSは偽陽性率の3倍の正の値を得る。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:27:06 GMT)
Nonreciprocal quantum coherence in cavity magnomechanics via the Barnett effect [2.0] キャビティ・マグノメカニカル(CMM)シーテムにおける量子コヒーレンスアンスの非相互性について理論的に検討する。
入力電力,マグノメカニカルおよびマグノンフォトン結合速度,キャビティフォトンモードとマグノンモードの両方の減衰速度が量子コヒーレンスにどのように影響するかを検討する。
この結果から,方向依存型量子コヒーレンスを制御可能な機構として,非相互量子デバイスや情報処理に応用できる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:54:25 GMT)
When Forgetting Triggers Backdoors: A Clean Unlearning Attack [1.8] 本稿では,モデル学習フェーズとその後の未学習要求の両方を利用する,新しいエムクリーンバックドア攻撃を提案する。
この戦略は、検出や緩和が難しい強力でステルス的な新しい攻撃をもたらす。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:31:51 GMT)
Social Media Reactions to Open Source Promotions: AI-Powered GitHub Projects on Hacker News [1.7] 我々は、宣伝中のGitHub AIプロジェクトにおけるHacker Newsと開発者活動の関係について調査する。
AI開発者の少なくとも19%は、GitHubプロジェクトをHacker Newsで宣伝し、コミュニティから肯定的な関与をしばしば受けた。
これらの結果は、Hacker NewsがAIを使ったOSSプロジェクトの実行可能なプラットフォームとして機能していることを示唆している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:03:52 GMT)
Three-dimensional Deep Shape Optimization with a Limited Dataset [1.7] 生成モデルは、新しい形状を作り出す能力にかなりの注目を集めている。
メカニカルデザインにおけるそれらの応用は、利用可能なデータセットのサイズとバリエーションが制限されているため、依然として制限されている。
本研究では,限られたデータセットを用いた形状最適化に特化して,ディープラーニングに基づく最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:26:28 GMT)
The SWE-Bench Illusion: When State-of-the-Art LLMs Remember Instead of Reason [1.6] 本稿では,問題記述のみからのファイルパス識別という診断タスクを導入し,モデルの基礎となる知識を探索する。
現状のモデルでは,リポジトリ構造にアクセスすることなく,問題記述のみを用いて,バグのあるファイルパスを識別する精度を最大76%向上することを示す。
このパフォーマンスは、SWE-Benchに含まれていないリポジトリのタスクで最大53%向上し、データ汚染やメモリ化の可能性を示している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:25:26 GMT)
Language Models Enable Data-Augmented Synthesis Planning for Inorganic Materials [1.6] GPT-4.1、Gemini 2.0 Flash、Llama 4 Maverickなどの市販モデルでは、トップ1前の予測精度は最大53.8%に達する。
言語モデルを用いて28,548個の合成反応のレシピを生成し,文献的な例と組み合わせてトランスフォーマーベースのモデルであるSyntMTEを事前訓練する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:55:05 GMT)
Boosting Resource-Constrained Federated Learning Systems with Guessed Updates [1.6] GELは制約のあるエッジデバイスに対して,勾配ベースのステップ上での推測更新を通じて,さらなる学習を可能にする。
GELは、資源制約ネットワークにおいて、経験的収束を最大40%向上させることができる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:27:57 GMT)
Transparency in Healthcare AI: Testing European Regulatory Provisions against Users' Transparency Needs [1.6] 欧州連合(EU)では、医療はAIのリスクの高いアプリケーション分野である。
IFU(Instructions for Use)は、ユーザに対して明確かつ関連性を持たなければならない。
本研究は, 後者の要件がIFU構造によって満たされるかどうかを検証した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:47:01 GMT)
BSA: Ball Sparse Attention for Large-scale Geometries [1.5] 自己注意は入力サイズと2次的にスケールし、大規模物理システムでの使用を制限する。
本稿では, ネイティブスパース注意(NSA)を非順序点集合に適応させるボールスパース注意(BSA)を提案する。
我々は、NSAのコンポーネントをボールベースの地区で機能するように修正し、サブクワッドラティックコストで世界的受容野を生み出す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:29:41 GMT)
EXGnet: a single-lead explainable-AI guided multiresolution network with train-only quantitative features for trustworthy ECG arrhythmia classification [1.5] 信頼性の高いECG不整脈分類ネットワークであるEXGnetを提案する。
マルチレゾリューション特徴抽出と説明可能な人工知能(XAI)ガイダンスを統合し、定量的特徴のみを訓練する。
提案手法は平均5倍精度98.762%、96.932%、F1スコア97.910%、ChapmanとNingboのデータセット95.527%を達成した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:48:44 GMT)
FastRAG: Retrieval Augmented Generation for Semi-structured Data [1.4] 本稿では,半構造化データを対象とした新しいRAG手法であるFastRAGを紹介する。
FastRAGはスキーマ学習とスクリプト学習を使用して、全データソースをLLMに送信することなく、データを抽出し、構造化する。
テキスト検索と知識グラフクエリを統合して、コンテキスト豊富な情報を取得する精度を向上させる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:00:02 GMT)
Counterfactual Uncertainty Quantification of Factual Estimand of Efficacy from Before-and-After Treatment Repeated Measures Randomized Controlled Trials [1.3] 本稿は, テクスティカル・テリマンドで実現可能な不確実性低減を定量化し, デジタル・ツインズを用いた場合の潜在的なバイアスに注意する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:48:53 GMT)
Phonikud: Hebrew Grapheme-to-Phoneme Conversion for Real-Time Text-to-Speech [1.3] Phonikudは、完全に特定されたIPA転写を出力する軽量でオープンソースのHebrew grapheme-to-phoneme(G2P)システムである。
我々は、転写されたヘブライ語音声のILSpeechデータセットにIPAアノテーションを付与し、ヘブライ語G2PのベンチマークやTSシステムのトレーニングデータとして機能する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:16:38 GMT)
MS-UMamba: An Improved Vision Mamba Unet for Fetal Abdominal Medical Image Segmentation [1.3] 胎児超音波画像分割のためのハイブリッド・コンボリューション・マンバモデルであるMS-UMambaを提案する。
具体的には,マンバのグローバルなモデリング強度を利用するCNNブランチと統合された視覚状態空間ブロックを設計する。
また,異なる層からの特徴情報を統合した効率的なマルチスケール機能融合モジュールを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:34:10 GMT)
Deep Fusion of Ultra-Low-Resolution Thermal Camera and Gyroscope Data for Lighting-Robust and Compute-Efficient Rotational Odometry [1.2] 本研究は,超低分解能熱画像とジャイロ読影器を統合した新しいセンサ融合法であるサーマルジャイロ融合を導入する。
熱ジャイロ融合は, 精度を著しく向上させることなく, 熱カメラの分解能を著しく低下させることができることを示す。
これらの利点は、資源に制約のあるロボットシステムのリアルタイム展開に適している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:23:40 GMT)
Compositional Shielding and Reinforcement Learning for Multi-Agent Systems [1.1] 高度な強化学習は、高性能なポリシーを得るための強力なツールとして登場した。
安全を保証するための有望なパラダイムの1つは、安全でない行動からポリシーを守るシールドである。
本研究では,マルチエージェント遮蔽のための新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:54:52 GMT)
Simplifying debiased inference via automatic differentiation and probabilistic programming [1.0] 「Dimple」は、興味のパラメータを表す入力コンピュータコードとして、効率的な推定器を出力する。
概念実証Pythonの実装を提供し、パラメータ仕様から数行のコードで効率的に推定できる方法の例を紹介します。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:21:04 GMT)
Ghost Policies: A New Paradigm for Understanding and Learning from Failure in Deep Reinforcement Learning [1.0] Arvolutionは、Augmented Reality(AR)フレームワークである。
「エージェントの歴史的に失敗した政策の軌跡を半透明の幽霊と表現する」
本稿では,DRLエージェントの障害を重要かつ実用的な学習資源に変換するパラダイムシフトを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:56:42 GMT)
Style-based Composer Identification and Attribution of Symbolic Music Scores: a Systematic Survey [0.9] 本稿では,シンボリック・ミュージック・スコアにおけるスタイルに基づく作曲家の識別と作者の属性に関する文献の体系的レビューを行う。
信頼性向上のための重要なニーズに対処し、さまざまな歴史的期間に発行された58の査読論文を厳格に分析する。
既存の研究のかなりの部分は、不適切な検証プロトコルと単純な精度の指標に対する過度な信頼性に悩まされていることが判明した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:34:07 GMT)
Nested Named-Entity Recognition on Vietnamese COVID-19: Dataset and Experiments [0.9] ベトナムにおける新型コロナウイルスのパンデミック防止を支援するNER(Nonden-entity Recognition)研究について述べる。
また、ベトナム向けのネストされたエンティティ認識タスクを備えた、手動で注釈付けされた新型コロナウイルスデータセットも提示する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:55:40 GMT)
Parkinson's Disease Freezing of Gait (FoG) Symptom Detection Using Machine Learning from Wearable Sensor Data [0.8] 歩行凍結はパーキンソン病(PD)患者にみられる特別な症状である
患者が着用する加速度計は、これらのエピソードの間の動きデータを記録でき、機械学習アルゴリズムはこの情報を分類するのに有用である。
本稿では,加速度センサデータ中のFoG事象を特定するために,Transformer-Bi-LSTM融合モデルを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:07:17 GMT)
Aptly: Making Mobile Apps from Natural Language [0.8] Aptlyはモバイルアプリ開発を民主化するためのプラットフォームだ。
App InventorにLLM(Large Language Model)を統合することで,自然言語を使用したアプリ開発が可能になる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:53:05 GMT)
Neuromorphic Online Clustering and Its Application to Spike Sorting [0.8] 動的オンラインクラスタリングが可能な基本的なニューラルネットワーク構築ブロックとして,ニューロモルフィックデンドライトを開発した。
ニューロモルフィックデンドライトの特徴と能力は、実験的神経科学(スパイクソート)のベンチマークによって示される。
提案したデンドライトの精度は、より計算集約的でオフラインなk平均クラスタリング手法と比較される。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:53:55 GMT)
Improved Quantum Query Upper Bounds Based on Classical Decision Trees [0.8] 古典的なクエリアルゴリズムが決定木として与えられると、古典的なクエリアルゴリズムよりも高速な量子クエリアルゴリズムはいつ存在するのか?
我々は、下層の決定木の構造に基づく一般的な構成を提供し、これが上から四進的な量子スピードアップをもたらすことを証明している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:25:35 GMT)
The Software Landscape for the Density Matrix Renormalization Group [0.7] 密度行列再正規化群 (DMRG) アルゴリズムは、量子多体系を研究するための基礎計算法である。
材料科学、量子化学、量子コンピューティングなどの分野に適用可能であるにもかかわらず、多くの独立した実装が開発されている。
このサーベイは急速に拡大するDMRGソフトウェアの世界をマッピングし、35の既存パッケージの機能を包括的に比較した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:12:16 GMT)
MonoVQD: Monocular 3D Object Detection with Variational Query Denoising and Self-Distillation [0.6] 我々は,DETRに基づくモノクル3D検出を高速化する新しいフレームワークであるMonoVQDを紹介する。
Mask Separated Self-Attentionメカニズムにより、DeTRアーキテクチャへのデノナイズプロセスの統合が可能になる。
本稿では,従来のデノナイズ手法の消滅問題に対処するために,変分クエリ・デノナイズ手法を提案する。
厳密な実験により、MonoVQDは挑戦的なKITTI単分子ベンチマークよりも優れたパフォーマンスを達成している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:49:12 GMT)
Beyond Robertson-Schrödinger: A General Uncertainty Relation Unveiling Hidden Noncommutative Trade-offs [0.6] 我々はRobertson-Schr'odingerの不確実性関係の普遍的な強化を報告した。
2段階の量子系では、不等式は任意の状態と観測可能な一対の対に対して完全に等しいものとなる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:52:10 GMT)
Universal Approximation of Operators with Transformers and Neural Integral Operators [0.6] 変換器アーキテクチャは、H"古い空間間の積分作用素の普遍近似であることを示す。
レイ・シャウダー写像を用いた変換器の修正版は任意のバナッハ空間の間の作用素の普遍近似である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:29:57 GMT)
Leakage-Resilient Extractors against Number-on-Forehead Protocols [0.6] 鍵となる要素は、Non-on-forehead (NOF)プロトコルに対するリーク耐性抽出器(LRE)と呼ばれる、新しい擬似ランダムプリミティブをほぼ最適に構築することである。
我々のLREは、Liの低エラー3ソース抽出器(FOCS '15)のより堅牢なバージョンと見なすことができ、Kumar、Meka、Sahaiによるオープンな質問を解決します。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:22:21 GMT)
Robust LLM Unlearning with MUDMAN: Meta-Unlearning with Disruption Masking And Normalization [0.6] 言語モデルは、広範囲の安全性を調整した後でも、危険な知識とスキルを保持することができる。
近年の研究では、特別な未学習の方法であっても容易に逆転できることが示されている。
Disruption Maskingは、ウェイトを更新するだけを可能にするテクニックです。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:49:51 GMT)
Konooz: Multi-domain Multi-dialect Corpus for Named Entity Recognition [0.5] コヌーズ(Konoz)は、10の領域にまたがる16のアラビア方言をカバーする新しい多次元コーパスである。
Konoozは、ドメイン適応や転送学習といったさまざまなNLPタスクに役立ちます。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:58:55 GMT)
Exploring Cultural Variations in Moral Judgments with Large Language Models [0.5] 対数確率に基づく道徳的正当性スコアを用いて、各モデルのアウトプットを、幅広い倫理的トピックをカバーする調査データと相関付けする。
以上の結果から, 早期モデルや小型モデルでは, 人的判断とほぼゼロに近い相関や負の相関が生じることが示唆された。
高度な命令調整モデル(GPT-4oやGPT-4o-miniを含む)は、かなり高い正の相関を達成し、現実世界の道徳的態度をよりよく反映している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:16:48 GMT)
Quantizing Small-Scale State-Space Models for Edge AI [0.5] ステートスペースモデル(SSM)は、最近、長距離依存を効率的にモデル化する能力について、ディープラーニングで注目を集めている。
本稿では,タスク性能を維持しながら,メモリと計算コストの削減に焦点をあてて,小型SSMにおける量子化の効果を分析する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:43:47 GMT)
Real-Time Agile Software Management for Edge and Fog Computing Based Smart City Infrastructure [0.5] 本稿では、ROOFフレームワークを利用して、中間フォグおよび周辺エッジネットワーク層での分散コンピューティングを行い、その起点付近のデータを処理することでレイテンシを低減する。
ROOFは、冗長性を避けるためにフォグキャッシュ、省エネのための超低電力無線伝送、効率のためのAI駆動のリソース割り当てを備えている。
ブーバネスワル、バルセロナ、コペンハーゲンの事例研究は、交通システムと環境モニタリングにおけるROOFの使用を検証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:00:53 GMT)
Advances in LLMs with Focus on Reasoning, Adaptability, Efficiency and Ethics [0.5] 人間と機械のコミュニケーションのギャップを埋めるのに最も効果的なテクニックには、Chain-of-Thought prompting、Instruction Tuning、Reinforcement Learning from Human Feedbackなどがある。
マルチモーダル学習の改善と、少数ショットまたはゼロショット技術により、LLMはより小さな入力で複雑なジョブを処理することができるようになった。
LLM推論、効率性、倫理的整合性を高める新しい手法を分類する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:55:19 GMT)
A Theoretical Framework for Virtual Power Plant Integration with Gigawatt-Scale AI Data Centers: Multi-Timescale Control and Stability Analysis [0.5] 本稿では,仮想電力プラント(VPPs)を再認識する包括的な理論的枠組みを提案する。
我々は, パルスメガワット規模の負荷を考慮したコンバータ支配システムに特化して, 制御機構と安定性基準を開発する。
この研究は、2030年までにデータセンターの電力消費量の50~70%を占めるAIインフラの安定した統合に必要な数学的基盤を確立する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:44:17 GMT)
EdgeProfiler: A Fast Profiling Framework for Lightweight LLMs on Edge Using Analytical Model [0.4] 本稿では,エッジシステム上での軽量大言語モデル(LLM)を評価するためのフレームワークであるEdgeProfilerを紹介する。
このフレームワークはTinyLLaMA、Gemma3.1B、Llama3.2-1B、DeepSeek-r1-1.5BなどのコンパクトなLCMをプロファイルしている。
プロファイリングにより,4ビット量子化によりモデルメモリ使用量を約60~70%削減し,精度は2~5%に抑えられた。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 04:43:24 GMT)
Information fusion strategy integrating pre-trained language model and contrastive learning for materials knowledge mining [0.4] 機械学習は材料設計に革命をもたらしたが、合金の延性のような複雑な特性を予測することは依然として難しい。
本稿では,これらの制約を克服するために,材料科学文献のドメイン固有テキストと量的物理記述子を統合する,革新的な情報融合アーキテクチャを提案する。
本フレームワークでは,テキスト理解の高度化にMatSciBERTを使用し,処理パラメータや微細構造特性に関する暗黙的な知識を自動的に抽出するコントラスト学習を取り入れている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:09:00 GMT)
Physical-Layer Machine Learning with Multimode Interferometric Photon Counting [0.4] 本稿では,機械学習と干渉光子計数を組み合わせた統合プロトコルを提案し,雑音の低減と相関関係を明らかにする。
以上の結果より, 従来のホモダイン検出法では, マルチモード干渉光子計数の方が優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:10:19 GMT)
Optimizing Blood Transfusions and Predicting Shortages in Resource-Constrained Areas [0.4] ドナー患者と血液バンク選択のためのデータマッチングアルゴリズムと、血液受け入れデータを分析し、潜在的な不足を予測する機械学習手法を提案する。
近距離選択,血液型適合性,呼吸優先度,希少度スコアを組み込んだシステムに,ランダムなアロケーションから進行する血液バンク操作を最適化するシミュレーションを開発した。
将来の開発では、予測精度と最適化性能を改善するために現実世界の変数を組み込む予定である。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:17:45 GMT)
Benchmarking Image Similarity Metrics for Novel View Synthesis Applications [0.2] 本研究では,新しい知覚的類似度尺度DreamSimの有効性を評価する。
画像類似度指標の感度と識別力を定量化するために, 人工的に劣化した画像のコーパスを作成する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:21:58 GMT)
A Mapping Study About Training in Industry Context in Software Engineering [0.1] 本研究は,産業環境におけるソフトウェア工学における企業教育研究の現状を地図化することを目的としている。
フィールドで公表された26の初等研究の選定と分析を含む系統地図研究を行った。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:08:01 GMT)
XPG-RL: Reinforcement Learning with Explainable Priority Guidance for Efficiency-Boosted Mechanical Search [0.1] エージェントが機械的な探索タスクを効率的に実行できる強化学習フレームワークXPG-RLを紹介する。
XPG-RLはタスク駆動型アクション優先順位付け機構と学習コンテキスト対応スイッチング戦略を統合する。
実験により、XPG-RLはタスク成功率と動作効率において、ベースライン法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:25:01 GMT)
Adaptive Multi-resolution Hash-Encoding Framework for INR-based Dental CBCT Reconstruction with Truncated FOV [0.1] Inlicit Neural representation (INR) はCT画像再構成において有望なアプローチとして最近出現している。
本稿では,3次元歯科用CBCTのマルチレゾリューション・ハッシュエンコーディングを利用した計算効率の良いINRベースの再構成フレームワークを提案する。
固定解像度レベルと固定サンプリングレートを用いた単純領域拡張と比較して、適応戦略は800x800x600の画像ボリュームに対して計算時間を60%以上削減する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:16:11 GMT)
Simulating the Antiferromagnetic Heisenberg Model on a Spin-Frustrated Kagome Lattice with the Contextual Subspace Variational Quantum Eigensolver [0.1] 反強磁性ハイゼンベルク模型を,高縮退エネルギースペクトルを生じさせる幾何学的にフラストレーションされた構造である,かごめ格子上で研究する。
このシステムをうまくシミュレートするために、コンテキストサブスペース手法を利用した量子ビット削減戦略を用いる。
我々は、リードアウト誤差緩和(REM)、対称性検証(SV)、ゼロノイズ外挿(ZNE)を組み合わせたハイブリッド量子誤り軽減戦略を採用する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:01:34 GMT)
SplashNet: Split-and-Share Encoders for Accurate and Efficient Typing with Surface Electromyography [0.0] 手首にある表面筋電図(sEMG)は、キーボードのない自然なテキスト入力を可能にする。
最先端の Emg2qwerty ベースラインは、まだ見知らぬユーザーのゼロショット設定で511.8%の文字を認識していない。
これらの誤りの多くを、ユーザ間信号統計のミスマッチに追従する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 05:38:29 GMT)
QGuard:Question-based Zero-shot Guard for Multi-modal LLM Safety [0.0] 有害なプロンプトをゼロショットでブロックする簡易かつ効果的な安全ガード手法であるQGuardを提案する。
実験の結果,本モデルはテキストのみとマルチモーダル有害データセットの両方で競合的に動作することがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:23:50 GMT)
ViQA-COVID: COVID-19 Machine Reading Comprehension Dataset for Vietnamese [0.0] ViQA-COVIDはベトナム向けの新型コロナウイルスに関する最初のRCデータセットである。
モデルやシステムの構築に使用することができ、病気の予防に寄与する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:04:49 GMT)
Unpolarized prethermal discrete time crystal [0.0] 非分極前熱離散時間結晶(UPDTCs)と呼ばれる新しい熱水前DTCのクラスを導入する。
常磁性初期状態に対するスタッガー磁化の自己相関関数において、頑健な周期倍のダイナミクスが持続可能であることを示す。
我々は,PDTCはFloquet予熱法と整合して,高周波駆動方式において指数的に長寿命であることを示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:06:31 GMT)
Universality of almost periodic orbits in certain composite functions [0.0] 基本代数フレームワークにおける合成関数について考察する。
フーリエを一切使わないと、ある種の合成函数を適切に特徴づけるほぼ周期軌道が見つかる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:00:12 GMT)
Tuning transport in solid-state Bose-Fermi mixtures by Feshbach resonances [0.0] 狭い固体フェシュバッハ共鳴に近いボース・フェルミ混合物の輸送特性を予測した。
これらの固体ボース-フェルミ混合系において, 従来の散乱機構よりも相互作用効果が支配的であることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:17:16 GMT)
Towards Fairness Assessment of Dutch Hate Speech Detection [0.0] オランダ語におけるヘイトスピーチ検出モデルの正当性を評価する。
分析の結果,ヘイトスピーチの検出,平均対実フェアネス,グループフェアネスの点で,モデルの性能が向上していることがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:33:12 GMT)
Thermal Fisher information for a rotating BTZ black hole [0.0] フィッシャー情報はブラックホールの自転に敏感であることを示す。
従来,静的ブラックホールの質量を2+1次元で判別できることが示されていた。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:58:03 GMT)
Symmetry-preserving neural networks in lattice field theories [0.0] この論文は対称性を尊重するニューラルネットワークを扱い、格子場理論問題に適用する利点を示す。
等変ネットワークを選択する利点は、まず複雑なスカラー場玩具モデル上での翻訳対称性のために説明される。
この議論はゲージ理論にまで拡張され、Lattice Gauge Equivariant Convolutional Neural Networks (L-CNN) が特別に設計されたアドホックである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:12:25 GMT)
Success probability in Shor's Algorithm [0.0] 本研究の目的は,Shorのアルゴリズムの各ステップにおける精度の高い成功確率を決定することである。
導出式は、シャイアのアルゴリズムにおける全ての失敗事例を識別することができるが、これはゼロの成功確率に相当する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:50:43 GMT)
Subexponential decay of local correlations from diffusion-limited dephasing [0.0] 有限エネルギー密度のカオス量子系は、独自の熱浴として機能することが期待されている。
この脱落は、ある空間次元における保存則を持つカオス力学の亜指数であると論じる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:05:05 GMT)
Statistical Description of Fermi System over a Surface in a Uniform External Field [0.0] フェルミ粒子系の熱力学特性を記述するための統計的手法を提案する。
単位面積当たりの粒子数は、特に小さいと仮定される。
大きな表面積の連続限界では、熱容量と密度分布の温度依存性が計算される。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:05:53 GMT)
State-Based Quantum Simulation of Imaginary-Time Evolution [0.0] 仮想時間進化のシミュレーションのための完全量子的手法を提案する。
量子状態の集合を用いて、制御されたSWAPゲートと測定のみを適用して、非単体的想像時間進化をシミュレートする方法を実証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:31:32 GMT)
Recent Advances and Future Directions in Literature-Based Discovery [0.0] 本稿では,文献ベースの発見(LBD)における最近の方法論的進歩について調査する。
知識グラフ構築,ディープラーニングアプローチ,事前学習型および大規模言語モデル(LLM)の統合という,3つの重要な分野の進歩を概観する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:47:13 GMT)
Real-Time, Low-Latency Surveillance Using Entropy-Based Adaptive Buffering and MobileNetV2 on Edge Devices [0.0] このシステムは、リソース制約のあるデバイス上で、50ms以下のエンドツーエンドの推論レイテンシでライブストリームを処理することができる。
私たちのアーキテクチャはスケーラブルで安価で、一般的な監視システムよりも厳格なデータプライバシー規制に準拠しています。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:32:05 GMT)
RAW-Explainer: Post-hoc Explanations of Graph Neural Networks on Knowledge Graphs [0.0] RAW-Explainerは、リンク予測のための連結、簡潔、解釈可能なサブグラフ説明を生成するために設計された新しいフレームワークである。
知識グラフに適した既存の手法とは異なり、我々はニューラルネットワークを用いて説明生成プロセスのパラメータ化を行っている。
提案手法は, 説明品質と計算効率のバランスをとる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 15:55:17 GMT)
RARL: Improving Medical VLM Reasoning and Generalization with Reinforcement Learning and LoRA under Data and Hardware Constraints [0.0] Reasoning-Aware Reinforcement Learning frameworkは、医療ビジョン言語モデルの推論能力を高める。
低ランク適応とカスタム報酬関数を用いた軽量ベースモデルQwen2-VL-2B-Instructを微調整する。
RARLは医用画像解析および臨床推論におけるVLM性能を著しく改善することを示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:41:30 GMT)
OscNet v1.5: Energy Efficient Hopfield Network on CMOS Oscillators for Image Classification [0.0] 我々は,OscNet上で実装可能なHopfield Networkベースの機械学習アルゴリズムを提案する。
ネットワークはフォワードプロパゲーションだけで訓練され、疎結合な重みを学習するが、精度は8%向上する。
OscNet v1.5は前進伝播のみに依存し、疎結合を採用しており、エネルギー効率のよい機械学習パイプラインとなっている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:10:23 GMT)
Ontology Enabled Hybrid Modeling and Simulation [0.0] 補完的なアプローチは、Human-Human、Human-Machine、Machineの3つの軸に沿った相互運用性の課題にどのように対処するかを示す。
Web Technologiesと統合して、シミュレーションのための記述的ドメイン構築と規範的ガイドとしての役割を示す。
海面設計分析、産業4.0モデリング、政策支援のための人工社会、サイバー脅威評価の4つの応用事例。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:41:40 GMT)
Noise tolerance via reinforcement: Learning a reinforced quantum dynamics [0.0] 強化は学習と最適化アルゴリズムの性能を高めるための強力な戦略として登場した。
強化量子力学は雑音環境との相互作用に対して顕著な堅牢性を示すことを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:22:12 GMT)
Multi-state detection and spatial addressing in a microscope for ultracold molecules [0.0] 87Rb133Csのバルク試料から個々の分子をその場で検出した。
分子の内部状態を異なる原子種にマッピングすることにより、個々の分子の位置と回転状態の同時検出を実証する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:40:34 GMT)
Microelectrode Signal Dynamics as Biomarkers of Subthalamic Nucleus Entry on Deep Brain Stimulation: A Nonlinear Feature Approach [0.0] 本稿では、非線形力学とエントロピーに基づくメトリクスを利用して、STN内外から記録された神経活動の分類を行うフレームワークを提案する。
本研究は,DBS手術中におけるリアルタイム・データ駆動意思決定支援における非線形・エントロピー信号記述子の可能性を明らかにするものである。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:23:26 GMT)
MatchPlant: An Open-Source Pipeline for UAV-Based Single-Plant Detection and Data Extraction [0.0] そこで本研究では,UAVを用いた単一プラント検出と地理空間特性抽出のための,モジュール型でグラフィカルなユーザインタフェースをサポートするオープンソースのPythonパイプラインであるMatchPlantを提案する。
MatchPlantは、UAV画像処理、ユーザガイド付きアノテーション、オブジェクト検出のためのConal Neural Networkモデルトレーニング、正規モザイクへのバウンディングボックスの前方投影、表現型解析のためのシェープファイル生成を統合することで、エンドツーエンドを可能にする。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 01:09:45 GMT)
Marginal second-order moments do not suffice for entanglement detection [0.0] 2階のモーメントを通して局所単位状態(LU)の条件を導出することにより、分離可能な状態と絡み合った状態のペアを構築する。
2階のモーメントを通して局所ユニタリ(LU)の条件を導出することにより、LU同値でない分離状態と絡み合った状態のペアを構築する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:51:31 GMT)
Magnetic properties of the frustrated decorated Ising chain [0.0] 検討中の系の基底状態エントロピー(粒子単位)は、よく知られた数値列で説明できる。
粒子数の関数として最小エネルギー(基底状態の退化)を持つ状態の数に依存することが判明した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:57:10 GMT)
Lower Bounds on Quantum Tunneling for Excited States [0.0] 連続体中を移動する粒子と磁場がない粒子の量子トンネル問題を再考する。
すべての空間次元において、単井戸ポテンシャルが反射対称性を満たす場合まで前の結果を拡張する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:35:36 GMT)
Localization with non-Hermitian off-diagonal disorder [0.0] 我々は,非エルミート系を,ランダムに近接する近傍トンネルが支配するシステムについて論じる。
完全に実固有スペクトルの物理的状況は、ハミルトニアンの三対角行列構造によって生じる。
対角線外障害は、非エルミート系を有限系における非局在化-局在化クロスオーバーへと導く。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:09:12 GMT)
Lightweight LSTM Model for Energy Theft Detection via Input Data Reduction [0.0] 本稿では,プリフィルタとして機能する軽量検出ユニット(watchdog mechanism)を提案する。
LSTMモデルに供給される入力量を削減し、エネルギー盗難の可能性がより高いインスタンスに制限する。
その結果、消費電力の減少は64%を超え、検出精度は最小限に抑えられ、リコールは一貫して高いことがわかった。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:40:03 GMT)
Lieb-Mattis states for robust entangled differential phase sensing [0.0] 絡み合った量子センサーは、標準的な量子限界を超えることができる。
差動信号推定のための2ノードエンタングルメント型量子センサネットワークを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:53:48 GMT)
Learning Mappings in Mesh-based Simulations [0.0] 本稿では,点のフットプリントを格子頂点に集約し,トポロジの情報豊富なグリッド表現を生成する,新規でパラメータフリーな符号化手法を提案する。
具体的には、ユニークな設計のUNet(E-UNet)とエンコーダを統合し、様々な2Dおよび3D問題にまたがるフーリエおよびトランスフォーマーベースのモデルに対して、その性能をベンチマークする。
提案フレームワークは,メッシュベースのシミュレーションを含む計算科学アプリケーションにおいて,プリミティブおよび計算集約型エンコーディングスキームの実用的な代替手段を提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:43:13 GMT)
Ising Models with Hidden Markov Structure: Applications to Probabilistic Inference in Machine Learning [0.0] 2つのイジング層を結合するハミルトニアンによって定義される木付きマルコフ鎖(ギブズ測度)について検討する。
具体的には、ケイリー木上のこのハミルトン多様体の変換不変ギブズ測度(TIGM)を探索する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:57:17 GMT)
Is attention all you need to solve the correlated electron problem? [0.0] 我々は、固体中の相互作用する電子問題を解くために、自己アテンションアンサッツを用いることができることを示した。
モワール量子材料に関するシステマティック・ニューラル・ネットワーク変動型モンテカルロによる研究により、自己注意型アンサッツが人間のバイアスを伴わない正確かつ効率的な解を提供することを示した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:39:10 GMT)
Interpretable Causal Representation Learning for Biological Data in the Pathway Space [0.0] 因果表現学習(Causal Representation Learning)は、生物学的システムを因果的に管理する潜伏要因を特定することを目的としている。
本稿では,潜伏表現を既知の生物学的過程と調和させるモデルSENA-discrepancy-VAEを提案する。
本研究は,SENA-discrepancy-VAEが介入の見当たらない組み合わせにおいて予測性能を達成することを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:33:19 GMT)
Interference of interference effects [0.0] 重なり合う2つのマッハ・ツェンダー干渉計からなる線形光学装置において、個々の光子の干渉を分析する。
このセットアップでは、シングルフォトのマッハ・ツェンダー干渉と2フォトのHong-Ou-Mandel干渉が相互に干渉し、部分的にキャンセルされていることを示す。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:10:13 GMT)
Information-theoretic Estimation of the Risk of Privacy Leaks [0.0] データセット内のアイテム間の依存関係は、プライバシリークを引き起こす可能性がある。
本稿では,プライバシ侵害の可能性を示唆する指標として,元データとランダム化器からのノイズ応答の相関を計測する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 03:39:11 GMT)
Inequality for von Neumann entropy change under measurement and dissipation [0.0] 我々は、連続的な測定と散逸の対象となる量子系におけるアンサンブル平均フォン・ノイマンエントロピー変化の低い境界を与える普遍的不等式を導出する。
導出不等式は、佐川-上田不等式のような古典的な情報-熱力学関係を量子状態に一般化する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 18:51:13 GMT)
Improving Generalization in MRI-Based Deep Learning Models for Total Knee Replacement Prediction [0.0] 変形性関節症イニシアチブ(OAI)データベースからMRIデータを用いてモデルを訓練し,評価した。
その結果,両領域の分類精度は統計的に有意に向上した。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:21:05 GMT)
Fully Quantum Lattice Gas Automata Building Blocks for Computational Basis State Encodings [0.0] 計算基底状態エンコーディングに依存するQLGAアルゴリズムのための新しいビルディングブロックを提案する。
基礎となる量子回路の直感的な例とオープンソース実装を提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:42:12 GMT)
From Human to Machine Psychology: A Conceptual Framework for Understanding Well-Being in Large Language Model [0.0] 本稿では,機械の繁栄の概念を紹介し,PAPERSフレームワークを提案する。
我々の発見は、人間とシステム固有の優先順位の両方を考慮に入れた、AI固有の繁栄モデルを開発することの重要性を浮き彫りにした。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 20:14:02 GMT)
Ergodic Theory of Inhomogeneous Quantum Processes [0.0] この研究は、時間不均質量子系におけるエルゴディディティと混合を理解するための厳密な枠組みを示す。
鍵となる貢献は、混合挙動を特徴づける量子マルコフ・ドブルシン法の開発である。
結果は量子力学の数学的基礎に寄与し、量子情報科学の進歩というより広い目標を支援する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:04:59 GMT)
Entanglement scaling and criticality of infinite-size quantum many-body systems in continuous space addressed by a tensor network approach [0.0] 本研究では、無限多結合量子発振器(iCQOs)の基底状態波動関数の量子絡みと臨界性について検討する。
仮想時間進化アルゴリズムを変換不変な関数テンソルネットワークで拡張することにより、iCQOsの基底状態と2体および3体結合の存在をシミュレートする。
本研究では、絡み合いエントロピー(EE)の対数スケーリング則と、物理的および非物理的領域の分割点における仮想結合$chi$に対する相関長のスケーリング則を明らかにする。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 02:20:41 GMT)
Electron Transport in One-Dimensional Disordered Lattice [0.0] 1次元(1D)不規則鎖における電子輸送の特異性について検討した。
宿主-格子位置の障害は、欠陥、不純物、電子-フォノン相互作用の存在によって引き起こされる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:42:01 GMT)
DoTA-RAG: Dynamic of Thought Aggregation RAG [0.0] DoTA-RAGは大規模Web知識インデックスに最適化された検索拡張生成システムである。
DoTA-RAGはクエリ書き換え、特別なサブインデックスへの動的ルーティング、マルチステージ検索とランキングという3段階のパイプラインで課題に対処する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 16:56:00 GMT)
Detecting Narrative Shifts through Persistent Structures: A Topological Analysis of Media Discourse [0.0] 本研究では,メディア物語の構造変化を永続的ホモロジーを用いて同定するためのトポロジ的枠組みを提案する。
進化する言説を追究するために,名詞句の日次共起グラフを構築した。
We compute Wasserstein distances and persistence entropies across homological dimensions to capture semantic disrupt。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 21:02:17 GMT)
Deploying and Evaluating Multiple Deep Learning Models on Edge Devices for Diabetic Retinopathy Detection [0.0] 糖尿病網膜症(DR)は世界中で約34.6%の糖尿病患者に影響を与えており、2045年までに2億2200万人に達すると予測されている。
従来のDR診断は、時間と資源を集中的に消費する網膜基底画像のマニュアル検査に依存している。
本研究では、エッジデバイス上でリアルタイムDRのための複数のディープラーニングモデルをデプロイするために、Edge Impulseを用いた新しいソリューションを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:53:45 GMT)
Defect-Mediated Pairing and Dissociation of Strongly Correlated Electrons in Low Dimensional Lattices: The Quantum Taxi Effect [0.0] 地中エネルギー欠損による局所的解離・ペアリング機構の発生について検討した。
この位置付近で空間的対/離電子間の遷移が生じることを示す。
これらの結果は、強相関電子系におけるエキゾチックなペアリング現象に関する新たな洞察を与える。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:57:24 GMT)
DeepSeq: High-Throughput Single-Cell RNA Sequencing Data Labeling via Web Search-Augmented Agentic Generative AI Foundation Models [0.0] 生成AI基盤モデルは、構造化された生物学的データを処理するための変換ポテンシャルを提供する。
本稿では,実時間Web検索を用いたエージェント基礎モデルを用いて実験データのラベル付けを自動化し,最大82.5%の精度を実現することを提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:30:22 GMT)
Component Based Quantum Machine Learning Explainability [0.0] 説明可能なMLアルゴリズムは、意思決定プロセスに対する透明性と洞察を提供するように設計されている。
本稿では、QMLアルゴリズムをコアコンポーネントに分割するモジュラーで説明可能なQMLフレームワークの作成について検討する。
各コンポーネントは、これらのQMLアルゴリズムの異なるコンポーネントを分析するために適応されたALEやSHAPなどの説明可能性技術を使用して分析される。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:21:09 GMT)
Collective Excitations of Dissipative Time Crystals [0.0] 我々は、散逸性光学キャビティと周期的に相互作用する原子の動力学を研究する。
通常の相から時結晶相へ遷移する原子の励起スペクトルを特徴付ける。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 09:16:25 GMT)
Collaboration Between the City and Machine Learning Community is Crucial to Efficient Autonomous Vehicles Routing [0.0] 自動運転車(AV)は、交通ネットワークを不安定にすることができる。
人間のドライバーとAVをシミュレートすることで、この相互作用を研究する。
我々は、市当局がMLコミュニティと協力して、自動車メーカーが提案するルーティングアルゴリズムを監視し、批判的に評価する必要があると主張している。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:24:41 GMT)
CLIP-HandID: Vision-Language Model for Hand-Based Person Identification [0.0] 本稿では,犯罪捜査に特化して設計された手動画像に基づく人物識別への新たなアプローチを提案する。
この手法は、性的虐待のような重大犯罪において特に有用であり、手動画像が利用可能な唯一の証拠であることが多い。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 10:59:00 GMT)
Bridging the Digital Divide: Small Language Models as a Pathway for Physics and Photonics Education in Underdeveloped Regions [0.0] この記事では、低消費電力デバイス上でオフラインで実行できる、Small Language Models(SLM)互換のAIツールが、スケーラブルなソリューションを提供する方法について説明する。
仮想チューターとして機能し、ネイティブ言語の教育を可能にし、インタラクティブな学習をサポートすることで、SLMは訓練された教育者の不足と実験室へのアクセスに対処するのに役立つ。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 08:41:05 GMT)
Binarization-Aware Adjuster: Bridging Continuous Optimization and Binary Inference in Edge Detection [0.0] 画像エッジ検出(ED)は、トレーニングと推論の根本的なミスマッチに直面します。
本稿では,バイナリ化アウェア (BAA) を設計するための理論的手法を提案する。
BAAは二項化の挙動を勾配に基づく最適化に明示的に組み入れている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 11:56:44 GMT)
Beyond Dicke superradiance: Universal scaling of the peak emission rate [0.0] 量子光学において、超放射能(英: superradiance)とは、集団崩壊中にN$完全励起量子エミッタ系が強い光を放射する現象である。
超放射能崩壊を受ける完全励起量子エミッタ系のピーク光子放出速度について解析的にコンパクトで計算が容易な式を提案する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 22:32:46 GMT)
An Incremental Framework for Topological Dialogue Semantics: Efficient Reasoning in Discrete Spaces [0.0] 有限な離散的な意味空間に基づく対話意味論のための、抽出可能な、漸進的なフレームワークを提案する。
我々は、厳密な基礎、神経アップデートのための確実に正しいインクリメンタルアルゴリズム、そしてWolfram言語における参照実装を提供する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 00:27:23 GMT)
Ab Initio Polaritonic Chemistry on Diverse Quantum Computing Platforms: Qubit, Qudit, and Hybrid Qubit-Qumode Architectures [0.0] 量子プラットフォーム上でのフェルミオンおよびボゾン自由度を表すための3つの戦略について検討する。
我々のアプローチの鍵となる要素は、コンパクトな電子-光子エンタングリング回路の開発である。
以上の結果から,各プラットフォームは極性エネルギーと固有状態の予測において,同等の精度を達成できることが示唆された。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 13:35:11 GMT)
ANIRA: An Architecture for Neural Network Inference in Real-Time Audio Applications [0.0] Aniraは、ニューラルネットワーク推論のためのクロスプラットフォームライブラリである。
OnNX、LibTorch、Lite Liteはリアルタイムオーディオアプリケーション向けにテストされている。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 23:55:58 GMT)
AI Recommendations and Non-instrumental Image Concerns [0.0] 本稿は、個人がAIレコメンデーションを活用できない重要な理由として、非構造的イメージの関心事を特定するために、オンライン実験を使用する。
これらの認識が金銭的な結果をもたらすことなく、参加者はAIアドバイスを無視し、タスクパフォーマンスを低下させます。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 17:41:56 GMT)
A philosophical and ontological perspective on Artificial General Intelligence and the Metaverse [0.0] 本稿では,AGIの概念,人間の意識との関係,そして,この関係を促進する上でのメタバースの重要な役割について考察する。
認知の具体化、マイケル・レヴィンの「自己」の計算境界、ドナルド・D・ホフマンの知覚のインターフェイス理論など、いくつかの理論的枠組みがこの探索を支えている。
この論文は、人間関係において一定の調和を達成することの重要性を強調し、世界レベルで人類の相互接続性を認識させることによって締めくくられる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 19:28:32 GMT)
A New Representation of Binary Sequences by means of Boolean Functions [0.0] ブール関数のいくつかの性質を二進列を通して研究し、その逆も検討する。
また、そのような表現とブール関数の他の表現との関係についても検討する。
最後に、ブール関数とそれらの性質のいくつかの観点から一般化自己収縮列を解析する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 12:32:01 GMT)
A Hybrid Architecture with Efficient Fine Tuning for Abstractive Patent Document Summarization [0.0] 本研究では,特許記録の抽象要約を効率的に作成するシステムを提案する。
この手順では、LexRankグラフベースのアルゴリズムを使用して、入力された親テキストから重要な文を検索する。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 07:15:13 GMT)
A Classical Analogue of Entanglement for a Kicked Top [0.0] 時間進化のユニタリ性は、量子状態間の距離が保存されることを保証するため、量子力学はカオスを示すことができないと広く信じられている。
平行議論は古典的なカオスの存在を否定するように見える古典力学で構築することができる。
論文参考訳(メタデータ) (Sat, 14 Jun 2025 14:47:40 GMT)