Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey [154.5] 3D再構成とビュー合成は、拡張現実(AR)、仮想現実(VR)、デジタルツインといった没入型技術における基礎的な問題である。
深層学習によるフィードフォワードアプローチの最近の進歩は、高速で一般化可能な3次元再構成とビュー合成を可能にして、この分野に革命をもたらした。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:13:25 GMT)
Rethinking Data Protection in the (Generative) Artificial Intelligence Era [115.7] 現代の(生産的な)AIモデルやシステムに生じる多様な保護ニーズを捉える4段階の分類法を提案する。
当社のフレームワークは、データユーティリティとコントロールのトレードオフに関する構造化された理解を提供し、AIパイプライン全体にわたっています。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 05:58:02 GMT)
DRS: Deep Question Reformulation With Structured Output [114.1] 大規模言語モデル(LLM)は、解決不可能な質問を検知できるが、これらの質問の修正をユーザーが支援するのに苦労する。
DRS:Deep Question Reformulation with Structured Output, a novel zero-shot method for enhance to LLMs ability to help users in reformulation Question。
DRS は GPT-3.5 の改定精度を 23.03% から 70.42% に改善するとともに,Gemma2-9B などのオープンソースモデルの性能を 26.35% から 56.75% に向上させた。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:39:52 GMT)
APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay [86.0] APIGen-MTは検証可能で多様なマルチターンエージェントデータを生成するフレームワークである。
xLAM-2-fc-r 級数で 1B から 70B のパラメータを持つモデル群を訓練する。
我々のモデルは、$tau$-benchとBFCLベンチマークでGPT-4oやClaude 3.5のようなフロンティアモデルより優れている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:39:17 GMT)
Composed Multi-modal Retrieval: A Survey of Approaches and Applications [81.5] 複合マルチモーダル検索(CMR)は次世代技術として誕生する。
CMRは、参照視覚入力とテキスト修正を統合することで、画像やビデオをクエリすることを可能にする。
本稿では,CMRの基礎的課題,技術的進歩,応用について概説する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:16:52 GMT)
What if Othello-Playing Language Models Could See? [81.1] VISOTHELLOは移動履歴と基板画像に基づいて訓練されたマルチモーダルモデルである。
マルチモーダルトレーニングは、内部表現の性能と堅牢性の両方を改善する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 07:47:55 GMT)
When Autonomy Goes Rogue: Preparing for Risks of Multi-Agent Collusion in Social Systems [78.0] 悪意のあるマルチエージェントシステム(MAS)のリスクをシミュレートするための概念実証手法を提案する。
この枠組みを、誤情報拡散とeコマース詐欺という2つのリスクの高い分野に適用する。
その結果,分散システムの方が,集中型システムよりも悪意ある行動を実行するのに効果的であることが示唆された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:17:30 GMT)
Agentic Satellite-Augmented Low-Altitude Economy and Terrestrial Networks: A Survey on Generative Approaches [76.1] 本調査は,衛星搭載低高度経済と地上ネットワーク(SLAETN)におけるエージェント人工知能(AI)の実現に焦点をあてる。
SLAETNのアーキテクチャと特徴を紹介するとともに,衛星,空中,地上コンポーネントの統合において生じる課題を分析する。
これらのモデルが,コミュニケーション強化,セキュリティとプライバシ保護,インテリジェントな衛星タスクという,3つの領域にわたるエージェント機能をどのように強化するかを検討する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 14:07:05 GMT)
MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization [74.0] MiroMind-M1 は Qwen-2.5 ベースのベンチマーク上に構築された完全なオープンソース RLM のセットである。
我々のモデルは2つの段階で訓練されている: SFT on a carefully curated corpus of 719K math-reasoning problem with confirmed CoT trajectories, then RLVR on 62K challenge and verible problem。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:21:23 GMT)
MagicGUI: A Foundational Mobile GUI Agent with Scalable Data Pipeline and Reinforcement Fine-tuning [73.9] MagicGUIは、現実のモバイルGUI環境における認識、接地、推論における重要な課題に対処するために設計された、基本的なモバイルGUIエージェントである。
フレームワークには、包括的で正確なデータセット、知覚と接地能力の強化、包括的で統一されたアクション空間、計画指向の推論メカニズムを含む6つの重要なコンポーネントが含まれている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:33:43 GMT)
SpatialTrackerV2: 3D Point Tracking Made Easy [73.0] SpaceTrackerV2はモノクロビデオのフィードフォワード3Dポイントトラッキング手法である。
これは、世界空間の3Dモーションをシーン幾何学、カメラエゴモーション、ピクセルワイドオブジェクトモーションに分解する。
このような異種データから幾何学と運動を共同で学習することで、SpatialTrackerV2は既存の3Dトラッキング方法よりも30%優れています。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:07:12 GMT)
Skill Learning via Policy Diversity Yields Identifiable Representations for Reinforcement Learning [67.9] 自己指導型特徴学習(RL)は、相互情報スキル学習(MISL)と呼ばれる情報理論の原則に依存することが多い。
本研究は,MISLを識別可能な表現学習のレンズを用いて検討する。
コントラスト継承機能(Contrastive Successor Features, CSF)は, 線形変換まで環境の地下構造を確実に復元できることを実証する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:48:46 GMT)
AutoPartGen: Autogressive 3D Part Generation and Discovery [66.1] 本稿では,3次元部品からなるオブジェクトを自己回帰的に生成するモデルであるAutoPartGenを紹介する。
このモデルは、オブジェクトの画像、オブジェクトの2Dマスク、または既存の3Dオブジェクトを入力として、対応する合成3D再構成を生成することができる。
我々はAutoPartGenの全体的な3D生成能力と部分レベル生成品質を評価し、3Dパーツ生成における最先端性能を実現することを実証した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 22:47:47 GMT)
ReDiSC: A Reparameterized Masked Diffusion Model for Scalable Node Classification with Structured Predictions [64.2] 本稿では,構造化ノード分類のための構造拡散モデルであるReDiSCを提案する。
本稿では,ReDiSCが最先端のGNN,ラベル伝搬,拡散ベースラインと比較して,優れた,あるいは高い競争力を発揮することを示す。
特にReDiSCは、従来の構造化拡散法が計算制約によって失敗する大規模データセットに効果的にスケールする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:46:53 GMT)
Iceberg: Enhancing HLS Modeling with Synthetic Data [61.5] Icebergは、LLM(Big Language Model)生成プログラムと、目に見えない設計構成の弱いラベルの両方を拡張する合成データ拡張アプローチである。
我々の弱いラベル生成方法はコンテキスト内モデルアーキテクチャと統合され、実際のラベルや近親ラベルからのメタラーニングを可能にする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:32:24 GMT)
Texture or Semantics? Vision-Language Models Get Lost in Font Recognition [48.9] FRB(Font Recognition Benchmark)は15のフォントからなるコンパクトで構造化されたデータセットである。
FRBには2つのバージョンがある: (i) 簡単なバージョン、10つの文を異なるフォントで描画するバージョン、 (ii) ハードバージョン。
フォント認識タスクにおける様々なVLMの広範な評価を通じて,以下の重要な知見を得た。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:51:42 GMT)
A Vision for Auto Research with LLM Agents [47.0] 本稿では,科学研究の全ライフサイクルの自動化,コーディネート,最適化を目的とした構造化マルチエージェントフレームワークであるエージェントベースオートリサーチを紹介する。
このシステムは、文献レビュー、アイデア、方法論、実験、論文執筆、査読応答、普及など、すべての主要な研究段階にまたがる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:30:25 GMT)
X-Intelligence 3.0: Training and Evaluating Reasoning LLM for Semiconductor Display [46.4] 我々は半導体ディスプレイ産業向けに開発された最初の高性能推論モデルであるX-Intelligence 3.0を提案する。
このモデルは、業界の複雑な課題に対する専門家レベルの理解と推論を提供するように設計されています。
比較的コンパクトな32億のパラメータにもかかわらず、X-Intelligence 3.0は複数の評価でSOTA DeepSeek-R1-671Bを上回っている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:20:39 GMT)
Statistical and Algorithmic Foundations of Reinforcement Learning [45.7] 近年,シーケンシャルラーニング (RL) が注目されている。
我々は、RLにおけるいくつかの重要な発展を紹介することを目指しており、新しいアイデアと古典的なトピックの関連を強調している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:42:41 GMT)
AlphaDPO: Adaptive Reward Margin for Direct Preference Optimization [45.5] $alpha$-DPOは、大規模言語モデルの適応的優先最適化アルゴリズムである。
ポリシーモデルと参照モデルのバランスを取り、パーソナライズされた報酬マージンを達成する。
さまざまなモデル設定でDPOとSimPOを一貫して上回ります。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 03:40:37 GMT)
CANDoSA: A Hardware Performance Counter-Based Intrusion Detection System for DoS Attacks on Automotive CAN bus [45.2] 本稿では,制御領域ネットワーク(CAN)環境向けに設計された新しい侵入検知システム(IDS)を提案する。
RISC-VベースのCAN受信機はgem5シミュレータを用いてシミュレートされ、AES-128暗号化によるCANフレームペイロードをFreeRTOSタスクとして処理する。
結果は、このアプローチがCANセキュリティを大幅に改善し、自動車サイバーセキュリティにおける新たな課題に対処する可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:09:52 GMT)
Collusion-Resilient Hierarchical Secure Aggregation with Heterogeneous Security Constraints [42.8] FL(Federated Learning)によって動機づけられたセキュアアグリゲーションは、多くのユーザに対して分散された入力の集合の合計を、可能な限り効率的に安全に計算することを目的としている。
We study weakly-secure HSA (WS-HSA) with collusion resistance。
サーバとリレーの両方のセキュリティを確保するのに必要な独立鍵記号の総数を特徴付ける。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 23:09:57 GMT)
Language Models for Controllable DNA Sequence Design [41.7] 制御可能生成のための自動変圧器発電機ATGC-Genを紹介する。
ATGC-Genはデコーダのみとエンコーダのみのトランスフォーマーアーキテクチャでインスタンス化されている。
我々の実験はATGC-Genが、流動的で多様性があり、生物学的に関係のある配列を生成できることを実証した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:23:17 GMT)
Unitary designs in nearly optimal depth [40.3] 回路深さ$O(log k log log n k / varepsilon)$。
深さは既知のすべての結果に対して指数関数的に改善され、すべてのパラメータは$n$, $k$, $varepsilon$である。
また,多数のクエリをランダムなユニタリーに格納する量子実験において,エラーをバウンディングするための新しい分析フレームワークを開発した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:11:58 GMT)
Suggest, Complement, Inspire: Story of Two Tower Recommendations at Allegro.com [39.6] 本稿では,欧州発祥の最大のeコマースプラットフォームであるAllegro.comに展開する,コンテンツベースの統一レコメンデーションシステムを提案する。
同じモデルアーキテクチャが3つの異なるレコメンデーションタスクにどのように適応できるかを示す。
この結果から,フレキシブルでスケーラブルなアーキテクチャは,メンテナンスのオーバーヘッドを最小限に抑えつつ,多様なユーザ意図に役立てることができることがわかった。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 19:03:38 GMT)
LEAD: Exploring Logit Space Evolution for Model Selection [39.3] 本稿では,ロジットのネットワーク出力に基づく微調整型アプローチであるLEADを提案する。
10のダウンストリームデータセットにわたる24の教師付きおよび自己教師付き事前トレーニングモデルに関する包括的な実験は、素晴らしいパフォーマンスを示している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:45:17 GMT)
Growing a Twig to Accelerate Large Vision-Language Models [37.0] 大規模視覚言語モデル(VLM)は、オープンワールドのマルチモーダル理解において顕著な能力を示した。
本稿では,基本VLMの初期層上に軽量な小枝を成長させることにより,シンプルで汎用的なアーキテクチャであるTwigVLMを紹介する。
TwigVLMは、88.9%の視覚トークンをプルーニングした後、元のパフォーマンスの96%を保ち、ロングレスポンスの生成において154%の高速化を実現している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 13:38:51 GMT)
KVLink: Accelerating Large Language Models via Efficient KV Cache Reuse [36.0] KVLinkは、大規模言語モデル(LLM)における効率的なキー値(KV)キャッシュ再利用のためのアプローチである。
KVLinkは、連結後のグローバルな位置と一致するように、推論時にKVキャッシュの位置埋め込みを調整することと、自己注意を回復するためにトレーニング可能な特別なトークンを使用することである。
7つのデータセットにわたる実験によると、KVLinkは最先端の手法よりも平均4%の精度で質問応答を改善する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 07:41:03 GMT)
Towards the Next Frontier in Speech Representation Learning Using Disentanglement [34.2] 本稿では,フレームレベルと発話レベルのエンコーダモジュールから構成される音声の拡散自己監督学習(Learning2Diss)のためのフレームワークを提案する。
提案したLearn2Dissは,フレームレベルのエンコーダ表現が意味的タスクを改善する一方で,発話レベルの表現が非意味的なタスクを改善することにより,様々なタスクにおける最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:26:06 GMT)
AlgoTune: Can Language Models Speed Up General-Purpose Numerical Programs? [32.0] オープンなベンチマークでアルゴリズムを設計・実装するテストモデルを提案する。
AlgoTuneベンチマークは155のコーディングタスクで構成されている。
AlgoTunerは参照ソルバに対して平均1.72倍のスピードアップを達成する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 11:23:25 GMT)
Score-based Causal Representation Learning: Linear and General Transformations [31.8] 本稿は、識別可能性と達成可能性の両方に対処する。
スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。
結果は、構造化された合成データと画像データに関する実験によって検証される。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 22:38:11 GMT)
CD-NGP: A Fast Scalable Continual Representation for Dynamic Scenes [31.8] CD-NGPは、メモリオーバーヘッドを減らし、スケーラビリティを向上させる継続的学習フレームワークである。
トレーニングメモリ使用量は14GBに大幅に削減され、DyNeRFのストリーミング帯域幅はわずか0.4MBである。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:24:53 GMT)
CASPER: Contrastive Approach for Smart Ponzi Scheme Detecter with More Negative Samples [28.6] 我々は、ブロックチェーントランザクションにおけるスマートPonziスキーム検出を強化するために、対照的な学習フレームワークであるCASPERを提案する。
我々は、XBlockデータセット上でCASPERを評価し、100%ラベル付きデータでトレーニングすると、ベースラインをF1スコアで2.3%上回ります。
その結果、CASPERによるスマートポンジスキームの効率的かつ費用効率の高い検出の可能性を強調した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:26:02 GMT)
WSI-Agents: A Collaborative Multi-Agent System for Multi-Modal Whole Slide Image Analysis [28.5] 全スライド画像(WSI)は、デジタル病理学において不可欠であり、様々な病理学課題におけるギガピクセルの組織解析を可能にする。
マルチモーダルWSI分析のための新しい協調型マルチエージェントシステムであるWSI-Agentsを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:11:03 GMT)
Adaptive 3D Gaussian Splatting Video Streaming [28.3] 本稿では,3DGSボリュームビデオストリーミングのための革新的なフレームワークを提案する。
ハイブリット・サリエンシ・タイリングと差別化品質・モデリングを用いて、効率的なデータ圧縮と帯域幅変動への適応を実現する。
提案手法は,映像品質,圧縮効率,伝送速度など,様々な面で既存手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:45:24 GMT)
Descrip3D: Enhancing Large Language Model-based 3D Scene Understanding with Object-Level Text Descriptions [28.2] Descrip3Dは自然言語を使ってオブジェクト間の関係を明示的にエンコードする新しいフレームワークである。
グラウンド、キャプション、質問応答など、さまざまなタスクを統一した推論を可能にする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:19:16 GMT)
Estimating Quantum Execution Requirements for Feature Selection in Recommender Systems Using Extreme Value Theory [24.8] 量子解のユーザビリティを定量的に評価するために,エクストリーム値理論に基づく解を提案する。
提案手法は,広く使用されている2つのベンチマークデータセットにおいて,要求される実行回数を効果的に推定する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 13:02:06 GMT)
Towards AI Urban Planner in the Age of GenAI, LLMs, and Agentic AI [24.8] 都市計画とは別に、生成AI、大規模言語モデル、エージェントAIが出現している。
本稿では、空間的、社会的、人間中心の制約の下で、AIが土地利用構成を合成する生成的AIタスクとして都市計画を概念化する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 19:40:42 GMT)
EvoRL: A GPU-accelerated Framework for Evolutionary Reinforcement Learning [24.4] 我々はGPUアクセラレーションに最適化された最初のエンドツーエンドEvoRLフレームワークである$texttt$textbfEvoRL$$を紹介した。
このフレームワークは、環境シミュレーションやECプロセスを含む、アクセラレーター上のトレーニングパイプライン全体を実行する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:35:01 GMT)
Strategyproofness and Monotone Allocation of Auction in Social Networks [24.2] ネットワークオークションにおける戦略的安全性は、バリュエーションを真実に報告するだけでなく、近所の人をソーシャルネットワークから招待するために最善を尽くす入札者を必要とする。
このような原則が欠如しているため、単ユニット需要を持つマルチユニットネットワークオークションへの拡張でさえ、予期せぬ困難を呈している。
Invitation-Depressed Monotonicity (ID-MON) と Invitation-Promoted Monotonicity (IP-MON) の2つの分類を同定する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:05:35 GMT)
VisGuard: Securing Visualization Dissemination through Tamper-Resistant Data Retrieval [23.0] VisGuardは、メタデータリンクを可視化画像に確実に埋め込む、タンパー耐性のVIDRフレームワークである。
VisGuardのデータ検索精度、埋め込み能力、改ざんやステガナリシスに対するセキュリティにおける優れた性能に関する総合的な実験を行う。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 03:09:30 GMT)
"Before, I Asked My Mom, Now I Ask ChatGPT": Visual Privacy Management with Generative AI for Blind and Low-Vision People [22.4] 本研究は,視力・視力の低い個人に対する現在の実践と今後の設計の嗜好について,インタビュースタディを通じて検討する。
我々の発見は、プライバシ、効率、感情的なエージェンシーのバランスをとるGenAIの現在の実践の幅を明らかにします。
我々は、GenAIを通じてユーザ中心の視覚的プライバシをサポートするための実用的なデザインレコメンデーションで締めくくります。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:31:05 GMT)
A first look at License Variants in the PyPI Ecosystem [22.0] 我々は,PyPIエコシステムにおけるライセンス変種に関する実証的研究を行った。
差分に基づく手法と大規模言語モデルを活用した,効率的なライセンス変種解析のための新しいアプローチであるLV-を導入する。
LV-は計算コストを30%削減しながら0.936の精度を達成し、LV-Compatは0.98の既存の方法よりも5.2倍互換性のないパッケージを識別する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:41:33 GMT)
Resource-Efficient Affordance Grounding with Complementary Depth and Semantic Prompts [21.4] Affordanceは、エージェントが認識し、その環境から利用する機能的特性を指す。
既存のマルチモーダル・アベイランス手法は有用な情報抽出の限界に直面している。
本稿では,BiT-Align画像深度テキストアプライアンスマッピングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:21:11 GMT)
SWI: Speaking with Intent in Large Language Models [21.0] 本稿では,大規模言語モデル(LLM)におけるSWI(Singing with Intent)の概念を紹介する。
人間の心における意図的・目的的な思考をエミュレートすることにより、SWIはLLMの推論能力と生成品質を高めることを仮定する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 03:53:06 GMT)
Rejection or Inclusion in the Emotion-Identity Dynamics of TikTok Refugees on RedNote [20.9] 本研究では、中国人利用者と自己識別された「ティクトック難民」との異文化交流について検討する。
1,862の投稿と403,054のコメントのデータセットに基づいて、大きな言語モデルベースの感情分類とBERTベースのトピックモデリングを使用する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 13:38:33 GMT)
TruthLens: Explainable DeepFake Detection for Face Manipulated and Fully Synthetic Data [20.6] 本稿では,DeepFake検出のための新しいフレームワークであるTruthLensを提案する。
TruthLensは、顔操作のDeepFakesと完全なAI生成コンテンツの両方を扱う。
予測のための詳細なテキスト推論を提供する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 05:46:35 GMT)
Brain Foundation Models: A Survey on Advancements in Neural Signal Processing and Brain Discovery [20.6] 脳基礎モデル(BFM)は、計算神経科学における変革的パラダイムとして登場した。
BFMは大規模な事前学習技術を活用し、複数のシナリオ、タスク、モダリティを効果的に一般化することができる。
本稿では,BFMを初めて定義し,これらのモデルを様々なアプリケーションで構築・活用するための明確かつ簡潔なフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:40:27 GMT)
InterAct-Video: Reasoning-Rich Video QA for Urban Traffic [20.5] ディープラーニングは、質問応答(VideoQA)モデルを通じて、高度なビデオベースのトラフィック監視を実現する。
既存のVideoQAモデルは、現実世界の交通シーンの複雑さに悩まされている。
InterAct VideoQAは、トラフィック監視タスクのためのVideoQAモデルをベンチマークし、拡張するために設計された、キュレートされたデータセットである。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:30:43 GMT)
A Structure-Guided Gauss-Newton Method for Shallow ReLU Neural Network [18.1] 浅いReLUニューラルネットワークを用いて最小二乗問題を解くための構造誘導型ガウスニュートン法(SgGN)を提案する。
目的関数の最小二乗構造とニューラルネットワーク構造の両方を効果的に活用する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:33:40 GMT)
EgoEvGesture: Gesture Recognition Based on Egocentric Event Camera [17.6] 本稿では,イベントデータ処理に特化して設計された新しいネットワークアーキテクチャを提案する。
イベントカメラを用いたエゴセントリックなジェスチャー認識のための,最初の大規模データセットを構築した。
本手法は,7Mパラメータのみの未確認被験者に対して62.7%の精度を達成し,最先端手法よりも3.1%高い精度を示した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:02:46 GMT)
A Transformer-Based Conditional GAN with Multiple Instance Learning for UAV Signal Detection and Classification [17.6] 本稿では,トランスフォーマーをベースとしたGAN(Generative Adversarial Network)とMILET(Multiple Examplely Explainable Learning)を統合した新しいフレームワークを提案する。
実験の結果,DroneDetectデータセットでは96.5%,DroneRFデータセットでは98.6%の精度が得られた。
このフレームワークはまた、様々なUAVプラットフォームと飛行状態にまたがる強力な計算効率と堅牢な一般化を示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:35:45 GMT)
$k$-PCA for (non-squared) Euclidean Distances: Polynomial Time Approximation [16.9] 整数 $kgeq1$ と集合 $P$ of $n$ points in $REALd$ が与えられたとき、古典近似 $k$-PCA は Affinemph$fty distance を近似する。
実世界のデータセットに関するオープンコードと実験結果も提供されている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 14:00:50 GMT)
Error-resilient Reversal of Quantum Chaotic Dynamics Enabled by Scramblons [16.7] 量子多体系における時間の矢印は、量子情報をスクランブルし絡みを増大させるハミルトン進化に由来する。
量子情報スクランブルとカオス力学の構造について検討する。
我々の結果は、複雑な量子系の動的反転の基本的な限界を押し上げます。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 08:30:08 GMT)
Self-supervised Learning of Hybrid Part-aware 3D Representations of 2D Gaussians and Superquadrics [16.4] PartGSは、オブジェクトやシーンを解釈可能な分解に解析するために、2Dガウスとスーパークワッドリックを統合する、自己管理された部分認識再構築フレームワークである。
提案手法は,DTU,ShapeNet,および実世界のデータセットに関する広範な実験において,最先端の手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 07:32:02 GMT)
Which Experiences Are Influential for RL Agents? Efficiently Estimating The Influence of Experiences [15.8] 経験的なリプレイを伴う強化学習(RL)では、リプレイバッファに格納された経験がRLエージェントのパフォーマンスに影響を与える。
経験の影響を推定する1つの方法は、LOO法である。
ターンオーバー・ドロップアウト(PIToD)によるポリシー・イテレーションを行い,経験の影響を効率的に推定する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:31:00 GMT)
Harnessing LLMs for Document-Guided Fuzzing of OpenCV Library [14.3] VISTAFUZZは、OpenCVライブラリのドキュメント誘導ファジングに大規模な言語モデルを利用する新しい技術である。
VISTAFUZは個々の入力パラメータとそれらの間の依存関係の制約を抽出する。
VISTAFUZZがOpenCVライブラリで330のAPIを試験する際の有効性を評価し、その結果、VISTAFUZは17の新たなバグを検出し、10のバグが確認され、そのうち5つのバグが修正された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:44:01 GMT)
Diffusion Models for Time Series Forecasting: A Survey [14.3] 拡散モデルは、当初は画像合成のために開発されたが、顕著な生成能力を示している。
近年, 時系列予測 (TSF) に応用が拡大され, 有望な結果が得られた。
本調査はTSFにおける拡散モデルの最近の進展と今後の展望を詳述し、この分野の研究者の参考となる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 07:04:04 GMT)
From Semantics, Scene to Instance-awareness: Distilling Foundation Model for Open-vocabulary Situation Recognition [14.2] マルチモーダル大言語モデル(MLLM)は、強いゼロショット能力を示すが、複雑な接地状況認識(GSR)と競合する。
我々は,教師MLLMから小さなGSRモデルへの知識の伝達を利用して,その一般化とゼロショット能力を向上させる。
基礎モデルから豊富なマルチモーダル知識を蒸留する新しいフレームワークであるMIPD(Multimodal Interactive Prompt Distillation)を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:29:02 GMT)
3DGAA: Realistic and Robust 3D Gaussian-based Adversarial Attack for Autonomous Driving [14.1] 本稿では,新しい対向オブジェクト生成フレームワークである3D Gaussian-based Adrial Attack (3DGAA)を提案する。
パッチやテクスチャ最適化に依存する以前の作品とは異なり、3DGAAは幾何学的属性と外見的属性の両方を共同で摂動する。
3DGAAは検出mAPを87.21%から7.38%に減らし、既存の3D物理攻撃を著しく上回っている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 11:48:13 GMT)
Task-Agnostic Continual Prompt Tuning with Gradient-Based Selection and Decoding [13.8] 本稿では,タスク非依存推論の2つの重要な制約に対処する統合フレームワークGRIDを紹介する。
GRIDは、後方転送を改善するタスク認識復号機構を統合している。
また、より少ない情報的プロンプトを1つの集約表現に圧縮する勾配に基づくプロンプト選択戦略を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 19:15:03 GMT)
DCHM: Depth-Consistent Human Modeling for Multiview Detection [13.8] 多視点歩行者検出は通常、人間のモデリングと歩行者のローカライゼーションという2つの段階を含む。
本稿では,一貫した深度推定と多視点融合を目的としたフレームワークDCHMを提案する。
提案する超画素ワイドガウススプラッティングパイプラインは,スパースビュー,大規模,混み合ったシナリオにおいて,多視点奥行きの整合性を実現する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:37:14 GMT)
Towards Cross-modal Retrieval in Chinese Cultural Heritage Documents: Dataset and Solution [13.3] クロスモーダル検索は中国文化遺産の理解と解釈において重要な役割を担っている。
中国文化遺産に関する特別なデータセットが不足している。
そこで我々は,中国語-CLIPを微調整した学習自由な局所アライメント戦略であるLACLIPを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:40:24 GMT)
BusterX++: Towards Unified Cross-Modal AI-Generated Content Detection and Explanation with MLLM [12.3] 合成メディアのクロスモーダル検出と説明のための新しいフレームワークである textbfBusterX++ を紹介する。
本手法は,冷間開始を排除した高度強化学習(RL)ポストトレーニング戦略を取り入れたものである。
textbfGenBuster++は、最先端の画像とビデオ生成技術を利用したクロスモーダルなベンチマークである。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 14:05:33 GMT)
Generalized Linear Bandits with Limited Adaptivity [12.1] 限定適応性の制約内における一般化線形文脈帯域問題について検討する。
我々は2つのアルゴリズム, $textttB-GLinCB$ と $textttRS-GLinCB$ を提示した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:42:01 GMT)
Towards Efficient Privacy-Preserving Machine Learning: A Systematic Review from Protocol, Model, and System Perspectives [11.9] 暗号化プロトコルに基づくプライバシ保護機械学習(PPML)は、クラウドベースの機械学習サービスにおいて、ユーザのデータプライバシを保護するための有望なパラダイムとして登場した。
PPMLは、大きなオーバヘッドのオーバヘッドのために、しばしば大幅な効率とスケーラビリティのコストを発生させる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 07:45:39 GMT)
Mangosteen: An Open Thai Corpus for Language Model Pretraining [11.7] 既存の大規模コーパスは英語や言語に依存しないパイプラインに依存している。
Mangosteen: タイのDolmaパイプラインを通じて構築された47億のタイ語対応コーパスを紹介します。
パイプライントリムを202万から2500万のドキュメントにまとめた上で,SEA-HELM NLGを3から11に引き上げた。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:28:58 GMT)
Alleviating Textual Reliance in Medical Language-guided Segmentation via Prototype-driven Semantic Approximation [11.5] ProLearnは、言語誘導セグメンテーションのためのプロトタイプ駆動学習フレームワークである。
テキスト入力からのセマンティックガイダンスの近似を可能にする新しいプロトタイプ駆動セマンティック近似(PSA)モジュールを提案する。
ProLearnは、制限されたテキストが利用できる場合、最先端の言語誘導メソッドより優れている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:01:24 GMT)
GRACE: Generative Recommendation via Journey-Aware Sparse Attention on Chain-of-Thought Tokenization [11.4] GRACE (Generative Recommendation via journey-aware sparse Attention on Chain-of-thinkt tokEnization) は、シーケンシャルレコメンデーションのための新しい生成フレームワークである。
セマンティックトークン化に関する製品ナレッジグラフからの明示的な属性とユーザとイテムのインタラクションをエンコードする。
2つの実世界のデータセットの実験により、GRACEは最先端のベースラインを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:23:23 GMT)
On the Effect of Token Merging on Pre-trained Models for Code [11.0] 本研究では,同じ意味単位に属するサブトークンの隠蔽表現をマージする効果について検討する。
1つは表現を平均化することに基づく戦略であり、もう1つは学習に基づくアプローチを活用する戦略である。
これらの戦略は浮動小数点演算数を1%$から19%$に削減できることを示している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 00:48:20 GMT)
Routine: A Structural Planning Framework for LLM Agent System in Enterprise [11.0] エンタープライズ環境におけるエージェントシステムの展開は、しばしばいくつかの課題によって妨げられる。
一般的なモデルは、ドメイン固有のプロセス知識が欠如し、非組織的な計画、主要なツールの欠如、実行の安定性が低下します。
本稿では、明確な構造、明示的な命令、シームレスなパラメータパッシングを備えたマルチステップエージェント計画フレームワークであるRuleineを紹介する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:46:19 GMT)
QUTCC: Quantile Uncertainty Training and Conformal Calibration for Imaging Inverse Problems [9.9] ディープラーニングモデルは、しばしば幻覚を与え、サンプルに存在しない現実的なアーティファクトを生成します。
これは、MRIや顕微鏡検査のような科学的および医学的な逆問題に恐ろしい結果をもたらす可能性がある。
量子不確実性トレーニングと校正技術であるQUTCCを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:44:14 GMT)
Finding A Voice: Exploring the Potential of African American Dialect and Voice Generation for Chatbots [9.9] 本研究は、アフリカ系アメリカ人コミュニティに役立てるために、アフリカ系アメリカ人英語(AAE)を仮想エージェントに統合することに焦点を当てる。
我々は,大規模言語モデルと音声合成技術を用いて,テキストベースおよび音声チャットボットを開発した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 18:57:52 GMT)
On the original Ulam's problem and its quantization [9.8] 一般共鳴の下では、古典的部分線型フェルミ・ウラム加速器はその量子化とは大きく異なる挙動を示す。
量子加速器では、エネルギー成長と準エネルギースペクトルの形状との間の直接的および明示的な関係を明らかにする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:00:50 GMT)
Adaptive 3D Gaussian Splatting Video Streaming: Visual Saliency-Aware Tiling and Meta-Learning-Based Bitrate Adaptation [9.8] 3D Splatting Video(3DGS)ストリーミングは、アカデミックと業界の両方で研究ホットスポットとして浮上している。
本研究では,空間的特徴と時間的特徴を統合した適応型3DGSタイリング手法を提案する。
また、ストリーミング中の3DGS表現における空間領域の劣化と結果の2Dレンダリング画像の品質を共同で評価する3DGSビデオの品質評価フレームワークについても紹介する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 03:00:36 GMT)
ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions [9.6] VLNを運用するドローンプラットフォームについて検討し、新しいシーン認識CBFを定式化することによって安全性を向上させる。
CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モーダルな注意を持つビジョンランゲージを使用する。
ASMAは移動物体を追跡し、シーン認識CBF評価をオンザフライで実行し、追加の制約として機能する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 18:48:48 GMT)
On the robustness of modeling grounded word learning through a child's egocentric input [9.6] 本研究では,各子から自動的に書き起こされたデータに基づいて学習したマルチモーダルニューラルネットワークが,複数のネットワークアーキテクチャにまたがる単語参照マッピングを取得し,一般化可能であることを示す。
単語学習のためのマルチモーダルニューラルネットワークのロバスト性を検証する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:55:37 GMT)
A Language Model-Driven Semi-Supervised Ensemble Framework for Illicit Market Detection Across Deep/Dark Web and Social Platforms [9.5] 本稿では,微調整言語モデルと半教師付きアンサンブル学習戦略を組み合わせた階層型分類フレームワークを提案する。
深層WebページやTelegramチャネル,Subreddits,Pastebinペーストから,ドメイン固有のデータを微調整したModernBERTを用いて意味表現を抽出する。
文書構造、Bitcoinアドレス、Eメール、IP、メタデータなどの組み込みパターンなど、手動で設計した機能を導入しています。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 05:54:52 GMT)
GPI-Net: Gestalt-Guided Parallel Interaction Network via Orthogonal Geometric Consistency for Robust Point Cloud Registration [9.5] 高品質な対応の識別は、特徴ベースのポイントクラウド登録において必須のタスクである。
特徴冗長性と複雑な空間的関係のため,局所的特徴とグローバル的特徴の融合を扱うことは極めて困難である。
本稿では,地域情報とグローバル情報との補間通信を容易にする新しいGPI-Netを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:56:29 GMT)
Quantum Circuit Optimization Based on Dynamic Grouping and ZX-Calculus for Reducing 2-Qubit Gate Count [9.4] 量子回路における2キュービットゲートは、単一キュービットゲートよりもノイズの影響を受けやすい。
本稿では,動的グルーピングとZX計算に基づく量子回路最適化手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:05:32 GMT)
Emerging Trends in Software Architecture from the Practitioners Perspective: A Five Year Review [9.4] ソフトウェアアーキテクチャは、ソフトウェアシステムの設計、開発、保守において中心的な役割を果たす。
この研究は、業界の主要な8つのカンファレンスにおけるソフトウェアアーキテクチャのトレンドを5年間にわたって分析する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:16:04 GMT)
Rec-AD: An Efficient Computation Framework for FDIA Detection Based on Tensor Train Decomposition and Deep Learning Recommendation Model [9.2] 深層学習モデルは、スマートグリッドにおけるFalse Data Injection Attack(FDIA)検出に広く採用されている。
本稿では、列車分解と深層学習勧告モデル(DLRM)を統合する計算効率の良いフレームワークRec-ADを提案する。
PyTorchと完全に互換性があるため、Rec-ADはコード修正なしで既存のFDIA検出システムに統合できる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:38:56 GMT)
DFQ-ViT: Data-Free Quantization for Vision Transformers without Fine-tuning [9.2] データフリー量子化(DFQ)は、データへのアクセスを必要とせずにビジョントランスフォーマー(ViT)の量子化を可能にし、限られたリソースを持つデバイスにViTをデプロイすることを可能にする。
既存の手法では、サンプル内のグローバルな特徴とローカルな特徴を完全にキャプチャしてバランスをとることができず、結果として合成データの品質が制限される。
視覚変換用データフリー量子化パイプライン(DFQ-ViT)を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:32:04 GMT)
Measuring CEX-DEX Extracted Value and Searcher Profitability: The Darkest of the MEV Dark Forest [9.2] 我々は、CEX-DEXを同定した7,203,560人の主要なCEX-DEXサーチによって抽出された合計233.8万USDを推定した。
3人の探索者が2つのボリュームと抽出値の4分の3を捕獲し、中央集権化の傾向が明らかになった。
これらの洞察は、MEVランドスケープの最も暗い角を照らし、分散化のためのCEX-DEX仲裁の重大な意味を強調している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:27:04 GMT)
Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering Human Perceptual Variability on Facial Expressions [9.2] 本研究は、個人が同じ刺激を視る場合でも、感情分類に有意な差異を示す高知覚的変動現象について検討した。
ANNと人間の知覚の類似性に触発されて、ANN分類器に不明瞭な表情サンプルは、人間の観察者の間で異なる知覚的判断をも引き起こすという仮説を立てた。
本研究は,ANN決定境界と人間の知覚的多様性の体系的関連性を確立し,感情的解釈のパーソナライズされたモデリングに関する新たな知見を提供する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:12:13 GMT)
PLADIS: Pushing the Limits of Attention in Diffusion Models at Inference Time by Leveraging Sparsity [9.1] 拡散モデルでは、高品質な条件付きサンプルの生成に顕著な結果が示されている。
しかし、既存の方法は、しばしば追加のトレーニングや神経機能評価(NFE)を必要とする。
本稿では,スパースアテンションを生かして事前学習モデルを強化する,PLADISと呼ばれる新しい,効率的な手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:43:22 GMT)
GTPBD: A Fine-Grained Global Terraced Parcel and Boundary Dataset [9.1] GTPBDは、ピクセルレベルのバウンダリラベル、マスクラベル、パーセルラベルを含む3レベルラベルを持つ47,537の高解像度画像で構成されている。
中国と大陸横断性気候圏の7つの主要地域をカバーしている。
GTPBDは、リモートセンシング研究において重要なギャップを埋め、きめ細かい農業地形解析のための基盤となる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:15:46 GMT)
Spectator Leakage Elimination in CZ Gates via Tunable Coupler Interference on a Superconducting Quantum Processor [8.9] 本稿では,ハミルトニアンシステムの動的再構成に基づく漏洩緩和戦略を提案する。
実験により, この動的制御方式は, 広範囲な共振デチューニング範囲で10~4ドル程度の漏出率を抑制することを実証した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 08:20:44 GMT)
Motion Segmentation and Egomotion Estimation from Event-Based Normal Flow [8.9] 本稿では,イベントベース正規流を用いた動きのセグメンテーションとエゴモーション推定のための頑健なフレームワークを提案する。
提案手法は, 希薄かつ高時間分解能なイベントデータを利用して, 通常の流れ, シーン構造, 慣性測定の幾何学的制約を取り入れたものである。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:11:09 GMT)
Designing Conversational AI to Support Think-Aloud Practice in Technical Interview Preparation for CS Students [8.4] LLMを用いた技術面接実践ツールを用いて17名の被験者を対象に調査を行った。
主なデザインレコメンデーションは、技術インタビューシミュレーションのための会話型AIにおける社会的プレゼンスを促進することである。
交差点の課題やそれに対応するための潜在的戦略など,幅広い考察を考察した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 00:15:05 GMT)
Knockout: A simple way to handle missing inputs [8.1] マルチモーダルディープラーニングモデルでは、推論時にいくつかの入力が欠落している可能性があるため、デプロイが困難になる可能性がある。
現在の一般的なソリューションには、マーシャリゼーション、インプット、複数のモデルのトレーニングなどがある。
完全入力と限界分布を用いて条件分布を効率よく学習する手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 13:42:40 GMT)
Linear Relational Decoding of Morphology in Language Models [7.8] 二つのアフィン近似は、ある種の対象物関係に対する変圧器の計算によい近似であることがわかった。
s が対象トークンの中間層表現であり、W がモデル微分から導出される線形変換 Ws は、多くの関係において最終対象状態の正確な再現も可能であることを示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 14:35:15 GMT)
Deep RL Dual Sourcing Inventory Management with Supply and Capacity Risk Awareness [7.5] 介入モデルを利用して大規模最適化問題に強化学習(RL)を効率的に適用する方法を検討する。
我々は,サプライチェーン最適化におけるマルチソース多周期在庫管理問題である,現実世界の挑戦的アプリケーションに対するアプローチを実証する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:44:45 GMT)
Configurable multi-agent framework for scalable and realistic testing of llm-based agents [7.5] 大言語モデル(LLM)エージェントは複雑で文脈に敏感な振る舞いを示す。
我々は,LLMベースのシステムの現実的マルチターン評価を自動化するフレームワークであるNeoを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:51:25 GMT)
ShiftKD: Benchmarking Knowledge Distillation under Distribution Shift [7.3] 知識蒸留(KD)は、大きなモデルから小さなモデルに知識を伝達し、近年顕著な成功を収めている。
しかし、実世界のアプリケーションにおける既存のKD手法の信頼性は、特に分布シフト下では、未解明のままである。
KDを2つの分散シフトに対してベンチマークするために,統一的かつ体系的なフレームワークtextscShiftKDを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:30:46 GMT)
Amico: An Event-Driven Modular Framework for Persistent and Embedded Autonomy [7.1] 私たちは、組み込みシステムに最適化された自律エージェントを構築するためのモジュラーでイベント駆動のフレームワークであるAmicoを紹介します。
Amicoは、WebAssemblyを介して組み込みプラットフォームとブラウザ環境間で効率的に動作する、リアクティブで永続的なエージェントをサポートする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 07:21:09 GMT)
A Hybrid Framework for Subject Analysis: Integrating Embedding-Based Regression Models with Large Language Models [6.8] 大規模言語モデル(LLM)は分類や要約作業に広く用いられているが、対象分析を行う能力は乏しい。
埋め込み型MLモデルをLLMと統合するハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:32:46 GMT)
State-observation augmented diffusion model for nonlinear assimilation with unknown dynamics [6.7] データ駆動同化のための新しい生成モデルであるState-Observation Augmented Diffusion(SOAD)モデルを提案する。
実験の結果、SOADは既存のデータ駆動方式と比較してパフォーマンスが向上する可能性が示唆されている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:04:25 GMT)
Uncertainty-aware Probabilistic 3D Human Motion Forecasting via Invertible Networks [6.7] 人間の3D動作予測は、自律的なアプリケーションの実現を目的としている。
本稿では,不整合空間におけるポーズをパラメータ化するための非可逆ネットワークを導入したProbHMIを提案する。
予測モジュールは将来の潜伏分布を明示的に予測し、効果的な不確実性定量化を可能にする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:02:07 GMT)
WMNav: Integrating Vision-Language Models into World Models for Object Goal Navigation [6.5] WMNavは視覚言語モデル(VLM)を利用した新しい世界モデルベースのナビゲーションフレームワークである。
決定の結果を予測し、ポリシーモジュールへのフィードバックを提供するためにメモリを構築する。
人間のような思考プロセスに従って分解することにより、WMNavはモデル幻覚の影響を効果的に緩和する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 03:44:28 GMT)
GEMINUS: Dual-aware Global and Scene-Adaptive Mixture-of-Experts for End-to-End Autonomous Driving [6.3] GEMINUSは、Global Expert、Scene-Adaptive Experts Group、Dual-Aware Routerを特徴とするエンドツーエンドの自動運転フレームワークである。
Global Expertはデータセット全体に基づいてトレーニングされており、堅牢なパフォーマンスを備えている。
Scene-Adaptive Expertsは、対応するシーンサブセットに基づいてトレーニングされ、適応的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 03:04:28 GMT)
Investigating the Role of LLMs Hyperparameter Tuning and Prompt Engineering to Support Domain Modeling [6.3] 大規模言語モデル(LLM)は、ソフトウェアエンジニアリングタスクの自動化を強化した。
本稿では,超パラメータチューニングとプロンプトエンジニアリングがLlama 3.1モデルの精度を向上させる方法について検討する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 19:49:58 GMT)
CRAFT: A Neuro-Symbolic Framework for Visual Functional Affordance Grounding [6.3] CRAFT(CRAFT)は、可買性グラウンドの解釈のための神経象徴的枠組みである。
与えられたアクション(例えば「カット」)を可能にするシーン内のオブジェクトを識別する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:06:29 GMT)
Fraud is Not Just Rarity: A Causal Prototype Attention Approach to Realistic Synthetic Oversampling [6.2] Causal Prototype Attention (CPAC)は、クラス認識クラスタリングを促進し、潜在空間構造を改善した解釈可能なアーキテクチャである。
CPACは優れた性能を示し、93.14%のF1スコア、90.18%のリコールを達成した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:51:54 GMT)
When few labeled target data suffice: a theory of semi-supervised domain adaptation via fine-tuning from multiple adaptive starts [5.8] 半教師付きドメイン適応(SSDA)は、限られたラベル付きターゲットデータを用いて、ターゲット領域で高い予測性能を達成することを目的としている。
本研究では,構造因果モデル(SCM)に基づく理論的枠組みを構築し,ラベル付き対象データに制限がある場合のSSDA手法の性能解析と定量化を可能にする。
本稿では,複数の出発点からUDAモデルを微調整し,最適性能を選択するマルチ・アダプティブ・スタート・ファイン・チューニング(MASFT)アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:18:28 GMT)
EHPE: A Segmented Architecture for Enhanced Hand Pose Estimation [5.7] 本稿では,手ポーズ推定(EHPE)のための新しいセグメンテーションアーキテクチャを提案する。
我々は,TIPと手首の局所抽出を行い,TIP予測に対する誤差蓄積の影響を軽減する。
広く使われている2つのベンチマークの実験は、EHPEが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:21:24 GMT)
Quantum State Preparation Based on LimTDD [5.3] 本稿では,局所可逆写像図(LimTDD)に基づく量子状態の準備手法を提案する。
LimTDDはテンソルネットワークと決定図の利点を組み合わせて、量子状態の効率的な表現を可能にしている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:00:27 GMT)
A Risk Assessment Framework for Digital Identification Systems [5.3] 本稿では,デジタル識別システムにおけるリスクアセスメントフレームワークを提案する。
この作業は、製品レビューと開発、製品ポリシー、および標準の取り組みに通知することを目的としています。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:04:34 GMT)
Exploring Human-AI Complementarity in CPS Diagnosis Using Unimodal and Multimodal BERT Models [5.1] 本稿では、AudiBERTモデルがデータセットに疎結合なクラスの分類を改善したことを強調して、過去の研究を拡張した。
BERTモデルに対する同様の有意なクラスワイド改善は、感情次元の分類では見られなかった。
相関分析の結果,AudiBERTモデルとBERTモデルの両方において,より大きなトレーニングデータが高いリコール性能に大きく関連していることがわかった。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 11:47:08 GMT)
Explainable Collaborative Problem Solving Diagnosis with BERT using SHAP and its Implications for Teacher Adoption [5.1] 本研究では、転写データ中の異なるトークン化単語が、BERTモデルのCPSプロセスの分類にどのように寄与するかを検討する。
その結果, 良好な分類は, 分類決定の合理的な説明と一致しなかったことが示唆された。
分析では、分類に肯定的に寄与する刺激的な単語も同定したが、クラスには意味論的には意味がなかった。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 11:57:24 GMT)
MoViAD: A Modular Library for Visual Anomaly Detection [4.8] MoViADは、VADモデル、トレーナー、データセット、VADユーティリティへの高速で簡単にアクセスできるように設計されたライブラリである。
連続性、半教師付き、少数ショット、ノイズなど、幅広いシナリオをサポートする。
MoViADは、バックボーンの選択、堅牢な評価VADメトリクス(ピクセルレベルと画像レベル)、および効率分析に有用なプロファイリングツールを統合する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:17:35 GMT)
Enhancing POI Recommendation through Global Graph Disentanglement with POI Weighted Module [4.7] 次の関心点(POI)推奨は主に、ユーザの過去のチェックインデータと現在の状況に基づいて、将来の活動を予測する。
本稿では,新しいPOIレコメンデーションフレームワークであるGraph Disentangler with POI Weighted Module (GDPW)を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 13:16:44 GMT)
Multi-parameter Control for the $(1+(λ,λ))$-GA on OneMax via Deep Reinforcement Learning [4.5] 我々は、最先端の深層強化学習技術がいかに優れた制御ポリシーを近似できるかを示す。
我々は、既定理論推奨設定を一貫して上回る単純な制御ポリシーを導出する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 19:56:29 GMT)
Beyond the Single-Best Model: Rashomon Partial Dependence Profile for Trustworthy Explanations in AutoML [4.1] モデル多重度を説明生成に組み込んだフレームワークを提案する。
結果として生じたラショモンPDPは解釈的変動を捉え、不一致の領域を強調している。
以上より,Rashomon PDPはモデル解釈の信頼性と信頼性を向上させることが示唆された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:30:52 GMT)
Large Language Models as Medical Codes Selectors: a benchmark using the International Classification of Primary Care [4.0] 本研究では,ドメイン固有検索エンジンを用いてICPC-2符号を割り当てる大規模言語モデルの可能性を評価する。
ICPC-2コードでアノテートされたブラジルポルトガルの437の臨床的表現のデータセットが使用された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:11:10 GMT)
Positive-Unlabeled Learning for Control Group Construction in Observational Causal Inference [3.8] 治療単位と管理単位の両方へのアクセスは、治療が興味ある結果に与える影響を推定するために不可欠である。
一般的な課題は、コントロールとして明確にラベル付けされたユニットの欠如である。
我々は,信頼度が高く,未ラベルのプールから制御ユニットを識別するためのフレームワークとして,肯定的未ラベル学習(PU)を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 08:06:08 GMT)
Contour Flow Constraint: Preserving Global Shape Similarity for Deep Learning based Image Segmentation [3.6] 本稿では,2つの形状が等価な輪郭を示すという前提に基づいて,大域的な形状類似性の概念を提案する。
本稿では,この制約をディープニューラルネットワークと統合するための2つの実装を提案する。
CFSSnetは、セグメント化ノイズ汚染画像におけるロバストさと、グローバルな形状の類似性を維持する固有の能力を示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:23:18 GMT)
Learning in Strategic Queuing Systems with Small Buffers [3.4] ラウンド間の移動効果を持つゲームにおける学習結果を検討する。
ネットワークにおいて重要な例としてルータがあり、単純な学習アルゴリズムを使って、パケットを所望の目的地に届ける最良の方法を見つける。
モデルをよりリアルにし、より高いトラフィック率を可能にする、2つの重要な変更を持つシステムについて検討する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:59:48 GMT)
Benefit from Reference: Retrieval-Augmented Cross-modal Point Cloud Completion [3.3] 本稿では,新たな検索強化ポイントクラウド補完フレームワークを提案する。
中心となる考え方は、クロスモーダル検索を完了タスクに組み込んで、構造的事前情報を学ぶことである。
本手法は細粒度点雲の生成に有効であることを示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:57:41 GMT)
Forecasting Faculty Placement from Patterns in Co-authorship Networks [3.1] 我々は,教員配置を個人レベルの予測課題とみなしている。
我々は,博士課程の権威や文献学的な特徴など,従来の属性を持つ時間的共著者ネットワークを用いている。
本研究の結果は,従来の学力向上と機関的威信の尺度を超えて,ソーシャルネットワーク,職業的支持,暗黙の擁護が教員の雇用において果たす役割を裏付けるものである。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:09:23 GMT)
Caching Techniques for Reducing the Communication Cost of Federated Learning in IoT Environments [2.9] フェデレートラーニング(FL)は、複数のデバイスがデータを集中せずに共有モデルを共同でトレーニングすることを可能にする。
本稿では、不必要なモデル更新送信を減らすために、キャッシュ戦略(FIFO、LRU、プライオリティベース)を紹介する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:02:15 GMT)
Maximum Causal Entropy IRL in Mean-Field Games and GNEP Framework for Forward RL [2.9] 本稿では、離散時間強化フィールドゲーム(MFFG)における因果エントロピー強化学習(IRL)の利用について検討する。
MFFGは一般ナッシュ問題(GNEP)として非作用状態勾配のデータを生成する
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:43:59 GMT)
Kernel Based Maximum Entropy Inverse Reinforcement Learning for Mean-Field Games [2.9] 静止平均フィールドゲームにおける最大因果エントロピー逆強化学習問題を考察する。
これにより、エキスパートのデモンストレーションから直接リッチで潜在的に非線形な報酬構造を推測することができる。
提案手法の有効性を,専門家の行動を正確に再現する平均フィールドトラフィックルーティングゲームに示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 08:06:52 GMT)
Spatial-Temporal Transformer with Curriculum Learning for EEG-Based Emotion Recognition [2.8] SST-CLは、空間時間変換器とカリキュラム学習を統合した新しいフレームワークである。
力に敏感なカリキュラム学習戦略は、高強度から低強度の感情状態へのトレーニングを指導する。
3つのベンチマークデータセットの実験では、様々な感情的強度レベルにわたる最先端のパフォーマンスが示されている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:23:38 GMT)
Sampling from Gaussian Processes: A Tutorial and Applications in Global Sensitivity Analysis and Optimization [2.7] ガウス過程(GP)から後続サンプルを生成するための2つの顕著なサンプリング法を提案する。
生成したサンプルをGSA、単目的最適化、多目的最適化に適用する方法を詳述する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:36:38 GMT)
Escaping Saddle Points for Nonsmooth Weakly Convex Functions via Perturbed Proximal Algorithms [2.5] 主な結果は、非滑らか関数に対する$epsilon$-approximate Local minimumの新たな特徴に基づいている。
標準的な仮定では、摂動近位点、摂動近位勾配、摂動近位線形アルゴリズムは非滑らかな凸関数に対して$epsilon$-approximate局所最小値を求める。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:35:56 GMT)
Characterizing State Space Model (SSM) and SSM-Transformer Hybrid Language Model Performance with Long Context Length [2.0] ローカルデバイス上で連続した長文入力を処理できるマシンインテリジェンスへの需要は急速に伸びている。
従来のTransformerアーキテクチャは効率が悪く、これらのタスクには使用できないことが多い。
これにより、ステートスペースモデル(SSM)やハイブリッドといった、ほぼ直線的なスケーリングを約束する新しいアーキテクチャへのパラダイムシフトが加速した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 08:24:57 GMT)
It's Not That Simple. An Analysis of Simple Test-Time Scaling [2.0] 以前の研究では、o1のようなモデルから抽出したモデルでこのスケーリング動作を複製するシンプルなテストタイムスケーリングが提案されていた。
本稿では, 簡単なテスト時間スケーリングの解析を行い, スケーリングの挙動は最大長を強制することによるスケールダウンに起因することが確認された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 00:28:10 GMT)
Kolmogorov Arnold Network Autoencoder in Medicine [2.0] 最近の研究はKAN(Kolmogorov Arnold Networks)と呼ばれる新しいアーキテクチャを導入し、ニューラルネットワークのエッジに学習可能なアクティベーション関数を配置することで、複数のシナリオのパフォーマンスが向上したことを報告している。
本研究の目的は,複数バージョンのバニラAE(線形・畳み込み・変分法など)を,同じあるいは少ないパラメータを持つコルモゴロフ・アルノルドの値と比較することである。
心電図をモデル入力として, 再建, 生成, 復調, 着色, 異常検出の5種類の古典的AEタスクについて検討した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:50:50 GMT)
First-Principles Framework for the Prediction of Intersystem Crossing Rates in Spin Defects: The Role of Electron Correlation [1.9] 本稿では,光スピン偏光サイクルにおいて重要なステップとなる,システム間交差過程を研究するための第1原理フレームワークを提案する。
ダイヤモンド中の窒素空孔中心をケーススタディとして、我々の枠組みが電子相関効果を効果的に捉えることを実証した。
我々は、蛍光寿命の測定を行い、理論と実験の間に優れた一致を見出すことにより、予測を検証した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:35:06 GMT)
Artificial Intelligence in the Food Industry: Food Waste Estimation based on Computer Vision, a Brief Case Study in a University Dining Hall [1.9] 本研究は,プレートレベルの食品廃棄物を推定する費用対効果のコンピュータビジョンフレームワークを提案する。
4つの完全に教師されたモデルが、キャップ付き動的逆周波数損失とAdamWメトリクスを使用して訓練された。
全てのモデルが満足な性能を達成し、食品の種類ごとに、少なくとも1つのモデルがDPAに近づいたか、90%を超えた。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:21:29 GMT)
Foundational Competencies and Responsibilities of a Research Software Engineer: Current State and Suggestions for Future Directions [1.8] Research Software Engineerという用語は10年ほど前に、研究コミュニティで働く個人を表現し、ソフトウェア開発にフォーカスする手段として登場した。
スペクトルの一端では、RSEの役割は伝統的な研究の役割と似ているかもしれない。
反対に、彼らは業界のソフトウェアエンジニアに似ています。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 18:38:03 GMT)
Mind the Gap: A Review of Arabic Post-Training Datasets and Their Limitations [1.7] 本稿では,Hugging Face Hub上でのアラビア語学習後のデータセットについて概説する。
各データセットは、人気、実践的採用、信頼性とメンテナンス、ドキュメンテーションとアノテーションの品質、ライセンスの透明性、科学的貢献に基づいて厳格に評価されている。
私たちのレビューでは、タスクの多様性の制限、ドキュメントやアノテーションの欠如、コミュニティ全体の採用率の低下など、アラビアのポストトレーニングデータセットの開発において重要なギャップが明らかになった。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:30:45 GMT)
Fast Bilateral Teleoperation and Imitation Learning Using Sensorless Force Control via Accurate Dynamics Model [1.6] この研究は、力覚フィードバックによる高速遠隔操作が、力覚のない低コストマニピュレータでも実現可能であることを示した。
本手法は,正確に同定されたマニピュレータ力学に基づいて非線形項補償,速度,外力推定を統合する。
4チャンネルの双方向制御によって収集されたデータを用いて、学習ポリシーの入力と出力の両方に力情報を統合することで、模倣学習のパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 00:20:11 GMT)
PerspectiveNet: Multi-View Perception for Dynamic Scene Understanding [1.3] PerspectiveNetは、複数のカメラビューにわたる長い記述を生成するための軽量モデルである。
提案手法では,視覚エンコーダ,コンパクトコネクタモジュール,および大規模言語モデルを用いる。
結果として得られるモデルは軽量で、効率的なトレーニングと推論を確実にします。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:59:12 GMT)
The Origin of Self-Attention: From Pairwise Affinity Matrices to Transformers [1.2] 自己認識メカニズムは現在、Transformersのようなディープラーニングアーキテクチャの中心となっている。
本稿では,複数の領域にまたがる自己意識の概念的起源を追究する。
我々は、ペア関係を前提とした基盤構造は、両方のアプローチにまたがって維持されていると論じる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:51:03 GMT)
High-fidelity quantum state control of a polar molecular ion in a cryogenic environment [1.2] 低温環境下でのCaH+イオンの量子状態を制御するために量子論理分光プロトコルを用いる。
このプロトコルは分子固有のレーザーを一切必要とせず、検出方式は非破壊である。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:52:34 GMT)
Influence of High-Performance Image-to-Image Translation Networks on Clinical Visual Assessment and Outcome Prediction: Utilizing Ultrasound to MRI Translation in Prostate Cancer [1.1] 本研究では,イメージ・ツー・イメージ・トランスフォーメーション(I2I)ネットワークのコア特性について検討し,その有効性と適応性に着目した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 23:22:17 GMT)
Large Language Models Assisting Ontology Evaluation [1.1] 機能的要求によるオントロジー評価は、コスト、労働集約、エラーを起こしやすい。
自動および半自動検証によるオントロジー評価を支援する新しいフレームワークであるOE-Assistを紹介する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:13:51 GMT)
Impact of Fixing Spins in a Quantum Annealer with Energy Rescaling [1.1] 本研究では,固定スピン,有望なサイズ縮小法,およびエネルギー再スケーリングの影響について検討した。
量子アニール器を用いた数値シミュレーションと実験により、固定スピン法が量子アニール性能を向上させることを示した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:25:12 GMT)
Accelerating Hamiltonian Monte Carlo for Bayesian Inference in Neural Networks and Neural Operators [1.1] ハミルトニアン・モンテカルロ (HMC) はベイジアンネットワークの後方分布をサンプリングするための強力で正確な手法である。
本稿では,安価なVI法と正確なHMC法を組み合わせて,ニューラルネットワークの不確かさを高精度に予測するハイブリッド手法を提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 14:57:54 GMT)
Clutter Detection and Removal by Multi-Objective Analysis for Photographic Guidance [1.1] 写真のクレーターは、写真家が意図した感情やストーリーを観客に伝えるのを妨げている。
我々は、クラッタ識別と除去のための解決策とガイダンスを提供するカメラ誘導システムを開発した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:15:17 GMT)
Depthwise-Dilated Convolutional Adapters for Medical Object Tracking and Segmentation Using the Segment Anything Model 2 [1.1] 本稿では SAM2 の効率的な適応フレームワーク DD-SAM2 を提案する。
DD-SAM2にはDepthwise-Dilated Adapter (DD-Adapter)が組み込まれている。
DD-SAM2はSAM2のストリーミングメモリを完全に活用し、医療ビデオオブジェクトの追跡とセグメンテーションを行う。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 13:19:55 GMT)
Grokking at the Edge of Linear Separability [1.0] グルーキングは非単調なテスト損失行動を伴う一般化が遅れている。
問題のパラメータが臨界点に近くても、グラッキングは自然に発生する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:23:58 GMT)
LeanTree: Accelerating White-Box Proof Search with Factorized States in Lean 4 [1.0] LeanTreeは、複雑な証明状態をシンプルで独立したブランチに分解する、Lean 4言語で構築されたツールです。
予備的な結果は、ホワイトボックスが一部の設定でブラックボックスの代替よりも優れていることを示唆している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 18:50:07 GMT)
Exploring the Dynamic Scheduling Space of Real-Time Generative AI Applications on Emerging Heterogeneous Systems [0.9] リアルタイム生成AI(RTGen)ワークロードは、生成モデルの計算強度と動的実行パターンと、リアルタイム推論の制約とを結合する。
現代のエッジプラットフォームでは、不均一なSystem-on-chip(SoC)アーキテクチャが採用されている。
スケジューリング決定がワークロードのパフォーマンスに大きく影響することを示します。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 18:24:11 GMT)
BioGraphFusion: Graph Knowledge Embedding for Biological Completion and Reasoning [0.9] そこで我々は,BioGraphFusionを紹介した。
3つの重要なバイオメディカルタスクにわたる実験により、バイオグラフフュージョンは最先端のKE、GNN、アンサンブルモデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:03:42 GMT)
Discipline and Resistance: The Construction of a Digital Home for TikTok Refugees on Xiaohongshu [0.7] この研究は、TikTokが米国で禁止されそうになった後、TikTok難民がXiaohongshuにどのように移動したかを調べる。
フーコーのヘテロトピアの概念を利用して、Xiaohongshuが異文化間の議論の危機的場所になったことを実証している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 03:47:55 GMT)
The unknotting number, hard unknot diagrams, and reinforcement learning [0.7] 強化学習エージェントは、最大200回の交差を持つノットダイアグラムの 交差変化の最小シーケンスを見つけます。
我々はこれを57kノットの無作為数を決定するために使用した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 19:05:27 GMT)
Deep Learning-Based Survival Analysis with Copula-Based Activation Functions for Multivariate Response Prediction [0.7] この研究は、ディープラーニング、コプラ関数、生存分析を統合している。
このようなデータに固有の非線形依存をモデル化するために、コプラに基づくアクティベーション関数を導入する。
提案するCNN-LSTMは, 右官能データに明示的に対応し, 複雑なパターンを捉えることにより, 予測精度を向上させる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 14:35:51 GMT)
Quantum Sensing Enhancement through a Nuclear Spin Register in Nitrogen-Vacancy Centers in Diamond [0.6] 固体スピン系、特にダイヤモンド中の窒素空孔(NV)中心は、高感度で室温で作動する能力に魅力がある。
周囲のスピン浴からのノイズによる電子スピンのコヒーレンスと、この環境効果は、NV中心の感度を制限する。
核スピン支援プロトコルは、自然発生の電子と核スピン対による電子スピンコヒーレンスの向上を示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:58:59 GMT)
Retrieval-Augmented Clinical Benchmarking for Contextual Model Testing in Kenyan Primary Care: A Methodology Paper [0.6] 大規模言語モデル(LLM)は、低リソース環境での医療アクセスを改善するという約束を持っているが、アフリカのプライマリケアにおけるそれらの効果は、まだ探索されていない。
ケニアのレベル2と3の臨床ケアに焦点を当てたベンチマークデータセットと評価フレームワークを作成するための方法論を提案する。
本手法は,ケニアの全国ガイドラインに臨床質問を根拠として,地域標準との整合性を確保するためにRAG (Regegration augmented generation) を用いている。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 13:25:26 GMT)
Adversarial bandit optimization for approximately linear functions [0.6] 非滑らかかつ非滑らかな関数に対する帯域最適化問題を考える。
それぞれのトライアルでは、損失関数は線形関数の和であり、プレイヤーの選択を観察した後に選択された小さいが任意の摂動である。
その結果、最適化のために高確率の後悔を省くことが示唆された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:53:31 GMT)
DiSCO-3D : Discovering and segmenting Sub-Concepts from Open-vocabulary queries in NeRF [0.5] DiSCO-3Dは、シーンとユーザクエリの両方に対応する3Dセマンティックセマンティックセマンティクスを提供することを目指している。
我々は、教師なしセグメンテーションと弱いオープン語彙誘導を組み合わせた、ニューラルネットワーク表現に基づくDiSCO-3Dを構築した。
オープン語彙サブ概念発見においてDiSCO-3Dが有効な性能を発揮することを示す。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:46:20 GMT)
RACR-MIL: Rank-aware contextual reasoning for weakly supervised grading of squamous cell carcinoma using whole slide images [0.5] 扁平上皮癌は最も一般的な癌亜型であり、発生頻度が増加し、がん関連死亡率に大きな影響を及ぼす。
複数の解剖学にまたがる堅牢な一般化を実現するために, RACR-MILを提案する。
本モデルでは,複数のSCCデータセットにまたがる最先端性能を達成し,3~9%のグレーディング精度,クラス不均衡に対するレジリエンス,最大16%の腫瘍局所化を実現した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:50:45 GMT)
Magnetic field orientation dependence of continuous-wave optically detected magnetic resonance with nitrogen-vacancy ensembles [0.5] ダイヤモンド中の窒素空孔(NV)スピンによる連続波光検出磁気共鳴(CW-ODMR)測定は、近傍のターゲットから直流磁場を検出するために用いられる。
この技術は、異なるNV配向クラスによる共鳴が互いに重なり合うとき、磁場成分の抽出の曖昧さに悩まされる。
ここでは、低バイアス磁場を呈するNVアンサンブルに対するそのような効果に関する詳細な実験および理論的研究を行う。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 10:52:07 GMT)
Toward Responsible And Beneficial Ai: Comparing Regulatory And Guidance-Based Approaches [0.4] この論文は、欧州連合、米国、中国、IEEEの技術標準における人工知能ガバナンスフレームワークの包括的な比較分析を提示している。
本研究は,システマティックコンテンツ分析に基づく定性的な研究設計を用いて,規制哲学,実施機構,グローバルエンゲージメント戦略の特異なパターンを識別する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:44:28 GMT)
Enhancing the Clique Local Decoder to Correct Length-2 Space Errors in the Surface Code [0.3] そこで我々はClique_L2を提案する。これはCliqueベースのアプローチを拡張し、いくつかの制約を緩和し、さらに低コストな論理を組み込む。
Clique_L2は、元のClique(またはClique_L1)デコーダ上で最大8.95倍の復号化を実現する。
Clique_L2はクラスタエラーや長いエラー連鎖が発生しやすい場合、Clique_L1上で最大18.3倍のデコード帯域幅の削減を達成する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:06:31 GMT)
Large Language Models are Autonomous Cyber Defenders [0.2] 自律サイバーディフェンス(ACD)は、人工知能(AI)エージェントによるインシデント対応を自動化することを目的としている。
ほとんどのACDアプローチは単一エージェントシナリオにフォーカスし、強化学習(RL)を活用する。
大きな言語モデル(LLM)は、一般的なセキュリティコンテキストで説明可能なアクションを提供することによって、これらの問題に対処することができる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 14:35:05 GMT)
Analyzing Internal Activity and Robustness of SNNs Across Neuron Parameter Space [0.1] Spiking Neural Networks (SNN)は、従来の人工ニューラルネットワークに代わるエネルギー効率の良い代替手段を提供する。
ネットワークが有意義な活動と機能的行動を示す運用空間を特徴付ける。
本結果は,堅牢で効率的なSNNをデプロイするための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:13:53 GMT)
Spiral renormalization group flow and universal entanglement spectrum of the non-Hermitian 5-state Potts model [0.1] テンソルネットワークアルゴリズムは、まだ非エルミート理論をシミュレートできることを示す。
我々は、基底状態に符号化されたハミルトニアンの絡み目を通して、完全な境界CCFTスペクトルを再構成する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 19:46:16 GMT)
Domain-Adaptive Small Language Models for Structured Tax Code Prediction [0.1] 本稿では,製品およびサービス税体系の高次予測のためのエンコーダデコーダアーキテクチャを備えたドメイン適応型小言語モデル(SLM)を提案する。
我々は,エンコーダ-デコーダアーキテクチャに基づくSLMを用いて,逐次税制コードの生成を可能にする。
本研究では, エンコーダ・デコーダのSLMを, 構造化税コードの逐次予測に適用できることを実証した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 21:12:12 GMT)
Sports Re-ID: Improving Re-Identification Of Players In Broadcast Videos Of Team Sports [0.0] 本研究は、チームスポーツの放送ビデオにおけるプレイヤーの再識別に焦点を当てている。
具体的には、試合の特定の瞬間に異なるカメラ視点から撮影された画像において、同じプレイヤーを特定することに焦点を当てる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:10:26 GMT)
What do Large Language Models know about materials? [0.0] 大規模言語モデル(LLM)は、機械工学や材料科学の分野でますます応用されている。
材料指紋の特異性に対する語彙とトークン化の役割を強調した。
これにより、情報選択のための物質知識ベンチマークが作成され、PSPPチェーンのLCMのステップが適用できる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:02:08 GMT)
Violation of the Thermodynamic Uncertainty Relation in Quantum Collisional Models [0.0] 量子衝突モデルにおける熱力学的不確実性関係について検討する。
マルコフ力学では、非平衡定常状態状態における古典的および量子的TUR境界について検討する。
2つの非マルコフ的アプローチに対して、非マルコフ的性の次数と型は、TUR違反に決定的に影響を及ぼす。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 18:15:05 GMT)
Two-photon coupling via Josephson element I: Breaking the symmetry with magnetic fields [0.0] 対称超伝導量子干渉デバイス(SQUID)に基づく結合素子について考察する。
2光子相互作用を媒介することを示す。
SQUIDによる他の誘導相互作用は、その場でオフにすることができる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:01:15 GMT)
Towards scalable quantum computations of atomic nuclei [0.0] 我々は、位置空間の格子上のピオンレス有効場理論の量子シミュレーションにより、核の2体と3体の境界状態を解く。
我々は、ユニタリ結合クラスタ理論から成長した適応アンサッツを用いて、重陽子と3$Heの基底状態のパラメータ化を行う。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:40:46 GMT)
Towards a Proactive Autoscaling Framework for Data Stream Processing at the Edge using GRU and Transfer Learning [0.0] 実世界のDSPデータセットと合成DSPデータセットを用いて,GRUニューラルネットワークが上流の負荷を予測する方法を示す。
転送学習フレームワークは、予測モデルをオンラインストリーム処理システムに統合する。
負荷予測のための軽量GRUモデルは、実世界のデータセット上で最大1.3%のSMAPE値を記録した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:47:50 GMT)
The Perception of Phase Intercept Distortion and its Application in Data Augmentation [0.0] 位相歪みとは、知覚可能な信号の周波数間の位相関係の変化を指す。
本稿では、周波数非依存の位相シフトによって生じる位相インセプション歪みと呼ばれる位相歪みの特別な場合について論じる。
本稿では,位相知覚歪みの認識不能が機械学習,特にデータ拡張にどのように役立つかを論じる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:53:48 GMT)
Text2VR: Automated instruction Generation in Virtual Reality using Large language Models for Assembly Task [0.0] 本稿では,Large Language Models (LLM) を利用してテキスト入力から仮想命令を生成する手法を提案する。
このシステムは、テキストからタスク関連情報を抽出するLLMモジュールと、この情報をVR環境内のアニメーションデモやビジュアルキューに変換するインテリジェントモジュールの2つのコアコンポーネントから構成される。
このアプローチは、トレーニングの有効性を高め、開発オーバーヘッドを低減し、VRベースのトレーニングをよりスケーラブルで、産業的なニーズに適応できるようにします。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 07:37:48 GMT)
Subradiance generation in a chain of two-level atoms with a single excitation [0.0] 単一の励起系における鎖N2レベル原子のサブ放射に関する研究は、主に有効ハミルトニアンの複素スペクトルに焦点を当てている。
疑問は、まずはレーザーによって励起されたり駆動されたりした原子からのサブ放射がどのように現れるかである。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:21:45 GMT)
Specification and Evaluation of Multi-Agent LLM Systems -- Prototype and Cybersecurity Applications [0.0] LLMは、推論技術、コード生成、ソフトウェア実行を複数の潜在的に特殊なLLMで組み合わせることで、複雑なタスクを解決するのに使うことができる。
本稿では,マルチエージェントシステムアーキテクチャとプロトタイプを用いて,エージェントスキーマ言語と仕様の実行と評価を紹介する。
サイバーセキュリティタスクを含むテストケースは、アーキテクチャと評価アプローチの可能性を示している。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:15:06 GMT)
Semi-automated Fact-checking in Portuguese: Corpora Enrichment using Retrieval with Claim extraction [0.0] この論文はポルトガルのニュースコーパスを外部の証拠で強化するための方法論を開発し、適用し、分析する。
このアプローチはユーザの検証プロセスをシミュレートし、Large Language Models (LLM) を使用してテキストから主クレームを抽出する。
ベースコーパスの品質を高めるために、ほぼ重複検出を含むデータ検証および前処理フレームワークを導入する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 23:46:40 GMT)
RingFormer: A Neural Vocoder with Ring Attention and Convolution-Augmented Transformer [0.0] RingFormerは、リングアテンション機構を軽量変圧器、畳み込み強化変圧器(コンフォーマー)に組み込むニューラルボコーダである。
RingFormerは2つの差別者による敵の訓練で訓練されている。
実験の結果、RingFormerは既存のモデルに匹敵する、あるいは優れたパフォーマンスを実現していることがわかった。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 06:41:48 GMT)
Rigorous lower bound on dynamical exponents in gapless frustration-free systems [0.0] この研究は、フラストレーションのない量子多体系における動的指数に対する普遍的下界$zge2$を厳格に確立する。
注目すべきことに、我々の結果は古典的プロセスの力学に対する新しい境界を証明するために応用できる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 22:41:11 GMT)
Rethinking Suicidal Ideation Detection: A Trustworthy Annotation Framework and Cross-Lingual Model Evaluation [0.0] 適切な思考検出は、リアルタイムの自殺予防には不可欠だが、その進歩は2つの未解決課題に直面している。
ほとんどのデータセットは英語で書かれているが、その中でも高品質で人間による注釈付きデータはほとんど残っていない。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:54:36 GMT)
Real Time Captioning of Sign Language Gestures in Video Meetings [0.0] コンピュータビジョンを用いた手話認識は、聴覚障害者と一般人のコミュニケーション障壁を取り除くことを目的としている。
本稿では,ビデオ通話中のすべての人の字幕に手話を自動的に翻訳するブラウザエクステンションを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:01:59 GMT)
Quantum determinism and completeness restored by indistinguishability and long-time particle detection [0.0] 量子物理学における測定データは、統計的、マクロなプロセスの結果としてのみ厳密に解釈できると論じる。
シュル・オーディンガー・キャットとベルの実験により、ボルン・ルールが1つの粒子のレベルで放棄されると、リアリズム、局所性、因果関係が復元されることを示した。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:48:54 GMT)
Performance comparison of medical image classification systems using TensorFlow Keras, PyTorch, and JAX [0.0] 本稿では、Keras、PyTorch、JAXの3つの人気のあるディープラーニングフレームワークのパフォーマンスを比較し、公開されているBloodMNISTデータセットから血液細胞像を分類する。
その結果、画像の解像度やフレームワーク固有の最適化といった要因の影響を受け、フレームワーク間でのパフォーマンスのばらつきが明らかになった。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:05:14 GMT)
Patents as Knowledge Artifacts: An Information Science Perspective on Global Innovation [0.0] この章では、知識アーティファクトとしての特許に焦点を当てることで、情報科学の文脈で特許を再構築することを提案する。
この研究は、AIの発明、バイオテクノロジーの特許、および特許との国際競争という3つの分野に焦点を当て、新しいテクノロジーが発明、アクセス、道徳的説明責任という伝統的な概念にどのように挑戦しているかを考察する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:33:39 GMT)
PAT++: a cautionary tale about generative visual augmentation for Object Re-identification [0.0] オブジェクト再識別のためのアイデンティティ保存画像生成の有効性を評価する。
その結果、ドメインシフトやアイデンティティ定義機能の維持に失敗するなど、一貫したパフォーマンス劣化が見られた。
これらの知見は、生成モデルの微粒化認識タスクへの転送可能性に関する仮定に挑戦する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:01:05 GMT)
Numerical Artifacts in Learning Dynamical Systems [0.0] 多くの応用において、その解から有限の時間点でサンプリングされた力学系を学ぶ必要がある。
本稿では,選択した数値スキームが学習結果に与える影響について述べる。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 05:23:39 GMT)
Nonlinearity-assisted advantage for open Dicke-quantum batteries [0.0] エネルギー貯蔵およびエネルギー抽出の観点から量子電池の性能を解析する。
システム内の非線形性は, 電池とキャビティの結合における非線形性である。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 11:30:49 GMT)
Multiply quantized vortex spectroscopy in a quantum fluid of light [0.0] 我々は、光の偏光流体の駆動散逸特性を利用して、定常で多重の電荷を持つ渦を生成する。
我々は、量子流体や天体物理学的なコンパクト物体のような他の回転するジオメトリーにおいて、量子化された渦の共通の特徴を観察する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 08:52:52 GMT)
Multipartite entanglement from ditstrings for 1+1D systems [0.0] 1+1Dシステムの臨界点を同定する効率的な方法として,マルチパーティ・アンタングルメントが有効であることを示す。
量子イジングモデル、格子の$lambda phi4$を量子四重項で近似し、レイドバーグ原子の配列でこれを実証する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 00:44:28 GMT)
Multimodal AI for Gastrointestinal Diagnostics: Tackling VQA in MEDVQA-GI 2025 [0.0] 本稿では,ImageCLEFmed MEDVQA 2025 ChallengeのSubtask 1へのアプローチについて述べる。
VQAパイプラインのバックボーンとして,大規模なマルチモーダル基盤モデルであるFlorenceモデルを採用しています。
KASVIRデータセットの実験では、微調整されたFlorenceが公式の課題メトリクスに対して正確なレスポンスを得ることが示された。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 09:04:13 GMT)
MultiRetNet: A Multimodal Vision Model and Deferral System for Staging Diabetic Retinopathy [0.0] 糖尿病網膜症(DR)は予防可能な失明の主要な原因であり、世界中で1億人以上に影響している。
低所得層の個人は、診断前に進行するリスクが高く、主にスクリーニングへのアクセスが限られているためである。
DRステージング精度を向上させるために,網膜イメージング,社会経済的要因,および協調性プロファイルを組み合わせた新しいパイプラインであるMultiRetNetを提案する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:00:31 GMT)
Microcausality and Tunneling Times in Relativistic Quantum Field Theory [0.0] 微視的因果性は超微視的トンネル力学を阻害することを示す。
これらの結果はディラックフェルミオンとクライン=ゴードンボソンの数値計算で説明する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 17:58:48 GMT)
Likelihood-Free Gaussian Process for Regression [0.0] 確率モデルについてはほとんど知識がない場合もある。
可能性自由ガウス過程(LFGP)と呼ばれる新しい枠組みを提案する。
提案するフレームワークは、可能性のないモデリングに多大な貢献を期待する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 01:05:12 GMT)
Exact steady state of perturbed open quantum systems [0.0] 摂動下での開量子系の正確な定常状態を決定するための一般的な非摂動的手法を提案する。
この手法を3つの非自明な開量子系に適用する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 16:45:13 GMT)
ElectriQ: A Benchmark for Assessing the Response Capability of Large Language Models in Power Marketing [0.0] 電力マーケティングのカスタマーサービスは、問い合わせ、苦情、サービス要求に対処する上で重要な役割を果たす。
GPT-4oやClaude 3のような大きな言語モデル(LLM)は強力な汎用能力を示しているが、この分野で必要とされる専門知識や共感は欠如している。
電力マーケティングシナリオにおけるLCMの評価と拡張を目的とした最初のベンチマークであるElectriQを紹介する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 02:28:51 GMT)
Disparities in Peer Review Tone and the Role of Reviewer Anonymity [0.0] 本研究は2つの主要な雑誌において8万件以上のレビューを調査する。
レビューのトーン、感情、支持的な言語が、著者の人口層によってどのように異なるかを明らかにする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 20:19:21 GMT)
Coordinate Heart System: A Geometric Framework for Emotion Representation [0.0] コーディネートハート(Coordinate Heart、CHS)は、人工知能アプリケーションにおける感情表現のための幾何学的なフレームワークである。
我々は8つのコア感情を単位円上の座標として位置づけ、複雑な感情状態の数学的計算を可能にした。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:38:30 GMT)
Combining Cost-Constrained Runtime Monitors for AI Safety [0.0] ランタイムモニタを単一の監視プロトコルに組み合わせる方法について検討する。
我々のフレームワークは、望ましくない振る舞いを検出するために既存のモニターを組み合わせるための原則化された方法論を提供する。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 04:28:40 GMT)
Bridging the Digital Divide: Small Language Models as a Pathway for Physics and Photonics Education in Underdeveloped Regions [0.0] この記事では、低消費電力デバイス上でオフラインで実行できる、Small Language Models(SLM)互換のAIツールが、スケーラブルなソリューションを提供する方法について説明する。
仮想チューターとして機能し、ネイティブ言語の教育を可能にし、インタラクティブな学習をサポートすることで、SLMは訓練された教育者の不足と実験室へのアクセスに対処するのに役立つ。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 15:03:53 GMT)
Backtranslation and paraphrasing in the LLM era? Comparing data augmentation methods for emotion classification [0.0] 本稿では,特にGPTのような大規模言語モデルを用いて,NLPのデータ拡張手法を体系的に検討する。
バックトランスレーションとパラフレーズ化は、ゼロと数ショットの例に匹敵する、あるいはさらに良い結果をもたらす。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 12:23:20 GMT)
Automated Safety Evaluations Across 20 Large Language Models: The Aymara LLM Risk and Responsibility Matrix [0.0] Aymara AIは、カスタマイズされたポリシーに基づく安全評価の生成と管理のためのプログラムプラットフォームである。
自然言語の安全ポリシーを敵のプロンプトに変換し、人間の判断に対して検証されたAIベースのレーダを使用してモデル応答をスコアする。
論文参考訳(メタデータ) (Sat, 19 Jul 2025 18:49:16 GMT)