DynaSaur: Large Language Agents Beyond Predefined Actions [127.0] 既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作を動的に生成・構成できるLLMエージェントフレームワークを提案する。
このフレームワークでは、汎用プログラミング言語で書かれたプログラムを生成し実行することで、エージェントが環境と対話する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:22:32 GMT)
MiniCPM4: Ultra-Efficient LLMs on End Devices [126.2] MiniCPM4は、エンドサイドデバイス向けに明示的に設計された高効率な大規模言語モデル(LLM)である。
この効率性は、モデルアーキテクチャ、トレーニングデータ、トレーニングアルゴリズム、推論システムという4つの重要な側面において、体系的な革新を通じて達成します。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:23:02 GMT)
One Flight Over the Gap: A Survey from Perspective to Panoramic Vision [117.8] 本研究は,最近のパノラマ視覚技術,特にパノラマ・パノラマ・パノラマ適応についてレビューする。
最初にパノラマ画像パイプラインと投影法を再検討し、構造的格差を分析するのに必要な事前知識を構築した。
これに基づいて、300以上の研究論文から得られた20以上の代表的タスクを2次元でカバーする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:10 GMT)
Few-step Flow for 3D Generation via Marginal-Data Transport Distillation [104.8] 数段階の3次元流体蒸留のための新しいフレームワーク MDT-dist を提案する。
我々のアプローチは、事前訓練されたモデルを蒸留して、Marginal-Data Transportを学習する、という第一の目的に基づいて構築されている。
提案手法は,A800におけるA800の9.0倍,6.5倍の速度で0.68s (1 Step x2) と0.94s (2 Step x2) のレイテンシを実現するため,各流れトランスのサンプリングステップを25から2に短縮する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:24:31 GMT)
3D and 4D World Modeling: A Survey [104.2] 世界モデリングはAI研究の基盤となり、エージェントが住んでいる動的な環境を理解し、表現し、予測することができるようになった。
我々は、ビデオベース(VideoGen)、占領ベース(OccGen)、LiDARベース(LiDARGen)のアプローチにまたがる構造的分類法を導入する。
実践的応用について議論し、オープン課題を特定し、有望な研究方向性を明らかにする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:58 GMT)
Chain-of-Reasoning: Towards Unified Mathematical Reasoning in Large Language Models via a Multi-Paradigm Perspective [98.3] CoR(Chain-of-Reasoning)は、複数の推論パラダイムを統合する新しい統合フレームワークである。
CoRは異なる推論パラダイムによって複数の潜在的な答えを生成し、それらをコヒーレントな最終解へと合成する。
実験の結果,CoR-Math-7Bは現在のSOTAモデルより有意に優れていた。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:01:21 GMT)
One-Embedding-Fits-All: Efficient Zero-Shot Time Series Forecasting by a Model Zoo [82.7] Time Series Foundation Models (TSFM) はゼロショット予測を大幅に進歩させた。
異なるモデルが異なる時間パターンの好みを示すため、単一のTSFMが普遍的に優れているものはない。
本稿では,各モデルの予測強度を特徴付けるZooCastを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:34:54 GMT)
Specification-Guided Repair of Arithmetic Errors in Dafny Programs using LLMs [79.7] 本稿では,障害の局所化と修復のためのオラクルとして形式仕様を用いたDafny用のAPRツールを提案する。
プログラム内の各ステートメントの状態を決定するために、Hoareロジックの使用を含む一連のステップを通じて、障害をローカライズします。
また, GPT-4o miniが74.18%と高い修理成功率を示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:15:12 GMT)
From Editor to Dense Geometry Estimator [77.2] 密度幾何予測のための拡散変換器(DiT)アーキテクチャに基づく高度な編集モデルを適用するフレームワークである textbfFE2E を紹介する。
FE2EはETH3Dデータセットで35%以上のパフォーマンス向上を実現し、100$times$データでトレーニングされたDepthAnythingシリーズを上回っている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:58:50 GMT)
Refined Risk Bounds for Unbounded Losses via Transductive Priors [67.1] 線形回帰の逐次変分を2乗損失、ヒンジ損失の分類問題、ロジスティック回帰で再検討する。
我々の鍵となるツールは、慎重に選択された導出先を持つ指数重み付けアルゴリズムに基づいている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:25:07 GMT)
Short-video Propagation Influence Rating: A New Real-world Dataset and A New Large Graph Model [66.9] クロスプラットフォームのショートビデオデータセットには、117,720の動画、381,926のサンプル、中国最大の5つのプラットフォームにわたる535のトピックが含まれている。
大グラフモデル(LGM)NetGPTは、多種多様なグラフ構造データを強力な推論能力とLarge Language Models(LLM)の知識で橋渡しすることができる
我々のNetGPTは,短ビデオ伝搬グラフの理解と解析が可能であり,短ビデオの長期伝搬の影響を予測できる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:10:37 GMT)
EQ-Knight: A Memory-Augmented LLM Agent for Strategic Affective Gaming in Debt Recovery [65.3] 債権者の利益を守るために感情戦略を優先するエージェントであるEQ-Knightを提案する。
ナイーブな共感中心のボットとは異なり、EQ-Knightは感情記憶とゲーム理論推論を統合している。
回復率を損なうことなく、譲歩損失を32%減少させる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:06:27 GMT)
Human Motion Video Generation: A Survey [65.2] 本稿では,10以上のサブタスクを含む人間のモーションビデオ生成について,詳細な調査を行う。
生成プロセスの5つの重要なフェーズ - 入力、モーションプランニング、モーションビデオ生成、リファインメント、アウトプット - について詳述する。
特に、人間のモーションビデオ生成の強化における大規模言語モデルの可能性について論じる最初の調査である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:39:21 GMT)
Deliberate Planning of 3D Bin Packing on Packing Configuration Trees [65.1] オンライン3D Bin Packing Problem (3D-BPP) は産業自動化に広く応用されている。
我々は,新しい階層表現,パッキング構成木(PCT)の学習を通じて,オンライン3D-BPPの実用性を高めることを提案する。
PCTは、ディープ強化学習(DRL)に基づくパッキングポリシー学習を支援するビンパッキングの状況と行動空間について、本格的な記述である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:00:39 GMT)
R2C2-Coder: Enhancing and Benchmarking Real-world Repository-level Code Completion Abilities of Code Large Language Models [62.2] 我々は,R2C2-Coderを提案し,大規模言語モデルの実世界のリポジトリレベルのコード補完能力を向上し,ベンチマークする。
R2C2-Coderには、コードプロンプトコンストラクションメソッドR2C2-Enhanceと、よく設計されたベンチマークR2C2-Benchが含まれている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:26:35 GMT)
Explicit and Implicit Data Augmentation for Social Event Detection [61.9] 社会的事象の検出には、ソーシャルメディアから重要な出来事を特定し分類することが含まれる。
ソーシャルイベント検出のための拡張フレームワーク(SED-Aug)を提案する。
SED-Augは、明示的なテキストベースと暗黙的な特徴空間拡張を組み合わせて、データの多様性を高め、堅牢性をモデル化する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:26:24 GMT)
EvoEmo: Towards Evolved Emotional Policies for LLM Agents in Multi-Turn Negotiation [61.6] 既存のLarge Language Models (LLM)エージェントは、そのような交渉における感情の機能的役割をほとんど見落としている。
本稿では,交渉における動的感情表現を最適化する進化的強化学習フレームワークであるEvoEmoを紹介する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:23:58 GMT)
Depth-Breadth Synergy in RLVR: Unlocking LLM Reasoning Gains with Adaptive Exploration [61.4] Reinforcement Learning with Verifiable Reward (RLVR)は、大規模言語モデルにおける推論能力をアンロックするための強力なパラダイムとして登場した。
RLVRの完全なポテンシャルは、モデルがサンプリングできる最も難しい深さと、単一のイテレーションで消費されるインスタンスの数という2つの未探索の次元によって妨げられていることを示す。
本稿では,多段ロールアウトによる難易度再重み付けを行うDARS(Difficulty Adaptive Rollout Smpling)を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:21:27 GMT)
Fantastic Pretraining Optimizers and Where to Find Them [59.6] AdamWは長い間、言語モデルの事前訓練において支配的な勾配だった。
行列ベースの行列の高速化はモデルスケールに逆比例する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:22:04 GMT)
Synthesizing Sheet Music Problems for Evaluation and Reinforcement Learning [58.9] 本稿では,音楽理論に基づくシート音楽問題の合成について提案する。
テキストと視覚の両方で検証可能なシート音楽質問を生成するデータ合成フレームワークを提案する。
RLVRの合成データを活用することで、Qwen3-8B-BaseとQwen2.5-VL-InstructはSSMR-Benchの改良を実現した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:42:17 GMT)
IPA: An Information-Preserving Input Projection Framework for Efficient Foundation Model Adaptation [56.7] 隠れた空間の情報を明示的に保存する特徴認識型プロジェクションフレームワークであるIPAを提案する。
IPAはLoRAとDoRAを一貫して改善し、平均1.5ポイントの精度でコモンセンス推論を行う。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:10:01 GMT)
MARS: Unleashing the Power of Variance Reduction for Training Large Models [56.7] 深層ニューラルネットワークのための統合トレーニングフレームワークを提案する。
我々は,事前条件付き勾配最適化を利用するMARSの3つの例を紹介する。
その結果,MARSの実装はAdamより一貫して優れていた。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:37:05 GMT)
Virtual Fitting Room: Generating Arbitrarily Long Videos of Virtual Try-On from a Single Image -- Technical Preview [55.8] 任意の長さの仮想試行ビデオを生成する新しいビデオ生成モデルであるVirtual Fitting Room (VFR)を紹介した。
我々のVFRは、自動回帰・セグメント・バイ・セグメンテーション生成プロセスとして、長いビデオ生成タスクをモデル化する。
我々のVFRは、局所的な滑らかさと、様々な動作下でのグローバルな時間的一貫性の両方を兼ね備えた、ミニスケールの仮想試行ビデオを生成する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:55 GMT)
DirectorLLM for Human-Centric Video Generation [54.6] ビデオ内の人間のポーズを整理するために,大規模言語モデル(LLM)を用いた新しいビデオ生成モデルである DirectorLLM を紹介する。
我々のモデルは、人間の動きの忠実度を高め、迅速な忠実度を向上し、被写体自然性を向上する上で、既存のものよりも優れています。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:09:59 GMT)
Context Reasoner: Incentivizing Reasoning Capability for Contextualized Privacy and Safety Compliance via Reinforcement Learning [53.9] 安全とプライバシの問題を文脈整合性(CI)理論に従って文脈整合性問題に定式化する。
CIフレームワークの下では、当社のモデルを3つの重要な規制基準 – EU AI ActとHIPAA – に整合させています。
我々は、安全・プライバシー基準の遵守を高めつつ、文脈推論能力を高めるためにルールベースの報酬を持つ強化学習(RL)を採用している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:31:24 GMT)
TriCLIP-3D: A Unified Parameter-Efficient Framework for Tri-Modal 3D Visual Grounding based on CLIP [52.8] 3Dビジュアルグラウンドティングは、人間の指示に基づいて現実世界の3D環境における視覚情報を理解するための具体的エージェントである。
既存の3Dビジュアルグラウンド法は、異なるモダリティの異なるエンコーダに依存している。
本稿では,3つのモードすべてを処理するために,統合された2次元事前学習型マルチモーダルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:42:44 GMT)
On YouTube Search API Use in Research [52.0] 同一クエリを12週間にわたって実行することで,APIの動作を分析する。
その結果,検索終端はクエリ間で非常に可変な結果を返すことがわかった。
以上の結果から,より短い人気ビデオが優先される可能性が示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:06:46 GMT)
FADE: A Dataset for Detecting Falling Objects around Buildings in Video [51.0] 建物から落下する物体は、大きな衝撃力によって歩行者に重傷を負わせる可能性がある。
FADEには18のシーンから1,881本のビデオがあり、8つの落下物カテゴリー、4つの気象条件、4つのビデオ解像度がある。
動作情報を効果的に活用するFADE-Netと呼ばれる新しい物体検出手法を開発した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:38:49 GMT)
SelfAug: Mitigating Catastrophic Forgetting in Retrieval-Augmented Generation via Distribution Self-Alignment [49.9] 大規模言語モデル(LLM)は、様々なタスクを理解し実行する能力を通じて自然言語処理に革命をもたらした。
教師付き微調整、特にRetrieval-Augmented Generation (RAG)のシナリオでは、しばしば破滅的な忘れが生じる。
本稿では,モデルのセマンティック分布を保存するために,入力シーケンスロジットをアライメントする自己分布アライメント手法であるSelfAugを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:50:47 GMT)
RepoDebug: Repository-Level Multi-Task and Multi-Language Debugging Evaluation of Large Language Models [49.8] LLM(Large Language Models)は、コードのデバッグに非常に熟練している。
本稿ではマルチタスクおよび多言語リポジトリレベルのコードデバッグデータセットであるRepo Debugを紹介する。
最高のパフォーマンスモデルである Claude 3.5 Sonnect は,リポジトリレベルのデバッグでは依然としてうまく動作しない。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:13:21 GMT)
Sample-efficient Integration of New Modalities into Large Language Models [48.8] マルチモーダル基礎モデルはいくつかのモダリティを処理できる。
本稿では,大規模言語モデルへのサンプル効率改善手法を提案する。
SEMIは、新しいモダリティを数秒で統合することで、サンプル効率を大幅に向上することがわかった。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:41:59 GMT)
Conditional Video Generation for High-Efficiency Video Compression [48.3] 本稿では,条件付き拡散モデルを利用した映像圧縮フレームワークを提案する。
具体的には、映像圧縮を条件生成タスクとして再構成し、生成モデルがスパース信号から映像を合成する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:36:19 GMT)
Set Block Decoding is a Language Model Inference Accelerator [48.1] SBD(Set Block Decoding)は,NTP(Next token Prediction)とマスク付きトークン予測(MATP)を単一のアーキテクチャに統合することにより,生成を高速化する,シンプルで柔軟なパラダイムである。
SBDは、従来の加速法との大きな違いである複数の、必ずしも連続しない未来のトークンを並列にサンプリングすることを可能にする。
我々は,SBDにより,生成に必要な前方通過回数を3~5倍削減し,同等のNTPトレーニングを達成できることを実証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:02:39 GMT)
Delta Activations: A Representation for Finetuned Large Language Models [47.5] デルタアクティベーション(Delta Activations)はベクトル埋め込みとして微調整モデルを表現する手法である。
この表現はドメインとタスクによる効果的なクラスタリングを可能にし、モデルランドスケープの構造を明らかにします。
Delta Activationsは、数ショットの微調整によってタスクを埋め込むことができ、さらにモデル選択とマージにその使い方を探求する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:06 GMT)
Improved 3D Scene Stylization via Text-Guided Generative Image Editing with Region-Based Control [47.1] ビューの整合性を保ちながら3次元スタイリゼーションの質を高める技術を導入し、任意の地域制御型スタイル転送を提供する。
本手法は,ソースビューのマルチビュー2D画像を用いて,初期3次元表現を再学習することで,スタイリゼーションを実現する。
本稿では,市販モデルのセグメンテーションマスクを用いて,異なる画像領域にスタイルを適用可能なマルチRegion Importance-Weighted Sliced Wasserstein Distance Lossを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:01:01 GMT)
RTQA : Recursive Thinking for Complex Temporal Knowledge Graph Question Answering with Large Language Models [46.8] RTQAは、トレーニングを必要とせずにTKGに対する推論を強化するための新しいフレームワークである。
問題をサブプロブレムに分解し、LLMとTKGの知識を用いてボトムアップを解き、フォールトトレランスを改善するためにマルチパス応答アグリゲーションを利用する。
MultiTQとTimelineKGQAベンチマークの実験では、Hits@1が"Multiple"と"Complex"のカテゴリで大幅に改善され、最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:25:01 GMT)
Why Can't I See My Clusters? A Precision-Recall Approach to Dimensionality Reduction Validation [46.5] 次元性低減(DR)は高次元データを可視化するために広く使われており、しばしば期待されるクラスタ構造を明らかにすることを目的としている。
既存のDR品質メトリクスは、予測の信頼性(ある程度)やクラスタ構造の品質を評価しますが、期待される構造が欠けている理由を説明していません。
本稿では,DR過程を類似性関係をモデル化した関係フェーズと,データの投影を行うマッピングフェーズの2つのフェーズに分割した最近のフレームワークを活用することで,この問題に対処する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:53:16 GMT)
ARTalk: Speech-Driven 3D Head Animation via Autoregressive Model [45.0] 音声駆動型3D顔アニメーションは、任意の音声クリップから3Dヘッドモデルのリアルな唇の動きと表情を生成することを目的としている。
本研究では,高度に同期した唇の動きと,リアルな頭部ポーズと瞬きをリアルタイムに生成する自己回帰モデルを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:17:20 GMT)
StreetViewAI: Making Street View Accessible Using Context-Aware Multimodal AI [44.4] 初めてアクセス可能なストリートビューツールであるStreetViewAIを紹介します。
StreetViewAIでは、視覚障害者は目的地を事実上検査したり、オープンワールドで探索したり、200億以上の画像やGSVが配備されている100以上の国を仮想的にツアーすることができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:56:50 GMT)
OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.9] OneSearchは、eコマース検索のためのエンドツーエンドの生成フレームワークである。
クアイシュ州の複数の検索シナリオにまたがって展開され、数百万のユーザにサービスを提供し、毎日数千万のPVを発生させている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:41:26 GMT)
Hallo4: High-Fidelity Dynamic Portrait Animation via Direct Preference Optimization and Temporal Motion Modulation [43.8] 人中心アニメーションに適した直接選好最適化を提案する。
第二に、提案した時間運動変調は、分解ミスマッチを解消する。
実験では, 口唇音の同期, 表情の鮮明さ, 体の動きのコヒーレンスをベースライン法より明らかに改善した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:13:25 GMT)
Peekaboo, I See Your Queries: Passive Attacks Against DSSE Via Intermittent Observations [43.4] DSSEは動的暗号化されたデータベースのセキュアな検索を可能にするが、固有の情報漏洩に悩まされている。
我々は新しいユニバーサルアタックフレームワークであるPeekabooを提案し、コア設計は検索パターンの推測に依存している。
FMA の 30% に対して,検索パターン回復のための 0.9 調整されたランドインデックス,90% のクエリ精度を実現した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:47:22 GMT)
A Generative Foundation Model for Chest Radiography [43.3] ChexGenは、胸部ラジオグラフのテキスト、マスク、バウンディングボックス誘導合成のための統一的なフレームワークを導入した、生成的視覚言語基盤モデルである。
ChexGenは、これまでで最大の胸部X線データセットで事前訓練された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:53:58 GMT)
Shuffling Heuristic in Variational Inequalities: Establishing New Convergence Guarantees [43.0] シャッフル戦略は変分不等式問題を解決するのに有効であることを示す。
この文脈におけるシャッフル法に対する最初の理論的収束推定を提供する。
多様なベンチマーク変動不等式問題に関する広範な実験により,本研究の成果を検証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:00:18 GMT)
The Telephone Game: Evaluating Semantic Drift in Unified Models [41.7] Unified Consistency Framework for Unified Models (UCF-UM)
UCF-UMは数世代にわたってI2TとT2Iを交換し、セマンティックドリフトを定量化する。
結果は,標準I2TおよびT2I評価の補足として循環整合性を強調した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:53:52 GMT)
A Foundation Model for Chest X-ray Interpretation with Grounded Reasoning via Online Reinforcement Learning [41.3] DeepMedix-R1は、胸部X線(CXR)の解釈のための総合医療用FMである。
クエリ毎に、画像のローカルリージョンに関連付けられた回答と推論ステップの両方を生成する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:00:04 GMT)
Vehicle-to-Infrastructure Collaborative Spatial Perception via Multimodal Large Language Models [41.0] 大型言語モデル (MLLM) の限界を克服するために, 軽量でプラグアンドプレイの鳥眼ビュー (BEV) インジェクションコネクタを提案する。
レイトレーシングはRGB、LiDAR、GPS、無線信号データを様々なセンシングシナリオで生成するために開発された。
シミュレーションの結果,提案したBEVインジェクションフレームワークは全タスクのパフォーマンスを継続的に改善していることがわかった。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:57:47 GMT)
MEDUSA: A Multimodal Deep Fusion Multi-Stage Training Framework for Speech Emotion Recognition in Naturalistic Conditions [41.0] MEDUSAは4段階のトレーニングパイプラインを備えたマルチモーダルフレームワークである。
DeepSERは、Deep-Modal Transformer fusionの新たな拡張である。
Manor MixUpは、さらなるレギュラー化のために使用される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:18:13 GMT)
Stitching the Story: Creating Panoramic Incident Summaries from Body-Worn Footage [40.1] 最初の応答者は、インシデントシーンを記録し、イベント後の分析をサポートするために、ボディウーンカメラを広く採用している。
この研究は、ボディカメラの映像をインシデントシーンを要約した情報パノラマ画像に変換するコンピュータビジョンパイプラインを提示する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:27:53 GMT)
Vision-based Manipulation from Single Human Video with Open-World Object Graphs [40.0] この研究は、人間のビデオから視覚に基づく操作スキルを学ぶためのオブジェクト中心のアプローチを示す。
ORIONは1つのRGBまたはRGB-Dビデオからオブジェクト中心の操作計画を抽出することでこの問題に対処するアルゴリズムである。
オープンワールドにおける1つの人間のビデオから学習する際のORIONの有効性を実証し、平均成功率74.4%を観察した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:23:37 GMT)
DEXOP: A Device for Robotic Transfer of Dexterous Human Manipulation [40.0] 周操作は、人間の操作を感知し記録し、実際のロボットへのデータの転送可能性を最大化する、ロボットデータ収集のパラダイムである。
我々は,このパラダイムを,自然環境における多種多様な操作タスクのためのリッチな感覚(視覚+触覚)データ収集能力の最大化を目的とした,受動的手外骨格であるDEXOPに実装する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:57:13 GMT)
Formal Verification of Local Robustness of a Classification Algorithm for a Spatial Use Case [39.1] 衛星部品の故障は費用がかかり、対処が難しい。
衛星に直接、障害検出のためのハイブリッドAIベースのシステムを組み込むことで、この負担を大幅に軽減することができる。
我々は、AIベースのアルゴリズムで使用されるニューラルネットワークモデルの局所的堅牢性を検証するために、公式な検証ツールであるMarabouを使用している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:19:53 GMT)
Multimodal Feature Fusion Network with Text Difference Enhancement for Remote Sensing Change Detection [37.0] MMChangeは画像とテキストのモダリティを組み合わせて精度とロバスト性を高めるマルチモーダルRSCD手法である。
画像特徴のセマンティックな制限を克服するために、視覚言語モデル(VLM)を用いてバイテンポラル画像の意味的記述を生成する。
テキスト差分拡張(TDE)モジュールは細粒度のセマンティックシフトをキャプチャし、モデルを意味のある変化へと導く。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:39:18 GMT)
Inverse IFEval: Can LLMs Unlearn Stubborn Training Conventions to Follow Real Instructions? [37.0] 大規模言語モデル(LLM)は多様なタスクにおいて高いパフォーマンスを達成するが、認知慣性を示すことが多い。
Inverse IFEvalは、モデルの能力を測定し、トレーニングによるバイアスをオーバーライドし、敵の指示に従うためのベンチマークである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:03:02 GMT)
Auto-Regressive vs Flow-Matching: a Comparative Study of Modeling Paradigms for Text-to-Music Generation [36.1] 最先端システム(SOTA)は、トレーニングデータセット、モデリングパラダイム、アーキテクチャ選択など、多くの面で大きく異なる。
本研究はモデリングパラダイムにのみ焦点をあてる。
自動回帰デコーディングと条件付きフローマッチングという,最も一般的な2つのモデリングパラダイムを比較した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:54:13 GMT)
FFHFlow: Diverse and Uncertainty-Aware Dexterous Grasp Generation via Flow Variational Inference [36.0] 本稿では,多種多様な頑健なマルチフィンガーグリップを生成するフローベース変分フレームワークFFHFlowを提案する。
流れの可逆性と正確な確率を利用して、FFHFlowは部分的な観測において不確実性を形成する。
また,不確実性を考慮したランキング戦略を定式化することにより,識別的把握評価器をフロー可能性と統合する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:07:56 GMT)
Towards Cognitively-Faithful Decision-Making Models to Improve AI Alignment [35.5] 対比較から認知に忠実な意思決定プロセスを学ぶための公理的アプローチを提案する。
提案したモデルが,人間のペアによる意思決定の事前モデルと一致しているか,あるいは精度を超越しているかを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:29 GMT)
A Comprehensive Survey on Trustworthiness in Reasoning with Large Language Models [35.5] Long-CoT推論は、言語理解、複雑な問題解決、コード生成など、さまざまなタスクに進歩している。
信頼に値する推論の5つの中核的な側面 – 真理性、安全性、堅牢性、公正性、プライバシ – に重点を置いています。
全体として、推論技術は、幻覚の緩和、有害なコンテンツ検出、堅牢性の改善を通じてモデルの信頼性を高めることを約束する一方で、最先端の推論モデルは、安全性、堅牢性、プライバシにおける同等またはそれ以上の脆弱性に悩まされることが多い。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:12:31 GMT)
Fuzzy to Clear: Elucidating the Threat Hunter Cognitive Process and Cognitive Support Needs [34.8] この研究は、脅威ハンターの生きた経験を理解するための人間中心のアプローチを強調した。
我々は、脅威ハンターが脅威ハンティングセッション中にどのようにメンタルモデルを構築し、洗練するかのモデルを導入する。
私たちは、それらをサポートするツールを強化するために、5つの実行可能な設計提案を提案します。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:25 GMT)
Foundations and Models in Modern Computer Vision: Key Building Blocks in Landmark Architectures [34.5] 本報告では,コンピュータビジョンにおけるキーデザインパターンの進化を,影響力のある6つの論文から分析する。
本稿では,残差接続を導入したResNetについて概説する。
画像パッチのシーケンスにトランスフォーマーアーキテクチャを適用し,新たなパラダイムを確立したビジョントランスフォーマー(ViT)について検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:47:30 GMT)
Causality-guided Prompt Learning for Vision-language Models via Visual Granulation [33.9] CLIPの視覚的顆粒化による因果誘導型テキストプロンプト学習法を提案する。
筆者らのCaPL法は,特に細粒度データセットにおいて,最先端のプロンプト学習法よりも優れていた。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:40:41 GMT)
Larger Is Not Always Better: Exploring Small Open-source Language Models in Logging Statement Generation [33.5] 自動ロギングステートメント生成のための大規模言語モデル(LLM)には、プライバシとリソースの問題がある。
本稿では,ロギングステートメントの自動生成のための小規模なオープンソース言語モデル(SOLM)を評価するための大規模な実証的研究について述べる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:06:40 GMT)
POET: Supporting Prompting Creativity and Personalization with Automated Expansion of Text-to-Image Generation [33.0] 最先端のビジュアル生成AIツールは、クリエイティブなタスクの初期のアイデア段階において、ユーザーを支援する大きな可能性を秘めている。
多くの大規模テキスト・ツー・イメージシステムは幅広い適用性のために設計されており、創造的な探索を制限するような従来の出力が得られる。
テキストから画像への生成モデルにおいて,同質性の次元を自動的に検出するリアルタイム対話型ツールPOETを紹介する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:45:36 GMT)
NE-PADD: Leveraging Named Entity Knowledge for Robust Partial Audio Deepfake Detection via Attention Aggregation [32.9] 部分的オーディオディープフェイク検出(PADD)のための新しい手法であるNE-PADDを提案する。
我々は2つのパラレルブランチ、SpeechNER(SpeechNER)とPADD(PADD)を通して名前付きエンティティの知識を活用する。
実験により,提案手法は既存のベースラインよりも優れており,PADDに名前付きエンティティ知識を組み込むことの有効性が証明された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:33:00 GMT)
Improving Vessel Segmentation with Multi-Task Learning and Auxiliary Data Available Only During Model Training [32.7] コントラストのない肝MRIにおける血管分割のためのマルチタスク学習フレームワークを提案する。
これは、トレーニング中にのみ利用可能な補助コントラスト強化MRIデータを利用して、注釈付きトレーニング例の必要性を減らす。
脳腫瘍のセグメンテーションのためのモデルを強化するこのアプローチの検証は、その利点を異なる領域にまたがって確認する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:01:27 GMT)
GeoArena: An Open Platform for Benchmarking Large Vision-language Models on WorldWide Image Geolocalization [32.3] 画像のジオローカライゼーションは、地球上のどこでも撮影された画像の地理的位置を予測することを目的としている。
現在の評価手法には2つの大きな制限がある。
グローバルな画像位置決めタスク上でLVLMを評価するための,最初のオープンプラットフォームであるGeoArenaを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:52:04 GMT)
Can Language Models Handle a Non-Gregorian Calendar? [32.2] 我々は,オープンソース言語モデルが日本語カレンダーをいかにうまく扱えるかを評価する。
カレンダー変換が可能なモデルもあるが,日本語中心のモデルでさえ,日本語のカレンダ算術に苦戦している。
本研究は,文化固有のカレンダー理解に優れたLMを開発することの重要性を強調した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:52:00 GMT)
Learning Active Perception via Self-Evolving Preference Optimization for GUI Grounding [31.6] 視覚言語モデル(VLM)は近年,視覚知覚と言語推論の橋渡しにおいて大きな進歩を遂げている。
マルチステップ認識機能を持つVLMを段階的に支援する自己進化型フレームワークであるLASERを提案する。
提案手法はモンテカルロの品質評価とインターセクション・オーバー・ユニオン(IoU)に基づく地域品質評価を統合し,高品質な嗜好データ構築における精度と多様性を両立させる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:17:01 GMT)
Large Language Models for Cryptocurrency Transaction Analysis: A Bitcoin Case Study [31.3] 大規模言語モデル(LLM)はこれらのギャップに対処する可能性を秘めているが、この分野におけるそれらの能力はほとんど解明されていない。
本稿では,LLMを実世界の暗号トランザクショングラフに適用することにより,この仮説を検証する。
これには、新しい人間可読グラフ表現フォーマット、LLM4TG、接続強化トランザクショングラフサンプリングアルゴリズム、CETraSが含まれる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:46:37 GMT)
HLG: Comprehensive 3D Room Construction via Hierarchical Layout Generation [31.0] 階層レイアウト生成(HLG)は,微細な3次元シーン生成のための新しい手法である。
HLGは、大規模な家具配置から複雑なオブジェクト配置まで、シーンレイアウトを精錬する、粗大できめ細かな階層的アプローチを採用した最初の企業である。
既存の手法と比較して,現実的な屋内シーンの生成において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:06:17 GMT)
Fitting Image Diffusion Models on Video Datasets [30.7] 本稿では,連続ビデオフレームに存在する時間的帰納バイアスを利用して拡散訓練を改善する,シンプルで効果的なトレーニング戦略を提案する。
本手法はHandCoデータセット上で評価し,手動物体間相互作用が高密度時間的コヒーレンスを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:04:54 GMT)
False Sense of Security: Why Probing-based Malicious Input Detection Fails to Generalize [30.4] 大きな言語モデル(LLM)は有害な命令に従うことができ、その優れた能力にもかかわらず深刻な安全上の懸念を生じさせる。
近年の研究は、LLMの内部表現における悪意と良性入力の分離性の研究に、探索に基づくアプローチを活用している。
その結果,調査者は意味的有害性よりも表面的なパターンを学習する,という仮説が得られた。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:15:55 GMT)
Defending LVLMs Against Vision Attacks through Partial-Perception Supervision [30.0] 近年、LVLM(Large Vision Language Models)の悪意ある注入や摂動画像に対する脆弱性に関する重大な懸念が提起されている。
DPS(Deefense through partial-Perception Supervision)と呼ばれるブラックボックス・トレーニング不要な手法を提案する。
DPSでは、攻撃時に部分的なイメージ理解に基づいて応答を調整することができ、クリーンな入力に対して元の応答を確実に維持することができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:43:22 GMT)
World Model Implanting for Test-time Adaptation of Embodied Agents [29.5] 具体的AIにおいて、永続的な課題は、エージェントが広範なデータ収集や再トレーニングを必要とせずに、新しいドメインへの堅牢な適応を可能にすることである。
本稿では、大規模言語モデルの推論能力と、独立に学習されたドメイン固有世界モデルを組み合わせた世界モデル埋め込みフレームワーク(WorMI)を提案する。
我々は、VirtualHomeとALFWorldのベンチマークでWorMIを評価し、いくつかのLSMベースのアプローチと比較して、ゼロショットと少数ショットのパフォーマンスが優れていることを示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:32:16 GMT)
Forewarned is Forearmed: Pre-Synthesizing Jailbreak-like Instructions to Enhance LLM Safety Guardrail to Potential Attacks [29.5] 新しい攻撃は、大きな言語モデルが目に見えない悪意のある命令を認識できないことを露呈する。
組込み空間分布解析を利用してジェイルブレイクのような命令を生成する合成フレームワークIMAGINEを提案する。
Qwen2.5, Llama3.1, Llama3.2の攻撃成功率は, 有効性を損なうことなく著しく低下した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:23:46 GMT)
A Survey of Graph Retrieval-Augmented Generation for Customized Large Language Models [29.5] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)をカスタマイズするための有望なソリューションとして登場した。
本調査は,GraphRAG(Graph-based Retrieval-Augmented Generation)の系統的解析である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:24:19 GMT)
Straighter Flow Matching via a Diffusion-Based Coupling Prior [29.4] フローマッチング(StraightFM)のストレートトラジェクトリを提案する。
分散レベル全体からの結合戦略でトラジェクトリを直線化する。
画素空間と潜伏空間の実験結果から、StraightFMは5段階以内で魅力的なサンプルが得られることが示された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:24:04 GMT)
Balancing Signal and Variance: Adaptive Offline RL Post-Training for VLA Flow Models [29.1] 本稿では,VLA(Vision-Language-Action)フローモデルに対するオフラインRLポストトレーニング目標を提案する。
次に、効率よく実現可能なオフラインRL微調整アルゴリズム -- Adaptive Reinforced Flow Matching (ARFM) を誘導する。
ARFMは優れた一般化、堅牢性、少数ショット学習、継続的な学習性能を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:48:43 GMT)
Skywork UniPic 2.0: Building Kontext Model with Online RL for Unified Multimodal Model [28.6] We present UniPic2-SD3.5M-Kontext, which is that a state-of-the-art image generation and editing while seamlessly extended into an unified multimodal framework。
我々のアプローチは、SD3.5-Mediumのアーキテクチャ変更と、高品質なデータによる大規模事前トレーニングから始まります。
UniPic2-SD3.5M-Kontextは、生成パラメータが大幅に大きいモデルよりも強力な画像生成と編集能力を示している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:00:17 GMT)
TEn-CATS: Text-Enriched Audio-Visual Video Parsing with Multi-Scale Category-Aware Temporal Graph [28.5] 本稿では,Bi-Directional Text Fusion (BiT) モジュールと Category-Aware Temporal Graph (CATS) モジュールを組み合わせた手法を提案する。
まず、BiTモジュールを通して、音声および視覚的モダリティの特徴に対してセマンティックインジェクションと動的キャリブレーションを行う。
次に,CATSモジュールを意味的伝播と接続に利用し,時間とともに正確な意味情報伝達を可能にする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:32:40 GMT)
Self-adaptive Dataset Construction for Real-World Multimodal Safety Scenarios [28.0] 本稿では,安全シナリオのための画像指向型自己適応データセット構築手法を提案する。
画像指向手法を用いて、誘導応答を伴う35k画像テキストペアからなるRMSデータセットを自動生成する。
様々なタスクに対する大規模な実験は、提案した画像指向パイプラインの有効性を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:13:59 GMT)
Towards a Unified View of Large Language Model Post-Training [27.9] モダン言語モデルの訓練後モデルには2つの主要なトレーニングデータがある。
Reinforcement Learning (RL) や Supervised Fine-Tuning (SFT) のようなアプローチは矛盾せず、単一の最適化プロセスの例であることを示す。
異なるトレーニング信号を動的に選択するアルゴリズムであるHybrid Post-Training (HPT)を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:40:33 GMT)
Meta-Inverse Reinforcement Learning for Mean Field Games via Probabilistic Context Variables [27.8] 逆強化学習は、専門家のデモンストレーションから報酬関数を推測するフレームワークを提供する。
深層潜伏変数MFGモデルと関連するIRL法を提案する。
提案手法は,基礎となる文脈に関する事前知識を必要とせずに,異なるが構造的に類似したタスクから報酬を推測することができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:13:11 GMT)
PromptEnhancer: A Simple Approach to Enhance Text-to-Image Models via Chain-of-Thought Prompt Rewriting [27.5] 本稿では,テキスト・ツー・イメージ(T2I)モデルのための新規で普遍的なプロンプト書き換えフレームワークであるPromptEnhancerを紹介する。
モデル固有の微調整やイメージ・リワードスコアのような暗黙の報酬信号に依存する従来の手法とは異なり、我々のフレームワークはリライターをジェネレータから切り離す。
Hunyuan Image 2.1モデルの実験では、PromptEnhancerは幅広い意味的および構成的課題において画像テキストアライメントを大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:46:10 GMT)
TokUR: Token-Level Uncertainty Estimation for Large Language Model Reasoning [27.4] 大きな言語モデル(LLM)は印象的な能力を示しているが、その出力品質は相容れないままである。
token-level Uncertainty Estimation framework for Reasoning (TokUR)を提案する。
我々の手法は、既存の不確実性推定方法より一貫して優れている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:49:52 GMT)
Large Language Models with Temporal Reasoning for Longitudinal Clinical Summarization and Prediction [27.0] 大規模言語モデル (LLM) は臨床テキスト要約の可能性を示唆している。
大規模言語モデル(LLM)の最近の進歩は,臨床テキスト要約の可能性を示唆している。
本研究は,いくつかの最先端のオープンソースLLMを体系的に評価する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:36:17 GMT)
Your Trust, Your Terms: A General Paradigm for Near-Instant Cross-Chain Transfer [26.6] セキュアで高性能なクロスチェーン決済を実現するために、Delegated Ownership Transfer(DOT)パラダイムを導入します。
DOTは、キーオーナシップをバリューオーナシップから切り離して、セキュアで高性能なクロスチェーン支払いを可能にする。
プロトタイプでは、クロスチェーン支払いは16.70ms以下で、原子スワップは33.09ms以下で完了しており、コストはLayer-1ガス料金から完全に切り離されている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:33:14 GMT)
EvoCoT: Overcoming the Exploration Bottleneck in Reinforcement Learning [25.5] 検証可能な報酬付き強化学習(RLVR)は,大規模言語モデル(LLM)を学習後,推論能力を向上させる上で有望なパラダイムとなっている。
本稿では,2段階チェーン・オブ・シークレット(CoT)推論最適化に基づく自己進化型カリキュラム学習フレームワークであるEvoCoTを提案する。
EvoCoTは、CoT軌道の自己生成と検証によって探索空間を制約し、その後徐々に短くし、制御された方法で空間を拡張する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:41:36 GMT)
Unveiling the Role of Data Uncertainty in Tabular Deep Learning [25.5] 本稿では,最近の表型DL手法の有効性を説明する上で,データ不確実性の概念の重要性を強調した。
これらのメカニズムを分離することにより、最近のパフォーマンス改善の統一的な理解を提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:49:59 GMT)
Visible Yet Unreadable: A Systematic Blind Spot of Vision Language Models Across Writing Systems [25.5] 先進視覚言語モデル(VLM)がこのレジリエンスを共有しているかどうかを検討する。
我々は、異なる筆記システムにまたがる2つの心理物理学的なベンチマークを構築した。
クリーンテキスト上での強いパフォーマンスにもかかわらず、現代のVLMはこれらの摂動の下で深刻な低下を見せている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:35:32 GMT)
MixNet: A Runtime Reconfigurable Optical-Electrical Fabric for Distributed Mixture-of-Experts Training [25.4] Mixture-of-Expert(MoE)モデルは、名前のついた専門家を1つのトークンベースで選択的に活性化することで、従来のモデルより優れている。
このゲート計算は、事前に決定できない動的通信を生成する。
我々は、分散MoEトレーニング中にトポロジ再構成をアンロックするMixNetと呼ばれる第一種システムを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:37:22 GMT)
Durian: Dual Reference-guided Portrait Animation with Attribute Transfer [25.3] デュリアンは、与えられた参照画像からターゲットポートレートへゼロショットで顔属性を転送した肖像画アニメーションビデオを生成するための最初の方法である。
本稿では,像像と属性画像の両方から空間的特徴を拡散モデルの認知過程に注入する2つの参照ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:53:03 GMT)
SLENet: A Guidance-Enhanced Network for Underwater Camouflaged Object Detection [25.3] UCODタスクと、このドメイン用に設計されたベンチマークデータセットであるDeepCamoを紹介する。
また,UCODの新しいフレームワークであるセマンティック・ローカライゼーション・エンハンスメント・ネットワーク(SLENet)を提案する。
DeepCamoデータセットと3つのベンチマークCODデータセットの実験により、SLENetのSOTAメソッドよりも優れたパフォーマンスが確認された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:44:32 GMT)
VoxRole: A Comprehensive Benchmark for Evaluating Speech-Based Role-Playing Agents [25.3] 我々は、音声ベースのRPCAsの評価に特化して設計された最初の総合ベンチマークであるVoxRoleを紹介する。
ベンチマークは13335のマルチターンダイアログで構成され、261本の映画に1228のユニークなキャラクターから65.6時間のスピーチがある。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:03:46 GMT)
A Synthetic-to-Real Dehazing Method based on Domain Unification [24.8] 分布変化により,実世界の画像に適用した場合,深層学習に基づく画像復調法の性能が悪影響を及ぼす。
本稿では, クリーンなデータの完全収集から, 実際のドメインと合成ドメイン間のデハージング作業のずれが生じる可能性があることを明らかにする。
そこで本研究では,合成ドメインと合成ドメインの関係を統一する,ドメイン統一に基づく合成から現実への脱ヘイズ手法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:39:22 GMT)
RadioDiff-Loc: Diffusion Model Enhanced Scattering Congnition for NLoS Localization with Sparse Radio Map Estimation [24.7] 本稿では条件拡散モデルに基づくNLoSローカライゼーションのための新しい生成推論フレームワークを提案する。
回折された電磁エネルギーが建物縁付近に集中する物理的知見を活用することにより,サンプリング戦略を開発する。
我々は、最大観測強度に対して全サンプルRSS値を正規化し、パワー不変の無線マップの構築を可能にした。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:23:45 GMT)
Separate to Collaborate: Dual-Stream Diffusion Model for Coordinated Piano Hand Motion Synthesis [24.4] コーディネートされたバイマニュアルピアノ演奏の合成は大きな課題となっている。
音声入力からピアノ演奏のための同期ハンドジェスチャーを生成するために設計されたデュアルストリームニューラルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:25:53 GMT)
Crossing the Species Divide: Transfer Learning from Speech to Animal Sounds [24.2] 自己教師型音声モデルは,音声処理において顕著な性能を示したが,その非音声データに対する効果は未検討のままである。
我々は,HuBERT,WavLM,XEUSなどのモデルが,分類群全体にわたって動物の音の豊かな潜伏表現を生成可能であることを示す。
その結果, 微調整された生体音響事前学習モデルと競合し, ノイズローバスト事前学習装置の影響を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:39:05 GMT)
TRUST-VL: An Explainable News Assistant for General Multimodal Misinformation Detection [24.0] マルチモーダルな誤報は、生成的AIによって増幅される社会的脅威を増大させる。
様々な歪みタイプが共通の推論能力を共有し、タスク固有のスキルも必要としています。
本稿では,汎用マルチモーダル誤情報検出のための統一的で説明可能な視覚言語モデルであるTRUST-VLを紹介する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:43 GMT)
Explicit Learning and the LLM in Machine Translation [23.8] 本研究は,文法書に記載された説明を用いて,LLMが新しい言語を学ぶ能力について考察する。
しかし、この能力は、学習する言語現象の複雑さが増加するにつれて低下する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:20:43 GMT)
SMooGPT: Stylized Motion Generation using Large Language Models [23.5] スティル化運動生成はコンピュータグラフィックスにおいて活発に研究されており、特に拡散モデルの急速な進歩の恩恵を受けている。
既存の研究では、動作スタイルの転送や条件付き動作生成によってこの問題に対処しようとしている。
本稿では,身体部分のテキスト空間を中間表現として利用し,SMooGPTを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:41:18 GMT)
Facts Fade Fast: Evaluating Memorization of Outdated Medical Knowledge in Large Language Models [23.3] 大規模言語モデルは、医学研究者や医師を支援することで、医療を強化する可能性を示している。
静的トレーニングデータへの依存は、新しい研究や開発と共に医療レコメンデーションが進化する際の大きなリスクである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:17:50 GMT)
Quantized Large Language Models in Biomedical Natural Language Processing: Evaluation and Recommendation [23.0] 本研究では,12種類の大規模言語モデルに対する量子化の影響を系統的に評価した。
量子化はGPUメモリの要求を最大75%減らし、様々なタスクでモデル性能を保っていることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:18:45 GMT)
NER Retriever: Zero-Shot Named Entity Retrieval with Type-Aware Embeddings [23.0] アドホックな名前付きエンティティ検索のためのゼロショット検索フレームワークであるNER Retrieverを提案する。
固定スキーマや微調整モデルに頼る代わりに、我々の手法は大きな言語モデルの内部表現に基づいている。
本研究では、内部表現、特に中間層トランスブロックの値が、一般的に使用されるトップ層埋め込みよりもより効果的に、きめ細かい型情報をエンコードしていることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:42:23 GMT)
Structure Transfer: an Inference-Based Calculus for the Transformation of Representations [20.9] 主要な未解決問題は、表現変換と選択を駆動する表現システム技術をどのように考案するかである。
本稿では,多種多様RS間の表現変換を可能にする構造伝達という新しい計算法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:55:32 GMT)
Oruga: An Avatar of Representational Systems Theory [20.9] 本稿では, 表象システム理論(RST)の諸側面の実装として, オルガ(スペイン語:caterpillar, a symbol of transformation)を提案する。
Orugaは、RTTの概念に対応するデータ構造コアと、コアと通信する言語と、構造転送と呼ばれる手法を用いて変換を生成するエンジンから構成される。
本稿では,Orugaのコアおよび言語の概要について概説する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:21:57 GMT)
BOSC: A Backdoor-based Framework for Open Set Synthetic Image Attribution [20.9] 合成画像属性は、生成モデルによって生成された画像の起源をトレースする問題に対処する。
本稿では,バックドアアタックの概念に依存する,BOSCと呼ばれる合成画像のオープンセット属性の枠組みを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:49:14 GMT)
Connections between reinforcement learning with feedback,test-time scaling, and diffusion guidance: An anthology [20.8] 本研究では,人的フィードバックによる強化学習,内部フィードバックによる強化学習,テスト時間スケーリングとの親密な関係と等価性を明らかにする。
我々は、アライメントと報酬指向拡散モデルに対する再サンプリングアプローチを導入し、明示的な強化学習技術の必要性を脇取りする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:29:38 GMT)
Fundamental bounds on efficiency-confidence trade-off for transductive conformal prediction [20.8] トランスダクティブ手法における信頼性と効率の基本的なトレードオフを実証する。
非自明な信頼度は、不確実性のあるデータに対する予測セットサイズが指数関数的に増加することを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:49:58 GMT)
Rapid Word Learning Through Meta In-Context Learning [20.4] In-context learNing Of Words(Minnow)のためのメタトレーニング手法を提案する。
この方法は、いくつかの文脈内例から単語の使用例を生成するために言語モデルを訓練する。
Minnowでスクラッチからトレーニングするモデルは、人間のスケールの子供指向言語で、強力な数発の単語学習を可能にしている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:58:09 GMT)
AnomalyLMM: Bridging Generative Knowledge and Discriminative Retrieval for Text-Based Person Anomaly Search [20.1] テキストベースの人物異常検索にLMMを利用する最初のフレームワークであるAnomalyLMMを提案する。
PABデータセットについて厳密な評価を行い、テキストベースの人物異常検索のための唯一の公開ベンチマークである。
実験により,提案手法の有効性が示され,競争基準を+0.96%のRecall@1精度で上回った。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:34:46 GMT)
An Interactive Framework for Finding the Optimal Trade-off in Differential Privacy [20.0] プライバシ保護分析の標準として差分プライバシー(DP)を導入し,プライバシ保証とモデル性能の基本的なトレードオフを導入する。
特に,ユーザに対して,仮説上のトレードオフ曲線を提示し,好みのトレードオフを選択するよう依頼する。
実世界の6つのデータセットにまたがる差分的ロジスティック回帰と深層移動学習実験により,本手法が最適プライバシー・正確性トレードオフに収束していることが判明した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:02:10 GMT)
Is an Ultra Large Natural Image-Based Foundation Model Superior to a Retina-Specific Model for Detecting Ocular and Systemic Diseases? [19.8] RETFoundおよびDINOv2モデルは眼疾患検出および全身性疾患予知タスクのために評価された。
RETFoundは、心不全、梗塞、虚血性脳梗塞の予測において、すべてのDINOv2モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:35:48 GMT)
Instance-Wise Adaptive Sampling for Dataset Construction in Approximating Inverse Problem Solutions [19.5] 本稿では,コンパクトで情報的なトレーニングデータセットを構築するための事例適応型サンプリングフレームワークを提案する。
本研究では,2種類の事前構造の下での逆散乱問題における手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:04:57 GMT)
Integrating Intermediate Layer Optimization and Projected Gradient Descent for Solving Inverse Problems with Diffusion Models [19.4] 逆問題(IP)はノイズの観測から信号を再構成する。
DMはIPを解くための強力なフレームワークとして登場し、優れた再構築性能を実現している。
既存のDMベースの手法は、重い計算要求や準最適収束といった問題に頻繁に遭遇する。
これらの課題に対処するために,DMILOとDMILO-PGDという2つの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:37:08 GMT)
Small Changes, Large Consequences: Analyzing the Allocational Fairness of LLMs in Hiring Contexts [19.2] 大規模言語モデル(LLM)は、採用のような高度なアプリケーションにますますデプロイされている。
本研究は、実際の人事利用を反映した2つのタスクを通して、LLMベースの採用システムの割当公平性を検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:53:10 GMT)
ActiveGAMER: Active GAussian Mapping through Efficient Rendering [18.5] ActiveGAMERは3Dガウススプラッティング(3DGS)を利用して高品質でリアルタイムなシーンマッピングと探索を実現するアクティブマッピングシステムである。
我々のシステムは、最先端のレンダリングと光度精度と完全性で環境を自律的に探索し、再構築する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:32:43 GMT)
Between a Rock and a Hard Place: Exploiting Ethical Reasoning to Jailbreak LLMs [18.5] 本稿では,TLMの倫理的推論を利用して安全を回避するためのフレームワークであるTRIAL(Trolley-problem Reasoning for Interactive Attack Logic)を紹介する。
TRIALは、オープンソースモデルとオープンソースモデルの両方に対して、高いジェイルブレイク成功率を示している。
モデルが高度な推論能力を得るにつれ、そのアライメントの性質は必然的に、より秘密のセキュリティ脆弱性を悪用することを可能にするかもしれない。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:53:20 GMT)
Promptception: How Sensitive Are Large Multimodal Models to Prompts? [18.5] プロンプトのフレーズや構造が微妙に変化しても、最大15%の精度のずれにつながる可能性がある。
本稿では,LMMの迅速な感度評価のための体系的フレームワークであるPromptceptionを紹介する。
この結果から,プロプライエタリなモデルの方が高速な表現に敏感であり,オープンソースモデルはより安定しているが,ニュアンスや複雑な表現に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:13:06 GMT)
PianoBind: A Multimodal Joint Embedding Model for Pop-piano Music [18.4] ソロピアノ音楽はジャンル、ムード、スタイルにまたがる豊かな意味情報を伝達する。
汎用的な音楽表現モデルは、同質のピアノ音楽において微妙な意味的区別を捉えるのにしばしば苦労する。
ピアノ固有のマルチモーダルな関節埋め込みモデルPianoBindを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:43:53 GMT)
Distinct Lifetimes for $X$ and $Z$ Loop Measurements in a Majorana Tetron Device [18.1] 超伝導体-半導体ヘテロ構造におけるテトロン量子ビットデバイスのハードウェア実現と測定について述べる。
デバイスアーキテクチャには、2つの平行超伝導ナノワイヤが含まれており、トポロジカルフェーズに調整すると4つのマヨラナゼロモード(MZM)をサポートする。
2つの異なるリードアウト干渉計は、超伝導構造を一連の量子ドットに接続することによって形成される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:57:54 GMT)
Transplant Then Regenerate: A New Paradigm for Text Data Augmentation [18.0] 大規模言語モデル(LLM)は、その"知識の出現"能力によって、テキスト拡張を強化している。
LLMを利用した新しいテキスト拡張パラダイムであるLMTransplantを提案する。
我々は,LMTransplantをテキスト関連タスク間で評価し,既存のテキスト拡張手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:58:17 GMT)
Privacy Preservation and Identity Tracing Prevention in AI-Driven Eye Tracking for Interactive Learning Environments [17.9] 視線追跡技術は、神経発達障害を理解し、人の身元を追跡するのに役立つ。
本稿では、AIによる視線追跡の教育的メリットを保ちながら、アイデンティティのバックトラッキングを防止するために設計された人間中心のフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:08:06 GMT)
MedVista3D: Vision-Language Modeling for Reducing Diagnostic Errors in 3D CT Disease Detection, Understanding and Reporting [17.6] 臨床における放射線診断の誤り-読影誤り、意図的失明、コミュニケーションの失敗--の既往である。
MedVista3Dは3次元CT解析のためのマルチスケールのセマンティック・エンリッチ・ビジョン言語事前学習フレームワークである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:28:44 GMT)
Autoformalization in the Wild: Assessing LLMs on Real-World Mathematical Definitions [17.6] 本稿では,ウィキペディアとarXivの論文から定義を収集する,自動形式化のための2つの新しいリソースを紹介する。
我々は、Isabelle/HOLに定義を形式化する能力を解析し、LLMの範囲を評価した。
以上の結果から, miniF2Fのような既存のベンチマークと比較して, 定義がより困難であることが判明した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:43:14 GMT)
Plot'n Polish: Zero-shot Story Visualization and Disentangled Editing with Text-to-Image Diffusion Models [17.5] Plot'n Polishは、一貫したストーリー生成を可能にするゼロショットフレームワークであり、様々なレベルの詳細でストーリーの可視化をきめ細かいコントロールを提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:34 GMT)
Pitfalls of Evidence-Based AI Policy [17.3] 目的がエビデンスベースのAIポリシーであるなら、第一の規制目標は、AIリスクを特定し、研究し、検討するプロセスを積極的に促進することである、と我々は主張する。
これを促進するために、ブラジル、カナダ、中国、EU、韓国、英国、米国がそれぞれ、さらなる証拠調査政策を採用する実質的な機会を持っていることを示すための15の規制目標について論じる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:42:50 GMT)
Transferable Belief Model on Quantum Circuits [17.0] 伝達可能な信念モデルはデンプスター・シェーファー理論の意味論的解釈である。
本稿では,量子AIモデルの基本情報表現の新しい視点を紹介する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:10:45 GMT)
Topotein: Topological Deep Learning for Protein Representation Learning [16.9] タンパク質表現学習(PRL)にトポロジカルディープラーニングを適用した包括的フレームワークTopoteinを紹介する。
PCCは、各レベルで幾何情報を保持しながら、残基から二次構造から完全なタンパク質まで、複数の階層レベルでタンパク質を表現している。
TCPNetは、これらの階層構造を横断するSE(3)-等価メッセージパッシングを採用し、より効果的なマルチスケール構造パターンのキャプチャを可能にする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:58:20 GMT)
IC-Cache: Efficient Large Language Model Serving via In-context Caching [16.8] IC-Cacheは、ライブ機能拡張によるサービス効率の向上を可能にするキャッシュシステムである。
IC-CacheはLCMのスループットを1.4~5.9倍改善し、応答品質を損なうことなく28~71%のレイテンシを低下させることを示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:20:55 GMT)
The dynamic interplay between in-context and in-weight learning in humans and neural networks [16.4] In-context Learning" (ICL) は、ニューラルネットワークに固有のIWLと共存可能な、根本的に異なる学習特性を持たせることができることを示す。
我々の研究は、創発的なICLが、そのネイティブなIWLと共存可能な、根本的に異なる学習特性を持つニューラルネットワークをどのように装備できるかを示している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:30:44 GMT)
CANDY: Benchmarking LLMs' Limitations and Assistive Potential in Chinese Misinformation Fact-Checking [16.1] CANDYは,中国語の誤情報の事実チェックにおいて,大規模言語モデル(LLM)の機能と限界を評価するために設計されたベンチマークである。
分析の結果,現在のLCMでは,チェーン・オブ・シークレットの推論や数発のプロンプトによって強化された場合でも,正確な事実チェックの結論が得られないことがわかった。
LLMは事実チェックには信頼性が低いが,本研究の結果から,シナリオにおける補助ツールとして展開する際の人的パフォーマンス向上の可能性が示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:33:44 GMT)
AudioCodecBench: A Comprehensive Benchmark for Audio Codec Evaluation [16.0] MLLM(Multimodal Large Language Models)は、音声や音楽に広く応用されている。
意味のみのテキストトークンとは異なり、音声トークンはグローバルな意味的コンテンツをキャプチャし、きめ細かい音響的詳細を保存する必要がある。
本稿では,意味的および音響的トークンの適切な定義を提供し,体系的な評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:25:57 GMT)
CoDiff: Conditional Diffusion Model for Collaborative 3D Object Detection [15.6] 協調型3次元物体検出は、自律運転の分野において重要な役割を担っている。
推定誤差と時間遅延のため、エージェント間の情報の融合はしばしば空間的および時間的ノイズを伴う特徴表現をもたらす。
我々は,新しいロバストな協調認識フレームワークであるCoDiffを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:53:35 GMT)
BIDO: A Unified Approach to Address Obfuscation and Concept Drift Challenges in Image-based Malware Detection [15.4] BIDOは、難読化とコンセプトドリフトの両方に対する堅牢性を高めるために設計されたハイブリッドイメージベースのマルウェア検出器である。
具体的には,画像特徴の識別能力を向上させるために,局所的特徴選択モジュールを導入する。
第3に,特徴のコンパクト性を確保するために,同一のラベルを持つサンプルを近い位置から抽出する学習可能なメトリクスを設計する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:48:03 GMT)
EHVC: Efficient Hierarchical Reference and Quality Structure for Neural Video Coding [15.3] EHVCは、3つの重要なイノベーションを持つ効率的な階層型ニューラルビデオである。
EHVCは最先端のNVCよりもはるかに優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:31:12 GMT)
LADSG: Label-Anonymized Distillation and Similar Gradient Substitution for Label Privacy in Vertical Federated Learning [15.2] VFL(Vertical Federated Learning)のための統一的で軽量な防衛フレームワークであるLADSG(Lallel-Anonymized Defense with Substitution Gradient)を提案する。
LADSGはまず、ソフト蒸留により真のラベルを匿名化し、セマンティックな露出を減らす。
6つの実世界のデータセットに対する大規模な実験により、LADSGは3種類のラベル推論攻撃の成功率を30~60%削減し、計算オーバーヘッドを最小限に抑え、その実用性を示している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:43:39 GMT)
WATCH: World-aware Allied Trajectory and pose reconstruction for Camera and Human [14.6] 原文(投稿日:2019/09/10)へのリンク 世界の人間の動きを、Wildのモノキュラービデオから再現することは、VR、グラフィックス、ロボティクスのアプリケーションでますます求められている。
We present WATCH (World-Aware Allied Trajectory and pose reconstruction for Camera and Human)は、両課題に対処する統一的な枠組みである。
本研究は、カメラと人間の動作関係を共同でモデル化することの有効性を実証し、グローバルな人間の動作再構成におけるカメラ翻訳統合の長年の課題に対処するための新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:29:48 GMT)
Psychologically Enhanced AI Agents [14.6] 本稿では,Large Language Model (LLM)エージェントの有効性を高めるためのフレームワークMBTI-in-Thoughtsを紹介する。
本手法は, 素早い工学的手法により, 異なる性格的特徴を持つエージェントを素数化する。
このようなパーソナリティプライミングは、多様なタスクにまたがる一貫した、解釈可能な行動バイアスをもたらすことを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:03:03 GMT)
Rolling in the Shadows: Analyzing the Extraction of MEV Across Layer-2 Rollups [14.4] 分散金融は、最大抽出可能価値(MEV)として知られる一連の搾取的経済プラクティスを取り入れている
本稿では,約3年間にわたるArbitrumやzkSyncなどの著名なロールアップにおけるMEVの有病率と影響について検討する。
一般的なロールアップのサンドイッチ活動は検出されなかったが,クロスレイヤーサンドイッチ攻撃の可能性が確認された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:20:04 GMT)
AImoclips: A Benchmark for Evaluating Emotion Conveyance in Text-to-Music Generation [14.3] AImoclipsは、TTMシステムが人間のリスナーに意図した感情をいかに伝達するかを評価するためのベンチマークである。
私たちは6つの最先端のTTMシステムを使って1000以上の音楽クリップを生成しました。
その結果,商用システムでは意図したよりも楽観的な音楽が生成されがちであり,オープンソースシステムはその逆の演奏をする傾向にあることがわかった。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:41:31 GMT)
CoT-Space: A Theoretical Framework for Internal Slow-Thinking via Reinforcement Learning [14.3] CoT-Spaceは、離散トークン予測タスクから連続的、推論レベルのセマンティック空間内の最適化プロセスへの推論を大言語モデル(LLM)に再キャストする。
最適CoT長への収束は、不適合と過適合の基本的なトレードオフの自然な結果であることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:02:16 GMT)
KGBERT4Eth: A Feature-Complete Transformer Powered by Knowledge Graph for Multi-Task Ethereum Fraud Detection [14.2] KGBERT4Ethは、トランザクションセマンティックスとトランザクション知識グラフを組み合わせた、機能の完全な事前トレーニングエンコーダである。
両コンポーネントの事前学習目標を最適化して,これらの補完機能を融合し,機能完備な埋め込みを生成する。
KGBERT4Ethは、フィッシングアカウントの検出と匿名化タスクの両方において、最先端のベースラインを大幅に上回る。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:38:11 GMT)
OC4-ReID: Occluded Cloth-Changing Person Re-Identification [14.0] Occluded Cloth-Changing Person Re-Identification (OC4-ReID)は、服が変わったときに特定の歩行者を回収する新しい方法である。
OC4-ReIDは衣服の変化と閉塞の2つの課題に同時に対処する。
提案したデータセットおよび2つのCC-ReIDベンチマークデータセットに関する総合的な実験は、提案手法の他の最先端手法に対する優れた性能を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:08:04 GMT)
Adaptive Circuit Learning of Born Machine: Towards Realization of Amplitude Embedding and Quantum Data Loading [14.0] 本稿では、アンザッツ回路を動的に拡張するAdaptive Circuit Learning of Born Machineというフレームワークを提案する。
本アルゴリズムは、ターゲット状態に存在する複雑な絡み合いを最もよく捉える2ビットの絡み合いゲートを選択的に統合するように設計されている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:02:34 GMT)
Learning to Deliberate: Meta-policy Collaboration for Agentic LLMs with Multi-agent Reinforcement Learning [13.9] エージェントは高レベルなメタ認知行動を通じて分散政策を学習する。
我々は,新しい強化学習アルゴリズムであるSoftRankPOを開発した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:06:06 GMT)
LOTS of Fashion! Multi-Conditioning for Image Generation via Sketch-Text Pairing [13.9] ファッション画像生成のためのLOTS(LOcalized Text and Sketch for fashion image generation)を提案する。
LOTSは、ペア化されたローカライズドスケッチ+テキスト情報の条件付けによるグローバルな記述を活用し、拡散適応のための新しいステップベースのマージ戦略を導入する。
提案手法を検証するため,Fashionpedia上に構築したSketchyは,画像毎に複数のテキスト-スケッチペアが提供される最初のファッションデータセットである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:26:56 GMT)
LMVC: An End-to-End Learned Multiview Video Coding Framework [13.8] マルチビュービデオはボリュームビデオの重要なデータソースであり、没入型3Dシーンの再構築を可能にする。
ディープラーニングベースのエンドツーエンドビデオコーディングは、大きな成功を収めていますが、ほとんどの場合、シングルビューやステレオビデオに重点を置いています。
本稿では,ランダムアクセスと後方互換性を保証する,エンドツーエンドのマルチビュービデオ符号化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:15:41 GMT)
DeepVIS: Bridging Natural Language and Data Visualization Through Step-wise Reasoning [13.6] 本稿では,CoT推論を自然言語から可視化(NL2VIS)パイプラインに統合することを提案する。
まず,NL2VISのための包括的CoT推論プロセスを設計し,構造化された推論ステップで既存のデータセットを装備する自動パイプラインを開発する。
第二にnvBench-CoTは、曖昧な自然言語記述から最終的な視覚化まで、ステップバイステップの詳細な推論をキャプチャする特殊なデータセットである。
第3に,CoT推論プロセスと密に統合された対話型ビジュアルインタフェースであるDeepVISを開発する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:50:20 GMT)
Bayesian Additive Regression Trees for functional ANOVA model [13.4] AnoVA Bayesian Additive Regression Trees (ANOVA-BART)は、Bayesian Additive Regression Trees (BART)の新規拡張である。
提案したANOVA-BARTは、解釈可能性を高め、BARTの理論的保証を保ち、拡張し、優れた予測性能を実現する。
これらの結果は,ANOVA-BARTが予測精度,解釈可能性,理論的整合性のバランスをとることで,BARTに代わる魅力的な代替手段を提供することを示唆している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:40:40 GMT)
Inferring the Graph Structure of Images for Graph Neural Networks [13.4] 我々は、グリッドグラフとスーパーピクセル法に代わるグラフを見つけることにより、下流グラフニューラルネットワークタスクの精度を向上させる。
実験により、これらの異なるグラフ表現と特徴を下流GNNモデルへの入力として使用すると、従来のグリッドグラフやスーパーピクセル法よりも精度が向上することが示された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:41:59 GMT)
EvolveSignal: A Large Language Model Powered Coding Agent for Discovering Traffic Signal Control Algorithms [13.3] 本稿では,大規模言語モデルを用いた符号化エージェントであるEvolveSignalを紹介し,新しい信号制御アルゴリズムを自動検出する。
信号化された交差点の実験では、発見されたアルゴリズムがWebsterのベースラインを上回り、平均遅延を20.1%削減し、平均停止時間を47.1%削減した。
この研究は、交通信号制御におけるアルゴリズム設計にAIを活用し、輸送工学によるプログラム合成をブリッジすることで、新たな研究の方向性を開く。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:25:05 GMT)
Code Like Humans: A Multi-Agent Solution for Medical Coding [13.1] Code Like Humans: 大きな言語モデルで医療コーディングを行うための新しいエージェントフレームワークを紹介します。
人間の専門家のための公式なコーディングガイドラインを実装しており、完全なICD-10コーディングシステムをサポートする最初のソリューションである。
希少な診断符号で現在までの最高のパフォーマンスを達成している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:31:38 GMT)
Expedition & Expansion: Leveraging Semantic Representations for Goal-Directed Exploration in Continuous Cellular Automata [13.1] 探検と拡張 (Expedition and Expansion, E&E) は、新奇主義による地域拡大と目標指向の探検を交互に行うハイブリッド戦略である。
人間の知覚と整合した意味空間で操作することで、E&Eはどちらも斬新さを評価し、概念的に意味のある方法で目標を生成する。
リッチで創発的な振る舞いで知られる継続的CAであるFlow LeniaでテストされたE&Eは、既存の探査方法よりも多様なソリューションを一貫して明らかにしている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:44:44 GMT)
TaleDiffusion: Multi-Character Story Generation with Dialogue Rendering [13.1] TaleDiffusionは、反復的なプロセスで複数文字のストーリーを生成するための新しいフレームワークである。
ストーリーが与えられたら、プレトレーニングされたLLMを使用して、フレームごとの記述、文字の詳細、対話を生成します。
次に、フレーム間の文字の整合性を確保するためのアイデンティティ一貫性を持つ自己認識機構と、正確なオブジェクト配置のための領域認識相互アテンションを適用した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:37:06 GMT)
What Would an LLM Do? Evaluating Policymaking Capabilities of Large Language Models [13.0] 本稿は,大規模言語モデル(LLM)が,ホームレスの緩和をテーマとした社会政策決定に,ドメインエキスパートと協調しているかどうかを評価する。
4つの地域をまたいだ政策選択を伴う意思決定シナリオからなる新しいベンチマークを開発する。
本稿では,ベンチマークされたポリシーをエージェントベースモデルに接続する自動パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:28:58 GMT)
Deep Learning Advances in Vision-Based Traffic Accident Anticipation: A Comprehensive Review of Methods, Datasets, and Future Directions [13.0] 視覚に基づく交通事故予測(Vision-TAA)は,ディープラーニング時代において有望なアプローチとして現れている。
本稿では,事故予測のための教師付き,教師なし,ハイブリッドなディープラーニングモデルの適用に焦点を当て,147の最近の研究をレビューする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:28:05 GMT)
Sailing Towards Zero-Shot State Estimation using Foundation Models Combined with a UKF [12.8] 本稿では,システムダイナミクスのトランスフォーマーモデルと,UKFを用いたセンサモデルを組み合わせた基礎モデルKalman filter(FM-UKF)を提案する。
我々は、FM-UKFを複雑な力学を持つコンテナ船モデルの新しいベンチマークで評価し、古典的な手法と比較して、競争の正確さ、努力、トレードオフを実証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:38:54 GMT)
An Empirical Study of Vulnerabilities in Python Packages and Their Detection [12.6] この記事では、Pythonパッケージの脆弱性の包括的なベンチマークスイートであるPyVulを紹介する。
PyVulには、公表された1,157の開発者認証脆弱性が含まれており、それぞれが影響を受けるパッケージにリンクされている。
ラベル精度を向上し、100%コミットレベルと94%関数レベルの精度を達成するために、LCM支援データクリーニング手法が組み込まれている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:38:28 GMT)
Schema Inference for Tabular Data Repositories Using Large Language Models [12.6] 本稿では,カラムヘッダとセル値のみを用いて,データに対する簡潔な概念スキーマを推論するSI-LLMを提案する。
SI-LLMは有望なエンドツーエンドの結果を達成し、各ステップにおける最先端のメソッドよりも良いか同等の結果が得られる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:50:16 GMT)
A Primer on Causal and Statistical Dataset Biases for Fair and Robust Image Analysis [12.6] 本稿では,画像解析における機械学習手法の失敗を誘発する因果構造と統計的構造を紹介する。
我々は,これまで見過ごされていた2つの問題に注目し,その問題をtextitno fair lunch problem と textitsubgroup separability problem と呼ぶ。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:06:58 GMT)
Robust Bandwidth Estimation for Real-Time Communication with Offline Reinforcement Learning [12.6] オフライン強化学習(RL)に基づくロバスト帯域幅推定フレームワークRBWEを提案する。
RBWEは過大評価誤差を18%減らし、QoE(QoE)を18%減らし、実世界のRTCアプリケーションにおいて実用性を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:14:56 GMT)
MTQA:Matrix of Thought for Enhanced Reasoning in Complex Question Answering [12.4] Matrix of Thought (MoT) は、新規かつ効率的なLLM思考構造である。
MoTは「カラムセル通信」機構を通じて水平次元と垂直次元の両方の問題を探索する。
我々は,検索した知識グラフと生テキストから知識単位を構築することにより,事実補正機構を開発する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:13:28 GMT)
Revisiting Third-Party Library Detection: A Ground Truth Dataset and Its Implications Across Security Tasks [12.3] 6000以上のアプリを対象に,最先端の10個のTPL検出技術に関する大規模な実証的研究を行った。
我々の評価は、ツールの脆弱性をR8時代の変換、バージョン識別の弱い、候補ライブラリの不正確な対応、類似性のしきい値の一般化の難しさ、大規模実行時のランタイム/メモリオーバーヘッドを禁止している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:48:02 GMT)
Reservoir kernels and Volterra series [11.9] 普遍カーネルは、有限次元ユークリッド空間における入力と出力でフェージングメモリカテゴリの因果フィルタと時間不変フィルタを近似した構成である。
このカーネルは、解析的なフェーディングメモリフィルタで利用可能なボルテラ級数展開の状態空間表現に関連付けられた貯水池関数を用いて構築される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:25:28 GMT)
Neural Video Compression with In-Loop Contextual Filtering and Out-of-Loop Reconstruction Enhancement [11.8] 本稿では,ニューラルビデオ圧縮における拡張フィルタリング手法の適用について検討する。
ループ内コンテキストフィルタリングは、フレーム単位の符号化中にエラーの伝播を緩和することにより、時間的コンテキストを洗練する。
ループ外リコンストラクションの強化は、再構築されたフレームの品質を向上するために使用され、コーディング効率をシンプルかつ効果的に改善する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:29:30 GMT)
Exposing Synthetic Speech: Model Attribution and Detection of AI-generated Speech via Audio Fingerprints [11.7] 我々は、AI生成音声を検出するためのトレーニング不要で効果的なアプローチを導入する。
本研究では,(1)オープンワールド環境における単一モデル帰属,(2)クローズドワールド環境における多モデル帰属,(3)合成音声と実音声の検知という3つの重要な課題に取り組む。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:43:52 GMT)
Expanding Foundational Language Capabilities in Open-Source LLMs through a Korean Case Study [11.5] 102億のパラメータからなる言語モデルであるLlama-3-Motifを導入する。
Llama-3-Motifは、コアトランスフォーマーアーキテクチャを変更することなくモデルを効果的にスケールするために、LlamaProやMasked Structure Growthといった高度なトレーニング技術を採用している。
ハイパースケールGPUクラスタ間の効率的なトレーニングにMoAIプラットフォームを使用することで、韓国とイギリスのデータのバランスの取れた比率を維持するために、慎重にキュレートされたデータセットを使用して、Llama-3-Motifを最適化した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:56:24 GMT)
Handling Infinite Domain Parameters in Planning Through Best-First Search with Delayed Partial Expansions [11.0] 自動計画では、制御パラメータは連続的な数値決定変数を導入して標準アクション表現を拡張する。
既存の最先端のアプローチは、他の時間的制約や数値的制約と共に、組み込み制約として制御パラメータを主に扱っている。
本稿では,制御パラメータを体系的な探索方式における真の決定点として明示的に扱う,効率的な代替案を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:27:27 GMT)
First Order Model-Based RL through Decoupled Backpropagation [11.0] 勾配計算から軌道生成を分離する手法を提案する。
本手法は,SHACなどの特殊な移動のサンプル効率と速度を実現する。
我々は、ベンチマーク制御タスクにおける勾配アルゴリズムを実証的に検証し、実際のGo2四足歩行ロボット上での有効性を実証する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:46:04 GMT)
LMAE4Eth: Generalizable and Robust Ethereum Fraud Detection by Exploring Transaction Semantics and Masked Graph Embedding [10.9] LMAE4Ethは、トランザクションセマンティクス、マスキンググラフの埋め込み、専門家の知識を融合する多視点学習フレームワークである。
まず、文脈に依存しない数値トランザクションレコードを結合型言語表現に変換するトランザクション型コントラスト言語モデル(TxCLM)を提案する。
次に、生成自己教師付き学習を用いたマスク付きアカウントグラフオートエンコーダ(MAGAE)を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:56:32 GMT)
Vulnerability-Affected Versions Identification: How Far Are We? [10.8] 本研究は,脆弱性に影響を及ぼすバージョンを同定した最初の包括的実証研究である。
ツールの精度は45.0%を超えず、依存、限定的な推論、厳密なマッチングロジックなどによる重要な課題がある。
本研究は,この重要な領域におけるツール開発,組み合わせ戦略,今後の研究の指針として,実用的な洞察を提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:31:22 GMT)
Non-unique decompositions of mixed states and deterministic energy transfers [10.8] 混合状態は一般に、量子論において非特異な分解を純粋状態に分解する。
本稿では, 決定論的エネルギー収穫を構成するエネルギー移動について考察する。
固定された$|alpha|$ のコヒーレントな EM モード状態の集合は、決定論的エネルギー移動を共同で達成し、それらの状態のすべての混合と重ね合わせを含むことができることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:10:49 GMT)
Street-Level AI: Are Large Language Models Ready for Real-World Judgments? [10.8] 直近でおそらくはAIは、いわゆるストリートレベルの官僚を支援するか、完全に置き換えることである。
本稿では,LLM判定が人間の判断とどのように一致しているかを検討する。
LLMの優先順位付けは、いくつかの点で非常に矛盾している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:42:06 GMT)
Breaking the Context Bottleneck on Long Time Series Forecasting [10.7] 長期の時系列予測は、経済、エネルギー、輸送における計画と意思決定に不可欠である。
最近の進歩によりこれらのモデルの効率は向上したが、より長いシーケンスを効果的に活用することの難しさは持続している。
長いシーケンスの効率的かつ効率的な処理を実現するために,Logsparse Decomposable Multiscaling (LDM) フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:16:44 GMT)
Echo State Networks as State-Space Models: A Systems Perspective [10.7] 本研究では, エコー状態特性が非線形SSMの入力状態安定性の例であることを示す。
また、解釈可能な極とメモリ水平線を持つ局所有効なLTI SSMを生成する2つの相補写像も開発する。
この観点は、メモリスペクトルの周波数領域の特徴を与え、ESNが構造化SSMカーネルをエミュレートするときに明確にする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:42:03 GMT)
Global-to-Local or Local-to-Global? Enhancing Image Retrieval with Efficient Local Search and Effective Global Re-ranking [10.5] 本稿では,効率的な局所的特徴探索がグローバルな特徴の再ランク付けに合致する局所的特徴検索パラダイムを提案する。
Revisited Oxford と Paris のデータセットに新たな最先端結果を設定することで,ソリッド検索性能を実証する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:12:14 GMT)
Quantum-Enhanced Multi-Task Learning with Learnable Weighting for Pharmacokinetic and Toxicity Prediction [10.5] 本稿では,ADMET分類タスクに特化して設計された,量子強化およびタスク重み付きマルチタスク学習フレームワークを提案する。
QW-MTLは、電子構造と相互作用に関する追加情報で分子表現を豊かにする量子化学記述子を採用している。
タスク間の動的損失分散を実現するために、データセットスケールの事前処理と学習可能なパラメータを組み合わせた、新しい指数関数的タスク重み付け方式を導入している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:33:40 GMT)
MillGNN: Learning Multi-Scale Lead-Lag Dependencies for Multi-Variate Time Series Forecasting [10.5] 我々は,MillGNNを提案する。MillGNNは,MTS予測のためのアンダーラインリード-アンダーラインラグ依存性を学習する新しい手法である。
MillGNNでは、スケール固有のリードラググラフ学習モジュールと階層的なリードラグメッセージパッシングモジュールという、2つの重要なイノベーションを紹介している。
11のデータセットに対する実験結果から,MillGNNの長期的および短期的MSS予測における優位性を示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:28:42 GMT)
TensoIS: A Step Towards Feed-Forward Tensorial Inverse Subsurface Scattering for Perlin Distributed Heterogeneous Media [10.0] 画像からヘテロジニアス媒質の散乱パラメータを推定することは、過度に制約され難解な問題である。
実世界の異種散乱パラメータを明示的にモデル化できる具体的な分布は分かっていない。
本稿では、これらのパーリン分布不均一散乱パラメータを推定する学習ベースのフィードフォワードフレームワークであるTensoISを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:28:20 GMT)
LibriQuote: A Speech Dataset of Fictional Character Utterances for Expressive Zero-Shot Speech Synthesis [9.9] 本稿では,リードオーディオブックから派生した英文コーパスであるLibriQuoteデータセットを紹介する。
トレーニングデータセットは、読み上げ、非表現音声の12.7K時間と、主に文字引用から引き出された表現音声の5.3K時間を含む。
また、TSシステムのベンチマークを目的とした、7.5時間の挑戦的なテストセットも提供します。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:05:06 GMT)
Spoken in Jest, Detected in Earnest: A Systematic Review of Sarcasm Recognition -- Multimodal Fusion, Challenges, and Future Prospects [9.8] 人間のコミュニケーションの共通する特徴であるサルカズムは、対人的相互作用と人間と機械的相互作用において課題を提起する。
近年の音声技術の進歩は、音声認識に音声データを活用することの重要性が増していることを強調している。
この体系的なレビューは、単調なアプローチからマルチモーダルなアプローチへの進化をグラフ化して、音声に基づく皮肉認識に焦点を当てた最初のものである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:40:52 GMT)
Joint Modeling of Entities and Discourse Relations for Coherence Assessment [9.8] 言語学において、コヒーレンス(coherence)は、文をまたいだ同じ実体の集合への参照を維持するなど、異なる手段によって達成される。
本研究では,コヒーレンス評価のための実体と談話の関係を共同でモデル化する2つの手法について検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:58:37 GMT)
UniExtreme: A Universal Foundation Model for Extreme Weather Forecasting [9.7] 既存のアプローチは、一般的な気象条件に焦点を当てるか、特定のタイプの極端を専門にし、様々な極端事象の現実世界の大気パターンを無視している。
本研究では,(1)通常の気象条件に対するスペクトル差,(2)階層的ドライバ,および多様な極度の地理的ブレンディングという,極端な事象の2つの重要な特徴を同定する。
UniExtremeは、適応周波数変調(AFM)モジュールと、通常の気象と極度の気象の領域的なスペクトル差を捉えた普遍的極端気象予測基盤モデルと、階層的な極端多様性と合成を解決するために、地域固有の極端事象を組み込んだイベント事前拡張(EPA)モジュールを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:24:09 GMT)
Millisecond-Response Tracking and Gazing System for UAVs: A Domestic Solution Based on "Phytium + Cambricon" [9.7] 本研究では,ミリ秒レベルの応答機能を持つUAVトラッキング・ギャージングシステムを提案する。
このシステムは1920*1080解像度のビデオストリーム処理において、安定した1フレームの包括的な処理遅延50-100msを実現する。
本研究は、UAVモニタリングと家庭用チップの応用のための革新的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:26:00 GMT)
DianJin-OCR-R1: Enhancing OCR Capabilities via a Reasoning-and-Tool Interleaved Vision-Language Model [9.6] 大型視覚言語モデル(LVLM)は、入力画像に存在しない単語を生成する幻覚を引き起こす傾向がある。
DianJin-OCR-R1は、ドメイン固有のデータセットに基づいて訓練された推論とツールをインターリーブしたVLMである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:05:29 GMT)
COBRA: Multimodal Sensing Deep Learning Framework for Remote Chronic Obesity Management via Wrist-Worn Activity Monitoring [9.5] 本研究では,手首型マルチモーダルセンサを用いた客観的行動監視のための新しい深層学習フレームワークCOBRAを提案する。
COBRAは、U-Net空間モデリング、マルチヘッド自己アテンション機構、BiLSTM時間処理を組み合わせたハイブリッドD-Netアーキテクチャを統合し、日々のアクティビティを4つの肥満関連カテゴリに分類する。
このフレームワークは、人口動態の低さ(3%)で堅牢な一般化性を示し、パーソナライズされた肥満介入と継続的ライフスタイル監視のためのスケーラブルなデプロイメントを可能にしている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:35:49 GMT)
What if I ask in \textit{alia lingua}? Measuring Functional Similarity Across Languages [9.3] 我々の分析によると、モデルのサイズと能力が大きくなるにつれて、言語間でモデルの応答がますます一貫性を増す。
これらの結果は、多言語信頼性を評価する実用的なツールとしての$kappa_p$の価値だけでなく、より一貫性のある多言語システムの開発を導く可能性も浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:08:39 GMT)
Learning from Majority Label: A Novel Problem in Multi-class Multiple-Instance Learning [9.3] 本稿では,LML(Learning from Majority Label)と呼ばれる,新しいマルチクラスマルチインスタンス学習問題を提案する。
LMLの目標は、マジョリティラベルを使用して各インスタンスのクラスを推定する分類モデルをトレーニングすることである。
この問題は、病理画像のセグメンテーション、政治的投票予測、顧客感情分析、環境モニタリングなど、様々なアプリケーションで有用である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:50:03 GMT)
Understanding Space Is Rocket Science -- Only Top Reasoning Models Can Solve Spatial Understanding Tasks [9.2] 本稿では,空間的関係理解のためのオープンソースのコントラスト付きVLMベンチマークを提案する。
RocketScienceは完全に新しい現実世界の画像テキストペアで構成されている。
その結果,オープンソースおよびフロンティア商用VLMにおける空間的関係理解の欠如が示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:38:44 GMT)
SPFT-SQL: Enhancing Large Language Model for Text-to-SQL Parsing by Self-Play Fine-Tuning [8.5] セルフプレイファインチューニング(SPIN)は、弱い大きな言語モデル(LLM)を競合する相互作用を通じて強力な言語に変換することができる。
本研究では,SPFT-tuningと呼ばれるテキスト・ツー・タスクに適した,新たなセルフプレイ・ファイン・チューニング手法を提案する。
自己再生の微調整フェーズにおいて,不適切な出力を相手モデルからインセンティブを与える誤り駆動損失法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:55:46 GMT)
Long Input Sequence Network for Long Time Series Forecasting [8.5] 短時間の固定長入力は、長い時系列予測タスクにおけるディープラーニング手法の主なボトルネックである。
我々は,新しいシリーズ分解モジュール(MPSD)とマルチトークンパターン認識ニューラルネットワーク(MTPR)を導入する。
トークンのサイズは、モデルがフォーカスするスケールとそれに対応するコンテキストサイズを決定するため、主にモデルの振る舞いを規定する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:16:59 GMT)
No Thoughts Just AI: Biased LLM Recommendations Limit Human Agency in Resume Screening [8.4] 人々は、レースベースの選好(バイアス)を示すシミュレーションAIモデルと協力し、16のハイステータスな職業の候補を評価する。
シミュレーションされたAIバイアスは、実世界のAIシステムにおける人種バイアスの事実的および反事実的推定を近似する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:16:26 GMT)
Is Artificial Intelligence Reshaping the Landscape of the International Academic Community of Geosciences? [8.4] 人工知能(AI)は、近年、AI関連の科学出力が顕著に増加し、地球科学の研究を積極的に変革している。
我々は、開発途上国の地球科学者が、最近のAI for Science(AI4S)パラダイムにおいて、より良い可視性を得たことを観察することを奨励されている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:26:17 GMT)
Simulation-based Inference via Langevin Dynamics with Score Matching [8.3] シミュレーションベース推論(SBI)は、確率が難しければベイズ解析が可能であるが、モデルシミュレーションが利用可能である。
本稿では,Langevinのダイナミックスとスコアマッチングを統合し,複雑な後部景観をより効率的に探索する新しいSBI手法を提案する。
提案手法では,シミュレーションコストを削減するローカライズ手法や,ログライクなスコアの統計構造を組み込んでスコアマッチング精度を向上させるアーキテクチャ正則化など,SBIのための調整されたスコアマッチング手法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:28:50 GMT)
Decoding the Poetic Language of Emotion in Korean Modern Poetry: Insights from a Human-Labeled Dataset and AI Modeling [8.1] KPoEMは、現代朝鮮詩における計算的感情分析のための新しいデータセットである。
このデータセットに微調整された、最先端の韓国語モデルでは、以前のモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:45:39 GMT)
That is Unacceptable: the Moral Foundations of Canceling [8.1] 本研究は,アノテータのモラルがキャンセルの知覚に与える影響を考察し,この現象の相違を説明する上で,モラルが独立した軸であることを示す。
このことは、ソーシャルメディアにおける有害行為をより深く理解するために、イベント中心のデータセットを開発する必要があることを示している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:08:46 GMT)
Evaluating the Robustness of Retrieval-Augmented Generation to Adversarial Evidence in the Health Domain [8.1] Retrieval augmented generation (RAG) システムは、検索された証拠や文脈を支援として提供することにより、Large Language Model (LLM) の応答を現実的に根拠付ける方法を提供する。
LLMは、回収された証拠に存在する誤報を吸収し、再生する。
この問題は、抽出された証拠が、誤報を公布することを明示的に意図した敵対的な材料を含むと拡大される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:45:58 GMT)
ShieldMMU: Detecting and Defending against Controlled-Channel Attacks in Shielding Memory System [8.1] Intel SGXとハイパーバイザは、非特権プログラムを他のソフトウェアから分離し、機密性と完全性を保証する。
サイドチャネル攻撃はIntel SGXのセキュリティを脅かし続けており、悪意のあるOSがPTEの現在のビットを操作し、ページフォールトを誘導し、メモリアクセストレースを盗むことができる。
本稿では、制御チャネル攻撃を緩和するための総合的なソリューションであるShieldMMUを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:34:34 GMT)
Measuring the Measures: Discriminative Capacity of Representational Similarity Metrics Across Model Families [8.0] モデルファミリを分離する能力に基づいて,表現類似度を評価する枠組みを提案する。
信号検出理論,シルエット係数,ROC-AUCの3つの相補的分離性尺度を用いる。
我々は、メトリクスがより厳密なアライメント制約を課すにつれて、分離性が体系的に増加することを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:11:10 GMT)
Diffusion Generative Models Meet Compressed Sensing, with Applications to Image Data and Financial Time Series [8.0] 我々は,合成データ生成の文脈において拡散モデル推論次元を加速させる技術を開発した。
提案アルゴリズムは,拡散モデル推論とスパースリカバリを組み合わせることにより,より高速な収束を享受できることが証明された。
副生成物として、潜在空間次元の最適値を得る。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:45:06 GMT)
Towards an Understanding of Developer Experience-Driven Transparency in Software Ecosystems [7.8] SECO-TransDXは、DX駆動の透明性の概念を導入する概念モデルである。
技術的、社会的、組織的なレイヤにまたがって、透明性がDXをどのように仲介するかを調べるための構造化レンズを提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:17:22 GMT)
Autonomation, Not Automation: Activities and Needs of European Fact-checkers as a Basis for Designing Human-Centered AI Systems [7.7] 我々は中央ヨーロッパのファクトチェッカーに詳しいインタビューを行った。
我々の貢献には、非英語圏における事実確認作業の多様性に関する詳細な調査が含まれる。
我々は,ファクトチェッカーの活動に関する知見をマッピングし,AI研究に必要な課題について考察した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:52:13 GMT)
Split Conformal Prediction in the Function Space with Neural Operators [7.6] 等角予測は有限次元空間において有限サンプル保証を与える。
直接関数値出力に拡張しない。
この研究は、2段階法に従って関数空間への共形予測を分割する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:12:04 GMT)
Learning Optimal Prompt Ensemble for Multi-source Visual Prompt Transfer [7.6] マルチソース・プロンプト・チューニングのための最適アンサンブル重み学習フレームワークであるHGPromptを提案する。
特に、ターゲットタスクにおけるプロンプト誘発特徴の識別性をキャプチャする、識別可能なプロンプト転送可能性指標を提案する。
大規模VTABベンチマークの実験は、HGPromptの最先端性能を実証している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:49:13 GMT)
Moco: A Learnable Meta Optimizer for Combinatorial Optimization [7.4] Moco は単一の連続ベクトル $theta$ で導かれる軽量な解の構成手順である。
同時にCOPの単一インスタンスに対して$theta$を更新するニューラルネットワークを学習する。
Mocoは完全に学習可能で、問題固有のメタを活用したり、トレーニングに最適なソリューションを必要としたりしない。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:15:03 GMT)
Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics [7.3] DTNの保守と運用に一般的に使用されるアクティブメトリック予測は、レイテンシ、スループット、エネルギー消費、信頼性に関するネットワーク性能を向上させることができる。
時系列予測における従来の平均回帰法は、データの複雑さを適切に把握できないため、ルーティングなどのDTNの運用タスクでは、性能が低下する。
本稿では、DTNにおけるメトリクスの予測を多変量時系列上の確率予測問題として定式化し、これらのサンプルの分布を特徴付けることによって予測の不確かさを定量化することができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:49:22 GMT)
Emerging (2+1)D electrodynamics and topological instanton in pseudo-Hermitian two-level systems [7.3] ハミルトニアンが時間に明示的に依存していない場合でも、ベリー曲率を2+1$の次元電磁場にマッピングすることができる。
時空特異点として現れるインスタントンは、当時のベリー曲率の磁束の跳躍を定量化する位相電荷を持つ。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:37:31 GMT)
EZhouNet:A framework based on graph neural network and anchor interval for the respiratory sound event detection [7.3] 可変長オーディオを処理可能なアンカー間隔を持つグラフニューラルネットワークベースのフレームワークを提案する。
本手法は呼吸音検出の柔軟性と適用性を両立させる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:07:56 GMT)
Keypoint-based Diffusion for Robotic Motion Planning on the NICOL Robot [7.2] 本稿では,ロボット動作計画のための新しい拡散型アクションモデルを提案する。
ディープラーニングのパワーを活用することで、はるかに小さなランタイムで良い結果を得ることができるのです。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:11:51 GMT)
Learning Neural Decoding with Parallelism and Self-Coordination for Quantum Error Correction [7.2] 既存のニューラルネットワークデコーダの実装には、超伝導論理量子ビットによって生成されたシンドロームストリームをリアルタイムで復号するために必要な並列性がない。
我々は、スライディングウインドウデコーディングに特化した、リカレントでトランスフォーマーベースのニューラルネットワークをトレーニングすることで、この問題に対処する。
このアプローチにより、ネットワークは近隣のウィンドウをまたいで自己調整し、任意に長いメモリ実験の高精度な並列デコードを容易にする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:02:27 GMT)
LATTE: A Decoding Architecture for Quantum Computing with Temporal and Spatial Scalability [7.2] 格子手術の量子オーバーヘッドをスケールアップする上で重要な要件に対処するため,FPGA-ハイブリッドデコーディングアーキテクチャであるLATTEを導入する。
LATTEは、リアルタイムデコードスループットを実現しつつ、ベースデコーダと同等の精度を提供し、帯域幅要求と計算資源の両方を著しく削減する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:29:21 GMT)
DaMoC: Efficiently Selecting the Optimal Large Language Model for Fine-tuning Domain Tasks Based on Data and Model Compression [7.2] 大規模言語モデル(LLM)は、一般的なタスクでは優れているが、ドメイン固有のタスクでは苦労し、特定のデータに対して微調整を必要とする。
この課題に対処するデータ・モデル圧縮フレームワーク(DaMoC)を導入します。
トレーニング時間に約20倍の時間を節約しながら,最適なLLMを選択することができることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:30:16 GMT)
Not All Splits Are Equal: Rethinking Attribute Generalization Across Unrelated Categories [7.0] 本研究では,このような条件下での属性予測タスクのロバスト性について,最初の明示的な評価を行う。
トレーニングとテストセットの相関を段階的に低減する,トレイン-テストの分割戦略を導入する。
その結果、トレーニングとテストカテゴリの相関が減少するにつれて、パフォーマンスが急激に低下することが明らかとなった。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:52:22 GMT)
ACING: Actor-Critic for Instruction Learning in Black-Box LLMs [7.0] ACINGは、命令最適化をステートレスで継続的な動作問題として定式化する強化学習フレームワークである。
命令推論タスクの76%で、人間が書き起こしたプロンプトより優れていることを発見する。
最大33ポイントを獲得し、命令のインダクション、要約、思考の連鎖的推論を含む33のタスクにおいて、最高の自動ベースラインよりも10ポイント中央値の改善を達成している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:56:24 GMT)
FutureGen: A RAG-based Approach to Generate the Future Work of Scientific Article [7.0] 科学論文のFuture Workセクションでは、現在の研究のギャップと限界を特定することによって、潜在的研究の方向性を概説している。
本研究では,研究論文から今後の課題を提案する。
大規模言語モデル(LLM)を検索拡張世代(RAG)に統合した実験を行った。
GPT-4o mini と LLM フィードバック機構を併用したRAG-based approach は,定性評価と定量的評価の両方に基づいて他の手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:12:41 GMT)
What Fundamental Structure in Reward Functions Enables Efficient Sparse-Reward Learning? [6.9] Policy-Aware Matrix Completion (PAMC)は、行列補完理論と強化学習を結びつける。
PAMCは、強い探索、構造化、表現学習と比較して1.6から2.1の因子によるサンプル効率を改善する。
結果は、ロボティクス、医療、その他の安全にクリティカルなサンプル調査アプリケーションに即座に影響する、有望な新しいパラダイムとして構造報酬学習を確立します。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:53:02 GMT)
Multi-Label Bayesian Active Learning with Inter-Label Relationships [6.6] 両課題に対処する多ラベルアクティブラーニング戦略を提案する。
本手法は, 漸進的に更新された正相関行列と負相関行列を組み込んで, 共起関係と解離関係を捉える。
私たちの戦略は、いくつかの確立された方法と比較して、信頼性と優れたパフォーマンスを継続的に達成します。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:22:21 GMT)
FaaSGuard: Secure CI/CD for Serverless Applications -- An OpenFaaS Case Study [6.5] サーバレスコンピューティングは、インフラストラクチャ管理を抽象化し、迅速でモジュール化されたイベント駆動デプロイメントを可能にすることで、ソフトウェア開発を大きく変えます。
そのメリットにもかかわらず、サーバレス機能は、特にOpenFのようなオープンソースのプラットフォームにおいて、ユニークなセキュリティ上の課題を生じさせる。
既存のアプローチは一般的に、統合された包括的なセキュリティ戦略が欠如しているDevSecOpsライフサイクルの独立したフェーズに対処する。
我々は、オープンソースのサーバレス環境用に明示的に設計された統合DevSecOpsパイプラインであるFGuardを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:48:13 GMT)
Quantum Inspiration, Classical Advantage: Dequantized particle algorithm for the nonlinear Vlasov-Poisson system [6.5] 本稿では,Vlasov--Poisson (VP) システムの復号化アルゴリズムを提案する。
シュル「オーディンガー-ポアソン」(SP)方程式の構造保存離散化(英語版)(Structure-reserving discretization)を行うことを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:12:33 GMT)
Unified Representation Learning for Multi-Intent Diversity and Behavioral Uncertainty in Recommender Systems [6.4] 本稿では,レコメンデーションシステムにおけるユーザ意図の多様性と行動の不確実性を共同でモデル化することの課題に対処する。
このフレームワークはマルチインテント表現モジュールと不確実性モデリング機構を構築している。
ユーザ行動系列から多粒性関心構造を抽出する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 22:53:38 GMT)
Improving Narrative Classification and Explanation via Fine Tuned Language Models [6.3] 本研究は,(1)ニュース記事における物語とサブナラティブのマルチラベル分類,(2)簡潔でエビデンスに基づく,支配的な物語の説明の生成という2つの課題に取り組む。
GPT-4oパイプラインを用いた総合的な物語検出, 予測の精細化のためのリコール指向アプローチにより, BERTモデルを微調整する。
本研究は, メディア分析, 教育, インテリジェンス収集における補助知識の活用により, 分類精度が向上し, 信頼性が向上することを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:12:31 GMT)
MitoDetect++: A Domain-Robust Pipeline for Mitosis Detection and Atypical Subtyping [6.3] MitoDetect++はMIDOG 2025チャレンジ用に設計された統合ディープラーニングパイプラインである。
検出には、EfficientNetV2-LをバックボーンとするU-Netベースのエンコーダデコーダアーキテクチャを用いる。
分類には、Lo-Rank Adaptation (LoRA) を用いて効率よく微調整されたVirchow2視覚変換器を用いて、資源消費を最小限に抑える。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 22:27:29 GMT)
CP-Bench: Evaluating Large Language Models for Constraint Modelling [6.3] 制約プログラミング(CP)は、問題を解くために広く使われているが、その中核となるプロセス、すなわち制約モデリングは、かなりの専門知識を必要とし、広く採用される際のボトルネックと考えられている。
近年,問題記述を実行可能な制約モデルに変換するために,Large Language Models (LLMs) を用いて検討されている。
制約モデリングのための既存の評価データセットは、しばしば、現実のシナリオの多様性を捉えない、小さく、均一で、ドメイン固有のインスタンスに限られる。
この研究はCP-Benchの導入によってこのギャップに対処する。CPコミュニティから得られた様々な既知の問題を含む新しいベンチマークであるCP-Benchは構造化されている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:10:05 GMT)
HuggingGraph: Understanding the Supply Chain of LLM Ecosystem [6.1] 大規模言語モデル(LLM)は、単語のシーケンスを処理および予測するためにディープラーニングアーキテクチャを活用する。
LLMは、以前のモデルやデータセットに存在する脆弱性やバイアス、悪意のあるコンポーネントを継承することができる。
このプロジェクトの目的は、モデルとデータセットの関係を研究することである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:06:49 GMT)
On Robustness and Reliability of Benchmark-Based Evaluation of LLMs [6.1] LLM(Large Language Models)の有効性は通常、MMLU、ARC-C、HellaSwagなどのベンチマークによって評価される。
実世界のアプリケーションは言語的多様性を伴い、同じ質問やクエリの様々なリワードでモデルの有効性を維持する必要がある。
そこで我々は,LLMの頑健さをベンチマーク問題に言い換えて体系的に評価し,ベンチマークに基づく評価がモデル能力の信頼性を評価できるかどうかを検証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:43:27 GMT)
SPECS: Specificity-Enhanced CLIP-Score for Long Image Caption Evaluation [6.0] SPECSは、長い画像キャプションに適した参照なしRSメトリックである。
本研究では,SPECSが人間の判断と相関して,オープンソースのLCMベースのメトリクスのパフォーマンスと一致することを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:43:50 GMT)
On Aligning Prediction Models with Clinical Experiential Learning: A Prostate Cancer Case Study [5.9] 本稿では,このモデル行動と臨床経験的学習の相違を調査するための枠組みを提案する。
まず,MLモデルに制約を課し,臨床知識を組み込むことにより,これらの矛盾を識別し,対処する。
本手法は,MLモデルを臨床経験的学習と整合させることが,性能を損なうことなく可能であることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:32:19 GMT)
An Automated, Scalable Machine Learning Model Inversion Assessment Pipeline [5.8] 我々は,データプライバシ損失のリスクをMIAから定量化する新しいDT&Eツールを提案する。
我々のパイプラインは、インバージョンと視覚言語モデル(VLM)を組み合わせて、スケーラブルな分析を可能にしながら、効率を向上させる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:39:37 GMT)
A systematic search for conformal field theories in very small spaces [5.8] 1+1d共形場の理論の基底状態は、ベクトル固定点方程式と呼ばれる局所エントロピー条件を満たす。
非常に小さな系(4量子ビットと4量子ビット)の状態の空間における探索を行い、この状態を満たす状態を調べる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:20:07 GMT)
Dual-Scale Volume Priors with Wasserstein-Based Consistency for Semi-Supervised Medical Image Segmentation [5.7] 本研究では,空間正規化手法とボリューム先行処理を統合した半教師付き医用画像分割フレームワークを開発した。
提案手法は,画像スケールとThreshold Dynamics空間正則化に先立って,強い明示ボリュームを統合する。
我々は、ラベル付きデータセットに予測されるボリューム分布がラベル付きデータセットと似ていることを強制する、弱暗黙ボリュームに基づくデータセットスケールのワッサースタイン距離損失関数を設計する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:47:25 GMT)
INGRID: Intelligent Generative Robotic Design Using Large Language Models [5.4] INGRID(Intelligent Generative Robotic Design)は、並列ロボット機構の自動設計を可能にするフレームワークである。
設計課題を,制約解析,キネマティックジョイント生成,チェーン構築,完全機構設計という4つの段階的な課題に分解する。
INGRIDは、メカニズム理論と機械学習のギャップを埋めることで、特殊なロボット工学の訓練を受けていない研究者たちが、独自の並列メカニズムを作ることができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:08:01 GMT)
Invariant Features for Global Crop Type Classification [5.3] CropGlobeは地球規模の作物型データセットで、5大陸8カ国から30万ピクセルのサンプルを収集している。
CropGlobeは広い範囲をカバーし、クロスカントリー、クロス大陸、クロス半球移動の下で体系的な評価を可能にする。
CropNetは、ピクセルレベルの作物分類に適した軽量で堅牢なCNNである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:09:44 GMT)
Understanding sparse autoencoder scaling in the presence of feature manifolds [5.3] 我々は、SAEスケーリングを理解するために、ニューラルスケーリング文献からキャパシティアロケーションモデルを適用する。
我々は,SAEが野生の病的状態にあるかどうかを論じる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:55:36 GMT)
Can Compact Language Models Search Like Agents? Distillation-Guided Policy Optimization for Preserving Agentic RAG Capabilities [5.2] 強化学習(Reinforcement Learning)は、言語モデルからエージェントRAGの振る舞いを抽出するためのポストトレーニングアプローチとして登場した。
Agentic RAG Capabilities (ARC) は、推論、探索調整、応答合成を詳細に分析するメトリクスである。
DGPOはリソース制約のある環境でエージェントRAGを実現する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:36:07 GMT)
Prob-GParareal: A Probabilistic Numerical Parallel-in-Time Solver for Differential Equations [5.1] Prob-GPararealは不確実性定量化のためのGPararealアルゴリズムの確率的拡張である。
5つのベンチマークODEシステム上で提案アルゴリズムの精度とロバスト性を数値的に示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:09:59 GMT)
An Agentic Model Context Protocol Framework for Medical Concept Standardization [5.1] モデルコンテキストプロトコル(MCP)に基づくゼロトレーニング・幻覚防止マッピングシステムの開発
このシステムは説明可能なマッピングを可能にし、最小限の労力で効率と精度を大幅に改善する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:32:22 GMT)
A Multidimensional AI-powered Framework for Analyzing Tourist Perception in Historic Urban Quarters: A Case Study in Shanghai [5.1] 本研究では,歴史的市街地における観光感の分析のための多次元AIを活用したフレームワークを提案する。
上海中心部の12の歴史的地区に適用され、焦点抽出、色テーマ分析、感情マイニングを統合している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:35:14 GMT)
We Have It Covered: A Resampling-based Method for Uplift Model Comparison [5.0] アップリフトモデルは、現代のマーケティングアプリケーションにおいて重要な役割を果たす。
意図したアプリケーションのコンテキストにおけるモデルの違いを理解することが不可欠である。
本研究では,2段階のサンプリング手法と再サンプリングに基づくアプローチを提案し,アップリフトモデルと不確実な定量化を比較した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:33:25 GMT)
Rethinking the long-range dependency in Mamba/SSM and transformer models [4.8] 我々は,過去の入力に対する隠蔽状態の微分を用いた長距離依存性を数学的に定義する。
本研究では,SSMの長距離依存性は,RNNにおけるメモリ関数の指数的減衰と一致するシーケンス長と指数関数的に一致することを示す。
本稿では,SSMにおける隠れ状態更新のための新しい定式化を提案し,その安定性を標準ガウス分布の下で証明する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:56:47 GMT)
Bootstrapping Reinforcement Learning with Sub-optimal Policies for Autonomous Driving [4.7] 本稿では,高度に最適化された,あるいは専門家レベルのコントローラを必要としない実演ポリシーでRL駆動エージェントを誘導することを提案する。
我々は,ルールベースのレーン変更コントローラとソフトアクター批評家(SAC)アルゴリズムを統合し,探索と学習効率を向上させる。
提案手法は運転性能の向上を実証し,他の運転シナリオにも拡張可能である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:56:26 GMT)
Single-seed generation of Brownian paths and integrals for adaptive and high order SDE solvers [4.7] 適応型高次解法を新しいVBTアルゴリズムで実現した2つの応用について述べる。
適応解法を用いて高揮発性CIRモデルをシミュレートし、定常ステップの収束順序を2倍以上に向上する。
MCMC問題に対して, 適応的第三次ランゲヴィン解法を応用し, 関数評価の10分の1しか用いない。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:32:54 GMT)
The Distributed Multi-User Point Function [4.7] 本稿では,信頼できるマスタノード,mathbbN$サーバノードの$N,Kin mathbbN$ユーザを含む,情報理論による分散マルチユーザポイント関数の問題について検討する。
本稿では,全ての点関数の回復を保証し,正当性と情報理論のプライバシー制約を満たすマルチユーザスキームを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:32:04 GMT)
Unilateral Criticality and Phase Transition in the Cavity-Ising Model [4.7] 空洞結合型逆イジングモデルの位相図に一側臨界端(UCEP)と三臨界点(TCP)を報告する。
1階と2階のシグネチャを1つの方向依存エンドポイントに統一することにより、UCEPは質的に新しい位相遷移のクラスを導入する。
この研究は、放散の有無に関わらず、空洞結合多体系における新しい臨界現象を探求するための興味深いプラットフォームも提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:03:19 GMT)
BuzzSet v1.0: A Dataset for Pollinator Detection in Field Conditions [4.7] 実地条件下で収集した高分解能受粉体画像の大規模データセットについて述べる。
BuzzSetには、7,856枚の手動検証画像があり、3つのクラス(ミツバチ、バンブルビー、未確認昆虫)に8000以上の注釈付きインスタンスがある。
このモデルは、ミツバチとバンブルビーのF1スコア0.94と0.92の強い分類精度を達成し、これらの分類の混乱を最小限に抑える。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:58:39 GMT)
A Framework for Quantum Data Center Emulation Using Digital Quantum Computers [4.4] 本稿では,単一量子プロセッサを用いた分散量子コンピューティングシステムをエミュレートするフレームワークを提案する。
本稿では,相互に発生する雑音を定量的に定量化するために,量子衝突力学に基づく実験的な基底雑音モデルを提案する。
このフレームワークはIBMの量子ハードウェアを使って検証されており、リモートゲートの実行が成功したことを実証している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:04:54 GMT)
Flexible inference of learning rules from de novo learning data using neural networks [4.4] 本稿では,Denovo学習タスクにおける行動データから学習ルールを推論する柔軟なフレームワークを提案する。
これらの結果は、実験的なトレーニングプロトコルと行動デジタル双生児の発達を知らせる洞察を与える。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:20:11 GMT)
Simulated Laser Cooling and Magneto-Optical Trapping of Group IV Atoms [4.3] 本稿では, レーザー冷却によるSi, ゲルマニウム (Ge), スズ (Sn) および鉛 (Pb) の磁気光学的トラップ法を提案する。
我々はこのスキームをSnに適用することに重点を置いており、精度測定の応用に魅力的ないくつかの特徴を持っている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:52:06 GMT)
Automatic segmentation of Organs at Risk in Head and Neck cancer patients from CT and MRI scans [4.2] 296例のCTとMRI-T1で分画パイプラインを訓練した。
パイプラインはHaN-Segチャレンジで78.12%、HD3.42mmで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:01:53 GMT)
ChronoGraph: A Real-World Graph-Based Multivariate Time Series Dataset [4.2] ChronoGraphは、実世界のプロダクションから構築されたグラフ構造化多変量時系列予測データセットである。
ChronoGraphは、専門家がアノテートしたインシデントウィンドウを異常ラベルとして提供し、異常検出方法の評価を可能にする。
本稿では,予測モデル,事前訓練された時系列基礎モデル,標準異常検出器にまたがるベースライン結果について報告する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:59:52 GMT)
Using causal abstractions to accelerate decision-making in complex bandit problems [4.1] 本稿では,様々な抽象レベルで定義されたCMAB問題インスタンス間の共有情報を効率的に活用するアルゴリズムAT-UCBを提案する。
我々は,AT-UCBの利点を理論的に説明し,累積的後悔に対する新たな上限を通じて,様々な解像度と計算コストを持つ疫学シミュレータにAT-UCBを適用して実証的に説明する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:11:04 GMT)
A Framework for Supervised and Unsupervised Segmentation and Classification of Materials Microstructure Images [4.0] このフレームワークは、位相/クラスに応じてマイクログラフを分類するための教師なしおよび教師なしの学習手法を統合する。
特定のプロセスや材料群に関連するマイクロ構造クラスのデータベースを徐々に構築するために使用することができる。
本発明の枠組みは、データベースを拡張して性能を高めるとともに、新しい均質又は多相材料を反復的に特徴付けることができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:28:55 GMT)
Expansion of higher-dimensional cubical complexes with application to quantum locally testable codes [4.0] 任意の次元 t>0 に対して高次元立方体錯体を導入し、量子局所テスト可能符号に適用する。
t=4 の場合、我々の構成は「最も良い」量子 LTC の族を与える。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 22:22:44 GMT)
Theory of Mind Using Active Inference: A Framework for Multi-Agent Cooperation [4.0] 心の理論 (ToM) は、エージェントが自分の行動を計画しながら他人の信念を推論することを可能にする。
能動推論におけるToMの実装によるマルチエージェント協調への新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:51:30 GMT)
Concept-ROT: Poisoning Concepts in Large Language Models with Model Editing [4.0] 編集技術は、より複雑な振る舞いを、同様の効果で統合できることを示す。
本研究では,複雑な出力動作を示すトロヤ群を効率的に挿入するモデル編集法であるConcept-ROTを開発した。
我々の結果は、機械学習モデルに対するトロイの木馬攻撃の実用性と潜在的な影響に関する懸念をさらに動機付けている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:43:59 GMT)
Sat-DN: Implicit Surface Reconstruction from Multi-View Satellite Images with Depth and Normal Supervision [3.9] 高解像度衛星画像はますますアクセスしやすくなり、高速かつ位置に依存しない地上モデルの再構築が可能になった。
従来のステレオマッチング手法は細部を捉えるのに苦労するが、ニューラルレイディアンス場(NeRF)は高品質な再構成を実現する。
そこで我々は,Sat-DNを提案する。Sat-DNは,段階的に訓練されたマルチ解像度ハッシュグリッド再構築アーキテクチャを活用する新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:14:29 GMT)
AraHalluEval: A Fine-grained Hallucination Evaluation Framework for Arabic LLMs [3.8] 本稿では,アラビア語および多言語大言語モデル(LLM)の最初の幻覚評価について述べる。
本研究は,4つのアラビア事前学習モデル,4つの多言語モデル,および4つの推論モデルを含む合計12個のLLMを評価する。
その結果、すべてのモデルやタスクにおいて、事実の幻覚は忠実度エラーよりも一般的であることが判明した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:57:35 GMT)
Bridging the Regulatory Divide: Ensuring Safety and Equity in Wearable Health Technologies [3.6] 多くのオーバー・ザ・カウンタツールは規制グレーゾーンで運用されており、臨床検査なしで健康に関するデータやアウトプットを活用する。
医療用ウェルネスデバイスの普及により、現在の監視範囲を超えた安全リスクがもたらされる可能性がある。
本稿では,分散リスク,患者中心の成果,反復的改革を重視したアプローチを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:13:06 GMT)
Estimation of High-Dimensional Markov-Switching VAR Models with an Approximate EM Algorithm [3.6] 高次元時系列におけるレジームシフトは、金融への多くの応用において自然に生じる。
本稿では,マルコフスイッチングモデルに対するEMアルゴリズムを提案する。
また,てんかん発作を発症した患者に記録された脳脳波データセットを解析し,そのアルゴリズムを実証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:21:04 GMT)
Towards Personalized Explanations for Health Simulations: A Mixed-Methods Framework for Stakeholder-Centric Summarization [3.5] 本稿では、利害関係者のニーズを特定し、健康シミュレーションの調整された説明を生成するための段階的枠組みを提案する。
本手法は, 多様な健康関係者のニーズと様式的嗜好をまず引き出すことで, 混合メソッド設計を用いている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:07:31 GMT)
SLM-Bench: A Comprehensive Benchmark of Small Language Models on Environmental Impacts--Extended Version [3.5] 小型言語モデル (SLM) は計算効率とアクセシビリティを提供する。
SLM-Benchは、複数の次元にわたるSLMを評価するために設計された最初のベンチマークである。
SLM-Benchは、正確性、計算、消費の11のメトリクスを定量化し、効率トレードオフの総合的な評価を可能にする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:23:22 GMT)
How Can I Publish My LLM Benchmark Without Giving the True Answers Away? [3.4] 大規模言語モデル(LLM)ベンチマークをインターネット上で公開することで、将来のLLMを汚染するリスクがある。
一般的な緩和策は、ベンチマークを非公開にし、参加者がモデルや予測をオーガナイザに提出できるようにすることである。
質問に対する根本的回答を完全に開示することなく,ベンチマークを公開する方法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:35:33 GMT)
CircInspect: Integrating Visual Circuit Analysis, Abstraction, and Real-Time Development in Quantum Debugging [3.1] 量子ソフトウェア開発は、量子コンピューティングの確率論的性質による複雑さを導入している。
ブレークポイントとリアルタイムソフトウェア開発機能を活用することで、Toolnameemはユーザに対して、分離された量子回路コンポーネントの分析、プログラム出力の監視、構造的変化の可視化、抽象的な情報による理解の強化を可能にします。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:07:34 GMT)
Who Pays for Fairness? Rethinking Recourse under Social Burden [3.1] 本稿では,アルゴリズムにおける不公平性を理論的に評価する。
次に,実践的アルゴリズム(MISOB)とともに,社会的負担に基づく新たなフェアネスフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:53:42 GMT)
Spatial-aware Transformer-GRU Framework for Enhanced Glaucoma Diagnosis from 3D OCT Imaging [3.1] 本稿では3次元光コヒーレンス・トモグラフィー(OCT)画像の診断値を利用した新しいディープラーニングフレームワークを提案する。
我々は、リッチスライスな特徴抽出のための網膜データに事前学習された視覚変換器と、スライス間空間依存性をキャプチャするための双方向Gated Recurrent Unitを統合する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:22:57 GMT)
Online time series prediction using feature adjustment [3.1] 時系列予測は、様々な領域において重要な意味を持つ。
時系列オンライン学習手法は2つの主要な側面に焦点を当てている。
本研究は,データに影響を及ぼす潜在因子の変化から分布変化が生じることを示唆する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:54:48 GMT)
SoK: Root Cause of $1 Billion Loss in Smart Contract Real-World Attacks via a Systematic Literature Review of Vulnerabilities [3.0] 我々は71の学術論文をレビューし、24のアクティブおよび5の非推奨脆弱性のカタログを構築する。
我々は2022年から2025年にかけて、最も深刻な実世界の攻撃のうち50件について、根本原因を特定するための詳細な実験的な分析を行った。
我々は、多くのインシデントは、孤立した脆弱性ではなく、人間、運用、経済設計の欠陥の組み合わせによって引き起こされるものであり、攻撃を可能にするために実装バグと結びついていることを明らかにすることによって、"エクスロイト・チェーン"の概念を紹介した。
実際の攻撃の成功は、プロトコルロジック設計、ライフサイクルとガバナンス、外部依存関係、古典的なスマートコントラクトの脆弱性の4つのティアの1つに遡る。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:01:54 GMT)
Measuring Bias or Measuring the Task: Understanding the Brittle Nature of LLM Gender Biases [3.0] 本稿では, 課題評価の目的が, LLMの性別バイアスに与える影響について検討する。
たとえ小さな急進的な変化であっても、バイアスの結果を著しく変え、時にはその方向性を完全に逆転させる可能性があることが分かっています。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:32:18 GMT)
Improved sampling algorithms and Poincaré inequalities for non-log-concave distributions [3.0] これは$d$と$frac1epsilon$である。 $L=mathcalO(1)$と$M=mathrmpoly(d)$である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:53:47 GMT)
Completing Spatial Transcriptomics Data for Gene Expression Prediction Benchmarking [2.7] 26の公開データセットからなるデータベースであるSpaREDと、最先端のトランスフォーマーに基づく遺伝子発現補完モデルであるSpaCKLEを紹介する。
我々の貢献は、これまででもっとも包括的な組織像からの遺伝子発現予測のベンチマークとなっている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:06:07 GMT)
Continuous Monitoring of Large-Scale Generative AI via Deterministic Knowledge Graph Structures [2.7] そこで本研究では,決定論的・大規模言語モデル(LLM)生成知識グラフ(KG)を用いて,AIの信頼性を計測する手法を提案する。
i) 明示的な規則に基づく手法,辞書,構造化エンティティ関係抽出規則を用いて構築された決定論的KGと,(ii) ライブニュース記事などのリアルタイムデータストリームから動的にLLM生成したKGの2つのKGを構築する。
Instantiated Class Ratio(ICR)、Instantiated Property Ratio(IPR)、Class Instantiation(CI)など、いくつかの確立されたKG指標を用いる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:34:49 GMT)
Image Embedding Sampling Method for Diverse Captioning [2.7] 本研究では,異なる画像領域に明示的に参加することで,キャプションの多様性と情報提供性を向上する学習自由フレームワークを提案する。
提案手法は,画像キャプションのアライメント,セマンティックな整合性,多様性の観点から,より大規模なモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:00:25 GMT)
One Small Step with Fingerprints, One Giant Leap for De Novo Molecule Generation from Mass Spectra [2.6] 我々は、エンコーダとしてMIST、デコーダとしてMolForgeを採用し、パフォーマンスを向上させるために追加のトレーニングデータを活用する。
これにより従来の最先端手法よりも改善され、MassSpecGymの質量スペクトルから分子構造のトップ-1 28%/トップ-10 36%が正確に生成される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:10:11 GMT)
Privacy Risks in Time Series Forecasting: User- and Record-Level Membership Inference [2.6] 時系列予測のための2つの新しいメンバシップ推論攻撃を導入する。
我々はこれらの手法を、分類設定による他の主要な攻撃の適応バージョンに対してベンチマークする。
以上の結果から,予測モデルには脆弱性があり,ユーザレベルの攻撃が検出に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:43:45 GMT)
Towards an Action-Centric Ontology for Cooking Procedures Using Temporal Graphs [2.5] 本稿では、レシピを指示されたアクションプロセス、転送、環境、キャプチャ、構成構造として表現するためのドメイン固有言語を紹介します。
この作業は、構造化されたマシン理解、正確な解釈、料理プロセスのスケーラブルな自動化を可能にするために、時間グラフを使用して、調理のためのアクション中心に向けた最初のステップを表す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:34:56 GMT)
From Lines to Shapes: Geometric-Constrained Segmentation of X-Ray Collimators via Hough Transform [2.3] X線画像の衝突は、関心領域(ROI)への曝露を制限し、患者に適用される放射線線量を最小限にする。
我々は、その幾何学に本質的に制約された深層学習に基づくセグメンテーションを導入する。
我々は,実X線画像の多彩なテストセットに対して,中央値のハウスドルフ距離4.3-5.0mmのコリメート領域の頑健な再構成を実証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:53:45 GMT)
Linguistic Hooks: Investigating The Role of Language Triggers in Phishing Emails Targeting African Refugees and Students [2.2] フィッシングと高度な電子メールベースの社会工学的攻撃は、難民や移民学生のような脆弱な人口に不釣り合いに影響を及ぼす。
米国では,新たに再定住したアフリカ系難民を対象に,デジタルリテラシーワークショップを実施し,個人情報の保護方法の理解を深めた。
本研究は,3つのグループを対象に,言語的手がかりを念入りに設計した電子メールを用いた実世界のフィッシング偽造調査を行った。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:13:04 GMT)
Attn-Adapter: Attention Is All You Need for Online Few-shot Learner of Vision-Language Model [2.2] Attn-Adapterは、CLIPの適応性を高める新しいオンライン数発学習フレームワークである。
我々の設計では、サポート例を使ってカテゴリ埋め込みを洗練するMemory Attn-Adapterと、ローカル機能とグローバル機能を統合することで画像埋め込みを強化したLocal-Global Attn-Adapterという2つのコンポーネントを通じて、データセット固有の情報を組み込んでいる。
Attn-Adapterは、クロスカテゴリとクロスデータセットの一般化において最先端のメソッドより優れており、CLIPバックボーン間の効率的な推論とスケーリングを維持している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:42:02 GMT)
Extending FKG.in: Towards a Food Claim Traceability Network [2.2] インド料理の知識グラフであるFKG[.]inの拡張として,FCN(Food Claim-Traceability Network)を提案する。
FCNは、食品関連のクレーム抽出と検証のために、キュレートされたデータ入力、構造化スキーマ、および証明対応パイプラインを統合する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:54:35 GMT)
Towards Reasoning for PDE Foundation Models: A Reward-Model-Driven Inference-Time-Scaling Algorithm [2.2] 本稿では,シミュレーション中に計算資源を利用するPDEのためのテスト時間コンピューティング(TTC)戦略を導入し,より正確な予測を行う。
TTCは、標準の非適応的自己回帰推論に対して改善された相対予測をキャプチャする。
このフレームワークは、より高度な推論アルゴリズムやPDEモデリングへの基礎的なステップであり、強化学習に基づくアプローチを取り入れている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:40:37 GMT)
dsld: A Socially Relevant Tool for Teaching Statistics [2.2] データサイエンスルックス・アット・差別(Data Science Looks At Discrimination)とは、人種、性別、年齢などの属性を含む識別の問題を調べるための総合的な分析的およびグラフィカルな手法を提供するRパッケージである。
付随する80ページのQuartoの本は、学生や法律専門家がこれらの原則を理解し、実際のデータに適用することをガイドしている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:44:46 GMT)
T-cell receptor specificity landscape revealed through de novo peptide design [2.2] 我々はT細胞受容体(TCR)とMHC(Major Histocompatibility Complexs)に提示されるペプチドとの相互作用を予測するための計算手法を導入する。
HERMESは、タンパク質の宇宙で訓練された構造に基づく物理誘導機械学習モデルであり、局所構造環境に基づいてアミノ酸の嗜好を予測する。
本手法は免疫原性ペプチドおよびネオ抗原設計のためのプラットフォームとTCR特異性の評価のためのプラットフォームを提供し,人工T細胞療法とワクチンの設計を知らせる計算フレームワークを提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:16:08 GMT)
Reservoir Predictive Path Integral Control for Unknown Nonlinear Dynamics [2.2] 本稿では, エコー状態ネットワーク (ESN) とモデル予測経路積分 (MPPI) の制御を統合し, 高速オンライン識別と未知のダイナミクスの制御の課題に対処する。
提案した貯水池予測経路積分(RPPI)は, ESNを用いた非線形力学の高速学習を可能にし, 並列化MPPI制御計算において, 学習された非線形性を直接活用する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:05:17 GMT)
Enhanced Generative Data Augmentation for Semantic Segmentation via Stronger Guidance [2.1] 制御可能拡散モデルを用いたセマンティックセグメンテーションのための効果的なデータ拡張パイプラインを提案する。
提案手法は,クラス・プロンプト・アペンディングとビジュアル・プライオリティ・ブレンディングを用いた効率的なプロンプト生成を含む。
このパイプラインは,セマンティックセグメンテーションのための高品質な合成画像を生成する上での有効性を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:32:46 GMT)
A Re-ranking Method using K-nearest Weighted Fusion for Person Re-identification [2.1] 本稿では,隣人の特徴を集約することで,多視点特徴を効率よく生成する手法を提案する。
本手法は,マーケット1501,MSMT17,Occluded-DukeMTMCの人物識別データセットについて検討した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:29:25 GMT)
An invertible generative model for forward and inverse problems [2.0] 我々は、生成モデルを訓練し、(可能性からサンプルを)シミュレートし、推論を行えるようにします。
シミュレーションや推論に使用できる2つの三角形写像(上と下)を1つの可逆写像に組み合わせる方法を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:04:10 GMT)
Quantifying Calibration Error in Neural Networks Through Evidence-Based Theory [2.0] 本稿では、予測エラー(ECE)の評価に主観的論理を組み込むことにより、ニューラルネットワークの信頼性を定量化する新しい枠組みを提案する。
我々は,MNISTおよびCIFAR-10データセットを用いた実験により,信頼性が向上したことを示す。
提案されたフレームワークは、医療や自律システムといったセンシティブな分野における潜在的な応用を含む、AIモデルのより解釈可能でニュアンスな評価を提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:15:53 GMT)
i-Mask: An Intelligent Mask for Breath-Driven Activity Recognition [2.0] i-Maskは、センサーを内蔵したカスタム開発マスクを用いて捕食された吸気パターンを活用する新しいHARアプローチである。
実験の結果,アプローチの有効性を検証し,95%以上の精度を達成し,医療・フィットネス分野での可能性を強調した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:42:43 GMT)
Finetuning AI Foundation Models to Develop Subgrid-Scale Parameterizations: A Case Study on Atmospheric Gravity Waves [1.9] 我々は、訓練済みAI基礎モデル(FM)を微調整することで、小規模気候プロセスの機械学習パラメータ化を開発するための新しいアプローチを提案する。
2.3億パラメータFMからの事前学習エンコーダデコーダを微調整し、大気重力波(GW)の深層学習パラメータ化を行う。
月平均値と機械学習モデルベースラインとの即時進化の比較により、FMパラメータ化の大気中における優れた予測性能が示された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:05:54 GMT)
How many patients could we save with LLM priors? [1.8] 多施設臨床試験における有害事象の階層的ベイズモデリングのための新しい枠組みを提案する。
我々の手法は,事前学習された大言語モデル(LLM)を用いて,モデルから事前情報を直接取得する。
この方法論は、より効率的で専門家にインフォームドされた臨床試験設計の道を開く。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:23:35 GMT)
Axiomatics of Restricted Choices by Linear Orders of Sets with Minimum as Fallback [1.8] 本研究では,選択関数の集合が制限されるような選択関数を実現するために,線形順序をどのように利用できるかを検討する。
線形順序の最小元としてフォールバック値が符号化された場合でも、選択肢の集合上の線形順序で選択関数を常に構築できることが示される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:04:10 GMT)
Exploring Linguistic Features for Turkish Text Readability [1.8] 本稿では,トルコ語テキストの自動可読性評価に関する最初の総合的研究について述べる。
我々は、最先端の可読性ツールを開発するために、最先端のニューラルネットワークモデルと語彙、形態、構文、談話レベルの言語的特徴を組み合わせる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:06:14 GMT)
Tuning the the fundamental periodicity of the current-phase relation in multiterminal diffusive Josephson junctions [1.5] 4つの超伝導接点を持つ拡散型SNSジョセフソン接合は2つの接点間の電流位相関係を示すことができることを示す。
このチューニング性は超伝導量子回路のハミルトニアンの調整に応用できるかもしれない。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:59:32 GMT)
Domain Adaptation for Different Sensor Configurations in 3D Object Detection [1.5] 3次元物体検出におけるセンサ構成の異なる領域適応に対処する。
下流ファインチューニングと部分層ファインチューニングの2つの手法を提案する。
本研究は,多種多様な車両プラットフォームに3次元物体検出モデルを適用するための実用的でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:54:25 GMT)
An Interactive Tool for Analyzing High-Dimensional Clusterings [1.4] DRtoolはインタラクティブなツールで、分析者がその次元削減結果をよりよく理解し、診断することができる。
様々な分析プロットを使用して、結果に対する多面的な視点を提供し、正当性を決定する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:36:28 GMT)
DMN-Guided Prompting: A Framework for Controlling LLM Behavior [1.4] 決定モデルと表記法(DMN)は、構造化されたユーザフレンドリな方法で決定ロジックを定義するための標準化されたグラフィカルなアプローチを提供する。
本稿では、複雑な決定ロジックをより小さく管理可能なコンポーネントに分解するDMN誘導プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:12:36 GMT)
ATHAR: A High-Quality and Diverse Dataset for Classical Arabic to English Translation [1.4] 古典アラビア語は、アラブ文化、哲学、科学文学の黄金時代を包含する重要な時代である。
我々は古典アラビア語の翻訳データセットが不足していることを特定し、スコープやトピックに制限されることが多い。
ATHARデータセットは、66,000の高品質のアラビア語から英語への翻訳サンプルからなる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:48:48 GMT)
Classical optimization with imaginary time block encoding on quantum computers: The MaxCut problem [1.4] ITE-BEと呼ばれる新しい手法を開発した。
我々は,本手法が他の量子アルゴリズムとうまく結合できることを実証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:49:48 GMT)
Towards Stable and Personalised Profiles for Lexical Alignment in Spoken Human-Agent Dialogue [1.3] 本研究では,安定な個人化された語彙プロファイルの構築を語彙アライメントの基礎として検討する。
10分間の音声書き起こし後に作成された小型でコンパクトなプロファイルは、性能とデータ効率の両面で最高のバランスを示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:07:27 GMT)
Evaluating Quality of Gaming Narratives Co-created with AI [1.3] 本稿では,文献や専門家の知見からストーリー品質の次元を合成し,それらがプレイヤーの満足度に与える影響を理解するために,Kanoモデルフレームワークにマッピングする。
その結果、ゲーム開発者に対して、生成AIと共同でゲーム物語を作成する際の品質面の優先順位付けについて通知することができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:13:42 GMT)
TAGAL: Tabular Data Generation using Agentic LLM Methods [1.3] データ生成は、機械学習タスクのパフォーマンスを改善するための一般的なアプローチである。
本稿では,エージェントワークフローを用いて合成表データを生成可能なメソッドの集合であるTAGALを提案する。
TAGALは、LLM(Large Language Models)のトレーニングを必要とする最先端のアプローチと同等に動作し、一般に他のトレーニング不要のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:25:14 GMT)
When the Past Misleads: Rethinking Training Data Expansion Under Temporal Distribution Shifts [1.3] 本研究では,過去のデータトレーニングウィンドウの拡大が,予測モデルの性能とアルゴリズム的公正性に与える影響について検討する。
公平性の観点から言えば、モデルがより偏りのある予測を生成するのは、概念のシフトの大きさが社会デマログラフ群によって異なる場合である。
トレーニングウィンドウを拡張する際には、コンセプトシフトがパフォーマンスの劣化に重要な要因であることが分かりました。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:23:54 GMT)
Adversarial Bug Reports as a Security Risk in Language Model-Based Automated Program Repair [1.2] 自動プログラム修復(APR)システムは、現代のソフトウェア開発にますます統合されている。
本稿では,敵のバグ報告によるセキュリティリスクについて検討する。
我々は、包括的脅威モデルを開発し、そのような攻撃に対する最先端のAPRシステムの脆弱性を評価するための実証的研究を行う。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:41:57 GMT)
When three experiments are better than two: Avoiding intractable correlated aleatoric uncertainty by leveraging a novel bias--variance tradeoff [1.2] 実世界の実験シナリオは、ヘテロスケダティックなアレタリックな不確実性の存在によって特徴づけられる。
実験ラウンド間のバイアスを直接低減する新しいアクティブラーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:23:54 GMT)
STM-Graph: A Python Framework for Spatio-Temporal Mapping and Graph Neural Network Predictions [1.1] 我々は、生の時間的都市イベントデータをグラフニューラルネットワーク(GNN)のトレーニングと予測に適したグラフ表現に変換する、オープンソースのPythonフレームワークであるSTM-Graphを紹介する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:36:48 GMT)
Shadow Quantum Linear Solver: A Resource Efficient Quantum Algorithm for Linear Systems of Equations [1.1] 本稿では,デジタル量子デバイス上での量子線形システム問題(QLSP)の解法を提案する。
その結果、大きな制御されたユニタリの必要性を回避し、システムサイズで対数的な多くの量子ビットを必要とする量子アルゴリズムが実現した。
これを、線形代数の分解定理を利用して、2次元格子における離散化されたラプラス方程式を解くことで、実用的妥当性の物理問題に適用する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:53:49 GMT)
Plugging Attention into Power Grids: Towards Transparent Forecasting [1.1] 本研究は,フランスとイギリスにおける2つの実世界の電力消費データに対して,グラフニューラルネットワーク(GNN)の広範なセットを評価した。
以上の結果から,GCN,SAGE,APPNPといったより単純なモデルの方が,低データレシエーションにおいてより複雑な選択肢よりも優れていることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:05:09 GMT)
Dynamic Range Reduction via Branch-and-Bound [1.0] ハードウェアアクセラレーターを強化するための主要な戦略は、算術演算における精度の低下である。
本稿ではQUBO問題における精度向上のための完全原理分岐境界アルゴリズムを提案する。
実験は、実際の量子アニール上でのアルゴリズムの有効性を検証する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:22:10 GMT)
Assessing Large Language Models in Comprehending and Verifying Concurrent Programs across Memory Models [1.0] GPT-4、GPT-4o、Mistral-AIのLarge2は、問題の堅牢な理解を示している。
優れた性能にもかかわらず、選択されたLLMは、緩和されたメモリモデルの下でプログラムの正確性を検証する重要な課題に直面している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:49:22 GMT)
Error Detection Schemes for Barrett Reduction of CT-BU on FPGA in Post Quantum Cryptography [0.9] 本稿では,障害検出のための新しいアルゴリズムであるRecomputation with Swapped Operand (RESWO)を提案する。
RESWO は RENO と RESO のどちらよりも遅延が小さい。
RESWO, RENO, RESOの故障検出効率はほぼ100%である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:03:47 GMT)
K-Syn: K-space Data Synthesis in Ultra Low-data Regimes [0.8] このレターは周波数領域の機能レベルのモデリングに焦点をあて、超低データ状態であっても安定でリッチな生成を可能にする。
我々は、時間枠にまたがるk空間データを複数の融合戦略と統合し、生成軌道を操り、さらに最適化する。
実験により, 提案手法は低データレシエーションにおいて強い生成能力を有することが示された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:25:05 GMT)
Hardware-Aware Data and Instruction Mapping for AI Tasks: Balancing Parallelism, I/O and Memory Tradeoffs [0.8] 我々は、予測可能なニューラルネットワークの振る舞いを利用して、予測可能なディープラーニング推論のためのマッピングフレームワークを導入し、計算と通信の両方を事前に計画する。
このフレームワークは命令とデータの統一的なストリームを生成し、ハードウェアが自身の操作を実行し、情報をルーティングすることを可能にする。
これにより、I/O、オフチップメモリ、ホスト制御への依存が自然に減少する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:14:16 GMT)
Detecting Regional Spurious Correlations in Vision Transformers via Token Discarding [0.7] 本稿では,視覚変換器における突発的相関を検出する新しい手法を提案する。
また,浸潤性乳房腫瘤の集団分類において急激なシグナルを呈する症例も報告した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:40:40 GMT)
Thin-film Al0.30Ga0.70As (111) as a flat source of high-purity orthogonally polarized entangled photons [0.7] Al0.30Ga0.70Asを用いた平面光学ベースの通信用SPDCは、ポンプ出力当たりの光子対発生率が高く、帯域幅は最大0.24Hz/mW/nmである。
特定の層配向は偏光交絡状態の前提条件である偏光交絡光子の生成を促進する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:06:41 GMT)
Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning [0.7] 本稿では,実演を取り入れたロボットタスクの学習を目的とした,探索効率の高い深層強化学習と参照ポリシ(DRLR)フレームワークを提案する。
DRLRフレームワークはImitation Bootstrapped Reinforcement Learning (IBRL)と呼ばれるアルゴリズムに基づいて開発されている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:02:32 GMT)
Scalable Entanglement Detection in Quantum Systems via Fisher Linear Discriminant Analysis [0.7] 我々は機械学習を用いて絡み合った状態と分離可能な状態の分類を行い、古典的なフィッシャー線形判別分析(FLDA)の適用に焦点をあてる。
本研究では,異なる量子状態における本手法の性能を体系的に評価し,効率的な量子状態分類ツールとしての有効性を実証する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:22:45 GMT)
AutoPETIII: The Tracer Frontier. What Frontier? [0.7] 今年のエディションは、PET/CTスキャンで病変のセグメンテーションを実行できる完全自動アルゴリズムを開発することを目的としている。
我々は,nnUNetv2フレームワークを用いて,完全自動PET/CT病変分割を行うために,モデルの6倍アンサンブルの2セットをトレーニングした。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:13:49 GMT)
Safeguarding Patient Trust in the Age of AI: Tackling Health Misinformation with Explainable AI [0.6] 本稿では,医療情報と戦うためにESSRC INDICATEプロジェクトを通じて開発された説明可能なAIフレームワークを提案する。
17の研究の体系的なレビューにより、医療における透明なAIシステムの必要性が明らかとなった。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:29:34 GMT)
Robust training of implicit generative models for multivariate and heavy-tailed distributions with an invariant statistical loss [0.5] 我々は、引用2024トレーニングで導入されたISL(textitinvariant statistics loss)法に基づいて構築する。
重み付きおよび多変量データ分散を扱うように拡張する。
ジェネレーティブ・ジェネレーティブ・モデリングにおけるその性能を評価し、ジェネレーティブ・ディバイサル・ネットワーク(GAN)の事前学習技術としての可能性を探る。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:44:44 GMT)
Simplicity Lies in the Eye of the Beholder: A Strategic Perspective on Controllers in Reactive Synthesis [0.5] この貢献は、様々な文脈における戦略の複雑さに焦点を当てている。
記憶とランダム性に関する最近の結果について論じるとともに、戦略の複雑さという従来の概念を超えて何が起きているのかを簡単に見てみよう。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:54:19 GMT)
Diffusion on language model encodings for protein sequence generation [0.5] 本稿では,タンパク質言語モデル表現で動作する潜在拡散フレームワークであるDiMAを提案する。
私たちのフレームワークは、新しい、高品質で多様なタンパク質配列を一貫して生成します。
これは、タンパク質ファミリーの生成、モチーフの足場と埋め込み、折りたたみ特異的な配列設計を含む条件付き生成タスクをサポートする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:13:05 GMT)
HumAIne-Chatbot: Real-Time Personalized Conversational AI via Reinforcement Learning [0.5] textbfHumAIne-chatbotはAIによる会話エージェントで、新しいユーザプロファイリングフレームワークを通じて応答をパーソナライズする。
ライブインタラクションの間、オンライン強化学習エージェントは暗黙の信号を組み合わせることで、ユーザ毎のモデルを洗練する。
その結果、パーソナライズ機能を有効にすると、ユーザ満足度、パーソナライズ精度、タスク達成度が一貫した改善が見られた。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:16:38 GMT)
StoqMA vs. MA: the power of error reduction [0.5] StoqMAは、確率的局所ハミルトニアンの計算硬度を特徴づける。
2006年にBravyi、Bessen、TerhalがStoqMAを定義して以来、StoqMAは引き続きオープンである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:53:45 GMT)
Exponential improvements to the average-case hardness of BosonSampling [0.5] ランダムなBosonSampling実験の確率を出力するための加算誤差推定は、任意の$delta>0$に対して#P$-hardであることを示す。
また,BosonSamplingの古典的な平均的なサンプリング結果の難しさを初めて示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:11:55 GMT)
Replication Study and Benchmarking of Real-Time Object Detection Models [0.4] 複数のグラフィクスカードにおける物体検出モデルの精度と推論速度を比較した。
本稿では,MMDetectionの機能に基づく統合トレーニングと評価パイプラインを提案し,モデルの比較を改良する。
結果は精度と速度の間に強いトレードオフを示し、アンカーフリーモデルが優勢である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:21:13 GMT)
Quantum Estimation in QED Scattering [0.4] 電子ミューオンおよびコンプトン散乱における物理パラメータの量子フィッシャー情報行列(QFIM)を木レベルで数値計算する。
特に,重心3モーメンタム等級と極散乱角の推定について検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:49:21 GMT)
Echoes Before Collapse: Deep Learning Detection of Flickering in Complex Systems [0.4] 畳み込み長短期記憶(CNN LSTM)モデルがフリックリングパターンを正確に識別できることを示す。
これらの結果から,ディープラーニングは雑音の非線形時系列から早期警告信号を抽出できることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 22:06:30 GMT)
Reinforcement Learning for Robust Ageing-Aware Control of Li-ion Battery Systems with Data-Driven Formal Verification [0.3] 対処すべき根本的な課題は、充電速度と老化行動のトレードオフである。
我々は高忠実度物理ベースのバッテリモデルに頼り、データ駆動充電と安全プロトコル設計へのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:01:03 GMT)
Analysis of Bluffing by DQN and CFR in Leduc Hold'em Poker [0.3] 我々は、DQNとCFRの2つの人気アルゴリズムが、Leduc Hold'emでブラッフィング行動を示すかどうかを調べた。
DQNとCFRはどちらもブラッフの挙動を示すが、異なる方法で行う。
これは、ブラフティングがアルゴリズムではなく、ゲームの本質的な側面であることを示している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:40:24 GMT)
Telecommunications fiber-optic and free-space quantum local area networks at the Air Force Research Laboratory [0.3] 通信帯域周波数で動作するQLAN(Quantum Local Area Networks)の開発について報告する。
本稿では3つのネットワークのネットワークトポロジと詳細なリンク特徴データについて述べる。
森林環境下での繊維配置における時間エネルギーベル状態の絡み合い分布を実証した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:24:40 GMT)
Mitigating Bias in Text Classification via Prompt-Based Text Transformation [0.3] テキストの書き直しをChatGPTに促すことが、意味を保ちながら人口統計信号を減少させるかどうかを検討する。
その結果, テキスト分類におけるバイアス軽減のための実践的, 一般化可能な手法として, プロンプトベースの書き直しが提案されている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:56:39 GMT)
Text2Cypher: Data Pruning using Hard Example Selection [0.2] 大規模言語モデル(LLM)は、Text2やText2Cypherといったモデルを通じて、データベースとの自然言語インタラクションを可能にする。
これらのモデルを微調整するには、通常、非自明な例を含む大規模で多様なデータセットが必要である。
本稿では,Text2Cypherデータセットを抽出するための5つのハードサンプル選択手法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:41:13 GMT)
Comparative Evaluation of Large Language Models for Test-Skeleton Generation [0.2] 本稿では,Large Language Models (LLMs) を用いて,テストスケルトンの自動生成について検討する。
テストスケルトンは、完全なテストロジックを実装することなく、ユニットテストカバレッジを概説する構造的テンプレートである。
大学ソフトウェア工学コースで開発された実世界のRubyクラスに対して,RSpecスケルトンを生成する能力に基づいて4つのLLMを評価した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:02:52 GMT)
Text2Cypher Across Languages: Evaluating and Finetuning LLMs [0.2] 本論文では,複数の言語を対象としたText2Cypherタスクにおける基礎的および微調整LLMの性能について検討する。
英語の質問をスペイン語とトルコ語に翻訳することで、多言語データセットを作成し、リリースします。
標準化されたプロンプトとメトリクスを用いて、いくつかの基礎モデルを評価し、一貫したパフォーマンスパターンを観察する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:01:56 GMT)
Quantum Computing for Discrete Optimization: A Highlight of Three Technologies [0.1] 本研究の目的は,オペレーショナルリサーチ(OR)と量子コンピューティングコミュニティの学際的な研究を促進することである。
異なる種類の量子ハードウェアを市場に投入する3つの量子パワー最適化手法を検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:16:59 GMT)
Federated Isolation Forest for Efficient Anomaly Detection on Edge IoT Systems [0.1] 本稿では,前述のフェデレート学習フレームワークを用いて,孤立林を用いた温度異常検出手法を提案する。
このシステムは実験的に評価され、正常な読解と異常な読解を区別する精度を96%以上達成している。
結果は、データプライバシと協調学習の連合学習原則を支持しながら、リソース制約のある環境とエッジシステムに対する適合性を強調している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:08:01 GMT)
From Leiden to Pleasure Island: The Constant Potts Model for Community Detection as a Hedonic Game [0.0] 本稿では,ネットワークを不連続なコミュニティに分割するための定数ポットモデル(CPM)のゲーム理論的視点を示す。
その効率性、堅牢性、正確性を強調します。
部分的地平情報を用いて初期分割をブートストラップするコミュニティトラッキングシナリオにおいて,ロバスト分割は地平情報の回復において高い精度が得られることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:50:54 GMT)
Infinite temperature at zero energy [0.0] 我々は、周期駆動(フロケット)系の固有状態特性を継承する局所ハミルトン系の族を構築する。
我々の構成は、固有状態が無限温度の特性を持つハミルトニアンをもたらす。
次に、固有状態が無限温度でETHに従うことが示される、正確に解けるフロケ量子回路の族を構築する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:31:41 GMT)
Wigner-negative states in the steady-state emission of a two-level system driven by squeezed light [0.0] 負値のウィグナー分布を持つ光の伝播モードは、量子光学において基本的な関心を持つ。
有限帯域の二次的光によって駆動される2レベル系の定常放出の時間モードにおけるウィグナー負性率の決定論的生成の可能性を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:26:10 GMT)
What fifty-one years of Linguistics and Artificial Intelligence research tell us about their correlation: A scientometric analysis [0.0] この研究は、1974年から2024年までの51年間にわたる知的生産を合成し、この相関関係を徹底的に科学的に分析する。
その結果、1980年代から1990年代にかけて、言語学とAI(AIL)の研究は、時間とともに不安定な出版によって特徴づけられ、堅牢ではなかったことが示唆された。
言語学とAIの相関関係は、いくつかのレベル、研究センター、ジャーナル、そしてAILの知識生産を形作り、将来のフロンティアを形作る国で確立されていると結論付けている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:25:45 GMT)
Wavefront correction of high-dimensional two-photon states via coherence-entanglement transfer [0.0] 典型的な戦略は、古典的なビーコンビームを使用して、波面歪みを学習し、修正することである。
本稿では、量子状態自体を用いて光歪みを補正する高速で効率的な波面補正手法を提案する。
提案手法は,量子イメージングと通信プロトコルの実践的実装の道を開くものである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:44:45 GMT)
Wave Packet Sizes in Quantum Mechanical Scatterings: New Perspective [0.0] 粒子の大きさは物質との相互作用によって決定され、環境に依存する。
本稿では,ウェーブパケットサイズとその意味について検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:57:45 GMT)
TriLiteNet: Lightweight Model for Multi-Task Visual Perception [0.0] TriLiteNetは低計算コストを維持しながら性能を最適化するように設計されている。
提案モデルでは,パラメータがわずか0.14Mの小さな構成で,最小限の計算量でマルチタスクのソリューションを提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:48:25 GMT)
Towards violations of Local Friendliness with quantum computers [0.0] ローカルフレンドリ(LF)の不平等は、現実に関する合理的な仮定から導かれる。
EWFSの思考実験は、教科書の量子力学がこれらの不等式に反することを示している。
EWFSはフォトニックキュービットを使用して、友人のそれぞれの役割を担い、LFの違反を測定している。
この回路は量子シミュレータやハードウェアデバイス上で動作し、システムサイズがスケールするにつれてLF違反を観測する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:56:24 GMT)
Time, quantum entanglement, and particle decay [0.0] 不安定粒子を含む絡み合い実験における時間秩序の役割について検討した。
2人の実験者が行った測定値の相関分析を行った。
この知見は、コペンハーゲンによる測定の解釈は、物理的現実のリテラルな説明というよりも数学的ツールである、という見解を補強するものである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:53:24 GMT)
ThreatGPT: An Agentic AI Framework for Enhancing Public Safety through Threat Modeling [0.0] ThreatGPTは、公安システムの脅威を理解し分析するためのエージェント人工知能アシスタントだ。
ディープ・サイバーセキュリティの専門知識を必要とせず、ユーザーは自分の懸念するシステムのコンポーネントを単純に記述できる。
少数ショットの学習を使用して、AIはサンプルから学び、関連するスマート脅威モデルを生成する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:26:54 GMT)
The human biological advantage over AI [0.0] AIの最近の進歩は、AIシステムがいつか人間にできることは何でもできる、という可能性を高めている。
しかし、より深い考察は、人間とAIの見過ごされた差別化要因は脳ではなく、中枢神経系であることを示している。
CNSは製造や模擬はできず、生物学的な構造として育てなければならない。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:54:27 GMT)
The Hilbert-space structure of free fermions in disguise [0.0] ハミルトン多様体は自由フェルミオンに写像できるスピン鎖を記述するが、ジョルダン・ウィグナー変換を経由しない。
FFD ハミルトニアンに付随するヒルベルト空間を特徴づける一連の結果を提供する。
我々の構成により、すべてのハミルトニアン固有空間の指数退化が完全に解決できる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:40:18 GMT)
The Auth Shim: A Lightweight Architectural Pattern for Integrating Enterprise SSO with Standalone Open-Source Applications [0.0] オープンソースソフトウェアOSSはエンタープライズ環境で広く採用されているが、スタンドアロンツールはIAMやOIDCのようなプロトコルをネイティブにサポートしていないことが多い。
本稿では,この問題を解決するために設計された軽量アーキテクチャパターンであるAuth Shimを紹介し,形式化する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:48:54 GMT)
Technology prediction of a 3D model using Neural Network [0.0] 本稿では、露光したジオメトリを持つ製品の3次元モデルから製造工程とその持続時間を直接予測するデータ駆動型アプローチを提案する。
モデルを複数の2Dイメージにレンダリングし、Generative Query Networkにインスパイアされたニューラルネットワークを活用することにより、事前に定義された生産段階の幾何学的特徴を3秒以下の平均絶対誤差で時間推定にマッピングすることを学ぶ。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:23:01 GMT)
Synthetic Survival Data Generation for Heart Failure Prognosis Using Deep Generative Models [0.0] 心臓不全(HF)の研究は、プライバシー規制と制度上の障壁により、大きな共有可能なデータセットへのアクセスが制限されていることで制限されている。
12,552人のユニークな患者からなる施設データから合成HFデータセットを生成した。
ディープラーニングに基づく合成データ生成は、研究アプリケーションに適した高忠実でプライバシー保護のHFデータセットを生成することができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:17:58 GMT)
Signatures from Non-classical Features of Axion Dark Matter in Cavity Haloscopes [0.0] 本稿では,局所軸索ダークマター状態の非古典的特徴が空洞ハロスコープにどのように印加されるかを紹介する。
本稿では,局所軸索ダークマター状態の非古典的特徴が空洞ハロスコープにどのように印加されるかを紹介する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:33:52 GMT)
Sharp Convergence Rates of Empirical Unbalanced Optimal Transport for Spatio-Temporal Point Processes [0.0] 不均衡な最適輸送形式のための経験的プラグイン推定器を解析する。
実験的なカントロビッチ-ルビンシュタイン距離の最小値の最適値に近づいた。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:55:01 GMT)
Segmenting Action-Value Functions Over Time-Scales in SARSA via TD($Δ$) [0.0] 本研究は、現在SARSA($Delta$)と指定されているSARSAアルゴリズムに適用することにより、時間差分分解法であるTD($Delta$)を強化する。
アクション値関数を特定の割引要因に関連付けられたコンポーネントに分割することで、SARSA($Delta$)は、さまざまな時間スケールでの学習を容易にする。
本研究の結果から,提案手法は,SARSAの更新におけるバイアスの低減と,決定論的およびアタリ的設定における収束の高速化に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:01:56 GMT)
Searching for a physical description relative to a quantum system [0.0] システム内の粒子に関する標準的および関係的な記述は、任意のユニタリ変換によって達成できないことを示す。
量子参照フレームの問題に対処するための新たな戦略が求められている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:03:37 GMT)
Scattering and induced false vacuum decay in the two-dimensional quantum Ising model [0.0] 量子イジングモデルにおける散乱を2次元で研究する。
我々は、24ドル格子の24倍の波状パケットを作成し、テンソルネットワークで状態を進化させる。
我々は,高エネルギー散乱法により偽真空の激しい崩壊を誘発し,結果として生じる真真空気泡の拡散について検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:24:28 GMT)
Scaling Environments for Organoid Intelligence with LLM-Automated Design and Plasticity-Based Evaluation [0.0] 本稿では,オルガノイドをベースとした生物エージェントの訓練を目的とした,スケーラブルでクローズドループな3つの仮想環境を提案する。
電気生理学的,細胞,分子レベルでシナプス可塑性を測定することによって学習を評価するためのマルチモーダルアプローチについて概説する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:51:00 GMT)
SasAgent: Multi-Agent AI System for Small-Angle Scattering Data Analysis [0.0] SasAgentは、大規模言語モデル(LLM)を利用したマルチエージェントAIシステムである。
SasViewソフトウェアからのツールを活用することで,SAS(小角散乱)データ解析を自動化する。
ユーザフレンドリーなGradioベースのインターフェースは、ユーザアクセシビリティを向上させる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:23:23 GMT)
SAMVAD: A Multi-Agent System for Simulating Judicial Deliberation Dynamics in India [0.0] 本稿では,インドの司法制度の枠組み内での審議プロセスのシミュレーションを目的とした,革新的なマルチエージェントシステム (MAS) であるSAMVADを紹介する。
我々の制度は、裁判官、検察官、弁護人、複数の行政官(司法ベンチを模擬する)など、主要な司法職を代表するエージェントで構成されている。
この研究の主な貢献は、インドにおけるランドマークな法律文書のドメイン固有の知識基盤に根ざした、検索型拡張世代(RAG)の統合である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:04:44 GMT)
Revealing the empirical flexibility of gas units through deep clustering [0.0] 我々は、その発電からガスユニットの実証的な柔軟性を学び、現実世界の限界が、同様の技術的特性を持つユニット間でどのように違いをもたらすかを明らかにした。
我々の教師なしアプローチは、ピークユニットの2つのクラスタ(高い柔軟性)と非ピークユニットの2つのクラスタ(低い柔軟性)を識別する。
主に産業や自治体が所有する非話者は、低い残量と負の価格に対する反応が限られている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:06:07 GMT)
Revealing higher-order neural representations of uncertainty with the Noise Estimation through Reinforcement-based Diffusion (NERD) model [0.0] ノイズ予測」HORは、脳が自身のノイズについて学ぶ必要があるかもしれないタスクのニューラルデータを用いて研究する。
本研究は, 強化型拡散モデルによる騒音推定手法を開発し, 応用するものである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:35:59 GMT)
Response of a classical mesoscopic oscillator to a two-level quantum system [0.0] 単一量子ビットに結合した古典的機械振動子の力学について検討する。
量子ビットの影響は決定論的かつ力として現れ、初期量子状態に依存する。
この結果から,古典的雑音スペクトルによる量子状態再構成の経路が示唆された。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:46:09 GMT)
Residual gauge theory for quanta of surface plasmons [0.0] 我々は、表面プラズモンの量子化を研究するためのゲージ理論の枠組みを開発する。
我々は、物理状態に制約方程式を課す残留ゲージ対称性が、ジュール加熱と根本的に関連していることを強調した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:38:45 GMT)
Quantum circuits for simulating linear interferometers [0.0] 作業プロトコルの量子証明に関する最近の提案に触発され,線形光干渉計のシミュレーション手法について検討した。
我々は、量子コンピュータのレジスタが光学モードを表す第2の量子化アプローチに焦点を当てる。
次に、標準量子光学技術を用いて、干渉計を記述するユニタリ行列を2対2のユニタリの配列に分解することができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:08:56 GMT)
Quantum Zeno effect versus adiabatic quantum computing and quantum annealing [0.0] 一般結合による脱コヒーレンスの影響について検討した。
量子ゼノ効果は性能に強い制限を与える。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:41:02 GMT)
Quantum AI Algorithm Development for Enhanced Cybersecurity: A Hybrid Approach to Malware Detection [0.0] 本研究では、サイバーセキュリティ脅威検出のための量子機械学習(QML)アルゴリズムの適用について検討する。
我々は、マルウェア検出タスクのための量子ニューラルネットワーク(QNN)、量子サポートベクトルマシン(QSVM)、ハイブリッド量子畳み込みニューラルネットワーク(QCNN)など、様々なQMLアルゴリズムを実装し、評価する。
QML法は従来の手法に比べて優れた性能を示し,QNNでは95%,QSVMでは94%の精度を示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:28:05 GMT)
Pulling Back the Curtain on ReLU Networks [0.0] より深いニューロンの勾配は ミスアライメントで知られています ネットワークの内部表現を曖昧にします
この直観は後方通過のみにソフトゲーティングを適用して検証する。
結果として得られた変化した勾配は「励起プルバック」と呼ばれ、顕著な知覚的アライメントを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:05:54 GMT)
Prototyping an AI-powered Tool for Energy Efficiency in New Zealand Homes [0.0] ニュージーランドの住宅の質は歴史的に貧弱であり、断熱と非効率な暖房は広範なエネルギー難に寄与している。
Warmer Kiwi Homesプログラム、Healthy Homes Standards、H1 Building Codeなどの最近の改革は、健康と快適な改善をもたらしたが、課題は続いている。
本研究では,ニュージーランドにおける住宅エネルギー効率向上のためのAIによる意思決定支援ツールの設計と評価を行う。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:41:38 GMT)
Predicting Traffic Accident Severity with Deep Neural Networks [0.0] 機械学習の最近の進歩は、交通事故に関連するデータを研究するための代替手段を提供してきた。
新しいモデルは、不均衡なデータよりも優れた一般化と高い予測力を達成する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:08:44 GMT)
Pilot Study on Generative AI and Critical Thinking in Higher Education Classrooms [0.0] ジェネレーティブAI(GAI)ツールは、教育環境において急速に採用されているが、批判的思考の促進における彼らの役割は、まだ解明されていない。
このパイロット研究は、導入型計算・データサイエンスコースにおける生成AI出力の評価において、構造化された批判的思考を適用する学生の能力について検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:59:28 GMT)
Peptidomic-Based Prediction Model for Coronary Heart Disease Using a Multilayer Perceptron Neural Network [0.0] 冠動脈心疾患(CHD)は、世界中で死因の主要な疾患であり、毎年の医療費に大きく貢献する。
非侵襲的な診断手法を開発するために,マルチ層パーセプトロン(MLP)ニューラルネットワークに基づくモデルを構築した。
このモデルは95.67パーセントの精度、感度、特異性を達成し、F1スコアは0.9565である。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 04:54:02 GMT)
Pattern-Based File and Data Access with Python Glob: A Comprehensive Guide for Computational Research [0.0] globはPythonモジュールで、ワイルドカードパターンを使ってファイルの検索、フィルタリング、取り込みを行う簡単な方法を提供する。
本稿では,データサイエンス,ビジネス分析,人工知能アプリケーションのための汎用ツールとして,グロブを紹介する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 01:34:22 GMT)
Optimizing Districting Plans to Maximize Majority-Minority Districts via IPs and Local Search [0.0] 訴訟の再制限において、投票権法(英語版)の施行は、しばしば、現行の提案よりも多数派マイノリティ地区を多数示す地区計画を裁判所に提供することに関与している。
本稿では,複数データセット上の短いバーストを性能的に上回る整数型プログラミングを用いて,多数のマイノリティ領域を持つ州全体の計画を生成する階層列生成アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:25:50 GMT)
Observation of self-oscillating supersonic flow across an acoustic horizon in two dimensions [0.0] 2次元原子超流動における自己振動性超音速流の観測を報告する。
観測されたスーパーフローは、超光信号の準周期バーストによって変調されているように見える。
提案実験は, 原子超流動中で超音速流を生成する新しい方法を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:13:46 GMT)
Monte Carlo simulation of random circuit sampling in quantum computing [0.0] 量子ビット系におけるランダム状態と対応するビット列をサンプリングするモンテカルロ法を開発した。
大系の極限におけるポーター・トーマス分布をもたらす正確な確率密度関数を導出する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:12:19 GMT)
Modular Techniques for Synthetic Long-Context Data Generation in Language Model Training and Evaluation [0.0] 本研究は,大規模言語モデル (LLM) との即時相互作用による長文データ生成のためのモジュラーフレームワークを導入する。
このフレームワークは、Supervised Fine-Tuning (SFT)、Direct Preference Optimization (DPO)、Group Relative Policy Optimization (GRPO)など、複数のトレーニングとアライメントの目標をサポートする。
マルチターン対話、文書入力出力ペア、検証可能な命令応答タスク、長文推論例の4つのコア生成パラダイムを含んでいる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:22:16 GMT)
Mitigating Catastrophic Forgetting and Mode Collapse in Text-to-Image Diffusion via Latent Replay [0.0] 継続的な学習は自然知性の基本である。
「破滅的な忘れ」は、新しいタスクの学習が以前獲得した知識を消去するときに起こる。
Latent Replayは、生成AIモデルのための効率的な連続学習を可能にする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:45:22 GMT)
Measuring Multiparticle Indistinguishability with the Generalized Bunching Probability [0.0] 一般化された集団化確率は、入力ボソンの不明瞭性に関する有用な部分的情報を提供すると論じる。
シュル粒子の入力性の適用として、単一粒子密度行列がギブス状態であるとき、平均一般化された集合確率が温度計として機能することを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:57:26 GMT)
Measurement dependence in a Bell inequality arising from the dynamics of hidden variables [0.0] ベルの不等式は、測定前にシステムを記述する隠れ変数の構成を採用する確率は、測定された物理的性質の選択とは無関係である、という仮定に依存している。
我々は,測定対象の隠れ変数の力学モデルについて検討し,測定依存を生じさせる特徴や,できない特徴を明らかにする。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:43:33 GMT)
Local Thermal Operations and Classical Communication [0.0] ローカル・サーマル・オペレーション・アンド・クラシック・コミュニケーション(Local Thermal Operations and Classical Communication, LTOCC)は、遠隔実験のパラダイムと熱力学の制約を統一する新しい運用フレームワークである。
我々はLTOCCプロトコルの階層を確立し、異なるレベルの包摂関係を示し、半局所的な熱操作との深い関係を明らかにする。
我々は,LTOCCが単一・複数コピーCHSHシナリオに課した制限を提示し,前者および後者の熱的局所操作と熱的局所操作のギャップを示さず,絡み合いを検出する能力について述べる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:43:58 GMT)
Local Invariance of Divergence-based Quantum Information Measures [0.0] 量子情報量(quantum information amount)は、量子情報科学における量子システムとプロトコルの特徴付けに不可欠である。
一般化された発散に基づく情報測度の種類を特定し、局所的あるいは単体的変換の下でそれらの不変性を証明した。
本研究は,量子情報処理分野にまたがる応用により,多くの運用関連情報測度を特徴付け,計算する能力を向上させるものである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:18:03 GMT)
Laser-dressed partial density of states [0.0] 本稿では,レーザー被覆材料の電子動力学の詳細を明らかにするための新しい手法を提案する。
レーザー被覆されたPDOSは、レーザー被覆された電子密度を形成する結合の構造に関する情報を提供する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:30:29 GMT)
Iti-Validator: A Guardrail Framework for Validating and Correcting LLM-Generated Itineraries [0.0] 本研究では,多言語モデル(LLM)の時間的性能について検討する。
LLM生成した旅行経路の時間的一貫性を評価し改善する検証フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:11:57 GMT)
Integrating Pruning with Quantization for Efficient Deep Neural Networks Compression [0.0] プルーニングと量子化は、モデルのサイズを減らし、処理速度を向上させるために広く使われている圧縮技術である。
本稿では,類似性に基づくフィルタプルーニングとアダプティブ・パワー・オブ・ツー(APoT)量子化を統合し,高い圧縮効率を実現する2つの手法を提案する。
実験により,提案手法は精度の低下を最小限に抑え,効率的なモデル圧縮を実現することを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:17:28 GMT)
Influence of Stakeholder Involvement in M&E on the Performance of Donor-Funded Projects in Informal Settlements in Kisumu Central Sub-County, Kisumu County, Kenya [0.0] 本研究は, ケニア, キスム中央郡区の非公式集落における, ドナー支援事業におけるM&Eの利害関係者の関与が, ドナー支援事業の業績に及ぼす影響について検討した。
この調査は、ドナー支援プロジェクトのプロジェクトマネージャが、プロジェクトのオーナーシップと持続可能性に対するステークホルダーの関与を高める必要があることを推奨した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 06:18:35 GMT)
Imputation-free Learning of Tabular Data with Missing Values using Incremental Feature Partitions in Transformer [0.0] 本稿では,グラフデータに対する命令なしインクリメンタルアテンション学習(IFIAL)手法を提案する。
一対の注目マスクを変圧器に導出して、欠落した値を入力したり初期化したりすることなく、データを直接合理化する。
実験は、不足値の計算を含む手法と比較して、異なる値の型やレートに対するIFIALの頑健さを裏付けるものである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 14:19:58 GMT)
Improving Robustness of AlphaZero Algorithms to Test-Time Environment Changes [0.0] 潜在的に変化するテスト環境にAlphaZeroエージェントを配置する際の問題を分析する。
標準フレームワークへの単純な変更の組み合わせによって、パフォーマンスが大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:38:37 GMT)
Imitating Radiological Scrolling: A Global-Local Attention Model for 3D Chest CT Volumes Multi-Label Anomaly Classification [0.0] 3次元CTスキャンのマルチラベル分類は、データの体積特性と検出すべき異常の多様性のために難しい課題である。
畳み込みニューラルネットワーク(CNN)に基づく既存のディープラーニング手法は、長距離依存を効果的に捉えるのに苦労する。
我々は,3次元CTスキャン解析において,放射線技師のスクロール挙動をエミュレートする新しいグローバルアテンションモデルCT-Scrollを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:19:09 GMT)
ICSLure: A Very High Interaction Honeynet for PLC-based Industrial Control Systems [0.0] ハニーポットは、ターゲットシステムのエミュレートと攻撃行動をキャプチャすることで、そのような脅威を検出し、分析する手段を提供する。
伝統的なICSハニーポットは、1つのPLCのソフトウェアベースのシミュレーションに制限されることが多いが、敵と戦うのに必要な現実性は欠如している。
本研究では,物理PLCと高度な産業プロトコルを統合したICSLureというモジュール型ハニーネットフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:18:30 GMT)
Gravity Well Echo Chamber Modeling With An LLM-Based Confirmation Bias Model [0.0] 本稿では,ユーザの信念強化コンテンツに対する感受性に基づいて,プルの強度を調節する確認バイアス変数を提案する。
この因子は、エコーチャンバーをより正確に識別する確認バイアス積分重力井戸モデルを生成する。
我々の貢献は、オンライングループ力学における確認バイアスの役割を体系的に把握するための枠組みである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 02:41:35 GMT)
Generating non-Clifford gate operations through exact mapping between Majorana fermions and $\mathbb{Z}_4$ parafermions [0.0] 本稿では,Majorana fermions から $mathbbZ_4$parafermions への正確なマッピングを確立する。
マヨラナフェルミオンのブレイディングは、$mathbbZ_4$パラフェルミオンで囲まれた4次元のキュイト表現において、非クリフォード量子ゲートにつながる可能性がある。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:41:25 GMT)
From Predictions to Explanations: Explainable AI for Autism Diagnosis and Identification of Critical Brain Regions [0.0] 2つのモジュールを持つコンピュータ支援診断フレームワークを提案する。
最初のモジュールは、ASD分類のためのクロスドメイン転送学習を通じて微調整されたディープラーニングモデルを活用する。
第2のモジュールは、モデル決定を解釈し、重要な脳領域を特定することに焦点を当てている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:48:10 GMT)
From Frege to chatGPT: Compositionality in language, cognition, and deep neural networks [0.0] 我々は、哲学、認知科学、神経科学の幅広い読者のために、機械学習による最近の経験的研究をレビューする。
特に,我々は,合成一般化機能を備えたニューラルネットワークを実現するための2つのアプローチを強調した。
これらの発見が人間の認知における構成性の研究にもたらす意味について論じる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:13:50 GMT)
FFTArray: A Python Library for the Implementation of Discretized Multi-Dimensional Fourier Transforms [0.0] FFTArrayは,フーリエ変換の一般的な離散化を自動化するPythonライブラリである。
Python Array API標準に基づいて構築されたFFTArrayは、NumPy、JAX、PyTorchといった配列バックエンドとシームレスに統合される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 11:37:54 GMT)
Exceptional point rings and $PT$-symmetry in the non-Hermitian XY model [0.0] XYモデルの異方性パラメータ$lambda$を複素値に拡張することにより、2つの準エネルギーが縮退できることを示す。
非エルミートXYモデルにおいて、これらの準エネルギー退化は2つの固有値とその対応する固有ベクトルが結合する例外点(EP)をもたらす。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:04:59 GMT)
Ergodicity and hydrodynamics: from quantum to classical spin systems [0.0] 一般可観測物の自己相関関数の潜時流体力学テールの正確な性質は, (i) 動的臨界指数と (ii) 対応する可観測体の平衡熱力学特性によって決定されることを示す。
1次元と2次元のシステムに対して数値的な結果を提供し、エルゴディディティの概念にのみ依存する理論的な考察を提示する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 10:59:57 GMT)
Entropy from scattering in weakly interacting systems [0.0] 我々は、初期状態とサブシステムエントロピーが増加することを保証するS行列に対する驚くほど単純な基準を見出す。
これらの基準を満たす初期状態のクラスは、サブシステムの単純な積状態よりもより相関している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 23:59:31 GMT)
Ensemble of Pathology Foundation Models for MIDOG 2025 Track 2: Atypical Mitosis Classification [0.0] 病理基盤モデル(PFM)を大規模病理組織学データセットで事前訓練した。
我々はPFMを補完するために、最先端の畳み込みニューラルネットワークアーキテクチャであるConvNeXt V2を組み込んだ。
我々は,相補的な形態的洞察を統合するために複数のPFMをアンサンブルし,予備評価フェーズデータセット上でバランスの取れた精度を実現した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:59:33 GMT)
Emergent Social Dynamics of LLM Agents in the El Farol Bar Problem [0.0] 大規模言語モデル(LLM)エージェントの空間拡張型El Farol Bar問題における創発的社会的ダイナミクスについて検討する。
その結果、LSMエージェントはバーに行く自発的なモチベーションを生み出し、集団となって意思決定を変えた。
これらの結果は,従来のゲーム理論上の問題設定では扱えないグループ意思決定の新しいモデルが,LLMエージェントによって実現可能であることを示唆している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:09:42 GMT)
Emergence of Quantised Representations Isolated to Anisotropic Functions [0.0] 本稿では,既存のスポットライト共振法に基づく表現構造決定手法を提案する。
これは、アクティベーション関数のみを変更する制御されたアブレーション研究を通じて、オートエンコーダモデルにおいて、個々の表現がどのように出現し、組織化できるかを示す。
この手法を用いて、関数駆動対称性が表現に暗黙の帰納バイアスとして作用するかどうかを判定する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:48:24 GMT)
Design and Development of a Web Platform for Blood Donation Management [0.0] 献血は医療において重要な要素であるが、緊急時に適切な献血者を見つけることは重大な課題となることが多い。
本稿では,患者,ドナー,管理者をつなぐWebベースのシステムの設計と開発について述べる。
ドナー登録、血液リクエスト、コミュニケーションの合理化により、提案システムは緊急時の複雑さを低減させる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 17:42:39 GMT)
DGLAP-BFKL duality from QCD to quantum computers [0.0] DGLAP積分微分方程式は、メルリンモーメントの複素平面に特定の写像を適用することで解くことができる。
これは、$n$粒子に対するシュル「オーディンガー方程式」として書き換えることができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:44:51 GMT)
Cumplimiento del Reglamento (UE) 2024/1689 en robótica y sistemas autónomos: una revisión sistemática de la literatura [0.0] この体系的な文献レビューは、自律ロボットシステムにおけるEU(EU)2024/1689のコンプライアンス状況を分析する。
PRISMAプロトコルを用いて、IEEE Xplore、ACM DL、Scopus、Web of Scienceの243つの初期記録から22の研究が選ばれた。
発見は部分的な規制の整合性を示すが、説明可能性モジュール、リアルタイムな人間の監視、知識ベーストレーサビリティには大きなギャップが残っている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:56:33 GMT)
Constructing a Photonic Implementation of Quantum Key Distribution [0.0] 量子鍵分布(Quantum Key Distribution, QKD)は、量子力学の原理を用いて、通信をセキュアにするための革命的なアプローチである。
本研究の目的は,光学的QKDを実験室で実装することである。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 16:59:17 GMT)
Comparative Analysis of Transformer Models in Disaster Tweet Classification for Public Safety [0.0] 本研究では,災害関連ツイートの分類において,BERTを含むトランスフォーマーモデルの有効性を評価する。
BERTは高い精度(91%)を達成し、ロジスティック回帰やネイブベイズといった従来のモデルよりもはるかに優れていた。
この研究は、トランスフォーマーアーキテクチャが公共の安全アプリケーションにずっと適していることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:22:33 GMT)
Comment on "A Note on Over-Smoothing for Graph Neural Networks" [0.0] 軽度スペクトル条件下では、ディリクレエネルギーは深さとともに指数関数的に減少し、スペクトルフィルタにさらに拡張し、Leaky-ReLUの場合の短い証明を与える。
エッジの削除と重量増幅の実験は、ディリクレのエネルギーが増加するときに現れ、過剰なスムーシングを緩和する実践的な方法を示唆している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:53:37 GMT)
Circular dichroism on the edge of quantum Hall systems: From many-body Chern number to anisotropy measurements [0.0] 閉じ込められた孤立量子ホール系の二色応答について検討する。
エッジ応答が適切に分離されると、円二色信号は量子化される。
我々は超低温原子に適した検出手法を提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 20:11:07 GMT)
Chest X-ray Pneumothorax Segmentation Using EfficientNet-B4 Transfer Learning in a U-Net Architecture [0.0] 胸腔内の空気の異常蓄積である気胸は、検出されていない場合、生命を脅かす可能性がある。
本稿では,U-NetとEfficientNet-B4エンコーダを併用したディープラーニングパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 07:21:37 GMT)
Characteristic Energy Behavior Profiling of Non-Residential Buildings [0.0] 気候回復対策は、重要なミッションを支援し、準備が整うのに役立つ施設資産を保護するために必要である。
本稿では,施設におけるエネルギー利用の行動プロファイルを決定するためのデータ駆動行動モデルを提案する。
個々の建築行動は、非住宅のエネルギー利用から収集されたマルチモーダルデータを正確に分析、予測、クラスタ化できるモデルで表現される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:41:35 GMT)
Breaking to Build: A Threat Model of Prompt-Based Attacks for Securing LLMs [0.0] 大規模言語モデル(LLM)は重要なセキュリティ課題を導入している。
敵のアクターは入力プロンプトを操作できる 重大な損傷を発生させ 安全アライメントを回避できる
本調査は,次世代のLLMの構築に向けた研究コミュニティの取り組みを報告することを目的としている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:59:07 GMT)
Bounding the computational power of bosonic systems [0.0] ボソニック量子系は、離散変数量子系とは異なり、無限次元ヒルベルト空間で動作する。
古典的コンピュータでは,普遍ボソニック量子計算をシミュレートできることを示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:47:36 GMT)
Beyond holography: the entropic quantum gravity foundations of image processing [0.0] G. Bianconiは、量子重力に対するエントロピーからの重力(GfE)アプローチを定式化し、そこでは、ローレンツ時空に関連する2つのメトリクス間の幾何学的量子相対エントロピー(GQRE)から重力が導かれる。
ここでは、画像処理のための有名なペローナ・マリクアルゴリズムが、単純なウォームアップシナリオにおけるGfE作用の勾配流であることを示す。
ペローナ・マリクのアルゴリズムは鋭い輪郭を保存していることが知られているため、GfEの作用は、勾配流のダイナミクスの反復による均一な像を導出しないことを意味する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:38:38 GMT)
BayesSDF: Surface-Based Laplacian Uncertainty Estimation for 3D Geometry with Neural Signed Distance Fields [0.0] BayesSDFは神経暗黙の3次元表現における不確実性推定のための新しい確率的フレームワークである。
表面認識の不確実性定量化を可能にすることで、ベイズSDFはより堅牢で、解釈可能で、動作可能な3D知覚システムの基礎を定めている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 18:52:33 GMT)
Attention as an Adaptive Filter [0.0] 本稿では,新しいアダプティブフィルタアテンション機構であるアダプティブフィルタアテンション(AFA)を紹介する。
AFAは学習可能な動的モデルを直接注意重みの計算に組み込む。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 12:29:14 GMT)
Are LLM Agents the New RPA? A Comparative Study with RPA Across Enterprise Workflows [0.0] AACUは、自然言語命令やユーザインターフェースとの自律的なインタラクションを通じて、インテリジェントエージェントがタスクを実行することを可能にする。
本研究では,企業ワークフローの自動化において,AACUがRCAの代替となるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:22:44 GMT)
Arabic Chatbot Technologies in Education: An Overview [0.0] 教育において、eラーニングシステムは世界中で広く採用されている。
近年の人工知能(AI)、特に自然言語処理(NLP)の進歩は、教育、医療、観光、カスタマーサービスなど様々な分野に導入されている。
本研究では,教育における既存のアラビア語チャットボットとその特性について,導入アプローチ,言語多様性,評価指標などの調査を行った。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:55:16 GMT)
Apparent violations of the second law in the quantum-classical dynamics of interacting levitated nanoparticles [0.0] 量子古典系における熱力学の第2法則の明らかな違反の発生について検討する。
量子系の初期状態とこれらがどのように古典粒子に作用し変動するかを考える。
我々は熱力学のレンズを通してハイブリッド量子古典システムの研究を開始する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 13:17:59 GMT)
An Unsupervised Natural Language Processing Pipeline for Assessing Referral Appropriateness [0.0] 本稿では,参照理由の抽出と評価が可能な,完全に教師なしの自然言語処理パイプラインを提案する。
我々のパイプラインは、イタリアの医療用テキストで事前訓練されたTransformerベースの埋め込みを活用して、参照の理由をクラスタ化する。
教師なしの環境で動作し、さまざまな試験タイプにまたがって一般化されるように設計されている。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:11:24 GMT)
An Approach to Grounding AI Model Evaluations in Human-derived Criteria [0.0] そこで本研究では,人為評価基準による既存ベンチマークを向上するための新しい手法を提案する。
パーセプションテストとOpenEQAベンチマークで調査を行い、詳細なインタビューと大規模調査を行った。
その結果、参加者はAIに解釈的・共感的スキルが欠如していると認識しているが、AIのパフォーマンスに対する高い期待は持たないことがわかった。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 21:40:32 GMT)
AI-in-the-Loop: Privacy Preserving Real-Time Scam Detection and Conversational Scambaiting by Leveraging LLMs and Federated Learning [0.0] リアルタイムのソーシャルエンジニアリングを利用する詐欺は、デジタルプラットフォーム全体の永続的で進化的な脅威であり続けている。
本稿では,スカム会話を積極的に検出し,リアルタイムに破壊するプライバシ保護型AI-in-the-loopフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 00:19:48 GMT)
A universal speed limit for spreading of coherence [0.0] 弱相互作用するボース・アインシュタイン凝縮体の形成過程におけるコヒーレンスの拡散を観察する。
我々の結果は、大規模コヒーレンスに依存し、他のシステムで同様の測定を招待する量子技術に関係している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 08:27:06 GMT)
A theoretical basis for model collapse in recursive training [0.0] 生成モデルからのトレーニングは、シミュレーションされた確率分布のいわゆる「崩壊」につながることが知られている。
このノートは、外部ソース、どのようにマイナーであれ、サンプルにも貢献するかどうかによって、実際には2つの異なる振る舞いが得られていることを示している。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:51:59 GMT)
A dynamic view of some anomalous phenomena in SGD [0.0] 過度にパラメータ化されたニューラルネットワークは二重降下現象を示すことが観察されている。
もう一つの異常な現象は、下降の2つの規則が第3の規則によって中断され、平均的な損失はほぼ一定であるイットグロキングである。
本稿では、2つの時間スケール近似の理論を連続時間制限力学に適用することにより、これらの現象と関連する現象について、妥当な説明を示す。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 03:59:29 GMT)
A RoBERTa-Based Functional Syntax Annotation Model for Chinese Texts [0.0] 本研究では,RoBERTaをベースとした中国語の構文構文モデルを提案する。
この研究は、ピープルズ・デイリー2014コーパスから4100の文をランダムに選択し、機能構文理論に基づいて注釈付けした。
このモデルは、主語(S)、主語(M)、補語(Complement)などの中核的な構文要素を同定する上で優れた性能を示した。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 09:27:40 GMT)
A Generalized Nonlinear Extension of Quantum Mechanics [0.0] 我々は、これまで提案されていた量子力学の非線形拡張の最も一般的な形式を構築する。
より単純なモデルとは異なり、新しいバージョンは完全に可積分ではないが、基礎となるハミルトン構造を持っている。
我々は特定の解を詳細に分析し、ボルン則の自然な拡張を用いて粒子軌道を計算する。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 15:41:20 GMT)
A Framework for Detection and Classification of Attacks on Surveillance Cameras under IoT Networks [0.0] 提案フレームワークは、機械学習アルゴリズムを利用して、ネットワークトラフィックを分析し、異常な振る舞いを検出する。
フレームワークは、過去のセキュリティインシデントから学ぶために、現実世界のデータセットを使用してトレーニングされ、評価される。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 05:33:41 GMT)
A Deep Learning Framework for Two-Dimensional, Multi-Frequency Propagation Factor Estimation [0.0] このコミュニケーションは、パターン伝播係数を推定するためにディープニューラルネットワークを用いた新しいアプローチを探索する。
ディープニューラルネットワークは、複数の周波数を分析し、パターン伝播係数を合理的に予測するように訓練することができる。
論文参考訳(メタデータ) (Thu, 04 Sep 2025 19:55:33 GMT)