Embodied AI Agents: Modeling the World [165.0] 本稿では,視覚的,仮想的,物理的形態を具現化したAIエージェントの研究について述べる。
我々は,世界モデルの開発が,具体的AIエージェントの推論と計画の中心であることを提案する。
また,より優れた人間とエージェントのコラボレーションを実現するために,ユーザのメンタルワールドモデルを学ぶことを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:05:34 GMT)
Organize the Web: Constructing Domains Enhances Pre-Training Data Curation [129.3] トピックとフォーマットの両面からWebページを整理するフレームワークを開発する。
我々は,大規模な言語モデルからアノテーションを抽出して,事前学習データを自動的にアノテートし,効率的なキュレーションを行う。
我々の研究は、ドメインの構築と混合が、品質ベースのデータキュレーション手法の貴重な補完となることを実証している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:09:12 GMT)
Mamba-FSCIL: Dynamic Adaptation with Selective State Space Model for Few-Shot Class-Incremental Learning [115.8] FSCIL(Few-shot class-incremental Learning)は、限られた例から新しいクラスを段階的に学習することを目的としている。
静的アーキテクチャは固定パラメータ空間に依存して、逐次到着するデータから学習し、現在のセッションに過度に適合する傾向がある。
本研究では,FSCILにおける選択状態空間モデル(SSM)の可能性について検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:48:50 GMT)
Scale-Aware Pre-Training for Human-Centric Visual Perception: Enabling Lightweight and Generalizable Models [88.3] 本研究では,人間中心の視覚知覚のための一般的なパターンを取得するために,SAIP(Scale-Aware Image Pretraining)を導入する。
SAIPは、クロススケール一貫性の原理に基づく3つの学習目標を取り入れている。
12のHVPデータセットで実施された実験では、SAIPは9つの人間中心の視覚タスクにまたがる顕著な能力を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:01:48 GMT)
The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements [87.6] 科学的進歩への重要な能力は、既存の作品を再現する能力である。
アクティブな研究領域においてAIエージェントが結果を再現する能力を評価するために,自動LLM高速化ベンチマークを導入する。
最近のLSMとSoTAの足場を組み合わせると、ベンチマークですでに知られているイノベーションを再実装するのに苦労していることが分かりました。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:44:32 GMT)
ShotBench: Expert-Level Cinematic Understanding in Vision-Language Models [87.4] 映画言語理解に特化したベンチマークであるShotBenchを紹介する。
画像とビデオクリップから3.5k以上の専門家によるQAペアを収録し、200本以上の称賛された(オスカー賞にノミネートされた)映画から細心の注意を払ってキュレートしている。
ShotBench上でのビジョン・ランゲージ・モデル24件の評価では,特に細粒度の視覚的手がかりや複雑な空間的推論に苦慮している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:10:18 GMT)
Cannot See the Forest for the Trees: Invoking Heuristics and Biases to Elicit Irrational Choices of LLMs [83.1] 本研究では,人間の認知における認知的分解と偏見に触発された新しいジェイルブレイク攻撃フレームワークを提案する。
我々は、悪意のあるプロンプトの複雑さと関連バイアスを減らし、認知的分解を用いて、プロンプトを再編成する。
また、従来の二分的成功または失敗のパラダイムを超越したランキングベースの有害度評価指標も導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:31:28 GMT)
Lost at the Beginning of Reasoning [82.2] 第1の推論ステップが最終予測に不当に大きな影響を与えることを示す。
本稿では、報酬モデルを利用して高品質な第1推論ステップを特定し、維持する効率的なサンプリング戦略を提案する。
モデル自己補正能力を体系的に評価するために、意図的に欠陥のある第1の推論ステップで構築された新しいベンチマークを導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:53:57 GMT)
ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.1] 大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:38:03 GMT)
PartEdit: Fine-Grained Image Editing using Pre-Trained Diffusion Models [81.0] 本稿では,事前学習した拡散モデルに基づくオブジェクト部品に対する最初のテキストベースの画像編集手法を提案する。
提案手法は, 利用者の66~90%に好まれる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:57:09 GMT)
Can Large Language Models Help Students Prove Software Correctness? An Experimental Study with Dafny [79.6] コンピューティング教育の学生は、ChatGPTのような大きな言語モデル(LLM)をますます利用している。
本稿では,Dafny の形式的検証演習において,学生が LLM とどのように相互作用するかを検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:34:13 GMT)
Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference [78.1] 視覚大言語モデル(VLLM)の知識境界を検出する手法を提案する。
本稿では,VLLMの知識境界の表現に成功し,性能の維持や改善を図りながら不差別な検索を抑えることができることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:05:04 GMT)
ShifCon: Enhancing Non-Dominant Language Capabilities with a Shift-based Multilingual Contrastive Framework [78.1] ShifConはシフトベースの多言語コントラストフレームワークで、他の言語の内部のフォワードプロセスを支配的な言語に合わせる。
実験により、我々のShifConフレームワークは、非支配言語の性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:21:49 GMT)
The Mamba in the Llama: Distilling and Accelerating Hybrid Models [76.6] 注目層からの線形射影重みを学術的なGPU資源で再利用することにより,大規模な変換器を線形RNNに蒸留する方法を示す。
結果として得られたハイブリッドモデルは、チャットベンチマークのオリジナルのTransformerに匹敵するパフォーマンスを達成する。
また,Mambaとハイブリッドモデルの推論速度を高速化するハードウェア対応投機的復号アルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:54:57 GMT)
Metadata Conditioning Accelerates Language Model Pre-training [76.5] そこで本研究では,Metadata Conditioning then Cooldown (MeCo) と呼ばれる新しい手法を提案する。
MeCoは、さまざまなモデルスケール(600Mから8Bパラメータ)とトレーニングソース(C4、RefinedWeb、DCLM)の事前トレーニングを著しく加速する
MeCoは驚くほどシンプルで、計算オーバーヘッドを追加せず、より有能でステアブルな言語モデルを生成するという約束を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:15:09 GMT)
How to Train Long-Context Language Models (Effectively) [75.5] 言語モデル(LM)の継続学習と教師付き微調整(SFT)を行い,長文情報の有効利用について検討した。
コードリポジトリと書籍は長いデータの優れた情報源であることがわかったが、それらと高品質の短文データを組み合わせることが不可欠である。
最終モデルであるProLong-8Bは、128Kの同様のサイズのモデル間で、最先端の長文性能を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:01:41 GMT)
Problem Solving Through Human-AI Preference-Based Cooperation [74.4] 我々は,人間-AI共同構築フレームワークであるHAICo2を提案する。
我々は、HAICo2の形式化に向けて第一歩を踏み出し、それが直面する困難なオープンリサーチ問題について議論する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:22:34 GMT)
MiCo: Multi-image Contrast for Reinforcement Visual Reasoning [72.8] CoT(Chain-of-Thought)推論は、複数の画像に視覚的手がかりをリンクするために使用することができる。
視覚言語モデル(VLM)の規則に基づく強化学習に適応する
提案手法は,マルチイメージ推論ベンチマークにおいて大幅な改善を実現し,汎用視覚タスクにおいて高い性能を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:59:27 GMT)
StarFT: Robust Fine-tuning of Zero-shot Models via Spuriosity Alignment [70.9] 本稿では,ゼロショットモデルの微調整を行うフレームワークであるStarFTを提案する。
StarFTはウォーターバードグループのシフトシナリオにおいて、それぞれ14.30%、平均精度を3.02%向上させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:19:58 GMT)
Quality Assessment and Distortion-aware Saliency Prediction for AI-Generated Omnidirectional Images [70.5] 本研究は,AIGODIの品質評価と歪みを考慮したサリエンシ予測問題について検討する。
BLIP-2モデルに基づく共有エンコーダを用いた2つのモデルを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:36:04 GMT)
PhysUniBench: An Undergraduate-Level Physics Reasoning Benchmark for Multimodal Models [69.7] 大規模言語モデル(MLLM)の推論能力の評価と改善を目的とした大規模ベンチマークであるPhysUniBenchを提案する。
PhysUniBenchは、3,304の物理問題から成っている。
ベンチマークの構成には、複数のロールアウト、専門家レベルの評価、解決が容易な問題の自動フィルタリング、そして5段階の難易度グレーディングシステムを含む、厳格な多段階プロセスが含まれていた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:45:30 GMT)
A Principled Approach to Randomized Selection under Uncertainty: Applications to Peer Review and Grant Funding [68.4] 本稿では,各項目の品質の間隔推定に基づくランダム化意思決定の枠組みを提案する。
最適化に基づく最適化手法であるMERITを導入する。
MERITが既存のアプローチで保証されていない望ましい公理特性を満たすことを証明している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:02:46 GMT)
Multi-Turn Code Generation Through Single-Step Rewards [68.1] 既存のメソッドはフィードバックなしでコードを生成するか、多ターン報酬を最適化するために複雑な階層的な強化学習を使用する。
我々は,単一ステップの報酬のみを用いて,マルチターンコード生成を解決する,シンプルでスケーラブルなアプローチである$mu$Codeを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:47:52 GMT)
Hardware acceleration for ultra-fast Neural Network training on FPGA for MRF map reconstruction [67.8] MRFデータからリアルタイムな脳パラメータ再構成のためのFPGAベースのNNを提案する。
この方法は、モバイルデバイス上でリアルタイムの脳分析を可能にし、臨床意思決定と遠隔医療に革命をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:09:35 GMT)
Releasing Inequality Phenomenon in $\ell_{\infty}$-norm Adversarial Training via Input Gradient Distillation [66.6] 最近の研究では、(ell_infty)-norm対逆訓練(ell_infty)-AT)が不均一な入力勾配を誘導することが明らかとなった。
この現象は(ell_infty)-norm-norm訓練されたモデルを標準訓練モデルよりも脆弱にする。
本稿では,不等式を$ell_infty$-ATで解放するために,IGD (Input Gradient Distillation) という簡易かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:05:44 GMT)
Distilling the Unknown to Unveil Certainty [66.3] アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)データから逸脱するテストサンプルを識別し、ネットワークの堅牢性と信頼性を確保するために重要である。
本稿では,ネットワークからOOD感受性情報を抽出し,IDとOODサンプルを識別可能なバイナリ分類器を開発するための,OOD知識蒸留のためのフレキシブルなフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:23:39 GMT)
MUPA: Towards Multi-Path Agentic Reasoning for Grounded Video Question Answering [64.5] Grounded Video Question Answering (Grounded VideoQA) では、テキストによる回答と明確な視覚的証拠の整合が必要である。
本研究では,ビデオグラウンド,質問応答,回答反射,集約を統一するMulti-Path AgenticアプローチであるMUPAを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:32:43 GMT)
Demystifying Singular Defects in Large Language Models [62.0] 大規模言語モデル(LLM)では、ハイノームトークンの根本原因は未解明のままである。
理論的な洞察と経験的検証の両方を、近年のモデルで提供します。
量子化方式の改良とLCMシグネチャの設計の2つの実用的応用について述べる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:12:48 GMT)
Hyper-modal Imputation Diffusion Embedding with Dual-Distillation for Federated Multimodal Knowledge Graph Completion [59.5] 本稿では,FedMKGCのマルチモーダル不確実性とマルチモーダルクライアントの不均一性問題に対処するMMFeD3-HidEというフレームワークを提案する。
本稿では,MMFedEという一般的なFedMKGCバックボーン,異種マルチモーダル情報を持つデータセット,構築されたベースラインの3つのグループからなる総合評価のためのFedMKGCベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:32:58 GMT)
Training Language Model to Critique for Better Refinement [58.7] textbfRefinement-oriented textbfCritique textbfOptimization (RCO)を導入する。
RCOは、批評家モデルによって生成された批評がアクターモデルに応答を洗練させるためのフィードバックループを使用する。
より良い改善につながる批判に焦点を当てることで、RCOは直接的な批判的嗜好評価の必要性を排除している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:10:57 GMT)
OTSurv: A Novel Multiple Instance Learning Framework for Survival Prediction with Heterogeneity-aware Optimal Transport [58.6] 全スライド画像(WSI)を用いた生存予測は、多重インスタンス学習(MIL)問題として定式化することができる。
我々は、最適な輸送の観点から、新しいMILフレームワークであるOTSurvを提案する。
我々は6つの人気のあるベンチマークで新しい結果を設定し、平均的なCインデックスで絶対3.6%の改善を達成した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:41:36 GMT)
QT-DoG: Quantization-aware Training for Domain Generalization [58.4] 領域一般化のための量子化アウェアトレーニング(QT-DoG)を提案する。
我々は、減量量化が損失景観におけるより平坦なミニマムを効果的に導くことを実証した。
QT-DoGは、モデル重みのノイズを誘導することで暗黙の正則化器として量子化を利用する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:42:45 GMT)
Is it easier to count communities than find them? [57.1] コミュニティ構造が異なるモデル間の仮説テスト問題について考察する。
2つの選択肢間のテストは、コミュニティを見つけるのと同じくらい難しいことを(低次のフレームワークで)示しています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:42:01 GMT)
TableLoRA: Low-rank Adaptation on Table Structure Understanding for Large Language Models [57.0] TableLoRA は、PEFT における LLM のテーブル構造理解を改善するために設計されたモジュールである。
テーブルを特別なトークンエンコーダでシリアライズするための特別なトークンを組み込み、2D LoRAを使ってセル位置の低ランク情報をエンコードする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:42:07 GMT)
Audio-Plane: Audio Factorization Plane Gaussian Splatting for Real-Time Talking Head Synthesis [56.7] 本稿では,ガウススティングと構造化オーディオファクトリゼーションプレーン(Audio-Plane)を統合し,高品質,音声同期,リアルタイム音声ヘッド生成を実現する新しいフレームワークを提案する。
提案手法は,最先端の視覚的品質,正確なオーディオ-リップ同期,リアルタイム性能を実現し,従来の2次元および3次元のパラダイムよりも優れていた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:42:26 GMT)
Is Lindblad for me? [56.7] リンドブラッド・マスター方程式(Lindblad master equation)は、開量子系の力学をモデル化するための基礎的なツールである。
3つの標準近似を取り巻く伝承を再検討する。
私たちは、一般的な伝承と洗練された期待とを対比したチェックリストを提供しています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:59:59 GMT)
Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.6] 教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:44:55 GMT)
Single-Scanline Relative Pose Estimation for Rolling Shutter Cameras [56.4] 本稿では,ラインプロジェクションの交差点と1枚の走査線を用いて,ローリングシャッターカメラ間の相対的なポーズを推定する手法を提案する。
あるいは、単一の画像内でスキャニングラインを選択することができ、ローリングシャッターカメラのスキャニングラインに対するシングルビュー相対ポーズ推定を可能にする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:00:21 GMT)
Partial CLIP is Enough: Chimera-Seg for Zero-shot Semantic Segmentation [55.5] 本稿では,体としてのセグメンテーションバックボーンと,頭部としてのCLIPベースのセマンティックヘッドを統合したChimera-Segを提案する。
特に、Chimera-Segはトレーニング可能なセグメンテーションモデルとCLIPセマンティックヘッド(CLIP Semantic Head, CSH)を備えており、CLIP対応空間に高密度な特徴をマッピングする。
また,CLIP CLSトークンと高い類似性を示す濃厚な特徴から知識を抽出する選択的グローバル蒸留(SGD)を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:26:50 GMT)
OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis [55.4] グラフィカルユーザインタフェース(GUI)エージェントのための新しいデータ合成パイプラインであるOS-Genesisを提案する。
事前に定義されたタスクに頼る代わりに、OS-Genesisはエージェントがまず環境を認識し、ステップワイドなインタラクションを実行することを可能にする。
我々は,OS-Genesisを用いたGUIエージェントのトレーニングにより,高度に挑戦するオンラインベンチマークの性能が大幅に向上することが実証された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:25:48 GMT)
Leveraging Online Olympiad-Level Math Problems for LLMs Training and Contamination-Resistant Evaluation [55.2] AoPS-Instructは60,000以上の高品質QAペアのデータセットである。
LiveAoPSBenchは、最新のフォーラムデータから派生したタイムスタンプによる進化的評価セットである。
我々の研究は、高度な数学推論のための大規模で高品質なデータセットの作成と維持にスケーラブルなアプローチを提示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:05:51 GMT)
LLM as GNN: Graph Vocabulary Learning for Text-Attributed Graph Foundation Models [54.8] Text-Attributed Graphs (TAG) は、現実のシナリオにおいてユビキタスである。
大規模言語モデル(LLMs)とグラフニューラルネットワーク(GNNs)をTAGsに統合する努力にもかかわらず、既存のアプローチは分離されたアーキテクチャに悩まされている。
本稿では,グラフ語彙学習に基づくTAGのための汎用GFMであるPromptGFMを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:53:42 GMT)
Do Vision-Language Models Have Internal World Models? Towards an Atomic Evaluation [54.4] 内部世界モデル(英語版)(WM)は、エージェントが世界の状態を理解し、遷移を予測することを可能にする。
近年,OpenAI o3, GPT-4o, Geminiなどの大規模視覚言語モデル(VLM)は汎用的なWMとしての可能性を示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:24:29 GMT)
Mic-hackathon 2024: Hackathon on Machine Learning for Electron and Scanning Probe Microscopy [54.2] 顕微鏡は、ナノメートルと原子スケールにおける材料構造と機能に関する情報の主要な源である。
主要な資金機関によるデータ管理計画(DMP)の導入は、保存とアクセスを促進する。
標準化されたコードエコシステム、ベンチマーク、統合戦略が欠如しているため、洞察を得るのは難しいままです。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:56:59 GMT)
UniCA: Adapting Time Series Foundation Model to General Covariate-Aware Forecasting [53.4] Time Series Foundation Models (TSFMs) は大規模な事前トレーニングを通じて大きな成功を収めた。
彼らの設計は主に実数値級数をターゲットにしており、一般的な予測タスクを扱う能力を制限する。
我々は、一般共変量認識予測でTSFMをブリッジするフレームワークであるUniCAを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:35:51 GMT)
Dynamic Knowledge Exchange and Dual-diversity Review: Concisely Unleashing the Potential of a Multi-Agent Research Team [53.4] IDVSCIは、大規模言語モデル(LLM)上に構築されたマルチエージェントフレームワークである。
動的知識交換機構とデュアルダイバーシティ・レビュー・パラダイムという2つの重要なイノベーションが組み込まれている。
結果は、IDVSCIが2つのデータセットで常に最高のパフォーマンスを達成していることを示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:05:09 GMT)
L2MAC: Large Language Model Automatic Computer for Extensive Code Generation [52.8] トランスフォーマーベースの大規模言語モデル(LLM)は、基盤となるトランスフォーマーアーキテクチャの固定コンテキストウィンドウによって制約される。
本稿では,L2MACを提案する。L2MACは,LLMをベースとした汎用型自動計算機(von Neumann Architecture)フレームワークで,長期的かつ一貫した出力生成を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:28:14 GMT)
What Makes the Preferred Thinking Direction for LLMs in Multiple-choice Questions? [51.6] 言語モデルは、通常左から右へ(L2R)自己回帰因子化を使用する。
いくつかのタスクにおいて,テキスト分布の代替因数分解が有用かどうかを検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:00:20 GMT)
RoomCraft: Controllable and Complete 3D Indoor Scene Generation [51.2] RoomCraftは、実際の画像、スケッチ、テキスト記述をコヒーレントな3D屋内シーンに変換するマルチステージパイプラインである。
このアプローチでは,シーン生成パイプラインと制約駆動最適化フレームワークを組み合わせる。
RoomCraftは、リアルでセマンティックなコヒーレントで視覚的に魅力的な部屋レイアウトを生成する上で、既存の方法よりもはるかに優れています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:03:17 GMT)
The AI Imperative: Scaling High-Quality Peer Review in Machine Learning [49.9] AIによるピアレビューは、緊急の研究とインフラの優先事項になるべきだ、と私たちは主張する。
我々は、事実検証の強化、レビュアーのパフォーマンスの指導、品質改善における著者の支援、意思決定におけるAC支援におけるAIの具体的な役割を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:00:06 GMT)
CRAB: Cross-environment Agent Benchmark for Multimodal Language Model Agents [49.7] Crabは、クロス環境タスクをサポートするように設計された最初のベンチマークフレームワークである。
私たちのフレームワークは複数のデバイスをサポートし、Pythonインターフェースで簡単に任意の環境に拡張できます。
実験の結果、GPT-4oの1剤が38.01%の最高完成率を達成することが示された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:01:09 GMT)
Score-Based Model for Low-Rank Tensor Recovery [49.2] 低ランクテンソル分解(TD)は、マルチウェイデータ解析に有効なフレームワークを提供する。
従来のTD法は、CPやタッカー分解のような事前定義された構造的仮定に依存している。
本稿では,事前定義された構造的仮定や分布的仮定の必要性を排除したスコアベースモデルを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:05:37 GMT)
Low-Rank Implicit Neural Representation via Schatten-p Quasi-Norm and Jacobian Regularization [49.2] 暗黙的神経表現のためのニューラルネットワークによりパラメータ化されたCPベースの低ランクテンソル関数を提案する。
滑らか性のために、ヤコビアンとハッチンソンのトレース推定器のスペクトルノルムに基づく正規化項を提案する。
提案した滑らか度正規化はSVDフリーであり、明示的な連鎖規則の導出を避ける。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:23:10 GMT)
Pseudo-Equilibria, or: How to Stop Worrying About Crypto and Just Analyze the Game [48.9] 本稿では,暗号プロトコルを用いたゲーム解析の問題点を考察する。
疑似ナッシュ平衡という新しい解の概念を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:21:28 GMT)
Maximizing Confidence Alone Improves Reasoning [48.8] RENT: エントロピー最小化による強化学習(Reinforcement Learning via Entropy Minimization)は、完全な教師なしのRL手法であり、外部の報酬や地道的な回答を必要としない。
得られた回答に高いモデル信頼をもたらす思考の連鎖を強化することで、モデルは推論能力を向上させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:25:28 GMT)
Bayesian Invariance Modeling of Multi-Environment Data [48.8] 我々は不変予測のための確率論的モデルを開発する。
シミュレーションや実データでは、既存の不変予測手法よりもBIPとVI-BIPの方が正確でスケーラブルであることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:58:37 GMT)
Hybrid Generative Modeling for Incomplete Physics: Deep Grey-Box Meets Optimal Transport [48.1] 多くの実世界の系は、方程式の欠落や未知の項にのみ記述される。
これにより、物理モデルの分布は真のデータ生成過程(DGP)とは異なる。
非完全物理モデルを強化するために, 深層グレーボックスモデルと最適輸送法を組み合わせた新しいハイブリッド生成モデルを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:23:27 GMT)
MedRAG: Enhancing Retrieval-augmented Generation with Knowledge Graph-Elicited Reasoning for Healthcare Copilot [47.8] Retrieval-augmented Generation (RAG)は、プライバシーに敏感な電子健康記録を検索するのに適した手法である。
本稿では,医療領域に対する知識グラフ(KG)により強化されたRAGモデルであるMedRAGを提案する。
MedRAGはより具体的な診断の洞察を提供し、誤診率の低減に最先端のモデルを上回っている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:06:42 GMT)
Enhancing Diffusion Posterior Sampling for Inverse Problems by Integrating Crafted Measurements [46.0] 現在の後方サンプリング法は、測定結果を後方サンプリングに取り込み、対象データの分布を推定する。
我々は,早期に高周波情報を早期に導入し,より大きな後部推定誤差を生じさせることを示す。
本稿では, 後方推定法として, 工法計測(逆演示法による雑音測定)を取り入れた新しい拡散後サンプリング法DPS-CMを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:50:55 GMT)
Correcting astigmatism and ellipticity in Gaussian beams using a cylindrical lens pair with tunable focal lengths [45.7] レーザービームの不規則性と楕円性を補正することは、顕微鏡、原子物理学、量子情報処理、先進的な製造の性能向上に不可欠である。
回折光学素子に基づく能動解は優れた性能を達成することができるが、それらはかさばる、高価であり、有限回折効率に悩まされ、さらに複雑さが増す。
本稿では,非直交楕円形ビームを非直交性のない円形ガウスビームに変換する簡単な方法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:19:27 GMT)
Robust and Accurate Multi-view 2D/3D Image Registration with Differentiable X-ray Rendering and Dual Cross-view Constraints [45.6] 2段階からなる新しい多視点2D/3D剛性登録手法を提案する。
第1段階では、予測と地味の両相の相違を取り入れた複合損失関数が設計される。
第2段階では、粗い段階から推定されたポーズを洗練するために、テスト時間最適化を行う。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:57:58 GMT)
Green LIME: Improving AI Explainability through Design of Experiments [45.0] Local Interpretable Model-Agnostic Explanations (LIME)は、興味のあるインスタンスの近くで新しいデータポイントを生成し、それらをモデルに渡すことによって、説明を提供する。
LIMEは非常に多用途であり、幅広いモデルやデータセットに適用できる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:44:25 GMT)
Soft Condorcet Optimization for Ranking of General Agents [44.9] ソフトコンドルチェット最適化(SCO)という,社会選択フレームワークに触発された新たなランキング方式について述べる。
SCOランキングは、PrefLibオープンランキングアーカイブの865の選好プロファイルにまたがる正規化Kendall-Tau距離の最適ランキングから、平均0から0.043まで離れている。
SCOランキングは、古典的な7人プレーヤーゲームである外交の31,049ゲームにまたがる52,958人の人間プレイヤーを含む問題において、ホールトアウトテストセットで測定された最適なランキングに最適な近似を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:26:25 GMT)
SPAZER: Spatial-Semantic Progressive Reasoning Agent for Zero-shot 3D Visual Grounding [44.8] 3D Visual Groundingは、自然言語クエリに基づいて、ターゲットオブジェクトを3Dシーン内にローカライズすることを目的としている。
本稿では,VLM駆動型エージェントであるSPAZERについて述べる。
ScanRefer と Nr3D ベンチマークの実験では、SPAZER が従来のゼロショット法よりも大幅に優れていたことが示されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:34:57 GMT)
STAIR: Improving Safety Alignment with Introspective Reasoning [44.8] SafeTyアライメントとItrospective Reasoningを統合したフレームワークSTAIRを提案する。
その結果,STAIRは本能的アライメント戦略と比較して,有害なアウトプットを効果的に軽減し,有用性を保っていることがわかった。
テスト時のスケーリングでは、STAIRは一般的なジェイルブレイク攻撃に対して、Claude-3.5に匹敵する安全性能を達成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:30:35 GMT)
Ludax: A GPU-Accelerated Domain Specific Language for Board Games [44.5] Ludaxはボードゲーム用のドメイン固有言語で、自動的にハードウェアアクセラレーションされたコードにコンパイルされる。
我々はLudaxを、RLから認知科学まで、ゲーム研究全般を加速させるツールとして想定している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:15:53 GMT)
Exploring Task-Solving Paradigm for Generalized Cross-Domain Face Anti-Spoofing via Reinforcement Fine-Tuning [44.4] 本稿では, ファインチューニングによる顔の偽造防止手法を提案する。
マルチモーダルな大規模言語モデルの能力を刺激し、アンチ・スプーフィング・タスク自体の解決方法を学ぶ。
これは、不明なターゲットドメインにおける多様な未知の攻撃タイプを一般化し、その真正性決定の解釈可能な推論を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:28:29 GMT)
Leveraging In-Context Learning for Political Bias Testing of LLMs [44.3] 本稿では,人間の調査データをコンテキスト内例として用いた質問応答モデリング(QM)を提案する。
そこで本研究では,QMが質問ベースのバイアス評価の安定性を向上し,命令調整モデルとベースバージョンの比較に使用できることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:49:37 GMT)
WildSpeech-Bench: Benchmarking Audio LLMs in Natural Speech Conversation [44.2] 本稿では,実用的な音声対話における音声大言語モデル(LLM)を徹底的に評価するための新しい手法を提案する。
音声シナリオに関連する実世界のチャットデータを体系的にキュレートし、話者属性や音響条件の多様性を導入し、音声固有の現象でデータセットを増強する。
様々な主流音声モデルの包括的テストと詳細な分析を行い、異なる音声シナリオにおけるモデル性能の顕著な差異を明らかにした。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:18:45 GMT)
Fairness and Bias in Algorithmic Hiring: a Multidisciplinary Survey [43.5] この調査は、システム、バイアス、尺度、緩和戦略、データセット、およびアルゴリズム雇用と公正性の法的側面のバランスよく統合されたカバレッジを持つ実践者や研究者を対象としている。
私たちの仕事は、現在の機会と制限を強調し、すべての利害関係者に対する共有メリットを保証するために、将来の作業に対する推奨を提供することによって、この技術のコンテキスト化された理解とガバナンスを支援します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:26:31 GMT)
Remote Sensing Large Vision-Language Model: Semantic-augmented Multi-level Alignment and Semantic-aware Expert Modeling [42.5] LVLM(Large Vision and Language Models)は、自然画像領域における様々な視覚言語タスクに強いパフォーマンスを示す。
リモートセンシング(RS)への応用は、視覚的外観、オブジェクトスケール、セマンティクスに大きな領域差があるため、いまだ探索されていない。
本稿では,RS理解に適した新しいLVLMフレームワークを提案する。セマンティック拡張多レベルアライメントとセマンティック対応エキスパートモデリングである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:31:37 GMT)
Autonomic Microservice Management via Agentic AI and MAPE-K Integration [42.0] 本稿では,エージェントAIを活用したMAPE-Kに基づく自動異常検出と修復のためのフレームワークを提案する。
私たちのフレームワークは、堅牢でセキュアなシステムの安定性を維持するための実用的で業界対応のソリューションを提供します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:46:12 GMT)
Quantum Entanglement Distribution via Uplink Satellite Channels [41.9] 量子衛星は宇宙空間で絡み合ったペアを生成し、遠く離れた地上局に分配する。
地上でペアが生成され、光学ベル測定を用いて衛星に交換される逆アップリンクケースは、真剣に検討されていない。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:39:53 GMT)
Exploration from a Primal-Dual Lens: Value-Incentivized Actor-Critic Methods for Sample-Efficient Online RL [40.1] 複雑な関数近似を持つオンライン強化学習(RL)は、現代の人工知能の実践において重要な役割を果たす。
探検と搾取の基本的なトレードオフのバランスは、依然として長年にわたる課題である。
本稿では,主対最適化のレンズによる楽観主義の原理を解釈する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:18:43 GMT)
Optimal absorption and emission of itinerant fields into a spin ensemble memory [39.7] この研究はスピンベースの量子メモリに焦点をあて、そこでは反復電磁場が大きなアンサンブルに格納される。
我々は吸収過程と放出過程の両方を記述するカスケード量子モデルを開発した。
超伝導量子プロセッサと相互作用するマイクロ波量子メモリの文脈で数値シミュレーションを行う。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:43:47 GMT)
End-to-End RGB-IR Joint Image Compression With Channel-wise Cross-modality Entropy Model [39.5] モダリティの数が増えると、必要なデータストレージと送信コストも2倍になる。
本研究は,RGB-IR画像ペアのための共同圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:04:21 GMT)
Dual-Perspective United Transformer for Object Segmentation in Optical Remote Sensing Images [38.9] 本稿では,長距離依存関係と空間的詳細を同時に統合するユニークな構造を持つDPU変換器を提案する。
特に,2つの視点から多種多様な情報を捉えるグローバル・ローカル・ミックス・アテンションを設計する。
本稿では,表現能力を高めるために,ゲート型線形フィードフォワードネットワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:40:48 GMT)
CURE: A Dataset for Clinical Understanding & Retrieval Evaluation [38.8] 医療提供者が医療現場で使用することを意図した検索システムのテストデータセットは少ない。
CUREは、単言語(英語)とクロスランガル(フランス語/スペイン語 ->英語)の2つの条件を持つ10の医療ドメインにまたがる2000のクエリからなる、通過ランキングのためのアドホック検索テストデータセットである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:09:49 GMT)
Advancing Language Multi-Agent Learning with Credit Re-Assignment for Interactive Environment Generalization [38.7] 我々は,新しいマルチエージェントクレジット再割り当て戦略を備えたマルチエージェント強化学習フレームワークであるCollabUIAgentsを提案する。
我々は,マルチエージェントシステムの性能と環境横断の一般化性を両立させることを実証した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:30:22 GMT)
Seg-R1: Segmentation Can Be Surprisingly Simple with Reinforcement Learning [38.4] Seg-R1は、大規模マルチモーダルモデルの画素レベルの理解と推論能力を高めるために強化学習を用いた予備的な探索である。
我々は,LMMに画素レベルの理解を持たせながら,グループ相対政策最適化をセグメンテーション領域に導入する。
Seg-R1 は純粋に RL ベースの訓練を行い、複雑なモデル修正なしに COD10K 上で.873 S 測定を行う。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:40:45 GMT)
GPAS: Accelerating Convergence of LLM Pretraining via Gradient-Preserving Activation Scaling [38.4] Gradient-Preserving Activation Scaling (GPAS)は、既存のアプローチと組み合わせて使用できるシンプルなテクニックである。
GPASは、その勾配を一定に保ちながら中間活性化をスケールダウンすることで機能する。
モデルサイズが71Mから1Bまで多岐にわたる実験の結果,GPASが一貫した性能向上を達成できた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:45:15 GMT)
Joint Task Offloading and Resource Allocation in Low-Altitude MEC via Graph Attention Diffusion [38.4] エアグラウンド統合マルチアクセスエッジコンピューティング(MEC)システムは、リアルタイムおよびインテリジェントなタスクスケジューリングに対する需要が高まっている。
本稿では、低高度経済ネットワークのための3層ヘテロジニアスMECシステムアーキテクチャを構築する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:03:48 GMT)
Rethinking Visual Token Reduction in LVLMs under Cross-modal Misalignment [38.0] トレーニングフリーで視覚のみのプルーニングフレームワークであるVisionDropを導入し、モーダル内(視覚から視覚への)注目に基づいて情報的視覚トークンを選択する。
提案手法は,複数の段階において重要なトークン選択と軽量なコンテキストマージを行い,攻撃的トークン予算の下でもきめ細かい視覚情報を保持できる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:55:40 GMT)
Noise-Inspired Diffusion Model for Generalizable Low-Dose CT Reconstruction [37.7] そこで本研究では,各領域の雑音特性に対する拡散モデルの調整を行うNEEDと呼ばれる,一般化可能な低線量CT再構成のためのノイズインスピレーション拡散モデルを提案する。
これら2つの拡散モデルを二重ドメイン再構成のためにカスケードすることで、NEEDはトレーニングに通常用量データしか必要とせず、テスト中に様々な未確認量レベルに効果的に拡張できる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:24:55 GMT)
OutDreamer: Video Outpainting with a Diffusion Transformer [37.5] 本稿では,DiTをベースとした映像出力フレームワークであるOutDreamerを紹介する。
マスク情報を動的に統合するマスク駆動型自己注意層を提案する。
長時間の画質向上のために、我々は、欠落したコンテンツを反復的に生成するクロスビデオクリップ精細機を採用している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:08:54 GMT)
A Survey of Continual Reinforcement Learning [37.1] 強化学習(Reinforcement Learning, RL)は、シーケンシャルな意思決定問題を解決するための重要な機械学習パラダイムである。
タスクをまたいで一般化するRLの限られた能力は、動的および実世界の環境での適用性を制限する。
CRL(Continuous Reinforcement Learning)は、これらの制限に対処するための有望な研究方向として登場した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:10:20 GMT)
PhysRig: Differentiable Physics-Based Skinning and Rigging Framework for Realistic Articulated Object Modeling [36.3] スキニングとリギングはアニメーション、明瞭なオブジェクト再構成、モーショントランスファー、および4D生成の基本的な構成要素である。
既存のアプローチは主にリニアブレンドスキニング(LBS)に依存している。
我々はPhysRigを提案する。PhysRigは微分可能な物理ベースのスキンとリギングフレームワークである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:58:56 GMT)
Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy [36.1] 本稿では,精密で一貫したビデオ編集のための3Dプロキシを組み込んだ新しいフレームワークであるShape-for-Motionを紹介する。
我々のフレームワークは、ポーズ編集、回転、スケーリング、翻訳、テクスチャ修正、オブジェクト合成など、ビデオフレーム間の精密で物理的に一貫性のある操作をサポートしています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:59:01 GMT)
No More Sliding Window: Efficient 3D Medical Image Segmentation with Differentiable Top-k Patch Sampling [34.5] No-More-Sliding-Window (NMSW)は、3Dセグメンテーションのための新しいエンドツーエンドのトレーニング可能なフレームワークである。
NMSWは、最も関連するパッチのみを選択的にサンプリングするために、差別化可能なTop-kモジュールを使用している。
H100 GPUでは9.1倍高速な推論、Xeon Gold CPUでは11.1倍高速な推論を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:58:15 GMT)
PatchDPO: Patch-level DPO for Finetuning-free Personalized Image Generation [34.5] ファインタニングのないパーソナライズされた画像生成は、テストタイムの微調整なしにカスタマイズされた画像を合成することができる。
本研究は,各画像内の画像パッチの品質を推定し,それに基づいてモデルをトレーニングするPatchDPOを提案する。
実験の結果,PatchDPOは複数の事前学習されたパーソナライズされた生成モデルの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:24:28 GMT)
Federated Data-Efficient Instruction Tuning for Large Language Models [34.4] フェデレートされたデータ効率のチューニング手法を提案する。
実験の結果、FedHDSはSOTAのフルデータ・フェデレーション・インストラクション・チューニング手法よりも平均10.72%改善した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:03:25 GMT)
Boosting MLLM Reasoning with Text-Debiased Hint-GRPO [34.2] GRPOアルゴリズムは、困難で複雑なマルチモーダル推論タスクを扱うのに苦労する。
本研究は,様々な困難サンプルに対するヒントを適応的に提供することにより,データ利用を改善するHint-GRPOを提案する。
提案手法は,既存のMLLM推論手法よりも優れた性能を示すとともに,従来のMLLMの推論能力を大きなマージンで向上させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:37:02 GMT)
DidSee: Diffusion-Based Depth Completion for Material-Agnostic Robotic Perception and Manipulation [33.9] 商用のRGB-Dカメラは、非ランベルト的対象に対するノイズの多い不完全な深度マップをしばしば生成する。
我々は,非ランベルト的オブジェクト上での深度補完のための拡散に基づくフレームワークである textbfDidSee を提案する。
DidSeeは、複数のベンチマークで最先端のパフォーマンスを達成し、堅牢な現実世界の一般化を示し、下流タスクを効果的に改善する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:36:33 GMT)
Involvement drives complexity of language in online debates [32.7] 本稿は、新型コロナウイルス、COP26、ロシア・ウクライナ戦争という、Twitter上の影響力のあるユーザーが生み出すコンテンツの言語的複雑さについて、世界規模で重要な3つのトピックについて検討する。
分析の結果,個人と組織の間に有意な差異がみられた。
本研究は,デジタルプラットフォームにおける社会言語学のダイナミクスに関する新たな知見を提供し,オンライン空間における言語がイデオロギーや社会構造をどのように反映しているかを深く理解する上で有効である。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:27:54 GMT)
AdaReasoner: Adaptive Reasoning Enables More Flexible Thinking in Large Language Models [32.5] AdaReasoner は LLM に依存しないプラグインで,任意の LLM が適応推論設定を自動化するように設計されている。
AdaReasonerは強化学習(RL)フレームワークを使用して訓練され、因子化されたアクション空間とターゲット探索戦略を組み合わせた。
標準ベースラインを一貫して上回り、分布外ロバスト性を保ち、調整されたプロンプトを通じて知識集約的なタスクに利益をもたらす。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:19:38 GMT)
SODA: Out-of-Distribution Detection in Domain-Shifted Point Clouds via Neighborhood Propagation [32.4] 我々は,ポイントクラウドオブジェクトにおけるOOD検出のための3次元視覚言語モデルの進歩を活用している。
大きな課題は、画像ベースのデータセットに比べて、ポイントクラウドデータセットのサイズとオブジェクトの多様性が大幅に小さいことです。
そこで本研究では,OOD点群の検出を近隣のスコア伝搬方式により改善するSODAと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:05:55 GMT)
Sheaf-Based Decentralized Multimodal Learning for Next-Generation Wireless Communication Systems [32.2] 多様なモダリティを持つデバイス間の協調性を高めるための,分散型マルチモーダル学習フレームワークであるSheaf-DMFLを提案する。
また、各クライアント内の注意機構を調整し、異なるモダリティ間の相関関係を抽出する、Sheaf-DMFL-Attという拡張アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:41:23 GMT)
SAMConvex: Fast Discrete Optimization for CT Registration using Self-supervised Anatomical Embedding and Correlation Pyramid [31.8] 特徴空間で計算されたコスト体積による変位ベクトル場の推定は,画像登録において大きな成功を収めた。
既存の特徴記述子は、グローバルな意味情報を表現できないローカル特徴のみを抽出する。
我々は,CT登録のための高速な粗い離散最適化手法SAMConvexを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:46:27 GMT)
A Framework for Multi-source Privacy Preserving Epidemic Analysis [31.8] 一部のデータセットは、しばしばセンシティブで、適切なプライバシー保護が必要である。
プライバシには多くのモデルがありますが、その強力な保証のため、差分プライバシー(DP)は事実上の標準になっています。
本研究では,深層学習と流行モデルを統合して,流行予測を同時に実行し,流行拡大のメカニズムモデルを学習する枠組みを開発する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:52:12 GMT)
ReCo: Reminder Composition Mitigates Hallucinations in Vision-Language Models [31.7] 視覚言語モデル(VLM)は、視覚データと言語データの統合と推論において素晴らしい能力を示す。
一般的な発見は幻覚の傾向、すなわち視覚入力に基づかない可塑性な音声テキストを生成することである。
我々は,任意のVLM上に,小型でトレーニング可能なモジュール(ReCoという名前)を追加することを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:01:02 GMT)
Advances in Temporal Point Processes: Bayesian, Neural, and LLM Approaches [31.6] TPP(Temporal Point Process)は、連続的に発生するイベントシーケンスを特徴付けるプロセスモデルである。
近年、ディープラーニングの進歩は神経性TPPの開発を加速させ、柔軟性と表現力を高めている。
大規模言語モデル(LLM)の出現はさらに興奮を呼び、イベントシーケンスのモデリングと分析の新しい可能性をもたらした。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:22:06 GMT)
Exploring Semantic Masked Autoencoder for Self-supervised Point Cloud Understanding [31.6] マスケプポイントモデリングに基づく手法は、最近、様々な下流タスクで顕著な性能を示した。
本稿では,プロトタイプベースのコンポーネントセマンティック・モデリング・モジュールと,コンポーネントセマンティック・エンハンスド・マスキング・ストラテジーを組み合わせたセマンティック・マスク・オートエンコーダを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:58:59 GMT)
4D-VLA: Spatiotemporal Vision-Language-Action Pretraining with Cross-Scene Calibration [31.1] 既存の手法は通常、単純な観察を入力としてデータセットのアクション分布をモデル化する。
カオスの源泉への入力に、4D情報を効果的に統合する新しいアプローチである4D-VLAを提案する。
我々のモデルは既存の手法を常に上回り、より強い空間的理解と適応性を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:09:29 GMT)
Exploring Text-Guided Single Image Editing for Remote Sensing Images [30.7] 本稿では,テキストガイドによるRSI編集手法を提案する。
大規模なベンチマークのトレーニングを必要とせずに一貫性を維持するために、マルチスケールのトレーニングアプローチが採用されている。
複数のRSI編集タスクの実験結果から,提案手法はCLIPスコアと主観的評価の両方に有意な利点をもたらすことが示された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:23:00 GMT)
SceneDiffuser++: City-Scale Traffic Simulation via a Generative World Model [30.6] SceneDiffuser++は、都市規模でA-to-Bシミュレーションを行うことができる単一損失関数に基づいて訓練された最初のエンドツーエンド生成世界モデルである。
本研究では,SceneDiffuser++の都市交通シミュレーション能力を実証し,その長大なシミュレーション条件下での優れたリアリズムについて検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:35:04 GMT)
RoboEnvision: A Long-Horizon Video Generation Model for Multi-Task Robot Manipulation [30.3] ロボット操作作業のための長距離ビデオ生成の問題に対処する。
本稿では,自己回帰生成の必要性を回避できる新しいパイプラインを提案する。
提案手法は,ビデオ品質と一貫性の2つのベンチマークにおいて,最先端の結果を達成している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:21:55 GMT)
DeepTalk: Towards Seamless and Smart Speech Interaction with Adaptive Modality-Specific MoE [29.7] ネイティブマルチモーダル大言語モデル(MLLM)は、単一大言語モデル(LLM)を音声言語モデル(SLM)に再構成する。
DeepTalkは、Mixture of Experts (MoE)アーキテクチャに基づいた適応型モダリティエキスパート学習のためのフレームワークである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:32:04 GMT)
Mobile-R1: Towards Interactive Reinforcement Learning for VLM-Based Mobile Agent via Task-Level Rewards [29.5] 対話型マルチターン強化学習とタスクレベルの報酬をモバイルエージェントに提供するMobile-R1を紹介する。
トレーニングフレームワークは,初期形式微調整,アクションレベル報酬によるワンステップオンライントレーニング,マルチターン軌道に基づくタスクレベル報酬によるオンライントレーニングの3段階で構成されている。
この戦略はMobile-R1の探索と誤り訂正機能を強化するために設計されており、大幅な性能向上につながっている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:38:24 GMT)
RiverEcho: Real-Time Interactive Digital System for Ancient Yellow River Culture [29.3] RiverEchoは、大きな言語モデルと文化知識データセットを使用して音声クエリに応答するリアルタイムインタラクティブシステムである。
我々は,古代イエロー川文化に着目した知識データベースを構築した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:40:00 GMT)
Generating Attribute-Aware Human Motions from Textual Prompt [28.6] 我々は各動作を属性情報とアクションセマンティクスの両方を含むものとして概念化する。
人間の属性からアクションセマンティクスを分離するために、構造因果モデルにインスパイアされた新しいフレームワークが提案されている。
得られたモデルは、ユーザのテキストと属性入力に一致したリアルで属性対応の動作を生成することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:56:54 GMT)
HLTCOE at LiveRAG: GPT-Researcher using ColBERT retrieval [28.4] HLT LiveRAG は GPT-Researcher フレームワークを用いて質問の文脈を調査した。
検索システムはColBERTのバイエンコーダアーキテクチャであり、多くの高密度トークンを持つパスを表す。
このシステムは、スコア1.07のLiveRAG自動評価で5位となった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:08:39 GMT)
Robust Detection of Watermarks for Large Language Models Under Human Edits [27.7] そこで本研究では,人間の編集下での透かし検出のための不適切な良性テストの形で,新しい手法を提案する。
我々は,Gumbel-GoF透かしのロバスト検出において,Tr-GoF試験が最適性を達成することを証明した。
また, Tr-GoF試験は, 適度なテキスト修正方式において, 高い検出効率が得られることを示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:34:08 GMT)
WarpRF: Multi-View Consistency for Training-Free Uncertainty Quantification and Applications in Radiance Fields [27.4] WarpRFは、放射場の不確かさを定量化するフレームワークである。
トレーニングを一切必要とせず、任意の放射場の実装に無償で適用することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:59:13 GMT)
Beyond Fixed Length: Bucket Pre-training is All You Need [27.3] 本稿では,固定長のパラダイムを超越した新しいマルチポケットデータ合成手法を提案する。
提案手法は,学習データを適応的に整理し,提案手法で測定した最適構成品質を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:33:27 GMT)
TASeg: Text-aware RGB-T Semantic Segmentation based on Fine-tuning Vision Foundation Models [27.0] 本稿では,ローランド適応(LoRA)ファインチューニング技術を用いたテキスト認識RGB-Tセグメンテーションフレームワークを提案する。
具体的には,画像エンコーダにおける動的特徴融合モジュール (DFFM) を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:34:28 GMT)
Unfolding Generative Flows with Koopman Operators: Fast and Interpretable Sampling [26.9] Conditional Flow Matching (CFM)は、連続時間生成モデルをトレーニングするためのシミュレーション不要のフレームワークを提供する。
我々は、CFMを加速し、クープマン作用素理論を統合することにより、その力学の解釈可能な表現を導入することを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:16:16 GMT)
Near Field Localization via AI-Aided Subspace Methods [26.8] NF-SubspaceNetは深層学習で強化された2次元MUSICアルゴリズムで,サロゲート共分散行列を学習し,挑戦条件下での局所化を改善する。
また,学習のためのAIモデルとして,近接場部分空間法を鋳造することと組み合わせて,情報源数を正確に推定する新しいモデル順序対応訓練手法を開発した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:37:04 GMT)
VideoFusion: A Spatio-Temporal Collaborative Network for Multi-modal Video Fusion and Restoration [26.6] 既存のマルチセンサー融合研究は、主にビデオではなく複数の画像からの補完を統合している。
VideoFusionは、時間的相補性と時間的ダイナミクスを利用して、文脈的時間的コヒーレントなビデオを生成する。
大規模な実験により、VideoFusionは、シーケンシャルなシナリオで既存の画像指向の融合パラダイムより優れていることが判明した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:59:17 GMT)
Design Patterns for Securing LLM Agents against Prompt Injections [26.5] インジェクション攻撃は 自然言語入力に対する エージェントの弾力性を利用してる
本稿では,AIエージェントのインジェクションに対する抵抗性を証明可能な設計パターンのセットを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:13:27 GMT)
Test-Time Consistency in Vision Language Models [26.5] VLM(Vision-Language Models)は、様々なマルチモーダルタスクにおいて優れたパフォーマンスを実現している。
MM-R3のような最近のベンチマークでは、最先端のVLMでさえ意味論的に等価な入力にまたがって分岐予測をもたらすことが強調されている。
教師付き再学習なしにセマンティックな一貫性を高める,シンプルで効果的なテスト時間一貫性フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:09:44 GMT)
MM-R$^3$: On (In-)Consistency of Vision-Language Models (VLMs) [26.5] 本稿では,3つのタスク(質問文の表現,画像の復元,コンテキスト推論)に基づいて,SoTA視覚言語モデルの性能を解析する。
我々の分析では、一貫性が必ずしも精度と一致していないことを示し、高い精度のモデルが必ずしも一致しているとは限らないことを示し、その逆も示している。
本稿では,命令間の不整合を最小限に抑えるために訓練されたアダプタモジュールの形式で,シンプルながら効果的な緩和戦略を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:08:56 GMT)
Jailbreaking Multimodal Large Language Models via Shuffle Inconsistency [26.3] MLLM(Multimodal Large Language Models)は目覚ましい性能を発揮し、商用アプリケーションで実用化されている。
ジェイルブレイク攻撃は安全メカニズムを回避し、MLLMの潜在的なリスクを発見することを目的としている。
本稿では,Shuffleの不整合を克服し,シャッフルランダム性を克服するため,SI-Attackというテキストイメージのジェイルブレイク攻撃を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:07:29 GMT)
Pedestrian Intention and Trajectory Prediction in Unstructured Traffic Using IDD-PeD [26.0] 本研究では,非構造環境における歩行者行動のモデル化の複雑さに対処するために,インドにおける歩行者行動データセットを提案する。
このデータセットは、エゴ車両の注意を必要とする歩行者に焦点を当てた、高レベルで詳細な低レベルな包括的なアノテーションを提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:41:18 GMT)
Spatial Degradation-Aware and Temporal Consistent Diffusion Model for Compressed Video Super-Resolution [25.6] ストレージと帯域幅の制限により、インターネット上で送信されるビデオは低画質で圧縮されたアーティファクトを特徴とすることが多い。
ビデオ超解像(VSR)は効率的なビデオ強調技術であるが、既存のVS手法では圧縮ビデオに焦点を絞らない。
圧縮VSRのための事前学習拡散モデルの先行性を利用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:03:50 GMT)
KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding [24.9] KITAB-Benchは、現在の評価システムのギャップを埋める包括的なアラビアOCRベンチマークである。
現代の視覚言語モデル(GPT-4o、Gemini、Qwenなど)は、従来のOCRアプローチを平均60%の文字誤り率(CER)で上回っている。
本研究はアラビア文書分析手法の改良を促進するための厳格な評価枠組みを確立する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:31:41 GMT)
More Vulnerable than You Think: On the Stability of Tool-Integrated LLM Agents [24.8] 本研究では,ツール実行プロセス全体を通して,エージェントがエラーに対して脆弱であるかどうかを検討する。
エージェントは各段階でエラーの影響を受けやすく,オープンソースモデルに基づくエージェントは,プロプライエタリモデルに基づくエージェントよりも脆弱である。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:13:29 GMT)
The Hidden Link Between RLHF and Contrastive Learning [24.8] 本稿では,人間フィードバックからの強化学習と直接選好最適化が相互情報の観点から解釈可能であることを示す。
このフレームワーク内では、RLHFとDPOの両方を、対照的な学習を行う方法と見なすことができる。
この観点からDV/MINE境界をJensen-Shannon MI推定器に置き換え、相互情報最適化を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:51:25 GMT)
On the Feasibility of Poisoning Text-to-Image AI Models via Adversarial Mislabeling [24.7] インターネットから得られる何百万もの画像に対してテキスト・画像生成モデルを訓練し、それぞれが視覚言語モデル(VLM)によって生成された詳細なキャプションと組み合わせる。
VLMは、画像に摂動を付加し、VLMを誤ったキャプションを発生させる、ステルスな敵攻撃に対して脆弱である。
潜在的な防御効果は有効であるが、アダプティブアタッカーによる攻撃を標的とし回避することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:13:47 GMT)
PapersPlease: A Benchmark for Evaluating Motivational Values of Large Language Models Based on ERG Theory [24.3] 大規模言語モデルの意思決定を調査するために設計された,3700のモラルジレンマからなるベンチマークであるPapersPleaseを紹介する。
この設定では,LPMは,人々の短い物語に基づいて入国を承認するか拒否するかを決定する移民検査官として機能する。
6つのLCMを統計的に分析した結果,LSMが暗黙の嗜好を符号化していることが示唆された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:09:11 GMT)
Optimal Estimation of Watermark Proportions in Hybrid AI-Human Texts [24.1] 本稿では,混合ソーステキストにおける透かし比率を最適に推定する問題に対処する。
我々は、このパラメータが特定の透かしスキームで特定可能であることさえなく、一貫して推定可能であることを示します。
本稿では,この手法の効率的な推定手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:53:04 GMT)
LLaVA-Scissor: Token Compression with Semantic Connected Components for Video LLMs [23.8] LLaVA-Scissorは、マルチモーダルな大規模言語モデルのために設計された、トレーニング不要なトークン圧縮戦略である。
本稿では,セマンティック・コネクテッド・コンポーネント(SCC)のアプローチを活用し,包括的セマンティック・カバレッジを確保することを提案する。
我々は,LLaVA-Scissorのトークン圧縮性能を多様なビデオ理解ベンチマークで広範囲に評価する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:29:58 GMT)
Literature-Grounded Novelty Assessment of Scientific Ideas [23.5] LLMに基づく検索拡張生成フレームワークであるIdean Novelty Checkerを提案する。
実験の結果,新規性チェッカーは既存手法よりも約13%高い一致を達成できた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:47:28 GMT)
Advancements and Challenges in Continual Reinforcement Learning: A Comprehensive Review [23.4] この論文は、継続的な強化学習、重要な概念、重要な課題、新しい方法論の基本的な側面を掘り下げている。
ロボット工学における継続的な強化学習の最近の進歩と、卓越した研究で利用される評価環境の簡潔な概観に特に重点を置いている。
このレビューは、限界と将来的な方向性に関する議論で締めくくられ、研究者や実践者にも貴重な洞察を与えている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:36:05 GMT)
Embodied Domain Adaptation for Object Detection [23.1] 我々は、ソースデータにアクセスせずに事前訓練されたモデルに適応するSource-Free Domain Adaptation (SFDA)アプローチを導入する。
実験の結果,ゼロショット検出性能が向上し,動的室内条件への柔軟な適応が得られた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:28:19 GMT)
SENSEI: Semantic Exploration Guided by Foundation Models to Learn Versatile World Models [23.0] 固有のモチベーションは、外部のタスクベースの報酬から探索を分離しようとする。
SENSEIはモデルに基づくRLエージェントに意味論的行動の本質的な動機を与えるためのフレームワークである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:33:13 GMT)
AutoMixer: Checkpoint Artifacts as Automatic Data Mixers [22.9] 本研究では,チェックポイントモデルが学習軌跡の異なる点において出現する能力を示すことを観察する。
これらのアーティファクトモデルをベンチマークでそれぞれの能力に基づいて同定する。
我々はこれらをデータミキサーとして利用し、ソースデータに対する集約された1次影響近似を利用する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:53:07 GMT)
Foundation Model Insights and a Multi-Model Approach for Superior Fine-Grained One-shot Subset Selection [22.7] ワンショットサブセットの選択は、ディープラーニングトレーニングコストを削減する効果的なツールとして機能する。
FMベースのサブセット選択は、多様なデータセットで従来のIEベースのメソッドより優れているか?
提案手法は,Oxford-IIIT Pet,Food-101,Caltech-UCSD Birds-200-2011などの細粒度データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:48:09 GMT)
The Consistency Hypothesis in Uncertainty Quantification for Large Language Models [22.6] モデルAPIアクセスのみに依存するブラックボックス不確実性定量化(UQ)手法は,その実用的メリットから人気を博している。
本稿では,自信の代用として生成整合性を利用するUQ手法の背景にある暗黙的な仮定について検討する。
信頼度推定のための世代間類似性を集約するデータフリーなブラックボックスUQ手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:53:15 GMT)
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities [22.5] 今後の研究を導くための総合的な調査を行う。
既存の統一モデルについてレビューし、これらを3つの主要なアーキテクチャパラダイムに分類する。
トークン化戦略,クロスモーダルアテンション,データなど,この新興分野に直面する重要な課題について論じる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:30:10 GMT)
BeamLLM: Vision-Empowered mmWave Beam Prediction with Large Language Models [22.1] BeamLLMは、大規模言語モデル(LLM)を利用した視覚支援ミリ波(mmWave)ビーム予測フレームワークである
現実的な車内構造(V2I)のシナリオに基づいて,提案手法は61.01%のTop-1精度と97.39%のTop-3精度を標準予測タスクで達成する。
数ショットの予測シナリオでは、パフォーマンス劣化はタイムサンプル1から10までの12.56%(トップ-1)と5.55%(トップ-3)に制限され、優れた予測能力を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:52:32 GMT)
A Survey on Federated Fine-tuning of Large Language Models [21.6] FedLLMは、データのプライバシを保持しながら、協調的なモデル適応のための有望な道を提供する。
FedLLMを厳格に評価するために、既存の微調整データセットと評価ベンチマークを徹底的にレビューする。
我々は、重要なオープン課題を特定し、FedLLMの今後の進歩を促進するための有望な研究の方向性を概説する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:42:47 GMT)
Temperature Matters: Enhancing Watermark Robustness Against Paraphrasing Attacks [21.4] 本研究プロジェクトは,合成テキストの検出のための新しい方法論の開発に重点を置いている。
本稿では,その頑健さを評価するために,パラフレーズ付きテキストを用いて,革新的な透かし手法を提案し,厳密な評価を行う。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:39:35 GMT)
Sequential Diagnosis with Language Models [21.2] 本稿では,304症例を段階的に診断するシークエンシャル診断ベンチマークを紹介する。
成績は、診断精度だけでなく、医師の診察や検査の費用によって評価される。
また,医師のパネルを模擬したモデル診断オーケストレータであるMAI診断オーケストレータ(MAI-DxO)についても紹介する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:27:26 GMT)
MirrorMe: Towards Realtime and High Fidelity Audio-Driven Halfbody Animation [21.2] MirrorMeは、LTXビデオモデル上に構築されたリアルタイムで制御可能なフレームワークである。
MirrorMeは映像を空間的に時間的に圧縮し、効率的な遅延空間をデノイングする。
EMTDベンチマークの実験では、MirrorMeの忠実さ、リップシンク精度、時間的安定性が実証されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:57:23 GMT)
Preserve Anything: Controllable Image Synthesis with Object Preservation [21.1] textitPreserve Anythingは、制御された画像合成のための新しい方法である。
i)オブジェクトの保存とサイズと配置、色と詳細の保持、およびアーティファクトの除去を統合する。
最先端のパフォーマンスを実現し、特徴空間の忠実性とセマンティックアライメントを大幅に改善する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:39:21 GMT)
Interactive Multi-Objective Probabilistic Preference Learning with Soft and Hard Bounds [21.0] ブラキセラピーでは、臨床医は腫瘍の最大範囲を、厳格な臓器投与制限とバランスさせなければならない。
現在の方法は、しばしばこれらの多面的嗜好構造を反復的に洗練するための体系的なアプローチを欠いている。
このプロセス用に設計されたインタラクティブなローカル・グローバル・フレームワークであるActive-MoSHを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:44:20 GMT)
Robust and Efficient Autoregressive Speech Synthesis with Dynamic Chunk-wise Prediction Policy [21.0] 本稿では,AR音声生成における効率性とインテリジェンス性を両立させるために,DCARと呼ばれる動的チャンクワイド自己回帰合成フレームワークを提案する。
DCARは従来の次世代予測モデルを大きく上回り、72.27%の知性向上と2.61倍の推論速度を同時に達成した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:45:21 GMT)
Attention-disentangled Uniform Orthogonal Feature Space Optimization for Few-shot Object Detection [20.7] Few-shot Object Detection (FSOD) は、新しいクラスのための限られたサンプルを持つオブジェクトを検出することを目的としている。
既存のFSODアプローチは、主にFaster R-CNN検出器上に構築されている。
クラス非依存のオブジェクト性知識をベースクラスから新しいクラスに転送するための一様直交特徴空間(UOFS)最適化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:17:04 GMT)
Knowledge-Guided Multi-Agent Framework for Automated Requirements Development: A Vision [20.7] 本稿では,KGMAFという知識誘導型マルチエージェントフレームワークを,自動要求開発のために提案する。
KGMAFは6つの特殊エージェントと1つのアーティファクトプールから構成され、効率と精度を向上させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:57:53 GMT)
ACORD: An Expert-Annotated Retrieval Dataset for Legal Contract Drafting [20.4] ACORDは、責任の制限(Limitation of Liability)、償却(Indemnification)、統制の変更(Change of Control)、最も好まれる国家( Most Favored Nation)といった複雑な契約条項に焦点を当てている。
114のクエリと126,000のクエリクロースペアが含まれており、それぞれが1から5の星のスケールでランク付けされている。
タスクはクエリーに最も関連性の高い前例句を見つけることである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:16:02 GMT)
Decoupled SGDA for Games with Intermittent Strategy Communication [20.1] グラディエントDescent Ascent(SGDA)の新規適応であるDecoupled SGDAを紹介する。
このアプローチでは、プレイヤーは時代遅れの相手戦略に基づいて戦略を独立に更新し、周期的同期により戦略を整合させる。
分離されたSGDAは、最もよく知られたGDAレートに匹敵する、ほぼ最適な通信複雑性を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:22:45 GMT)
Cell Tracking according to Biological Needs -- Strong Mitosis-aware Multi-Hypothesis Tracker with Aleatoric Uncertainty [20.0] 動作推定のための不確実性推定手法を導入し,多仮説追跡フレームワークを拡張した。
我々の不確実性推定は、問題固有のテスト時間拡張を用いて、運動表現を確率論的空間密度に引き上げる。
我々の枠組みでは、明示的な生物学的知識は割り当てコストでモデル化される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:55:51 GMT)
From Superficial to Deep: Integrating External Knowledge for Follow-up Question Generation Using Knowledge Graph and LLM [19.8] 会話システムでは、コンテキストに基づいたフォローアップ質問を動的に生成することで、ユーザが情報を調べるのに役立つ。
本稿では,3段階の外部知識を付加したフォローアップ質問生成手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:54:01 GMT)
StableCodec: Taming One-Step Diffusion for Extreme Image Compression [19.7] 拡散に基づく画像圧縮は、高いリアリズムで超低符号化(1ピクセルあたり0.05ビット未満)を達成するという驚くべき可能性を示している。
現在のアプローチでは、極端な制約の下で現実的な結果を生成するために、デコーダの多数のデノナイズステップが必要となる。
本稿では,高忠実度・高現実性画像圧縮のための一段階拡散を可能にするStableCodecを紹介する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:39:21 GMT)
Can Video Large Multimodal Models Think Like Doubters-or Double-Down: A Study on Defeasible Video Entailment [19.7] 私たちはDVidE(Defeasible Video Entailment)を紹介します。
DVidEでは、ビデオ前提とテキスト仮説が考慮され、新しい更新が仮説を強化または弱めるかどうかをモデルが判断しなければならない。
生成タスクにおいて、ASR出力とLLM(Large Language Model)を組み合わせ、一貫性のある文脈に関連のある更新を生成するフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:51:15 GMT)
3D-Telepathy: Reconstructing 3D Objects from EEG Signals [19.5] 脳波(EEG)データからの3次元視覚刺激の再構成は脳-コンピュータインタフェース(BCI)の応用に有意な可能性を秘めている
本稿では,2つの自己認識機構を統合した革新的なEEGアーキテクチャを提案する。
我々は、クロスアテンション、コントラスト学習、自己教師型学習技術を含む、脳波のトレーニングにハイブリッドトレーニング戦略を使用します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:26:52 GMT)
SqueezeMe: Mobile-Ready Distillation of Gaussian Full-Body Avatars [19.2] 本稿では,高忠実度3Dガウスフルボディアバターを軽量な表現に変換するフレームワークであるSqueezeMeを紹介する。
私たちはMeta Quest 3 VRヘッドセットで3つのガウスアバターをリアルタイムで(72FPS)同時アニメーションとレンダリングを初めて実現しました。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:35:11 GMT)
DFVEdit: Conditional Delta Flow Vector for Zero-shot Video Editing [18.9] DFVEditは,ビデオDiTに適した効率的なゼロショットビデオ編集手法である。
DFVEditは、フロー変換を介してクリーンな潜水器を直接操作することで、注意修正と微調整の両方を不要にする。
本研究は,条件付きデルタフローベクトル (CDFV) を提案し,Implicit Cross Attention (ICA) ガイダンスを統合する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:42:17 GMT)
A Hyperdimensional One Place Signature to Represent Them All: Stackable Descriptors For Visual Place Recognition [18.8] 最先端手法の性能, 計算, 拡張性を向上させるために, HOPS (Hyperdimensional One Place Signatures) を提案する。
HOPSは超次元コンピューティングフレームワークを活用することで、あらゆる環境条件にスケールする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:54:23 GMT)
Mitigating Semantic Collapse in Generative Personalization with a Surprisingly Simple Test-Time Embedding Adjustment [18.7] 生成的パーソナライゼーションにおいて、学習された視覚概念(V*$)は、その本来の意味から徐々に変化していく。
本研究では,事前学習した埋め込みの大きさと方向を推論時に調整する学習自由度手法を提案する。
本手法は多種多様なパーソナライズ手法に適用可能であり,テキスト画像アライメントの大幅な向上を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:40:27 GMT)
ReME: A Data-Centric Framework for Training-Free Open-Vocabulary Segmentation [18.7] トレーニングフリーなオープン語彙セマンティックセマンティックセマンティクス(OVS)は、任意のテキストカテゴリのセットが与えられた画像を、コストのかかるモデル微調整なしで分割することを目的としている。
本稿では,データパイプラインを組み込んだデータ品質指向フレームワークを提案する。
本手法は既存のトレーニング不要なOVSアプローチよりも優れており,トレーニングなしでOVSを前進させるためのデータ中心設計の重要性を強調している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:06:27 GMT)
Augmenting Online RL with Offline Data is All You Need: A Unified Hybrid RL Algorithm Design and Analysis [18.3] 本稿では、エージェントがオフラインデータセットとオンラインインタラクションの両方を利用して最適なポリシーを学習できる強化学習(RL)のためのハイブリッド学習フレームワークについて検討する。
統合されたアルゴリズムと分析を行い、オフラインデータセットによる信頼性に基づくオンラインRLアルゴリズムの強化は、純粋なオンラインまたはオフラインのアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:05:50 GMT)
Plant in Cupboard, Orange on Rably, Inat Aphone. Benchmarking Incremental Learning of Situation and Language Model using a Text-Simulated Situated Environment [18.3] 大きな言語モデル(LLM)はエージェントシステムのキーコンポーネントとして機能し、それらの常識的な知識は、位置や具現化されたアクションのための言語ベースのプランナーとしての性能に大きく影響する。
LLMのインクリメンタル学習(環境からのフィードバックに基づく)を評価し,テキストベースの環境を用いてコンテキスト内学習能力を制御する。
その結果、より大きな商用モデルはオープンウェイトに比べて性能がかなり低いが、ほとんどのモデルは合成語実験に苦慮していることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:38:47 GMT)
VGAT: A Cancer Survival Analysis Framework Transitioning from Generative Visual Question Answering to Genomic Reconstruction [18.2] 本稿では,VQA(Visual Question Answering)技術を統合したゲノムモダリティ再構築手法を提案する。
VQAのテキスト特徴抽出手法を適用することで、生ゲノムデータの次元問題を回避する安定なゲノム表現を導出する。
5つのTCGAデータセットで評価され、VGATは既存のWSIのみのメソッドより優れている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:09:46 GMT)
Query as Test: An Intelligent Driving Test and Data Storage Method for Integrated Cockpit-Vehicle-Road Scenarios [17.8] 既存のテストメソッドはデータスタックに依存し、すべてのエッジケースをカバーすることができず、柔軟性がない。
クエリ・アズ・テスト(QaT)は、厳格で規範化されたテストケースから、柔軟でオンデマンドな論理的なクエリへと焦点を移します。
拡張シナリオ表記(ESN)は、新しい宣言型データフレームワークである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:59:58 GMT)
Vision Transformers Don't Need Trained Registers [17.4] 疎いニューロンの集合は、外れ値のトークンに高ノルムの活性化を集中させる役割を担っている。
これらのアーティファクトを緩和するために、トレーニング不要のアプローチを作成します。
その結果,テスト時のレジスタは,テスト時のレジスタトークンの役割を効果的に担っていることが示唆された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:37:09 GMT)
KNN-MMD: Cross Domain Wireless Sensing via Local Distribution Alignment [17.3] クロスドメイン無線センシングのためのK-Nearest Maximum Neighbors Mean Discrepancy (KNN-MMD)を提案する。
我々のアプローチは、ターゲットドメインからKNNを使用してヘルプセットを構築し、ソースとターゲットドメイン間の局所的なアライメントを可能にすることから始まります。
また、モデルの性能がエポック間で急激に変動するクロスドメイン手法でよく見られる重要な不安定性問題にも対処する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:15:52 GMT)
Med-LEGO: Editing and Adapting toward Generalist Medical Image Diagnosis [17.1] Med-LEGOは、ジェネラリストCADモデルのシームレスな統合や更新を可能にする、トレーニング不要のフレームワークである。
我々の実験では、Med-LEGOは、クロスドメインとインドメインの両方の医療タスクにおいて、既存の手法よりも優れています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:51:38 GMT)
Derivational Probing: Unveiling the Layer-wise Derivation of Syntactic Structures in Neural Language Models [17.0] 本稿では,マイクロシンタクティック構造とマクロシンタクティック構造がどのように構築されているかを調べるために導出型プローブを提案する。
マイクロシンタクティック構造は下層に出現し、徐々に高層にコヒーレントなマクロシンタクティック構造に統合される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:29:30 GMT)
Cross-modal Ship Re-Identification via Optical and SAR Imagery: A Novel Dataset and Method [16.8] 海上での船の追跡は、海上捜索救助、法執行、船舶分析などの用途に不可欠である。
現在の船舶追跡手法のほとんどは静止衛星やビデオ衛星に依存している。
これらの制約に対処するため,Hybrid Optical and Synthetic Aperture Radar (SAR) Ship Re-Identificationデータセットを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:13:22 GMT)
Llama See, Llama Do: A Mechanistic Perspective on Contextual Entrainment and Distraction in LLMs [16.8] 我々は,様々な言語モデル (LM) にまたがる新しい現象,文脈学習を観察し,迅速な設定を行う。
文脈的エントレメントの大きさが意味的要因の影響を受けているという統計的に有意な証拠が得られている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:15:26 GMT)
KARMA Approach supporting Development Process Reconstruction in Model-based Systems Engineering [16.5] 本稿では,開発プロセスモデルを支援するモデル再構築手法を提案する。
GOPPRR-Eメタモデリング法に基づくKARMA言語は、プロセスモデルの一様形式化に使用される。
ケーススタディとして、航空機搭載保守システムの開発工程を再構築する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:34:08 GMT)
No Metric to Rule Them All: Toward Principled Evaluations of Graph-Learning Datasets [16.0] グラフ学習データセットの品質を評価するためのフレキシブルでモード摂動フレームワークであるRingsを紹介した。
本フレームワークでは,評価ツールとして分離性とモード補完性という2つの尺度を提案する。
グラフ学習手法の評価を改善するための実用的な勧告を導出する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:34:57 GMT)
FairyGen: Storied Cartoon Video from a Single Child-Drawn Character [15.7] 本研究では,一人の子どもの絵から物語駆動のマンガ映像を自動生成するFairyGenを提案する。
以前のストーリーテリング方法とは異なり、FairyGenはスタイル化された背景生成から文字モデリングを明示的に切り離している。
我々のシステムは、スタイリスティックに忠実で、物語的に構造化された自然運動のアニメーションを生成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:04:39 GMT)
ProSAM: Enhancing the Robustness of SAM-based Visual Reference Segmentation with Probabilistic Prompts [15.6] ProSAMは、既存のSAMベースのビジュアル参照セグメンテーションアプローチにおいて、我々が特定した安定性の課題に対処する、シンプルだが効果的な方法である。
ProSAMは不安定な領域にあるプロンプトの生成を回避し、より堅牢でないプロンプトによって引き起こされる不安定さを克服する。
私たちのアプローチは、Pascal-5$i$とCOCO-20$i$データセットの最先端メソッドを一貫して超越しています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:50:15 GMT)
Graph-Reward-SQL: Execution-Free Reinforcement Learning for Text-to-SQL via Graph Matching and Stepwise Reward [15.4] テキスト・ツー・タスクにおける大規模言語モデル(LLM)の性能向上のために,強化学習(RL)が広く採用されている。
既存の方法は、実行ベースやLLMベースのBradley-Terry報酬モデルに依存していることが多い。
本稿では,GMNScore結果報酬モデルを用いたテキスト・ツー・RLファインチューニングフレームワークであるGraph-Reward-Rewardを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:45:33 GMT)
Step-by-Step Video-to-Audio Synthesis via Negative Audio Guidance [15.3] 本稿では,個々の音声トラックを逐次生成するステップバイステップの音声合成手法を提案する。
提案手法は従来のフォーリーを反映し,映像によって引き起こされる全ての音を包括的に捉えることを目的としている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:33:56 GMT)
TaleForge: Interactive Multimodal System for Personalized Story Creation [15.2] TaleForgeは、物語とイラストの両方にユーザーの顔画像を埋め込む、パーソナライズされたストーリー生成システムである。
ユーザスタディでは、個人が主人公として現れると、エンゲージメントとオーナシップが高まった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:45:38 GMT)
Few-Shot Identity Adaptation for 3D Talking Heads via Global Gaussian Field [15.1] リコンストラクションとレンダリングに基づく音声ヘッド合成法は、強いアイデンティティ保存を伴う高品質な結果を得るが、アイデンティティ固有モデルへの依存によって制限される。
FIAGは,少数のトレーニング映像のみを用いて,効率の良い個人識別特化を実現する新しい3D音声ヘッド合成フレームワークである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:42:30 GMT)
EnLVAM: Enhanced Left Ventricle Linear Measurements Utilizing Anatomical Motion Mode [15.1] 本稿では,左室(LV)測定の精度を直線的制約によって向上する新しい枠組みを提案する。
ランドマーク検出器は解剖学的Mモード(AMM)画像に基づいて訓練され、Bモードビデオからリアルタイムで計算され、Bモード空間に変換される。
実験により、標準的なBモード法よりも精度が向上し、ネットワークアーキテクチャ全体にわたってフレームワークが一般化された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:57:17 GMT)
Large Language Models in Argument Mining: A Survey [15.0] Argument Mining (AM) はテキストから議論的構造を抽出することに焦点を当てている。
LLM(Large Language Models)の出現は、AMを大きく変化させ、高度な文脈内学習を可能にした。
本研究は, LLM駆動型AMの最近の進歩を体系的に合成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:25:12 GMT)
VERA: Variational Inference Framework for Jailbreaking Large Language Models [15.0] 最先端のLDMへのAPIのみアクセスは、効果的なブラックボックスジェイルブレイクメソッドの必要性を強調している。
VERA: variational infErence fRamework for jAilbreakingを紹介する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:22:00 GMT)
A Large Language Model-Empowered Agent for Reliable and Robust Structural Analysis [14.8] 大規模言語モデル(LLM)は、様々なオープンドメインタスクにまたがる顕著な能力を示してきたが、土木工学のような専門分野への応用は、いまだに未解明のままである。
本稿では, ビーム構造解析におけるLCMの信頼性とロバスト性を評価することによって, このギャップを埋める。
実験の結果, エージェントはベンチマークデータセット上で99.0%を超える精度を達成し, 多様な条件で信頼性と堅牢性を示すことがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:16:53 GMT)
Uncovering smooth structures in single-cell data with PCS-guided neighbor embeddings [14.7] 単細胞シークエンシングは、細胞-状態遷移の詳細な研究を可能にすることによって生物学に革命をもたらす。
ノイズの多い高次元単細胞データから滑らかで低次元の表現を抽出することは依然として困難である。
NESSは、NE表現を改善するための、原則的で解釈可能な機械学習手法である。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:45:55 GMT)
Refining Salience-Aware Sparse Fine-Tuning Strategies for Language Models [14.7] SPEFT(Sparsity-based PEFT)は、モデルの重み行列にトレーニング可能なスパース適応を導入する。
我々は、ゼロコストNASプロキシにインスパイアされたSPEFTのサリエンス指標を初めて体系的に評価した。
静的マスキング戦略と動的マスキング戦略を比較し、トレーニング前にゼロでないエントリを事前に決定する静的マスキングが、パフォーマンスを犠牲にすることなく効率を向上することを示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:34:59 GMT)
ROME: Robust Multi-Modal Density Estimator [14.6] ROME (RObust Multi-modal Estimator) は密度推定のための非パラメトリック手法である。
我々は,ROMEが他の推定者によって提示される過度な適合や過度なスムース化の問題を克服できることを示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:47:38 GMT)
Secure Video Quality Assessment Resisting Adversarial Attacks [14.6] 近年の研究では、既存のVQAモデルの敵攻撃に対する脆弱性が明らかにされている。
本稿では,既存のVQAモデルにセキュリティを持たせることを目的とした,一般敵防衛の原則について検討する。
セキュリティ指向の観点から,SecureVQAと呼ばれる新しいVQAフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:26:08 GMT)
MetaCipher: A General and Extensible Reinforcement Learning Framework for Obfuscation-Based Jailbreak Attacks on Black-Box LLMs [14.5] 難読化による脱獄攻撃は依然として有効である。
我々は,新しい難読化ベースの脱獄フレームワークである textbfMetaCipher を提案する。
わずか10クエリで、MetaCipherは92%以上のアタック成功率を達成した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:15:56 GMT)
The Cost of Avoiding Backpropagation [14.3] 前向きモード自動微分(FmAD)とゼロ次最適化(ZO)は、バックプロパゲーション(BP)に代わるメモリ効率の良い代替手段として提案されている。
本研究は,BP法,FmAD法,ZO法を総合的に比較した。
本研究は,FmADとZOの基本的限界を強調し,メモリ制約条件下でのモデルトレーニングにおいて,チェックポイントを用いたBPを最も効果的な戦略として再確認した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:47:03 GMT)
AB-UPT: Scaling Neural CFD Surrogates for High-Fidelity Automotive Aerodynamics Simulations via Anchored-Branched Universal Physics Transformers [14.3] 計算流体力学(CFD)シミュレーションのためのニューラルサロゲート構築のための新しいモデリング手法として,Anchored-Branched Universal Physics Transformers (AB-UPT)を導入した。
AB-UPTは、(i)マルチブランチ演算子による幾何符号化と予測タスクの分離、(ii)低次元潜在空間におけるニューラルシミュレーションによる高分解能出力へのスケーラビリティの実現、(iii)新しい発散のない定式化による物理の整合性の実現。
AB-UPTは、自動車CFDシミュレーションにおける表面および体積場の最先端予測精度が得られることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:59:19 GMT)
Cardiovascular disease classification using radiomics and geometric features from cardiac CT [14.3] CVD分類パイプラインを, (i) 画像分割, (ii) 画像登録, (iii) 下流CVD分類の3つのコンポーネントに分割した。
具体的には、Atlas-ISTNフレームワークと最近のセグメンテーション基礎モデルを用いて、解剖学的構造セグメンテーションと規範的健全なアトラスを生成する。
ASOCAデータセットを用いた実験により,これらの特徴を生CT画像を直接トレーニングした分類モデル(67.50%)と比較すると,CVD分類精度(87.50%)が向上することが示された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:43:05 GMT)
Not All Frame Features Are Equal: Video-to-4D Generation via Decoupling Dynamic-Static Features [14.0] 本稿では動的表現を強化するために動的静的特徴分離モジュール(DSFD)を提案する。
動的特徴と現在のフレーム特徴によって駆動される分離された特徴を取得する。
空間軸に沿って、動的領域の類似情報を適応的に選択する。
提案手法は,映像から4Dまで,最先端のSOTA(State-of-the-art)を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:31:48 GMT)
Thompson Sampling in Function Spaces via Neural Operators [14.0] 目的が未知作用素の出力の既知の関数である関数空間上の問題を最適化するために、トンプソンサンプリングの拡張を提案する。
提案アルゴリズムは,ニューラル演算子サロゲートを用いたサンプル列最適化手法を用いる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:21:57 GMT)
An LLM-assisted approach to designing software architectures using ADD [13.5] 本稿では,Attribute-Driven Design (ADD) 法を用いたLarge Language Model (LLM) 支援ソフトウェアアーキテクチャ設計手法を提案する。
ケーススタディを通じてアプローチを検証するとともに、生成した設計を実証されたソリューションと比較し、専門家アーキテクトと評価する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:58:15 GMT)
RExBench: Can coding agents autonomously implement AI research extensions? [13.5] LLM(Large Language Models)に基づくエージェントは、高度なソフトウェアエンジニアリングタスクを自律的に実行することを約束している。
研究拡張とその実装は,このようなシステムにとって重要な能力である,と我々は主張する。
この機能の評価をサポートするために、RExBenchを導入します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:41:41 GMT)
Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs [13.3] 適応型フレーム選択とマルチテンポラリスケーリングのための新しいアプローチであるビデオQFrameを紹介する。
Q-Frameは、CLIPのようなテキスト画像マッチングネットワークによって生成されたトレーニング不要のプラグイン・アンド・プレイ戦略を採用している。
ベンチマークデータセットの広範な実験を通じて,Q-Frameの有効性を実証する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:30:51 GMT)
CaO$_2$: Rectifying Inconsistencies in Diffusion-Based Dataset Distillation [13.2] 拡散に基づくデータセット蒸留は, 評価プロセスを見落とし, 蒸留プロセスにおける2つの重要な矛盾を示す。
本稿では, 蒸留プロセスと評価目標を整合させる2段階拡散に基づくフレームワークであるCaO$(Condition-Aware with Objective-Guided Smpling Optimization)を紹介する。
CaO$はImageNetとそのサブセットの最先端のパフォーマンスを達成し、平均2.3%の精度で最高のパフォーマンスのベースラインを超えた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:02:05 GMT)
A Survey of Large Language Models in Psychotherapy: Current Landscape and Future Directions [13.2] 大きな言語モデル(LLM)は、広いコンテキストとマルチターン推論を扱う能力のために、このギャップに対処する可能性がある。
本総説では, 精神療法を相互に連携した段階(評価, 診断, 治療)に分割し, LLMの進歩と課題を体系的に検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:52:25 GMT)
Gradual Domain Adaptation for Graph Learning [13.1] 本稿では,コンパクトなドメイン配列を構成するグラフ段階的ドメイン適応(GGDA)フレームワークを提案する。
我々のアプローチは、FGW(Fused Gromov-Wasserstein)計量上の知識保存中間グラフの効率的な生成から始まる。
我々のフレームワークは、実装可能な上界と下界を介して、難易度の高いドメイン間距離$W_p(mu_t,mu_t+1)$を増大させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:45:02 GMT)
GenEscape: Hierarchical Multi-Agent Generation of Escape Room Puzzles [13.0] 我々は,視覚的,論理的,知的刺激的な,脱出室パズル画像を生成することによって,テキスト・ツー・イメージモデルに挑戦する。
本稿では,このタスクを機能設計,象徴的なシーングラフ推論,レイアウト合成,局所画像編集など,構造化段階に分解する階層型マルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:08:37 GMT)
A Different Approach to AI Safety: Proceedings from the Columbia Convening on Openness in Artificial Intelligence and AI Safety [12.9] オープンウェイトでオープンソースのファンデーションモデルは、AIシステムを安全にする義務を強化しています。
本稿では,AIオープンネスと安全に関するコロンビア・コンベンションの結果を報告する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:45:44 GMT)
dreaMLearning: Data Compression Assisted Machine Learning [12.9] 本稿では,圧縮データからの学習を非圧縮で行えるフレームワークであるdreaMLearningを紹介する。
実験によると、dreaMLearningはトレーニングを最大8.8倍加速し、メモリ使用量を10倍削減し、ストレージを42%削減する。
これらの進歩は、分散学習やフェデレーション学習、リソース制約エッジデバイスでの微小MLなど、多様なMLアプリケーションを強化する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:57:22 GMT)
End-to-End Full-Page Optical Music Recognition for Pianoform Sheet Music [12.8] 複雑なレイアウトにおいて、ページレベルの光音楽認識のための、真にエンドツーエンドなアプローチを初めて提示する。
本システムでは,畳み込み層と自己回帰変換器を組み合わせることで,楽譜ページ全体を処理し,完全書き起こしを符号化形式で出力する。
その結果,本システムは,全ページの楽譜の書き起こしに成功しただけでなく,ゼロショット設定とターゲットドメインとの微調整の両面において,商業ツールよりも優れていた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:39:52 GMT)
USM-VC: Mitigating Timbre Leakage with Universal Semantic Mapping Residual Block for Voice Conversion [12.7] 音声変換(VC)は、ソース音声を内容を保存することによってターゲット音声に変換する。
これを解決するために,コンテント抽出器にUniversal Semantic Matching (USM)残差ブロックを導入する。
提案手法は音色漏れを効果的に軽減し,ターゲット話者との類似性を著しく改善することを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:01:55 GMT)
LoopGen: Training-Free Loopable Music Generation [12.7] 現在の生成音楽モデルは、本当にループ可能なオーディオを作り出すのに苦労しています。
我々は、非自己回帰モデルを変更して、円形パターンでトークンを生成する。
この推論のみのアプローチは、将来の状況とループを自然に認識している世代に結果をもたらす。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:34:00 GMT)
CMI-Bench: A Comprehensive Benchmark for Evaluating Music Instruction Following [12.6] CMI-Benchは、様々な音楽情報検索(MIR)タスクにおいて、オーディオテキストLLMを評価するために設計された総合的な音楽指示に従うベンチマークである。
以前のベンチマークとは異なり、CMI-Benchは従来の最先端のMIRモデルと一致する標準化された評価基準を採用している。
LTU,Qwen-audio,SALMONN,MusiLingoなど,オープンソースの音声テキストLLMをサポートする評価ツールキットを提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:42:09 GMT)
Fingerprinting SDKs for Mobile Apps and Where to Find Them: Understanding the Market for Device Fingerprinting [12.5] 本稿では,モバイルアプリケーションエコシステムにおける指紋の挙動を大規模に分析する。
当社は,サードパーティSDKの共通使用によって実現されるように,サードパーティのトラッキングに焦点をあてて,市場ベースのアプローチを採用しています。
われわれの知る限りでは、これはSDKの動作をこれまでで最大規模で分析することを意味している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:05:48 GMT)
Grammar and Gameplay-aligned RL for Game Description Generation with LLMs [12.3] ゲーム記述生成(GDG)は、自然言語テキストからゲーム記述言語(GDL)で記述されたゲーム記述を生成するタスクである。
GDG(RLGDG)のための強化学習に基づく大規模言語モデルの微調整を提案する。
学習方法は,ゲームコンセプトに対する文法的正しさと忠実さを同時に向上させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:31:44 GMT)
Round Attention: A Novel Round-Level Attention Mechanism to Accelerate LLM Inference [12.3] 会話ラウンドが続くにつれて、大量のKVキャッシュをGPUメモリに格納する必要がある。
ラウンドアテンション - トップk関連ラウンドのKVキャッシュを選択的に処理する新しいラウンドレベルのアテンション機構を提案する。
提案手法はメモリ使用量を54%から82%削減するが, 実験結果から, スパースクリティカルラウンドKVキャッシュの負荷が性能劣化を伴わずに応答精度を維持できることが確認された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:43:24 GMT)
Cost-effective Reduced-Order Modeling via Bayesian Active Learning [12.3] 本研究では,不確実性を意識したベイズ固有分解(POD)に基づく能動的学習フレームワークBayPOD-ALを提案する。
棒の温度変化を予測する実験結果から,ベイポッドALの有効性が示唆された。
トレーニングデータセットよりも高時間分解能のデータセット上で,ベイポD-ALの性能を評価することにより,ベイポD-ALの一般化性と効率を実証する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:23:37 GMT)
SDRNET: Stacked Deep Residual Network for Accurate Semantic Segmentation of Fine-Resolution Remotely Sensed Images [12.2] 高解像度リモートセンシング画像のセマンティックセグメンテーションから生成されたランドカバーマップは、ミューコンを描画した。
本稿では、FRRS画像からのセマンティックセグメンテーションのためのスタックドディープ残差ネットワーク(SDRNet)を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:40:30 GMT)
$C^3$-Bench: The Things Real Disturbing LLM based Agent in Multi-Tasking [12.2] エージェントの堅牢性を評価するためのオープンソースベンチマークをC3$-Benchで提示する。
具体的には,複雑なツール関係をナビゲートし,重要な隠蔽情報を処理し,動的決定経路を管理する,という3つの課題を設計する。
本質的に$C3$-Benchは、これらの課題を通じてモデル脆弱性を公開し、エージェントパフォーマンスの解釈可能性の研究を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:58:25 GMT)
Leveraging Semantic Asymmetry for Precise Gross Tumor Volume Segmentation of Nasopharyngeal Carcinoma in Planning CT [12.2] 鼻咽喉頭癌(NPC)の放射線治療では,非コントラスト計画CTを用いてGTV(Grog tumor volume)を脱線させるのが一般的である。
腫瘍と隣接する正常な組織との間の低コントラストは、放射線腫瘍学者が手動で腫瘍を脱線させる必要がある。
非コントラストプランニングCT画像にNPC細胞性腫瘍を直接分離する手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:50:03 GMT)
Universal Retrieval for Multimodal Trajectory Modeling [12.2] 軌道データは、AIエージェント能力を向上する大きな可能性を秘めている。
本稿では,ユニバーサル検索とエージェント中心軌道モデリングのギャップを埋めるマルチモーダル軌道検索手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:50:38 GMT)
DiffSoundStream: Efficient Speech Tokenization via Diffusion Decoding [12.1] DiffSoundStreamは、非ストリーミングシナリオにおける音声トークン化の効率を改善するソリューションである。
実験によると、毎秒50トークンのDiffSoundStreamは標準のSoundStreamモデルと同等の音声品質を実現している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:23:07 GMT)
Probabilistic Optimality for Inference-time Scaling [11.9] 大規模言語モデル(LLM)の推論性能を向上させるための強力な手法として、推論時間スケーリングが登場した。
本稿では,並列サンプルが独立して同一分布であるという仮定の下で,推論時間スケーリングの最適性を定式化する確率的フレームワークを提案する。
このフレームワーク内では,対象性能レベルを達成するために,必要なサンプル数に基づいて理論的な下限を導出し,計算効率のスケーリングに関する第一原理的なガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:44:11 GMT)
UiS-IAI@LiveRAG: Retrieval-Augmented Information Nugget-Based Generation of Responses [11.8] Retrieval-augmented Generation (RAG) は、事実の正しさ、ソース属性、応答完全性に関連する課題に直面している。
本稿では,検索した文書から抽出した関連情報の最小限の原子単位である情報ナゲットに基づくモジュールパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:29:25 GMT)
MDC-R: The Minecraft Dialogue Corpus with Reference [11.6] Minecraft Dialogue Corpus with Reference (MDC-R) について紹介する。
MDC-Rは、オリジナルのMinecraft Dialogue Corpus (MDC) を補完する新しい言語リソースであり、アナフォリックおよびデリケートな参照のエキスパートアノテーションを備えている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:56:40 GMT)
Practical and Accurate Local Edge Differentially Private Graph Algorithms [11.6] 我々は、kコア分解と三角形カウントという2つの基本グラフ統計量に対して、新しい LDP アルゴリズムを導入する。
提案手法は、入力依存のプライベートグラフ特性、特にグラフの退化性と最大度を活用して、理論的有用性を向上させる。
我々のkコア分解は正確な値の3倍以内の誤差を達成し、Dhulipalaなどのベースラインで131倍の誤差をはるかに上回っている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:23:30 GMT)
Integrating Multi-Modal Sensors: A Review of Fusion Techniques for Intelligent Vehicles [11.4] マルチセンサー融合は、自律運転の知覚を高める上で重要な役割を担っている。
本稿では,マルチセンサ融合戦略をデータレベル,特徴レベル,決定レベルカテゴリに形式化する。
我々は、重要なマルチモーダルデータセットを提示し、現実の課題に対処する上で、それらの適用性について議論する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:43:48 GMT)
RLSF: Fine-tuning LLMs via Symbolic Feedback [11.4] 大規模言語モデル(LLM)はAIを変えてきたが、ドメイン固有の推論と論理的アライメントを必要とするタスクにしばしば苦労している。
従来の微調整手法は、私たちにとって利用可能な膨大な量の記号的ドメイン知識を活用できない。
本稿では,新しい微調整パラダイムであるシンボリックフィードバック(RLSF)による強化学習を紹介する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:16:37 GMT)
Spring-block theory of feature learning in deep neural networks [11.4] 特徴学習深度ネットが、定期的に低次元の幾何学にどのように崩壊するかを示す。
本稿では,図を再現し,階層間の特徴学習と一般化をリンクするマクロ力学的理論を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:20:12 GMT)
MimicMotion: High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance [11.3] 我々は、任意の長さの高品質なビデオを生成することができるMimicMotionと呼ばれる制御可能なビデオ生成フレームワークを提案する。
信頼を意識したポーズガイダンスは、高いフレーム品質と時間的滑らかさを保証する。
長大かつスムーズなビデオを生成するために,我々は進行的な潜伏融合戦略を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:06:13 GMT)
EAMamba: Efficient All-Around Vision State Space Model for Image Restoration [11.2] 本研究では,マルチヘッド選択走査モジュール(MHSSM)と全周走査機構を組み込んだ拡張フレームワークであるEfficient All-Around Mamba (EAMamba)を紹介する。
EAMambaは、既存の低レベルのVision Mamba法と比較して、FLOPの大幅な31~89%の削減を実現している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:12:58 GMT)
Reward Balancing Revisited: Enhancing Offline Reinforcement Learning for Recommender Systems [11.0] 本稿ではReallocated Reward for Recommender Systems (R3S)と呼ばれる革新的なオフラインRLフレームワークを提案する。
報酬予測における本質的な変動に対処するために本質的なモデルの不確実性を統合することにより、意思決定のための多様性を高め、よりインタラクティブなパラダイムと整合させる。
実験の結果,R3Sは世界モデルの精度を向上し,ユーザの不均一な嗜好を効率的に調和させることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:46:41 GMT)
Field mixing in a thermal medium: A quantum master equation approach [11.0] 本研究では,2つの(擬似)スカラー場の間接混合の非平衡ダイナミクスについて検討した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:59:48 GMT)
Bridging Compositional and Distributional Semantics: A Survey on Latent Semantic Geometry via AutoEncoder [10.9] このサーベイは、合成意味論のレンズを通して、潜在空間幾何学に関する新しい視点を提供する。
本稿では、Vector Quantized VAE(VQVAE)、Sparse AutoEncoder(SAE)の3つの主流オートエンコーダアーキテクチャをレビューし、比較する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:47:54 GMT)
An Algebraic Theory of Gapped Domain Wall Partons [10.9] 絡み合いブートストラッププログラムは、2次元の位相位相相の間のギャップ付き領域壁に住む自由度に関連する新しい量子数を生成する。
これらの中で最も基本的なものは、複合セクターの動物園を生み出すいわゆる「パルトン」量子数である。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:00:03 GMT)
PriorDiffusion: Leverage Language Prior in Diffusion Models for Monocular Depth Estimation [10.9] 拡散モデルのテキスト・ツー・イメージ事前学習において得られた帰納的バイアスを活用することにより,先行言語は単眼深度推定を向上させることができると論じる。
本稿では,アフィン不変深度を推定するために,画像と対応するテキスト記述を併用した事前学習型テキスト・画像拡散モデルを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:07:48 GMT)
Can LLMs Interpret and Leverage Structured Linguistic Representations? A Case Study with AMRs [10.8] 本稿では,Large Language Models (LLMs) が構造化言語表現の形で文脈情報を活用する能力を評価する。
抽象的意味表現(AMR:Abstract Meaning Representation)構造を多種多様な言語タスクに適用し,短いコンテキストと長いコンテキストの両方を符号化することの影響について検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:58:33 GMT)
Why Are Parsing Actions for Understanding Message Hierarchies Not Random? [10.7] ランダム解析手法を用いたエージェントが高い通信精度を維持しているかどうかを考察する。
階層構造を持つ複雑な入力を解析できる、単純で複雑な修正を行う。
これらの変更により、ランダム解析手法を用いたエージェントが高い通信精度を維持しているかどうかを評価する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:27:35 GMT)
GKNet: Graph Kalman Filtering and Model Inference via Model-based Deep Learning [10.6] グラフ上の時系列による推論タスクは、都市水ネットワーク、経済学、ネットワーク化された神経科学などの応用において重要である。
グラフ時間列に対するグラフ対応状態空間モデルを提案する。このモデルでは、潜時状態と観測方程式の両方がパラメトリックグラフ誘導モデルであり、学習すべきパラメータが限られている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:17:07 GMT)
NSegment : Label-specific Deformations for Remote Sensing Image Segmentation [10.6] リモートセンシング(RS)画像セグメンテーションデータセットのラベル付けエラーは、曖昧なクラス境界、混合ピクセル、影、複雑な地形の特徴、主観的アノテータバイアスのため、暗黙的かつ微妙なままであることが多い。
NSegmentは、この問題を軽減するために、シンプルだが効果的なデータ拡張ソリューションである。
従来の方法とは異なり、セグメンテーションラベルのみに弾性変換を適用し、各トレーニングエポックにおける各サンプル毎の強度を変化させて、アノテーションの不整合に対処する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:35:04 GMT)
Reasoning in machine vision: learning to think fast and slow [10.4] 推論は人間の知性の目印であり、複雑で不慣れなシナリオで適応的な意思決定を可能にする。
マシンインテリジェンスは、推論時にソリューションを動的に洗練する能力がないため、トレーニングデータに縛られている。
本稿では,思考時間の増加に伴う性能向上を実現することにより,視覚における機械推論を可能にする新しい学習パラダイムを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:03:05 GMT)
FSDA-DG: Improving Cross-Domain Generalizability of Medical Image Segmentation with Few Source Domain Annotations [10.4] 医用画像セグメンテーションのクロスドメイン一般化性を改善するための新しい手法としてFSDA-DGを提案する。
FSDA-DGは、画像をグローバルな広域領域とセマンティクスに誘導されたローカルリージョンに分割し、データ分散の強化のために異なる拡張戦略を適用する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:01:39 GMT)
MMCR: Benchmarking Cross-Source Reasoning in Scientific Papers [10.3] この研究は、科学論文からのクロスソース情報を用いた推論のためのビジョンランゲージモデルの能力を評価するために設計されたベンチマークであるMMCRを提示する。
18のVLMによる実験では、既存のモデルに対して、クロスソース推論が重大な課題となることが示されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:14:07 GMT)
EasyDistill: A Comprehensive Toolkit for Effective Knowledge Distillation of Large Language Models [10.3] 大規模言語モデル(LLM)の効果的なブラックボックスおよびホワイトボックス知識蒸留(KD)のための総合ツールキットであるEasyDistillを提案する。
我々のフレームワークは、データ合成、教師付き微調整、ランキング最適化、強化学習技術など多機能な機能を提供している。
EasyDistillは、研究者や業界の実践者がLLMのKD戦略をシームレスに実験し、実装できるようにする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:59:43 GMT)
Grounding-Aware Token Pruning: Recovering from Drastic Performance Drops in Visual Grounding Caused by Pruning [10.3] MLLM(Multimodal Large Language Models)は、視覚的接地において強力な性能を示す。
我々はプルーニングがモデルのグラウンド化能力を大幅に低下させ、誤った予測と劇的な性能低下をもたらすことを観察した。
位置IDを簡易かつ効果的に調整し,RECの精度を51.42%まで回復するGrounding-Aware Token Pruning (GAP)を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:11:22 GMT)
iPrOp: Interactive Prompt Optimization for Large Language Models with a Human in the Loop [10.2] $textitiPrOp$は、インタラクティブなプロンプト最適化アプローチである。
最適化プロセスにおける人間のエンゲージメントを高めるためのタスク固有のガイダンスをユーザに提供することを目的としている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:25:48 GMT)
Epistemic Artificial Intelligence is Essential for Machine Learning Models to Truly 'Know When They Do Not Know' [10.1] AIの素晴らしい成果にもかかわらず、不確実性を扱うAIシステムの能力には大きなギャップがある。
従来の機械学習アプローチは、データ適合性の過大評価のため、この問題に対処するのに苦労している。
このポジションペーパーは、認識論的人工知能へのパラダイムシフトを示し、モデルが知っていることから学ぶ必要性を強調している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:25:34 GMT)
Self is the Best Learner: CT-free Ultra-Low-Dose PET Organ Segmentation via Collaborating Denoising and Segmentation Learning [10.0] ポジトロン・エミッション・トモグラフィ(PET)における臓器の分画は、がんの定量化において重要な役割を担っている。
低線量PET(LDPET)は、放射線被曝を減らすことでより安全な代替手段を提供する。
既存のPET臓器分割法はコアギスタードCT(Computerd Tomography)アノテーションに依存している。
我々は,新しいCTフリー超LDPET臓器分割パイプラインであるLDOSを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:47:23 GMT)
Exploiting Vision Language Model for Training-Free 3D Point Cloud OOD Detection via Graph Score Propagation [9.9] 3Dポイントクラウドデータのアウト・オブ・ディストリビューション(OOD)検出は依然として課題である。
本稿では,視覚言語モデル(VLM)を利用した3次元点群における効果的なOOD検出のためのトレーニングフリーフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:42:45 GMT)
EFRame: Deeper Reasoning via Exploration-Filtering-Replay Reinforcement Learning Framework [9.7] EFRame(Exploration-Filtering-Replay)は,GRPOを3つの重要な次元で体系的に拡張するフレームワークである。
EFRameは完全な安定した学習サイクルを確立し、探索から収束までの構造化された遷移を通じてモデルを導く。
実験の結果,EFRameはトレーニングの堅牢性や効率性を向上するだけでなく,バニラGRPOの下では実現不可能な深い推論能力にもアクセス可能であることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:09:05 GMT)
Tied Prototype Model for Few-Shot Medical Image Segmentation [9.5] 本稿では,前景および背景分布のためのプロトタイプ位置を結合したADNetの原理的再構成を提案する。
確率的基盤に基づいて、TPMは自然に複数のプロトタイプとマルチクラスのセグメンテーションに拡張する。
自然発生のクラス事前を利用して適応しきい値の理想的なターゲットを定義する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:33:55 GMT)
ProtoSeg: Interpretable Semantic Segmentation with Prototypical Parts [9.3] 本稿では,解釈可能なセマンティックイメージセグメンテーションの新しいモデルであるProtoSegを紹介する。
ベースライン法に匹敵する精度を達成するため,プロトタイプ部品の機構を適応させる。
ProtoSegは標準的なセグメンテーションモデルとは対照的にセグメンテーションの概念を発見する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:06:31 GMT)
On the Lipschitz Continuity of Set Aggregation Functions and Neural Networks for Sets [9.0] ニューラルネットワークのリプシッツ定数は、ネットワークのいくつかの重要な性質に接続されている。
これまでの研究は主に多層パーセプトロンと畳み込みニューラルネットワークのリプシッツ定数の推定に重点を置いてきた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:58:00 GMT)
Evaluating Scoring Bias in LLM-as-a-Judge [8.8] 大規模言語モデル (LLM) は複雑なタスクの評価に使用される。
LLM-as-a-Judgeには様々なバイアスがあり、判断の公平性と信頼性に悪影響を及ぼす。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:25:23 GMT)
SPADE: Spatial Transcriptomics and Pathology Alignment Using a Mixture of Data Experts for an Expressive Latent Space [8.6] 本研究では,空間転写学データと病理組織学を統合し,画像表現学習を指導する基礎モデルSPADEを紹介する。
SPADEは14のダウンストリームタスクで評価され、ベースラインモデルと比較して非常に優れた数ショット性能を示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:20:51 GMT)
Breaking Rank Bottlenecks in Knowledge Graph Completion [8.4] 多くの知識グラフ補完(KGC)モデルは、単純なベクトル行列乗法に頼り、候補となるオブジェクトに対してクエリをスコアする。
ランクボトルネックがKGCモデルにどのように影響するかを理論的および実証的に検討する。
KGCモデルのランクボトルネックを解消する混合出力層であるKGE-MoSを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:41:22 GMT)
Strategic A/B testing via Maximum Probability-driven Two-armed Bandit [8.3] 本研究は, 平均ボラティリティ統計量の重み付けにより, 最大確率駆動型二本腕バンディット(TAB)プロセスを提案する。
置換法の実装により、ロバスト性と有効性がさらに向上する。
実験結果から,A/B試験の大幅な改善が示され,高い統計力を維持しながら実験コストを低減できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:15:57 GMT)
Learning to Solve Multi-Objective Routing Problems on Multigraphs [8.3] マルチグラフ上での多目的ルーティングに対処するための2つのニューラルアプローチを提案する。
最初のアプローチは、ツアーが完了するまでエッジを自動回帰的に選択することで、マルチグラフ上で直接動作する。
一方,第2のモデルではまずまずマルチグラフを単純なグラフにプルークし,ルートを構築する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:25:58 GMT)
Optimal Return-to-Go Guided Decision Transformer for Auto-Bidding in Advertisement [8.2] 本稿では,自動入札に固有の問題に対処するため,R*決定変換器(R* DT)を導入する。
R* DTは、状態とリターン・トゥ・ゴー(RTG)値に基づくアクションを格納し、トレーニングセットを使用して所定の状態のRTGを記憶する。
公開入札データセットの総合的なテストは、R* DTの有効性を検証し、混合品質軌跡を扱う際の優位性を強調する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:56:54 GMT)
Unveiling the Power of Noise Priors: Enhancing Diffusion Models for Mobile Traffic Prediction [8.2] 我々は,ノイズを先行成分と残留成分に分解するフレームワークであるNPDiffを提案する。
NPDiffは、様々な拡散に基づく予測モデルとシームレスに統合することができ、効率的、効率的、堅牢な予測を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:56:44 GMT)
Towards Accurate Heart Rate Measurement from Ultra-Short Video Clips via Periodicity-Guided rPPG Estimation and Signal Reconstruction [8.2] 我々は,2つの課題に対処することにより,超短2秒ビデオクリップからHRを正確に測定することを目指している。
まず,超短ビデオクリップにおける心拍周期の制限を克服するために,実効周期性誘導r推定法を提案する。
第二に、スペクトルリークによる不正確性を軽減するため、より長いr信号の再構成を行うジェネレータを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:05:00 GMT)
Time is On My Side: Dynamics of Talk-Time Sharing in Video-chat Conversations [8.1] すべての会話の本質的な側面は、複数の話者間で会話時間を共有する方法である。
本稿では,話者間の会話時間分布を定量化する計算フレームワークを提案する。
我々はこのフレームワークを、見知らぬ人間のビデオチャットの大規模なデータセットに適用する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:08:11 GMT)
A Wavelet Diffusion GAN for Image Super-Resolution [8.0] 拡散モデルは,高忠実度画像生成のためのGAN(Generative Adversarial Network)の優れた代替品として登場した。
しかし、そのリアルタイム実現性は、遅いトレーニングと推論速度によって妨げられている。
本研究では,ウェーブレットを用いた単一画像超解法のための条件拡散GANスキームを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:13:25 GMT)
SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving [7.9] acronymは、軽量エッジデバイスが様々なドラフトモデルを使用して、複数の候補トークンをローカルにドラフトできるフレームワークである。
単一の共有エッジサーバは、より正確なターゲットモデルを用いてトークンを検証する。
Jetson Orin Nano、Raspberry Pi 4B/5、Nvidia A100 GPUを搭載したエッジサーバを使った最初の実験は、大きなメリットを示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:37:25 GMT)
Linearly Homomorphic Signature with Tight Security on Lattice [7.9] Boyen氏とLi氏は、ASIACRYPT 2016カンファレンスで、オープンな問題を提起した。
ショートソリューション(SIS)硬さ仮定の下で、厳密にセキュアな同型シグネチャスキームを構築する方法。
この研究は、同じ仮定の下でこの問題の最初の完全な解決を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:52:06 GMT)
ReF-LLE: Personalized Low-Light Enhancement via Reference-Guided Deep Reinforcement Learning [7.9] ReF-LLEは、フーリエ周波数領域で動作し、深層強化学習を取り入れた、パーソナライズされた低照度画像強調手法である。
推論フェーズでは、ReF-LLEはFourierドメインのゼロ周波数成分によって導かれる、パーソナライズされた適応的反復戦略を採用する。
ベンチマークデータセットの実験では、ReF-LLEが最先端のメソッドより優れていることが示されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:35:34 GMT)
Quantum Coherence and Distinguishability as Complementary Resources: A Resource-Theoretic Perspective from Wave-Particle Duality [7.6] 我々は、量子コヒーレンスと古典的区別可能性を相補的な資源として扱う。
我々は、互いに純粋な状態のアンサンブルにおいて、コヒーレントな自由操作の下で保存されるコヒーレンスを定量化するコビットの和が有界であることを証明する。
この双対関係は、系の量子コヒーレンスを同時に保存することと、その古典的な区別可能性の抽出の間に固有のトレードオフを露呈する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:00:28 GMT)
Learning Networks from Wide-Sense Stationary Stochastic Processes [7.6] ここでの重要な推論問題は、ノード出力(ポテンシャル)からエッジ接続を学習することである。
我々はWhittleの最大可能性推定器(MLE)を用いて時間相関サンプルから$Last$のサポートを学習する。
MLE問題は厳密な凸であり、ユニークな解であることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:01:18 GMT)
Scalable Hypergraph Structure Learning with Diverse Smoothness Priors [7.6] そこで本研究では,前処理の滑らかさに基づいて時系列信号からハイパーグラフを復元するハイパーグラフ学習手法を提案する。
提案手法は,Smoothness (HSLS) を用いたハイパーグラフ構造学習 (Hypergraph Structure Learning) と呼ばれ,先行研究の限界に対処する。
我々の手法はますます複雑なネットワーク構造においてスケーラブルになる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:58:19 GMT)
The Aging Multiverse: Generating Condition-Aware Facial Aging Tree via Training-Free Diffusion [7.5] 一つの画像から複数の可塑性顔の老化軌跡を生成するためのフレームワークであるAging Multiverseを紹介する。
本研究では,アイデンティティの保存,年齢の正確さ,条件管理のバランスをとるための,学習自由拡散に基づく手法を提案する。
実験とユーザスタディでは、アイデンティティ保存、高齢化リアリズム、条件付きアライメントなど、最先端のパフォーマンスが実証されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:43:26 GMT)
QuickSilver -- Speeding up LLM Inference through Dynamic Token Halting, KV Skipping, Contextual Token Fusion, and Adaptive Matryoshka Quantization [7.2] 推論は、大きな言語モデルにおける遅延とエネルギー消費の大部分を占める。
QuickSilverはモジュール型のトークンレベルのフレームワークで、モデルウェイトや構造を変更することなく、推論時のセマンティックアダプティビティを実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:10:32 GMT)
Towards Fair Rankings: Leveraging LLMs for Gender Bias Detection and Measurement [6.9] 自然言語処理(NLP)と情報検索(IR)システムの社会的バイアスは、現在進行中の課題である。
我々は,大言語モデル(LLM)を利用して,通過ランクの性別バイアスを検出し,測定することで,この問題に対処することを目指している。
そこで我々は,既存の制約に対処するために,CWEx (Class-wise Weighted Exposure) という新しいジェンダーフェアネス尺度を導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:39:12 GMT)
Pixels-to-Graph: Real-time Integration of Building Information Models and Scene Graphs for Semantic-Geometric Human-Robot Understanding [6.9] 画像画素とLiDARマップから構造化されたシーングラフをリアルタイムに生成する,新しい軽量な手法である Pixels-to-Graph (Pix2G) を紹介する。
このフレームワークは、オンボードの計算制約を満たすためだけにCPU上のすべての操作を実行するように設計されている。
提案手法は,NASA JPL NeBula-Spot脚ロボットを用いた実世界の実験において,定量的に定性的に評価される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:23:31 GMT)
Generative AI for Software Architecture. Applications, Challenges, and Future Directions [6.9] 我々は、ソフトウェアアーキテクチャにおけるGenAIの使用、合理化、コンテキスト、ユーザビリティ、および将来の課題を体系的に総合することを目指している。
アーキテクチャ決定支援とアーキテクチャ再構築のためのGenAIの導入について検討した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:29:21 GMT)
Dehazing Light Microscopy Images with Guided Conditional Flow Matching: finding a sweet spot between fidelity and realism [6.9] 光顕微鏡画像のデハージングのための新しい反復法HazeMatchingを提案する。
我々の目標は、デハジング結果の忠実さと個人の予測の現実性の間にバランスのとれたトレードオフを見つけることであった。
提案手法は, 平均的な忠実度と現実性との間に一貫したバランスを保ちながら, 7つの基準線と比較する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:10:43 GMT)
CAL-RAG: Retrieval-Augmented Multi-Agent Generation for Content-Aware Layout Design [6.8] CAL-RAGは、コンテンツ対応レイアウト生成のための検索拡張エージェントフレームワークである。
我々は、LangGraphを使ってフレームワークを実装し、セマンティック変数に富んだベンチマークで評価する。
その結果,検索強化とエージェント的多段階推論を組み合わせることで,拡張性,解釈性,高忠実度な解が得られることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:09:56 GMT)
ZeroReg3D: A Zero-shot Registration Pipeline for 3D Consecutive Histopathology Image Reconstruction [6.6] 組織学的解析は組織構造や病理を理解する上で重要な役割を担っている。
2次元スライスから正確な3Dモデルを構築することは、組織変形、分割アーティファクト、画像技術における可変性、および一貫性のない照明のために依然として困難である。
本研究では,ゼロレグ3D(ゼロレグ3D,ゼロレグ3D,ゼロレグ3D,ゼロレグ3D,ゼロレグ3D)を導入した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:31:23 GMT)
Excited States from ADAPT-VQE convergence path in Many-Body Problems: application to nuclear pairing problem and $H_4$ molecule dissociation [6.6] 量子コンピューティングアルゴリズムは、多体相互作用系における低レベルの励起状態を得るために提案される。
近似固有状態は、ADAPT-VQEの収束経路から選択された状態の部分空間における量子空間対角化法を用いて得られる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:45:01 GMT)
Embedding-based Approaches to Hyperpartisan News Detection [6.5] 過党派ニュース(Hyperpartisan news)は、国民に政治的分裂を起こそうとする極端に分極的な政治的立場をとるニュースである。
両方向LSTMを用いた事前学習ELMoを用いた最適システムは,10倍のクロスバリデーションで83%の精度を実現した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:38:02 GMT)
ARMOR: Robust Reinforcement Learning-based Control for UAVs under Physical Attacks [6.4] 無人航空機(UAV)は、知覚、ナビゲーション、制御のための搭載センサーに依存している。
ArmORは攻撃耐性、モデルレス強化学習コントローラである。
ArmORは2段階のトレーニングフレームワークを通じて、UAVの物理的状態の堅牢な遅延表現を学習する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:46:33 GMT)
Periodic-MAE: Periodic Video Masked Autoencoder for rPPG Estimation [6.3] 本研究では,肌の色調の微妙な変化を経時的に捉え,顔画像から周期的な信号の一般的な表現を学習する手法を提案する。
提案手法をPURE, U-BFCr, MMPD, V-BFC4Vデータセット上で評価した。
その結果,特にクロスデータセット評価の課題において,大幅な性能向上が見られた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:18:10 GMT)
LeanConjecturer: Automatic Generation of Mathematical Conjectures for Theorem Proving [6.2] LeanConjecturerは、Large Language Models(LLMs)を使用して、Lean 4で大学レベルの数学予想を自動的に生成するパイプラインである。
反復生成と評価により、LeanConjecturerは40のMathlibシードファイルから12,289の予想を生成し、3,776は構文的に有効で非自明であると同定された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:17:18 GMT)
Beyond ReLU: How Activations Affect Neural Kernels and Random Wide Networks [6.1] 我々は、非滑らか性のみがゼロである典型的な活性化関数に対して、より一般的なRKHSの特性を提供する。
以上の結果から, 無限に滑らかでないアクティベーションの幅広いクラスは, 異なるネットワーク深さで等価なタンジェントを生成する一方, アクティベーションは等価でないRKHSを生成することがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:56:09 GMT)
One Video to Steal Them All: 3D-Printing IP Theft through Optical Side-Channels [6.1] 本研究では,3Dプリンティングプロセスの映像記録にアクセスできる敵が,基礎となる3Dプリンティング命令をリバースエンジニアリングできることを示す。
本モデルでは,印刷工程中のプリンタノズルの動きを追跡し,対応する軌道をGコードにマッピングする。
フィードレートやエクストルージョンレートなどの正しいパラメータを特定し、知的財産の盗難を成功させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:34:07 GMT)
FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization [6.1] FEASTはフレキシブルな食事時間支援システムで、Wildでパーソナライズできる。
当社のシステムは,適応性,透明性,安全性の3つのキーテットによって誘導されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:48:18 GMT)
Practical roadmap to measurement-altered criticality in Rydberg arrays [6.0] 原子の周期的な部分集合を投影的に測定すると、異なる方法で量子臨界相関が変化することを示す。
提案した事後状態の特徴付けには,未測定臨界状態の特徴付けに使用する結果の事後平均化の調整しか必要としない。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:11:16 GMT)
ASVSim (AirSim for Surface Vehicles): A High-Fidelity Simulation Framework for Autonomous Surface Vehicle Research [5.9] AirSim For Surface Vehicles (ASVSim) は、内陸および港湾環境での自律輸送研究のためのオープンソースのシミュレーションフレームワークである。
ASVSimは、自律的なナビゲーションアルゴリズムを開発し、合成データセットを生成するための包括的なプラットフォームを提供する。
ASVSimはMITライセンスの下でオープンソースプロジェクトとして提供されており、海洋工学コミュニティの大部分で自律的なナビゲーション研究が利用できるようになる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:39:16 GMT)
Towards Distributed Neural Architectures [5.9] 視覚領域と言語領域に分散ニューラルネットワーク(DNA)を導入し、訓練する。
DNAは(トランスフォーマー、計算、注意など)モジュールとルータで構成されるプロトアーキテクチャを持つ。
DNAモジュールの計算と通信パターンは、トレーニング中にエンドツーエンドに学習される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:57:59 GMT)
R1-Track: Direct Application of MLLMs to Visual Object Tracking via Reinforcement Learning [5.8] 単一のオブジェクト追跡は、その後のビデオフレームにおけるターゲットのスケールを連続的にローカライズし、推定することを目的としている。
Qwen2.5-VLはイメージペア間のテンプレートマッチングに苦労している。
グループ相対政策最適化(GRPO)強化学習法を用いてQwen2.5-VLを微調整した。
結果として得られたR1-Trackは、GOT-10kベンチマークで顕著な性能を達成した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:41:15 GMT)
Universal Quantum Computational Spectroscopy on a Quantum Chip [5.8] 我々は、普遍的な量子量子量子分光フレームワークを提示し、実証する。
本手法は閉系と開系の両方のスペクトル情報を効率的に再構成する。
我々は,プログラム可能なシリコン-フォトニック量子処理チップを用いて,このアプローチを実験的に検証した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:44:30 GMT)
Data Quality Issues in Multilingual Speech Datasets: The Need for Sociolinguistic Awareness and Proactive Language Planning [5.7] 一部の言語では、データセットは重要な品質問題に悩まされ、下流の評価結果を難なくする可能性がある。
マクロレベルの問題は、制度化されていない、しばしばリソース不足の言語でより一般的であることが分かりました。
今後のデータセット開発においてこれらの問題を緩和するためのガイドラインと勧告を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:38:01 GMT)
Mixed-state geometric phases of coherent and squeezed spin states [5.7] スピンコヒーレント状態 (CSS) とスピン圧縮状態 (SSS) の2つの混合状態幾何位相 (Uhlmann phase) と干渉幾何学的位相 (IGP) を解析した。
j = 3/2$ CSS の場合、ウルマン位相は突然のジャンプによって特徴づけられる有限温度位相遷移を示す。
同じ状態のGPは温度が変化するにつれて不連続なジャンプを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:33:11 GMT)
Quantum secure direct communication based on fully passive source [5.7] 完全受動的ソースに基づく、受動的にソース化された量子セキュアなダイレクト通信プロトコルを提案する。
量子状態とデコイ状態の強度の両方を受動的に変調することで、ソースでのアクティブな変調操作を避けることができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:21:32 GMT)
Automated detection of atomicity violations in large-scale systems [5.7] 我々は,大規模言語モデル (LLM) エージェントと静的解析を統合し,実世界のプログラムにおける原子性違反を検出するフレームワークであるCloverを提案する。
Cloverは92.3%/86.6%の精度/リコールを達成した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:19:29 GMT)
Discretion in the Loop: Human Expertise in Algorithm-Assisted College Advising [5.6] 介入を指導し、学生の成功に影響を及ぼすアルゴリズムにおいて、アドバイザーがコンテキストを利用できない方法を検討する。
本研究は,非アルゴリズム的文脈を用いて,3つの介入のうち2つの介入が,学生に対して「専門的標的」であったことを推定した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:46:45 GMT)
Fusing Radiomic Features with Deep Representations for Gestational Age Estimation in Fetal Ultrasound Images [5.6] 胎児超音波画像を用いて妊娠年齢(GA)を計測するための新しい特徴融合フレームワークを提案する。
我々のフレームワークは、GAを3つのトリメータで平均8.0日間の絶対誤差で推定し、これらの妊娠期において現在の機械学習手法よりも優れている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:41:48 GMT)
Are Fast Methods Stable in Adversarially Robust Transfer Learning? [5.6] 我々は, 高速勾配符号法(FGSM)を頑健な伝達学習に適用し, 対向微調整の計算コストを向上する。
FGSMは、スクラッチからトレーニングする場合よりも、敵の微調整においてずっと安定している。
この安定性が複数のデータセットにまたがるパフォーマンスにどのように変換されるかを実証する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:53:53 GMT)
Single-shot HDR using conventional image sensor shutter functions and optical randomization [5.5] シングルショットHDRイメージングは、HDRデータを単一の露光に符号化し、それを計算的に復元することで問題を緩和する。
我々は、市販センサのグローバルリセットリリース(GRR)シャッターモードを利用する。
プロトタイプでは,48dBのダイナミックレンジを持つ8ビットセンサを用いて,最大73dBのダイナミックレンジを実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:48:21 GMT)
MisinfoTeleGraph: Network-driven Misinformation Detection for German Telegram Messages [5.5] Misinfo-TeleGraphは、誤情報検出のための最初のドイツ語のTelegramベースのグラフデータセットである。
公開チャネルから500万以上のメッセージが送信され、メタデータ、チャンネルの関係性、弱いラベルと強いラベルが満載されている。
メッセージフォワードをネットワーク構造として組み込んだ,テキストのみのモデルとグラフニューラルネットワーク(GNN)の両方を評価する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:32:19 GMT)
C-Learner: Constrained Learning for Causal Inference [5.4] 本稿では,両世界の最適な重み付けを実現し,安定したプラグイン推定を実現する新しいデバイアス化手法を提案する。
我々の制約学習フレームワークは、プラグイン量に対する一階誤差がゼロであるという制約の下で、最高のプラグイン推定器を解く。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:45:28 GMT)
MatChA: Cross-Algorithm Matching with Feature Augmentation [5.3] 異なるデバイスが異なるスパース特徴抽出アルゴリズムを使用する場合、最先端の手法では視覚的ローカライゼーションの解決に失敗する。
本手法は,クロスフィーチャーシナリオにおける画像マッチングと視覚的位置決めを著しく改善することを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:43:51 GMT)
All Entities are Not Created Equal: Examining the Long Tail for Ultra-Fine Entity Typing [5.2] PLMのパラメトリック知識にのみ依存するエンティティタイピングアプローチは,事前学習分布の長い部分のエンティティと大きく競合することを示す。
この結果から, PLMを超越して, 希少なエンティティによく対応できるソリューションを創出する必要があることが示唆された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:47:42 GMT)
English K_Quantization of LLMs Does Not Disproportionately Diminish Multilingual Performance [5.2] 本稿では,多言語のパフォーマンスを犠牲にして,英語タスクのパフォーマンスが維持されたかどうかを考察する。
有意な結果が得られた全ての実験は、現在の量子化の慣行が多言語のパフォーマンスを不当に損なわないことを示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:34:56 GMT)
Generative AI for O-RAN Slicing: A Semi-Supervised Approach with VAE and Contrastive Learning [5.1] 本稿では,O-RANにおける資源割り当てとネットワークスライシングを最適化する,新しい生成型AI(GAI)による半教師付き学習アーキテクチャを提案する。
本稿では,eMBB と URLLC サービスの質を高めるために,ユーザ機器のスループット(UE)を最大化し,物理リソースブロック(PRB)を割り当てる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:51:47 GMT)
Self-ReS: Self-Reflection in Large Vision-Language Models for Long Video Understanding [5.1] SelfReSは、ユーザのプロンプトに基づいてキービデオフラグメントを動的に選択する、非時間的自己反射サンプリング手法である。
SelfReSは、強力なベースLVLMにシームレスに統合することができ、長時間ビデオタスクの精度を改善し、同じGPUメモリ予算で最大46%高速な推論速度を達成することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:25:29 GMT)
Learning Individual Reproductive Behavior from Aggregate Fertility Rates via Neural Posterior Estimation [5.0] 我々は、生殖過程の個別レベルモデルをSNPE(Sequential Neural Posterior Estimation)と組み合わせた、可能性のないベイズ的枠組みを開発する。
これにより、ASFRと、計画されていない出生と計画されていない出生の年齢という、2つの集合から8つの行動的・生物学的パラメータを推測できる。
適合モデルでは完全な合成生活史が得られているため、行動学的に明らかな人口予測を可能にし、人口統計学的デジタル双生児の構築を支援する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:09:50 GMT)
Improving Token-based Object Detection with Video [5.0] 本稿では、Pix2Seqオブジェクト検出器をビデオ用に拡張することで改善する。
オブジェクトを離散トークンの可変長シーケンスとして表現する。
ビデオオブジェクトは、完全に統合され、分割できない3Dボックスまたはトラックレットとして出力する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:21:58 GMT)
What Makes ChatGPT Effective for Software Issue Resolution? An Empirical Study of Developer-ChatGPT Conversations in GitHub [4.9] GitHubイシュースレッド内で共有されている686人の開発者-ChatGPT会話を分析し、これらの会話を課題解決に効果的にする特徴を特定します。
ChatGPTはコード生成やツール/ライブラリ/APIレコメンデーションに最も効果的ですが、コード説明に苦労しています。
問題レベルでは、ChatGPTは開発者のアクティビティが制限され、より高速な解像度で、より単純な問題に対して最善を尽くします。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:00:48 GMT)
You Can't Trust Your Tag Neither: Privacy Leaks and Potential Legal Violations within the Google Tag Manager [4.7] Googleは、Google Tag Manager'(GTM)と呼ばれる独自のTMSを開発した。
タグを収集するデータのタイプを分析するために,プライバシリークを分離して検出する手法を提案する。
我々は、複数の隠れたデータ漏洩、不完全でバラバラな宣言、未公表のサードパーティやクッキー、個人データの共有、同意なしに発見する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:28:30 GMT)
Artificial Intelligence in Creative Industries: Advances Prior to 2025 [4.7] 人工知能(AI)の急速な進歩は、クリエイティブ産業に大きな影響を与えた。
本稿は,2022年の前回レビュー以降に現れたものに対して,創造的機会を拡大し,効率を向上する方法について考察する。
複数のクリエイティブなタスクに対処し、統合できる統合AIフレームワークへのトレンドを強調します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:52:13 GMT)
Advancing Jailbreak Strategies: A Hybrid Approach to Exploiting LLM Vulnerabilities and Bypassing Modern Defenses [4.7] 2つの主要な推論フェーズの脅威はトークンレベルとプロンプトレベルのジェイルブレイクである。
トークンレベルの手法とプロンプトレベルの手法を統合した2つのハイブリッドアプローチを提案し,多様なPTLMにおけるジェイルブレイクの有効性を向上する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:26:33 GMT)
KunLunBaizeRAG: Reinforcement Learning Driven Inference Performance Leap for Large Language Models [4.6] KunLunBaizeRAGは、複雑なマルチホップ質問応答タスクにおける大規模言語モデル(LLM)の推論能力を高めるために設計された強化学習駆動推論フレームワークである。
主なイノベーションとしては、RAG駆動のReasoning Alignment(RDRA)メカニズム、検索-Think Iterative Enhancement(STIE)メカニズム、Network-Local Intelligent Routing(NLR)メカニズム、プログレッシブハイブリッドトレーニング戦略などがある。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:11:14 GMT)
PrefPaint: Enhancing Image Inpainting through Expert Human Feedback [4.6] 医療画像の塗布は不正確な画像を生成することができ、医療診断や治療に重大な誤りをもたらす。
安定拡散塗装のトレーニングプロセスに人間のフィードバックを取り入れたアプローチであるPrefPaintを提案する。
さらに,Web ベースのインタフェースにより,トレーニング,微調整,推論を効率化する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:47:07 GMT)
Probing the Quantum Capacitance of Rydberg Transitions of Surface Electrons on Liquid Helium via Microwave Frequency Modulation [4.6] 本稿では,液体ヘリウム上の表面電子のリドベルク転移に伴う量子容量を求める方法を提案する。
ライドバーグ転移の共鳴マイクロ波励起は、容量結合された電極上での画像電荷の再分配を誘導する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:16:35 GMT)
Advanced Deep Learning Techniques for Automated Segmentation of Type B Aortic Dissections [4.5] B型大動脈解離切除のための深層学習パイプラインを4本開発した。
Dice Coefficients for TL, 0.88 $pm$ 0.18, 0.47 $pm$ 0.25であった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:38:33 GMT)
Programming Distributed Collective Processes in the eXchange Calculus [4.5] IoT(Internet of Things)は、ほぼあらゆる種類の環境で、高密度でマルチスケールなコンピューティングデバイスのデプロイというビジョンを示唆している。
IoT(Internet of Things)のような最近のトレンドは、ほぼあらゆる種類の環境において、コンピューティングデバイスの密集したマルチスケール展開のビジョンを示唆している。
顕著なエンジニアリング上の課題は、そのような計算生態系の集合的適応的な振る舞いをプログラミングすることである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:38:23 GMT)
CAPM: Fast and Robust Verification on Maxpool-based CNN via Dual Network [4.5] 本研究は、CPM(Convex Adversarial Polytope for Maxpool-based CNN)を用いて、汎用マックスプールベース畳み込みニューラルネットワーク(CNN)の検証境界を改善する。
その結果、この手法により、最大プールベースのCNNに対して最先端の検証精度が得られ、現在の検証方法よりも計算コストがはるかに低いことが示されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:26:12 GMT)
Event Data Association via Robust Model Fitting for Event-based Object Tracking [4.4] 本稿では,イベントアソシエーションと融合問題に明示的に対処する新しいイベントデータアソシエーション(EDA)手法を提案する。
提案するEDAは、統合データアソシエーションと情報融合を行うために、イベントデータに最も適したイベントトラジェクトリを求める。
実験結果から,高速,運動のぼやけ,高ダイナミックレンジ条件といった難易度シナリオ下でのEDAの有効性が示された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:04:28 GMT)
CoATA: Effective Co-Augmentation of Topology and Attribute for Graph Neural Networks [4.3] CoATAは、Topology and AttributeのCo-Augmentationのために特別に設計されたデュアルチャネルGNNフレームワークである。
CoATAは、拡張グラフと原グラフの相互修正を容易にするために、プロトタイプのアライメントと一貫性制約を活用するコントラスト学習を導入している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:11:49 GMT)
Trainability of Parametrised Linear Combinations of Unitaries [4.2] トレーニング可能なパラメトリ回路の総和は依然としてトレーニング可能であることを示す。
我々は、量子デバイス上でこれらのトレーニング可能な回路を評価する際に、量子スピードアップのスコープがあることを論じる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:20:00 GMT)
SAGE: Spliced-Audio Generated Data for Enhancing Foundational Models in Low-Resource Arabic-English Code-Switched Speech Recognition [4.2] 本稿では、方言アラビア語(DA)とアラビア英語(CS)音声における様々な音声SSLモデルの性能について検討する。
データ不足に対処するため,人工CS音声データを生成するための改良型オーディオスプライシング手法を導入した。
すでに微調整されたSSLモデルでは、アラビア語と英語のCSベンチマークでワードエラー率(WER)が7.8%向上する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:42:43 GMT)
Reinforcement Learning with Physics-Informed Symbolic Program Priors for Zero-Shot Wireless Indoor Navigation [4.2] 物理をエンコードする誘導バイアスは、トレーニング中のサンプル効率を改善し、テストの一般化を高めるのに役立つ。
これらの有用な物理インフォームドインダクティブバイアスを組み込む現在のプラクティスは、必然的に、重要な手作業やドメインの専門知識に結びついています。
この研究は、物理学でインフォームドされた誘導バイアスを人間可読で自然に説明可能なRLエージェントに蒸留するシンボリックアプローチを探求する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:26:29 GMT)
Multi-View Contrastive Learning for Robust Domain Adaptation in Medical Time Series Analysis [4.1] 複雑な時間的依存関係と動的分散シフトのため、マシンラーニングモデルを医療時系列に適応することは依然として課題である。
本稿では,多視点コントラスト学習を活用して,時間的パターン,微分的ダイナミクス,周波数領域の特徴を統合する新しいフレームワークを提案する。
本手法では,独立エンコーダと階層的融合機構を用いて,ドメイン間で転送可能な特徴不変表現を学習する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:06:16 GMT)
Fast, robust and laser-free universal entangling gates for trapped-ion quantum computing [4.1] ダブルドレス量子状態は、位相変調された連続駆動場を適用することによって生成される。
ゲートを駆動するフィールドは、クビットを振幅と周波数ノイズから動的に分離し、クビットのコヒーレンス時間を3ドルのオーダーで増加させる。
我々はベル状態の$|Phi+rangle$と$|Psi+rangle$を313ドル以下で生成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:20:50 GMT)
HyReC: Exploring Hybrid-based Retriever for Chinese [4.0] HyReCは、中国語のハイブリッド検索に特化したエンドツーエンド最適化手法である。
項の意味的結合を表現モデルに統合することで、性能を向上させる。
これはGlobal-Local-Aware (GLAE)を特徴とし、レキシコンベースと高密度検索の一貫性のあるセマンティック共有を促進する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:57:01 GMT)
AI Model Passport: Data and System Traceability Framework for Transparent AI in Health [4.0] 本稿では,構造化および標準化されたドキュメントフレームワークであるAI Model Passportの概念を紹介する。
ライフサイクル全体にわたってAIモデルを特定し、検証し、追跡し、監視するために必要なメタデータをキャプチャする。
このフレームワークの実装は、医療画像アプリケーションのためのProCAncer-I EUプロジェクト内で開発されたMLOpsツールであるAIPassportを通じて提示される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:16:15 GMT)
Weakly-Supervised Domain Adaptation with Proportion-Constrained Pseudo-Labeling [3.9] ドメインシフトは、特に医療応用において、機械学習において重要な課題である。
本稿では,対象ドメインのクラス比例情報を活用する弱教師付きドメイン適応手法を提案する。
提案手法は,クラス比に基づいてラベルなしのターゲットデータに擬似ラベルを割り当て,追加アノテーションを必要とせずに性能を向上する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:13:05 GMT)
Unifying Biomedical Vision-Language Expertise: Towards a Generalist Foundation Model via Multi-CLIP Knowledge Distillation [3.9] 我々は,Multiple Medical CLIP Knowledge Distillationによって開発されたバイオメディカル基礎モデルMMKD-CLIPを紹介する。
MMKD-CLIPは、数十億の生データに頼るのではなく、9つの最先端のドメイン固有または一般のCLIPモデルから知識を抽出する。
この2段階のトレーニングパイプラインは、まず26のイメージモダリティから290万以上のバイオメディカルな画像テキストペアをCLIPスタイルで事前トレーニングし、続いて1920万以上の教師モデルから抽出された特徴ペアを使用して特徴レベルの蒸留を行った。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:28:57 GMT)
COOCO -- Common Objects Out-of-Context -- Semantic Violation in Scenes: Investigating Multimodal Context in Referential Communication [3.8] VLM(Vision-Language Models)は、オブジェクトへの参照を生成する際に、同様の方法でシーンコンテキストに依存することを学習していることを示す。
本研究は,物体とシーン間の意味的関連性や騒音のレベルによって,モデルがシーンコンテキストを適応的に活用できることを示唆する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:44:45 GMT)
Robust quantum reservoir computers for forecasting chaotic dynamics: generalized synchronization and stability [3.8] 量子貯水池コンピュータは時系列データからカオス力学を学習・予測するための堅牢なツールであることを示す。
この研究は、短期量子ハードウェア上でのカオス時系列予測のための堅牢な量子マシンを設計する機会を開く。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:42:20 GMT)
Artificial Intelligent Disobedience: Rethinking the Agency of Our Artificial Teammates [3.8] 本稿では、AIチームメイトの代理店を知的不服従を含むよう拡張することを主張する。
AIエージェンシーのスケールを導入し、AI自律性を独立した研究対象として扱うことの重要性を強調する代表的な例を使用する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:45:27 GMT)
Mitigating Metropolitan Carbon Emissions with Dynamic Eco-driving at Scale [3.5] 我々は、二酸化炭素排出量を減らす新たな機会として、半自律車の採用の増加を考えています。
交通シナリオと車両排出の複雑さにより、包括的影響分析は手に入らなかった。
我々は,米国三大都市を横断する信号化交差点6,011箇所で,ダイナミックエコドライブの詳細な影響評価を行う。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:16:41 GMT)
Assessing the feasibility of Large Language Models for detecting micro-behaviors in team interactions during space missions [3.5] 本研究では,宇宙飛行中に収集したテキストを用いて,チーム会話における微小行動の微妙な表現を検出するための大規模言語モデル(LLM)の実現可能性について検討する。
具体的には、エンコーダのみのシーケンス分類LLMとデコーダのみの因果言語モデリングLLMを用いた少数ショットテキスト生成を用いて、ゼロショット分類、微調整、パラフレーズ拡張細調整について検討する。
以上の結果から,RoBERTa や DistilBERT などのエンコーダのみの LLM は,微調整を重み付けしても,低表現のマイクロ行動,特に抑止音声の検出に苦慮していたことが示唆された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:06:24 GMT)
Making Non-Markovian master equations accessible with approximate environments [3.5] 本研究では, 主方程式における減衰正弦波の和として, 環境相関関数を表現できることを実証する。
この分解は、ラムシフト計算と崩壊率計算のコストを著しく削減する、かなりの利益をもたらす。
これらのラムシフト効果は、熱輸送のシナリオでは明らかに無視できない。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:54:38 GMT)
A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags [3.4] 本稿では,オーストリアの大手新聞DerStandardのオンラインプラットフォーム上でのユーザ活動の大規模・縦断的データセットについて紹介する。
データセットは10年(2013-2022年)で、7500万以上のユーザコメント、4億以上の投票、記事やユーザインタラクションに関する詳細なメタデータが含まれている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:40:20 GMT)
Advancing Facial Stylization through Semantic Preservation Constraint and Pseudo-Paired Supervision [3.4] これらの問題は、スタイリゼーション中にジェネレータのセマンティックシフトを無視することに起因すると我々は主張する。
意味的保存制約と擬似ペア付き監視を統合した顔のスタイリング手法を提案する。
顔のスタイリゼーションを基盤として,より柔軟なマルチモーダルおよび参照誘導型スタイリゼーションを実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:44:31 GMT)
BézierGS: Dynamic Urban Scene Reconstruction with Bézier Curve Gaussian Splatting [3.4] B'ezier curve splatting (B'ezierGS) は、学習可能な B'ezier curve を用いて動的対象の運動軌跡を表す。
B'ezierGSは動的および静的なシーンコンポーネントの再構築と新しいビュー合成において、最先端の代替よりも優れている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:30:16 GMT)
Dealing with the Evil Twins: Improving Random Augmentation by Addressing Catastrophic Forgetting of Diverse Augmentations [3.3] ランダムな拡張の性質は、学習した特徴を歪ませるコライディング拡張のセットを生み出すことができることを示す。
そこで本研究では,ランダム拡張の一般化効果を改善するための簡単な解を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:43:24 GMT)
Towards Adaptive Memory-Based Optimization for Enhanced Retrieval-Augmented Generation [3.3] Retrieval-Augmented Generation (RAG)は、外部知識ベースからの非パラメトリック知識をモデルに統合する。
既存のRAGメソッドは、オープンドメイン質問回答(QA)タスクに苦労する。
オープンドメインQAタスクのための拡張RAGのための適応メモリベースの最適化を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:17:10 GMT)
Thompson Sampling-Based Learning and Control for Unknown Dynamic Systems [3.3] 本研究では,再現カーネルヒルベルト空間を用いた法学学習のパラメータ化手法を提案する。
具体的には,制御法則を関数空間の要素として扱い,制御法則をシステム構造や制御器の形態に制約を加えることなく設計することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:49:43 GMT)
A Practical Approach to Power Saving in Hearables Using Sub-Nyquist Sampling with Bandwidth Extension [3.2] 骨伝導マイクロホン(BCM)は、騒音条件下でのマルチモーダル音声強調(SE)の支持モードとして、可聴器内の空気伝導マイクロホン(ACM)と共に使用される。
SubARUはADCのサブニキストサンプリングと低ビット解像度を使用し、消費電力を3.31倍削減する。
SubARUは1.74msの推論時間と13.77MB未満のメモリフットプリントで、モバイルプラットフォームとSE上でのストリーミング操作を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:35:04 GMT)
Closing the Performance Gap in Biometric Cryptosystems: A Deeper Analysis on Unlinkable Fuzzy Vaults [3.1] 可変特徴量の大きさと類似度閾値に対する影響によって生じる不安定な誤り訂正能力を同定する。
等間隔の反復に基づく特徴量化手法を提案する。
提案手法はテンプレート保護によって生じる性能ギャップを著しく低減する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:57:58 GMT)
Visual Structures Helps Visual Reasoning: Addressing the Binding Problem in VLMs [3.1] 本稿では,低レベル空間構造による視覚入力の増大という,シンプルながら効果的な介入を提案する。
私たちは、コアの視覚的推論タスクに対して、実質的なパフォーマンス改善を実証的に示します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:44:40 GMT)
Fetal Sleep: A Cross-Species Review of Physiology, Measurement, and Classification [3.1] このレビューは、生理的特徴、発症、胎児睡眠の調節に関する80年以上の研究を合成する。
ヒトと大型動物モデルにおける睡眠状態パターンを比較し、種別差と睡眠状態類似体の存在を強調した。
低酸素症や胎児成長制限といった子宮内状態が胎児の睡眠を妨げているかについて議論する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:15:57 GMT)
Quantum-Classical Auxiliary Field Quantum Monte Carlo with Matchgate Shadows on Trapped Ion Quantum Computers [3.1] 量子古典的補助場量子モンテカルロ(QC-AFQMC)アルゴリズムを用いて化学反応障壁をモデル化するためのエンドツーエンドワークフローを実証する。
アルゴリズムの革新とGPUアクセラレーションを効率よく実現し,数桁の高速化を実現している。
この研究は、量子デバイス上での実用的な量子化学シミュレーションへの一歩である。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:33:52 GMT)
Enhancing Object Detection Robustness: Detecting and Restoring Confidence in the Presence of Adversarial Patch Attacks [3.0] 敵パッチに対するYOLOv5モデルの防御機構について検討した。
我々はSegment and Complete (SAC)、Inpainting、Latent Diffusion Modelsを含むいくつかの防衛実験を行った。
その結果, 対向パッチは平均検出信頼度を22.06%低下させることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:45:14 GMT)
Towards Reproducible LLM Evaluation: Quantifying Uncertainty in LLM Benchmark Scores [2.9] 我々は、大きな言語モデルの能力をテストするために設計されたベンチマークを使用して、基準方向を推論する。
本稿では,ベンチマークスコアの不確かさを定量的に定量化するための簡易な手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:33:10 GMT)
Spectraformer: A Unified Random Feature Framework for Transformer [2.8] 本稿では,Transformerのアテンション機構におけるカーネル関数の近似と学習のための統合フレームワークであるSpectraformerを紹介する。
我々の経験的結果は、ランダムな特徴に基づくアプローチが、最高性能のスパース法と低ランク法に匹敵する性能を達成することを初めて証明した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:39:14 GMT)
QuKAN: A Quantum Circuit Born Machine approach to Quantum Kolmogorov Arnold Networks [2.8] Kolmogorov Arnold Networks (KAN) は、より少ない神経細胞で複雑な機能を表現できる有望な能力を示した。
量子回路ボルニングマシン(QCBM)を用いたハイブリッドおよび完全量子形式におけるこれらのkanアーキテクチャの実装について述べる。
提案するQuantum Kan(QuKAN)アーキテクチャの実現可能性,解釈可能性,性能について述べる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:51:19 GMT)
LRP4RAG: Detecting Hallucinations in Retrieval-Augmented Generation via Layer-wise Relevance Propagation [2.7] 本稿では,大規模言語モデル(LLM)における幻覚検出手法であるLPP4RAGを提案する。
我々の知る限り、RAG幻覚の検出にLPPを用いたのは今回が初めてです。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:14:36 GMT)
Control Synthesis in Partially Observable Environments for Complex Perception-Related Objectives [2.7] 本研究は、部分的に観測可能なマルコフ決定プロセスによってモデル化された環境における知覚関連目的のための最適なポリシーを合成する問題について研究する。
提案手法は,mboxsc-iLTL の目的を mboxsc-iLTL の目的を,信念 MDP の積と sc-iLTL の目的から構築した決定論的有限オートマトンを構築することにより,到達可能性の目標に変換することである。
製品によるスケーラビリティの課題を克服するため,モンテカルロ木探索法(MCTS)を導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:02:07 GMT)
Stability of Primal-Dual Gradient Flow Dynamics for Multi-Block Convex Optimization Problems [2.7] 提案された力学はラグランジアン近似に基づくもので、ADMMの代替となる。
我々は、様々な構造的特性を利用して、提案された力学に対する大域的(指数的)収束保証を確立する。
我々の仮定は原始双対力学の(指数的な)安定性を証明するために必要なものよりもはるかに弱い。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:25:57 GMT)
When Servers Meet Species: A Fab-to-Grave Lens on Computing's Biodiversity Impact [2.7] 本稿では,コンピュータシステムによる生物多様性への影響のエンド・ツー・エンド分析について述べる。
生物多様性指数(EBI)とOBI(Operational Biodiversity Index)の2つの新しい指標を導入し,生物多様性への影響をライフサイクル全体で定量化する。
本稿では,計算負荷と生物多様性の影響を結びつけるモデリングフレームワークであるFABRICを紹介する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:24:18 GMT)
OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis [2.6] OpenTCMはドメイン固有の知識グラフであり、グラフベースの検索・拡張生成システムである。
我々は,中国医学古典データベースの68冊の婦人科本から,330万以上の漢文字を抽出した。
OpenTCMは、材料情報検索における4.378、診断質問応答タスクにおける4.045の平均エキスパートスコア(MES)を達成している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:01:12 GMT)
Reconstructing Intelligible Speech from the Pressure Sensor Data in HVACs [2.6] 本稿では,低分解能・雑音圧センサデータから可聴音声を再構成するWaLiについて述べる。
WaLiは複雑な値のコンバータと複雑なグローバルアテンションブロック(CGAB)を使用して、音素間および音素内依存関係をキャプチャする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:20:25 GMT)
Refining Czech GEC: Insights from a Multi-Experiment Approach [2.5] 本稿では,チェコ語による文法誤り訂正(GEC)システムについて述べる。
本システムは,Transformerアーキテクチャを用いたニューラルネットワーク翻訳手法に基づいている。
主な機能はリアルタイム合成生成パイプラインで、文を動的に人工エラーで強化する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:21:40 GMT)
AlphaBeta is not as good as you think: a new probabilistic model to better analyze deterministic game-solving algorithms [2.4] 固定レベル条件分布を用いてゲームツリーを漸進的に構築する新しい確率モデルを提案する。
我々のフレームワークは、古典的なゲーム解決アルゴリズムに新たな光を当て、厳密な証拠と分析ツールを提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:07:17 GMT)
Transformers are Graph Neural Networks [2.4] トークンの完全連結グラフで動作するメッセージパッシングGNNとして、Transformerをどのように見ることができるかを示す。
変換器は、アプリオリグラフに制約されることなく入力要素間の関係を学習する表現的集合処理ネットワークである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:15:33 GMT)
Space-Time Graphs of Convex Sets for Multi-Robot Motion Planning [2.3] MRMP(Multi-Robot Motion Planning)は、連続環境における複数ロボットの衝突のない軌道の計算問題である。
本研究では,無衝突時空間領域をランダムサンプリングに頼るのではなく,無衝突時空間領域で体系的にカバーする新しいプランナである,凸集合の空間時間グラフ(ST-GCS)を提案する。
また,コンベックス分解(ECD)を時間的障害としてトラジェクトリを「保存」するために提案し,その後の計画のための衝突のない時空間グラフセットの維持に対処する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:53:38 GMT)
Fine-Tuning MIDI-to-Audio Alignment using a Neural Network on Piano Roll and CQT Representations [2.3] 本稿では,人間のピアノ演奏の音声録音と,それに対応するゆるやかなMIDIファイルとを同期させるニューラルネットワーク手法を提案する。
提案手法は,業界標準の動的時間ワープ法(DTW)よりも最大20%高いアライメント精度を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:59:50 GMT)
Analyzing and Fine-Tuning Whisper Models for Multilingual Pilot Speech Transcription in the Cockpit [2.3] 本稿では,Whisperモデルを用いたコックピット会話の転写精度を検証し,改善する。
書き起こしを洗練し、単語誤り率(WER)を改善するために、複数の正規化方式を提案する。
次に、低ランク適応(LoRA)を用いた性能効率の微調整を利用して、ASR性能を向上させるために微調整を用いる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:57:13 GMT)
Computational Efficient and Minimax Optimal Nonignorable Matrix Completion [2.2] 一般化された非無視的欠落機構に対して,核ノルム正規化行および列ワイズ行列U統計損失関数を提案する。
提案手法は,既存手法に匹敵する計算効率を実現する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:17:58 GMT)
DAPFAM: A Domain-Aware Patent Retrieval Dataset Aggregated at the Family Level [2.1] DAPFAMは、シンプルなファミリーレベルで構築された新しいオープンアクセスドメイン対応特許検索データセットである。
データセットには1,247のドメインバランスの取れたフルテキストクエリーファミリーと45,336のフルテキストターゲットファミリーが含まれている。
データセットは複数の管轄権を持ち、検索評価のための事前処理はほとんど必要とせず、限られたリソースを持つエンティティに対して管理可能なサイズのままである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:34:51 GMT)
LinguaSynth: Heterogeneous Linguistic Signals for News Classification [2.1] 本稿では,5つの相補的言語特徴型を統合した新しいテキスト分類フレームワークを提案する。
解釈可能性と計算効率を維持し、20ニューズグループデータセットで84.89パーセントの精度を達成している。
統語的信号と実体的信号が本質的な曖昧さをもたらし,分散意味論を効果的に補完することを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:45:20 GMT)
Fairness-Optimized Synthetic EHR Generation for Arbitrary Downstream Predictive Tasks [2.1] 本稿では,実EHRデータと整合した合成EHRデータを生成するパイプラインを提案する。
下流タスクと2つの異なるEHRデータセットにまたがるパイプラインの有効性を実証する。
提案したパイプラインは、ヘルスAIアプリケーションの公正性に対処する既存のツールボックスに、広く適用可能な補完ツールを追加することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:11:59 GMT)
Adversarial Threats in Quantum Machine Learning: A Survey of Attacks and Defenses [2.1] 量子機械学習(QML)は、量子コンピューティングと古典的な機械学習を統合して、分類、回帰、生成タスクを解決する。
本章では、クラウドベースのデプロイメント、ハイブリッドアーキテクチャ、量子生成モデルにおける脆弱性に焦点を当て、QMLシステム特有の敵の脅威について検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:19:49 GMT)
The Missing Link: Joint Legal Citation Prediction using Heterogeneous Graph Enrichment [2.1] 本稿では,グラフニューラルネットワーク(GNN)リンク予測モデルを提案する。
元の引用グラフの拡張および拡張されたバージョンで動作する適応型リレーショナルグラフ畳み込みを導入する。
ケースとノルムの共学学習と予測は、ケースの引用予測を最大4.7ポイント改善する大きな相乗効果をほぼ2倍の効率で達成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:21:41 GMT)
Towards Scalable and Robust White Matter Lesion Localization via Multimodal Deep Learning [2.1] ホワイトマター・ハイパーインテンシティ(White matter hyperintensities, WMH)は、小血管疾患や神経変性の放射線マーカーであり、正確なセグメンテーションと局所化が診断とモニタリングに不可欠である。
単一モードのMRI入力とマルチモードのMRI入力を用いて,WM病変分割と局所化の深層学習フレームワークを提案する。
本研究は, 高精度かつ堅牢なWMH解析のためのマルチモーダルフュージョンの有用性と, 統合予測のためのジョイントモデリングの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:39:26 GMT)
Using Large Language Models to Suggest Informative Prior Distributions in Bayesian Statistics [2.1] 我々は,大規模言語モデル (LLM) を用いて,適切な知識に基づく情報提供先を提案する。
心疾患リスクとコンクリート強度の2つの実際のデータセットを用いてClaude Opus,Gemini 2.5 Pro,ChatGPT-4o-miniを評価した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:11:55 GMT)
RetFiner: A Vision-Language Refinement Scheme for Retinal Foundation Models [2.1] 既存のFMの表現を改善するSSLビジョン言語改良スキームであるRetFinerを提案する。
本手法は,テキストデータから得られるリッチな監視信号を利用する,多様な学習目標を用いている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:53:54 GMT)
Towards Modeling Human-Agentic Collaborative Workflows: A BPMN Extension [2.0] 大規模言語モデル(LLM)は、自律的なインテリジェントエージェントの定義を促進する。
これらのエージェントのオーケストレーションと調整は、いまだに難しい。
現在のビジネスプロセスモデリング言語は、これらの新しい混合コラボレーティブなシナリオを規定することに関して不足しています。
私たちは、この新しいタイプのワークフローの定義を可能にするために、よく知られたプロセスモデリング言語(BPMN)を拡張します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:11:00 GMT)
Boosting Classification with Quantum-Inspired Augmentations [2.0] 量子ゲートの摂動は量子デジタルデバイスでは一般的であるが、古典コンピュータでは欠落している。
これらの摂動は、データ拡張の自然な源として機能することで、パフォーマンスを向上させることができる。
本稿では, ランダムブロッホ球の回転を, 単純かつ効果的な量子インスパイアされたデータ増大手法として検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:08:43 GMT)
CLoVE: Personalized Federated Learning through Clustering of Loss Vector Embeddings [2.0] クラスタ化フェデレーション学習(CFL)のための新しいアルゴリズムであるCLoVEを提案する。
CLoVEは、クライアントデータに対するモデル損失に由来するクライアントの埋め込みを利用し、同じクラスタ内のクライアントが同様の損失値を共有するという洞察を活用する。
CLoVEは、異なるクラスタからクライアントを反復的に識別し、分離し、クラスタ固有のモデルを最適化することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:52:16 GMT)
On CNF formulas irredundant with respect to unit clause propagation [2.0] 2つのCNF式はucp-等価(ucp-equivalent)と呼ばれ、単位節の伝搬(UCP)に関して同じように振る舞う。
公式がucp-irredundant(英語版)と呼ばれるのは、任意の節を削除すると、元の句と等価でない公式が導かれるからである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:29:57 GMT)
Causal Inference Isn't Special: Why It's Just Another Prediction Problem [1.9] 因果推論は予測モデリングとは異なるものとして描かれることが多い。
しかし、中核では、因果推論は単に分布シフトの下での予測の構造化例である。
この観点は因果推定をよく知られた一般化問題として再定義する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:38:26 GMT)
Transfer Learning for Assessing Heavy Metal Pollution in Seaports Sediments [1.9] 本稿では,重金属評価プロセスの簡易化を目的としたディープラーニングモデルを提案する。
本モデルでは,水処理領域におけるデータ不足の問題に対処する。
オーストラリアのニューサウスウェールズ州にある6つの主要港のデータを用いて,本モデルの評価を行った。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:26:42 GMT)
Language in Vivo vs. in Silico: Size Matters but Larger Language Models Still Do Not Comprehend Language on a Par with Humans Due to Impenetrable Semantic Reference [1.8] 本研究では,人間とモデルの違いがモデルサイズに寄与するかどうかを判断する上で,モデルスケーリングが果たす役割について検討する。
アナフォラ, 中心埋め込み, 比較, 負極性を含む文法判断タスクにおいて, 3つの大言語モデル(LLM)を検証した。
結果,ChatGPT-4の精度は,ChatGPT-4の精度が76%に対して80%であったのに対し,ChatGPT-4の精度は1つのタスク条件,すなわち文法文でのみ優れていた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:50:30 GMT)
LIGHT: Multi-Modal Text Linking on Historical Maps [1.8] 光は、歴史的地図上のテキストをリンクするための言語的、画像的、幾何学的特徴を統合する、新しいマルチモーダルアプローチである。
ICDAR 2024/2025 MapTextコンペティションのデータでは、既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:18:00 GMT)
A Systematic Review of Human-AI Co-Creativity [1.8] Coクリエイティビティコミュニティは、人間のクリエイティビティをサポートし、強化するための、より洗練され、調整されたシステムの開発において、大きな進歩を遂げている。
共同創造システムに関する62論文の体系的な文献レビューを行った。
以上の結果から,高いユーザコントロールを提供するシステムは,創造的成果よりも満足感,信頼感,所有意識が強くなる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:31:02 GMT)
Performance of Rank-One Tensor Approximation on Incomplete Data [1.8] 本研究は, スペクトル解析により再構成性能にアクセス可能なランダム行列モデルに還元可能であることを示す。
これらの結果は、そのエントリのランダム部分の削除によるテンソルのメモリコストの人工的削減によって引き起こされるパフォーマンスの損失に光を当て、特定する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:10:54 GMT)
Concept-Level AI for Telecom: Moving Beyond Large Language Models [1.8] 大規模言語モデル(LLM)は、特定の通信問題に効果的に適用できる。
しかし、固有のトークン・バイ・トークン処理と拡張コンテキストを維持する能力の制限により、LLMはテレコム固有の要件を満たすのに苦労している。
本稿は、LCMの採用は単なる段階的なステップではなく、堅牢で効果的なAI駆動型通信管理の実現に向けた進化的な飛躍である、と論じる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:20:18 GMT)
Diversity by Design: Addressing Mode Collapse Improves scRNA-seq Perturbation Modeling on Well-Calibrated Metrics [1.8] 最近のベンチマークでは、単一セルの摂動応答のモデルは、データセットの平均を単に予測することで、しばしば性能が向上することが示された。
制御参照デルタと非重み付きエラーメトリクスの報酬モードは、制御がバイアスを受けたり、生物学的信号がスパースであったりすると、崩壊する。
高感度のニッチ信号における誤差を計測する全ての摂動に対して、差分式遺伝子(DEG)対応メトリクス、重み付き平均二乗誤差(WMSE)および重み付きデルタ$R2$(R2_w(Delta)$)を導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:12:46 GMT)
Don't Trust Generative Agents to Mimic Communication on Social Networks Unless You Benchmarked their Empirical Realism [1.7] 我々は,大規模言語モデルを用いて,ソーシャルネットワーク利用者の行動の再現に重点を置いている。
我々は、英語とドイツ語でユーザ動作を模倣する様々なアプローチを経験的にテストした。
本研究は, シミュレーション部品が装着された環境で測定された経験的現実性によって, 社会シミュレーションを検証すべきであることを示唆している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:32:16 GMT)
Physics-informed network paradigm with data generation and background noise removal for diverse distributed acoustic sensing applications [1.6] 既存のAIモデルは、トレーニングのためにラベル付けされているかどうかに関わらず、現実世界のデータ(RWD)を必要とする。
ここでは、実世界のイベントデータを必要としない物理インフォームドDASニューラルネットワークパラダイムを提案する。
提案手法の有効性は,DASデータの公開データセットに基づく事象識別アプリケーションと,DAS時間周波数データに基づくベルトコンベア故障監視アプリケーションで検証される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:46:58 GMT)
The SWE-Bench Illusion: When State-of-the-Art LLMs Remember Instead of Reason [1.6] 本稿では,問題記述のみからのファイルパス識別と,現在のファイルコンテキストと問題記述のみによる基底真理関数の再現という,2つの診断タスクを紹介する。
現状のモデルでは,リポジトリ構造にアクセスすることなく,問題記述のみを用いて,バグのあるファイルパスを識別する精度を最大76%向上することを示す。
このパフォーマンスは、SWE-Benchに含まれていないリポジトリのタスクで最大53%向上し、データ汚染やメモリ化の可能性を示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:41:49 GMT)
A Deep Learning framework for building damage assessment using VHR SAR and geospatial data: demonstration on the 2023 Turkiye Earthquake [1.6] 災害直後の被害の特定は緊急対応・復旧の指導に不可欠である。
超高分解能(VHR)合成開口レーダ(SAR)画像を用いた建物損傷検出のための新しい多モードディープラーニング(DL)フレームワークを提案する。
SAR画像パッチ、OpenStreetMap(OSM)構築フットプリント、デジタル表面モデル(DSM)データ、グローバル地震モデル(GEM)の構造と露出特性を統合する。
その結果,地理空間的特徴を取り入れることで,これまで見られなかった領域に対する検出性能と一般化性が著しく向上することがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:49:58 GMT)
A User-Centric, Privacy-Preserving, and Verifiable Ecosystem for Personal Data Management and Utilization [1.6] 本稿では,異種個人情報を扱う分散型プライバシ保護アーキテクチャを提案する。
従来のモデルとは異なり、当社のシステムはユーザのデータ所有とコントロールを完全化し、プライバシを損なうことなく情報を選択的に共有できるようにします。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:05:46 GMT)
Maximal intrinsic randomness of noisy quantum measurements [1.5] 量子的測定をすれば、そこからどれだけのランダム性を生成することができるのか?
この研究では、以下の疑問を考察する: 量子測度が与えられた場合、そこからどれだけのランダム性が生成されるか?
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:05:15 GMT)
DistShap: Scalable GNN Explanations with Distributed Shapley Values [1.4] DistShapは、Shapley値に基づく説明を複数のGPUに分散する並列アルゴリズムである。
既存のほとんどのGNN説明手法を精度で上回り、何百万もの機能を持つGNNモデルに拡張した最初のものである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:30:49 GMT)
Demonstration of measurement-free universal fault-tolerant quantum computation [1.4] トラップイオン量子プロセッサ上での中間回路計測を行わずに、フォールトトレラントな論理演算の普遍的なツールボックスを提案し、実験的に実証する。
我々は,3つの論理量子ビットをホストする8ビット誤り検出符号に,コヒーレントゲート操作のみで実行可能なフォールトトレラントユニバーサルゲートを実現する。
我々の研究は、実際の実現可能性を示し、測定不要な量子計算のほとんど探索されていない方向への第一歩を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:51:44 GMT)
Conversational LLMs Simplify Secure Clinical Data Access, Understanding, and Analysis [1.4] メディカル・インフォメーション・マート・フォー・インシデント・ケア(MIMIC-IV)は、世界最大のオープンソースEHRデータベースである。
M3は、研究者が普通の英語でデータベースと会話することを可能にする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:24:17 GMT)
Heuristics for AI-driven Graphical Asset Generation Tools in Game Design and Development Pipelines: A User-Centred Approach [1.4] グラフィカルアセットの作成を支援するために、AI駆動の生成ツールを使用する可能性がある。
生成的手法がより広いパイプラインにどのように適合するかに対処する研究はほとんどない。
我々は16人のゲームデザイナと開発者とともにユーザスタディを行い、グラフィカルアセットのための生成ツールの動作と相互作用について検討した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:11:20 GMT)
FedCLAM: Client Adaptive Momentum with Foreground Intensity Matching for Federated Medical Image Segmentation [1.4] フェデレートラーニング(Federated Learning)は、データをステークホルダーのコントロール下に置くための分散トレーニングアプローチであり、独立したトレーニングよりも優れたパフォーマンスを達成する。
本稿では,各クライアントの局所学習における損失削減から導かれるテキスト従順適応モーメント項を統合したFedCLAMを提案する。
また,不均質な画像強度プロファイルを扱うために,予測値と地上構造分布とを一致させる新たなテクスティインテンシティアライメント・アライメント・ロスを導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:52:41 GMT)
Eye of Judgement: Dissecting the Evaluation of Russian-speaking LLMs with POLLUX [1.3] POLLUXは、ロシア語で大規模言語モデル(LLM)の生成能力を評価するために設計されたベンチマークである。
各タスクタイプについて、一連の詳細な基準を定義し、スコアリングプロトコルを開発する。
これにより、従来のリソース消費による人的比較を超えて、透過的で基準駆動的な評価が可能になる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:43:03 GMT)
Adapting University Policies for Generative AI: Opportunities, Challenges, and Policy Solutions in Higher Education [1.3] 生成的人工知能(AI)ツールの急速な普及は、高等教育における変革の時代を後押ししている。
この記事では、生成AIがもたらす機会を批判的に検討し、それらがもたらす多面的課題を探求し、堅牢なポリシーソリューションの概要を述べる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:49:02 GMT)
FEAT: A Preference Feedback Dataset through a Cost-Effective Auto-Generation and Labeling Framework for English AI Tutoring [1.3] 英語教育の授業では、教師のフィードバックは生徒の指導に不可欠である。
近年,教師を支援するため,AIによる授業支援システムが登場している。
教員のフィードバックを生成するための費用対効果の高いフレームワークであるFEATを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:38:08 GMT)
Translating Bell Non-Locality to Prepare-and-Measure Scenarios under Dimensional Constraints [1.2] 本稿では,2部構成ベルの不等式を次元有界な準備・測定タスクに変換する体系的手法を提案する。
我々は、翻訳が量子境界と自己検定特性を保存する十分な条件を同定する。
本研究は,異なる量子相関フレームワークを統一し,並列プロトコルとシーケンシャルプロトコルの相互作用を研究する研究に寄与する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:53:19 GMT)
EXPRTS: Exploring and Probing the Robustness of Time Series Forecasting Models [1.2] 我々は時系列を生成するための解釈可能でシンプルなフレームワークを開発する。
本手法は時系列分解と解析関数を組み合わせることで,分布内データと分布外データの両方に一致する特性を持つ時系列を生成することができる。
私たちは、モデルロバスト性を改善するために、我々のフレームワークが意味のあるOOD時系列を生成する方法を示します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:55:29 GMT)
deCIFer: Crystal Structure Prediction from Powder Diffraction Data using Autoregressive Language Models [1.2] 粉末回折データから結晶構造予測(CSP)を行う自己回帰言語モデルを提案する。
提示されたモデルであるdeCIFerは、広く使われているCrystallographic Information File (CIF)フォーマットで結晶構造を生成する。
ほぼ2.3Mの結晶構造でdeCIFerを訓練し、難易度の高い無機結晶系を特徴付けるために多種多様なPXRDパターンの検証を行う。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:53:05 GMT)
Exploration Behavior of Untrained Policies [1.2] 深層神経政策のアーキテクチャが、トレーニング前に探索を暗黙的に形成する方法について研究する。
無限幅ネットワークの理論と連続時間制限を用いて、訓練されていないポリシーは相関作用を返却し、非自明な状態ビジュアライゼーション分布をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:28:41 GMT)
Towards Universal & Efficient Model Compression via Exponential Torque Pruning [1.2] 本稿では,正規化に指数的力の適用方式を採用するETP(Exponential Torque Pruning)を提案する。
ETPは、従来の最先端のプルーニング戦略よりも、無視できる精度の低下で大幅に高い圧縮率を達成することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:28:21 GMT)
Fair Data Exchange at Near-Plaintext Efficiency [1.2] ほぼ平文に近い速度とサイズを実現するFDE実装を導入し,ギガバイト規模のファイルであっても公平な交換を実現する。
これにより、トランザクション手数料を約10ドルから0.01ドル以下に削減し、トランザクションのレイテンシを数十秒から1秒以下に短縮することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:35:40 GMT)
Preemptive Hallucination Reduction: An Input-Level Approach for Multimodal Language Model [1.1] 本研究では,最も適切なフィルタリング手法を適応的に選択する,アンサンブルに基づく新しい前処理フレームワークを提案する。
この手法は、自然言語推論(NLI)スコアによって測定された幻覚率を44.3%削減する。
この結果は、幻覚を緩和し、より信頼性の高いマルチモーダルシステムを実現するための適応的前処理技術の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:20:04 GMT)
Exploring Modularity of Agentic Systems for Drug Discovery [1.1] 大規模言語モデル(LLM)とエージェントシステムは、創薬と設計を加速するエキサイティングな機会を提供する。
本稿では,多言語モデル(LLM)の性能とツールコールエージェントの有効性を比較した。
本研究は,現実問題に対する安定かつスケーラブルなソリューションの開発を可能にするために,エージェントシステムのモジュール性に関するさらなる研究の必要性を強調した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:57:00 GMT)
GameTileNet: A Semantic Dataset for Low-Resolution Game Art in Procedural Content Generation [1.1] GameTileNetは、低解像度デジタルゲームアートのセマンティックラベルを提供するために設計されたデータセットである。
このデータセットは、低解像度タイルベースのゲームアートにおいて、オブジェクト検出のためのパイプラインを導入する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:50:32 GMT)
Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search [1.1] 適応分岐モンテカルロ木探索(AB-MCTS)を提案する。
AB-MCTSは、原則化されたマルチターン探索とエクスプロイトによる繰り返しサンプリングを一般化する。
我々はフロンティアモデルを用いて複雑なコーディングとエンジニアリングのタスクについて評価する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:18:30 GMT)
Interact2Vec -- An efficient neural network-based model for simultaneously learning users and items embeddings in recommender systems [1.1] 本稿では,ユーザとアイテムの分散埋め込みを同時に学習するニューラルネットワークモデルを提案する。
このモデルは、自然言語処理モデルがトレーニングフェーズを最適化し、最終的な埋め込みを強化するために一般的に使用する最先端の戦略を採用している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:30:03 GMT)
Few-Shot Segmentation of Historical Maps via Linear Probing of Vision Foundation Models [1.0] 本稿では,歴史的地図の断片化をシンプルかつ効果的に行う手法を提案する。
大規模視覚基盤モデルのリッチなセマンティック埋め込みとパラメータ効率の微調整を併用する。
本手法は,手動アノテーションの必要性を大幅に低減しつつ,多様な歴史地図の正確なセグメンテーションを可能にする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:07:21 GMT)
Domain-Driven Design in Software Development: A Systematic Literature Review on Implementation, Challenges, and Effectiveness [1.0] ドメイン駆動設計(DDD)はソフトウェア開発において大きな注目を集めています。
この研究は、ソフトウェア開発におけるDDDに関する既存の研究を分析します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:02:42 GMT)
Experimental quantum reservoir computing with a circuit quantum electrodynamics system [1.0] 量子貯水池コンピューティングは、他の量子ニューラルネットワークモデルと比較してトレーニングの容易さを提供する機械学習フレームワークである。
本稿では,回路量子電気力学アーキテクチャに基づく新しい量子貯水池計算プラットフォームを提案し,実験的に実装する。
我々の研究は、ハードウェア効率のよい量子ニューラルネットワークの実装を示し、他の量子機械学習モデルにさらにスケールアップして一般化することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:31:36 GMT)
Doubly robust inference via calibration [1.0] 二重ロバストな手順におけるニュアンス推定器の校正は、線形汎函数に対して二重ロバストな正規性をもたらすことを示す。
我々の理論的解析は、DML推定器が、関数の回帰あるいはリース表現器が十分に適切に推定されている場合、キャリブレート正規のままであることを示している。
アイソトニック回帰によるクロスフィット推定をキャリブレーションするために,数行のコードを追加することで,既存のDMLパイプラインに統合することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:36:47 GMT)
Local Markov Equivalence and Local Causal Discovery for Identifying Controlled Direct Effects [0.9] 制御された直接効果(CDE)を同定するための新しいアルゴリズムを提案する。
我々のアルゴリズムは条件付き独立テストを少なくし、理論的な保証を維持しながらより弱い仮定の下で運用する。
シミュレーション研究を通して,本手法の有効性について述べる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:13:05 GMT)
Bootstrapping Human-Like Planning via LLMs [0.9] 2つの共通エンドユーザープログラミングパラダイムには、ドラッグ・アンド・ドロップインタフェースと自然言語プログラミングがある。
我々は,自然言語を入力として受け入れる大規模言語モデル (LLM) ベースのパイプラインを構築し,人間の動作シーケンスを出力として生成する。
以上の結果から,人間の行動系列の生成において,より大型のモデルの方が,より小型のモデルよりも優れていることが示されたが,それにもかかわらず,より小型のモデルでは良好な性能が得られている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:00:51 GMT)
Improved entanglement entropy estimates from filtered bitstring probabilities [0.8] ニューマン量子絡み合いエントロピー$SvN_A$。
多くの場合、これらの下限は、ある値$p_min$よりも低い確率でビットストリングを除去し、残りの確率を正規化することで改善できることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:20:02 GMT)
DIGS: Dynamic CBCT Reconstruction using Deformation-Informed 4D Gaussian Splatting and a Low-Rank Free-Form Deformation Model [0.8] 3D Cone-Beam CT (CBCT) は放射線療法に広く用いられているが, 呼吸による運動性アーチファクトに悩まされている。
本稿では,自由形変形(FFD)に基づく空間基底関数と,整合性を実現する変形インフォームフレームワークを提案する。
我々は、6つのCBCTデータセットに対するアプローチを評価し、HexPlaneの6倍のスピードアップで優れた画像品質を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:48:59 GMT)
PQ-GCN: Enhancing Text Graph Question Classification with Phrase Features [0.7] 我々はPhrase Question-Graph Convolutional Network (PQ-GCN) というグラフ畳み込みネットワークを利用した新しいアプローチを提案する。
諸領域の問合せデータセットの分類性能を向上させるために,句ベースの特徴の組み入れを評価した。
我々の発見は、グラフニューラルネットワーク研究と教育応用のギャップを埋める、よりコンテキスト対応でパラメータ効率の高い質問分類の可能なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:18:39 GMT)
Vulnerable Road User Detection and Safety Enhancement: A Comprehensive Survey [0.7] 本研究は,車両とVRU間の通信網について検討した。
センサデータ品質を向上させるために,前処理技術とデータ融合手法を検討する。
本研究は,VRU検出および分類アルゴリズムの最近の進歩に注目し,環境条件の変動といった課題に対処する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:39:35 GMT)
Earthquake Damage Grades Prediction using An Ensemble Approach Integrating Advanced Machine and Deep Learning Models [0.7] 本研究は、SMOTE(Synthetic minority oversampling Technique)の助けを借りて、クラス不均衡の問題を扱う。
複数のクラス分類機械学習、ディープラーニングモデル、およびアンサンブル手法を探索し、構造的損傷度を推定する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:12:37 GMT)
Faster Convergence of Riemannian Stochastic Gradient Descent with Increasing Batch Size [0.7] バッチサイズの増加は、一定のバッチサイズを使用するよりも、RSGD収束率の向上につながる。
バッチサイズの増加は、RSGDのSFOを減少させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:25:29 GMT)
A Dual-Layered Evaluation of Geopolitical and Cultural Bias in LLMs [0.6] 大規模言語モデル(LLM)は、多種多様な言語や文化の文脈にまたがって展開されている。
モデルバイアス(モデルトレーニングに由来するバイアス)と推論バイアス(クエリの言語によって誘導されるバイアス)の2種類を定義した。
我々は、4つの言語と質問タイプにまたがって、事実と疑わしいQAの両方にまたがる手動でキュレートされたデータセットを構築した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:37:15 GMT)
3D Shape Generation: A Survey [0.6] 近年のディープラーニングの進歩は、3次元形状生成の分野に変化をもたらした。
本調査では, 形状表現, 生成的モデリングアプローチ, 評価プロトコルの3つのコアコンポーネントに関する議論をまとめる。
オープンな課題を特定し、制御可能で効率的で高品質な3D形状生成の進展を促す将来の研究方向を概説する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:06:06 GMT)
Hierarchical Modeling and Architecture Optimization: Review and Unified Framework [0.6] 本稿では、構造化された入力空間に関する文献をレビューし、既存のアプローチを一般化する統一的なフレームワークを提案する。
変数は、その値が他の命令された変数の存在を支配すればメタとして記述され、条件付きおよび階層構造をモデル化できる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:38:57 GMT)
Engineering CSS surgery: compiling any CNOT in any code [0.6] 本稿では,量子誤り訂正符号に論理を実装するためのフレームワークを提案する。
身体レベルでは,手術に必要なすべてのデータをカプセル化するサブコードの概念を導入する。
論理レベルでは、ホモロジー代数を利用して、任意の手術プロトコルによって引き起こされる論理的操作を追跡することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:17:01 GMT)
A Quantum Algorithm for Model-Independent Searches for New Physics [0.6] 多次元双対コライダーデータにおける非モデル化異常を探索するための新しい量子手法を提案する。
データ中の空間的に相関する異常を捉えるために,近隣のサイト間のスピンスピン相互作用を導入する。
私たちのテスト統計は、最もよく使われている適合性テストよりも優れています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:11:32 GMT)
Enhancing Cloud Security through Topic Modelling [0.6] 本研究では,NLP(Natural Language Processing)技術を用いて,セキュリティ関連テキストデータを解析し,潜在的な脅威を予測している。
本稿では,LDA(Latent Dirichlet Allocation)とPLSA(Probabilistic Latent Semantic Analysis)に着目し,データソースから意味のあるパターンを抽出する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:34:30 GMT)
From Ground to Air: Noise Robustness in Vision Transformers and CNNs for Event-Based Vehicle Classification with Potential UAV Applications [0.6] 本研究では、イベントベースカメラにおける2つの最も関連性の高いコンピュータビジョン深層学習アーキテクチャ、畳み込みニューラルネットワークとビジョントランスフォーマーの性能について検討する。
この研究で研究されたディープラーニングモデルは、Gene1イベントベースのデータセットに基づいて微調整されたResNet34とViT B16である。
クリーンなgen1データセットの初期評価では、ResNet34とViT B16はそれぞれ88%と86%のアキュラシーを達成しており、ResNet34は分類精度にわずかに有利である。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:21:00 GMT)
Closing the Loop: How Semantic Closure Enables Open-Ended Evolution [0.6] この写本は意味的クロージャの進化的出現を探求している。
関係生物学、物理生物疫学、生態心理学の概念を統一的な計算行動論の枠組みに統合する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:06:31 GMT)
Risk-Averse Best Arm Set Identification with Fixed Budget and Fixed Confidence [0.6] 本稿では,期待報酬の最大化と関連する不確実性の最小化に対処するバンディット最適化における新たな問題設定を提案する。
固定信頼と固定最適体制の両方の下で動作可能な統一的メタ予算ゴリトミックフレームワークを提案する。
提案手法は,精度と試料効率の両面で既存手法より優れている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:21:03 GMT)
Can AI be Consentful? [0.5] 生成型AIシステムは、同意を中心に構築された従来の法的および倫理的枠組みの課題を明らかにする。
この章では、従来の同意の概念が、データ保護とプライバシの権利に基礎を置いている一方で、個人データから生成されたAI生成コンテンツの影響にどう対処するかを考察する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:32:16 GMT)
SepFormer: Coarse-to-fine Separator Regression Network for Table Structure Recognition [0.5] 本稿では,SepFormerについて紹介する。SepFormerは分割とマージのパラダイムを,DETRスタイルのアーキテクチャとセパレータレグレッションを通じて単一のステップに統合する。
SepFormerは平均25.6FPSで実行でき、いくつかのベンチマークデータセットで最先端のメソッドと同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:20:42 GMT)
Reliability Analysis of Smart Contract Execution Architectures: A Comparative Simulation Study [0.5] 信頼性の高いスマートコントラクト実行の安全性を評価するための評価モデルを開発した。
次に、現実的なスマートコントラクトを有効にしたIoTエネルギケーススタディを開発しました。
その結果,Execute-Order-Executeアーキテクチャは信頼性とセキュリティに関してより有望であることがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:45:05 GMT)
In situ fine-tuning of in silico trained Optical Neural Networks [0.4] 光学ニューラルネットワーク(ONN)のトレーニングは、特にシリコモデルにおける単純化への依存など、ユニークな課題を提起する。
本稿では,サイリコ訓練におけるノイズの特定がONN性能に与える影響を解析する。
本稿では、この性能劣化を軽減するために設計された軽量アルゴリズム、Gradient-Informed Fine-Tuning(GIFT)を紹介する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:00:36 GMT)
$\text{C}^{2}\text{BNVAE}$: Dual-Conditional Deep Generation of Network Traffic Data for Network Intrusion Detection System Balancing [0.4] 本稿では,バランスの取れたネットワークトラフィックデータを生成するために,Dual-Conditional Batch Normalization Variational Autoencoder(textC2textBNVAE$)を提案する。
$textC2textBNVAE$は、異なるデータカテゴリへのモデルの適応性を改善し、リアルなカテゴリ固有のデータを生成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:12:51 GMT)
A Heuristic Study of Temperature: Quantum Circuitry in Thermal Systems [0.4] 我々は,境界動的複雑性を仮定に推し進め,複雑度ウィンドウ型熱力学(CWT)の開発を行う。
スムースネスは有限で連続的な有効温度と非負の複雑性生成ポテンシャルを保証する。
CWTは臨界点の滑らか化からブラックホール情報の流れへの現象を統一し、宇宙の総生成可能な複雑さとそのホログラフィックエントロピーは、熱力学、量子計算、重力の順序と同じである、と予測する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:56:39 GMT)
URSA: The Universal Research and Scientific Agent [0.4] 本稿では,研究課題を加速する科学エージェントエコシステムURSAについて紹介する。
URSAは、高度な物理シミュレーションコードとの結合を含むモジュラーエージェントとツールのセットで構成されている。
この作業では、URSAのアーキテクチャと、システムの可能性を強調した例を強調します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:56:02 GMT)
Unifying communication paradigms in delegated quantum computing [0.3] Delegated quantum Computing (DQC) は、量子コンピュータをホストするサーバに計算をアウトソースする、低い量子能力を持つクライアントを可能にする。
計算のセットアップと実行の全体的なプロセスは、キュービットの準備、リソース状態を得るためにキュービットを絡み合わせること、計算を実行するためのキュービットを測定することの3つの段階からなる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:54:43 GMT)
Enhancing Variational Quantum Algorithms for Multicriteria Optimization [0.2] 本稿では,変分量子アルゴリズムの分野への2つの重要な貢献を紹介する。
まず、VQAのパラメータ最適化タスクを多重基準問題として再構成する。
次に,超体積型コスト関数をカバレッジ指向の指標で拡張する手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:15:22 GMT)
Do Electric Vehicles Induce More Motion Sickness Than Fuel Vehicles? A Survey Study in China [0.2] 電気自動車(EV)は燃料車(FV)に代わる有望な代替品である
EVの普及にともなって、運動障害(MS)誘発の可能性が高くなるという不満が広まっている。
本研究の目的は、EV誘導型MSの存在を調査し、それにつながる潜在的な要因を探ることである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:55:55 GMT)
Bose-Marletto-Vedral experiment without observable spacetime superpositions [0.2] エンタングルメントは時空重畳や量子時空自由度を必要とせずに重力によって生成できることを示す。
具体的には、3つの異なるおもちゃモデルを用いて絡み合いを生成できることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:48:32 GMT)
Recomposed realities: animating still images via patch clustering and randomness [0.2] 本稿では、既存の画像データを用いて静止画像の動作を生かしたパッチベースの画像再構成とアニメーション手法を提案する。
このアプローチはレプリケーションに対する再解釈を強調しており、ソースとターゲットドメインはローカル構造を共有しながら概念的に異なる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:14:34 GMT)
A purely geometrical Aharonov-Bohm effect [0.1] 本稿では,アフィン共変積分量子化(ACIQ)の量子力学への応用について述べる。
句読面のトポロジーのため、我々の量子化手順はアフィンベクトルポテンシャルを生じさせる。
このポテンシャルは無限ソレノイドによって生成されるアハロノフ・ボームゲージ場(AB)と解釈できる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:42:40 GMT)
BrainMT: A Hybrid Mamba-Transformer Architecture for Modeling Long-Range Dependencies in Functional MRI Data [0.1] 近年のディープラーニングの進歩により、機能的磁気共鳴画像(fMRI)脳の体積から直接表現型測定を予測できるようになった。
本稿では,fMRIデータの長距離時間特性を効率的に学習し,統合するための新しいハイブリッドフレームワークBrainMTを紹介する。
筆者らのフレームワークは,(1)時間優先走査機構を備えた双方向マンバブロックを用いて,時間的に効率よくグローバルな時間的相互作用をキャプチャし,(2)グローバルな空間的関係をモデル化するための自己認識を利用したトランスフォーマーブロックの2段階で動作する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:20:41 GMT)
Maximum Dispersion, Maximum Concentration: Enhancing the Quality of MOP Solutions [0.1] 多目的最適化問題(MOP)は、しばしば相反する目的間のトレードオフを必要とし、目的空間における多様性と収束を最大化する。
本研究では, 決定空間における分散と, 目的空間の特定の領域における収束を最適化することにより, MOPソリューションの品質を向上させる手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:32:22 GMT)
Linearization Scheme of Shallow Water Equations for Quantum Algorithms [0.1] 浅水方程式を解くための量子アルゴリズムの可能性について検討する。
非線形浅水方程式から線形方程式系への写像を作成し、量子デバイス上で指数関数的に高速に解くことができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:54:14 GMT)
crypto price prediction using lstm+xgboost [0.0] 本研究では,Long Short-Term Memory(LSTM)ネットワークとExtreme Gradient Boosting(XGBoost)を統合したハイブリッドディープラーニングと機械学習モデルを提案する。
LSTMコンポーネントは過去の価格データの時間的依存性を捉え、XGBoostは感情スコアやマクロ経済指標などの補助的特徴との非線形関係をモデル化することによって予測を強化する。
このモデルは、Bitcoin、Dogecoin、Litecoinの歴史的データセットに基づいて評価され、グローバルおよびローカライズされた交換データの両方を取り入れている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:49:25 GMT)
Visual Content Detection in Educational Videos with Transfer Learning and Dataset Enrichment [0.0] 本稿では,講義映像フレーム内の視覚的要素を検出するための伝達学習手法について報告する。
YOLOは講義ビデオオブジェクト検出に最適化されており、複数のベンチマークデータセットをトレーニングし、半教師付きオートラベリング戦略を展開している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:43:05 GMT)
VLM@school -- Evaluation of AI image understanding on German middle school knowledge [0.0] 本稿では、視覚言語モデル(VLM)の能力を評価するために設計された新しいベンチマークデータセットを提案する。
このデータセットは、数学、歴史、生物学、宗教を含む9つの領域にまたがる実際の中学カリキュラムから導かれる。
我々は,複数の次元にわたる最先端のオープンウェイトVLM13種の評価を行った。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:12:42 GMT)
Universal and complete extraction for energy-invariant catalysis in quantum batteries [0.0] 量子電池からのエネルギー抽出における触媒の役割について検討する。
エネルギー抽出には、電池と触媒に共同で作用するが、触媒のエネルギーは維持するユニタリに制限する。
電池と同じ寸法のエネルギー不変触媒の存在下では、蓄電池のすべての蓄電エネルギーを常に抽出できることを実証する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:53:43 GMT)
Universal Modelling of Autocovariance Functions via Spline Kernels [0.0] ボクナーの定理は、任意の正のスペクトル測度が逆変換を通じて有効な ACF を生成することを保証している。
我々は、任意の次数と結び目を持つB-スプラインスペクトル基底の逆変換を導出することにより、非パラメトリックACFの柔軟な閉形式クラスを開発する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:47:25 GMT)
Unified Memcapacitor-Memristor Memory for Synaptic Weights and Neuron Temporal Dynamics [0.0] 本稿では, メモリスタックを作製し, メモリスタックを設計し, メモリスタックを設計した。
繰り返しスパイクニューラルネットワーク(RSNN)における空間的・時間的ダイナミクスの同時制御を可能にする回路を設計する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:45:16 GMT)
Under the Hood of BlotchyQuasar: DLL-Based RAT Campaigns Against Latin America [0.0] ブラジルを中心に、ラテンアメリカ諸国をターゲットにした洗練されたマルスパムキャンペーンが最近明らかになった。
この操作は、非常に詐欺的なフィッシングメールを使用して、悪意のあるMSIファイルの実行をユーザを騙し、マルチステージ感染を開始する。
このマルウェアは、BlotchyQuasarとして知られるQuasarRATの亜種であり、広範囲の悪意ある活動を可能にする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:36:10 GMT)
Towards a Comparative Framework for Compositional AI Models [0.0] 本稿では、自然言語処理のためのDisCoCircフレームワークを用いて、モデルがどのように構成的一般化を学べるかを示す。
我々は、bAbIタスクの1つから派生したデータセット上で、量子回路ベースのモデルと古典的ニューラルネットワークを比較した。
両方のアーキテクチャは、生産性と置換性タスクにおいて、それぞれ5%以内のスコアを得ますが、システマティタスクでは、少なくとも10%の違いがあります。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:59:14 GMT)
Toward the Autonomous AI Doctor: Quantitative Benchmarking of an Autonomous Agentic AI Versus Board-Certified Clinicians in a Real World Setting [0.0] 2030年までには、世界中で1100万人の医療従事者が不足していると予測されている。
エンド・ツー・エンドの大規模言語モデル(LLM)ベースのAIシステムは、実際の臨床実践において厳格に評価されていない。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:04:44 GMT)
Toward Data Systems That Are Business Semantic Centric and AI Agents Assisted [0.0] ビジネスSemantics Centric, AI Agents Assisted Data System (BSDS)
BSDSは、データシステムをビジネス成功の動的な実現手段として再定義する。
システムには、ビジネスエンティティにリンクされたキュレートされたデータ、コンテキスト認識AIエージェントの知識ベース、効率的なデータパイプラインが含まれる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:49:26 GMT)
Time series classification with random convolution kernels: pooling operators and input representations matter [0.0] 本稿では,SelF-Rocketと呼ばれるMiniRocketに基づく,高速時系列分類(TSC)のための新しいアプローチを提案する。
トレーニングプロセス中に最適な入力表現とプーリング演算子を動的に選択する。
カリフォルニア大学リバーサイド校(UCR)のベンチマークデータセットで最先端の精度を実現している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:03:42 GMT)
Three-Body Non-Locality in Particle Decays [0.0] 多粒子量子系における絡み合いとベル非局所性について検討する。
いくつかの不等式を解析することにより、量子力学からの偏差の検出に対処する。
我々の発見は、3粒子系における古典理論と量子理論の境界について深い洞察を与える。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:15:56 GMT)
The Janus State: Strong Photon Antibunching from a Superposition of Squeezed Vacua [0.0] 2つの圧縮された真空状態の重ね合わせであるジャヌス状態を導入する。
我々の正確な分析理論は、この創発的な非古典性は純粋な量子干渉によって駆動されることを示している。
この結果は、アンチバンチングが非ガウス的資源を必要とするというパラダイムに根本的に挑戦する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:25:42 GMT)
Task-Agnostic Contrastive Pretraining for Relational Deep Learning [0.0] 本稿では,データベース全体の表現学習を可能にするRDLのためのタスク依存型コントラスト事前学習手法を提案する。
モジュール型RDLアーキテクチャにより,各事前学習手法を実装した。
予備的な結果から、事前訓練したモデルの微調整は、スクラッチからトレーニングを成功させることが示された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:18:13 GMT)
Structural Properties of Non-Linear Cellular Automata: Permutivity, Surjectivity and Reversibility [0.0] 非線型局所規則を持つセルオートマトンは、全射性と可逆性を示す。
これらの性質に影響を与える重要な要因として、置換度の役割を分析し、非線型CAが(bi)置換性であるかどうかを決定する条件を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:25:05 GMT)
Strengthening False Information Propagation Detection: Leveraging SVM and Sophisticated Text Vectorization Techniques in comparison to BERT [0.0] 本研究では,機械学習と自然言語処理,具体的にはSVM(Support Vector Machines)とBERTを用いて偽ニュースを検出する。
SVMには、TF-IDF(Term Frequency Inverse Document Frequency)、Word2Vec(Word2Vec)、Bag of Words(BoW)の3つの異なるテキストベクトル化手法を用いる。
これらの手法を変換器の大規模言語モデルであるBERTと比較し,最も効果的な手法を決定する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:01:44 GMT)
Spin squeezing generation in atom-cavity systems: on the effects of adiabatic elimination beyond the leading order [0.0] 原子空洞結合の増大はスピンスクイーズ生成に有害であることを示す。
次に, スピンスクイーズによるスケーラビリティ損失が, 削減された開系力学によって正確に再現されることを数値シミュレーションにより示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:49:24 GMT)
Spectral Bias in Variational Quantum Machine Learning [0.0] パラメータ化量子回路(PQC)における特殊効果について検討する。
トレーニング中のフーリエ係数の勾配の大きさは、係数の冗長性と強く相関している。
また, 冗長性が高いPQCは, 対応する周波数におけるパラメータのランダムな摂動に対して頑健性を示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:11:54 GMT)
Smooth-Distill: A Self-distillation Framework for Multitask Learning with Wearable Sensor Data [0.0] 本稿では,人間の活動認識(HAR)とセンサ配置検出を同時に行うように設計された,新しい自己蒸留フレームワークであるSmooth-Distillを紹介する。
従来の蒸留法とは異なり, 提案手法では, モデル自体のスムーズな歴史バージョンを教師として利用している。
実験結果から,Smooth-Distill は異なる評価シナリオにおける代替手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:51:51 GMT)
Simulation-based population inference of LISA's Galactic binaries: Bypassing the global fit [0.0] 周波数(あるいは時間)のひずみ列から直接、最も多くのLISA源の特性を推測できることを示す。
これにより、解決されたソースと未解決のソースの両方から、同時に、計算的に効率的な方法で、人口パラメータに関する情報を抽出することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:00:03 GMT)
Simple Sufficient Criteria for Optimality of Entanglement Witnesses [0.0] エンタングルメントブレーキングチャネルによるスパンニング特性の斬新な特徴について紹介する。
分散プロパティよりもわずかに弱いが、手動でも数値でもテストがずっと簡単で、ほとんどすべての目撃者に適用できる。
第2の基準は、与えられた証人の期待値を最大絡み合った状態で簡単に計算できるものである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 12:33:53 GMT)
Signatures of rigidity and second sound in dipolar supersolids [0.0] 超固体はバリア除去後に減衰した結晶振動を示し、減衰速度は超流動接続を反映する。
位相印加されたジャンプは、2番目の音を励起する準安定なダークソリトンをトリガーする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:03:12 GMT)
Selective filtering of multi-photon events from a single-photon emitter [0.0] 単一光子純度は多くの光の量子状態の最も重要な指標の1つである。
フォトニック量子技術における応用には、その誤差導入の性質のため、多重光子誤差率の最小化が必要である。
ここでは、単光子純度に対するこの基本的な制限でさえ、多重光子誤差を形成する個々の光子の分光時間特性が異なるために克服できることを示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:47:40 GMT)
Segmentation-Based Regression for Quantum Neural Networks [0.0] 量子ハードウェアの最近の進歩は、量子サンプリングと古典的推論を統合するアルゴリズムフレームワークの開発を動機付けている。
本研究は,量子ニューラルネットワーク(QNN)に適したセグメンテーションに基づく回帰手法を提案する。
回帰タスクを構造化された桁格子上の制約付き問題としてキャストすることにより、連続的な推論を解釈可能かつトラクタブルな更新に置き換える。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:11:43 GMT)
Sampling Groups of Pauli Operators to Enhance Direct Fidelity Estimation [0.0] 実験状態のコピーを少なくする改良された直接忠実度推定プロトコルを提案する。
数値シミュレーションにより,8ビットのハールランダム状態の場合,必要なコピー数の3分の1の削減が達成されることを示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:37:34 GMT)
Retrieval Augmented Generation Based LLM Evaluation For Protocol State Machine Inference With Chain-of-Thought Reasoning [0.0] 本稿では,RAGをベースとしたエージェント型大規模言語モデル(LLM)アーキテクチャのネットワークパケットのシード生成とエンリッチメントにおける効率性を評価するための新しい手法を提案する。
実験の結果, BLEU, ROUGE, WERでは, それぞれ18.19%, 14.81%, 23.45%の大幅な改善が見られた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:24:21 GMT)
REMOR: Automated Peer Review Generation with LLM Reasoning and Multi-Objective Reinforcement Learning [0.0] 我々は,多目的強化学習(REMOR)を用いた推論LLMが,限界を克服できるかを評価する。
REMORは、人間のレビューの平均的な報酬の2倍以上の報酬、非最先端のエージェント的マルチモーダルAIレビューシステムを達成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 02:48:27 GMT)
REDELEX: A Framework for Relational Deep Learning Exploration [0.0] 近年、深層学習は、RDBをグラフ構造として概念化する新しいパラダイムとして登場した。
様々なRDLモデルと基礎となるRDBの特徴との関係について分析することができない。
REDELEX$-$aの総合的な探査フレームワークを70以上のRDBの最も多様なコレクション上で、様々な複雑さのRDLモデルを評価する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:05:15 GMT)
RAUM-Net: Regional Attention and Uncertainty-aware Mamba Network [0.0] Fine Grained Visual Categorization (FGVC) はコンピュータビジョンにおいて依然として難しい課題である。
既存のメソッドは、特にラベル付きデータが不足している場合に、きめ細かいシナリオで苦労する。
本研究では,マンバに基づく特徴モデリング,地域注意,ベイズ不確実性を組み合わせた半教師付き手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:48:19 GMT)
Questionable and Unquestionable in Quantum Mechanics [0.0] 原則として、あるシステムの量子論的記述は、原則として純粋に運用確率的な記述に変換可能であるべきである。
まず、任意の物理系の動作記述のための一般的なスキームから始める。
この操作確率的記述が量子力学的記述とどのように比較され、標準ヒルベルト空間量子力学が一般的な操作確率論的理論の再構成と見なすことができるかについて議論する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:34:03 GMT)
Quantum-Enhanced Attention Mechanism in NLP: A Hybrid Classical-Quantum Approach [0.0] 本稿では,量子化されたアテンション機構を標準の古典的アーキテクチャに組み込んだ,古典量子変換器のハイブリッドモデルを提案する。
様々なNLPベンチマークにおいて,このアプローチの有効性を実証し,効率と表現能力の両面で改善したことを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:09:08 GMT)
Quantum smell: tunneling mechanisms in olfaction [0.0] 臭気分子の内在エネルギースケールと分子間電荷輸送を促進するギャップ状態との相互作用を探索する。
臭気は電子カップリングの限界により弱いトンネル導体として機能することがわかった。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:33:11 GMT)
Quantum Workshop for IT-Professionals [0.0] 本稿では、事前の量子知識のないIT専門家向けに、ユーザ中心のワークショップコンセプトを提案する。
架空の企業のビジネスゲームセットを使用して、参加者はリレーショナルでアプリケーション駆動のシナリオを通じて量子技術を探求する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:48:15 GMT)
Quantum Search with a Generalized Laplacian [0.0] 量子スピンネットワークにおける単一励起は、未重み付きグラフ上の様々な連続時間量子ウォークに影響を与える。
ハイゼンベルク模型は、これらの3つの量子ウォークを符号付き重み付きグラフ上で作用させることができることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:27:01 GMT)
Quantum Listenings -- Amateur Sonification of Vacuum and other Noises [0.0] 例は量子力学が適用可能な体制に近く選択される。
視覚的および聴覚的レンダリングは、音楽とのいくつかの接続と比較され、特に時間軸に沿ったフラクタルな複雑さを描写している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:19:38 GMT)
Quantum Features of the Thermal Two-Qubit Quantum Rabi Model in Ultra- and Deep-Strong Regimes [0.0] 2量子ビット量子ラビモデル (2QQRM) は、単一のボソニックモードに結合された2つの量子ビットを記述する。
本研究では、熱平衡における2QQRMにおける量子相関と非古典状態の持続性について検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:24:01 GMT)
Public Service Algorithm: towards a transparent, explainable, and scalable content curation for news content based on editorial values [0.0] Public Service Algorithm(PSA)は、Public Service Media(PSM)にインスパイアされた価値に基づいた、スケーラブルで透明なコンテンツキュレーションのための新しいフレームワークである。
以上の結果から,人間の編集判断とLarge Language Models (LLMs) の評価との間に有望な整合性があることが示唆された。
この研究は、信頼できるニュースコンテンツの自動キュレーションのためのスケーラブルなフレームワークへの第一歩となる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:39:38 GMT)
Probing Quantum Spin Systems with Kolmogorov-Arnold Neural Network Quantum States [0.0] 量子力学的波動関数を表現するニューラルネットワークモデルであるtexttSineKAN を提案する。
textttSineKANモデルは,計算コストを最小限に抑えて高精度かつ高精度にトレーニングできることが判明した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:50:31 GMT)
Pipe Reconstruction from Point Cloud Data [0.0] 本稿では,不完全なレーザースキャンデータから自動管再構築のためのパイプラインを提案する。
アプローチでは、ラプラシアンに基づく収縮を用いて骨格曲線を推定し、その後に曲線伸長が続く。
骨格軸は、回転球法と2D円の嵌合を併用し、3D平滑化工程で精製される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:54:51 GMT)
Perfect transfer of arbitrary continuous variable states across optical waveguide lattices [0.0] 我々は, 近接結合を変調したハミルトニアンが支配する光導波路格子において, 完全状態伝達が達成できることを実証した。
提案プロトコルは2次元および3次元の導波路ジオメトリに拡張可能であることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:55:06 GMT)
Perfect quantum state transfer through a chaotic spin chain via many-body scars [0.0] 量子多体傷(QMBS)は、弱いエルゴディディディティ破壊のメカニズムを提供する。
カオス多体システムにおけるQMBSは、一般に可積分モデルに関連する情報伝達タスクに利用される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:48:13 GMT)
Partitions in quantum theory [0.0] 量子論において、部分系は通常、大域系上の作用素の代数のサブC*代数としてフレーム化される。
任意の数の部分への分割の定義を示し、それぞれがおそらく非因子部分C*代数である。
我々は、その物理的解釈と性質、特に代数中心の構造について研究する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:36:48 GMT)
PARSI: Persian Authorship Recognition via Stylometric Integration [0.0] 我々は、67人の著名なペルシア人詩人の著者を決定するために、多入力のニューラル・フレームワークを使用している。
我々は、厳密な前処理と著者検証により、ガンジョーのデジタルコレクションの647,653節の膨大なコーパスをコンパイルし、データを検証した。
本研究は、著者属性の改善を目的とした、深層表現形式とドメイン固有の機能の統合に焦点を当てる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:08:52 GMT)
Orbital Angular Momentum Generation in Schwinger Scattering from Perfect Quartz [0.0] 完全単結晶、特に石英の周期構造における原子内核電場を利用する。
熱中性子と後方回折中性子のブラッグとローの回折波動関数を計算し、スピンから軌道角運動量への変換を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:32:13 GMT)
Oldies but Goldies: The Potential of Character N-grams for Romanian Texts [0.0] 我々は,軽量で解釈可能な文字n-gramアプローチが,ルーマニアの著作家帰属に最先端の精度をもたらすことを示す。
本研究は, 資源, 制約, アンダースタディド言語設定における簡易なテクスチャ的特徴の可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:46:24 GMT)
Observation of entanglement in a cold atom analog of cosmological preheating [0.0] 本研究では, ボース・アインシュタイン凝縮体の粒子生成に類似した状態における集合励起の絡み合いを観察する。
本装置では, 葉巻状凝縮体の逆呼吸モードにより, インフラトン場の振動を模倣する。
これらの対の絡み合いを観察し、真空のゆらぎがパラメトリック成長を発生させ、励起の量子的起源を確かめた。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:46:06 GMT)
Nonclassicality in correlations without causal order [0.0] 我々はベルシナリオにおける非シグナリングの最小緩和を考える。
ベルと異なり、私たちは当事者間の因果関係についてグローバルな仮定をしていない。
相関集合間の厳密な階層構造を、その反理性に基づいて証明する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:26:01 GMT)
Neural models of multiscale systems: conceptual limitations, stochastic parametrizations, and a climate application [0.0] 気候モデルは、定常統計と外部の摂動に対する応答の両方を捉えなければならない。
現在の自己回帰神経モデルはしばしば前者を再現するが、通常は後者と競合する。
我々は、複雑なシステムの巧妙なエミュレーションにおいて、物理的に根ざした戦略は概念的にも実用的にも重要であると論じる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:04:36 GMT)
Microscopic approach to the quantized light-matter interaction in semiconductor nanostructures: Complex coupled dynamics of excitons, biexcitons, and photons [0.0] 半導体と量子光の相互作用を研究するための完全量子化モデルを提案する。
量子光場と1対と2対の電子-ホール対の結合力学について述べる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:37:15 GMT)
Metric formalism for precision assessment in non-Hermitian systems [0.0] 量子システムにおける測定精度の向上は、量子センシングや通信といった技術の進歩に不可欠である。
伝統的に、量子フィッシャー情報(QFI)は、エルミート量子系の精度限界を決定する鍵となるツールである。
本研究では、正規化や計量アプローチのような非エルミート量子力学の様々な解釈について検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:39:17 GMT)
Massive quantum superpositions using magneto-mechanics [0.0] 本稿では,Q因子の高い大規模量子発振器系の空間重畳法を提案する。
まず, 近接する磁束量子ビットに印加された磁力により発生する浮遊球状磁石の空間重畳を提案する。
第2の手法では,磁化量子ビットを誘導的に駆動することによって発生する磁化磁化磁束量子ビットの空間的重畳を,磁気化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁化磁
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:35:26 GMT)
Macroscopic theory of multipartite correlations in permutation-invariant open quantum systems [0.0] マルコフ進化中のN$相互作用ユニット間の定常多部情報のマクロ的挙動を決定する手法を提案する。
我々は、従来のシステムでは、平均場力学の固定点に緩和するシステムでは相互情報の広範なスケーリングは不可能か、あるいはそのようなスケーリングが特定のシステムパラメータの摂動に対して堅牢でないという結論を延長する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 11:00:15 GMT)
Long-Sequence Memory with Temporal Kernels and Dense Hopfield Functionals [0.0] 長い系列ホップフィールドメモリモデルに関する初期の研究に基づいて、時間的依存関係を組み込むために時間的カーナル$K(m, k)$を提案する。
本手法が映画フレームの保存とシーケンシャル検索に有効であることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:57:58 GMT)
Learning Non-Local Molecular Interactions via Equivariant Local Representations and Charge Equilibration [0.0] 非局所的相互作用を効率的にモデル化する上での課題に対処するために、長距離相互作用のための電荷平衡層(CELLI)を提案する。
CellIは多様なデータセットや大きな構造に一般化し、高い計算効率と堅牢な予測を提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:03:53 GMT)
Learning Data-Driven Uncertainty Set Partitions for Robust and Adaptive Energy Forecasting with Missing Data [0.0] 短期的な風力発電予測モデルでは、投入時に入力データ(機能)が利用可能であることを前提としている。
機器の故障、破壊、サイバー攻撃は、そのようなモデルが運用に使用される際に欠落する可能性がある。
適応的ロバスト最適化と対向機械学習を用いて、不足したデータをシームレスに操作する予測モデルを開発する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:15:39 GMT)
Layer Importance for Mathematical Reasoning is Forged in Pre-Training and Invariant after Post-Training [0.0] 数学的推論は特定の層重み付け構造を生じさせ,この構造は後学習のパラダイム全体にわたって持続することを示す。
事実的リコールのような非数学的なタスクは、重要なレイヤを示さない。
この区別は、数学的推論は事前訓練中に現れる特別な層を必要とするが、他の非推論タスクは必要ではないことを示している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:04:55 GMT)
Lamb-Dicke Dynamics of Interacting Rydberg Atoms Coupled to the Motion of an Optical Tweezer Array [0.0] ライドバーグ原子は光ツイーザーアレイに閉じ込められ、量子計算の基盤となる。
トラップ周波数の異なるRydberg原子のラム・ディッケダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 22:32:14 GMT)
Koopman operator-based discussion on partial observation in stochastic systems [0.0] 決定論的なシステムでは、モリ=ズワンツィヒ形式主義は部分的な観測を扱うための理論的枠組みを提供する。
クープマン作用素理論に基づくデータ駆動アルゴリズムは大きな進歩を遂げた。
クープマン作用素理論を用いたシステムにおける部分観測の効果について論じる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:30:51 GMT)
Josephson vortices and persistent current in a double-ring supersolid system [0.0] ポテンシャル障壁によって生成される放射結合同心円環トラップにおける超低温双極子原子の性質を理論的に検討する。
超流動-超固体相転移における非回転基底相の研究を行った。
回転を適用すれば、角運動量や障壁強度によって、どちらの環でも密度変調が誘導される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:49:37 GMT)
JointRank: Rank Large Set with Single Pass [0.0] モデル入力限界を超える大集合を高速に復位するモデルに依存しない手法を提案する。
本手法は, 57.68に対して70.88のnDCG@10を実現していることを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:30:12 GMT)
Investigation of three-body Förster resonance for various spatial configurations of the three interacting Rubidium Rydberg atoms [0.0] dc電場によって制御される3体F"オースター共鳴は、3量子ビット量子ゲートの実装に重要である。
共鳴の1つは、原子間の距離に共鳴電場が弱い。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:28:40 GMT)
Information Dynamics in Quantum Harmonic Systems: Insights from Toy Models [0.0] 本研究では,調和振動子の玩具モデルを用いた量子情報力学について検討する。
本研究では,磁場や情報フロー,計算量など,結合強度や変形,外部要因の変動が,どのように影響するかを検討する。
イオン輸送の文脈では、突然のプロトコルと断熱的なプロトコルを比較し、非断熱性計量を用いてそれらの忠実度・複雑度を定量化する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:53:00 GMT)
Improving LLM Outputs Against Jailbreak Attacks with Expert Model Integration [0.0] Archiasはドメイン内通信とドメイン外通信を区別できるエキスパートモデルである。
Archiasは、ユーザからの問い合わせを、ドメイン内(特に自動車業界)、悪意のある質問、価格注入、インジェクションのプロンプト、ドメイン外の例に分類する。
アーチは調整され、微調整され、小型のため様々な目的に使用される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:04:25 GMT)
Implementation and representation of qudit multi-controlled unitaries and hypergraph states by many-body angular momentum couplings [0.0] 我々は多体角運動量相互作用の観点から、キューディット多制御ユニタリ作用素の表現を構築する。
四極子-四極子相互作用と四極子-四極子相互作用の単純化と接続が確立できるキュートリットの特殊な場合の主な点について述べる。
本稿では,近縁なquditハイパーグラフ状態の表現について述べる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:39:37 GMT)
Identifying a Circuit for Verb Conjugation in GPT-2 [0.0] GPT-2 Smallのサブネットワークを分離・解釈する手法を実装した。
このモデルには、主題が特異(例えば「アリス」)か複数の(例えば「アリス」と「ボブ」)のいずれかである場合のプロンプトが与えられ、そのタスクは適切な動詞形式を正しく予測することである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:35:41 GMT)
HyperCLOVA X THINK Technical Report [0.0] HyperCLOVA X THINKはHyperCLOVA Xファミリの最初の推論中心の大規模言語モデルである。
韓国の約6兆ドル(約660兆円)の高品質な韓国のトークンと、ターゲットとする韓国の合成データで強化された英語のトークンを事前訓練した。
韓国のベンチマークでも同様の大きさのモデルに対して、競争力のあるパフォーマンスを提供する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:23:12 GMT)
How do Probabilistic Graphical Models and Graph Neural Networks Look at Network Data? [0.0] 確率的グラフモデル(PGM)とグラフニューラルネットワーク(GNN)を比較した。
グラフのヘテロフィリエが増加すると、PGMはGNNよりも頑丈であることが分かる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:37:02 GMT)
Hitchhiking Rides Dataset: Two decades of crowd-sourced records on stochastic traveling [0.0] 本稿では,20年近くにわたって収集された63,000件を超えるヒッチハイクライダーのデータセットを提示し,分析する。
クラウドソースによるコントリビューションを活用することで、データセットはヒッチハイキングの起源、進化、コミュニティ主導のメンテナンスの重要な側面をキャプチャする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:41:08 GMT)
High Resolution Isotropic 3D Cine imaging with Automated Segmentation using Concatenated 2D Real-time Imaging and Deep Learning [0.0] DLモデルを用いて2次元リアルタイムシネ画像から3次元シネデータを作成する可能性を実証した。
提案手法は,2分以内で全セグメントデータが得られる短い取得時間と再構築時間を有する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:58:22 GMT)
HQCM-EBTC: A Hybrid Quantum-Classical Model for Explainable Brain Tumor Classification [0.0] HQCM-EBTCはMRI画像を用いた脳腫瘍の自動分類のためのハイブリッド量子古典モデルである。
健常者,髄膜腫,グリオーマ,下垂体等を対象とし,7,576回の検診を行った。
HQCM-EBTCは96.48%の精度を達成し、従来のベースライン(86.72%)を大幅に上回った
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:16:57 GMT)
GuiderNet: A Meta-Learning Framework for Optimizing Quantum Circuit Geometry and Mitigating Barren Plateaus [0.0] データ依存パラメータシフトを用いた量子回路(PQC)を強化するメタラーニングフレームワークである GuiderNet を紹介する。
GuiderNetは累積トレーニング損失を5倍以上減らし、テスト精度を75.3%から98.6%に改善し、マイノリティクラスF1スコアを0.67から0.95に引き上げている。
その結果、幾何学的メタコンディショニングはバレンプラトーと不条件を緩和し、量子機械学習の一般化にスケーラブルなアプローチを提供することを示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:30:33 GMT)
Ground-state reachability for variational quantum eigensolvers: a Rydberg-atom case study [0.0] 変分量子固有解法(VQE)の到達性条件について,その固有対称性を解析して検討した。
我々は、大域的な制御を持つリドベルグ原子量子シミュレータを考察し、イジングとハイゼンベルクが標的とするハミルトンの基底状態に到達する能力を評価する。
我々のフレームワークはまた、追加の量子リソースの追加や異なる初期状態の選択によって対称性の制限を克服するアプローチを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:53:50 GMT)
Generative adversarial neural networks for simulating neutrino interactions [0.0] 本稿では,ニュートリノ散乱現象を標準モンテカルロ発生器の代替としてシミュレートする新しい手法を提案する。
ミューオン運動変数、特にそのエネルギーと散乱角を生成するための単純化された枠組みを考える。
2つのGANモデルが得られ、1つは準弾性ニュートリノ核散乱をシミュレートし、もう1つは与えられたニュートリノエネルギーで全ての相互作用をシミュレートした。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:14:44 GMT)
Generalized Venn and Venn-Abers Calibration with Applications in Conformal Prediction [0.0] 我々は、Venn-Abersキャリブレーションのための統一的なフレームワークを導入し、Vovkのアプローチを二項分類を超えて、ジェネリック損失関数によって定義される予測問題の幅広いクラスに拡張する。
提案手法は,任意の完全サンプル内キャリブレーションされた予測器を,有限サンプルにおいて少なくとも1つの限界点予測を出力するセット値予測器に変換する。
量子損失に対して,本フレームワークは,グループ条件とマルチキャリブレーションされた共形予測を特殊ケースとして回収し,量子条件のカバレッジで新しい予測区間を生成する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:41:16 GMT)
General many-body entanglement swapping protocol [0.0] 2つの非署名者が任意のパーティショニングに沿って一般的な多体状態を共有することができる多体絡み交換プロトコルを導入する。
共有多体状態は、ターゲット状態と全く同じシュミットベクトルを保持し、典型的には高い忠実性を示す。
実量子ハードウェア上でプロトコルの概念を実証し、複雑なマルチキュービット状態のフレキシブルな共有やフォールトトレラントな絡み合わせなど、新しい機能を実現する方法について論じる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:56:55 GMT)
GRASP-PsONet: Gradient-based Removal of Spurious Patterns for PsOriasis Severity Classification [0.0] 本稿では,突発的な相関を導入し,問題のあるトレーニングイメージを自動的にフラグするフレームワークを提案する。
フラグ付き画像の8.2%は、保持されたテストセットでモデルAUC-ROCを5%(85%から90%)改善する。
2人の皮膚科医によって評価された訓練データのサブセットに適用した場合、この方法は、レイター間不一致の90%以上を識別する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:42:09 GMT)
From Data Quality for AI to AI for Data Quality: A Systematic Review of Tools for AI-Augmented Data Quality Management in Data Warehouses [0.0] 分析、コンプライアンス、AIのパフォーマンスには、高データ品質(DQ)が不可欠だ。
本研究では,データウェアハウスにおけるAI強化データ品質管理(DQM)をサポートする既存のツールについて検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:27:32 GMT)
Forecasting the future development in quality and value of professional football players [0.0] 本稿では,予測精度と不確実性定量化手法に基づいて,説明可能な機械学習モデルを評価する。
予測精度は1年後の選手の質と価値を予測するためにモデルを訓練することで研究される。
概して、ランダム森林モデルは最も適したモデルである。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:47:13 GMT)
Float Lattice Gas Automata: A connection between Molecular Dynamics and Lattice Boltzmann Method for quantum computers [0.0] 本稿では,Lattice Gas Automataフレームワークの簡易かつ変動のない変種を紹介する。
このアプローチは浮動小数点数に依存し、Lattice Boltzmann Method (LBM) を密接に反映している。
本稿では,従来のLBM実装に代わる効率的な代替手段として,Float Lattice Gas Automata(FLGA)の衝突を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:48:12 GMT)
First-order nuclear dipolar order in rotating solids [0.0] 核スピンの双極子秩序は魔法の角度の回転の下で作られる。
参照フレームにおける双極子再結合と断熱脱磁の同時実施。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 05:05:24 GMT)
Evaluating Pointing Gestures for Target Selection in Human-Robot Collaboration [0.0] 本研究では,平面ワークスペース内におけるポインティングターゲットのローカライズ手法を提案する。
提案手法はポーズ推定と,RGB-Dストリームからジェスチャーデータを抽出するショルダー・ブラスト拡張に基づく簡易幾何モデルを用いる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:51:31 GMT)
Entropy from scattering in weakly interacting systems [0.0] サブシステムエントロピーが増加することを保証する初期状態と散乱行列の驚くほど単純な基準を見出す。
これらの基準を満たす状態のクラスは、サブシステムの単純な積状態よりもより相関している。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 19:54:51 GMT)
Entropic characterization of Tunneling and State Pairing in a Quasi-Exactly Solvable Sextic Potential [0.0] V_textQES(x) = frac12(x6 + 2x4 - 2(2lambda + 1)x2)$ をパラメータ $lambda in [-frac34, 6]$ の関数として解析する。
for $lambda > -frac12$, the potential exhibits a symmetric double-well structure, with tunneling comes for the ground state level at $lambda approx
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:31:49 GMT)
Entanglement and Stabilizer entropies of random bipartite pure quantum states [0.0] 絡み合いと魔法には強い依存があるが、驚くべきことに全く無関係である。
最初の近似で、絡み合いはシュミット軌道上の平均的な魔法を決定する。
しかし、エンタングルメントスペクトルの平坦度が関与する異なる軌道を区別する平均的な魔法には、より微細な構造がある。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:38:24 GMT)
Enhanced Lieb-Robinson bounds for commuting long-range interactions [0.0] 量子多体系における情報伝達における長距離相互作用の複雑な効果を示す。
私たちのモチベーションの一部は、量子エラー訂正コードに起因しています。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 21:32:45 GMT)
End-to-end entanglement of quantum network paths with multi-parameter states [0.0] 量子ネットワークにおける経路の終端絡みについて検討する。
平均的なエンドツーエンドの絡み合いのスケーリングの振る舞いは、その分布が平均に徐々に集中していることを明らかにする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 14:12:01 GMT)
EUR/USD Exchange Rate Forecasting incorporating Text Mining Based on Pre-trained Language Models and Deep Learning Methods [0.0] 本研究では,深層学習,テキスト解析,粒子群最適化(PSO)を統合したEUR/USD交換レート予測の新しい手法を提案する。
オンラインニュースや分析テキストを定性的データとして組み込むことにより,提案したPSO-LSTMモデルは従来のエコノメトリや機械学習モデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:39:10 GMT)
EUR-USD Exchange Rate Forecasting Based on Information Fusion with Large Language Models and Deep Learning Methods [0.0] 本稿では、ニュースや分析からの非構造化テキストデータを交換レートや財務指標に関する構造化データと統合する新しいフレームワークIUSを提案する。
次に、オプトゥーナ最適化Bi-LSTMモデルを用いて、EUR/USD交換レートを予測する。
実験の結果、提案手法はベンチマークモデルを上回る性能を示し、MAEを10.69%、RMSEを9.56%削減した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:57:32 GMT)
Dynamic Adaptive Rank Space Exploration for Efficient Sentiment Analysis with Large Language Models [0.0] 大規模言語モデル(LLM)は、ニュアンスド言語パターンをキャプチャすることで感情分析の分野に革命をもたらした。
LLMを用いた効率的な感情分析のための動的適応ランク空間探索(DARSE)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:44:48 GMT)
Dynamic Adaptive Optimization for Effective Sentiment Analysis Fine-Tuning on Large Language Models [0.0] 大規模言語モデル(LLM)は、マルチタスク学習を利用して特定のタスクを同時に処理することで、感情分析の一般的なパラダイムとなっている。
動的適応最適化(DAO)モジュールを用いた新しいマルチタスク学習フレームワークを提案する。
この研究は、平均二乗誤差(MSE)と精度(ACC)を、以前の研究と比べてそれぞれ15.58%、1.24%改善した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:13:14 GMT)
Dissipative Kondo physics in the Anderson Impurity Model with two-body losses [0.0] 我々は、相互作用する不純物がマルコフの散逸に露呈するアンダーソン不純物モデルの散逸版について研究する。
我々は,強いクーロン反発と相関散逸の相互作用が,近藤物理学の強固な署名をもたらすことを示した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:13:44 GMT)
Disentangled and Interpretable Multimodal Attention Fusion for Cancer Survival Prediction [0.0] 癌生存予測を改善するために,Distangled and Interpretable Multimodal Attention Fusion (DIMAF)を提案する。
DIMAFは、注意に基づく融合機構の中で、モダリティ内およびモダリティ間相互作用を分離し、異なるモダリティ固有およびモダリティ共有表現を学習する。
4つの公立がん生存データセットでDIMAFを評価し,約1.85%の成績,23.7%の解離率の相対的な改善を達成した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:35:13 GMT)
Dipoles and Anyonic Directional Confinement via Twisted Toric Codes [0.0] 修正された2Dトーリック符号は、ハミルトニアンが1つの空間方向に沿って明示的なエノン閉じ込めを示す。
システムサイズに依存する論理演算子を解析する。
我々は、サーフェスコードやXキューブモデルといった3Dモデルに構築を拡張します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:46:23 GMT)
Deterministic role of chemical bonding in the formation of altermagnetism: Reflection from correlated electron system NiS [0.0] 新たなコリニア磁気状態であるオルテルマグネティズムは、ここ数年で大きな注目を集めている。
我々は, 結晶化学結合の役割を探求し, 反磁性の形成を説明する。
我々は, AMSSの分割が最大となるNiAs型六角形結晶において, 12個のアンチノダル領域を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 06:32:15 GMT)
Detection of Personal Data in Structured Datasets Using a Large Language Model [0.0] 本稿では,GPT-4oを利用した構造化データセットの個人データ検出手法を提案する。
私たちは、Microsoft PresidioやCASSEDといった代替手法と比較して、それらを複数のデータセットで評価します。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:16:43 GMT)
Deep Hedging to Manage Tail Risk [0.0] 我々は凸リスク最小化のパラメータ化にディープニューラルネットワークを用いる。
1日99%のCVaR削減を実現した。
また、摩擦に敏感な戦略適応に関する実践的な洞察を与える。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:16:52 GMT)
Decoherence of Majorana qubits by 1/f noise [0.0] 1/fノイズは、Majorana qubit decoherenceの未探索メカニズムを生じることを示す。
1/fノイズの存在下での無秩序ナノワイヤの準粒子励起確率を計算した。
この機構は、現在開発されているMZM量子ビットのデコヒーレンス時間を1マイクロ秒未満に制限する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:08:21 GMT)
Decoding Machine Translationese in English-Chinese News: LLMs vs. NMTs [0.0] 本研究では,機械翻訳出力の言語特性である機械翻訳(MTese)について検討する。
4つのサブコーパスからなる大規模データセットを構築し、包括的な5層特徴集合を用いる。
ニューラルネットワーク翻訳システム(NMT)とLarge Language Models(LLM)におけるMTeseの存在が確認された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:45:37 GMT)
Daemonic ergotropy of Gaussian quantum states and the role of measurement-induced purification via general-dyne detection [0.0] 量子系において、ユニタリ演算によって抽出可能な最大作業はデーモンエルゴトロピーと呼ばれる。
単モードガウス状態の場合、エルゴトロピーは州のエネルギーと純度にのみ依存することを示す。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:02:14 GMT)
DRAGON (Differentiable Graph Execution) : A suite of Hardware Simulation and Optimization tools for Modern AI/Non-AI Workloads [0.0] DRAGONは、高速で説明可能なハードウェアシミュレーションと最適化ツールチェーンである。
ハードウェアアーキテクトはハードウェア設計をシミュレートし、ハードウェア設計を最適化してワークロードを効率的に実行することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 00:31:10 GMT)
DIVE: Deep-search Iterative Video Exploration A Technical Report for the CVRR Challenge at CVPR 2025 [0.0] 本稿では,2025年のコンプレックスビデオ推論・ロバストネス評価チャレンジにおいて,第1位を獲得した勝利のソリューションについて述べる。
CVRR-ES(Complex Video Reasoning and Robustness Evaluation Suite)ベンチマークを使用しており、11のカテゴリにまたがる214のユニークなビデオと2400の質問応答ペアで構成されている。
我々の手法であるDIVEは、各入力質問を意味的に分解し、ステップワイズ推論とプログレッシブ推論によって解決する反復推論手法を採用する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:05:12 GMT)
Correlated Mutations for Integer Programming [0.0] 本研究は、進化戦略(IESs)の基盤を確立することを目的としている。
IESはすでにIP処理に優れていますが、離散化や高度なパッチを連続演算子に適用することで実現しています。
整数決定変数の突然変異分布に着目した。
エントロピー関数を含むそれらの理論的性質を考察し、拡張性のある相関突然変異分布を生成する方法を提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:24:15 GMT)
Controllable Non-reciprocity in Multi-sphere Loaded Chiral Resonator [0.0] キャビティマグノニクスにおける制御可能な非相反性により、プログラム可能なアイソレータ、サーキュレータ、RFスイッチの開発が可能となり、性能が向上した。
開発は、より汎用的でスケーラブルな情報処理システムへの道を開くかもしれない。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:47:41 GMT)
Conserved Quantities in Linear and Nonlinear Quantum Search [0.0] 3つのアルゴリズムを調べることで、量子コンピューティングアルゴリズム、保存法則、および多体量子システムの分野を橋渡しする。
第1のアルゴリズムは線形量子ウォークを用い, 基本計算を適用し, アルゴリズムの成功確率が1。
第二のアルゴリズムは、実効的なハミルトニアン$H(t) = lambda|psi|2$を持つ非線形量子ウォークを用いており、これはボース=アインシュタイン凝縮を記述するグロス=ピタエフスキー方程式に現れる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 08:19:21 GMT)
Concomitant Entanglement and Control Criticality Driven by Collective Measurements [0.0] 本研究では、量子多体状態が測定と条件付きユニタリ演算によって制御される適応量子回路について検討する。
我々は、2つの遷移を共に駆動するためには、集合的測定によって媒介される長距離臨界性が不可欠であると推測する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:49:52 GMT)
Collective Reasoning Among LLMs: A Framework for Answer Validation Without Ground Truth [0.0] いくつかの先進的な大規模言語モデルが複雑で博士レベルの確率問題を生成・解き出す新しいアプローチを導入する。
本研究は, 多様なモデル間の合意が, アウトプットの信頼性を如何に示すかに焦点を当てる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 03:53:26 GMT)
Classifying Logical Gates in Quantum Codes via Cohomology Operations and Symmetry [0.0] 量子符号のための定数深さ回路によって実装されたフォールトトレラント論理ゲートを構築し,分類する。
LDPC符号におけるアドレナブルな論理ゲートと並列な論理ゲートの定式化について述べる。
副産物として、高いポントリャーギン力を用いた有限高次対称性の新しいトポロジカル反応を求める。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:01:13 GMT)
Characteristic solutions of the chain of Vlasov equations [0.0] 最初のヴラソフ方程式の解はシュル「オーディンガー方程式」の解によって得られる。
提案手法は時間依存量子システムの例に実装されている。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:46:27 GMT)
Certifying Macroscopic Quantum Mechanics via Hypothesis Testing with Finite Data [0.0] 位置測定に基づく古典力学と量子力学を区別する仮説テストフレームワークを提案する。
その結果, 確率比試験により, 所定の信頼度に達するために必要な測定値が指数関数的に低減されることが判明した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:24:37 GMT)
Certification of quantum correlations and DIQKD at arbitrary distances through routed Bell tests [0.0] 本研究では,一方に送信された粒子を源から近距離で測定できる経路付きベル実験の概念について検討する。
遠方のデバイスへのチャネルに任意の損失がある場合でも、絡み合った量子ビットのみを含む経路付きベル試験が量子相関を証明できることを証明した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:20:14 GMT)
Causal Decompositions of 1D Quantum Cellular Automata [0.0] 本稿では,因果分解の研究プログラムの進歩について述べる。
われわれは1次元量子セルオートマタ(1次元QCA)について検討した。
この分解は翻訳不変QCAとみなすことができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:36:50 GMT)
Can Peter Pan Survive MT? A Stylometric Study of LLMs, NMTs, and HTs in Children's Literature Translation [0.0] 7つのヒト翻訳(HT)、7つの大言語モデル翻訳(LLM)、7つのニューラルマシン翻訳出力(NMT)からなるピーターパンコーパスを構築する。
この分析には、語彙的、構文的可読性、n-gram特徴を含む一般的な特徴セットと、反復、リズム、翻訳性、雑多なレベルをキャプチャーする創造的テキスト翻訳(CTT特化)機能セットがあり、合計447の言語的特徴をもたらす。
その結果,HTsとMTsは結合語分布と1-word-gram-Yi比に有意な差があることが判明した。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:34:40 GMT)
Bridging the Gap Between Saliency Prediction and Image Quality Assessment [0.0] 深部神経モデルでは画像品質評価(IQA)が大幅に進歩している
我々はIQAとSaliency Predictionタスクの関係を明らかにする実証的研究を行った。
本稿では,サリエンシ対応圧縮画像の新たなSACIDデータセットを導入し,従来のIQA法とニューラルベースIQA法の大規模比較を行う。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:15:35 GMT)
Benchmarking Vision Language Models on German Factual Data [0.0] 本稿では,ドイツ語と英語の事実知識に基づくオープンウェイトVLMの分析を行う。
有名人や観光人にとって、VLMはドイツの画像コンテンツに対する視覚的認識が欠けているため、苦労している。
動物や植物にとって、テストされたモデルは、しばしば画像の内容を正しく識別するが、ドイツのランゲージでは失敗する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 10:17:13 GMT)
Atomic Dirac energy-level dynamics and redshift in the 4xU(1) gravity gauge field [0.0] 4xU(1)重力ゲージ場における水素様原子に対するディラック方程式を解く。
重力ゲージ場は、実験的に観測可能な重力赤方偏移と一致する量で原子ディラックエネルギー準位をシフトすることを示す。
我々の研究は、強い重力場における量子フォトニクス現象の研究の新たな可能性を開く。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 09:53:35 GMT)
Asymptotic Theory of Geometric and Adaptive $k$-Means Clustering [0.0] 我々は、ユークリッド空間における$k$-meansクラスタリングの一貫性に関するポラードの古典的な結果を再考する。
上に述べたすべてのクラスタリング手順が強く整合していることが示される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 23:01:38 GMT)
Anomalous geometric transport signatures of topological Euler class [0.0] 二次元マルチギャップ位相の半古典的輸送特性における量子幾何学的構造について検討する。
特に、非線形ホール様バルク電流応答と、従って、トポロジカルオイラー不変量の存在によって誘導される運動の半古典方程式について検討する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 18:14:24 GMT)
An Effective Two-Phase Genetic Algorithm for Solving the Resource Constrained Project Scheduling Problem (RCPSP) [0.0] 2PGAはGA親選択を2つのフェーズで実装する: フェーズ1は親プールにおける最良の電流解を含み、フェーズ2は親プールから最高の電流解を除外する。
2PGAはLIB PSPの標準ベンチマーク問題でテストされ、このアルゴリズムが有効であることが示され、いくつかの最良の解が改善された。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 04:59:48 GMT)
Agent-based modeling and the sociology of money: some suggestions for refining monetary theory using social simulation [0.0] 通貨制度は基礎的な社会機構と見なすことができ、地域社会は経済過程を定量化することができる。
本稿では、経済・社会学における貨幣の性質に関する影響力ある見解をレビューし、近年のエージェントベースモデル「貨幣の出現」の比較的限られた発見と対比する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 15:32:08 GMT)
A scanning resonator for probing quantum coherent devices [0.0] 量子コヒーレントデバイスを探索するための走査共振器の実装について報告する。
我々の走査装置は、オンチップ超伝導共振器を作製することなく、興味のあるシステムに調整可能なコヒーレントカップリングを可能にする。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:34:00 GMT)
A note on a classical dynamical system and its quantization [0.0] 系のハミルトニアンが量子化されると、パラメータ間の関係によって異なる挙動が生じることを示す。
この2つのケースはボソニックまたは擬ボソニック・ラグ作用素によって解析される。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 07:56:15 GMT)
A hierarchical Vovk-Azoury-Warmuth forecaster with discounting for online regression in RKHS [0.0] 再生ケルネルヒルベルト空間(RKHS)の時間変化関数列に対する制約のない二次的損失を伴うオンライン回帰問題について検討する。
そこで本研究では,ディスカウント係数とランダムな特徴数の両方を学習する完全適応型階層型アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 20:47:52 GMT)
A Plea for History and Philosophy of Statistics and Machine Learning [0.0] 歴史と統計哲学の統合は、これまで以上に緊急である。
人工知能の最近の成功は、主に機械学習によって推進されている。
ケーススタディは機械学習における哲学的な考え方であり、そのルーツは、しばしば過小評価される作品にまで遡ることができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 13:59:08 GMT)
A Novel Open Set Energy-based Flow Classifier for Network Intrusion Detection [0.0] ネットワーク侵入検知システム(NIDS)における単一クラスエネルギーフロー(EFC)アルゴリズムの適応性を提案する。
EFCは、既知の攻撃だけでなく、未知の攻撃も正しく分類し、時間的複雑さの低い単一の層を提示することで、文献と他の提案とは異なる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 17:08:28 GMT)
A Hierarchical Approach to Quantum Many-Body Systems in Structured Environments [0.0] 我々はBogoliubov-Born-Green-Kirkwood-Yvon階層を用いて、構造されたフォトニック浴およびフォニック浴に接触した多体系のオープンな記述を行う。
我々の研究は、凝縮物質と量子光学の間のアクセス可能で厳密な経路を確立し、新しい領域をその界面で成長させる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 16:04:08 GMT)
3Description: An Intuitive Human-AI Collaborative 3D Modeling Approach [0.0] 3Descriptionは、従来の3Dモデリングにおけるアクセシビリティとユーザビリティの課題に対処することを目的としている。
非専門的な個人が、言葉とジェスチャーの記述を使って3Dモデルを作成することができる。
論文参考訳(メタデータ) (Fri, 27 Jun 2025 01:33:46 GMT)