Generative AI for Autonomous Driving: Frontiers and Opportunities [145.6] この調査は、自律運転スタックにおけるGenAIの役割の包括的合成を提供する。
まず、VAE、GAN、拡散モデル、および大規模言語モデルを含む、現代の生成モデリングの原則とトレードオフを蒸留することから始めます。
我々は、合成データ一般化、エンドツーエンド駆動戦略、高忠実なデジタルツインシステム、スマートトランスポートネットワーク、具体化されたAIへのクロスドメイン転送など、実用的な応用を分類する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:59:20 GMT)
Visual Imitation Enables Contextual Humanoid Control [117.2] VIDEOMIMICは、日常の映像をマイニングし、人間と環境を共同で再構築する、リアルからシミュレート・トゥ・リアルなパイプラインである。
実際のヒューマノイドロボットにおけるパイプラインの結果を実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:48:41 GMT)
TUM2TWIN: Introducing the Large-Scale Multimodal Urban Digital Twin Benchmark Dataset [91.0] 都市デジタルツインズ(UDT)は、都市管理と多様なソースからの複雑な異種データの統合に欠かせないものとなっている。
これらの課題に対処するために、最初の総合的マルチモーダルなUrban Digital TwinベンチマークデータセットTUM2TWINを紹介する。
このデータセットには、地理的にセマンティックに整合した3Dモデルとネットワーク、およびさまざまな地球、モバイル、航空、衛星観測結果、約10,000ドル以上のデータサブセット、そして現在767GBのデータが含まれている。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:12:36 GMT)
2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining [86.8] 本稿では,VLM事前学習のための基礎知識を充実させた高品質な教科書コーパスについて紹介する。
2.5年以上の授業ビデオを集め、クラス時間は22,000時間である。
ビデオ中心の教科書は、それと比較すると、より一貫性のあるコンテキスト、より豊かな知識、より優れた画像テキストアライメントを提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:29:08 GMT)
Rydberg Atomic Quantum Receivers for Classical Wireless Communications and Sensing: Their Models and Performance [78.8] ライドバーグ原子量子受信機(Rydberg atomic quantum receivers, RAQRs)は、高周波(RF)信号の電界を検出するための卓越した溶液である。
本稿では,無線コミュニティに対して,エンドツーエンドの受信方式を提示することでRAQRを導入する。
次に,現実的な受信フローに依存する等価なベースバンド信号モデルを開発する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:03:05 GMT)
Rejoining fragmented ancient bamboo slips with physics-driven deep learning [77.2] WisePandaは物理駆動の深層学習フレームワークで、断片化した竹のスリップに再結合するよう設計されている。
破壊と材料劣化の物理に基づいて、WisePandaは自動的に合成トレーニングデータを生成する。
WisePandaを使った考古学者は、大幅な効率改善を経験している。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:16:53 GMT)
A Head to Predict and a Head to Question: Pre-trained Uncertainty Quantification Heads for Hallucination Detection in LLM Outputs [72.0] 大規模言語モデル(LLM)は幻覚、すなわち、散発的に偽情報や偽情報を生成する傾向を持つ。
不確実性定量化(UQ)は、モデル出力の信頼性を評価するためのフレームワークを提供する。
我々は、Mistral、Llama、Gemma 2など、人気のあるLLMシリーズ向けのUQヘッドのコレクションを事前訓練する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:30:26 GMT)
An Analytical Emotion Framework of Rumour Threads on Social Media [71.0] マルチアスペクト感情検出,反響スレッド,非反響スレッドを包括的に分析し,感情の相関分析と因果解析を行う。
我々の枠組みは、噂がよりネガティブな感情(例えば、怒り、恐怖、悲観主義)を引き起こすのに対して、非噂はよりポジティブな感情を引き起こすことを明らかにしている。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:37:48 GMT)
Enhanced Importance Sampling through Latent Space Exploration in Normalizing Flows [69.9] 重要サンプリングはモンテカルロシミュレーションで使われる稀な事象シミュレーション手法である。
正規化フローの潜在空間における提案分布を更新し,より効率的なサンプリング法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:04:45 GMT)
Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion [69.8] 我々はファストフード(FastFood)について紹介する。ファストフード(FastFood)は、908のファストフードカテゴリーに84,446のイメージを持つデータセットで、成分や栄養のアノテーションが特徴である。
栄養推定の精度を高めるために,新しいモデル非依存型ビジュアル・イングレディエント・フィーチャー・フュージョン (VIF$2$) 法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:01:21 GMT)
BAT: Benchmark for Auto-bidding Task [67.6] 本稿では,最も普及している2種類のオークション形式を含むオークションベンチマークを提案する。
我々は,新しいデータセットに基づいて,一連の堅牢なベースラインを実装した。
このベンチマークは、研究者や実践者が革新的なオートバイディングアルゴリズムを開発し、洗練するための、ユーザフレンドリで直感的なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:12:34 GMT)
Gaussian Shading++: Rethinking the Realistic Deployment Challenge of Performance-Lossless Image Watermark for Diffusion Models [66.5] 著作権保護と不適切なコンテンツ生成は、拡散モデルの実装に課題をもたらす。
本研究では,実世界の展開に適した拡散モデル透かし手法を提案する。
Gaussian Shading++はパフォーマンスのロスレス性を維持するだけでなく、ロバスト性の観点からも既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:36:12 GMT)
No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves [59.8] 自己表現アライメント(Self-Representation Alignment, SRA)は, 自己蒸留法により表現指導を得る単純な方法である。
実験結果から,SRAをDiTsおよびSiTsに適用すると一貫した性能向上が得られた。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:45:57 GMT)
PWC-MoE: Privacy-Aware Wireless Collaborative Mixture of Experts [59.5] クラウドサーバにホストされる大規模言語モデル(LLM)は、ローカルデバイス上の計算とストレージの負担を軽減するが、プライバシの懸念を高める。
小規模言語モデル(SLM)は、ローカルで実行されるためプライバシーが向上するが、複雑なタスクではパフォーマンスが制限される。
帯域幅制約下での計算コスト,性能,プライバシ保護のバランスをとるために,プライバシを意識したPWC-MoE(PWC-MoE)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:27:07 GMT)
CrashFixer: A crash resolution agent for the Linux kernel [58.2] この作業は、システムレベルのLinuxカーネルバグのベンチマークと、Linuxカーネルで実験を実行するプラットフォームを共有するkGymの上に構築されている。
CrashFixerはLinuxカーネルのバグに適応する最初のLCMベースのソフトウェア修復エージェントである。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:59:15 GMT)
OpenThinkIMG: Learning to Think with Images via Visual Tool Reinforcement Learning [57.9] OpenThinkIMGは、ツール拡張LVLMのための、最初のオープンソースで包括的なエンドツーエンドフレームワークです。
本稿では,LVLMを学習し,外部視覚ツールを起動するための適応的なポリシーを学ぶための,新しい強化学習フレームワークV-ToolRLを提案する。
V-ToolRLにより、LVLMは最適なツール利用戦略を自律的に発見できる。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:35:51 GMT)
CodePDE: An Inference Framework for LLM-driven PDE Solver Generation [57.2] 偏微分方程式(PDE)は物理系のモデリングの基本である。
従来の数値解法は専門家の知識に頼って実装し、計算コストがかかる。
大規模言語モデルを用いてPDEソルバを生成するための最初の推論フレームワークであるCodePDEを紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:58:08 GMT)
Online Learning and Unlearning [56.8] オンライングラデーション降下(OGD)に基づくオンライン学習者アンラーナー(OLU)アルゴリズムを2つ提示する。
第一の受動的OLUは、OGDの収縮特性を利用し、未学習時にノイズを注入し、追加の計算を行わない。
2つめのアクティブなOLUは、オフラインの未学習アルゴリズムを使用して、削除されたデータを除くソリューションにモデルをシフトする。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:33:36 GMT)
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? [55.9] 人間は、様々な情報源からの知識を統合することで、顕著な構成的推論を示す。
本稿では,このスキルを再現する上でのトランスフォーマーの可能性を検証するための合成学習タスクを提案する。
数発のChain-of-Thoughtプロンプトにより、TransformersはFTCT上でコンストラクショナル推論を行うことができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:04:47 GMT)
Preference Optimization for Combinatorial Optimization Problems [54.9] 強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:47:00 GMT)
InductionBench: LLMs Fail in the Simplest Complexity Class [53.7] 大規模言語モデル(LLM)は推論において顕著に改善されている。
帰納的推論(inductive reasoning)は、観測されたデータから基礎となるルールを推測するものであり、まだ探索されていない。
本稿では, LLMの帰納的推論能力を評価するための新しいベンチマークであるインジェクションベンチを紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:06:09 GMT)
IntrinsicEdit: Precise generative image manipulation in intrinsic space [53.4] そこで本研究では,固有画像空間で動作する汎用的生成ワークフローを提案する。
我々はアイデンティティの保存と内在チャネルの絡み合いの鍵となる課題に対処する。
我々は,グローバル照明効果の自動分解による高精度かつ効率的な編集を可能にする。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:24:15 GMT)
Model Steering: Learning with a Reference Model Improves Generalization Bounds and Scaling Laws [52.1] 本稿では,戦略データの選択や重み付けを通じて,対象モデルのトレーニングを指導・強化するための基準として,訓練モデルを用いた新たな学習パラダイムを定式化する。
提案手法は,参照モデルを持たないトレーニングと比較して,一般化とデータの効率性を改善する理由に関する理論的知見を提供する。
これらの知見に基づいて,DRRho-CLIPと呼ばれる参照モデルを用いたコントラスト言語-画像事前学習手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:01:05 GMT)
LaDi-WM: A Latent Diffusion-based World Model for Predictive Manipulation [51.8] 拡散モデルを用いて将来の状態の潜伏空間を予測する世界モデルLaDi-WMを提案する。
LIBERO-LONGベンチマークでは,LaDi-WMが27.9%,現実シナリオでは20%,政策性能が著しく向上することを示した。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:42:14 GMT)
SMI: An Information-Theoretic Metric for Predicting Model Knowledge Solely from Pre-Training Signals [51.6] 我々は、モデルの内部知識を示す重要な下流タスクであるクローズドブック質問応答(QA)の性能を予測することを目指している。
我々は、21の公開言語と3つのカスタムトレーニングされた大規模言語モデルの事前学習コーパスに対して、大規模な検索と意味解析を行う。
これらの基礎の上に構築されたSMI(Size-dependent Mutual Information)は,事前学習データの特徴,モデルサイズ,QAの精度を線形に相関する情報理論の指標である。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:19:37 GMT)
STORYANCHORS: Generating Consistent Multi-Scene Story Frames for Long-Form Narratives [50.6] 本稿では,高品質でマルチシーンなストーリーフレームを生成するための統合フレームワークであるStoryAnchorsを紹介する。
StoryAnchorsは、時間的一貫性を確保するために、過去と将来の両方のコンテキストを統合する双方向のストーリージェネレータを使用している。
また、マルチイベントストーリーフレームラベリングとプログレッシブストーリーフレームトレーニングを統合し、モデルが包括的な物語の流れとイベントレベルのダイナミクスの両方をキャプチャできるようにする。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:48:10 GMT)
Vision-Language Models Do Not Understand Negation [50.3] NegBenchは18のタスクバリエーションと79ドルのサンプルに対する否定的理解を評価するために設計されたベンチマークである。
提案手法は, 否定的クエリに対するリコールが10%増加し, 否定的キャプションを用いた複数質問に対する精度が28%向上することを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:30:11 GMT)
Weak coupling limit for quantum systems with unbounded weakly commuting system operators [50.2] この研究は、電磁場と相互作用するオープン無限次元量子系の縮小力学や、フェルミ粒子やボース粒子によって形成される貯水池に対する弱結合限界(WCL)の厳密な解析に費やされている。
我々は,貯水池の多点相関関数の項が WCL においてゼロでないことを条件として,貯水池統計の弱い結合限界を導出する。
得られた還元系力学が、元のハミルトニアンへのラムシフトと解釈できる修正されたハミルトニアンを持つユニタリ力学に収束することを証明する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:32:34 GMT)
Efficient and Scalable Neural Symbolic Search for Knowledge Graph Complex Query Answering [50.2] 複雑なクエリに対する効率的でスケーラブルなシンボル検索フレームワークを提案する。
我々のフレームワークは、ほぼ同じ性能を維持しながら、シンボリックメソッドの計算負荷を90%削減する。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:24:09 GMT)
AI-accelerated Discovery of Altermagnetic Materials [48.3] 新たな磁気相であるオルテルマグネティズムは、強磁性と反強磁性とを区別して理論的に提案され、実験的に検証されている。
本稿では,AI検索エンジンによる自動発見手法を提案する。
金属、半導体、絶縁体をカバーする新しい50の磁気材料を発見しました。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:00:39 GMT)
Learning to Be Cautious [47.9] 自律システムが直面する可能性のあるあらゆる状況や、どんな行動が悪い結果を避けるのが最善かを予測することは不可能である。
現在のアプローチでは、通常、タスク固有の安全情報や明示的な慎重な振る舞いをシステムに組み込む。
注意深い行動がますます不要になるタスクのシーケンスと、システムが注意深いことを学習できることを実証するアルゴリズムを提示する。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:20:19 GMT)
Scaling Laws for Floating Point Quantization Training [47.2] 本稿では、FP量子化目標、指数ビット、マティーサビットの影響と、LLMモデルのFP量子化訓練性能におけるスケーリング係数の計算について検討する。
ハードウェアメーカーが将来参照できるビット数に対して最適な指数-行列ビット比を提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:19:32 GMT)
No Preference Left Behind: Group Distributional Preference Optimization [47.0] Group Distributional Preference Optimization (GDPO) は、言語モデルをグループ内の好みの分布と整合させる新しいフレームワークである。
GDPOは、グループの信念分布の統計的推定を用いて言語モデルを校正する。
GDPOはトレーニング中にこのアライメントギャップを一貫して削減します。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:06:47 GMT)
Query-driven Document-level Scientific Evidence Extraction from Biomedical Studies [46.3] 本研究は,臨床問題に対する文書レベルの科学的根拠抽出の課題に焦点をあてる。
このタスクをサポートするために、CochraneForestというデータセットを作成します。
202の注釈付き森林プロット、関連する臨床研究の質問、研究の全文、研究固有の結論からなる。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:50:45 GMT)
Controlled measurement, Hermitian conjugation and normalization in matrix-manipulation algorithms [46.1] 本稿では,小アクセス確率を所望のアシラ状態に限定する制御計測の概念を提案する。
複素行列の実部と虚部の分離符号化は、エルミート共役を行列操作のリストに含めることができる。
純粋量子状態の正規化条件によって必然的に課される行列要素の絶対値の制約を弱める。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:41:03 GMT)
Localization of Impacts on Thin-Walled Structures by Recurrent Neural Networks: End-to-end Learning from Real-World Data [46.0] 薄肉構造への影響は、圧電センサで測定できるラム波を励起する。
本稿では,ニューラルネットワークを用いた影響の局所化について検討する。
その結果,比較的小さなデータセットであっても,衝撃位置の推定精度は著しく向上した。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:08:47 GMT)
Extending Large Vision-Language Model for Diverse Interactive Tasks in Autonomous Driving [45.8] DriveMonkeyは、大きなビジュアル言語モデルと空間プロセッサをシームレスに統合するフレームワークである。
我々の実験によると、DriveMonkeyは一般的なLVLMよりも優れており、特に3D視覚グラウンドタスクにおいて9.86%の顕著な改善が達成されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:36:51 GMT)
Bridging LLMs and KGs without Fine-Tuning: Intermediate Probing Meets Subgraph-Aware Entity Descriptions [45.8] 大きな言語モデル(LLM)は、強力なコンテキストモデリングによって大きなコーパスから広範な知識を学ぶ。
我々は、LLMの中間層を刺激するためにプロンプトを利用することで、コンテキスト対応の知識三重項の隠蔽状態を捉える。
次に、これらの隠れ状態にデータ効率の分類器をトレーニングし、KGCにおける凍結LDMの本質的な機能を利用する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:09:08 GMT)
Exploiting Text Semantics for Few and Zero Shot Node Classification on Text-attributed Graph [45.6] テキスト分散グラフ(TAG)は、各グラフノードにテキスト記述を提供する。
テキストセマンティックス拡張(TSA)を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:06:08 GMT)
CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image [44.8] 現在のメソッドはドメイン固有の制限や低品質のオブジェクト生成に悩まされることが多い。
本稿では,3次元シーンの復元と復元のための新しい手法であるCASTを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:47:06 GMT)
A Comparative Study of Human Activity Recognition: Motion, Tactile, and multi-modal Approaches [44.0] 本研究は、視覚に基づく触覚センサが15のアクティビティを分類する能力を評価する。
触覚とモーションデータを組み合わせたマルチモーダル・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:20:21 GMT)
Visual Watermarking in the Era of Diffusion Models: Advances and Challenges [43.7] 拡散モデルに関連する透かし技術の長所と長所を解析する。
我々は、進化する偽りの脅威に対して、透かしの堅牢性を維持するための談話を進めることを目的としている。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:14:18 GMT)
Removing Watermarks with Partial Regeneration using Semantic Information [43.5] SemanticRegenは3段階のラベルのない攻撃で、最先端のセマンティックスと目に見えない透かしを消去する。
4つの透かしシステムで1000のプロンプトを評価しました
結果は、現在の透かし防御と適応的セマンティクスを意識した敵の能力の急激なギャップを浮き彫りにする。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:25:06 GMT)
Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models [43.5] 大規模言語モデル(LLM)のプルーニングは、性能を保ちながら、モデルのサイズと計算の複雑さを減らすための有望なソリューションである。
LLMのためのShapley Value-based Non-Uniform Pruning (SV-NUP)法を提案する。
このアプローチは,各トランス層がモデル全体の性能に与える影響を定量的に評価し,各層に最適化されたプルーニング予算を割り当てることで,臨界パラメータを維持できる。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:13:57 GMT)
Neural BRDF Importance Sampling by Reparameterization [43.5] 本稿では、リパラメータ化に基づくニューラルBRDF重要サンプリングの定式化を提案する。
BRDFサンプルを正確に生成した標準的なレンダリングパイプラインにシームレスに統合する。
提案手法は,高い推論速度を維持しながら,ニューラルBRDFレンダリングの最良の分散化を実現する。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:23:55 GMT)
A Social Robot with Inner Speech for Dietary Guidance [42.9] 人間では、内部の音声構造はプロセスと意思決定を思考する。
ロボット工学では、推論を明確にすることで説明可能性を向上させる。
食事のアドバイスを提供するソーシャルロボットを開発した。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:26:52 GMT)
Sample-Efficient Reinforcement Learning of Koopman eNMPC [42.7] 強化学習は、データ駆動(経済)非線形モデル予測コントローラ((e)NMPC)を、特定の制御タスクにおける最適な性能に調整するために使用することができる。
モデルに基づくRLアルゴリズムと、Koopman (e)NMPCを自動微分可能なポリシーに変換する方法を組み合わせる。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:16:06 GMT)
On the Impact of Uncertainty and Calibration on Likelihood-Ratio Membership Inference Attacks [42.2] 我々は,情報理論の枠組みにおける可能性比攻撃(LiRA)の性能を解析する。
我々は、MIAの有効性に対する不確実性と校正の影響についての洞察を提供することを目的として、MIA敵の利点に基づいて境界を導出する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:38:09 GMT)
Leveraging AI for Productive and Trustworthy HPC Software: Challenges and Research Directions [41.2] 我々は、最先端のAI技術を活用して、独特でニッチなソフトウェアを開発する際の課題について議論する。
ElloraとDurbanの2つの米国エネルギー省が支援する、AIによるHPCソフトウェア推進プロジェクト(ElloraとDurban)で、私たちの研究の方向性を概説する。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:12:45 GMT)
Structural-Temporal Coupling Anomaly Detection with Dynamic Graph Transformer [41.2] 動的グラフトランスモデルを用いた構造・時間結合異常検出アーキテクチャを提案する。
具体的には、2つの統合レベルから構造的特徴と時間的特徴を導入し、異常を意識したグラフの進化パターンを提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:10:41 GMT)
FauForensics: Boosting Audio-Visual Deepfake Detection with Facial Action Units [40.9] 本稿では,オーディオ・ビジュアル・ディープフェイク検出のためのFauForensicsという新しいフレームワークを提案する。
本手法は, フレーム単位の音響視覚的類似性を, 専用の融合モジュールを用いて計算する。
FakeAVCelebとLAV-DFの実験では、最先端(SOTA)性能と、平均4.83%のクロスデータセットの一般化性が示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:18:07 GMT)
ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning [40.7] マルチコンセプトビデオカスタマイズ(MCVC)は依然として大きな課題である。
本稿では,ID分離問題に効果的に対処する新しいフレームワークであるConceptMasterを紹介する。
ビデオのカスタマイズタスクでは,ConceptMasterが従来よりも大幅に優れていたことが示される。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:42:52 GMT)
Graph state extraction from two-dimensional cluster states [39.6] グラフ状態操作ツールを導入し、局所的な次数を増やし、サブグラフをマージする。
本稿では,複数のエッジを回避してオーバヘッドを最小化する方法を示し,計測に基づく量子計算とトランスポートを併用した局所的な操作戦略と比較する。
これらのスキームは、絡み合いベースの量子ネットワーク、センサーネットワーク、分散量子コンピューティング全般に直接的な応用がある。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:49:54 GMT)
The Truth Becomes Clearer Through Debate! Multi-Agent Systems with Large Language Models Unmask Fake News [39.3] TruEDebate(TED)は、ソーシャルネットワーク上で偽ニュースを検出する新しいマルチエージェントシステムである。
TEDは形式的な議論設定に触発された厳格な議論プロセスを採用している。
DebateFlow Agentsはエージェントを2つのチームに編成する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:03:20 GMT)
TiMo: Spatiotemporal Foundation Model for Satellite Image Time Series [39.2] TiMoは、SITS分析に適した新しい階層型視覚トランスフォーマー基盤モデルである。
その中核となるのは、時間と空間の両方にわたるマルチスケールパターンを動的にキャプチャする時間的注意機構の導入である。
森林破壊モニタリングを含む複数の時間的タスクにわたる広範囲な実験-TiMoの最先端手法に対する優位性を実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:35:11 GMT)
Fast Text-to-Audio Generation with Adversarial Post-Training [39.0] テキストとオーディオのシステムは推論時に遅いため、多くのクリエイティブなアプリケーションではレイテンシが実用的ではない。
本稿では, 蒸留法をベースとしない拡散流モデルに対する最初の逆数加速アルゴリズムである, ARC(Adversarial Relativistic-Contrastive Re-trainstive Re-training)について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:25:47 GMT)
Principled Data Selection for Alignment: The Hidden Risks of Difficult Examples [38.8] 選好データは難易度が異なり、過度に難しい例が整列を妨げていることを示す。
Selective DPOを導入し、過度に難しい例をフィルタする。
この簡単な調整により、AlpacaEval 2ベンチマークでのアライメント性能は9-16%向上する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:54:09 GMT)
SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding [38.4] SeriesBenchは、105の慎重にキュレートされた物語駆動のシリーズからなるベンチマークである。
本稿では,新しい長文物語アノテーション手法とフルインフォーム・トランスフォーメーション・アプローチを提案する。
シリーズ内のプロット構造とキャラクタ関係を詳細に分析するためのモデルキャパシティをさらに向上するために,新しい物語推論フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:06:19 GMT)
Enhancing Aerial Combat Tactics through Hierarchical Multi-Agent Reinforcement Learning [38.2] 本研究は,模擬空戦シナリオを解析するための階層型多エージェント強化学習フレームワークを提案する。
目的は、予め設定されたシミュレーションでミッションの成功につながる効果的な行動コースを特定することである。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:13:48 GMT)
Codifying Character Logic in Role-Playing [37.9] 本稿では,行動決定のための文字論理を構造化し実行可能な関数として表現する,ロールプレイングのための符号化プロファイルを提案する。
本実験は, 持続性, 積極性, 行動多様性を向上する上で, 有意な有益性を示すものである。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:16:35 GMT)
Towards Anytime Optical Flow Estimation with Event Cameras [37.9] イベントカメラはミリ秒レベルでの対数輝度の変化に反応し、光フロー推定に最適である。
既存のイベントカメラからのデータセットは、光学フローに対して低フレームレートの地上真実を提供するのみである。
本研究では,高フレームレートのイベント光流を生成するEVent-based Anytime Flow推定ネットワークであるEVA-Flowを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:00:41 GMT)
Quantum dynamics in frustrated Ising fullerenes [37.9] 本研究は、古典的磁気配置の退化基底状態多様体を持ち上げる量子揺らぎを実験的に実証する。
超伝導量子アニールの世代間における顕著な性能向上が観察された。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:12:11 GMT)
An Analysis of Data Transformation Effects on Segment Anything 2 [37.8] ビデオオブジェクトセグメンテーション(VOS)は,映像認識と理解の発達において重要な課題である。
Meta AIがリリースしたSegment-Anything Model 2 (SAM2)は、エンドツーエンドVOSの最先端アーキテクチャである。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:36:07 GMT)
Web2Grasp: Learning Functional Grasps from Web Images of Hand-Object Interactions [37.3] 器用な多指ロボットの手を使って物体を効果的に操るためには,機能的把握が不可欠である。
自然と機能的なオブジェクトの相互作用を描写するため,Web画像から人間の把握情報を抽出する手法を提案する。
安価なWebソースから得られた比較的低品質なHOIデータは、機能的把握モデルを効果的に訓練できることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:34:19 GMT)
PrePrompt: Predictive prompting for class incremental learning [37.1] 事前学習モデルに基づくクラスインクリメンタルラーニング(CIL)は,オープンワールドの継続的ラーニングに有望な方向性を提供する。
本稿では,事前学習したモデルの自然な分類能力を活用し,タスク固有のプロンプトを予測することによって,相関に基づく制約を回避する新しいCILフレームワークであるPrepromptを提案する。
複数のベンチマークの実験は、PrePromptが最先端のプロンプトベースのCILメソッドよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:57:56 GMT)
Parameter-Efficient Fine-Tuning of Vision Foundation Model for Forest Floor Segmentation from UAV Imagery [37.0] 我々は視覚基盤モデルを用いて,樹木の切り株,植生,樹木の破片などの林床オブジェクトを分割する。
我々はパラメータ効率の細かい微調整(PEFT)を用いて、追加のモデルパラメータの小さなサブセットを微調整する。
その結果,アダプタを用いたPEFT法は,結合よりも高い平均交叉を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:59:29 GMT)
Do You Trust Your Model? Emerging Malware Threats in the Deep Learning Ecosystem [36.3] ニューラルネットワークに自己抽出型自己実行型マルウェアを組み込むテクニックであるMaleficNet 2.0を紹介する。
MaleficNet 2.0インジェクションテクニックはステルス性があり、モデルのパフォーマンスを低下させることなく、除去テクニックに対して堅牢である。
我々は、MaleficNet 2.0を用いた概念実証型自己抽出ニューラルネットワークマルウェアを実装し、広く採用されている機械学習フレームワークに対する攻撃の実用性を実証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:56:20 GMT)
Runtime Quantum Advantage with Digital Quantum Optimization [36.1] IBMの156量子ビットデバイス上でのバイアスフィールドデジタル化された反断熱量子最適化(BF-DCQO)アルゴリズム。
古典的手法では困難であり,マルチコアプロセッサでも数分で実行可能である問題インスタンスを選択するのが適当である。
以上の結果から,特定目的量子アルゴリズムと組み合わせて利用可能なデジタル量子プロセッサは,量子誤り訂正がなくても,実行時量子優位性を示すことがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:24:17 GMT)
From Seeing to Doing: Bridging Reasoning and Decision for Robotic Manipulation [35.8] FSD(From Seeing to Doing)は空間関係推論により中間表現を生成する新しい視覚言語モデルである。
提案手法は,空間座標を視覚信号と整列する自己整合性機構と,階層的なデータパイプラインを併用する。
我々は、FSDがSimplerEnvで54.1%の成功率、実世界の8つのタスクで72%の成功率を達成したことを示し、最強のベースラインを30%上回った。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:20:46 GMT)
FAD: Frequency Adaptation and Diversion for Cross-domain Few-shot Learning [35.4] ドメイン間数ショット学習では、大きな分散シフトの下で限定ラベル付きサンプルからモデルを一般化する必要がある。
本稿では、スペクトル成分を明示的にモデル化・変調する周波数対応フレームワークである周波数適応・変換(FAD)を紹介する。
FADは、目に見えないドメインと見えないドメインの両方において、最先端のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:48:06 GMT)
DiTPainter: Efficient Video Inpainting with Diffusion Transformers [35.2] Diffusion Transformer (DiT) を用いたエンド・ツー・エンドの映像インペイントモデル DiTPainter を提案する。
DiTPainterは、ビデオインペイント用に設計された効率的なトランスフォーマーネットワークを使用しており、大きな事前訓練されたモデルから初期化するのではなく、スクラッチからトレーニングされている。
実験により、DiTPainterは、高品質で時空間整合性の良い既存のビデオ塗装アルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:07:54 GMT)
UVTM: Universal Vehicle Trajectory Modeling with ST Feature Domain Generation [34.9] 普遍的な車両軌道モデルは異なるタスクに適用でき、複数の専門モデルを維持する必要がなくなる。
過度な再訓練を伴わずに様々なタスクに効果的に適応できるユニバーサル車両軌道モデル(UVTM)を提案する。
UVTMは、細かな特徴不完全軌跡から密度の高い特徴完全軌跡を再構築することで事前訓練される。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:16:03 GMT)
Rethinking Latent Redundancy in Behavior Cloning: An Information Bottleneck Approach for Robot Manipulation [34.5] 行動クローニング(BC)は、ロボット操作において広く採用されている視覚模倣学習手法である。
我々は,潜在表現における冗長性を定量化し緩和するために相互情報を導入する。
本研究は, 様々な方法, バックボーン, 実験環境における潜在表現の冗長性に関する最初の包括的研究である。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:02:42 GMT)
Rapid Overfitting of Multi-Pass Stochastic Gradient Descent in Stochastic Convex Optimization [34.5] 基本凸最適化(SCO)モデルにおけるマルチパス勾配勾配勾配(SGD)のアウトオブサンプル性能について検討した。
SCOの非平滑なケースでは、SGDのごく一部のエポックが既にそのアウト・オブ・サンプルを著しく損なっており、オーバーフィッティングにつながることが示されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:32:48 GMT)
Is Centralized Training with Decentralized Execution Framework Centralized Enough for MARL? [34.0] 分散実行によるトレーニングは、協調的マルチエージェント強化学習のための一般的なフレームワークである。
マルチエージェント強化学習のためのCADP(Advising and Decentralized Pruning)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:06:37 GMT)
Where the Devil Hides: Deepfake Detectors Can No Longer Be Trusted [33.6] ディープフェイク検出器は一般的にディープニューラルネットワーク(DNN)上で開発され、サードパーティのデータセットを使用してトレーニングされる。
サードパーティプロバイダは、これらのトリガーを悪意のあるユーザに配布または販売することで、検出性能を操作し、説明責任を逃れることができる。
本稿では、この危険性を深く調査し、ディープフェイク検出器に密かに感染する解決策について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:09:34 GMT)
MoKD: Multi-Task Optimization for Knowledge Distillation [33.4] 知識蒸留(KD)における2つの重要な課題は、教師の指導と課題目標からの学習のバランスである。
知識蒸留のためのマルチタスク最適化(MoKD)を提案する。
MoKDはKDを多目的最適化問題として再定義し、目的物間のバランスを改善する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:13:39 GMT)
Large Language Models for Computer-Aided Design: A Survey [33.4] 大規模言語モデル(LLM)は近年急速に進歩している。
現代のデザインの複雑さが増すにつれ、LCMがコンピュータ支援設計(CAD)を効率化し、効率化する可能性が高まっている。
本稿では,LLMとCADの交点を探索する最初の体系的な調査について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:19:04 GMT)
Multi-step manipulation task and motion planning guided by video demonstration [33.0] この研究は、ロボット工学における複雑な多段階のタスク・アンド・モーション計画タスクを解決するために、指導ビデオを活用することを目的としている。
本稿では,RRT(Rapidly-Exploring Random Tree)プランナの拡張について提案する。
我々は,Franka Emika PandaやKUKA KMR iiwaなどのロボットに対して,計画アルゴリズムの有効性を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:27:16 GMT)
GRID: Protecting Training Graph from Link Stealing Attacks on GNN Models [32.5] グラフニューラルネットワーク(GNN)は、グラフ構造化データ上の様々な分類タスクにおいて優れた性能を示した。
リンク盗難攻撃は、GNNモデルで使用されるトレーニンググラフに深刻なセキュリティとプライバシの脅威をもたらす。
本稿では,リンク盗難攻撃を防止すべく,GRID(Graph Link Disguise)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:32:32 GMT)
TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation [32.4] VLA(Vision-Language-Action)モデルは、エンド・ツー・エンドの学習プロセスを通じて、視覚運動制御と命令理解において顕著な可能性を示している。
現在のVLAモデルは、推論中に遅くなり、大量のロボットデータに対して広範な事前トレーニングを必要としているため、重大な課題に直面している。
既存のVLAモデルに対して2つのアドバンテージを提供する,TinyVLAと呼ばれる,コンパクトな視覚言語アクションモデルを導入した。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:02:20 GMT)
FANeRV: Frequency Separation and Augmentation based Neural Representation for Video [32.4] ビデオのための周波数分離と拡張に基づくニューラル表現(FANeRV)を提案する。
FANeRVは離散ウェーブレット変換を用いて入力フレームを高周波数成分と低周波数成分に明示的に分離する。
特別に設計されたゲートネットワークは、これらの周波数成分を効果的に融合して最適な再構成を行う。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:42:01 GMT)
Task-level Distributionally Robust Optimization for Large Language Model-based Dense Retrieval [32.1] 本稿では,大規模言語モデルに基づくDense Retrievalファインタニングのためのタスクレベル分散ロバスト最適化(tDRO)を提案する。
tDROはドメインの重みをパラメータ化し、拡張されたドメイン勾配で更新する。
実験では、大規模検索ベンチマークの最適改善と、最大30%のデータセット使用率の削減が示されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:08:02 GMT)
HarmoniCa: Harmonizing Training and Inference for Better Feature Caching in Diffusion Transformer Acceleration [32.0] 我々はHarmoniCaと呼ばれる新しい学習ベースのキャッシュフレームワークを開発した。
SDT(Step-Wise Denoising Training)を取り入れて、Denoisingプロセスの継続性を保証する。
私たちのフレームワークは40%以上のレイテンシ削減(理論的スピードアップ)とPixArt-$alpha$のパフォーマンス向上を実現しています。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:43:47 GMT)
AC-Reason: Towards Theory-Guided Actual Causality Reasoning with Large Language Models [31.9] 本稿では,ACシナリオ内の因果関係事象を識別する半形式推論フレームワークであるAC-Reasonを提案する。
AC-Reasonは、それらの公式因果係数の値を推論し、理論誘導アルゴリズムを通じてACクエリに説明とともに答える。
我々は,Big-Bench Hard Causal Judgment (BBH-CJ)をベースとした新たなベンチマークであるAC-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:02:33 GMT)
Energy-Efficient Pseudo-Ratchet for Brownian Computers through One-Dimensional Quantum Brownian Motion [30.8] 1次元(1次元)量子ブラウン運動に基づく新しいアプローチを導入する。
1次元系の量子共鳴効果を利用して、粒子の運動量空間を部分空間に分割する。
本研究では,この擬似ラチェット機構を,エントロピー的な視点から解析する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:20:07 GMT)
DPR: Diffusion Preference-based Reward for Offline Reinforcement Learning [30.7] 拡散選好に基づく報酬獲得法(DPR)を提案する。
DPRは拡散モデルを用いて状態-作用対の選好分布を直接モデル化し、これらの分布から報酬を識別することができる。
本手法を既存のオフライン強化学習アルゴリズムに適用し,拡散型報酬獲得手法が従来法およびトランスフォーマー法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:05:27 GMT)
Accelerated Stochastic Min-Max Optimization Based on Bias-corrected Momentum [30.0] 1次アルゴリズムは、$varepsilon-stationary pointを見つけるのに少なくとも$mathcalO(varepsilonepsilon-4)$ complexityを必要とする。
本稿では,高効率な変動複雑性を生かした新しい運動量アルゴリズムを提案する。
本手法の有効性は実世界のデータセットを用いてロジスティック回帰を用いて検証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:28:36 GMT)
Prototype Augmented Hypernetworks for Continual Learning [29.9] 連続学習(CL)は、先行知識を忘れずに一連のタスクを学習することを目的としているが、新しいタスクの更新は、しばしば以前に学んだ重みを上書きし、破滅的な忘れ(CF)を引き起こす。
本稿では,学習可能なタスクプロトタイプを前提とした単一ハイパーネットワークフレームワークであるPrototype-Augmented Hypernetworks (PAH)を提案する。
我々は,PAHが最先端性能を達成し,試料や頭部を保存せずに,それぞれ1.7%,4.4%の精度で74.5%,63.7%の精度を達成できることを実証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:08:25 GMT)
VCRBench: Exploring Long-form Causal Reasoning Capabilities of Large Video Language Models [29.7] ビデオベース長周期因果推論(VCRBench)という新しいベンチマークを導入する。
VCRBenchは、LVLM(Large Video Language Model)が特定の目標を達成するために必要なイベントを特定し、推論し、正しくシーケンスできるかどうかをテストする。
本稿では,ビデオに基づく因果推論を,ビデオ認識と因果推論の2つのサブタスクに分割するモジュラーアプローチである認識推論分解(RRD)を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:35:58 GMT)
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation [29.6] HoloTimeは、ビデオ拡散モデルを統合して、単一のプロンプトまたは参照イメージからパノラマビデオを生成するフレームワークである。
360Worldデータセットは、下流の4Dシーン再構築タスクに適したパノラマビデオの包括的なコレクションである。
パノラマアニメーションは、パノラマ画像を高品質のパノラマビデオに変換する2段階のイメージ・ツー・ビデオ拡散モデルである。
パノラマ空間時間再構成は、空間時間深度推定法を用いて、生成されたパノラマ映像を4次元の点雲に変換する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:04:40 GMT)
Benchmarking Multimodal Mathematical Reasoning with Explicit Visual Dependency [29.3] 視覚的依存を明示するマルチモーダル数学的推論のためのベンチマークであるVCBENCHを紹介する。
VCBENCHには6つの認知領域に1,720の問題がある。
我々は、VCBENCH上で26の最先端LVLMを評価し、高い性能差を示し、トップモデルでさえ50%以上の精度を達成できなかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:32:02 GMT)
Ultra Lowrate Image Compression with Semantic Residual Coding and Compression-aware Diffusion [28.6] ResULICは残留誘導型超低レート画像圧縮システムである。
残差信号は意味検索と拡散に基づく生成プロセスの両方に組み込む。
最先端拡散法に比べて客観的・主観的性能に優れる。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:51:23 GMT)
Controllable Image Colorization with Instance-aware Texts and Masks [28.3] 現在の主流の画像カラー化モデルは、カラー出血やカラーバインディングエラーといった問題に直面している。
利用指導による高精度なインスタンス認識カラー化を実現するために,拡散型カラー化手法MT-Colorを提案する。
我々は、既存の画像データセット上で大きな視覚言語モデルを活用することで、インスタンスレベルのカラー化タスクであるGPTカラーのための特別なデータセットを作成しました。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:13:06 GMT)
EMPERROR: A Flexible Generative Perception Error Model for Probing Self-Driving Planners [27.8] 本稿では, EMPERRORを提案する。
我々は、現在の検出器を以前の研究よりも忠実に模倣していることを示します。
現実的な入力を生成し、プランナーの衝突率を最大85%向上させることができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:30:04 GMT)
On the Geometry of Semantics in Next-token Prediction [27.3] 現代の言語モデルは、次世代の予測によってのみ訓練されているにもかかわらず、言語的な意味を捉えている。
本研究では,この概念的にシンプルな学習目標が,潜在意味概念と文法概念を抽出し,符号化するモデルにどのように寄与するかを検討する。
我々の研究は、分布意味論、神経崩壊幾何学、ニューラルネットワークトレーニングのダイナミクスを橋渡しし、NTPの暗黙のバイアスがどのように言語モデルにおける意味表現の出現を形作るかについての洞察を提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:46:04 GMT)
GradMix: Gradient-based Selective Mixup for Robust Data Augmentation in Class-Incremental Learning [27.2] クラス増分学習における破滅的な忘れを軽減するための,堅牢なデータ拡張手法であるGradMixを提案する。
各種実データを用いた実験により,GradMixは過去の知識の忘れを最小化することにより,データ拡張ベースラインを精度良く上回ることを示した。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:01:38 GMT)
Enhancing Scene Coordinate Regression with Efficient Keypoint Detection and Sequential Information [26.9] 本稿では,SCR(Scene Coordinate Regression)システムを提案する。
既存のSCR手法と比較して,シーンエンコーディングと有能なキーポイント検出の両方に統一的なアーキテクチャを提案する。
室内および屋外のデータセットにまたがる総合的な実験により、提案システムは最先端(SOTA)SCR法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:08:50 GMT)
Judging the Judges: Can Large Vision-Language Models Fairly Evaluate Chart Comprehension and Reasoning? [26.9] 13個のオープンソースのLVLMを多彩なチャート理解および推論タスクの判断として評価した。
我々は、事実の正しさ、情報性、関連性といった基準を網羅した、ペアワイズかつポイントワイズな評価タスクを設計する。
我々は、研究開発と商業利用の両方に適した費用対効果のLVLMに焦点を当てる。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:50:08 GMT)
Towards Autonomous UAV Visual Object Search in City Space: Benchmark and Agentic Methodology [26.9] 都市オブジェクトの自律検索のための最初のベンチマークデータセットであるCityAVOSを紹介する。
このデータセットは、6つのオブジェクトカテゴリにまたがる2,420のタスクで構成され、難易度は様々である。
また,人間の3層認知を模倣したマルチモーダルな大規模言語モデル(MLLM)を用いたエージェント手法であるRPPSearcherを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:34:54 GMT)
InfoPO: On Mutual Information Maximization for Large Language Model Alignment [26.7] 人選好データを用いた大規模言語モデルのポストトレーニングについて検討する。
本稿では、InfoPOと呼ばれる優先選好微調整アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:37:48 GMT)
ExEBench: Benchmarking Foundation Models on Extreme Earth Events [25.6] 人類の生命や生態系に大きなリスクをもたらす、極端な出来事が頻繁に発生しています。
機械学習(ML)の最近の進歩は、特徴の抽出と災害管理の約束を示すものである。
これらのモデルは、トレーニングデータからバイアスを受け継ぎ、極端な値よりもパフォーマンスに挑戦することが多い。
textbfExEBenchは,洪水,山火事,嵐,熱帯低気圧,極端な降水量,熱波,寒波にまたがる7つの極端なイベントカテゴリの集合体である。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:02:04 GMT)
Guiding LLM-based Smart Contract Generation with Finite State Machine [24.8] 有限状態機械(FSM)と大言語モデル(LLM)に基づくスマートコントラクト生成フレームワークであるFSM-SCGを提案する。
最高のベースラインと比較して、FSM-SCGは生成したスマートコントラクトコードのコンパイル成功率を少なくとも48%改善し、平均脆弱性リスクスコアを約68%削減する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:13:26 GMT)
UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations [24.2] UniSkillは、ラベルなしで大規模なクロスボデーメントビデオデータから、エンボディディメントに依存しないスキル表現を学ぶフレームワークである。
シミュレーションと実環境の両方における実験により、我々のクロス・エボディメントのスキルは、ビデオのプロンプトが見えない場合でも、ロボットが適切な行動を選択するのに成功していることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:59:22 GMT)
Visually Guided Decoding: Gradient-Free Hard Prompt Inversion with Language Models [24.2] Visually Guided Decoding(VGD)は、大規模言語モデルとCLIPベースのガイダンスを活用して、一貫性とセマンティックに整合したプロンプトを生成する、勾配のないアプローチである。
我々の実験は、VGDが既存のプロンプトインバージョン技術よりも理解しやすく、文脈的に関係のあるプロンプトを生成することを実証している。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:40:22 GMT)
An integrated language-vision foundation model for conversational diagnostics and triaging in primary eye care [24.2] 本稿では,多機能基盤モデルであるMeta-EyeFMについて述べる。
低位適応を用いて、VFMを微調整し、眼疾患や全身疾患を検出し、眼疾患の重症度を識別し、一般的な眼症状を同定した。
このモデルは、ファンス画像を適切なVFMにルーティングする際の100%の精度を達成し、疾患検出の精度は15ドル82.2%、重度判別の精度は89%、符号識別の精度は76%であった。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:13:26 GMT)
IterKey: Iterative Keyword Generation with LLMs for Enhanced Retrieval Augmented Generation [24.1] IterKeyは、スパース検索によるRAGを強化する反復的なキーワード生成フレームワークである。
BM25ベースのRAGと単純なベースラインよりも5%から20%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:25:15 GMT)
TradExpert: Revolutionizing Trading with Mixture of Expert LLMs [23.9] TradeExpertは、専門的な4つのLLMを使用して、専門家(MoE)のアプローチを組み合わせた、新しいフレームワークである。
実験の結果は、すべての取引シナリオにおいて、TradeExpertの優れたパフォーマンスを示しています。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:13:18 GMT)
Position: AI Scaling: From Up to Down and Out [23.7] 本稿では、Scaling Up、Scaling Down、Scaling Outを含む、AIスケーリングのための総合的なフレームワークを提案する。
モデルのスケールアップは固有のボトルネックに直面しているが、AIスケーリングの今後の軌道はスケールダウンとスケーリングアウトにある、と氏は主張する。
我々は、医療、スマートマニュファクチャリング、コンテンツ作成における変革的なアプリケーションについて検討し、AI Scalingがいかに効率、パーソナライゼーション、グローバル接続のブレークスルーを可能にするかを実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:47:13 GMT)
Lost in Transliteration: Bridging the Script Gap in Neural IR [23.6] 本稿では,多言語で高密度な埋め込みを含む現在の検索システムが,翻訳クエリに一般化していないことを示す。
本研究は,多言語情報検索手法の堅牢性を高めるために,一般的な「翻訳訓練」パラダイムを音訳に適用するかどうかを考察する。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:09:51 GMT)
HealthBench: Evaluating Large Language Models Towards Improved Human Health [23.3] HealthBenchは、モデルと個人ユーザーまたは医療専門家の間の5000のマルチターン会話で構成されている。
262名の医師が作成した対話型ルーブリックを用いて応答を評価した。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:53:59 GMT)
DreamO: A Unified Framework for Image Customization [23.1] 複数の条件をシームレスに統合しながら、幅広いタスクをサポートするために設計された画像カスタマイズフレームワークであるDreamOを紹介する。
具体的には、DreamOは拡散変換器(DiT)フレームワークを使用して、異なるタイプの入力を均一に処理する。
ベースライン整合性を確立するための限られたデータを伴う単純なタスクに焦点を当てた初期段階、カスタマイズ能力を包括的に強化するためのフルスケールトレーニング段階、低品質データによって導入された品質バイアスを補正するための最終品質アライメント段階の3段階からなるプログレッシブトレーニング戦略を採用する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:49:35 GMT)
MobA: Multifaceted Memory-Enhanced Adaptive Planning for Efficient Mobile Task Automation [23.0] MLLMベースのモバイルアシスタントシステムであるMobAを提案する。
本稿では,エラー復旧のためのリフレクション機構を組み込んだ適応計画モジュールを提案する。
複雑なモバイルインタラクション用に設計されたデータセットであるMobBenchについても紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:25:09 GMT)
Learning Advanced Self-Attention for Linear Transformers in the Singular Value Domain [23.0] Transformerのキーコンポーネントは自己アテンションであり、入力シーケンス内の任意の2つのトークンの関係を学習する。
最近の研究により、自己注意はグラフの正規化隣接行列として理解できることが明らかになった。
本稿では,自己注意を特異値領域におけるグラフフィルタの学習として解釈する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:48:04 GMT)
Computing High-dimensional Confidence Sets for Arbitrary Distributions [22.9] 最良球の体積と競合する$exp(tildeO(d1/2)$因子を持つ信頼集合を求めるアルゴリズムが見つかる。
我々の結果は、信頼セットの適切な(不適切な)学習と適切な(不適切な)学習を、興味深い分離を提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:01:44 GMT)
VideoUFO: A Million-Scale User-Focused Dataset for Text-to-Video Generation [22.8] VideoUFOは、現実世界のシナリオにおけるユーザのFOcusに合わせて特別にキュレーションされたビデオデータセットである。
VideoUFOには1億9900万本以上のビデオクリップがあり、それぞれに短いキャプションと詳細なキャプションがある。
実験の結果,(1)現在の16種類のテキスト・ビデオ・モデルでは,すべてのユーザ中心のトピックに対して一貫したパフォーマンスが得られず,(2)ビデオUFOで訓練された単純なモデルでは,最悪のパフォーマンスのトピックにおいて他者よりも優れていたことがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:54:08 GMT)
SaFARi: State-Space Models for Frame-Agnostic Representation [22.7] State-Space Models (SSM) は、オンライン機能のための強力なツールとして再登場し、長距離依存データのための機械学習モデルのバックボーンとなった。
本稿では,SSMをフレームやベースで構築する手法について述べる。
このフレームワークは、HiPPOとして知られるアプローチを包含するが、SSMアーキテクチャ内の他の可能な「種」の無限の多様性も許容する。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:39:40 GMT)
Towards Adaptive Meta-Gradient Adversarial Examples for Visual Tracking [22.6] 視覚的トラッキングのための適応的メタ段階的対向攻撃法(AMGA)を提案する。
その結果, AMGAは攻撃性能, 転送可能性, および敵対例の誤認を著しく改善することがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:26:19 GMT)
ADC-GS: Anchor-Driven Deformable and Compressed Gaussian Splatting for Dynamic Scene Reconstruction [22.2] 既存の4Dガウス散乱法は、標準空間からターゲットフレームへのガウス毎の変形に依存している。
動的シーン再構成のためのコンパクトで効率的なADC-GSを提案する。
その結果, ADC-GS はレンダリング速度300%-800% でガウス変形法よりも優れていた。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:13:40 GMT)
DeepMath-Creative: A Benchmark for Evaluating Mathematical Creativity of Large Language Models [22.1] DeepMathチームはオープンな数学的LLMの開発を目的としたオープンソースイニシアチブを立ち上げた。
本稿は、このイニシアチブの初期の貢献を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:58:05 GMT)
A Finite Sample Analysis of Distributional TD Learning with Linear Function Approximation [22.0] 線形関数近似を用いた分布時間差(TD)学習の有限サンプル統計率について検討した。
この結果から,分布強化学習アルゴリズムの統計的効率に関する新たな知見が得られた。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:03:07 GMT)
CellTypeAgent: Trustworthy cell type annotation with Large Language Models [22.0] 本稿では,LLMと関連するデータベースの検証を統合した,信頼性の高い大規模言語モデル (LLM) エージェントであるCellTypeAgentを提案する。
我々はCellTypeAgentを36の組織から303の細胞タイプを含む9つの実際のデータセットで評価した。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:34:11 GMT)
GPTAQ: Efficient Finetuning-Free Quantization for Asymmetric Calibration [21.5] GPTAQは大規模トランスアーキテクチャを圧縮するための新しい微調整不要量子化法である。
各層を独立に校正する従来のGPTQ法とは異なり、我々は常に量子化層の出力と完全精度モデルの正確な出力とを一致させる。
GPTAQは実装が容易で、GPTQよりも20行のコードを使用するだけで、低ビット量子化下での性能を向上させることができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:54:56 GMT)
NurValues: Real-World Nursing Values Evaluation for Large Language Models in Clinical Context [21.4] この研究は、看護価値アライメントのための最初のベンチマークを導入する。
国際的な看護法典から抽出された5つの中核的価値次元(Altruism, Human Dignity, Integrity, Justice, Professionalism)で構成されている。
このベンチマークは、3つの病院で5ヶ月にわたる縦断調査によって収集された1,100件の現実世界の看護行動から成っている。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:46:25 GMT)
Communication Styles and Reader Preferences of LLM and Human Experts in Explaining Health Information [21.0] 大規模言語モデル(LLM)の通信スタイルについて検討した。
権威ある事実検査機関から1498件の健康誤報説明データセットを収集した。
情報提示に対するLCMの構造化アプローチは,読者の関心を喚起する上でより効果的である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:32:38 GMT)
AniSora: Exploring the Frontiers of Animation Video Generation in the Sora Era [20.7] 本稿では,アニメーション映像生成のための総合システムAniSoraを提案する。
1000万以上の高品質なデータでデータ処理パイプラインがサポートしています。
また,様々なアニメーションビデオの評価ベンチマークを収集し,特にアニメーションビデオ生成のための指標を開発した。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:20:54 GMT)
Semantic Shift Estimation via Dual-Projection and Classifier Reconstruction for Exemplar-Free Class-Incremental Learning [20.6] EFCIL (Exemplar-Free Class-Incremental Learning) のためのDPCR (Dual-Projection Shift Estimation and Reconstruction) アプローチを提案する。
DPCRは、学習可能な変換と行空間の射影を組み合わせた二重射影による意味的シフトを効果的に推定する。
実験により、様々なデータセットにおいて、DPCRは古いタスクと新しいタスクのバランスを効果的に保ち、最先端のEFCILメソッドより優れていることが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:19:56 GMT)
G-MSGINet: A Grouped Multi-Scale Graph-Involution Network for Contactless Fingerprint Recognition [20.5] G-MSGINetは、接触レス指紋認識のための統一されたフレームワークである。
生の入力画像から直接、微妙な局所化とアイデンティティの埋め込みを共同で行う。
3つのベンチマークデータセットの大規模な実験は、G-MSGINetが97.0%から99.1%の範囲で0.83pm0.02$、ランク1の識別精度で一貫してF1スコアを達成していることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:24:24 GMT)
Lost in Transmission: When and Why LLMs Fail to Reason Globally [20.3] 本稿では,アテンションヘッド上の帯域制限をモデル化する新しい計算フレームワークである,バウンダリ・アテンションプレフィックス・オラクル(BAPO)モデルを紹介する。
グラフ到達性のような重要な理由付け問題は、BAPOが解決するためには、高い通信帯域幅を必要とすることを示す。
本研究は,LLMの故障の原理的説明とアーキテクチャの方向性,帯域幅制限を緩和する推論手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:25:23 GMT)
HLV-1K: A Large-scale Hour-Long Video Benchmark for Time-Specific Long Video Understanding [20.2] 我々は、長時間ビデオ理解モデルを評価するために、大規模な時間長ビデオベンチマークHLV-1Kを構築した。
HLV-1Kは、高品質質問応答(QA)とマルチチョイス質問応答(MCQA)を備えた1009時間ビデオからなる。
我々は,既存の最先端手法を用いてベンチマークを評価し,様々なレベルでの深層ビデオ理解能力をテストすることの価値を実証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:38:44 GMT)
LM-Scout: Analyzing the Security of Language Model Integration in Android Apps [19.7] 開発者はLanguage Models(LM)をモバイルアプリに統合し、チャットベースのアシスタントなどの機能を提供する。
LM統合が安全でない場合、攻撃者は制限をバイパスし、LMへの無制限アクセスを得ることができる。
本報告では,AndroidアプリによるLMの安全でない使用に関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:37:23 GMT)
DiffCloud: Real-to-Sim from Point Clouds with Differentiable Simulation and Rendering of Deformable Objects [19.4] 本稿では,最近のニューラルネットワークアーキテクチャを用いて実点雲からのシミュレーションパラメータ推論を行う方法について述べる。
そこで本研究では,アライメントの実現に要する時間を大幅に短縮するために,異なる点クラウドサンプリングと微分可能なシミュレーションを活用することを提案する。
高度に変形可能なオブジェクトによる実験は、本手法が実際のオブジェクトの振る舞いと同等あるいはより良いアライメントを達成できることを示します。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:31:59 GMT)
LLM Enhancers for GNNs: An Analysis from the Perspective of Causal Mechanism Identification [19.4] グラフニューラルネットワーク(GNN)の入力として使用されるノード表現を最適化する機能拡張器として,大規模言語モデル(LLM)を用いて検討する。
解析結果に基づいて,LLMエンハンサーとGNN間の情報伝達を改善するためのプラグアンドプレイ最適化モジュールを設計する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:29:25 GMT)
Tensor Sketch: Fast and Scalable Polynomial Kernel Approximation [19.4] textitTensor Sketchは、カーネルを近似するための効率的なランダムな特徴マップである。
Sketchは、$BOn(d+D logD)$の低次元埋め込みを時間内に計算する。
誤差近似に関する理論的保証を提供し、その結果のカーネル関数の推定精度を確実にする。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:47:17 GMT)
MGPATH: Vision-Language Model with Multi-Granular Prompt Learning for Few-Shot WSI Classification [19.3] 全スライド画像分類は、ギガピクセル画像サイズと限定アノテーションラベルによる課題を提示する。
本稿では,数ショットの病理分類に大規模な視覚言語モデルを適用するための素早い学習手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:09:47 GMT)
Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems [19.3] ユーザ関心向上(UIE)と呼ばれる革新的なソリューションを提案する。
UIEは、ユーザプロファイルやユーザ履歴の動作シーケンスを含む、ユーザの関心を高める。
エンドツーエンドのソリューションとして、UIEは既存のランキングモデルに簡単に実装できます。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:16:29 GMT)
On the Account Security Risks Posed by Password Strength Meters [19.2] パスワード強度計(PSM)は、パスワード強度を測定するためにウェブサイトで広く使われており、ユーザーがより強力なパスワードを作成することを奨励している。
我々は11個のPSMを分析し、5つのデータ駆動メーターが、トレーニングされたパスワードを露出するメンバシップ推論攻撃に弱いことを発見した。
我々は、このメーターを使用してウェブサイト上のアカウントを不正に処理する際、巧妙な攻撃者が使用済みパスワードをフィルタリングできる新しいメーター認識攻撃を開発する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:15:17 GMT)
Optimized View and Geometry Distillation from Multi-view Diffuser [19.1] 本研究では,2次元拡散モデルから無条件雑音を利用するUnbiased Score Distillation (USD)を提案する。
本研究では2次元拡散モデルの2段階の特殊化プロセスを開発する。
最後に,改良された多視点画像から直接忠実な形状とテクスチャを復元する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:47:01 GMT)
DLO-Splatting: Tracking Deformable Linear Objects Using 3D Gaussian Splatting [19.1] DLO-Splattingは、多視点RGB画像とグリップ状態情報から変形可能な線形物体(DLO)の3次元形状を推定するアルゴリズムである。
このアルゴリズムは、形状の滑らかさと剛性減衰補正を備えた位置ベース力学モデルを用いて、物体の形状を予測する。
実験では、既存の視覚のみの手法では難しいノットタイリングのシナリオで有望な結果を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:03:40 GMT)
An Analytical Characterization of Sloppiness in Neural Networks: Insights from Linear Models [19.0] 近年の研究では、複数の深層ニューラルネットワークのトレーニング軌道が、驚くほど低次元の「ハイパーリボン様」多様体上で進化することが示されている。
深層ネットワークと線形ネットワークの訓練軌跡の類似性から着想を得て,この現象を後者に対して解析的に特徴付ける。
この低次元多様体の幾何学は, (i) トレーニングデータの入力相関行列の固有値の減衰率, (ii) トレーニング開始時の接地トラスト出力の相対スケール, (iii) 勾配勾配のステップ数によって制御されることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:20:19 GMT)
An Identifiable Cost-Aware Causal Decision-Making Framework Using Counterfactual Reasoning [18.3] そこで本研究では,最小コスト因果決定(MiCCD)フレームワークを提案する。
混合異常データの存在を識別する反ファクト的推論プロセスに重点を置いている。
MiCCDは、F1スコア、コスト効率、ランキング品質(nDCG@k値)など、従来の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:41:45 GMT)
Inexact subgradient methods for semialgebraic functions [18.3] 機械学習における近似勾配の広範囲な適用を動機として, 永続的な誤差を受ける部分エクサクティヴな加算法について検討する。
我々の分析は、消滅と定常的なステップサイズ体制の両方に対処する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:35:00 GMT)
Emotional EEG Classification using Upscaled Connectivity Matrices [18.3] ローカルパターンを強化するために,接続行列をスケールアップするアイデアを提案し,検証する。
実験により、この単純なアイデアは分類性能を著しく向上させることができることが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:21:20 GMT)
Federated Large Language Models: Feasibility, Robustness, Security and Future Directions [18.2] LLM(Large Language Models)とFL(Federated Learning)の統合は、分散データに対する共同トレーニングのための有望なソリューションを提供する。
本稿では, 実現可能性, 堅牢性, セキュリティ, 今後の方向性の4つの重要な視点から課題を考察する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:23:54 GMT)
Differentiable Channel Selection in Self-Attention For Person Re-Identification [18.2] 本稿では,微分チャネル選択アテンションモジュール (DCS-アテンションモジュール) と呼ばれる新しいアテンションモジュールを提案する。
従来の自己注意とは対照的に、DCS-Attentionモジュールは注意重みの計算において情報チャネルの選択を行う。
我々のDCS-Attentionは、固定されたニューラルネットワークのバックボーンと互換性があるか、微分可能なニューラルネットワークサーチ(DNAS)で学習可能なバックボーンと互換性があり、それぞれ固定されたバックボーン(DCS-FB)とDCS-DNASでDCSに導かれる。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:01:53 GMT)
Learning Cocoercive Conservative Denoisers via Helmholtz Decomposition for Poisson Inverse Problems [17.9] 我々は,コヒーレンシブ保守型(CoCo)デノイザーを提案するが,これは(残留)拡張性があり,デノイジングの改善につながる。
一般化されたヘルムホルツ分解を利用して、ハミルトン正則化と保守性を促進する新しいトレーニング戦略を導入する。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:00:55 GMT)
A note on concentration inequalities for the overlapped batch mean variance estimators for Markov chains [17.6] Atchad'e と Cattaneo 2014 が導入した Martingale 分解法を用いて,マルコフ鎖に付随する二次構造の濃度特性について検討した。
我々の主な結果は、OBM推定器とマルコフ連鎖のばらつきの差の$p$-thのモーメントを明示的に制御することである。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:36:04 GMT)
Model-Distributed Inference for Large Language Models at the Edge [17.0] 大規模言語モデル(MDI-LLM)のためのモデル分散推論を提案する。
MDI-LLMは最先端の低消費電力デバイスへの最先端の大規模言語モデル(LLM)の展開を容易にするように設計されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:07:37 GMT)
Ophora: A Large-Scale Data-Driven Text-Guided Ophthalmic Surgical Video Generation Model [16.9] 眼科手術では、手術映像を解釈し、その後の手術を予測することができるAIシステムの開発には、高品質なアノテーションを備えた多数の眼科手術ビデオが必要である。
我々は,眼科手術映像を自然言語で生成できる先駆的モデルであるOphoraについて紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:39:25 GMT)
SPP-SBL: Space-Power Prior Sparse Bayesian Learning for Block Sparse Recovery [16.6] 本稿では,ブロックスパース信号の未知パターンを適応的に捉えるために,非方向グラフモデルに基づく新しい空間パワーを提案する。
本研究では,空間結合パラメータ推定の解問題に効果的に対処する,新しい構造付きスパースベイズ学習法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:49:25 GMT)
Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement [16.6] 大規模言語モデル(LLM)の急速な進歩は、従来の評価手法よりも優れている。
心理学とは、人格、価値観、知性といった人間の心理学の無形側面を定量化する科学である。
本調査は, LLM心理学の学際分野を新たに導入し, 合成するものである。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:47:51 GMT)
DeepDistill: Enhancing LLM Reasoning Capabilities via Large-Scale Difficulty-Graded Data Training [16.4] 大規模言語モデル(LLM)は、最近、様々な複雑な推論ベンチマークで顕著なパフォーマンスを達成した。
難易度が変化する約334万のユニークなクエリを含む大規模で難易度の高い推論データセットを構築した。
AIME2024の数学的推論ベンチマークで79.2%のパス率を達成することで、ベースモデルの推論能力を大幅に改善する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:43:57 GMT)
AM-Thinking-v1: Advancing the Frontier of Reasoning at 32B Scale [16.4] AM-Thinking-v1は32Bの高密度言語モデルであり、推論のフロンティアを前進させる。
DeepSeek-R1と、Qwen3-235B-A22BやSeed1.5-Thinkingのような主要なMixture-of-Experts (MoE)モデルに対抗して、AM-Thinking-v1は、AIME 2024で85.3、AIME 2025で74.4、LiveCodeBenchで70.3を達成している。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:41:15 GMT)
Adaptive Schema-aware Event Extraction with Retrieval-Augmented Generation [16.4] イベント抽出(EE)は自然言語処理(NLP)の基本課題であり、構造化されていないテキストからイベント情報を識別して抽出する。
既存の研究では,(1)既存のパイプラインシステムにおける厳密なスキーマ固定,(2)共同スキーママッチングと抽出のためのベンチマークの欠如という2つの重要なギャップが示されている。
本稿では,適応認識イベント抽出(ASEE)を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:47:54 GMT)
HMPNet: A Feature Aggregation Architecture for Maritime Object Detection from a Shipborne Perspective [16.4] 様々な海洋環境と気象条件下での12の対象カテゴリに注釈付けされた新しいデータセットを提示する。
船舶搭載物体検出に適した軽量アーキテクチャであるHMPNetを提案する。
経験的評価は、HMPNetが現在の最先端の手法を精度と計算効率の両面で上回っていることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:17:53 GMT)
Unsupervised Urban Land Use Mapping with Street View Contrastive Clustering and a Geographical Prior [16.3] 本研究は、地理的事前に組み込まれたストリートビュー画像に対する教師なしコントラストクラスタリングモデルを提案する。
本研究では,2つの都市の地理タグ付きストリートビュー画像データセットから土地利用地図を作成できることを実験的に示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:31:13 GMT)
Streamlining Prediction in Bayesian Deep Learning [16.1] 本研究は, サンプリング不要な単一前方通過によるBDLの合理化予測について検討する。
我々は、後続の予測分布に対する近似を解析的に計算する。
本稿では,ViT や GPT-2 などのトランスフォーマーにアプローチを示し,その性能を回帰および分類タスクで評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:16:34 GMT)
RadioLLM: Introducing Large Language Model into Cognitive Radio via Hybrid Prompt and Token Reprogrammings [16.0] 大言語モデル(LLM)は認知無線技術(CRT)の進展に新たな可能性をもたらす
提案するRadioLLMは,無線信号特徴と専門知識を組み合わせたHPTR(Hybrid Prompt and Token Regramming)と高頻度特徴モデリングのためのFAF( Frequency-Attuned Fusion)モジュールを組み合わせた新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:17:48 GMT)
Aya Vision: Advancing the Frontier of Multilingual Multimodality [16.0] 高品質で多様な多言語マルチモーダル命令データをキュレートする合成アノテーションフレームワークを開発した。
また,破滅的忘れを緩和するクロスモーダルモデルマージ手法を提案する。
我々の研究は、マルチモーダルフロンティアにおける多言語的な進歩を前進させ、計算の必要性を効果的に曲げる技術に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:03:48 GMT)
Unsupervised Out-of-Distribution Detection in Medical Imaging Using Multi-Exit Class Activation Maps and Feature Masking [15.9] 医用画像における深層学習モデルの信頼性確保には,アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
この研究は、クラスアクティベーションマップ(CAM)が、通常、モデルの予測に非常に関係のある領域を強調しているという観察に動機づけられている。
マルチエクイットCAMと特徴マスキングを活用した,新しい教師なしOOD検出フレームワークであるMulti-Exit Class Activation Map (MECAM)を導入する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:18:58 GMT)
ReSurgSAM2: Referring Segment Anything in Surgical Video via Credible Long-term Tracking [15.8] ReSurgSAM2は2段階の外科的セグメンテーションフレームワークである。
クロスモーダルな時空間マンバを用いて正確な検出とセグメンテーション結果を生成する。
信頼性と多様なメモリバンクを維持し、一貫した長期追跡を保証する、多様性駆動型メモリ機構を備えている。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:56:10 GMT)
Modeling Unseen Environments with Language-guided Composable Causal Components in Reinforcement Learning [15.6] 構成因果成分を用いた世界モデリング(WM3C)について紹介する。
このフレームワークは、因果成分の学習と活用による強化学習を強化する。
我々のアプローチは、潜在空間を意味のある構成要素に分解するために、言語を構成モダリティとして統合する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:08:28 GMT)
Round and Round We Go! What makes Rotary Positional Encodings useful? [15.5] メカニカルレベルでの RoPE の使用方法を理解するため, トレーニングされた Gemma 7B モデルの内部構造について検討した。
Gemma は,RoPE を用いて高周波数を利用してロバストな「位置的」アテンションパターンを構築することを学ぶ。
強調された問題を修正し、性能を向上するRoPEの修正を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:11:59 GMT)
Why do LLMs attend to the first token? [15.5] 大規模言語モデル(LLM)は、シーケンスの最初のトークンに大きく関与する傾向があり、いわゆるアテンションシンクを生成する。
我々は、このメカニズムがLLMの過剰混合を回避する方法を提供すると理論的、実証的に主張する。
理論的直観を検証し、文脈長、深さ、データパッキングなどの選択がシンク行動にどのように影響するかを示す実験を行う。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:38:34 GMT)
On the Parallels Between Evolutionary Theory and the State of AI [15.4] 本稿では,現代AI手法の基本原理を批判的に考察し,その可能性を妨げる限界について考察する。
我々は、進化生物学における現代AIの風景と20世紀の現代合成の類似性を描き、現代合成を増進する進化論の進歩、特に進化的発達生物学の進歩が、AIの新しいデザインパラダイムに影響を及ぼす洞察を与える方法について強調する。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:43:02 GMT)
Mirror Mirror on the Wall, Have I Forgotten it All? A New Framework for Evaluating Machine Unlearning [15.4] 機械学習の手法は、データセットとリクエストセットでトレーニングされたモデルを取り、その後、リクエストセットにない例でのみトレーニングされたかのようにモデルを生成しようと試みる。
敵がミラーモデルと非学習手法で生成したモデルとを区別できることを示す。
本稿では,計算機アンラーニングという,機械アンラーニングのための強力な形式的定義を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:23:17 GMT)
Ultrasound Report Generation with Multimodal Large Language Models for Standardized Texts [15.3] 我々は,多言語および多言語による米国レポート生成のための統一的なフレームワークを提案する。
方法は、臓器部位や言語間で一貫性があり、臨床的に正確なテキスト生成を実現する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:27:01 GMT)
IrrMap: A Large-Scale Comprehensive Dataset for Irrigation Method Mapping [15.1] IrrMapは、地域間での灌水方法マッピングのための最初の大規模データセット(11万パッチ)である。
データセットは2013年から2023年までの複数の西部州で1,687,899の農場と14,117,330エーカーに及ぶ。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:36:41 GMT)
Cite Before You Speak: Enhancing Context-Response Grounding in E-commerce Conversational LLM-Agents [15.0] 顧客に対して'引用体験'を可能にする、容易に生産可能なソリューションを提案します。
本研究では, 励起生成パラダイムにより地盤性能が13.83%向上することを示す。
大規模なオンラインA/Bテストでは、接地されたCSAレスポンスがUXのバリエーションによって顧客のエンゲージメントを3%から10%改善している。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:02:11 GMT)
SHAP-based Explanations are Sensitive to Feature Representation [14.9] ローカル機能ベースの説明は、XAIツールキットの重要なコンポーネントである。
本稿では,データエンジニアリングの選択が局所的特徴に基づく説明に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:43:09 GMT)
An Efficient On-Policy Deep Learning Framework for Stochastic Optimal Control [14.8] 本稿では、最適制御(SOC)問題を解決するための新しいオン政治アルゴリズムを提案する。
ギルサノフの定理を利用することで、微分方程式や随伴問題解による高価なバックプロパゲーションを伴わずに、SOC対象の政治的勾配を直接計算する。
実験により,従来の手法に比べて計算速度とメモリ効率が大幅に向上した。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:30:44 GMT)
Alleviating LLM-based Generative Retrieval Hallucination in Alipay Search [14.8] 生成的検索(GR)は大規模言語モデル(LLM)の出現とともに文書検索に革命をもたらした
検索幻覚を緩和する最適化されたGRフレームワークを提案する。
我々は、GRが検索したクエリドキュメント(q-d)ペアの評価と推論にLLMを使用し、GRモデルに転送された知識として推論データを蒸留する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:54:26 GMT)
Feasibility-Aware Pessimistic Estimation: Toward Long-Horizon Safety in Offline RL [14.8] CVAEに基づくペシミズム(FASP)を用いたオフラインセーフ強化学習フレームワークを提案する。
我々はハミルトン・ヤコビ(H-J)リーチビリティ解析を用いて信頼性の高い安全ラベルを生成する。
また,報酬とコストのQ値の推定にも悲観的推定法を用いる。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:32:49 GMT)
Leveraging Segment Anything Model for Source-Free Domain Adaptation via Dual Feature Guided Auto-Prompting [14.6] セグメンテーションのためのソースフリードメイン適応(SFDA)は、ソースドメインでトレーニングされたモデルを適用して、ターゲットドメインでうまく機能することを目的としている。
私たちはSegment Anything Model for SFDAの可能性を初めて探求し、正確なバウンディングボックスプロンプトを自動的に見つけました。
ボックスプロンプトを検索するための新しいDual Feature Guided (DFG) 自動プロンプト手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:00:48 GMT)
A Comprehensive Social Bias Audit of Contrastive Vision Language Models [14.6] テキスト・ツー・イメージ・モデルにおける公平性を高める新しいフレームワークであるFairCoTを紹介する。
また,FairCoTは画像品質や意味的忠実さを犠牲にすることなく,公平性と多様性を著しく向上させることを示した。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:39:21 GMT)
A Mamba-based Network for Semi-supervised Singing Melody Extraction Using Confidence Binary Regularization [14.5] 歌唱旋律抽出は音楽情報検索の分野で重要な課題である。
既存の方法にはいくつかの制限がある。
半教師付き歌唱メロディ抽出のためのマンバベースネットワークSpectMambaを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:43:35 GMT)
CursorCore: Assist Programming through Aligning Anything [14.4] 本稿では,情報ソースの統合,データ収集,モデルのトレーニング,性能評価を行う新しい対話型フレームワークを提案する。
CursorCoreは同等のサイズの他のモデルよりも優れています。
このフレームワークは、インラインチャットや自動編集などのアプリケーションを統合することで、コーディングアシスタントの進歩に貢献している。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:13:13 GMT)
Entanglement Model for Mode-Pairing Quantum Key Distribution [14.4] モードペアリング(MP)量子鍵分布(QKD)は、位相ロックと位相トラッキングの要件を取り除く。
本稿では,MP-QKDと等価なフリーペア型エンタングルメントスキームを提案し,MP-QKDの絡み合いモデルを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:16:39 GMT)
GDNTT: an Area-Efficient Parallel NTT Accelerator Using Glitch-Driven Near-Memory Computing and Reconfigurable 10T SRAM [14.3] 本稿では、グリッチ駆動ニアメモリコンピューティング(GDNTT)を用いた領域効率の高い高並列NTT加速器を提案する。
この設計はデータストレージ用の10Tを統合し、柔軟な行/列のデータアクセスと合理化回路マッピング戦略を可能にする。
評価の結果,提案したNTTアクセラレーターは,最先端技術と比較して1.528*のスループット向上を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:53:07 GMT)
Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS) challenge results [13.9] 深層学習(DL)が医用画像セグメンテーションの主流となっている。
この課題は、より包括的な基盤真理を確立する上で、複数のアノテータが果たす重要な役割を強調している。
我々は,DLモデルが不確実性をどのように扱うか,信頼度推定が真のセグメンテーション性能と一致しているかを評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:45:44 GMT)
A Survey of Deep Learning for Complex Speech Spectrograms [13.8] 近年のディープラーニングの進歩は音声信号処理の分野に大きな影響を与えている。
このサーベイは、複雑なスペクトログラムを処理するためにディープニューラルネットワークを活用する最先端技術の概要を提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:53:01 GMT)
Assessing and Advancing Benchmarks for Evaluating Large Language Models in Software Engineering Tasks [13.7] 大規模言語モデル(LLM)は、ソフトウェア工学(SE)で人気が高まっている。
この分野での有効性を 理解するためには 有効性の評価が不可欠です
本稿では、191ベンチマークの徹底的なレビューを行い、どのベンチマークが利用可能か、どのようにベンチマークを構築しているか、これらのベンチマークの将来展望の3つの主要な側面に対処する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:45:10 GMT)
Behind Maya: Building a Multilingual Vision Language Model [13.7] オープンソースのMultilingual VLMであるMayaを紹介します。
コントリビューションは,1)LLaVA事前学習データセットに基づく8言語による多言語画像テキスト事前学習データセット,2)これらの言語をサポートする多言語画像テキストモデル,そして,視覚言語タスクにおける文化的・言語的理解の向上である。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:01:12 GMT)
PoisonCatcher: Revealing and Identifying LDP Poisoning Attacks in IIoT [13.7] ローカル微分プライバシー(LDP)は、軽量で分散化されスケーラブルであるため、産業用IoT(Industrial Internet of Things)で広く採用されている。
本研究は,資源豊富なアグリゲータにおけるIIoTに対するLDP中毒防御法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:08:10 GMT)
Continual Reinforcement Learning via Autoencoder-Driven Task and New Environment Recognition [13.7] 本研究では,新しいタスクの検出と観測環境の一致に対するオートエンコーダの有効性について検討した。
本手法は、エンドツーエンドの連続学習システムにおいて、ポリシー最適化と親しみやすいオートエンコーダを統合する。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:38:54 GMT)
Controllable creation of topological boundary states in topological-insulator-based Josephson corner junctions [13.6] 凝縮物質系におけるマヨラナゼロモード(MZM)は、過去20年で大きな注目を集めている。
我々は, トポロジカル絶縁体(TI)をベースとしたジョセフソン角接合の角に, 位相境界状態の制御可能な生成を実現した。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:07:24 GMT)
A suite of LMs comprehend puzzle statements as well as humans [13.4] 本研究では,ヒトの反応を2つの条件で比較した事前登録研究を報告した。
リリーディングが制限されると、人間の精度は大幅に低下し、Falcon-180B-ChatやGPT-4よりも低下した。
結果は、モデル固有の欠陥よりも、実用的感受性の共有を示唆している。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:18:51 GMT)
MUBox: A Critical Evaluation Framework of Deep Machine Unlearning [13.2] MUBoxは、ディープラーニングにおける未学習の手法を評価するために設計された総合的なプラットフォームである。
MUBoxは23の高度なアンラーニング技術を統合し、11の多様な評価指標で6つの実践シナリオでテストされている。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:50:51 GMT)
FedRS-Bench: Realistic Federated Learning Datasets and Benchmarks in Remote Sensing [13.1] Federated Learning (FL)は、分散リモートセンシング(RS)データソース間で、生データを公開せずに協調的なモデルトレーニングを可能にするソリューションを提供する。
本稿では,現実的な運用シナリオを表す,FedRSと呼ばれる現実的なフェデレーションRSデータセットを提案する。
総合的なFedRS-Benchを構築するために,10のベースラインFLアルゴリズムと評価指標を実装した。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:04:03 GMT)
A Survey on GUI Agents with Foundation Models Enhanced by Reinforcement Learning [13.1] まず、GUIエージェントタスクをマルコフ決定プロセスとして定式化し、典型的な実行環境と評価指標について議論する。
次に、(M)LLMベースのGUIエージェントのモジュールアーキテクチャをレビューし、パーセプション、プランニング、アクティベーションモジュールをカバーし、それらの進化を代表的作業を通して追跡する。
本稿では, 複合現実環境におけるGUIエージェントの一般化とロバスト性について, マルチモーダル認識, 決定推論, 適応行動生成における最近の革新が, どのようにして大幅に向上したかを述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:59:29 GMT)
Cost Function Estimation Using Inverse Reinforcement Learning with Minimal Observations [13.1] 連続空間における最適コスト関数を推定するための反復逆強化学習アルゴリズムを提案する。
本アルゴリズムは,分割関数に対する各観測の有効性を個別に調整することができ,大きなサンプルセットを必要としない。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:38:25 GMT)
Learning Phase Distortion with Selective State Space Models for Video Turbulence Mitigation [13.1] 大気の乱流は、長距離イメージングシステムにおける画像劣化の主な原因である。
多くの深層学習に基づく乱流緩和法 (TM) が提案されているが, それらは遅い, メモリ不足であり, 一般化が不十分である。
本稿では,(1)選択状態空間モデル(MambaTM)に基づく乱流緩和ネットワークと(2)学習遅延位相歪み(LPD)の2つの概念に基づく新しいTM法を提案する。
提案手法は,様々な合成および実世界のTMベンチマークにおいて,推定速度が大幅に向上した現状のネットワークを超越した手法である。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:32:25 GMT)
Improving Unsupervised Task-driven Models of Ventral Visual Stream via Relative Position Predictivity [13.0] 本稿では,相対位置(RP)予測という,VVSを含む追加機能を導入する。
本稿では,VVSをモデル化するための教師なしタスク駆動手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:45:21 GMT)
Self-reflecting Large Language Models: A Hegelian Dialectical Approach [13.0] 哲学的なレンズによるNLPの探索は、計算手法と古典的な哲学の学派を結びつけることで、研究者の目を引くようになった。
本稿では,LLMのテクスト自己回帰に対するヘーゲル弁証法に触発された哲学的アプローチを紹介する。
提案手法は, 新たなアイデアの創出と, 問題解決におけるLCMの推論能力の向上に有効であることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:06:22 GMT)
ACT-R: Adaptive Camera Trajectories for 3D Reconstruction from Single Image [12.9] 多視点合成に適応的なビュープランニングを導入する。
我々は3次元コヒーレンスを高めるために時間的一貫性を活用して一連のビューを生成する。
本手法は, 未知のGSOデータセット上でのSOTAによる3次元再構成を大幅に改善する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:31:59 GMT)
AI Hiring with LLMs: A Context-Aware and Explainable Multi-Agent Framework for Resume Screening [12.8] 大規模言語モデル(LLM)を用いたスクリーニング再開のためのマルチエージェントフレームワークを提案する。
フレームワークは、履歴抽出器、評価器、要約器、スコアフォーマッターを含む4つのコアエージェントから構成される。
この動的適応は、パーソナライズされた採用を可能にし、AI自動化と人材獲得のギャップを埋める。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:41:54 GMT)
Transformer representation learning is necessary for dynamic multi-modal physiological data on small-cohort patients [12.8] 術後せん妄 (POD) は, 高リスク手術患者の約50%に影響を及ぼす重度の精神科合併症である。
本稿では,従来の機械学習アルゴリズムに続き,トランスフォーマー表現モデルを含むPOD予測フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:22:50 GMT)
Improved Algorithms for Differentially Private Language Model Alignment [12.6] プライバシ保護アライメントのための新しいアルゴリズムを提案する。
私たちのフレームワークは2つの著名なアライメント技術にデプロイできます。
我々のアルゴリズムの1つであるDP-AdamWとDPOは、従来の手法を超越し、適度なプライバシー予算の下でアライメント品質を最大15%改善します。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:18:59 GMT)
Measurement to Meaning: A Validity-Centered Framework for AI Evaluation [12.6] 我々は、利用可能な証拠から得られる評価的クレームのタイプを推論するための構造化されたアプローチを提供する。
私たちのフレームワークは、機械学習の現代的なパラダイムに適しています。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:36:22 GMT)
Skeleton-Guided Diffusion Model for Accurate Foot X-ray Synthesis in Hallux Valgus Diagnosis [12.4] 世界の人口の約19%に影響を及ぼすハルース・バルガスは、度重なるX線による評価を必要とする。
既存のX線モデルは、画像の忠実さ、骨格の一貫性、物理的制約のバランスをとるのに苦労することが多い。
骨格拘束条件拡散モデル(SCCDM)を提案し,骨格ランドマークを利用した足跡評価手法であるKCCを導入する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:57:15 GMT)
Unlocking Location Intelligence: A Survey from Deep Learning to The LLM Era [12.4] 位置インテリジェンス(英: Location Intelligence, LI)は、位置中心の地理空間データを行動可能な知識に変換する科学である。
地理空間表現学習の急速な進化は、2つの連続した技術革命を通じて、LI開発を根本的に変えつつある。
本調査は,両技術時代における地理空間表現学習の総合的なレビューである。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:16:26 GMT)
CURIE: Evaluating LLMs On Multitask Scientific Long Context Understanding and Reasoning [12.4] 我々は、科学的な問題解決におけるLarge Language Models(LLM)の可能性を測定するためのベンチマークであるCURIEを紹介する。
このベンチマークでは、合計580の課題と6つの分野の専門家がキュレートしたソリューションペアを備えた10の課題が紹介されている。
CURIEのタスクには、ドメインの専門知識、長いコンテキスト内情報の理解、複数ステップの推論を必要とする、クローズドでオープンなLCMを幅広く評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:16:23 GMT)
Human Motion Prediction via Test-domain-aware Adaptation with Easily-available Human Motions Estimated from Videos [12.4] 3Dヒューマンモーション予測(HMP)では、従来の方法では、高価なモーションキャプチャーデータでHMPモデルを訓練する。
本稿では,簡単なビデオから推定されたポーズを用いて,HMPの学習能力を高めることを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:34:56 GMT)
Multi-Layer Hierarchical Federated Learning with Quantization [12.3] 階層型階層型学習フレームワーク(QMLHFL)を提案する。
QMLHFLは階層FLをネスト集約により任意の数の層とネットワークアーキテクチャに一般化する。
この結果から,QMLHFLは高いデータ不均一性の下でも,常に高い学習精度を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:47:13 GMT)
A Survey of 3D Reconstruction with Event Cameras: From Event-based Geometry to Neural 3D Rendering [12.3] イベントカメラは、ピクセルごとの明るさ変化を非同期にキャプチャする能力のために、3D再構成のための有望なセンサーとして登場した。
従来のフレームベースのカメラとは異なり、スパースで時間的に豊かなデータストリームを生成し、より正確な3D再構成を可能にする。
本調査は,イベント駆動型3次元再構築における総合的なリファレンスと今後の展開のロードマップとして機能することを目的としている。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:04:04 GMT)
A Large-scale Benchmark on Geological Fault Delineation Models: Domain Shift, Training Dynamics, Generalizability, Evaluation and Inferential Behavior [12.2] 本稿では,地震解析における領域シフト戦略の回答とガイドラインを提供するために設計された,最初の大規模ベンチマーク研究について述べる。
我々のベンチマークは、3つの異種データセットでトレーニングされ評価された200ドル以上のモデルを含んでいる。
我々の分析は、現在の微調整プラクティスの脆弱さ、破滅的な忘れの出現、そして、パフォーマンスを体系的に解釈することの難しさを強調している。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:56:43 GMT)
Empowering Vision Transformers with Multi-Scale Causal Intervention for Long-Tailed Image Classification [12.1] 因果推論は、クラス不均衡によって引き起こされるバイアスを扱うことによって、長い尾の分類を緩和する有望なアプローチとして現れてきた。
本稿では,既存の因果モデルがCNNおよびViT変種に与える影響について検討する。
微粒な因果関係を発見するための2段階因果関係モデリング手法であるTSCNetを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:23:55 GMT)
Strategy-Augmented Planning for Large Language Models via Opponent Exploitation [11.8] 大規模言語モデル(LLM)は、最近、一般的なタスクにおいて卓越した性能を示した。
LLMをベースとしたエージェントの攻撃的利用能力を大幅に向上させる2段階戦略拡張計画フレームワークを提案する。
我々は,SAPが頑健な一般化能力を示し,これまで遭遇していた相手戦略に対して効果的に実行可能であることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:41:10 GMT)
Template-Guided Reconstruction of Pulmonary Segments with Neural Implicit Functions [11.7] 肺がんの分節切除と外科的治療計画において,高品質な肺部分の3D再構成が重要な役割を担っている。
そこで我々は, 解剖学的, 正確な肺セグメント再構築を実現するために, 3次元表面を学習する神経暗黙関数に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:31:01 GMT)
Probability Consistency in Large Language Models: Theoretical Foundations Meet Empirical Discrepancies [11.6] 列のパープレキシティは、前方、後方、任意の置換を含む任意の因子化の下で不変であることを示す。
我々は,GPT-2モデルを前方,後方,任意の順序で科学的テキスト上で再訓練する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:52:19 GMT)
Automatic Curriculum Learning for Driving Scenarios: Towards Robust and Efficient Reinforcement Learning [11.6] 本稿では、強化学習(RL)を用いたエンドツーエンド自動運転エージェントの訓練の課題について述べる。
RLエージェントは通常、シミュレーションにおいて周囲の道路利用者の一定のシナリオと名目上の振る舞いで訓練される。
本稿では,エージェントの進化能力に基づいて,適応性のある複雑な運転シナリオを動的に生成する自動カリキュラム学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:26:57 GMT)
Measuring the Accuracy and Effectiveness of PII Removal Services [11.6] 本稿では,商業的個人識別情報(PII)除去システムについて,大規模な実証的研究を行った。
これらのサービスの一般的な例としては、DeleteMe、Mozilla Monitor、Incogniなどが挙げられる。
これらのサービスには、プライバシ向上技術としてのこれらのサービスの有用性を制限する、相当な精度とカバレッジの問題があることが分かりました。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:39:26 GMT)
WaveGuard: Robust Deepfake Detection and Source Tracing via Dual-Tree Complex Wavelet and Graph Neural Networks [11.6] WaveGuardは、堅牢性と非受容性を高めるプロアクティブな透かしフレームワークである。
本稿では,Dual-Tree Complex Wavelet Transform (DT-CWT) とStructure Consistency Graph Neural Network (SC-GNN) を用いて,透かしを高周波サブバンドに埋め込んだ。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:31:42 GMT)
Multi-Party Supervised Fine-tuning of Language Models for Multi-Party Dialogue Generation [11.3] 大規模言語モデル(LLM)は通常、ダイアディックや二者対話に参加するために微調整される。
本研究では,多人数対話データセットに基づくLLMのためのマルチパーティファインチューニングフレームワーク (MuPaS) を設計する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:10:40 GMT)
LibVulnWatch: A Deep Assessment Agent System and Leaderboard for Uncovering Hidden Vulnerabilities in Open-Source AI Libraries [11.3] LibVulnWatchは、オープンソースのAIライブラリのためのグラフベースのエージェントアセスメントフレームワークである。
5つの重要なドメインにまたがって、ガバナンスに沿ったスコアを生成する。
OpenSSF Scorecardチェックの88%をカバーし、ライブラリ毎に19のリスクを発生させる。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:58:11 GMT)
Tuning the Quantum Mpemba Effect in Isolated System by Initial State Engineering [11.2] 分離された非可積分量子系における量子Mpemba効果(QME)について検討する。
我々は、QMEの出現に影響を与える調節可能なメカニズムを同定し、ある非平衡状態から素早く緩和することを示す。
本稿では,量子シミュレータプラットフォーム上での複雑な制御を必要としない,実験的に実現可能な量子回路を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:24:44 GMT)
Hierarchical and Multimodal Data for Daily Activity Understanding [11.2] Daily Activity Recordings for Artificial Intelligence (DARai)は、現実の環境での人間の活動を理解するために構築されたマルチモーダルデータセットである。
DARaiは、10の異なる環境における50人の参加者による連続的なスクリプトと未記述の録音で構成され、合計200時間以上のデータである。
さまざまな機械学習モデルによる実験では、人間中心のアプリケーションにおける重要な課題を明らかにする上で、DARaiの価値が示されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:36:40 GMT)
Legacy Procurement Practices Shape How U.S. Cities Govern AI: Understanding Government Employees' Practices, Challenges, and Needs [10.9] 我々は、米国の都市の調達慣行がどのように公共セクターAIを取り巻く批判的な決定を形作るかについて、最初の実証的研究を行う。
都市のレガシーな調達慣行は、数十年前の法律や規範によって形作られています。
我々は、既存のAI調達改革イニシアチブによって完全に対処されていないが、動機づける3つの重要な課題を特定します。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:13:45 GMT)
Adaptive Diffusion Policy Optimization for Robotic Manipulation [10.9] アダムベース拡散ポリシー最適化(Adam-based Diffusion Policy Optimization、ADPO)は、ロボット制御タスクにおける微調整拡散に基づく警察のベストプラクティスを含む高速なアルゴリズムフレームワークである。
標準的なロボット制御タスクに関する広範な実験を行い、ADPOを試験し、特に6つの一般的な拡散型RL法をベンチマーク手法として提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:21:45 GMT)
S-EPOA: Overcoming the Indistinguishability of Segments with Skill-Driven Preference-Based Reinforcement Learning [10.7] 嗜好に基づく強化学習(PbRL)は、直接報酬信号として人間の嗜好を使用する。
従来のPbRL法は、しばしば、学習プロセスを妨げるセグメントの不明瞭さによって制約される。
本稿では,S-EPOA(Skill-Enhanced Preference Optimization Algorithm)を紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:30:16 GMT)
The Odyssey of the Fittest: Can Agents Survive and Still Be Good? [10.6] この研究は、軽量で適応的なテキストベースの冒険ゲームであるOdysseyを紹介した。
オデッセイは、生物学的ドライブを3つの異なるエージェントに実装することの倫理的意味を調べている。
分析によると、危険が増すと、エージェントの倫理的行動は予測不能になる。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:00:22 GMT)
AI Accelerators for Large Language Model In-ference: Architecture Analysis and Scaling Strategies [10.5] 大規模言語モデル(LLM)は推論のための特別なハードウェアの新しい波を駆動している。
本稿では,商用AIアクセラレータのワークロード中心,クロスアーキテクチャ性能に関する最初の研究について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:21:20 GMT)
FMNV: A Dataset of Media-Published News Videos for Fake News Detection [10.4] FMNVは,メディア組織によるニュースビデオで構成された新作のダセットである。
我々は,メディア公開ニュースを操作することで,コンテンツを自動生成するために,Large Language Models (LLMs) を採用している。
この研究は、メディアエコシステムにおいて、インパクトの高いフェイクニュースを検出するための重要なベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:09:20 GMT)
Open the Eyes of MPNN: Vision Enhances MPNN in Link Prediction [10.3] グラフビジョンネットワーク(GVN)と呼ばれる効果的なフレームワークを提案することにより、視覚構造を考慮したグラフニューラルネットワークを実現する。
GVNは、大規模グラフの挑戦を含む、7つのリンク予測データセットにわたるビジョン強化の恩恵を一貫して受けている。
このような改善は既存のSOTA(State-of-the-art)メソッドと互換性があり、GVNは新たなSOTA結果を得る。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:32:23 GMT)
SPAST: Arbitrary Style Transfer with Style Priors via Pre-trained Large-scale Model [10.2] 任意のスタイル転送は、コンテンツイメージの構造を保存し、スタイルイメージのスタイルを保持する、新しいスタイル化されたイメージをレンダリングすることを目的としている。
既存の任意のスタイル転送手法は、小さなモデルまたは訓練済みの大規模モデルに基づいている。
我々はSPASTと呼ばれる新しいフレームワークを提案し、推論時間が少なくて高品質なスタイリング画像を生成する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:54:36 GMT)
Calibrated and Sharp Uncertainties in Deep Learning via Density Estimation [10.2] 本稿では, キャリブレーションが重要であり, 維持が容易であることを論じる。
校正されたモデルを生成する再校正に基づく簡単なトレーニング手順を導入し、全体的な性能を犠牲にしない。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:08:24 GMT)
Building-Block Aware Generative Modeling for 3D Crystals of Metal Organic Frameworks [10.1] 金属-有機フレームワーク(MOF)は、無機ノード、有機エッジ、トポロジカルネットをプログラム可能な多孔質結晶に結合する。
既存のモデルは既知のビルディングブロックをリサイクルするか、小さなユニットセルに制限される。
本稿では,各ブロックの3次元全原子表現を学習するSE(3)同変拡散モデルであるビルディングブロック対応MOF拡散について紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:02:28 GMT)
Super-fast rates of convergence for Neural Networks Classifiers under the Hard Margin Condition [10.0] DNNは二乗損失代理と$ell_p$ペナルティによる経験的リスクを最小限に抑えることができ、ハードマージン条件下では、任意の大きさの$alpha>0$に対して$mathcalOleft(n-alpharight)$の有限サンプル超過リスクを達成できることを示す。
この証明は、独立した利害関係にある可能性のある過剰リスクの新たな分解に依存している。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:26:04 GMT)
InvDesFlow: An AI-driven materials inverse design workflow to explore possible high-temperature superconductors [9.9] InvDesFlowは、深層モデルの事前トレーニングと微調整技術、拡散モデル、物理ベースのアプローチを統合するAI検索エンジンである。
非常に小さなサンプルセットに基づいて,AIモデルにより予測される臨界温度がT_c geq$15Kと予測された74個の動的安定材料を得た。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:22:00 GMT)
Diffusion-VLA: Scaling Robot Foundation Models via Unified Diffusion and Autoregression [9.9] DiffusionVLAは、自己回帰モデルと拡散モデルとをシームレスに組み合わせ、ビジュモータポリシーを学習するフレームワークである。
自己推論によるポリシー学習を強化するために,新しい推論インジェクションモジュールを導入する。
複数の実ロボットを用いて広範に実験を行い,DiffusionVLAの有効性を検証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:37:27 GMT)
Clustering of Incomplete Data via a Bipartite Graph Structure [9.9] 本稿では,二部グラフモデルに基づくクラスタリング手法を提案する。
センターノードに関する情報を必要とせずに、不完全なデータからクラスタを推論できる。
重み付きデータを効果的に扱うように設計されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:06:13 GMT)
Grounding Synthetic Data Evaluations of Language Models in Unsupervised Document Corpora [9.9] 言語モデル(LM)は進化を続け、応答品質と一貫性を改善している。
モデル品質、応答適性、推論能力を評価するために、数多くの評価ベンチマークが作成されている。
本稿では,文書群を基盤としたファクトベース合成データモデル評価の自動化手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:50:03 GMT)
DSADF: Thinking Fast and Slow for Decision Making [9.8] RLエージェントと高速かつ直感的な意思決定のためのメモリ空間からなるシステム1と、深く解析的な推論のためのVLMによって駆動されるシステム2の2つの補完モジュールを統合するためのデュアルシステム適応決定フレームワーク(DSADF)を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:58:04 GMT)
Generalization in Monitored Markov Decision Processes (Mon-MDPs) [9.8] 多くの実世界のシナリオでは、報酬は常に観測可能であるわけではなく、モニターされたマルコフ決定プロセス(Mon-MDP)としてモデル化することができる。
本研究は,関数近似(FA)を用いてMon-MDPを探索し,関連する課題について検討する。
学習した報酬モデルと関数近似を組み合わせることで,監視対象状態から監視対象環境状態へ,監視対象状態から監視対象環境までの報酬を一般化できることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:58:25 GMT)
CHD: Coupled Hierarchical Diffusion for Long-Horizon Tasks [9.7] 拡散に基づくプランナーは、短期水平タスクでは強い性能を示してきたが、しばしば複雑な長期水平設定では失敗する。
本稿では,HLサブゴールとLL軌道を統一拡散過程内で共同でモデル化するフレームワークであるCoupled Hierarchical Diffusionを提案する。
迷路のナビゲーション、テーブルトップ操作、家庭環境における実験は、CHDがフラットな拡散ベースラインと階層的な拡散ベースラインの両方を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:28:39 GMT)
FareShare: A Tool for Labor Organizers to Estimate Lost Wages and Contest Arbitrary AI and Algorithmic Deactivations [9.6] デアクティベーション(Deactivation) - ギグワーカーのプラットフォームアクセスの突然の削除-典型的には、任意のAIとアルゴリズムによる決定を通じて、説明や会話はほとんどない。
これはアルゴリズム制御の最も厳しい形態の1つであり、労働者の経済的安定性を悪化させる。
近年の合衆国の政策は、不正な不活性化の期間に、プロセスのアピールと補償の回復を義務付けている。
FareShareは、不活性化ドライバーの損失賃金推定を自動化する計算ツールである。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:46:47 GMT)
Agent-as-a-Service based on Agent Network [9.5] 本稿では,RGPS(Role-Goal-Process-Service)標準に基づくサービス指向パラダイムであるエージェントネットワーク(A-AN)に基づくエージェント・アズ・ア・サービスを提案する。
A-ANは、構築、統合、相互運用性、ネットワーク化されたコラボレーションを含む、エージェントライフサイクル全体を統一する。
我々は,MASにおける長鎖協調の今後の研究を促進するために,1万個の長軸マルチエージェントを含むデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:15:19 GMT)
Generative AI for Urban Planning: Synthesizing Satellite Imagery via Diffusion Models [9.4] 我々は、土地利用記述、インフラ、自然環境に照らした高忠実な衛星画像を生成するために、制御ネットで拡張された最先端の安定拡散モデルを適用した。
米国の主要3都市からのデータを用いて,提案した拡散モデルが,土地利用形態,道路網,水域などによって,現実的で多様な都市景観を生成することを示す。
我々のモデルは高いFIDとKIDのスコアを達成し、多様な都市環境におけるロバスト性を実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:55:38 GMT)
Leveraging Multi-Modal Information to Enhance Dataset Distillation [9.3] 本稿では, キャプション誘導型監視とオブジェクト中心マスキングの2つの重要な拡張点について紹介する。
テキスト情報を統合するために,キャプション機能を利用する2つの手法を提案する。
包括的評価は、キャプションベースのガイダンスとオブジェクト中心マスキングを組み合わせることで、データセットの蒸留が促進されることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:20:11 GMT)
Block-Biased Mamba for Long-Range Sequence Processing [9.0] Mambaは入力依存力学を導入することで、初期の状態空間モデル(SSM)を拡張している。
長距離依存関係用に設計されたアーキテクチャ上に構築されているにもかかわらず、Mambaは長距離シーケンシャルなタスクでは不十分である。
本稿では,ブロックワイズ選択力学とチャネル固有バイアスを組み合わせた,MambaのS6ユニットの簡単な拡張を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:34:09 GMT)
SPAT: Sensitivity-based Multihead-attention Pruning on Time Series Forecasting Models [8.8] 本研究では,SPAT(textbfS$ensitivity $textbfP$runer for $textbfAt$tention)という構造化プルーニング手法を提案する。
データセットの実験では、SPATで処理されたモデルはMSEで2.842%、MAEで1.996%、FLOPで35.274%の削減を達成した。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:39:31 GMT)
VIViT: Variable-Input Vision Transformer Framework for 3D MR Image Segmentation [8.6] 自己教師型事前学習と分節微調整のためのトランスフォーマーベースのフレームワークである可変インプット ViT (VIViT) を提案する。
本手法は脳梗塞と脳腫瘍のセグメンテーションにおいて,Diceスコア0.624, 0.883で, 現在のCNNおよびViTモデルより優れていた。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:52:34 GMT)
Optimized Couplings for Watermarking Large Language Models [8.6] 大規模言語モデル(LLM)は、多くの場合、人間が生成したコンテンツと区別できないようなテキストを生成することができる。
本稿では,テキスト透かしをワンショットで解析する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:08:12 GMT)
Boosting Zero-shot Stereo Matching using Large-scale Mixed Images Sources in the Real World [8.6] ステレオマッチング法は、密度の高いピクセル単位の基底真理ラベルに依存している。
ラベル付きデータの不足と、合成画像と実世界の画像のドメインギャップは、注目すべき課題である。
視覚基盤モデルと大規模混合画像ソースの両方を活用する新しいフレームワーク textbfBooSTer を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:24:38 GMT)
DynamicDTA: Drug-Target Binding Affinity Prediction Using Dynamic Descriptors and Graph Representation [8.5] 我々はDTA予測を強化するために静的および動的タンパク質機能を組み込んだ革新的なディープラーニングフレームワークであるDynamicDTAを紹介する。
提案されたDynamicDTAは、薬物配列、タンパク質配列、動的記述子を含む3種類の入力を取る。
3つのデータセットに対する大規模な実験は、DynamicDTAが7つの最先端のベースライン手法と比較してRMSEスコアを少なくとも3.4%改善したことを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:34:48 GMT)
M3G: Multi-Granular Gesture Generator for Audio-Driven Full-Body Human Motion Synthesis [8.5] 本稿では,M3G(Multi-Granular Gesture Generator)という新しいフレームワークを提案する。
M3Gでは、動作パターンをトークン化し、異なる時間性から動作シーケンスを再構築する、新しいマルチグラニュラーVQ-VAEを提案する。
提案するM3Gフレームワークは、自然かつ表現力のあるフルボディのジェスチャーを生成するという点で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:16:58 GMT)
Policy-labeled Preference Learning: Is Preference Enough for RLHF? [8.4] 本研究では,行動政策情報を反映した,後悔を伴う人間の嗜好をモデル化することで,ミスマッチの可能性を解消するための政策ラベル付き嗜好学習(PPL)を提案する。
高次元連続制御タスクの実験は、PPLがオフラインのRLHF性能を大幅に改善し、オンライン環境での有効性を示した。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:50:08 GMT)
Bellman Unbiasedness: Toward Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation [8.4] 有限エピソードマルコフ決定過程における一般値関数近似を用いた分布強化学習の後悔の解析を行った。
証明可能なアルゴリズムである$textttSF-LSVI$を提案し、$tildeO(d_E Hfrac32sqrtK)$で、$H$は地平線、$K$はエピソード数、$d_E$は関数クラスの退化次元である。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:53:31 GMT)
TUMS: Enhancing Tool-use Abilities of LLMs with Multi-structure Handlers [8.3] 本稿では,大規模言語モデルのツール利用能力を高めるための新しいフレームワークであるTUMSを提案する。
本フレームワークは,(1)LLMがタスクをよりよく理解するためのユーザ意図を識別するインテント認識器,(2)複雑なタスクを単純なサブタスクに分解するタスク分解器,(3)高精度なパラメータを生成するマルチ構造ハンドラを備えたサブタスクプロセッサの4つで構成されている。
我々の実証研究は、TUMSフレームワークの有効性と効率を、平均19.6%と50.6%で証明した。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:57:28 GMT)
Addressing the Current Challenges of Quantum Machine Learning through Multi-Chip Ensembles [8.3] より小さな量子チップ間で高次元計算を分割するマルチチップアンサンブルVQCフレームワークを提案する。
このアプローチはバレンプラトーを緩和し、量子誤差バイアスと分散を低減し、制御された絡み合いによる堅牢な一般化を維持することを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:57:53 GMT)
SIM-Shapley: A Stable and Computationally Efficient Approach to Shapley Value Approximation [8.3] 共有値(SV)法は、複雑なモデルにおける特徴帰属の原則的な枠組みを提供するが、高い計算コストがかかる。
最適化にインスパイアされた安定かつ効率的な近似法である,共有値近似のための反復モーメント(SIM-Shapley)を提案する。
我々の数値実験では、SIM-Shapleyは最先端のベースラインと比較して計算時間を最大85%削減する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:23:10 GMT)
High-Quality Spatial Reconstruction and Orthoimage Generation Using Efficient 2D Gaussian Splatting [8.3] True Digital Orthophoto Maps(TDOM)を特徴付ける高精度な幾何精度と高密度画像特徴
本研究は2次元ガウススプラッティング(2DGS)に根ざした代替手法を提案する。
ディバイド・アンド・コンカ戦略は、リソースコストの低い高解像度のTDOMによる優れたGSトレーニングとレンダリングを実現する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:55:34 GMT)
Graph Attention is Not Always Beneficial: A Theoretical Analysis of Graph Attention Mechanisms via Contextual Stochastic Block Models [8.1] 構造ノイズが特徴雑音を超えると,グラフアテンション機構により分類性能が向上することを示す。
本稿では,単一層GATよりも優れたマルチレイヤグラフアテンションネットワーク(GAT)アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:37:55 GMT)
Beyond Single-Turn: A Survey on Multi-Turn Interactions with Large Language Models [8.1] 現実世界のアプリケーションは洗練されたマルチターンインタラクションを必要とする。
大規模言語モデル(LLM)の最近の進歩は、シングルターンタスクを扱う能力に革命をもたらした。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:14:08 GMT)
Reassessing Graph Linearization for Sequence-to-sequence AMR Parsing: On the Advantages and Limitations of Triple-Based Encoding [8.0] 我々は、ペンマンの符号化には深いAMRグラフの制限があると主張している。
本稿では, 3次元線形化法を提案し, その効率をペンマン線形化と比較する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:36:02 GMT)
TARGET: Automated Scenario Generation from Traffic Rules for Testing Autonomous Vehicles via Validated LLM-Guided Knowledge Extraction [8.0] TARGETは、トラフィックルールからテストシナリオを自動的に生成するエンドツーエンドフレームワークである。
交通ルールから知識を抽出するために,Large Language Model (LLM) を利用する。
TARGETはシナリオをシミュレーションでレンダリングするために実行可能なスクリプトを合成する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:33:57 GMT)
Enhancing the Efficiency of Complex Systems Crystal Structure Prediction by Active Learning Guided Machine Learning Potential [8.0] 我々は、高度に一般化され、データ効率のよい機械学習ポテンシャルを構築するための柔軟で自動化されたワークフローを提案する。
このワークフローはMg-Ca-H三元系とBe-P-N-O四元系の両方で検証される。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:34:34 GMT)
EventDiff: A Unified and Efficient Diffusion Model Framework for Event-based Video Frame Interpolation [8.0] ビデオフレーム補間(VFI)はコンピュータビジョンにおける基本的な課題である。
イベントカメラの最近の進歩により、これらの課題に対処する新たな機会が開けている。
VFIのための統合的で効率的なイベントベース拡散モデルフレームワークであるEventDiffを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:25:58 GMT)
Implet: A Post-hoc Subsequence Explainer for Time Series Models [7.9] 時系列モデルのための新しいポストホック説明器であるImpletを紹介する。
提案手法は,モデルの予測に大きく寄与する重要な時間セグメントを同定する。
本稿では,コホートに基づく(グループレベルの)説明フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:01:23 GMT)
An effcient variational quantum Korkin-Zolotarev algorithm for solving shortest vector problems [7.8] 最短ベクトル問題(SVP)を解決するための量子ビット要求を著しく低減する変分量子Korkin-Zolotarev(VQKZ)アルゴリズムを提案する。
提案したVQKZアルゴリズムは、元のSVPを投影された部分格子上の一連のサブプロブレムに変換することにより、格子次元61.39%のSVPインスタンスを、従来の方法で解けるものよりも解決することができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:32:21 GMT)
Monocular Depth Guided Occlusion-Aware Disparity Refinement via Semi-supervised Learning in Laparoscopic Images [7.8] 立体腹腔鏡画像の偏差推定には,咬合とラベル付き手術データの不足が重要な課題である。
これらの課題に対処するために,DGORNet(Depth Guided Occlusion-Aware Disparity Refinement Network)を提案する。
位置埋め込み(PE)モジュールは、空間的コンテキストを明示的に提供し、機能をローカライズし洗練するネットワークの能力を高めるために導入された。
SCAREDデータセットの実験では、DGORNetは End-Point Error (EPE) と Root Mean Squared Error (RMSE) で最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:29:56 GMT)
Decoding Neighborhood Environments with Large Language Models [7.8] 本研究では,大規模周辺環境を大規模に復号化するためのツールとして,大規模言語モデル(LLM)の実現可能性について検討する。
我々は,6つの環境指標を検出する上で,平均99.13%の精度を達成できるロバストYOLOv11モデルを訓練する。
次に、4つのLCMを評価し、これらの指標を識別する可能性、堅牢性、限界を評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:54:54 GMT)
DexVLA: Vision-Language Model with Plug-In Diffusion Expert for General Robot Control [7.6] 視覚言語アクション(VLA)モデルは、一般化可能なロボットスキルを約束している。
現在のVLAモデルは視覚言語モデル(VLM)コンポーネントのスケーリングに重点を置いていることが多いが、アクション空間の表現は依然として重要なボトルネックである。
本稿では,複雑な長期タスクに対するVLAの効率性と一般化能力を向上する新しいフレームワークであるDexVLAを紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:55:53 GMT)
Synthetic Politics: Prevalence, Spreaders, and Emotional Reception of AI-Generated Political Images on X [7.5] われわれは、2024年のアメリカ合衆国大統領選挙に関連するTwitter/Xの大規模なデータセットを分析した。
共有画像の約12%がAI生成として検出され、約10%のユーザがAI生成画像の80%を共有していることがわかった。
スーパースプレッダーのAI画像ツイートは、AI以外の画像ツイートよりもポジティブで有害な反応を誘発する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:12:13 GMT)
RepCali: High Efficient Fine-tuning Via Representation Calibration in Latent Space for Pre-trained Language Models [7.4] 微調整事前学習言語モデル(PLM)は、下流タスクにPLMを適用する上で、主要なパラダイムとなっている。
本稿では,潜在空間におけるPLM表現の校正を学習することで,この問題に対処する。
提案する表現キャリブレーション法(RepCali)では,エンコーダの後,特定のキャリブレーションブロックを潜在空間に統合し,デコーダ入力としてキャリブレーション出力を使用する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:47:00 GMT)
VizCV: AI-assisted visualization of researchers' publications tracks [7.2] VizCVは、新しいWebベースのエンドツーエンドのビジュアル分析フレームワークである。
AI支援分析を取り入れ、キャリア進化の自動報告をサポートする。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:47:59 GMT)
ALOHA: Empowering Multilingual Agent for University Orientation with Hierarchical Retrieval [7.0] 大学指向の階層的検索により強化された多言語エージェントであるALOHAを紹介する。
システムは配備され、12,000人以上のサービスを提供している。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:01:03 GMT)
LLMSR@XLLM25: Less is More: Enhancing Structured Multi-Agent Reasoning via Quality-Guided Distillation [6.9] 本稿では,LLMSR@XLLM25構造推論タスクにおける3位獲得手法であるLess is Moreを提案する。
提案手法は,逆プロンプト誘導,GPT-4oによる検索拡張推論合成,二段階報酬誘導フィルタリングを用いたマルチエージェントフレームワークを活用する。
全てのモジュールはメタラマ-3-8B-インストラクトからLoRA+を統一した構成で微調整される。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:12:49 GMT)
Sensitivity-Constrained Fourier Neural Operators for Forward and Inverse Problems in Parametric Differential Equations [6.9] du/dt = f(u, x, t, p) という形のパラメトリック微分方程式は、科学や工学において基本的なものである。
フーリエニューラル演算子(FNO)のようなディープラーニングフレームワークは、解を効率的に近似することができるが、逆問題、感度推定(du/dp)、概念ドリフトに苦労する。
我々は、感度制約のあるフーリエニューラル演算子(SC-FNO)と呼ばれる感度に基づく正則化戦略を導入することで、これらの制限に対処する。
SC-FNOは解経路の予測において高い精度を達成し、物理インフォームド正規化により標準FNOとFNOを一貫して上回る。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:54:10 GMT)
Learning Treatment Allocations with Risk Control Under Partial Identifiability [6.9] 患者に対する適切な治療アロケーションの学習は、精密医療において重要な課題である。
そこで本研究では,部分的特定環境での有限サンプルによる治療リスクを制御するための認証学習手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:22:18 GMT)
ImprovNet -- Generating Controllable Musical Improvisations with Iterative Corruption Refinement [6.9] ImprovNetは、表現力と制御性のある即興演奏を生成するトランスフォーマーベースのアーキテクチャである。
ジャンル固有のスタイルでメロディーを調和させ、短期間の即時継続および補充タスクを実行することができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:11:26 GMT)
Parameter Estimation using Reinforcement Learning Causal Curiosity: Limits and Challenges [6.9] 因果好奇心は、直接測定することなく、できるだけ正確に効率的に推定することを目的としている。
本稿では,この手法の今後のポテンシャルと現在の限界を計測精度で解析する。
本研究の結果,我々は因果好奇心法の改良と効率的な設計の提案を推し進めた。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:30:51 GMT)
Majority is not Needed: A Counterstrategy to Selfish Mining [6.8] 特に、他のプールが利己的な鉱業や他の先進的な戦略を採っている場合、誠実さは必ずしもインセンティブを与えるものではない。
この反ストラテジーは、いかなる先進的な戦略にも効果的に対抗でき、その可能性さえも、他の先進的な戦略の実装を妨げていることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:28:47 GMT)
A primal-dual perspective for distributed TD-learning [6.7] 本研究の目的は,ネットワーク型マルチエージェントマルコフ決定プロセスにおける分散時間差(TD)学習について検討することである。
提案手法は分散最適化アルゴリズムに基づいており、これはヌル空間制約を受ける原始双対常微分方程式(ODE)の力学として解釈できる。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:50:51 GMT)
QRA++: Quantified Reproducibility Assessment for Common Types of Results in Natural Language Processing [6.7] QRA++は3段階の粒度で連続的な評価の度合いを生成する定量的な評価手法である。
比較実験の3つの例にQRA++を適用して説明する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:04:04 GMT)
LLMs meet Federated Learning for Scalable and Secure IoT Management [6.6] 従来の集中型アーキテクチャは、レイテンシ、プライバシの懸念、リソースの過剰消費に悩まされている。
本稿では,IoTシステムインテリジェンスの向上を目的とした,FL-LLM(Federated Learning-driven Large Language Model)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:49:49 GMT)
LLM-Based Threat Detection and Prevention Framework for IoT Ecosystems [6.6] 本稿では,IoT環境における包括的脅威検出と防止のためのLarge Language Model(LLM)ベースのフレームワークを提案する。
このシステムは、IoT固有のデータセットに微調整された軽量LLMを統合し、リアルタイム異常検出と自動化されたコンテキスト認識緩和戦略を実現する。
シミュレーションIoT環境での実験結果は、従来のセキュリティメソッドよりも検出精度、応答レイテンシ、リソース効率が大幅に向上したことを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:02:38 GMT)
Towards a Formal Theory of the Need for Competence via Computational Intrinsic Motivation [6.6] 人工知能から得られるフォーマリズムは、どのようにして肥大した出発点を提供するかを示す。
我々は,自己決定理論における「能力の必要性」に焦点をあてる。
これらの定式化を用いて、SDTが明示に失敗する前提条件を明らかにする。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:21:16 GMT)
Enhancing Cache-Augmented Generation (CAG) with Adaptive Contextual Compression for Scalable Knowledge Integration [6.4] キャッシュ拡張ジェネレーション(CAG)は、検索拡張ジェネレーション(RAG)に代わる有望な代替手段として登場した。
本稿では,文脈入力を動的に圧縮・管理する技術である適応文脈圧縮(ACC)を紹介する。
本稿では、選択検索を統合し、追加情報を必要とするシナリオにおける事前ロードコンテキストを拡大するハイブリッドCAG-RAGフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:24:48 GMT)
A Multi-scale Representation Learning Framework for Long-Term Time Series Forecasting [6.3] 長期時系列予測(LTSF)は、エネルギー消費や天気予報といった実用的な設定において幅広い用途を提供する。
この研究は、多粒度情報の最適部分利用を含むLTSFの重要な問題に直面している。
提案手法は,様々なスケールにわたる明瞭で同時的な予測を用いて,複雑な時間的ダイナミクスを適切に解き放つ。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:26:44 GMT)
Learning Optimal Classification Trees Robust to Distribution Shifts [6.3] トレーニングとテスト/デプロイデータ間の分散シフトに頑健な分類木を学習する際の問題点を考察する。
混合整数型ロバスト最適化技術に基づく最適ロバスト分類木を学習する手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:10:16 GMT)
Total Variation-Based Image Decomposition and Denoising for Microscopy Images [6.2] 実験的に取得された顕微鏡画像は、ノイズやその他の望ましくない信号の存在によって必然的に影響を受ける。
本研究は、全変動(TV)に基づくワークフローによる顕微鏡画像の分解と復調に焦点を当てたものである。
提案手法は,望ましくない信号成分を抽出し,生信号成分から抽出するか,あるいはノイズを除去することによって画像の復元を行う。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:14:00 GMT)
PCS-UQ: Uncertainty Quantification via the Predictability-Computability-Stability Framework [6.2] 本稿では,検証データ科学における予測可能性,計算可能性,安定性の枠組みに基づく信頼性の高い不確実性定量化(UQ)手法を提案する。
PCS-UQは予測チェックを使用してモデル選択に対処し、不適切なモデルをスクリーニングする。
PCS-UQは、これらのスクリーニングされたアルゴリズムを複数のブートストラップに適合させ、サンプル間の変動とアルゴリズムの不安定性を評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:58:16 GMT)
Integrating Natural Language Processing and Exercise Monitoring for Early Diagnosis of Metabolic Syndrome: A Deep Learning Approach [6.1] メタボリックシンドローム(MetS)は、腹部肥満、インスリン抵抗性、高血圧、高脂血症を特徴とする薬物療法である。
本研究の目的は,MetSの診断に,日常的に容易に得られる運動関連活動に関する最も少ない生理的データと自由テキストを使用することである。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:48:36 GMT)
Quantum gyroscope based on the cavity magnomechanical system [6.1] ノイズ発生環境における高精度な回転角測定は、航空宇宙工学、軍用航法、および関連する領域において重要な不規則な距離を保っている。
本稿では,ハイブリッド光磁気相互作用を利用した高精度回転角検出を可能にするキャビティ磁気力学系に基づく量子ジャイロ法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:49:16 GMT)
Dynamic Snake Upsampling Operater and Boundary-Skeleton Weighted Loss for Tubular Structure Segmentation [5.9] 本稿では,トポロジカルな管状構造物に適した動的ヘビ吊り上げ演算子と境界スケルトン重み付き損失を導入する。
様々なドメインデータセットとバックボーンネットワークにわたる実験により、このプラグアンドプレイのダイナミックスネークアップサンプリング演算子とバウンダリ・スケルトン重み付き損失は、ピクセルワイドセグメンテーション精度と結果のトポロジ的整合性の両方を促進することが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:56:59 GMT)
Inference Attacks for X-Vector Speaker Anonymization [5.9] 我々は、xベクトル話者匿名化のプライバシーとユーティリティのトレードオフを再考する。
匿名化のための新しい推論攻撃を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:42:33 GMT)
Learning Like Humans: Advancing LLM Reasoning Capabilities via Adaptive Difficulty Curriculum Learning and Expert-Guided Self-Reformulation [5.8] 本稿では,大規模言語モデルの複雑な問題を解決する能力を高めるための2つの新しい戦略を提案する。
まず,適応困難カリキュラム学習(adaptive Difficulty Curriculum Learning,ADCL)は,難易度シフト(Difficulty Shift)現象に対処する新しいカリキュラム学習戦略である。
第2に、Expert-Guided Self-Reformulation(EGSR)は、模倣学習と純粋探索のギャップを埋める新しい強化学習戦略である。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:10:48 GMT)
GBT-SAM: Adapting a Foundational Deep Learning Model for Generalizable Brain Tumor Segmentation via Efficient Integration of Multi-Parametric MRI Data [5.8] GBT-SAMはパラメータ効率のよいディープラーニングフレームワークで,Segment Anything Modelをmp-MRIデータに適用する。
本モデルは,深度認識モジュールを組み込んだ2段階の微調整戦略により,スライス間相関を抽出する。
BraTSアダルトグリオーマデータセットで93.54のDiceスコアを達成し、メニンギオーマ、小児グリオーマ、サブサハラグリオーマデータセットで堅牢なパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:15:21 GMT)
A document processing pipeline for the construction of a dataset for topic modeling based on the judgments of the Italian Supreme Court [5.6] トピックモデリングに最適化された匿名化データセットを生成する文書処理パイプラインを開発した。
パイプラインは文書レイアウト解析(YOLOv8x)、光学文字認識、テキスト匿名化を統合している。
OCRのみの手法と比較して,多様性スコア0.6198,コヒーレンススコア0.6638でトピックモデリングを改善した。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:06:24 GMT)
How Do OSS Developers Reuse Architectural Solutions from Q&A Sites: An Empirical Study [5.6] 開発者はQ&Aサイトでプログラミング関連の知識を再利用する。
それらの問題を解決するために、Q&Aサイトのアーキテクチャソリューションの7つのカテゴリが再利用されている。
OSS開発者は、SOのアーキテクチャソリューションを組み込むためのアドホックな方法に頼ることが多い。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:01:13 GMT)
A Large-Scale Empirical Analysis of Custom GPTs' Vulnerabilities in the OpenAI Ecosystem [5.5] 我々は、14,904個のカスタムGPTを分析し、7つの悪用可能な脅威に対する感受性を評価する。
以上の結果から,95%以上のカスタムGPTには適切なセキュリティ保護が欠如していることが判明した。
これらの結果は、セキュリティ対策の強化とコンテンツモデレーションの厳格化に対する緊急の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:51:07 GMT)
Ask, Fail, Repeat: Meeseeks, an Iterative Feedback Benchmark for LLMs' Multi-turn Instruction-following Ability [5.4] textbfMeeseeks (Mr. Meeseeks from textitRick and MortyfootnoteRick and Morty)は、ジャスティン・ロイランド(Justin Roiland)とダン・ハーモン(Dan Harmon)がカートゥーン・ネットワーク(Cartoon Network)の夜間プログラミングブロック、アダルト・スイム(Ault Swim)のために制作したアメリカのアダルト・フィクションのシットコム。
Meeseeksは反復的なフィードバックフレームワークを通じて現実的な人間とLLMのインタラクションをシミュレートする。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:14:03 GMT)
TT-DF: A Large-Scale Diffusion-Based Dataset and Benchmark for Human Body Forgery Detection [5.3] そこで本研究では,1,378,857個の合成フレームを備えた6,120本の鍛造ビデオを含む,大規模な拡散型フォージェリーデータセットを提案する。
目的は、可能な限り網羅的に、潜在的に見えない偽造データをシミュレートすることであり、TT-DFのベンチマークも実施することである。
実験の結果,TOF-NetはTT-DFで良好な性能を示し,現在最先端の顔偽造検出モデルより優れていることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:01:25 GMT)
LLM-Based Detection of Tangled Code Changes for Higher-Quality Method-Level Bug Datasets [5.2] 本研究では,コミットメッセージとメソッドレベルのコード差分の両方を活用することで,絡み合ったコード変化を検出するための大規模言語モデルの有用性について検討する。
以上の結果から,コミットメッセージとコード差分を組み合わせることでモデル性能が著しく向上し,F1スコアの0.88が達成された。
これらの発見は、主にノイズフリーなバグデータセットが欠如していることから、メソッドレベルのバグ予測がオープンな研究課題であり続けているため、研究コミュニティにとって有益である。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:26:13 GMT)
Estimation of Food Intake Quantity Using Inertial Signals from Smartwatches [5.2] 本稿では,市販スマートウォッチの噛み込み重量を推定するための新しいアプローチを提案する。
私たちの公開データセットには、10人の参加者によるスマートウォッチ慣性データが含まれています。
提案手法は,食材を装填するのに要する時間などの抽出された行動特徴と慣性信号の統計的特徴を組み合わせ,噛み重量を推定するための支持ベクトル回帰モデルへの入力として機能する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:29:57 GMT)
Density Ratio-based Causal Discovery from Bivariate Continuous-Discrete Data [5.1] 連続変数の条件密度比の単調性を分析することによって因果方向を決定する新しい手法を提案する。
我々の理論的解析は、連続変数が離散変数を引き起こすとき条件密度比が単調性を示すが、逆方向ではないことを示す。
この特性は、異なるタイプの変数間の因果方向を、強い分布仮定や情報内容の違いから生じる偏見を伴わずに比較するための、原則化された基礎を提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:18:41 GMT)
Scaling Context, Not Parameters: Training a Compact 7B Language Model for Efficient Long-Context Processing [5.1] 512Kのコンテキスト長をサポートする言語モデルであるMegaBeam-Mistral-7Bを提案する。
本研究は,長期学習における現実的な制約に対処し,コンプライアンス監視や検証などの現実的なタスクをサポートする。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:13:15 GMT)
Entanglement Islands from Hilbert Space Reduction [5.1] ヒルベルト空間に残されている全ての状態に対して、その状態が別の部分集合$mathcalR_a$の状態にエンコードされている部分集合$I_a$が存在することを示す。
このようなシステムを自己符号化と呼び、そのようなシステムの絡み合いエントロピーは、新しい島式によって計算されるべきであることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:14:15 GMT)
Low-Complexity Inference in Continual Learning via Compressed Knowledge Transfer [5.1] 継続学習(CL)は、以前獲得した知識を忘れずに一連のタスクを学習できるモデルを訓練することを目的としている。
近年、大きな事前学習モデルがCLで広く採用されている。
クラス増分学習に適した2つの効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:07:40 GMT)
TRAIL: Trace Reasoning and Agentic Issue Localization [5.0] この研究は、エージェントワークフロートレースに対する堅牢でダイナミックな評価方法の必要性を明確に示している。
我々は,この分類法を用いて構築され,確立されたエージェント・ベンチマークに基づいて構築された148個の大型人名跡(TRAIL)について述べる。
生態学的妥当性を確保するため,単一エージェントシステムとマルチエージェントシステムの両方のトレースをキュレートする。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:55:31 GMT)
Equipping Sketch Patches with Context-Aware Positional Encoding for Graphic Sketch Representation [5.0] 文脈認識型位置符号化(PE)によるスケッチパッチの装備による変分描画保護手法を提案する。
実験結果から,本手法はスケッチのヒーリングと制御可能なスケッチ合成を大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:25:01 GMT)
Probabilistic Wind Power Forecasting via Non-Stationary Gaussian Processes [5.0] 一般化されたスペクトル混合カーネルを組み込んだ非定常GPフレームワークを提案する。
実世界のSCADAデータを用いて提案モデルの性能を評価する。
その結果,風力予測における非定常性のモデル化の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:46:33 GMT)
Extreme Conformal Prediction: Reliable Intervals for High-Impact Events [4.9] 極値統計と共形予測を橋渡し、信頼性と情報的予測間隔を提供する。
この極端な等角予測手法の利点はシミュレーション研究や洪水リスク予測への応用で説明される。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:54:36 GMT)
Lower Bounds on the MMSE of Adversarially Inferring Sensitive Features [4.9] 本稿では,有限標本サイズと線形予測モデルに基づく,感度の高い特徴推論のための逆評価フレームワークを提案する。
提案手法は,他の相関特徴の雑音観測から感度特性を推定する真のMMSEの理論的下界を確立する。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:39:24 GMT)
Not that Groove: Zero-Shot Symbolic Music Editing [4.9] 私たちは象徴的な音楽編集に最初に取り組みました。
ゼロショットプロンプト付きLPMがドラム溝を効果的に編集できることを実証する。
成功のレシピは、LCMと音楽とを相互作用する創造的に設計されたフォーマットである。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:33:36 GMT)
Are We Paying Attention to Her? Investigating Gender Disambiguation and Attention in Machine Translation [4.9] 最小ペア精度(MPA)と呼ばれる新しい評価指標を提案する。
MPAは、モデルが最小ペアで性別に適応するかどうかに焦点を当てている。
MPAは、反ステレオタイプの場合、NMTモデルは男性的な性別の手がかりを考慮に入れやすいことを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:17:23 GMT)
GraphSparseNet: a Novel Method for Large Scale Traffic Flow Prediction [4.9] ディープラーニング、特にグラフNNによる最近の進歩は、複雑なダイナミクスによってこれらの予測の精度を大幅に向上させた。
しかし、GraphSparseNetはモデル複雑さが指数関数的に増大しているため、依然として課題である。
本稿では,GNNトラフィックベース予測モデルの精度とスケーラビリティを両立させる新しいフレームワークであるGraphSparseNetを紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:38:27 GMT)
Continuous World Coverage Path Planning for Fixed-Wing UAVs using Deep Reinforcement Learning [4.9] 無人航空機 (UAV) カバー・パス・プランニング (CPP) は、精密農業や捜索救助などの応用において重要である。
連続環境におけるUAV CPP問題を定式化し、完全カバレッジを確保しつつ消費電力を最小化する。
提案手法は, 曲率制約付きB'ezier曲線を用いた可変サイズ軸整形矩形とUAV運動を用いて環境をモデル化する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:29:16 GMT)
A Practical Introduction to Deep Reinforcement Learning [4.7] 本チュートリアルは,深層強化学習(DRL)の簡潔で直感的で実践的な導入を目的としたチュートリアルである。
我々は全アルゴリズムをGPI(Generalized Policy Iteration)フレームワークで整理し、読者に統一的で体系的な視点を提供する。
長い理論的な証明の代わりに、直感的な説明、図解的な例、実践的な技術技術を強調します。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:19:16 GMT)
SafeMate: A Modular RAG-Based Agent for Context-Aware Emergency Guidance [4.7] 我々は、一般的なユーザーに正確なコンテキスト認識ガイダンスを提供する検索強化AIアシスタントであるSafeMateを紹介する。
Model Context Protocol (MCP) 上に構築されたSafeMateは、ユーザクエリを動的にドキュメント検索、チェックリスト生成、構造化要約のためのツールにルーティングする。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:03:27 GMT)
Simulating and Analysing Human Survey Responses with Large Language Models: A Case Study in Energy Stated Preference [4.7] ステートド・リセプション(SP)調査は、仮説的、潜在的に未来的なシナリオにおいて、個人がどのようにトレードオフを行うかを研究者が理解するのに役立ちます。
本研究では,エネルギー関連SP調査における消費者選択をシミュレートする大規模言語モデル (LLM) について検討した。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:38:19 GMT)
PSBench: a large-scale benchmark for estimating the accuracy of protein complex structural models [4.7] タンパク質複合体構造を予測することは、タンパク質の機能解析、タンパク質設計、薬物発見に不可欠である。
PSBenchは4つの大規模ラベル付きデータセットからなるベンチマークスイートである。
PSBenchには、幅広いタンパク質配列の長さ、複雑な確率論、機能クラス、モデリング困難を含む100万以上の構造モデルが含まれている。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:47:12 GMT)
Identifying Memorization of Diffusion Models through p-Laplace Analysis [4.6] 拡散モデルは、基礎となる確率分布に直接アクセスすることなくスコア関数を推定する。
ここでは、記憶されたトレーニングデータを特定するためにこれらの演算子を使用できることを示す。
学習したスコア関数に基づいた数値的なp-Laplace近似を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:52:15 GMT)
Detecting Prefix Bias in LLM-based Reward Models [4.6] 選好データセットに基づいて訓練された報酬モデルにおいて,プレフィックスバイアスを検知し,評価するための新しい手法を提案する。
これらの指標を活用して、人種と性別の異なる嗜好モデルにおける大きなバイアスを明らかにします。
本研究は,公正かつ信頼性の高い報酬モデルを開発する上で,バイアス対応データセットの設計と評価を重要視するものである。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:50:03 GMT)
High-order Regularization for Machine Learning and Learning-based Control [4.5] 本稿では,機械学習のための新しい正規化手法を提案する。
提案手法は近似アルゴリズムの証明可能な収束を保証する。
ニューラルネットワークの一般化性は、適切な正規化行列で最大化できることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:00:23 GMT)
Transfer Learning of Surrogate Models: Integrating Domain Warping and Affine Transformations [4.5] サロゲートモデルは、計算的に要求される現実世界のプロセスに効率的な代替手段を提供する。
従来の研究では、微分可能および非微分可能サロゲートモデルの移動について研究されてきた。
本稿は、より広い範囲のトランスフォーメーションに対処することで、これまでの研究を拡張している。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:49:36 GMT)
Bounding Neyman-Pearson Region with $f$-Divergences [4.4] 単純二項仮説検定のナイマン・ピアソン領域(Neyman-Pearson region)は、ある検定の偽陽性率と偽陰率を表す点の集合である。
我々は、任意の$f$-divergenceという観点で境界に対する新しい下界を確立する。
任意のナイマン・ピアソン境界を概あるいは正確に実現できる分布の対を構成する方法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:42:10 GMT)
Crossing Boundaries: Leveraging Semantic Divergences to Explore Cultural Novelty in Cooking Recipes [4.3] 社会的要因、特に文化的背景は、新規性と革新に対する認識に大きな影響を及ぼす。
文化的ノベルティは、異なるコミュニティ間の距離によって形成されたサリエンスとノベルティの相違から生じる。
本稿では,社会学と経営学の知識を統合する学際的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:38:23 GMT)
Thermal Detection of People with Mobility Restrictions for Barrier Reduction at Traffic Lights Controlled Intersections [4.3] コンピュータビジョンのためのディープラーニングの急速な進歩は、RGBカメラベースの適応的な交通信号システムの採用を促している。
RGBカメラの使用は、悪天候や低視認性条件下での検知性能の制限など、重大な課題を呈している。
本稿では,歩行障害のある人や移動負担のある人に対して,信号の持続時間を動的に調整する,完全自動熱検知方式のトラヒックライトシステムを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:44:21 GMT)
LLM-based Prompt Ensemble for Reliable Medical Entity Recognition from EHRs [4.3] 本稿では,大規模言語モデル(LLM)を用いた即時医療機関認識について検討する。
即発アンサンブルのGPT-4oはF1スコア0.95、リコール0.98で最高評価を達成した。
アンサンブル法は、埋め込みベースの類似性と多数決によって出力を集約することで信頼性を向上させた。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:11:29 GMT)
Universal Structure of Computing Moments for Exact Quantum Dynamics: Application to Arbitrary System-Bath Couplings [4.3] オープン量子系における相関関数の高次モーメントの計算方法を提案する。
我々の発見は、複雑なオープン量子系に対する正確な力学への有望な道のりを示唆している。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:35:30 GMT)
Lie Group Symmetry Discovery and Enforcement Using Vector Fields [4.2] 我々は、非アフィン対称性発見の概念をニューラルネットワークによって定義される関数に拡張する。
ベクトル場を用いた滑らかなモデルの対称性強制を導入する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:24:46 GMT)
Automated Model-Free Sorting of Single-Molecule Fluorescence Events Using a Deep Learning Based Hidden-State Model [4.2] DASHはトレース分類、状態割り当て、自動ソートのための完全に合理化されたアーキテクチャである。
本稿では, 単分子蛍光イベントの自動的, 詳細なソートのための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:26:33 GMT)
Evaluating the Effectiveness of Black-Box Prompt Optimization as the Scale of LLMs Continues to Grow [4.1] 大規模言語モデル(LLM)の整合性を高めるために入力プロンプトを精算するための有望な戦略としてブラックボックスプロンプト最適化法が登場した。
3つの有名なブラックボックス最適化手法を評価し、4つのNLUおよびNLGデータセットにわたる大規模LCM(DeepSeek V3およびGemini 2.0 Flash)で評価する。
その結果、これらのブラックボックスプロンプト最適化手法は、これらの大規模LLMに対して限定的な改善しか提供しないことがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:26:56 GMT)
The Sponge is Quantum Indifferentiable [4.0] スポンジは、公開置換をハッシュ関数に変換する暗号構造である。
SHA-3は、世界中で採用される予定のほとんどのポスト量子公開鍵暗号スキームの中核的なコンポーネントである。
我々は、スポンジが量子敵に対するランダムなオラクルと区別できないことを証明した。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:05:17 GMT)
Decoupled Multimodal Prototypes for Visual Recognition with Missing Modalities [3.9] マルチモーダル学習は、複数のデータモダリティから情報を知覚し、理解することで、ディープラーニングモデルを強化する。
既存のアプローチのほとんどは、現実のアプリケーションでしばしば失敗する前提として、すべてのモダリティの可用性を前提としています。
最近の研究は、欠落したモダリティによる性能劣化を軽減するために学習可能な欠落事例認識プロンプトを導入している。
個別のモダリティに適合したクラスワイドプロトタイプを欠落ケース認識する新しいデカップリング型プロトタイプベース出力ヘッドを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:53:37 GMT)
OnPrem.LLM: A Privacy-Conscious Document Intelligence Toolkit [3.8] 我々は,大規模言語モデル(LLM)を機密性の高い非公開データに適用するためのPythonベースのツールキットであるOnPrem$.$LLMを提案する。
このシステムはプライバシ保護のユースケース用に設計されており、ドキュメント処理とストレージのためのプレビルドパイプラインを提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:43:26 GMT)
Genus expansion for non-linear random matrix ensembles with applications to neural networks [3.8] 本研究では,ある非線形ランダム行列アンサンブルと関連するランダムニューラルネットワークを統一的に研究する手法を提案する。
我々は、ファア・ディ・ブルーノの公式を任意の数の合成に一般化するニューラルネットワークに対して、新しい級数展開を用いる。
応用として、ランダムな重みを持つニューラルネットワークについて、いくつかの結果を証明した。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:37:08 GMT)
Knowledge-Informed Deep Learning for Irrigation Type Mapping from Remote Sensing [3.8] 衛星画像のスペクトル特徴のみに依存する既存のモデルは、農業景観の複雑さと限られた訓練データのために効果がない。
本稿では,特殊なプロジェクション行列を用いて農作物を灌水確率にエンコードする,スウィントランスフォーマーに基づく新しいアプローチであるKnowledge-Informed Irrigation Mapping(KIIM)を提案する。
合衆国の5州での実験では、ベースラインよりも22.9%(IoU)の改善があり、71.4%(IoU)の改善が図られている。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:25:28 GMT)
RT-GAN: Recurrent Temporal GAN for Adding Lightweight Temporal Consistency to Frame-Based Domain Translation Approaches [3.8] 本稿では,個別のフレームベースアプローチに時間的整合性を加えるための,可変時間パラメータRT-GANを用いた軽量な解を提案する。
大腸内視鏡検査における2症例に対するアプローチの有効性について検討した。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:31:47 GMT)
Fusing Bidirectional Chains of Thought and Reward Mechanisms A Method for Enhancing Question-Answering Capabilities of Large Language Models for Chinese Intangible Cultural Heritage [3.8] 本稿では,思考の双方向連鎖と報酬機構を統合した新しい学習手法を提案する。
この手法は、無形文化財の分野に特化して設計された大きな言語モデルであるICH-Qwenに基づいている。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:05:25 GMT)
Hyperbolic Contrastive Learning with Model-augmentation for Knowledge-aware Recommendation [3.8] メタボリック・コントラスト学習とモデル拡張を併用した知識認識型推薦手法を提案する。
固有階層グラフ構造を捉えるために,我々はまず,新しいローレンツ的知識集約機構を設計する。
次に,ハイパーボリックなコントラスト学習を支援する3つのモデルレベル拡張手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:30:27 GMT)
Clicking some of the silly options: Exploring Player Motivation in Static and Dynamic Educational Interactive Narratives [3.8] モチベーションは、学習を成功させる上で重要な要素である。
従来の研究では、静的な対話型物語ゲームがモチベーションに与える影響が実証されている。
我々は、研究倫理に関する選択型インタラクティブな物語ゲームであるAcademicalの2つのバージョンを比較した。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:27:25 GMT)
Joint Metric Space Embedding by Unbalanced OT with Gromov-Wasserstein Marginal Penalization [3.7] 異種データセットの教師なしアライメントのための新しい手法を提案する。
本手法は,Gromov-Wasserstein境界化を用いた不均衡最適輸送問題に基づく。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:24:45 GMT)
CHOICE: Benchmarking the Remote Sensing Capabilities of Large Vision-Language Models [3.7] CHOICEは、大規模視覚言語モデル(VLM)の階層的リモートセンシング能力を客観的に評価するために設計されたベンチマークである。
リモートセンシングに不可欠な2つの主機能次元(知覚と推論)に着目し,さらに6つの二次的次元と23の葉のタスクを分類し,十分に包括された評価範囲を確保する。
新たにキュレートされたデータと、決定的な回答を伴う複数選択質問の形式は、客観的で直接的なパフォーマンス評価を可能にします。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:32:16 GMT)
Foundation Models Knowledge Distillation For Battery Capacity Degradation Forecast [3.7] 本研究は,時系列基礎モデルの劣化を考慮した微調整戦略を提案する。
リリースしたCycleLife-SJTUIEデータセットの検証は、微調整されたバッテリタイマーが強力なゼロショットの一般化能力を持っていることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:03:35 GMT)
Attention-based Generative Latent Replay: A Continual Learning Approach for WSI Analysis [3.7] 全体スライド画像(WSI)分類は、計算病理学において強力なツールとして登場したが、ドメインシフトによって制約されている。
本稿では,Attention-based Generative Latent Replay Continual Learning framework (AGLR-CL) を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:55:46 GMT)
Enhancing Software Development with Context-Aware Conversational Agents: A User Study on Developer Interactions with Chatbots [3.6] テキストベースのチャットボットのプロトタイプを用いて,29人の開発者を対象に,好みの機能について調査を行った。
その結果,タスク自動化,バージョン管理サポート,コンテキスト適応性への強い関心が明らかになった。
我々は,CA設計における深い文脈理解,歴史的相互作用意識,パーソナライズされた支援の重要性を強調した。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:08:55 GMT)
Adaptive Bias Generalized Rollout Policy Adaptation on the Flexible Job-Shop Scheduling Problem [3.6] フレキシブルジョブショップスケジューリング問題(FJSSP)はNPハード最適化問題である。
一般化Nested Rollout Policy Adaptationから派生した新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:27:18 GMT)
AC-PKAN: Attention-Enhanced and Chebyshev Polynomial-Based Physics-Informed Kolmogorov-Arnold Networks [3.6] 本稿では、弱教師付き物理情報ニューラルネットワーク(PINN)の拡張を構成する新しいアーキテクチャであるAC-PKANを提案する。
本稿では, PINNsFormerなどの最先端モデルよりもAC-PKANの方が一貫して優れ, 適合していることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:46:10 GMT)
Brain Hematoma Marker Recognition Using Multitask Learning: SwinTransformer and Swin-Unet [3.6] 本稿では,分類とセマンティックセグメンテーションのためのトランスフォーマを用いたマルチタスク学習手法 MTL-Swin-Unet を提案する。
この手法により,他の2つの画像表現を用いた画像表現の高速化が可能となる。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:06:57 GMT)
Evaluating Simplification Algorithms for Interpretability of Time Series Classification [3.6] 本稿では,TSCの解釈可能性の文脈において,簡略化された時系列の使用を評価するためのメトリクスを紹介する。
これらのメトリクスを用いて、4つの異なる単純化アルゴリズム、複数のTSCアルゴリズム、および異なる特性のデータセットを評価する。
以上の結果から,TSCの解釈可能性の簡易化は,季節,非定常,低エントロピーの時系列よりもはるかに優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:00:56 GMT)
Integrating Single-Cell Foundation Models with Graph Neural Networks for Drug Response Prediction [3.5] 本研究では,既存の薬物反応予測フレームワークの性能向上を図るために,事前学習した基礎モデルである scGPT を組み込むことが有効かどうかを検討する。
scGPTは従来のアプローチより優れているだけでなく、トレーニングの安定性も向上し、SCGPT由来の知識を活用する価値を強調している。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:04:50 GMT)
AI-Mediated Code Comment Improvement [3.5] 本稿では,Large Language Model (LLM) を用いて,既存のコードコメントを品質軸に沿って書き直す手順を提案する。
GPT-4oを用いて処理を行い、その結果を社内で実行可能なより小さなモデルに分解する。
提案手法が品質軸に沿ったコードコメントをどのように改善するかを評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:31:32 GMT)
Robust Emotion Recognition via Bi-Level Self-Supervised Continual Learning [3.5] クロスオブジェクトの変動性とノイズラベルは、感情認識モデルの性能を妨げる。
本稿では,動的メモリバッファをベースとした2段階の自己教師付き連続学習フレームワークSSOCLを提案する。
このバイレベルアーキテクチャは、動的バッファと擬似ラベルの割り当てを反復的に洗練し、代表サンプルを効果的に保持する。
高速適応モジュールとクラスタマッピングモジュールを含むフレームワークの主要なコンポーネントは、データストリームの堅牢な学習と効果的な処理を可能にする。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:47:04 GMT)
Decadal analysis of sea surface temperature patterns, climatology, and anomalies in temperate coastal waters with Landsat-8 TIRS observations [3.4] 海面温度 (SST) は、海面の熱状態を特徴付ける物理パラメータである。
Landsat-8 TIRSセンサーは、小型の沿岸SSTパターンを明らかにするユニークな機会を提供する。
南オーストラリア州ポートリンカーン沖にブイを配置し,S検索の質を検証した。
100mの分解能を持つSSTの日次ベースライン気候学が構築され, 異常SSTの検出と解析が可能となった。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:36:27 GMT)
Benchmarking AI scientists in omics data-driven biological research [3.4] 我々は,生物発見を生み出すAI科学者の能力を評価するために,生物AI科学者ベンチマーク(BaisBench)を紹介する。
BaisBenchは、31のエキスパートラベル付きシングルセルデータセット上の細胞型アノテーションと、198の複数の質問への回答による科学的発見の2つのタスクで構成されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:33:54 GMT)
Quantum metrology of hopping strength in a one-dimensional electronic chain [3.4] 電子格子のホッピング強度を高精度で測定することは、電子材料の特性を制御する上で、おそらく最も重要なステップである。
我々はキャビティ電子鎖結合系におけるホッピング強度を測定するために臨界量子メロジカルプロトコルを設計する。
チェーン内の電子電流の増加は精度を高めるのに有用であり, チェーンサイズを増大させることで任意に大きな精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:52:08 GMT)
COMRECGC: Global Graph Counterfactual Explainer through Common Recourse [3.3] グラフニューラルネットワーク(GNN)は、ソーシャルネットワーク、分子生物学、レコメンデーションシステムなどの様々な領域で広く使われている。
GNNの予測の説明は2つのタイプに分類される。
本稿では,コモン・リコースの説明問題を定式化し,COMRECGCという効率的なアルゴリズムを設計して解決する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:51:33 GMT)
Minimax rates of convergence for nonparametric regression under adversarial attacks [3.2] 非パラメトリック回帰設定における敵攻撃に対する堅牢性の限界を理論的に解析する。
我々の研究は、入力中の敵攻撃時の最小値レートが2項の和と同じであることを明らかにした。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:48:50 GMT)
On the Complexity and Properties of Preferential Propositional Dependence Logic [3.2] 優先的なチームベースの推論は累積的であるが、SystemPに違反する。
これらの特徴付けは、驚くべきことに、チームベースの命題論理に受け継がれません。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:54:59 GMT)
A computer vision-based model for occupancy detection using low-resolution thermal images [3.2] 本研究は,低分解能熱画像とCV技術を用いた占有率検出モデルを開発した。
このモデルは最終的に良好な性能を達成し、精度、リコール、mAP50、mAP50の値は10,000に近づいた。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:27:50 GMT)
ICVul: A Well-labeled C/C++ Vulnerability Dataset with Comprehensive Metadata and VCCs [3.2] 機械学習ベースのソフトウェア脆弱性検出には高品質なデータセットが必要である。
ICVulは,データ品質を重視し,包括的メタデータに富んだデータセットである。
データセットは、ユーザビリティとデータの整合性を改善するために、リレーショナルのようなデータベースに格納される。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:33:51 GMT)
Kudzu: Fast and Simple High-Throughput BFT [3.1] Kudzuは、高速経路を統合した高スループットの原子放送プロトコルである。
我々のプロトコルは、$n = 3f + 2p + 1$のレプリカがすべて正しく振る舞う場合、わずか2ラウンドの通信で最終性を達成する。
プログレス証明書、複雑なビューの変更、投機的実行などの複雑な処理は避けられる。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:50:05 GMT)
The RaspGrade Dataset: Towards Automatic Raspberry Ripeness Grading with Deep Learning [3.0] 本研究では,コンピュータビジョンの食品品質評価への応用について検討した。
コンベアベルトに沿って果物が移動するにつれて、産業環境の中で5つの異なるクラスに格付けするリアルタイムラズベリーという新しい挑戦に焦点を当てている。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:07:29 GMT)
Modeling Quantum Links for the Exploration of Distributed Quantum Computing Systems [3.0] 本稿では,マイクロ波光子による量子状態分布に依存する量子通信プリミティブの遅延,損失,忠実性を推定するためのプロトコルとモデルについてレビューする。
また,将来の分散量子コンピューティングシステムの設計と評価を支援するスケーラブルなシミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:53:44 GMT)
Area Comparison of CHERIoT and PMP in Ibex [3.0] 本稿では,Ibex RISC-Vコアにメモリ安全性拡張を加えた場合の影響について検討する。
オープンなFreePDK45プロセスをターゲットにした商用ツールを用いて拡張Ibexコアを合成する。
この拡張により,PMPでは24万ゲート等価(kGE),CHERIoTでは33kGEのコアサイズが増加することがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:12:30 GMT)
Deep reinforcement learning-based longitudinal control strategy for automated vehicles at signalised intersections [2.9] 本研究では,信号交差点における深部強化学習に基づく縦方向車両制御戦略を提案する。
総合的な報酬関数は、特に距離方向に基づく効率報酬に焦点を当てて定式化されている。
DDPG(Deep Deterministic Policy Gradient)とSAC(Soft-Actor Critic)という2つのDRLアルゴリズムが組み込まれている。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:38:42 GMT)
Early-Cycle Internal Impedance Enables ML-Based Battery Cycle Life Predictions Across Manufacturers [2.9] 電圧容量プロファイルデータにのみ依存する特徴を構成する手法は、通常、セルケミストリーをまたいだ一般化に失敗する。
本研究では、従来の電圧容量特性と直流内部抵抗(DCIR)測定を組み合わせた手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:25:33 GMT)
Quantum entanglement and Einstein-Podolsky-Rosen steering in ultrastrongly light-matter coupled system [2.9] 本研究は、量子エンタングルメントの工学的スキームと、ガウス測度を用いたアインシュタイン-ポドルスキー-ローゼンステアリングを示す。
量子相関、特に量子エンタングルメントとEPRステアリングを基底状態で調べることから始める。
低い光周波数は量子エンタングルメントとEPRステアリングの両方を強化する。
我々の発見は、量子情報処理のさらなる研究を促す可能性がある。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:54:03 GMT)
How Students Use AI Feedback Matters: Experimental Evidence on Physics Achievement and Autonomy [2.9] 本研究は, GAIを用いた個人化されたフィードバックが高校生の物理学的達成と自律性に及ぼす影響について検討した。
実験にはランダム化された2つのテストが含まれ、使用パターンに重点が置かれた。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:32:44 GMT)
Credit Assignment and Efficient Exploration based on Influence Scope in Multi-agent Reinforcement Learning [2.8] スパース・リワードシナリオにおける協調エージェントの訓練は、マルチエージェント強化学習(MARL)に重大な課題をもたらす
本研究では,個々のエージェントの影響を受けうる状態の次元/属性の特定の値を取ることで,エージェントのスコープ(ISA)が状態に与える影響を計算するアルゴリズムを提案する。
エージェントの行動と状態属性の相互依存は、各エージェントの信用割り当てを計算し、各エージェントの探索空間を除くために使用される。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:49:26 GMT)
Exploring EFL Secondary Students' AI-generated Text Editing While Composition Writing [2.8] 生成人工知能(Generative Artificial Intelligence)は、外国語の学生としての英語の書き方を変えつつある。
本研究では,説明書作成タスクを完了すると,学生がAI生成テキストをどのように統合し,修正するかを検討する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:46:00 GMT)
Tracing the Invisible: Understanding Students' Judgment in AI-Supported Design Work [2.8] 本研究では、HCIデザインコースの33名の学生チームからの反射を分析し、AIツールを使用する際の学生の判断方法を検討する。
確立した設計判断形式(器楽曲,評価,品質など)と創発型(エージェント分配判定,信頼性判定)の両方を見出した。
我々の研究結果は、生成型AIがデザイン推論に新しい複雑なレイヤーを導入し、学生がいつどのように依存するかを反映するよう促すことを示唆している。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:08:10 GMT)
Variational Quantum Algorithms in the era of Early Fault Tolerance [2.8] 量子コンピューティングのロードマップは、次の3~5年で10,000量子ビットデバイスが利用可能になることを予測している。
マジック状態注入によるRz回転をしながらクリフォード演算を誤り訂正する戦略である部分誤差補正(pQEC)を導入する。
以上の結果から,pQECは標準手法よりも9.27倍のVQA忠実度を向上できることが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:22:58 GMT)
A Deep Learning-Driven Framework for Inhalation Injury Grading Using Bronchoscopy Images [2.7] 吸入外傷は、従来の方法の限界により、臨床診断とグレーディングの課題に直面している。
本研究は,気管支鏡画像を用いた吸入障害評価のための新しい深層学習フレームワークを提案する。
我々は,合成画像の品質と臨床関連性を改善するために,Patch LossとSSIM Lossを統合した生成モデルであるStarGANを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:48:36 GMT)
Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM [2.7] Gideonは、コンテキスト長が拡張された、現代的で、より小さく、ローカルなLLMへの移行を可能にする、新しいフレームワークである。
Qwen-2.5 1.5Bで実施され、8k-32kサンプルで訓練された単一ドメインシナリオの予備実験では、66.1%の有効なプランパーセンテージが示されている。
トレーニングの非効率性は、Gideonの合理化されたデータ生成パイプラインによって軽減できる。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:22:38 GMT)
Anomalous current-electric field characteristics in transport through a nanoelectromechanical systems [2.7] まず、ナノエレクトロメカニカルシステム(NEMS)による輸送のための完全な量子力学的アプローチを確立する。
低バイアスで異常な電流-電界特性がみられ、電流は上昇する電界とともに減少する。
メカニカル・ムーブメントとクーロン・ブロッキングの複合効果から,この挙動が生じることが明らかとなった。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:32:48 GMT)
Capability-Aware Shared Hypernetworks for Flexible Heterogeneous Multi-Robot Coordination [2.7] マルチロボットチームのための能力認識共有ハイパーネットワークス(CASH)を提案する。
CASHは、ハイパーネットワークを使用してフレキシブルな共有ポリシを効率的に学習する、ソフトウェイト共有アーキテクチャである。
トレーニングとゼロショットの一般化の両方において、CASHは性能とサンプル効率の点で、ベースラインアーキテクチャを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:02:30 GMT)
On the interplay of Explainability, Privacy and Predictive Performance with Explanation-assisted Model Extraction [2.7] 差分プライバシー(DP)を利用する場合のモデル性能、プライバシ、説明可能性のトレードオフについて検討する。
モデル抽出(MEA)攻撃を緩和するための2つのDP戦略を評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:27:06 GMT)
ROSA: Finding Backdoors with Fuzzing [2.6] コードレベルのバックドアは隠れたアクセスであり、プログラムのコード内にプログラムされ、隠されている。
本稿では,AFL++(State-of-the-art fuzzer)と,ランタイムバックドアトリガを検出する新しいメタモルフィックテストオラクルを組み合わせた,新しいアプローチであるROSAを紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:16:06 GMT)
Extreme Loss Suppression and Wide Tunability of Dipolar Interactions in an Ultracold Molecular Gas [2.6] 双極子分子は、新しい量子状態の物質の創出を大いに約束する。
我々は、超低温の基底状態分子の衝突的に安定な気体を数秒の寿命で実現した。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:51:51 GMT)
Outlier-robust neural network training: variation regularization meets trimmed loss to prevent functional breakdown [2.6] 我々は,高度に表現力のあるニューラルネットワークを用いた外乱予測モデリングの課題に取り組む。
提案手法は,(1)変換トリミング損失(TTL)と(2)高次変動正規化(HOVR)の2つの重要な要素を統合し,予測関数に滑らかさの制約を課す。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:35:11 GMT)
Aitomia: Your Intelligent Assistant for AI-Driven Atomistic and Quantum Chemical Simulations [2.5] AitomiaはAIを利用したプラットフォームで、AI駆動の原子論と量子化学(QC)シミュレーションの実行を支援する。
Aitomiaには計算とAIエージェントが備わっており、原子論シミュレーションのセットアップと実行において専門家や非専門家を支援する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:11:41 GMT)
Information Leakage in Data Linkage [2.5] PPRLプロトコルは、機密情報の意図しない漏洩を引き起こす可能性があることを示す。
脆弱性を特定して防止するために、データカストディアンやデータリンクプロジェクトに関わる他の関係者を支援するためのレコメンデーションを提供します。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:09:47 GMT)
An Overview of the Prospects and Challenges of Using Artificial Intelligence for Energy Management Systems in Microgrids [2.4] 本稿では,マイクログリッドのエネルギー管理システムにおいて,AIベースの方法論を実現するメリットを強調した。
また、AI駆動のエネルギー管理システムを先導することを約束する今後の研究の方向性についても指摘している。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:44:22 GMT)
A portable diagnosis model for Keratoconus using a smartphone [2.3] Keratoconus (KC) は進行性角膜疾患である。
携帯電話画面に表示されるプラチドディスクの角膜反射をキャプチャする携帯型スマートフォンベースの診断フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:34:46 GMT)
Model-free Online Learning for the Kalman Filter: Forgetting Factor and Logarithmic Regret [2.3] 未知の非爆発線形系に対するオンライン予測の問題点を考察する。
既知のシステムモデルでは、最適な予測子はカルマンフィルタである。
我々は指数的忘れ込みを通じて回帰モデルに帰納バイアスを注入することでこの問題に取り組む。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:49:56 GMT)
Shifting Work Patterns with Generative AI [2.3] 本稿では,生産型AIが知識労働者の作業パターンをどのように変えるかを示す。
研究に参加した7,137人の従業員の半分は、電子メール、文書作成、会議にすでに使用しているアプリケーションに統合された生成AIツールにアクセスした。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:28:06 GMT)
Trainability and Expressivity of Hamming-Weight Preserving Quantum Circuits for Machine Learning [2.2] 可変量子回路(VQC)のトレーニング性と制御性の解析
まず、新しいデータローダの実現可能性を示し、$n$-qubit量子回路をトレーニングすることにより、$binomnk$-dimensionalベクトルの量子振幅符号化を行う。
最後に、ハミング重み保存回路のトレーニング可能性を分析し、サブ空間の$binomnk$の分散がサブ空間の$binomnk$に応じて有界であることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:38:10 GMT)
Multimodal Fusion of Glucose Monitoring and Food Imagery for Caloric Content Prediction [2.2] 我々は,CGM時系列データ,デモグラフィック/マイクロバイオーム,および食事前食品イメージを併用して,カロリー推定を向上するマルチモーダル深層学習フレームワークを提案する。
我々のモデルは0.2544のルート平均正方形相対誤差(RMSRE)を達成し、ベースラインモデルを50%以上上回った。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:12:54 GMT)
Efficient Unstructured Pruning of Mamba State-Space Models for Resource-Constrained Environments [2.2] 状態空間モデル(SSM)は、シーケンスモデリングのためのトランスフォーマーの強力な代替品として登場した。
そこで本研究では,Mambaモデルに適した非構造化プルーニングフレームワークを提案し,その性能を95%以上維持しながら,最大70%のパラメータ削減を実現した。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:23:08 GMT)
Deep-MacroFin: Informed Equilibrium Neural Network for Continuous Time Economic Models [2.1] Deep-MacroFinは偏微分方程式を解くために設計された包括的なフレームワークである。
ハミルトン・ヤコビ・ベルマン方程式(HJB)と結合代数方程式によってカプセル化された経済情報を用いて最適化される。
また,非線形HJB方程式のトレーニング安定性を向上させるため,50次元経済モデルの解法を実現するためのタイムステッピング手法も取り入れた。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:40:38 GMT)
Revisiting 16-bit Neural Network Training: A Practical Approach for Resource-Limited Learning [2.1] 混合精度技術は、モデルトレーニングと推論の間に異なる数値精度を活用し、資源利用を最適化する。
リソースが限られている多くの人にとって、利用可能なオプションは32ビット、16ビット、または2つの組み合わせに限られている。
この研究は重要なギャップを埋め、スタンドアロンの16ビット精度のニューラルネットワークが32ビットと混合精度の精度で一致したことを初めて証明した。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:38:28 GMT)
MARCO: A Multi-Agent System for Optimizing HPC Code Generation Using Large Language Models [2.1] 大規模言語モデル(LLM)は、コード生成機能を通じてソフトウェア開発を変革してきたが、高性能コンピューティングにおけるその有効性は依然として限られている。
我々は,特殊なマルチエージェントアーキテクチャにより,HPC用のLLM生成コードを強化する新しいフレームワークであるMARCOを提案する。
MARCOはコード生成と性能評価に別々のエージェントを使用し、フィードバックループで接続され、最適化が徐々に洗練される。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:41:18 GMT)
Visualization enhances Problem Solving in Multi-Qubit Systems: An Eye-Tracking Study [1.9] 本稿では,数式記号 Dirac Notation (DN) に加えて,マルチキュービットシステムの可視化が,ユビキタスなアダマールゲート操作において,性能,外因性認知負荷 (ECL) ,内因性認知負荷 (ICL) の両面での問題解決に有効であることを示す。
量子物理学の経験の少ない参加者に対して,可視化が性能を高め,認知負荷を低減することを発見した。
さらに、表現能力は、可視化によるECLの削減を予測できるが、性能やICLは予測できない。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:30:28 GMT)
Modular Federated Learning: A Meta-Framework Perspective [1.9] フェデレートラーニング(FL)は、プライバシを保持しながら、分散機械学習トレーニングを可能にする。
急速な進歩にもかかわらず、FLは複雑で多面体である。
モジュールコンポーネントの合成としてFLを概念化したメタフレームワークの観点を導入する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:04:55 GMT)
Validation of Conformal Prediction in Cervical Atypia Classification [1.9] ディープラーニングに基づく頸がん分類は、低リソース領域のスクリーニングへのアクセスを増加させる可能性がある。
ディープラーニングモデルは、しばしば過信され、診断の不確実性を確実に反映しない。
共形予測は、訓練されたディープラーニングモデルのためのクラスを含む予測セットを生成するためのモデルに依存しないフレームワークである。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:37:58 GMT)
Calibrated and Efficient Sampling-Free Confidence Estimation for LiDAR Scene Semantic Segmentation [1.9] 分類タスクの信頼度を適切に推定するためのサンプリング不要な手法を提案する。
提案手法は,処理速度の向上を図りながら,精度の高い信頼度を維持している。
本手法は, 過信予測よりも不信感を生じ, 安全クリティカルなアプリケーションに有利である。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:07:04 GMT)
Deep Reinforcement Learning for Power Grid Multi-Stage Cascading Failure Mitigation [1.9] 電力網のカスケード故障は、社会活動や経済活動に深刻な混乱をもたらす可能性がある。
既存のカスケード障害軽減戦略は、通常、単一ステージベースであり、多ステージシナリオの複雑さを見下ろしている。
本稿では,多段階カスケード故障問題を強化学習課題として扱い,シミュレーション環境を開発する。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:01:34 GMT)
Wilsonian Renormalization of Neural Network Gaussian Processes [1.9] 本稿では,ガウス過程(GP)回帰の文脈でWilsonian RGを実行するための実践的アプローチを示す。
GPカーネルの未学習モードを体系的に統合し,データをIRスケールに設定したGPのRGフローを得る。
このアプローチは、RGフローと学習可能モードと学習不可能モードとの自然な接続を提供することによって、RGとニューラルネットワークの間の構造的な類似性を越えている。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:20:02 GMT)
UAV-VLA: Vision-Language-Action System for Large Scale Aerial Mission Generation [1.9] UAV-VLA (Visual-Language-Action) は、空中ロボットとの通信を容易にするためのツールである。
衛星画像処理をビジュアル言語モデル(VLM)と統合し、GPTの強力な能力により、UAV-VLAはユーザーが一般的な飛行経路と行動計画を作成することができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:54:45 GMT)
Constrained Edge AI Deployment: Fine-Tuning vs Distillation for LLM Compression [1.9] 現代のモデルは、エッジデプロイメントの厳密な計算、メモリ、接続制約を満たすために、構造化プルーニングと再トレーニングの組み合わせによって圧縮されることが多い。
我々の焦点は最大圧縮を達成することではなく、再学習損失関数の影響を分離することである。
エッジネットワークに典型的な断続的あるいは否定的な接続シナリオに適したコモンセンスQAのOLMo2-7B-SFTモデル上で両方のパイプラインを評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:06:32 GMT)
Will AI Take My Job? Evolving Perceptions of Automation and Labor Risk in Latin America [1.8] 16カ国の48,000人以上の個人からの回答に基づいて、人工知能とロボット工学による失業の恐れを分析します。
以上の結果から,2018年は時間的・横断的な変動が顕著であり,そのピークは顕著であった。
これらの結果は、グローバル・ノースを超えて、自動化に対する大衆の態度のより広範な理解に寄与する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:43:02 GMT)
Schrödinger Diffusion Driven Signal Recovery in 3T BOLD fMRI Using Unmatched 7T Observations [1.8] 本稿では,3T BOLD fMRI 取得の品質向上を目的とした新しい計算手法を提案する。
我々は、軽量で教師なしのSchr"odinger Bridgeフレームワークを使用して、3Tデータの高SNR、高解像度のデータを推測する。
以上の結果から,標準的な3T取得から7Tレベルの品質を計算的に近似することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:35:44 GMT)
Training Ultra Long Context Language Model with Fully Pipelined Distributed Transformer [1.8] 長い文脈能力を持つ大規模言語モデル(LLM)は、自然言語処理や計算生物学における複雑なタスクに不可欠なものである。
長文LLMを効率的に学習するためのFPDT(Fully Pipelined Distributed Transformer)を提案する。
GPTモデルとLlamaモデルでは、同じハードウェア上でトレーニング可能なシーケンス長が16倍に向上する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:07:26 GMT)
Open-Source LLM-Driven Federated Transformer for Predictive IoV Management [1.8] Federated Prompt-d Traffic Transformer (FPoTT)は、オープンソースのLarge Language Modelsを利用して予測IoV管理を行う新しいフレームワークである。
FPoTTは動的プロンプト最適化機構を導入し、テキストプロンプトを反復的に洗練して軌道予測を強化する。
このアーキテクチャは、リアルタイム推論のための軽量エッジモデルと、グローバルインテリジェンスを維持するためのクラウドベースのLLMを組み合わせた、二重層フェデレーション学習パラダイムを採用している。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:24:54 GMT)
Johnny: Structuring Representation Space to Enhance Machine Abstract Reasoning Ability [1.8] 本稿では,AIの抽象推論能力を向上する上での課題について考察する。
複雑な人間のような概念を含むRaven's Progressive Matrices (RPM)タスクに焦点を当てている。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:57:47 GMT)
TeleSABRE: Layout Synthesis in Multi-Core Quantum Systems with Teleport Interconnect [1.8] 我々は,テレポーテーションに基づく相互接続を特徴とするアーキテクチャに適したレイアウト合成手法であるTeleSABREを開発した。
量子移動のためのSWAP操作のみを導入する標準のSABREとは異なり、TeleSABREはコア内SWAPとテレポーテーションベースの技術を統合している。
これにより、コア間通信オーバーヘッドと、テレポーテーションプロトコルやローカルゲートの実行に必要なコア内SWAPの数の両方を削減することで、より効率的な回路実行が可能になる。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:53:04 GMT)
Tests as Prompt: A Test-Driven-Development Benchmark for LLM Code Generation [1.7] 私たちは、テスト駆動開発(TDD)タスクにおいて、大規模言語モデル(LLM)を評価するための新しいベンチマークであるWebApp1Kを紹介します。
自然言語のプロンプトに依存する従来のアプローチとは異なり、我々のベンチマークでは、LLMがテストケースから直接機能を解釈し実装する能力を強調しています。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:47:12 GMT)
Engineering long-range and multi-body interactions via global kinetic constraints [1.7] 長距離および多体相互作用は、量子シミュレーションと量子計算に不可欠である。
本稿では,Bose-Hubbardシステムに基づく実験手法を提案する。
このスキームを$N$-qubit Toffoli ゲートに対して説明し、2体ゲート分解の必要性を回避する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:36:22 GMT)
Accelerating Fermionic System Simulation on Quantum Computers [1.7] 量子優位性を示す潜在的なアプローチは、フェルミオン系をシミュレートするために量子コンピュータを使用することである。
ハミルトン項を$mathcalO(N4)$グループに分割するグループ戦略を導入する。
我々は、ハミルトン進化の回路深さを$N$の係数で減少させる並列ハミルトン進化スキームを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:44:07 GMT)
Augmenting Density Matrix Renormalization Group with Matchgates and Clifford circuits [1.6] 行列積状態がMatchgateとClifford回路の組み合わせで拡張される新しい波動関数アンサッツ(MCA-MPS)を提案する。
1次元水素鎖のベンチマーク結果から,MCA-MPSは同じ結合次元のMPSよりも数桁の精度で基底状態計算の精度を向上できることが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:53:09 GMT)
Optimizing Retrieval-Augmented Generation: Analysis of Hyperparameter Impact on Performance and Efficiency [1.6] 大規模な言語モデルは高いタスク性能を達成するが、しばしば幻覚や時代遅れの知識に依存している。
Retrieval-augmented Generation (RAG) は、これらのギャップに外部探索と結合して対処する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:13:27 GMT)
Lightweight Hybrid Block-Stream Cryptographic Algorithm for the Internet of Things [1.6] アルゴリズムは、IoT(Internet of Things)テクノロジデバイスのアプリケーションに特化して設計されている。
このアルゴリズムの設計概念は擬似乱数置換関数と擬似乱数生成関数の統合に基づいている。
このアルゴリズムで行われたセキュリティ分析は、NIST統計テストの結果とともに、最も一般的で高度な暗号攻撃に対する堅牢性を確認している。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:29:20 GMT)
Scalable Trapped Ion Addressing with Adjoint-optimized Multimode Photonic Circuits [1.6] 統合フォトニクスは、従来の自由空間光学に代わる有望な代替手段を提供する。
表面電極イオントラップと一体化した多モードフォトニック回路の設計を提案する。
TE$_text10$とTE$_text20$モードの制御された干渉は、イオン分離時に-20dBから-30dBのクロストークをもたらす。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:20:45 GMT)
High-contrast interaction between remote superconducting qubits mediated by multimode cable coupling [1.6] マルチモード同軸ケーブルは空間的に分離された量子ビット間の高コントラスト相互作用を媒介できることを示す。
量子ビット周波数を簡易に変調することで、高忠実度制御ZおよびZZフリーiSWAPゲートを実装できる。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:23:04 GMT)
Uncertainty-Aware Surrogate-based Amortized Bayesian Inference for Computationally Expensive Models [1.6] 不確かさを意識したサロゲートに基づくアモータイズベイズ推論(UA-SABI)を提案する。
実験により,厳密な時間制約下であっても,計算コストの高いモデルに対するベイズ推定を信頼性,高速かつ繰り返し行うことが可能であることが確認された。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:44:10 GMT)
Detecting the Root Cause Code Lines in Bug-Fixing Commits by Heterogeneous Graph Learning [1.5] 自動欠陥予測ツールは、ソフトウェアプロジェクト内の欠陥に起因するソフトウェア変更を積極的に識別することができる。
異質で複雑なソフトウェアプロジェクトにおける既存の作業は、異質なコミット構造に苦労したり、コード変更におけるクロスライン依存関係を無視したりといった課題に直面し続けている。
本稿では,バグフィックスグラフ構築コンポーネント,コードセマンティックアグリゲーションコンポーネント,クロスラインセマンティック保持コンポーネントの3つの主要コンポーネントからなるRC_Detectorというアプローチを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:46:57 GMT)
Improving the Reliability of LLMs: Combining CoT, RAG, Self-Consistency, and Self-Verification [1.5] 大規模言語モデル(LLM)は、自信はあるが不正確または無関係な情報を生成する。
幻覚は、複雑でオープンなタスクへの応用において重要な限界である。
本研究では,CoT(Chain-of- Thought)とRAG(Research-augmented Generation)を組み合わせることで幻覚を抑える方法について検討する。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:57:02 GMT)
Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs [1.5] 大規模言語モデル(LLM)は、推論、理解、データ生成において強力な能力を示す人工知能において重要な存在となっている。
量子化はメモリ使用量と推論時間を削減するために広く用いられている手法であるが、LCMはアクティベーションにおける異常値の出現により、ユニークな課題を示す。
我々は、アダマール行列が、低ビット量子化を達成する上で重要な障害である外れ値を減らすのにより効果的であることを実証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:36:03 GMT)
Deep Probabilistic Modeling of User Behavior for Anomaly Detection via Mixture Density Networks [1.5] 本稿では,深層混合密度ネットワークに基づく異常検出手法を提案する。
行動データに共通するマルチモーダル分布特性を効果的に捉える。
実世界のネットワークユーザデータセットUNSW-NB15で実験を行った。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:32:21 GMT)
AI and Generative AI Transforming Disaster Management: A Survey of Damage Assessment and Response Techniques [1.5] 各種自然災害の被害評価におけるAIとGenAIの展望を概観する。
我々は、テキスト、画像、ビデオ、オーディオなどのマルチモーダルデータへのその応用について語り、また、危機時のデータのプライバシー、セキュリティ、倫理的利用に関する主要な問題についても取り上げる。
我々は,災害管理全般において,安全で信頼性の高い倫理的生成AIシステムの必要性を強調し,今後の研究の成果を概説する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:33:31 GMT)
Revealing economic facts: LLMs know more than they say [1.4] 大規模言語モデル (LLM) の隠れ状態が, 経済統計を推定し, インプットするのに有効かどうかを検討する。
オープンソースのLLMの隠れ状態に基づいて訓練された単純な線形モデルが、モデルのテキスト出力より優れていることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:24:08 GMT)
Security through the Eyes of AI: How Visualization is Shaping Malware Detection [1.4] マルウェアの検出と分類に応用された既存の可視化に基づくアプローチを評価する。
このフレームワーク内では、マルウェア検出パイプラインの重要な段階にわたる最先端のアプローチを分析する。
我々は、可視化ベースのアプローチにおける主な課題を明らかにし、この重要な分野における進歩と将来的な方向性についての洞察を提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:35:12 GMT)
Hallucination by Code Generation LLMs: Taxonomy, Benchmarks, Mitigation, and Challenges [1.4] 大規模言語モデル(LLM)は、ソースコードをスケーラブルに生成できる。
LLMは、誤った、非感覚的で、正当化可能な情報である幻覚を発生させる傾向がある。
本研究では,CodeLLMsによる幻覚に関する最近の研究と技術について検討する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:51:35 GMT)
LLM-Text Watermarking based on Lagrange Interpolation [1.4] 本研究では,ラグランジュ逆数に基づく LLM 生成テキストの透かし方式を提案する。
中心となる考え方は、一直線上の点$(x, f(x))$の連続列を埋め込むことである。
抽出中、アルゴリズムは元の点と多くの突発的な点を復元する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:12:54 GMT)
Understanding Housing and Homelessness System Access by Linking Administrative Data [1.4] 本稿では,北米の主要都市の住宅・ホームレスケアシステム(HHSC)における235,000件以上の記録を,プライバシ保護手法を用いてリンクする。
複数の機械学習ペアワイズリンクと2つのクラスタリングアルゴリズムが、データ内の潜任者のプロファイルをマージするために評価されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:57:55 GMT)
Optimal navigation of magnetic artificial microswimmers in blood capillaries with deep reinforcement learning [1.3] 外部磁場によって推進される網膜毛細血管における人工細菌鞭毛(ABF)の数値シミュレーションを行った。
シミュレーションは、個々の赤血球の力学とABFとの流体力学的相互作用を予測する検証された血液モデルに基づいている。
そこで本研究では,ABFを低次モデルと細粒度血液シミュレーションの両方において,確実に所定の目標に導出する方針を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:26:11 GMT)
CoVoL: A Cooperative Vocabulary Learning Game for Children with Autism [1.3] 本研究では,協調型二言語学習ゲームCoVoLの設計を提案する。
CoVoLは、子供たちが現実世界のソーシャルコミュニケーションシナリオに有用なゲームベースの語彙学習に参加することを可能にする。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:48:02 GMT)
MESSI: A Multi-Elevation Semantic Segmentation Image Dataset of an Urban Environment [1.3] データセットは2525枚の画像で構成されます 密集した都市上空を飛ぶドローンによって
MESSIには、位置、向き、カメラ固有のパラメータが付加された画像が含まれている。
パブリックドメインで公開され、密集した都市環境を飛行するドローンや類似車両によって撮影された画像を使用してセマンティックセグメンテーションの評価ベンチマークとして機能する予定である。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:01:07 GMT)
Automatic quality control in multi-centric fetal brain MRI super-resolution reconstruction [1.3] 本研究は、胎児脳MRIの超解像再構成(SRR)ボリュームの自動品質管理に焦点を当てる。
本稿では,100以上の画像品質指標を抽出し,画像品質スコアを予測する機械学習手法FetMRQC$_SR$を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:18:26 GMT)
GPML: Graph Processing for Machine Learning [1.3] GPMLライブラリは生のネットワークトラフィックトレースをグラフ表現に変換する。
このライブラリは、動的ネットワークにおけるインタラクションとコミュニティシフトの異常を検出するツールを提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:10:46 GMT)
Comparative Analysis of Blockchain Systems [1.3] データは複数のノードに分散して保存され、すべてのノードが保持し、データの完全性、不確定性、セキュリティを保証する。
本稿では,BitcoinやHyperledger Fabricといったブロックチェーンプラットフォームの原則と技術に注目し,各レイヤにおけるブロックチェーンシステムのアーキテクチャを分析する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:13:37 GMT)
ChicGrasp: Imitation-Learning based Customized Dual-Jaw Gripper Control for Delicate, Irregular Bio-products Manipulation [1.2] 我々は、このタスクのために、エンドツーエンドのハードウェア-ソフトウェアの共同設計であるChicGraspを紹介する。
個別に提示した生のブロイラーカーカスでは,40.6%のグリップ・アンド・リフト成功率を達成した。
すべてのCAD、コード、データセットはオープンソースになる。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:56:44 GMT)
DrivAer Transformer: A high-precision and fast prediction method for vehicle aerodynamic drag coefficient based on the DrivAerNet++ dataset [1.2] 本研究では、DrivAer Transformerと呼ばれるポイントクラウド学習フレームワークを提案する。
DAT構造はDrivAerNet++データセットを使用しており、産業標準の3D車両形状の高忠実なCFDデータを含んでいる。
この枠組みは車両設計プロセスの加速と開発効率の向上が期待されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:43:14 GMT)
Robustness Analysis against Adversarial Patch Attacks in Fully Unmanned Stores [1.2] 敵パッチ攻撃(Hiding, Creating, Altering)の3種類について検討する。
また,対象のクラスオブジェクトの色情報に対する攻撃者の知識を活用することで,新たな色ヒストグラム類似度損失関数を導入する。
本研究は、無人店舗を敵の脅威から守るための堅牢な防衛戦略の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:24:32 GMT)
Object detection in adverse weather conditions for autonomous vehicles using Instruct Pix2Pix [1.2] 悪天候下での物体検出システムの堅牢性向上は、自律運転技術の進歩に不可欠である。
本研究では,拡散モデル Instruct Pix2Pix を用いた気象モデルによる現実的なデータセット生成手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:12:07 GMT)
Performance Gains of LLMs With Humans in a World of LLMs Versus Humans [1.1] 現在、LLMと人間の専門家のグループの比較にかなりの研究努力が費やされている。
適切な保護がなければ、LLMは患者ケアの安全提供という確立した構造に害をもたらす恐れがある。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:44:22 GMT)
Classical Benchmarks for Variational Quantum Eigensolver Simulations of the Hubbard Model [1.1] 電子相関が強ければ大きいほど, 基底状態エネルギーと波動関数プラトーの誤差が大きくなることを示す。
本研究は,量子ハードウェア上でのHubbardモデルを解くための現在のアプローチの能力と限界を強調した。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:15:12 GMT)
Self-testing tilted strategies for maximal loophole-free nonlocality [1.1] 量子戦略は、非効率検出器の存在下で最大のループホールのない非局所性を達成する。
ここでは, 局所等長写像に比例して, クラスー=ホルン=シモニー=ホルト不等式を最大2倍に破る戦略が一意であることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:57:16 GMT)
Error correcting 2D-3D cascaded network for myocardial infarct scar segmentation on late gadolinium enhancement cardiac magnetic resonance images [1.1] 本稿では、完全自動で心筋梗塞の程度を計算できる畳み込みニューラルネットワーク(CNN)のケースケードフレームワークを提案する。
心筋梗塞のセグメンテーションにおいて,我々の枠組みは最先端の基準法よりも優れていた。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:20:21 GMT)
Protocol-level description and self-contained security proof of decoy-state BB84 QKD protocol [1.1] 本稿では,デコイ状態のBB84量子鍵分布プロトコルに対する自己完結型情報理論セキュリティ証明を提案する。
我々の証明は、以前の結果と一致したキーレートが得られる。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:14:32 GMT)
Adaptive Security Policy Management in Cloud Environments Using Reinforcement Learning [1.1] Amazon Web Services(AWS)のようなクラウド環境のセキュリティは複雑で動的である。
本稿では、強化学習(RL)を用いて動的に適応するセキュリティポリシー管理フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:34:54 GMT)
Hakim: Farsi Text Embedding Model [1.0] Hakimは、新しいテキスト埋め込みモデルで、FaMTEBベンチマークの既存のアプローチよりも8.5%パフォーマンス改善を実現している。
コーデシア、Pairsia-sup、Pairsia-unsupの3つの新しいデータセットを導入し、教師なしおよび教師なしのトレーニングシナリオをサポートする。
一方,RetroMAEに基づく言語モデルでは,テキスト情報検索に特に有効であることが証明されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:57:32 GMT)
Automatic Task Detection and Heterogeneous LLM Speculative Decoding [1.0] 下流タスク最適化に適した投機的復号化アルゴリズムを提案する。
ダウンストリームタスクを異なるサブタスクに自動的に分類するタスクパーティショニングとアサイン方法が含まれている。
実験の結果,提案手法はバニラ投機復号よりも6%から50%精度が向上することがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:16:12 GMT)
SafeNav: Safe Path Navigation using Landmark Based Localization in a GPS-denied Environment [1.0] LanBLoc-BMMはランドマークに基づく局所化(LanBLoc)と戦場特異的モーションモデル(BMM)と拡張カルマンフィルタ(EKF)を組み合わせたナビゲーション手法である。
その性能は、BMMとベイズフィルタを統合した最先端の3つのビジュアルローカライゼーションアルゴリズムと比較される。
2つの安全なナビゲーション手法であるSafeNav-CHullとSafeNav-Centroidは、LanBLOC-BMMと新しいリスク認識RT*(RAw-RRT*)アルゴリズムを統合して、障害物回避とリスク暴露の最小化を実現している。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:56:50 GMT)
Big Data and the Computational Social Science of Entrepreneurship and Innovation [1.0] 本章では、大規模データを活用した技術的・商業的ノベルティの特定の難しさについて論じる。
これは、研究者が新しいテキスト、ネットワーク、画像、オーディオ、およびビデオデータを2つの異なる方法で活用する方法を示唆している。
ビッグデータとビッグデータを結合することで、起業家精神とイノベーションにおける理論開発とテストの進歩を論じている。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:13:18 GMT)
Scaling Multi Agent Reinforcement Learning for Underwater Acoustic Tracking via Autonomous Vehicles [0.9] マルチエージェント強化学習は、サンプル非効率で悪名高い。
GazeboのLRAUVのような高忠実度シミュレータは、リアルタイムのシングルロボットシミュレーションを100倍高速にする。
本稿では,高忠実度シミュレーションをGPU加速環境へ伝達する反復蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:42:30 GMT)
Saturation of the Cramér-Rao Bound for the Atomic Resonance Frequency with Phased Array of Hyperbolic Secant Pulses [0.9] 双曲型セカント形状の$pi$-pulsesで駆動される共振実験の古典的および量子的フィッシャー情報を分析する。
本研究では, 原子共鳴周波数推定の精度の理論的限界を達成し, 量子クラムエル・ラオ境界を世界規模で飽和させるパルス列を用いた測定を行った。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:02:01 GMT)
DFA-CON: A Contrastive Learning Approach for Detecting Copyright Infringement in DeepFake Art [0.9] この研究は、著作権侵害や偽造されたAI生成アートを検出するために設計された、対照的な学習フレームワークであるDFA-CONを紹介する。
DFA-CONは差別的な表現空間を学び、オリジナルアート作品とその偽造作品に親和性を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:23:52 GMT)
Forecasting intermittent time series with Gaussian Processes and Tweedie likelihood [0.8] 我々は、断続時系列の確率的予測のための潜在関数としてガウス過程(GP)を採用する。
我々は、潜在GP変数と、負二項分布(NegBinGP)とツイーディ分布(TweedieGP)の2種類の予測分布を結合する。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:38:37 GMT)
Feature Fitted Online Conformal Prediction for Deep Time Series Forecasting Model [0.8] 時系列予測は多くのアプリケーションにおいて重要であり、深層学習に基づく点予測モデルは高い性能を示している。
既存の信頼区間モデリングアプローチは、重要な制限に悩まされている。
本稿では,リトレーニングを伴わずに,有効なカバレッジと短い間隔長を提供する軽量な予測予測手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:33:53 GMT)
Hidden quantum-classical correspondence in chaotic billiards revealed by mutual information [0.8] 量子ビリヤードにおけるカオスの増加は、共役位相空間変数間の相互情報を高める。
空間的非局在化は、位置と運動量の間の相互情報の増加と一致するかもしれない。
これらの相関は位相空間における古典的不変構造を追跡し、半古典的状態を超えて継続する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:37:29 GMT)
Toward Accessible and Safe Live Streaming Using Distributed Content Filtering with MoQ [0.8] ライブビデオストリーミングはソーシャルメディアプラットフォームでますます人気がある。
ライブストリーミングは、分析と配信の両方のレイテンシを制限する。
本稿では,リアルタイムなコンテンツモデレーションを実現するためのメディアオーバーQUICトランスポートプロトコルの拡張について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:00:22 GMT)
For GPT-4 as with Humans: Information Structure Predicts Acceptability of Long-Distance Dependencies [0.8] 標準文の情報構造に関する英語話者の判断は、独立して収集された受容可能性評価を予測する。
我々はGPT-4を人間と新しい拡張で使用するのと同じタスクで探索する。
その結果,情報構造と受容可能性に関する信頼性の高いメタ言語的スキルが明らかにされた。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:41:13 GMT)
An adaptive sampling algorithm for data-generation to build a data-manifold for physical problem surrogate modeling [0.7] 物理モデルを含むデータ生成のための適応サンプリングアルゴリズム(ASADG)を提案する。
より代表的な入力データを生成するLHS法と比較して,データサンプリングアルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:17:10 GMT)
Transforming Hyperspectral Images Into Chemical Maps: An End-to-End Deep Learning Approach [0.7] 本研究では、U-Netの修正版とカスタムロス関数を用いて、ハイパースペクトル画像から化学マップを直接取得するエンド・ツー・エンドのディープラーニング手法を提案する。
U-Netと従来のPSS回帰を豚腹サンプルの実際のデータセットと関連する平均脂肪基準値と比較した。
同時にU-Netは、分散の99.91%が空間的に相関している詳細な化学地図を生成する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:06:22 GMT)
Can (A)I Change Your Mind? [0.7] 研究は200人の参加者とともにヘブライ語で実施され、議論を呼んでいる市民政策のトピックに対するLLMと人間インターロケーターの説得効果を評価した。
以上の結果から,LLMとヒトの視点も同様に採用され,全ての条件において有意な意見の変化が認められた。
これらの知見は, LLMをベースとしたエージェントが, 様々なソースや設定にまたがる堅牢な説得力を示し, 世論形成への潜在的影響を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:45:16 GMT)
Deep Representation Learning for Unsupervised Clustering of Myocardial Fiber Trajectories in Cardiac Diffusion Tensor Imaging [0.7] 心筋線維の非教師的クラスタリングのための新しいディープラーニングフレームワークを提案する。
われわれのフレームワークは、新しい、柔軟で定量的な心筋構造解析方法を提供し、これまで達成されていなかったデライン化のレベルを達成する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:47:56 GMT)
USEFUSE: Uniform Stride for Enhanced Performance in Fused Layer Architecture of Deep Neural Networks [0.6] 本研究では,低レイテンシ左から右へのビットシリアル演算を用いた畳み込みのためのSum-of-Products (SOP)ユニットを提案する。
有効メカニズムは、ReLU層の後、非効率な畳み込みを検出し、スキップし、消費電力を最小化する。
ひとつはミッションクリティカルなアプリケーションの応答時間を最小限にすること、もうひとつはリソースに制約のあるデバイスに同じレイテンシでフォーカスすることである。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:19:44 GMT)
Non-contact Vital Signs Detection in Dynamic Environments [0.6] 本稿では,Hilbert and Differential Cross-Multiply (HADCM)復調アルゴリズムとともに,新しいDCオフセット校正法を提案する。
アプローチでは、隣接する信号ピークと谷からの時間変化DCオフセットを推定し、その後、I/Qチャネル信号の微分形式とヒルベルト変換の両方を用いて、バイタルサイン情報を抽出する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:11:48 GMT)
Radio-frequency cascade readout of coupled spin qubits fabricated using a 300~mm wafer process [0.6] 個々のスピン量子ビット制御と読み出しは300mmウェハ金属酸化物半導体(MOS)プロセスで作製された量子ドットで実証されている。
ここでは、スピン量子ビット用にカスタマイズされた300mmの天然シリコンMOSプロセスを使用し、交換相互作用を用いた2つの電子スピンのコヒーレント制御を実証する。
読み出しには、無線周波数電子カスケードという新しい読み出し技術を導入し、高い利得を提供しながら、キュービット単位セルを単純化する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:28:26 GMT)
GNCAF: A GNN-based Neighboring Context Aggregation Framework for Tertiary Lymphoid Structures Semantic Segmentation in WSI [0.6] 我々は、新しいタスクTLSセマンティック(TLS-SS)に焦点を当てる。
全スライド画像(WSI)におけるTLSの領域と成熟段階の両方のTLS-SSセグメント
我々は、GNNベースの近隣コンテキスト集約フレームワーク(GNCAF)を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:47:38 GMT)
Regularizing quantum loss landscapes by noise injection [0.6] ノイズインジェクションを用いて量子損失を正規化するためのプロトコルを提案する。
このプロトコルはハードウェアでもシミュレーションでも効率的に実装できる。
様々な問題種における品質の大幅な改善を観察する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:28:08 GMT)
Clinically inspired enhance Explainability and Interpretability of an AI-Tool for BCC diagnosis based on expert annotation [0.6] テレダーマトロジーによるBCCの診断に対する解釈可能なサポートを提供するために、AIツールが開発された。
その結果,分類精度と解釈可能性に大きな改善が認められた。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:29:47 GMT)
Lessons From an App Update at Replika AI: Identity Discontinuity in Human-AI Relationships [0.6] 人気の高い米国ベースのAIコンパニオンであるReplika AIを使って、これらの質問に光を当てています。
アプリがエロティックロールプレイ(ERP)機能を削除した後、このイベントはAIコンパニオンのアイデンティティが停止されたという顧客からの認識を引き起こしました。
この結果は、損失を嘆くことや、"オリジナル"に対する"新しい"AIを非評価することを含む、損失に関連する消費者福祉とマーケティングの負の成果を予測した。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:17:50 GMT)
WixQA: A Multi-Dataset Benchmark for Enterprise Retrieval-Augmented Generation [0.6] 我々は、リリースされた知識ベース(KB)コーパスに精度の高いQAデータセットを含むベンチマークスイートであるWixQAを紹介する。
WixQAには、Wix.comのカスタマーサポートインタラクションから派生した3つの異なるQAデータセットが含まれている。
我々は、MITライセンス下でデータセットと一緒にKBスナップショットをリリースし、包括的なベースライン結果を提供します。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:02:54 GMT)
FutureVision: A methodology for the investigation of future cognition [0.6] 本研究では,未来シナリオの評価において,視覚的固定パターンがどう変化するかを検討する。
予備的な結果は、遠未来と悲観的なシナリオがより長い固定とより不規則なサケードと関連していることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:38:21 GMT)
The classification of rebit quantum channels [0.5] クビットチャネルの分類は2002年から知られています
リビットチャネル分類を完了させる代替案を提案する。
この結果は純粋に抽象的な関心事であるだけでなく、実量子系の局所的性質と時間的進化の分析に応用できるかもしれない。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:20:44 GMT)
Spectral Gap Bounds for Quantum Markov Semigroups via Correlation Decay [0.5] 正準精製ハミルトニアンのスペクトルギャップは、量子マルコフ半群の可逆生成子のクラスにおけるスペクトルギャップに下界を与えることを示す。
提案手法の適用例として, 混合条件は, 北エフの量子二重モデルと同様に, 任意の有限範囲1次元モデルに対して常に満たされることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:01:50 GMT)
QEA: An Accelerator for Quantum Circuit Simulation with Resources Efficiency and Flexibility [0.5] 我々は、メモリ管理、システム適応性、実行効率の難しさを克服する状態ベクトルベースのハードウェアアクセラレータであるQEAを紹介する。
0.534Wの電力しか使わないAMD Alveo U280ボード上でQEAを実装し評価する。
実験の結果、QEAは極めて柔軟で、広範囲の量子回路をサポートし、忠実さに優れており、正規化ゲート速度の点で153.16倍の性能を持つCPUや関連技術より優れていた。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:05:03 GMT)
MINIMALIST: switched-capacitor circuits for efficient in-memory computation of gated recurrent units [0.5] リカレントニューラルネットワーク(RNN)は、時間的シーケンスデータの処理における長年の候補である。
トレーニングパラダイムの最近の進歩は、今では新しい世代の効率的なRNNに影響を与えている。
最小ゲートリカレントユニット(GRU)に基づく合理化およびハードウェア互換アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:13:41 GMT)
SkillFormer: Unified Multi-View Video Understanding for Proficiency Estimation [0.5] SkillFormerは、統合されたマルチビューの熟練度推定のためのパラメータ効率の高いアーキテクチャである。
マルチヘッド・クロスアテンション、学習可能なゲーティング、適応的な自己校正を使って、ビュー特有の特徴を融合する。
マルチビュー設定で最先端の精度を実現し、計算効率を著しく向上させる。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:27:24 GMT)
Signal-based AI-driven software solution for automated quantification of metastatic bone disease and treatment response assessment using Whole-Body Diffusion-Weighted MRI (WB-DWI) biomarkers in Advanced Prostate Cancer [0.5] We developed a AI-driven software solution to Quantify metastatic bone disease from WB-DWI scans。
i) 骨を分離するための骨格確率マップを生成する残留U-Netモデル、(ii) WB-DWI強度正規化のための統計フレームワーク、(iii) 浅い畳み込みニューラルネットワーク。
ソフトウェアは80.5%の精度、84.3%の感度、85.7%の特異性を達成した。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:57:49 GMT)
Efficient Adaptation For Remote Sensing Visual Grounding [0.5] 事前訓練されたモデルへの適応は人工知能の効果的な戦略となり、スクラッチからモデルのトレーニングにスケーラブルで効率的な代替手段を提供する。
本研究は, リモートセンシングにおけるPEFT技術の高効率かつ高精度なマルチモーダル解析への応用について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:53:11 GMT)
LCES: Zero-shot Automated Essay Scoring via Pairwise Comparisons Using Large Language Models [0.5] 本稿では,AESをペア比較タスクとして定式化する方法であるLCES(Comparent Essay Scoring)を提案する。
具体的には、2つのエッセイのどちらが優れているかを判断し、そのような比較を多く集め、それらを連続的なスコアに変換するようにLCMに指示する。
AESベンチマークデータセットを用いた実験により、LCESは計算効率を保ちながら従来のゼロショット法よりも精度が高いことが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:26:16 GMT)
Clustering-based Low-Rank Matrix Approximation: An Adaptive Theoretical Analysis with Application to Data Compression [0.5] 低ランク行列近似 (LoRMA) は高解像度データ行列を圧縮するための基本的なツールである。
データマトリックスを重なり合うパッチに分割する適応型LoRMAを導入する。
適応型LoRMAとグローバルSVDを4つの画像モダリティで比較し比較した。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:10:05 GMT)
Steiner Traveling Salesman Problem with Quantum Annealing [0.4] シュタイナー旅行セールスマン問題(Steiner Traveling Salesman Problem、STSP)は、古典的な旅行セールスマン問題の変種である。
STSPのNPハード性を考えると、この問題に対処するための量子的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:49:40 GMT)
Generalizing Large Language Model Usability Across Resource-Constrained [0.4] 論文は、現実世界の制約下での大規模言語モデルを一般化するための体系的な研究である。
まず、LLMが多様なモダリティをシームレスに統合することを可能にする、堅牢なテキスト中心アライメントフレームワークを導入する。
マルチモーダル設定以外にも、この論文はLLMの推論時間最適化戦略を研究している。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:00:12 GMT)
IndicSQuAD: A Comprehensive Multilingual Question Answering Dataset for Indic Languages [0.4] IndicSQuADは9つの主要なIndic言語をカバーする包括的多言語抽出QAデータセットである。
IndicSQuADは、各言語に対する広範なトレーニング、検証、テストセットを含む。
言語固有の単言語BERTモデルと多言語 MuRIL-BERT を用いたベースライン性能の評価を行った。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:11:55 GMT)
A new methodology to decompose a parametric domain using reduced order data manifold in machine learning [0.4] 反復主成分分析を用いたパラメトリック領域分解法を提案する。
2つの手法で逆プロジェクタを再構築し、下位データコンポーネントから元のプロジェクタへ投影する。
提案手法の有効性と有効性を示すために, 調和輸送問題の数値例を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:25:16 GMT)
Bayesian Estimation of Causal Effects Using Proxies of a Latent Interference Network [0.4] ネットワーク干渉は、ある単位に割り当てられた治療が他の単位の結果に影響を与える場合に起こる。
従来のアプローチでは、観測されたネットワークが干渉構造を正しく特定していると仮定することが多い。
本稿では,プロキシネットワークのみが利用できる場合の因果関係を推定するためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:46:30 GMT)
Large Language Models Meet Stance Detection: A Survey of Tasks, Methods, Applications, Challenges and Future Directions [0.4] スタンス検出は、ソーシャルメディア、ニュース記事、オンラインレビューなど、さまざまなプラットフォームにわたる主観的コンテンツを理解するために不可欠である。
大規模言語モデル(LLM)の最近の進歩は、新しい能力を導入して姿勢検出に革命をもたらした。
本稿では3つの重要な側面に沿って構築されたLCMに基づく姿勢検出手法について,新しい分類法を提案する。
スタンス検出、政治分析、公衆衛生モニタリング、ソーシャルメディアのモデレーションにおける主要な応用について論じる。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:47:49 GMT)
ConDiSim: Conditional Diffusion Models for Simulation Based Inference [0.4] ConDiSimは、計算可能な確率を持つ複素系のシミュレーションに基づく推論のための条件拡散モデルである。
10のベンチマーク問題と2つの実世界のテスト問題で評価され、有効な後部近似の精度を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:58:23 GMT)
From raw affiliations to organization identifiers [0.3] 既存のアプローチでは、複数の組織や外部情報の言及を含むアフィリエイト文字列の複雑さに対処できない。
本稿では,これらの課題に対処するための新しいアプローチであるAffRoについて紹介する。
その結果, 複雑なアフィリエイト文字列から組織を正確に同定する上で, AffRpの有効性が示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:27:19 GMT)
Exploiting Uncertainty for Querying Inconsistent Description Logics Knowledge Bases [0.3] 我々は、この問題を解決するために、disPONTEと呼ばれる既存の確率論的意味論を利用する。
提案手法をTRILLとBUNDLEに実装し,提案手法の有効性を実証的に検証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 21:06:22 GMT)
Decoding Futures Price Dynamics: A Regularized Sparse Autoencoder for Interpretable Multi-Horizon Forecasting and Factor Discovery [0.3] 本稿では,複数水平商品価格の同時予測のための正規化スパースオートエンコーダ(RSAE)を提案する。
以上の結果から,RSAEは競争力のあるマルチホライズン予測の精度と,価格変動に対するデータ駆動的洞察を提供することがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:44:43 GMT)
Monte Carlo Beam Search for Actor-Critic Reinforcement Learning in Continuous Control [0.3] 我々は,ビームサーチとモンテカルロロールアウトをTD3と組み合わせた新しいハイブリッド手法であるモンテカルロビームサーチ(MCBS)を導入し,探索と行動選択を改善した。
MCBSはポリシーのアウトプットに関するいくつかの候補アクションを生成し、それらを短期的なロールアウトを通じて評価することで、エージェントがより良いインフォームドの選択をすることができる。
本手法はTD3, SAC, PPO, A2Cに比べて, 異なる環境にまたがる収束率が高いことを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:56:12 GMT)
Beyond Basic A/B testing: Improving Statistical Efficiency for Business Growth [0.3] 標準的なA/Bテストアプローチは、主に大規模産業アプリケーションにおけるt-testに基づいている。
しかしながら、これらの標準的なアプローチは、小さなサンプルサイズまたは非ガウス分布の性質のため、ビジネス環境での統計力の低下に悩まされている。
i) 適応回帰、一般化された推定方程式、マン・ホイットニーU、ゼロ・トリムU。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:00:06 GMT)
A Classification Benchmark for Artificial Intelligence Detection of Laryngeal Cancer from Patient Voice [0.3] 現在の診断経路は非効率であり、患者と医療システムの両方に不適切なストレスを与える。
オープンソースデータセット上でトレーニングおよび評価された36のモデルからなるベンチマークスイートを導入する。
我々の最良のモデルでは、バランスの取れた精度が83.7%、感度が84.0%、特異性が83.3%、AUROCが91.8%である。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:50:39 GMT)
Generative Molecular Design with Steerable and Granular Synthesizability Control [0.3] 本稿では, ステアブルおよび粒状合成性制御が可能な分子生成設計フレームワークを提案する。
医薬化学変換においてこれらの反応制約を混合・整合する能力を示す。
当社のフレームワークが,デノボ最適化分子に対する産業副産物のバリデーションにどのように活用できるかを実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:53:54 GMT)
Interplay of entanglement structures and stabilizer entropy in spin models [0.3] エンタングルメント構造と非安定化剤性が量子相の特異なシグネチャとしてどのように機能するかを示す。
この結果から, 絡み合いスペクトル特性と魔法に基づく測度は, 量子相転移の相互に絡み合った, 頑健な指標となることが明らかとなった。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:22:24 GMT)
Interest Changes: Considering User Interest Life Cycle in Recommendation System [0.3] 本稿では,Deep Interest Life-cycle Network (DILN) という手法を提案する。
DILNは、興味あるライフサイクル機能を効率的にキャプチャするが、既存のランキングモデルと簡単に統合できる。
オンラインA/Bテストによると、DILNはCTRで+0.38%、CVRで+1.04%、ユーザ当たり+0.25%の大幅な改善を実現している。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:53:26 GMT)
Small but Significant: On the Promise of Small Language Models for Accessible AIED [0.3] GPTは、大きな言語モデル(LLM)とほぼ同義語になっている。
我々は、小規模言語モデル(SLM)が資源に制約のある機関に、高品質なAIツールへの公平で安価なアクセスを提供する上での潜在的影響を無視して、GPTのリスクに重点を置いていることを論じる。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:58:29 GMT)
Automatic detection of abnormal clinical EEG: comparison of a finetuned foundation model with two deep learning models [0.2] 提案する基礎モデルであるBioSerenity-E1とCNN-LSTMとTransformer-basedの2つのディープラーニングモデルを比較し,脳波記録全体を正常または異常と分類する。
3機は2500のEEG記録で訓練または微調整が行われた。
脳波自動分類における事前学習モデルの有用性について検討した。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:07:24 GMT)
Behind the Noise: Conformal Quantile Regression Reveals Emergent Representations [0.2] 本稿では,不確実性境界を校正した低品質測定を識別する機械学習手法を提案する。
共形量子レグレッションを用いて訓練された軽量でランダムに構造化されたニューラルネットワークのアンサンブルを用いて,本手法は信頼性の高い復調を行う。
実世界の地球生物化学イメージングデータに対するアプローチを検証し、自信ある解釈をサポートし、実験設計をガイドする方法を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:27:12 GMT)
Near-unity quantum interference of transverse spatial modes in an ultra-compact inverse-designed photonic device [0.2] 超コンパクトフットプリントが 3 $mu m$$times$ 3 $mu m$ である逆設計の逆モードビームスプリッターを用いて量子干渉を示す。
1つのデバイスから最大99.56$pm$0.64 %までの香港-オマンデルの可視性を測定し、99.38$pm$0.41 %の3つの同一デバイスの平均可視性を示す。
我々の研究は、逆設計のコンポーネントがマルチモードデバイスのチップ上での量子干渉に適していることを示し、将来のコンパクト化への道を開いた。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:30:47 GMT)
One Bad NOFO? AI Governance in Federal Grantmaking [0.2] 米国の機関は、連邦政府の財政援助に何十億ドルもの資金を投入する際に、見過ごされているAIガバナンスの役割を持っている。
裁量的な助成金メーカーとして、機関は、AIガバナンスのための隠されたレバーである、受賞者の行為をガイドし、制限する。
2009年から2024年にかけて、Grants.govに投稿された4万件以上の非防衛的連邦政府助成金通知(NOFO)のデータセットを使用します。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:08:22 GMT)
Fractional Wannier Orbitals and Tight-Binding Gauge Fields for Kitaev Honeycomb Superlattices with Flat Majorana Bands [0.2] 強結合ゲージ場に結合した分数軌道の低エネルギー格子モデルを導出するための新しい体系的枠組みを導入する。
我々の研究は、ゲージを介するタイトバインディングモデルのための一般的な枠組みと、相互作用する分数軌道に対するゲージ不変平均場理論を確立する。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:18:42 GMT)
Investigating Popularity Bias Amplification in Recommender Systems Employed in the Entertainment Domain [0.2] 本研究は,エンターテイメント分野における推薦システムにおける人気バイアスの増幅に関する研究をまとめたものである。
商品の推薦頻度が人気と正の相関があることを実証する。
その結果、人気コンテンツへの関心がほとんどないユーザグループは、人気のあるアイテムを好むユーザに比べて、精度の低いレコメンデーションを受けることができた。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:02:51 GMT)
When Recall Fails, Discord Remembers: A Quantum Analogue of Kuhn's Theorem [0.1] 行動量子戦略は、不完全なリコールを伴う広義のゲームにおいて、古典的な混合戦略のペイオフを再現する。
この結果から、クーンの古典的同値性に量子的類似性が示唆されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:25:59 GMT)
Explaining Autonomous Vehicles with Intention-aware Policy Graphs [0.1] 本稿では,都市環境における自動運転車の挙動を遠隔操作で説明するためのモデルに依存しないソリューションを提案する。
Intention-Aware Policy Graphsをベースとした本手法は,車両動作の解釈可能な信頼性説明の抽出を可能にする。
これらの説明は、車両が許容される法的境界内で動作しているかどうかを判断し、自律走行データセットやモデルにおける潜在的な脆弱性を特定するために有効であることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:58:32 GMT)
Evaluating the Symbol Binding Ability of Large Language Models for Multiple-Choice Questions in Vietnamese General Education [0.1] 我々は,複数選択質問応答(MCQA)タスクに対して,ゼロショット,ワンショット,少数ショット設定で複数選択シンボルバインディング(MCSB)を実行する大規模言語モデル(LLM)の能力を評価する。
このデータセットは、厳密なスタイルでタイプされているため、LSMと小言語モデル(LM)のMCSB能力を評価するために使用することができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:23:12 GMT)
Assessing the Feasibility of Internet-Sourced Video for Automatic Cattle Lameness Detection [0.1] 本研究では, 牛の乳腺, 病状, 異常を検出するためのディープラーニングモデルについて, 公開されているビデオデータを用いて検討した。
3D CNNモデルはビデオレベルの分類精度が90%に達し、精度、リコール、f1スコアはそれぞれ90.9%、90.9%、90.91%であった。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:22:55 GMT)
Reinforcement Learning-based Fault-Tolerant Control for Quadrotor with Online Transformer Adaptation [0.1] マルチローターは様々な分野のロボティクス応用において重要な役割を果たしている。
従来のアプローチでは、マルチロータモデルの事前知識や、新しい構成への適応に苦労する必要がある。
我々はトランスフォーマーベースのオンライン適応モジュールと統合された新しいハイブリッドRLベースのFTCフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:50:29 GMT)
Automated Meta Prompt Engineering for Alignment with the Theory of Mind [0.1] 本稿では,複雑なタスクに対して,フロートテキストを共同で生成するメタプロンプト手法を提案する。
LLMを審査員(LLMaaJ)として教えるエージェント強化学習の手法が応用される。
ユーザーは、US Open 2024 tennis Grand Slamで発表する前に、AI生成の長い文章を修正します。
米国オープン2024で展開された私たちの仕事は、スポーツやエンターテイメント内の他のライブイベントで使われてきました。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:42:36 GMT)
Three-dimensional real space renormalization group with well-controlled approximations [0.1] 我々は、カダノフのブロックアイデアを信頼性のある3次元実空間再正規化群(RG)法に変換する。
提案したRGは3次元の体系的に改善可能な実空間RG法として期待されている。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:40:28 GMT)
Multireference error mitigation for quantum computation of chemistry [0.1] 参照状態エラー緩和(REM)の拡張であるMREM(Multireference-state error mitigation)を導入する。
MREMは多重参照状態を利用して強相関基底状態のノイズを捕捉する。
分子系の包括的シミュレーションによるMREMの有効性を実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:11:42 GMT)
Superradiance of Strongly Interacting Dipolar Excitons in Moiré Quantum Materials [0.1] 本研究では,モイア格子の深部波長特性から生じるモイア励起子の共振特性について検討した。
以上の結果から, 層間モワール励起体は, 強く相互作用する多体系において, 協調的な光学現象を探索するためのユニークなプラットフォームとなることが示唆された。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:16:45 GMT)
Disruptive Transformation of Artworks in Master-Disciple Relationships: The Case of Ukiyo-e Artworks [0.1] 本稿では、東画の事例研究として、伝統的な日本画形式である浮世絵に焦点を当てる。
11,000枚の高解像度画像を用いて芸術作品の創造性を定量的に分析する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:55:53 GMT)
neuralGAM: An R Package for Fitting Generalized Additive Neural Networks [0.0] ニューラルGAMパッケージは、一般化付加モデルに基づくニューラルネットワークトポロジーを実装している。
このパッケージは、Generalized Additive Neural Networksをトレーニングするための柔軟なフレームワークを提供する。
合成データと実データの両方において、NeuralGAMパッケージの使用について説明する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:30:01 GMT)
When repeats drive the vocabulary: a Byte-Pair Encoding analysis of T2T primate genomes [0.0] 我々は、我々のカスタムツールであるdnaBPEを用いて512,000トークンの固定語彙で独立したBPEトークンライザを訓練する。
分析の結果、すべてのアセンブリで11,569個のトークンが共有されているのに対し、991,854個のトークンは1つのゲノムに固有のものであることがわかった。
我々は、ゲノムトークン化を洗練するための潜在的ハイブリッド戦略と繰り返しマスキングアプローチについて議論する。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:27:58 GMT)
WaLLM -- Insights from an LLM-Powered Chatbot deployment via WhatsApp [0.0] 発展途上国では、永続的なデジタル分割のため、情報へのアクセスは依然として困難である。
私たちはWhatsApp上のカスタムAIボット、WaLLMを開発しました。
当社のサービスは6ヶ月以上運用されており、約100人のユーザから14.7K以上のクエリを収集しています。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:36:18 GMT)
Vulnerabilities that arise from poor governance in Distributed Ledger Technologies [0.0] 分散Ledger Technologies (DLT) は分散化、透明性、セキュリティを約束するが、基本的なガバナンスの欠陥のために現実は不足することが多い。
本稿では、DLTガバナンスの現状を調査し、重大な脆弱性を特定し、優れたガバナンスのために広く受け入れられているベストプラクティスが欠如していることを強調する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:40:59 GMT)
Visual Image Reconstruction from Brain Activity via Latent Representation [0.0] レビューでは、フィールドの進化は初期の分類のアプローチから洗練された再構築まで遡る。
多様なデータセットの必要性と、人間の知覚的判断に合わせた洗練された評価指標について論じる。
視覚画像再構成は、ニューラルコーディングに関する有望な洞察を提供し、視覚経験の新たな心理的測定を可能にする。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:46:52 GMT)
Valid Bootstraps for Network Embeddings with Applications to Network Visualisation [0.0] ネットワークにおける不確実性の定量化は、エンティティ間の関係と相互作用をモデル化する重要なステップである。
ネットワークの単一観測のみを行う場合、不均一なランダムグラフをブートストラップすることの難しさを考察する。
我々は,任意のメソッドが生成したブートストラップサンプルを実証的に検証できる交換可能なネットワークテストを利用する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:49:40 GMT)
Using Few-Shot Learning to Classify Primary Lung Cancer and Other Malignancy with Lung Metastasis in Cytological Imaging via Endobronchial Ultrasound Procedures [0.0] 本研究は, 子宮内膜超音波(EBUS)における肺転移の早期発見を支援するコンピュータ支援診断システムを提案する。
細胞間の画像の制限と形態的類似性のため、肺転移の分類は困難であり、既存の研究ではこの問題を直接ターゲットとすることはめったにない。
データ不足を克服し、分類を改善するために、著者らは、きめ細かい分類とコントラスト学習を備えたハイブリッド事前学習バックボーンを用いた数ショット学習モデルを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:31:53 GMT)
Unveiling the Best Practices for Applying Speech Foundation Models to Speech Intelligibility Prediction for Hearing-Impaired People [0.0] 音声基礎モデル(SFM)は、聴覚障害者のための音声の可聴性予測(SIP-HI)など、様々な下流課題において強い性能を示した。
SIP-HIの性能に影響を及ぼす重要な設計要因を5つのSFMで同定する。
その結果,従来の全層法とは対照的に,単一のエンコーダ層を選択することで,より良い結果が得られることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 04:07:59 GMT)
Unsupervised Raindrop Removal from a Single Image using Conditional Diffusion Models [0.0] 単一画像からの雨滴除去は画像処理において難しい課題である。
拡散モデルの使用の最近の進歩は、最先端の画像塗装技術に繋がる。
本研究では,拡散画像を用いた単一画像からの雨滴除去手法を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:00:01 GMT)
Uniqueness of Squeezed States for One and Two Modes, and a No-Go Beyond [0.0] 我々は、$(a - α adagger)|psirangle = 0$という形の消滅条件で定義される圧縮真空状態の構造と特異性について検討する。
N=1$と$N=2$の場合、これらの条件はFockベースで標準の1モードと2モードの圧縮状態を一意に定義する。
次に、(a_i - alpha_i a_i+1dagger)|psirangle = 0$ with $a_
論文参考訳(メタデータ) (Tue, 13 May 2025 19:02:16 GMT)
Understanding molecular ratios in the carbon and oxygen poor outer Milky Way with interpretable machine learning [0.0] 解釈可能な機械学習を用いて、9つの異なる分子比を研究する。
低酸素および炭素初期存在量の分子雲の性質について検討した。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:08:37 GMT)
Two-electron quantum walks can probe entanglement and decoherence in an electron microscope [0.0] 本稿では,量子状態の異なる基底に変形する2電子量子ウォークを導入する。
我々は電子-電子相関において高いコントラスト干渉を観測するが、電子-電子絡みの顕著な兆候はない。
複数の自由電子の量子状態を特徴づける能力は、基礎研究や量子電子顕微鏡で用いられる電子と電子の絡み合いの検証を可能にする可能性がある。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:48:07 GMT)
Tsirelson's Inequality for the Precession Protocol is Maximally Violated by Quantum Theory [0.0] ツィレルソンの不等式は、古典理論における$P_3 leq 2/3$は、ある状態によって量子論において破られると述べている。
我々は、有限個の結果を持つシステムに対して、プレセッションプロトコルを理論に依存しない方法で検討する。
我々は、量子論が常にこの境界を飽和させることを構成によって証明する。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:56:57 GMT)
TrialMatchAI: An End-to-End AI-powered Clinical Trial Recommendation System to Streamline Patient-to-Trial Matching [0.0] 本稿では,患者間マッチングを自動化するAIを利用したレコメンデーションシステムTrialMatchAIを提案する。
微調整されたオープンソースの大規模言語モデルに基づいて構築されたTrialMatchAIは、透明性を確保し、軽量なデプロイメントフットプリントを維持する。
現実のバリデーションでは、腫瘍学患者の92%が、少なくとも1つの関連するトライアルを、トップ20のレコメンデーションで回収した。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:39:06 GMT)
Trade-off between Gradient Measurement Efficiency and Expressivity in Deep Quantum Neural Networks [0.0] 量子ニューラルネットワーク(QNN)は、実用的な量子優位性を達成するために効率的なトレーニングアルゴリズムを必要とする。
本稿では, 量子回路の対称構造を利用して, トレードオフ上界を実現するSLPA (Stabler-logical Product Ansatz) と呼ばれる一般QNNアンサッツを提案する。
数値実験により、SLPAは精度と訓練性を維持しながら、トレーニングに必要なサンプルの複雑さを大幅に減らすことが示された。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:02:13 GMT)
Towards Foundation Models for Experimental Readout Systems Combining Discrete and Continuous Data [0.0] 我々は、将来の電子イオン衝突型加速器において、チェレンコフ検出器からの低レベル検出器入力を動作させることができる(プロトタイプ)核物理学基礎モデルを提案する。
本モデルにより,チェレンコフ光子に対する高速かつ高忠実な画素生成および時間列生成が可能となり,高速DIRCにおけるクロージャ試験により検証された。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:49:45 GMT)
Time Advance and Probability Conservation in PT-Symmetric Quantum Mechanics [0.0] 励起状態が減衰すると、時間発展作用素 $U(t)=e-iHt$ は $Udagger(t)U(t)=I$ に従わない。
結果として、崩壊に伴う時間遅延は、励起のための等しい時間進行と反対の時間進行を伴わなければならない。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:21:20 GMT)
TikTok Search Recommendations: Governance and Research Challenges [0.0] TikTokは検索エンジンとしての利用を受け入れ、ユーザーが検索可能なコンテンツを作るための検索製品を開発している。
このポジションペーパーは、TikTokにおける検索レコメンデーションの斬新さに対処し、この機能がプラットフォームガバナンスにもたらす課題を強調している。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:32:09 GMT)
Thin Film Lithium Niobate on Diamond (LiNDa) platform for Efficient Spin-Phonon Coupling [0.0] ダイヤモンド中の負電荷シリコン空孔(SiV)中心は、固体量子メモリの候補となっている。
表面音響波(SAW)によるコヒーレントスピン制御が実証され、オンチップ・フォノン量子ネットワークの開発に不可欠である。
我々は、薄膜ニオブ酸リチウム(TFLN)とダイヤモンドを結合して、単一SiVスピンの音響制御を可能にするヘテロジニアス一体型フォノンプラットフォームを実証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:38:15 GMT)
The Impact of Large Language Models on Open-source Innovation: Evidence from GitHub Copilot [0.0] 大規模言語モデル(LLM)は、ガイド付き設定における個人の生産性を高めることが示されている。
本稿では,LLMが協調作業の2つの側面,すなわち能力革新と反復的イノベーションに影響を及ぼすかどうかを考察する。
GitHub Copilotの選択的なロールアウトに関する自然な実験を活用することで、GitHub上のオープンソースプロジェクトに注力しています。
コントリビューション全体の飛躍的な増加を観察し、LLMが非ガイド環境で協調的なイノベーションを効果的に増強することを示唆している。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:08:10 GMT)
The Failure of Plagiarism Detection in Competitive Programming [0.0] プログラミングコースにおけるプラジャリズムは依然として永続的な課題である。
本稿では,従来のコードプラジャリズム検出手法が競合プログラミングの文脈で頻繁に失敗する理由について考察する。
広く使われている自動類似性チェッカーは、単純なコード変換や、新しいAI生成コードによって妨げられる。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:43:49 GMT)
The Effect of Trap Design on the Scalability of Trapped-Ion Quantum Technologies [0.0] 本研究では,表面トラップ上に接地面を配置した簡易なマルチウェーハ形状を提案する。
我々は,このトラップの性能を,線形ポールトラップの小型版である表面トラップとマルチウェーハトラップと比較した。
その結果,2つのマルチウェーハトラップ設計は,高調波化により表面トラップ設計よりも電力散逸が大幅に向上することが判明した。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:55:09 GMT)
Systematic many-fermion Hamiltonian input scheme and spectral calculations on quantum computers [0.0] 本稿では、相対論的あるいは非相対論的な多重フェルミオン系の一般第二量子化ハミルトニアンに対する新しい入力スキームを提案する。
入力方式に基づいて,将来の量子ハードウェア上でのスペクトル計算のためのハイブリッド量子古典的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:26:41 GMT)
Statistical models of barren plateaus and anti-concentration of Pauli observables [0.0] 本稿では,3つの主要なバレン高原の統計モデルについて紹介する。
非局所可観測子は、ランダムなパウリ作用素によってモデル化され、確率が指数関数的に1に近いバレンプラトーをもたらす。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:28:04 GMT)
Statistical Decision Theory with Counterfactual Loss [0.0] 我々は、標準的な意思決定理論を拡張して、すべての潜在的な結果を用いて意思決定を評価する反事実的損失の基準を組み込む。
強い無知性の仮定の下では、反現実的損失関数が潜在的な結果に付加的である場合に限って、反現実的リスクが特定可能であることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:00:07 GMT)
Space-time tradeoff in networked virtual distillation [0.0] 仮想蒸留は、理想的な条件下で、量子状態コピーの数が増えるにつれてエラーを指数関数的に抑制できる技術である。
時空トレードオフを最大化するエッジケースに対応するVDの実用的実装を3つ分析する。
ネットワーク型イオントラップシステムの現実的なノイズ特性下での3つの実装の性能を数値的に比較する。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:04:08 GMT)
Simultaneous sweet-spot locking of gradiometric fluxonium qubits [0.0] 近傍のフラックス線間のクロストークは、ゼロフィールドのスイートスポットのキュービットをバイアスするために必要である。
グラジオメトリック・ループ(gradiometric loops)は、対称なときにフラクトンが閉じ込められると、デバイスをスイートスポットに保持するフラックスロック機構を組み込んだものだ。
アルミニウムループが捕捉されたフラッションを無期限に保持する複数のグラジオメトリックフラッソニウム量子ビットを同時にロックすることで、この手法を実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:40:39 GMT)
Simulating lossy and partially distinguishable quantum optical circuits: theory, algorithms and applications to experiment validation and state preparation [0.0] 我々は,光子数分布の計算が指数時間で可能であることを証明し,高速化を実現する。
その結果,Fock と Gaussian のボーソンサンプリングの検証試験において,大幅な高速化と精度の向上が得られた。
彼らはリアルなフォトニック回路のより効率的なシミュレーションへの道を開いた。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:24:25 GMT)
Simplified Fermionic Scattering State Preparation for the NISQ Era [0.0] 本稿では,回路深さを大幅に低減する簡易なフェルミオン散乱状態調製法を提案する。
単純化された状態は、少数の量子ビットで準備されている間、真のフェルミオン状態の挙動のほとんどを保っていることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:38:37 GMT)
Self-consciousness and personal identity in quantum panprotopsychism [0.0] 我々は、自己意識を経験の主題として見る能力として分析する。
絡み合った系では、個々の部分の性質が消失し、指数的な数の創発性や状態が生じる。
この文脈では、パーソナリティの問題は、単純な視点や還元的アプローチの問題から解放された新しい形態を取る。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:55:33 GMT)
Self-Supervised Learning for Robotic Leaf Manipulation: A Hybrid Geometric-Neural Approach [0.0] 本稿では,自律的な葉の把握のためのハイブリッドな幾何学的アプローチを提案する。
本手法は,従来のコンピュータビジョンとニューラルネットワークを自己教師付き学習により統合する。
制御された環境では88.0%、実際の温室環境では84.7%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:20:44 GMT)
Securing RAG: A Risk Assessment and Mitigation Framework [0.0] Retrieval Augmented Generation (RAG)は、ユーザ向けNLPアプリケーションのためのデファクト業界標準として登場した。
本稿では,RAGパイプラインの脆弱性を概観し,データ前処理からLLM(Large Language Models)の統合に至るまで,攻撃面の概要を述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:39:00 GMT)
Schwinger pair production in counterpropagating laser pulses: Identifying volume factors [0.0] 2つの逆伝搬線形偏光レーザーパルスの組み合わせによる真空対生成の非摂動過程について検討する。
我々は, 対応する4次元構成の総粒子収率を計算し, 簡易な低次元シナリオで得られた推定値と比較した。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:27:46 GMT)
SAFE-SiP: Secure Authentication Framework for System-in-Package Using Multi-party Computation [0.0] チップレットベースの異種統合は、半導体、AI、高性能コンピューティング産業を変革している。
現在のソリューションは、しばしば専用のセキュリティチップレットや、信頼できるSiPインテグレータを前提としたタイミングフローの変更に依存している。
SAFE-SiPは,チップレットシグネチャを解析し,完全性検証にMPCを使用するスケーラブルな認証フレームワークである。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:36:17 GMT)
Resource-Efficient Language Models: Quantization for Fast and Accessible Inference [0.0] 大規模な言語モデルでは、自然言語処理が大幅に進歩しているが、ハードウェアのアクセシビリティやエネルギー消費に関して、その膨大なリソース要求が課題を提起している。
本稿では,エンドユーザによるLLMの推論効率の最適化を目的とした,ポストトレーニング量子化手法の集中的かつ高レベルなレビューを行う。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:39:33 GMT)
Red Teaming the Mind of the Machine: A Systematic Evaluation of Prompt Injection and Jailbreak Vulnerabilities in LLMs [0.0] 大規模言語モデル(LLM)は、消費者およびエンタープライズアプリケーションにますます統合されている。
その能力にもかかわらず、アライメントセーフガードをオーバーライドする迅速な注射やジェイルブレイクのような敵の攻撃を受けやすいままである。
本稿では,様々な最先端のLDMに対するジェイルブレイク対策を体系的に検討する。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:36:34 GMT)
Reciprocity as the Foundational Substrate of Society: How Reciprocal Dynamics Scale into Social Systems [0.0] マルチエージェントAIにおける大きなボトルネックは、現実的な行動制約の下での社会構造のボトムアップ発生のためのシミュレート可能なモデルがないことである。
相互ダイナミクス, 個人レベルの相互交換のキャプチャ, 共有期待の統合であるノルム安定化, 安定したパターンをスケーラブルな構造に外部化する制度構築という3段階のボトムアップフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:50:01 GMT)
Realizing non-trivial doublon formation using a quantum computer [0.0] 連続時間量子ウォークをシミュレートすることにより,量子コンピュータにおけるダブルロン生成のシグネチャを示す。
初期ダビロンと自由粒子の場合、ドビロンの安定性は力学におけるダビロンよりも顕著である。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:09:11 GMT)
Quantum confinement theory of ultra-thin films: electronic, thermal and superconducting properties [0.0] 電子機器の小型化は、数ナノメートルの厚さからわずか1-2ナノメートルまでの超薄膜の出現につながった。
従来の理論やab initio法は、実験で測定された性質を記述するのに苦労している。
量子閉じ込めに対する統一的な理論的アプローチが提案されており、インタフェースの実際の性質を考慮に入れることができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:56:20 GMT)
Quantum computational speedup and retrocausality [0.0] 最適量子アルゴリズムは、量子スピードアップの存在が論理的に相互排他的あるいは因果ループを意味することを示している。
慣用量子記述のユニタリ部分は数学的にはあるが、因果関係の振る舞いの記述はそれに沿って変化する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:44:13 GMT)
Quantum Time Crystal Clock and its Performance [0.0] 凝縮物質理論において、時間結晶は(擬)平衡の振動を特徴とする新しい物質相として発見された。
テクティカン・タイム・クリスタルは量子時計として使われ、熱力学の観点からのパフォーマンスはどうなるのか?
この疑問に答え、量子結晶は真の量子時計であり、時間-翻訳対称性の自発的な破れによって性能が向上している。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:41:08 GMT)
Quantum Support Vector Regression for Robust Anomaly Detection [0.0] 異常検出(AD)は、特にITセキュリティの領域において、データ分析において重要である。
本研究では、量子MLアプローチ、特に量子カーネル法の可能性について検討し、ロバストADへの応用について述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:54:41 GMT)
Quantum State Readout via Overlap-Based Feature Extraction [0.0] 提案手法は、量子状態の振幅の生値と絶対値の両方に対する量子状態の読み出しを含む。
格子型波動関数とX線吸収スペクトルを量子状態から再構成するための予備数値シミュレーションを行った。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:30:42 GMT)
Proper scoring rules for estimation and forecast evaluation [0.0] 本稿では,適切なスコアリングルールの数学的基礎について概観する。
推定・予測評価における統計学と機械学習の役割について論じる。
論文参考訳(メタデータ) (Tue, 13 May 2025 22:12:47 GMT)
Propagation of Spin Waves in Doubly Periodic Magnonic Crystals [0.0] 本研究は, 二重周期性を有する1次元マグノン結晶のバンドギャップ特性について検討した。
以上の結果から,複数の周期性は,所望のバンドギャップを持つマグノン結晶の創出に有効な設計パラメータとなる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:00:17 GMT)
Probing the Universe's Topology through a Quantum System? [0.0] 我々は3次元ディラックデルタポテンシャルの有界状態における量子粒子のエネルギー固有値に、コンパクトで、平坦で、宇宙論的に着想を得た位相がいかに影響するかを分析する。
我々の研究は、地球規模の宇宙トポロジーが量子境界状態にどのように現れるかの理論的な洞察を与え、初期の宇宙量子現象の将来の研究を知らせるかもしれない。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:18:57 GMT)
Probing arbitrary polarized photon pairs undergoing double Compton scatterings by a dedicated MC simulator validated with experimental data [0.0] 2光子系の自由度における量子相関は広く研究されている。
バイパルタイト光子の初期偏光状態をシミュレートできるGeant4ベースのモンテカルロ・ウィーン=ワルシャウモデルを提案する。
2つの散乱面の角度差における偏光を符号化する2乗可視(干渉コントラスト)の値を求める。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:37:02 GMT)
Privacy-Preserving Analytics for Smart Meter (AMI) Data: A Hybrid Approach to Comply with CPUC Privacy Regulations [0.0] カリフォルニア州では、規制決定は顧客のエネルギー使用データに対する厳格なプライバシー保護を義務付ける。
データ匿名化、プライバシー保護機械学習、合成データ生成、暗号化技術から引き出されたソリューションについて検討する。
これにより、機械学習モデル、エネルギー消費データに関する統計および計量分析を含む高度な分析が、個人のプライバシーを損なうことなく実行できる。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:30:35 GMT)
Physics-informed neural networks viewpoint for solving the Dyson-Schwinger equations of quantum electrodynamics [0.0] 物理インフォームドニューラルネットワーク(PINN)は、ユークリッド空間における量子電磁力学(QED)のダイソン・シュウィンガー方程式を解くために用いられる。
我々のPINNフレームワークは、積分方程式を直接損失関数に挿入することで、単一ニューラルネットワークがモータのスペクトル上での質量関数の連続的かつ微分可能な表現を学習することができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:01:29 GMT)
Photocurrent Enhancement in a Generalized Quantum Photocell with Multi-Donor Architectures [0.0] 本研究では,N個の独立ドナー分子を中心受容体の周囲に対称に配置したスケーラブルなアーキテクチャを提案する。
ドナー数の増加は光電流および出力パワーの超線形化につながることが判明した。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:48:05 GMT)
Performance of rotation-symmetric bosonic codes in the presence of random telegraph noise [0.0] 連続変動系におけるボソニックモードに対する個人および複数ゆらぎ器の影響を解析する。
ガウス状態の場合、スクイーズや熱ゆらぎは非マルコビアン性を高めないことを示す。
誤り訂正の利点で知られる回転対称ボソニック符号(RSB)では、非マルコビアン性は符号対称性とともに線形に増大する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:32:18 GMT)
Oracle problems as communication tasks and optimization of quantum algorithms [0.0] 出力と実値の相互情報を用いたアルゴリズムの性能測定を提案する。
我々は,任意のオラクル分類問題に対して,少なくとも一定数のクエリを使用する最適非適応アルゴリズムについて述べる。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:28:33 GMT)
Optimizing Neuro-Fuzzy and Colonial Competition Algorithms for Skin Cancer Diagnosis in Dermatoscopic Images [0.0] 本研究の目的は,画像処理技術と機械学習アルゴリズムの融合によるギャップを埋めることである。
また,ISICデータベースの皮膚内視鏡画像にも適用し,その精度は94%であった。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:17:19 GMT)
Operator formulation of Classical mechanics: Levi-Civita map and equivalence of central forces in 2-dimensions [0.0] 古典力学の演算子定式化を2次元の2つの中心ポテンシャルに明示的に適用することで研究する。
これら2つのポテンシャルに付随する古典波動関数を解く。
連続性方程式を満たす一方で、これらの古典波動関数は2次元平面の有限領域でのみ再正規化可能であることが示される。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:13:27 GMT)
On the first quantization and quantum diversity of photons [0.0] 第一量子化法に基づく光子の量子理論は、量子力学の定式化においてシュレーディンガーが用いたものと同様である。
波動方程式、シュレーディンガー様方程式、光子のディラック方程式が導出される。
分散媒質の新規方程式における光子の伝播を記述する。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:13:47 GMT)
Notes on Quantum Computing for Thermal Science [0.0] 本論文は熱科学における量子コンピューティングの可能性について考察する。
実験により、最も効果的なアルゴリズムの探索と実際の量子ハードウェアの性能について言及する。
工学的な問題に対する新しいアルゴリズムの開発は、量子コンピューティングのユニークな強みを活用することを目的としている。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:10:29 GMT)
Next Word Suggestion using Graph Neural Network [0.0] 本稿では,GNNにおけるグラフ畳み込み処理を利用してコンテキストを符号化し,LSTMと連立して次の単語を予測する手法を提案する。
我々は、非常に限られたリソースを使って、カスタムのウィキペディアテキストコーパスでこれをテストし、このアプローチが次の単語を予測するのにかなりうまく機能していることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:59:10 GMT)
NeurIPS 2024 Ariel Data Challenge: Characterisation of Exoplanetary Atmospheres Using a Data-Centric Approach [0.0] 本研究では,データ中心のビジネスアプローチに着目し,競争特化最適化よりも一般化を優先する。
ガウス対数類似度(GLL)スコアにおいて不確実性推定が重要な役割を果たすことを示す。
本研究は,天体物理データ解析におけるモデル単純性,解釈可能性,一般化のトレードオフを強調した。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:09:22 GMT)
Nesterov acceleration in benignly non-convex landscapes [0.0] 本研究では, モーメントに基づく最適化アルゴリズムが, 深層学習問題の非凸設定に応用可能であることを示す。
本稿では、加速理論と実践設定のこのギャップを部分的に埋める。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:12:54 GMT)
Minimally Entangled Typical Thermal States for Classical and Quantum Simulation of 1+1-Dimensional $\mathbb Z_2$ Lattice Gauge Theory at Finite Temperature and Density [0.0] 有限温度と密度で強い結合ゲージ理論をシミュレートすることは、核物理学や高エネルギー物理学における長年の挑戦である。
我々は、古典的および量子的両方の研究を容易にするために、最小絡み合った典型的な熱状態(METTS)アプローチを用いる。
我々の研究は、古典的および量子的ハードウェアと強く結合したゲージ理論の将来の研究の舞台となる。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:57:54 GMT)
Metric Similarity and Manifold Learning of Circular Dichroism Spectra of Proteins [0.0] 本研究ではSP175データベースから球状タンパク質の円二色性スペクトルの機械学習解析を行った。
以上の結果から,$mathcalW_1$はEuclideanとManhattanの両メトリクスと一致し,ノイズに対する堅牢性を示した。
一方、$t$-SNEは高次元データの有意義な構造を明らかにする。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:15:55 GMT)
Metal-Insulator Transition described by Natural Orbital Functional Theory [0.0] 水素系システムは金属絶縁体遷移(MIT)を研究するための単純だが強力なモデルを提供する
自然軌道汎関数理論(NOFT)を用いた立方体構造を持つ有限水素クラスターの研究
その結果, 原子間距離が減少するにつれて, NOFTは絶縁から金属への遷移を捉えていることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:52:18 GMT)
Magnetic penetration depth of Aluminum thin films [0.0] 超伝導浸透深さ$lambda$ 様々な厚さのアルミニウム薄膜
選択された厚さの範囲は、薄膜状態からバルクな挙動に近づいている状態まで及ぶ。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:31:47 GMT)
Learning cardiac activation and repolarization times with operator learning [0.0] 我々は最近提案された2つの演算子学習手法、すなわちフーリエニューラル演算子(FNO)とカーネル演算子学習(KOL)を利用する。
我々は、物理領域の応用刺激を活性化時間分布と再分極時間分布にマッピングする演算子を学習する。
これらのデータ駆動法は、合成2Dドメインと3Dドメイン、および生理学的にリアルな左心室形状に基づいて評価される。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:50:16 GMT)
Layered Uploading for Quantum Convolutional Neural Networks [0.0] 量子回路に沿ってデータをアップロードする新しいアーキテクチャを提案する。
これにより、量子回路に使用する量子ビットの数を増やすことなく、データからより多くの機能を利用することができます。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:42:16 GMT)
Landau levels in a time-dependent magnetic field: the Madelung fluid perspective [0.0] 本研究では, 波動関数のスロッシング振動を, 磁力とボームポテンシャルのランダウ準位勾配のバランスから逸脱した結果として解釈できることを示す。
本研究は、Madelung流体アプローチが、量子力学と物理流体力学の非関連概念の類似性を明らかにしていることを示している。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:41:24 GMT)
Key exchange protocol based on circulant matrix action over congruence-simple semiring [0.0] 並列半環上の行列に作用する循環行列に基づく新しい鍵交換プロトコルを提案する。
我々は、その計算コストと既知の攻撃に対するセキュリティについて分析する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:28:08 GMT)
Isolation Forest in Novelty Detection Scenario [0.0] ノベルティ検出は、通常のデータのみをトレーニングした後、これまで見えなかったパターンを特定することに焦点を当てる。
本研究では,ストリーミング異常検出のために提案されたハーフスペースツリー(HST)アルゴリズムについて検討する。
本稿では,新規性検出タスクに特化して適応する理論的修正を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:21:53 GMT)
Is gauge symmetry vacuous or physical ? : Lessons from the Landau problem as a solvable quantum gauge theoretical system [0.0] ゲージ対称性は現代物理学において最も重要な概念の1つである。
その意味や解釈には矛盾する見解が2つある。
親しみやすいゲージ原理は、2つの視点の微妙なミスマッチを解き放つ上で重要な役割を担っていると論じる。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:54:24 GMT)
Introduction to Machine Learning [0.0] この本は、機械学習で使用される多くのアルゴリズムの開発と分析に繋がる数学的基礎と技法を紹介する。
次に、被験者は、サンプリング方法を示す章から始まる生成方法に切り替える。
次の章では、クラスタリング、因子分析、多様体学習など、教師なしの学習方法に焦点を当てている。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:40:29 GMT)
Interface-Bound States and Majorana Zero Modes in Lateral Heterostructures of Bi$_2$Se$_3$ and Sb$_2$Te$_3$ with Proximity-Induced Superconductivity [0.0] マヨラナゼロモード(MZM)は2つの3次元トポロジカル絶縁体からなる側方ヘテロ構造に現れる。
我々の発見は、トポロジカル量子コンピューティングのプラットフォームとしてのこのヘテロ構造の可能性を強調した。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:53:56 GMT)
Interactive Oracle Proofs of Proximity to Codes on Graphs [0.0] FRIプロトコルにインスパイアされたグラフ上のコードのための対話型Oracle Proof of Proximity (IOPP)を設計する。
音質はFRIに比べて大幅に改善され、複雑性パラメータは同等であり、使用するフィールドに制限はない。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:06:46 GMT)
Intelligent Road Anomaly Detection with Real-time Notification System for Enhanced Road Safety [0.0] ポットホールや亀裂などの道路損傷異常は、事故の重要かつ頻発する原因として現れている。
網羅的なシステムは、穴、亀裂を検知し、そのサイズを分類し、当局による適切な行動のためにデータをクラウドに送信するために開発されている。
また、道路上で重篤な異常が検出された場合、周囲の車両に警告信号を発信する。
論文参考訳(メタデータ) (Tue, 13 May 2025 18:12:03 GMT)
Improved delta-kick cooling with multiple non-ideal kicks [0.0] 本研究では, 魅力的なキックと反発キックを戦略的に組み合わせることで, 調和ポテンシャルの効果を模倣できることを示す。
提案手法は,2パルスシーケンスで2.5ドル,3パルスシーケンスで3.2ドルで運動温度の低下を示唆する。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:12:24 GMT)
Identifying optimal magnetic field configurations for decoherence mitigation of boron vacancies in hexagonal boron nitride [0.0] 2Dヘキサゴナル窒化ホウ素の ホウ素空孔センターが 有望な量子センサーとして出現しました
中心電子スピンと超微細に結合した核スピンは、磁場変動体として効果的に振舞い、急速に脱コヒーレンスをもたらす。
本稿では、スピンコヒーレンスの向上につながる特異部分空間の実現における静磁場強度と配向の効果について検討する。
論文参考訳(メタデータ) (Tue, 13 May 2025 11:39:13 GMT)
Human-AI Collaboration or Academic Misconduct? Measuring AI Use in Student Writing Through Stylometric Evidence [0.0] 本研究は,学術著作におけるAI支援の定量化のためのオーサシップ検証(AV)技術の利用について検討する。
公開データセット(PAN-14)を含む3つのデータセットと、さまざまなコースのメルボルン大学の学生の2つを使用します。
学生向けの堅牢な書記プロファイルを構築するために,特徴ベクトル差分AV手法を開発した。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:36:36 GMT)
High-dimensional Bayesian Tobit regression for censored response with Horseshoe prior [0.0] 本稿では,高次元Tobitレグレッションのための新しいフレームワークを提案する。
高次元のベイズトビットモデルに対する最初の理論的結果を与えるため、後方整合性を確立し、疎度下で濃度率を導出する。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:05:27 GMT)
Graph RAG for Legal Norms: A Hierarchical and Temporal Approach [0.0] 本稿では,法規範の分析と理解を目的としたグラフ検索拡張生成(Graph RAG)の適応を提案する。
構造化知識グラフとコンテキストに富んだテキストセグメントを組み合わせることで、Graph RAGは、固有の複雑さと膨大な法的データに対処する有望なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:19:55 GMT)
Governance of Ledger-Anchored Decentralized Identifiers [0.0] 分散ID(Decentralized Identifier)は、エンティティにユニークな自己発行の識別子の制御を証明する権限を与える。
本稿では、DIDの管理の意味を考察し、複数のエンティティによってDIDを制御できる様々な形態について論じる。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:08:44 GMT)
From S4 to Mamba: A Comprehensive Survey on Structured State Space Models [0.0] シーケンスモデリングの最近の進歩は、構造化状態空間モデル(Structured State Space Models, SSMs)の出現につながっている。
SSMは構造的再帰と状態空間表現を利用して、線形またはニア線形複雑度で優れたロングシーケンス処理を実現する。
この調査は、AIとディープラーニングにおけるSSMベースのアーキテクチャの進歩、トレードオフ、今後の方向性を詳述した、研究者や実践者の構造化ガイドとして機能する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:46:33 GMT)
ForeCite: Adapting Pre-Trained Language Models to Predict Future Citation Rates of Academic Papers [0.0] 本稿では,学術論文の今後の引用率を予測するフレームワークであるForeCiteを紹介する。
ForeCiteは2000年から2024年にかけて発行された900K以上のバイオメディカル論文のキュレートされたデータセット上で、$rho = 0.826$のテスト相関を達成している。
これらの結果は,学術研究の長期的影響を予測し,科学的貢献の自動化された高忠実度評価の基礎を築いた。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:10:00 GMT)
FLUXSynID: A Framework for Identity-Controlled Synthetic Face Generation with Document and Live Images [0.0] FLUXSynIDは、ユーザ定義の識別属性分布を持つ高精細合成顔データセットを生成するためのフレームワークである。
FLUXSynIDを用いて生成されたデータセットは、実際のアイデンティティ分布との整合性が向上し、以前の作業よりもセット間の多様性が向上した。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:21:53 GMT)
Exploring the Effects of Mass Dependence in Spontaneous Collapse Models [0.0] 自然崩壊モデルは、量子力学における長年の計測問題を、客観的波動関数の崩壊を含むように理論のダイナミクスを変更することで解決することを目的としている。
我々は,崩壊モデルの将来の発展と実証テスト可能性に重要な意味を持つ,限られた範囲の大量依存関数のみが実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:14:48 GMT)
Exploring Challenges in Test Mocking: Developer Questions and Insights from StackOverflow [0.0] FLOW技術におけるMockingに関する25,302の質問を分析した。
トピックモデリングにLatent Dirichlet Allocationを使用しました。
我々は,各カテゴリーの年次および相対確率を分析し,モック関連議論の進化を解明した。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:23:49 GMT)
Experimental demonstration of a multi-particle collective measurement for optimal quantum state estimation [0.0] 量子状態推定ゲームにおける最適解として提案される2粒子集合計測を実験的に実証した。
以上の結果から, 集団計測戦略は, 少なくとも局所的手法としては最適であることが示唆された。
本研究では, 量子状態トモグラフィーに集合計測を適用し, 試料の総数とともに不均一性のほぼ最適スケーリングを観察する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:47:26 GMT)
Exact quantum noise deconvolution with partial knowledge of noise [0.0] ノイズの完全な知識に依存しない新しい量子ノイズデコンボリューション技術を導入する。
我々は、ノイズの不完全な知識にもかかわらず、完全に修正可能な期待値を持つ観測可能な集合を構築した。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:56:59 GMT)
Evaluating LLM Metrics Through Real-World Capabilities [0.0] 大規模調査データと利用ログを分析し,Large Language Models(LLM)の使用方法を示す6つのコア機能を特定する。
次に、既存のベンチマークがこれらの機能をカバーする範囲を評価し、カバレッジ、効率測定、解釈可能性に大きなギャップがあることを明らかにする。
6つの機能のうち4つは、実世界のタスクに最適なベンチマークを特定し、それらを主要なモデルの比較に使用します。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:02:37 GMT)
Equilibrium Propagation for Learning in Lagrangian Dynamical Systems [0.0] トレーニングは、望ましい目標に向かって軌道を優しくヌードし、トレーニング対象のパラメータにどのように共役するかを測定することで達成される。
この方法は、周期境界条件や固定された初期状態と最終状態を持つシステムに特に適しており、時間を通して明示的なバックプロパゲーションを必要とせず、効率的なパラメータ更新を可能にする。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:06:52 GMT)
Enhancing Thyroid Cytology Diagnosis with RAG-Optimized LLMs and Pa-thology Foundation Models [0.0] 本研究は,病理基盤モデルを用いたAUC拡張大言語モデル(LLM)の甲状腺診断への応用について検討した。
キュレートされた知識ベースを活用することにより、RAGは関連するケーススタディ、診断基準、専門家の解釈のダイナミック検索を促進する。
これらのAI駆動のアプローチの融合は、診断の整合性を高め、多様性を低下させ、悪性甲状腺病変から良性を排除する病理学者を支援する。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:01:35 GMT)
Efficient driving of a spin-qubit using single-atom magnets [0.0] 単原子磁石が近傍の単一スピン量子ビットを効率的に駆動する方法を実証する。
交換結合の変調が一次駆動力であることを示し,数MHz帯でのラビレートの再現に成功した。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:49:10 GMT)
Edge modes and boundary impurities in the anisotropic Heisenberg spin chain [0.0] 分数化スピン-$frac12$エッジモードと結合スピン-$frac12$エッジの不純物との相互作用について検討した。
本研究は, ギャップ付き反強磁性系における境界不純物のニュアンス挙動を明らかにするものである。
論文参考訳(メタデータ) (Tue, 13 May 2025 02:53:39 GMT)
Early Detection of Forest Calamities in Homogeneous Stands -- Deep Learning Applied to Bark-Beetle Outbreaks [0.0] 本研究では,森林における異常検出のためのLong Short Term Memory (LSTM) Autoencoderに基づくディープラーニングアルゴリズムの可能性について検討した。
そこで本研究では,2018年から2024年末までの7年間にわたって,ドイツのテューリンゲンで純粋な発芽点をモニタリングした。
我々の最良のモデルでは、テストデータに対して87%の精度で検出を行い、非常に早い段階で全異常の61%を検出できた。
論文参考訳(メタデータ) (Tue, 13 May 2025 07:55:00 GMT)
DyGSSM: Multi-view Dynamic Graph Embeddings with State Space Model Gradient Update [0.0] 状態空間モデル勾配更新(DyGSSM)を用いたマルチビュー動的グラフ埋め込み法を提案する。
提案手法では,局所的な特徴抽出のためのグラフ畳み込みネットワーク(GCN)と,各スナップショットにおけるグローバルな特徴抽出のためのGRU(Gated Recurrent Unit)を組み合わせた。
5つの公開データセットの実験では、20例中17例で既存のベースラインと最先端(SOTA)メソッドよりも優れていた。
論文参考訳(メタデータ) (Tue, 13 May 2025 23:12:07 GMT)
Divisible and indivisible Stochastic-Quantum dynamics [0.0] この研究は、開あるいは閉の2つの構成を持つ系に対する確率のレベルにおいて、可分かつ可分な時間進化の完全な幾何学的特徴付けを示す。
識別不可能な力学は、情報消去時間座標に対する時間フローによって特徴づけられるか、行列空間の円錐に対してタキオニックである。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:58:56 GMT)
Diffusion-assisted Model Predictive Control Optimization for Power System Real-Time Operation [0.0] 本稿では,リアルタイム電力系統運用のためのモデル予測制御(MPC)フレームワークを提案する。
このフレームワークは、負荷予測モジュールの精度を高めるために、時系列生成に適した拡散モデルを含む。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:04:46 GMT)
Detuning-symmetric laser cooling of many mechanical modes with a photothermally modified cavity [0.0] 単一青色レーザで駆動される光熱修飾光学キャビティを用いた膜のメカニカルモードを同時に冷却する。
機械系に直接適用される放射圧やボロメトリー力とは対照的に、この冷却効果は変形の兆候に依存しない。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:45:12 GMT)
Designing open spin-boson models for enabling quantum enhanced sensing through classical measurements [0.0] 多くのボディモデルは、幅広い実験プラットフォームの物理学を捉えている。
スピンボソンモデルのある種のクラスに対して、多くのボディ量子増強は古典的な測定によって実際に達成できることが示される。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:20:13 GMT)
Demonstration of logical quantum phase estimation for X-ray absorption spectra [0.0] 遷移金属$L_2,3$-edgesのX線吸収分光(XAS)スペクトルを計算した。
測定結果によるQPEの分解能誤差と統計的誤差について検討した。
我々は、アクティブ空間内の3つの軌道を包含し、捕捉されたイオン量子コンピュータにQPEを実装した。
論文参考訳(メタデータ) (Tue, 13 May 2025 14:30:38 GMT)
DHECA-SuperGaze: Dual Head-Eye Cross-Attention and Super-Resolution for Unconstrained Gaze Estimation [0.0] 本稿では,DHECA-SuperGazeについて紹介する。DHECA-SuperGazeは,視線予測を超解像(SR)とデュアルヘッドアイ・クロスアテンション(DHECA)モジュールを用いて進める深層学習に基づく手法である。
Gaze360およびGFIEデータセットの性能評価は,提案手法のデータセット内性能に優れていた。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:45:08 GMT)
DArFace: Deformation Aware Robustness for Low Quality Face Recognition [0.0] DArFaceは堅牢な顔認識フレームワークで、高い品質と低品質のトレーニングサンプルを必要とすることなく、このような劣化に対する堅牢性を高める。
本手法は, 訓練中の大域変換(回転, 変換など)と局所弾性変形の両方を逆向きに統合し, 現実的な低品質条件をシミュレートする。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:35:57 GMT)
Cryptologic Techniques and Associated Risks in Public and Private Security. An Italian and European Union Perspective with an Overview of the Current Legal Framework [0.0] 本稿は、暗号技法の進化とその公衆および民間の安全への意味について論じる。
2024年法律第90号を含むイタリアの立法改革は、サイバー犯罪に対する罰則を強化している。
サイバー犯罪に関する国連の草案のような国際的なイニシアチブは、戦後のセキュリティ、プライバシー、基本的人権のバランスを強調している。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:12:30 GMT)
Cryptography without Long-Term Quantum Memory and Global Entanglement: Classical Setups for One-Time Programs, Copy Protection, and Stateful Obfuscation [0.0] 量子暗号プリミティブを構築するために,古典的なクエリアクセスのみが可能なオーラクルをどのように利用できるかを示す。
重要なことは、RAM難読化方式は長期の量子メモリや大域的な絡み合いを必要としない。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:32:24 GMT)
Crowd Scene Analysis using Deep Learning Techniques [0.0] 本研究は,群集シーン分析の2つの主な応用に焦点を当てたものである。
ディープラーニングモデルはデータハングリーであり、アルゴリズムのトレーニングには、常に大量の注釈付きデータが必要です。
群集異常検出のためのVGG19に基づく時間モデルを提案する。
モデルは二分分類で動作し、正常または異常な振る舞いを検出することができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:29:30 GMT)
Convolutional Spiking Neural Network for Image Classification [0.0] 画像の分類に使用されるスパイキングニューラルネットワーク(SNN)における畳み込みアーキテクチャの実装を検討する。
従来のニューラルネットワークと同じように、畳み込みレイヤは、CoLaNETアーキテクチャを備えたSNNベースの分類器の予測子として使用される情報“機能”を形成する。
論文参考訳(メタデータ) (Tue, 13 May 2025 12:47:13 GMT)
Continuous Temporal Learning of Probability Distributions via Neural ODEs with Applications in Continuous Glucose Monitoring Data [0.0] 目的は、グルコースなどのバイオマーカーの分布が経時的にどのように変化するか、糖尿病などの慢性疾患の進行をどう反映するかを分析することである。
本稿では,ガウス分布の混合に基づく新しい確率モデルを提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:57:06 GMT)
Constructor theory of time [0.0] コンストラクタ理論は、物理学の法則は、物理的システムの変換が非有界な精度で起こりうる、あるいは起こせない仕様として表現可能であると主張している。
コンストラクタ理論形式で表される法則が持続時間や力学にどのように意味を与えるかを示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:50:46 GMT)
Considerations in the use of ML interaction potentials for free energy calculations [0.0] 機械学習ポテンシャル(MLP)は、分子のエネルギーと自由エネルギーのランドスケープを正確にモデル化する能力を提供する。
トレーニングデータ中の集合変数(CV)の分布が,システムの自由エネルギー面(FES)を決定する際の精度に与える影響について検討した。
ブタンの発見から,キーFES領域のトレーニングデータカバレッジにより,CV分布にかかわらずモデルの精度が保証されることがわかった。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:22:54 GMT)
Congenital Heart Disease recognition using Deep Learning/Transformer models [0.0] 先天性心疾患(CHD)は乳幼児の死亡率と死亡率の主要な原因である。
深層学習モデルは、自動的に特徴を抽出する能力を持ち、医師がより効果的にCHDを検出するのを助けることができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:34:06 GMT)
Claycode: Stylable and Deformable 2D Scannable Codes [0.0] Claycodeは、広範囲なスタイリングと変形のために設計された、新しい2Dスキャン可能なコードである。
Claycodesは機能を損なうことなく、広範囲なスタイリゼーションを可能にすることを示す。
次に、Claycodeの重い変形に対する高い耐性を実証的に証明し、通常失敗するシナリオで従来の2Dスキャン可能なコードよりも優れています。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:28:06 GMT)
CNN and ViT Efficiency Study on Tiny ImageNet and DermaMNIST Datasets [0.0] 我々は,DermatologyMNISTとTinyImageNetの4種類の視覚変換器(Tiny, Small, Base, Large)に適用した微調整戦略を提案する。
適切に調整された視覚変換器は、ベースラインのパフォーマンスにマッチまたは超過し、より高速な推論を実現し、少ないパラメータで操作できることを実証する。
論文参考訳(メタデータ) (Tue, 13 May 2025 06:17:18 GMT)
CMOS-Compatible, Wafer-Scale Processed Superconducting Qubits Exceeding Energy Relaxation Times of 200us [0.0] 本稿では,200mmウエハ上での超伝導量子ビットの産業レベルの製造結果について述べる。
99.7%(ショートとオープン)のジョセフソン接合の収率を10000以上の接合で示し、キュービット周波数予測精度は1.6%である。
これは、業界グレードのウェハレベルの減量プロセスで作製された超伝導量子ビットにとって、これまで報告された中で最高の性能を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:36:20 GMT)
Breast Cancer Histopathology Classification using CBAM-EfficientNetV2 with Transfer Learning [0.0] 本研究では,EfficientNetV2モデルを用いて特徴抽出を改善し,関連組織領域に焦点を当てた新しいアプローチを提案する。
CBAMを搭載した効率の良いNetV2-XLは、最高精度99.01%、F1スコア98.31%を400倍の精度で達成した。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:49:51 GMT)
Blockchain Technology: Core Mechanisms, Evolution, and Future Implementation Challenges [0.0] 分散コンセンサスアルゴリズムや暗号原理,スマートコントラクト機能など,コア技術コンポーネントについて検討する。
技術的制限、規制のハードル、既存のシステムとの統合の複雑さなど、広範なブロックチェーン採用に直面する重要な課題を特定します。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:50:31 GMT)
Bang-bang preparation of a quantum many-body ground state in a finite lattice: optimization of the algorithm with a tensor network [0.0] bang-bang (BB) アルゴリズムは格子量子多体ハミルトンの基底状態を作成する。
1次元と2次元のテンソルネットワークでアルゴリズムを最適化する。
本稿では, 行列積状態 (MPS) と対交射影状態 (PEPS) を用いて, 量子臨界点付近の1Dおよび2D量子イジングモデルでそれぞれ手順を検証した。
論文参考訳(メタデータ) (Tue, 13 May 2025 05:01:49 GMT)
Anisotropic particle creation from $T-$vacuum in the radiation dominated universe [0.0] 我々は、初期の宇宙を支配した放射線において、$T-$vacuumが異方性粒子生成現象を引き起こすことを示した。
結果は、初期の宇宙から観測された異方性と比較される可能性を持ち、宇宙論的な粒子生成に関する新たな洞察を与えるかもしれない。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:36:22 GMT)
An incremental algorithm for non-convex AI-enhanced medical image processing [0.0] 医用画像における逆問題を解決するために,モデルに基づく最適化とディープラーニングに基づく手法を統合したハイブリッドフレームワークを提案する。
IncDGは従来の反復解法と深層学習法の両方に優れ、精度と安定性が向上することを示す。
IncDGは性能を著しく低下させるものではないと結論付けた。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:03:14 GMT)
An algebraic solution of Dirac equation on a static curved space-time [0.0] 2つの異なる代数的アプローチを用いて、静的曲線時空におけるディラック方程式の正確な解を示す。
このアプローチの結果として生じる作用素は、$su (1,1)$代数を閉じ、表現論を通じて対応するエネルギースペクトルと固有関数を生成する。
論文参考訳(メタデータ) (Tue, 13 May 2025 16:37:51 GMT)
An Effective Flow-based Method for Positive-Unlabeled Learning: 2-HNC [0.0] バイナリ分類の多くのシナリオでは、トレーニングデータには正のインスタンスのみが提供され、残りのデータはラベル付けされていない。
この設定は、正の未ラベル学習(PU)と呼ばれ、サンプル間のペアの類似性を利用するネットワークフローベースの手法で処理される。
ここで提案する方法である2-HNCは、Hochbaumの正規化カット(HNC)と、パラメトリック最小カット問題を解くことで提供される解の集合を利用する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:58:16 GMT)
Alignment Drift in CEFR-prompted LLMs for Interactive Spanish Tutoring [0.0] 本稿では,第二言語学習における適応型チューターとしてのLarge Language Models(LLMs)の可能性について検討する。
スペイン語の教師と学生の対話を,7Bから12Bまでの大きさの命令調整型オープンソースのLLMを用いてシミュレートした。
次に、チューターモデルからの出力を用いて、3つの習熟度レベルにわたるテキストの難易度を制御するCEFRベースのプロンプトの有効性を評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:50:57 GMT)
Aggregating Concepts of Fairness and Accuracy in Predictive Systems [0.0] 精度と公平度を線形に組み合わせて、予測アルゴリズムの全てを考慮に入れた値を測定するには、十分な理由がある、と私は論じる。
AngwinらによってコンパイルされたCompASデータセットを用いて、精度・公正トレードオフの分析に私の結果を適用します。
論文参考訳(メタデータ) (Tue, 13 May 2025 01:00:25 GMT)
ARC-NCA: Towards Developmental Solutions to the Abstraction and Reasoning Corpus [0.0] ARC-NCAはARC-AGIベンチマークに取り組むための開発手法である。
開発ソリューションは、AIの問題解決能力を高めるための有望な道を提供するかもしれない。
論文参考訳(メタデータ) (Tue, 13 May 2025 17:55:43 GMT)
ABAC Lab: An Interactive Platform for Attribute-based Access Control Policy Analysis, Tools, and Datasets [0.0] Attribute-Based Access Control (ABAC)は、表現力と柔軟性を提供し、きめ細かいアクセス制御ポリシーを強制するための魅力的なモデルである。
ABACへの移行を促進するために、ポリシー管理者がモデルを適用するのを支援する方法論、フレームワーク、ツールを開発するために広範な研究がなされている。
本稿では,既存のABACポリシーデータセットと分析ツールを統合した対話型プラットフォームであるABAC Labを紹介する。
論文参考訳(メタデータ) (Tue, 13 May 2025 03:53:19 GMT)
A quantum approach for optimal control [0.0] 非線形最適制御問題のクラスを解くための新しい変分量子アプローチを提案する。
我々のアプローチは、ディラックの力学系の正準量子化と非エルミートハミルトニアン基底状態の解を統合する。
論文参考訳(メタデータ) (Tue, 13 May 2025 10:20:57 GMT)
A new classification system of beer categories and styles based on large-scale data mining and self-organizing maps of beer recipes [0.0] 6万2100個のビールレシピを分析した。
4つの主要なスーパークラスターは、独特のモルトとホップの使用パターン、スタイルの特徴、歴史的醸造の伝統を示した。
論文参考訳(メタデータ) (Tue, 13 May 2025 00:05:23 GMT)
A Thermodynamic Framework for Coherently Driven Systems [0.0] 我々はコヒーレント駆動システムのための熱力学の枠組みを導出する。
本稿では,3レベルメーザをコヒーレントドライブのノイズを低減するエンジンとして理解する方法を示す。
論文参考訳(メタデータ) (Tue, 13 May 2025 13:34:31 GMT)
A Study of Data-driven Methods for Inventory Optimization [0.0] 本稿では、時系列、ランダムフォレスト(RF)、ディープ強化学習(Deep Reinforcement Learning)の3つのアルゴリズムを3つのインベントリモデルに包括的に分析する。
主な目的は、データ駆動型の効率的なメソッドを分析することである。
各モデルの結果を比較することにより、各アルゴリズムの有効性を評価する。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:35:23 GMT)
A Relativistic Pseudo-Unitary Version of Schwinger's Quantum Mechanical Symbolism of Atomic Measurements [0.0] 非相対論的量子力学の領域内で伝統的に記述される測定過程は、カルタン空間の共変フレームワークに転写される。
この研究は相対論的量子計算ゲートの構築に基本的な理論的背景を与える可能性がある。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:14:02 GMT)
A Quantum Constraint Generation Framework for Binary Linear Programs [0.0] 量子コンピュータを用いたバイナリ線形プログラミング(BLP)のための新しい手法を提案する。
量子最適化アルゴリズム(ハイブリッドまたは量子専用)は現在、ICPのためのスタンドアロンの解法である。
本研究では,任意の量子最適化アルゴリズムを量子情報古典制約生成フレームワークにラップする。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:43:23 GMT)
A New Tractable Description Logic under Categorical Semantics [0.0] 抽出可能な記述論理(DL) ELに否定を加えることで、協調的、実在的制限、概念包含を可能にすることが知られている。
トラクタビリティを保ちながら負の知識を表現できるように,否定を弱めたELの新たな拡張を提案する。
論文参考訳(メタデータ) (Tue, 13 May 2025 19:25:21 GMT)
A Comprenhensive Dataset of Quantum Properties for Proteins [0.0] Quantum Mechanics for Proteins (QMProt)は、タンパク質研究における量子コンピューティングアプリケーションをサポートするために開発されたデータセットである。
QMProtは正確な量子力学的および物理化学的データを含み、生体分子の正確なキャラクタリゼーションを可能にする。
論文参考訳(メタデータ) (Tue, 13 May 2025 20:41:49 GMT)
A Comparison Between Human and Generative AI Decision-Making Attributes in Complex Health Services [0.0] 目的は、人間が複雑な医療サービスにおける最適な意思決定に寄与する、ユニークで/または有用な属性を持っているかどうかを検討することである。
意味のある意思決定の役割を維持するために、人間は、人間と生成AIのコントリビューションを統合した意思決定システムによって、独自の属性を開発することができる。
論文参考訳(メタデータ) (Tue, 13 May 2025 09:08:18 GMT)
'Memory States' from Almost Nothing: Representing and Computing in a Non-associative Algebra [0.0] 本稿では,高次元空間における情報項目の表現と計算のための非連想的フレームワークを提案する。
これは空間コンピューティングの原理と、記憶に関する認知科学の実証的な発見と一致している。
論文参考訳(メタデータ) (Tue, 13 May 2025 08:43:02 GMT)
$\mathcal{P}$, $\mathcal{T}$-violating axion mediated interactions in RaOH molecule [0.0] 分子内のアキシオンを媒介する電子-核子相互作用に対する振動の影響は、以前に研究された短距離電子-核子-擬核子相互作用に対する影響に類似している。
以上の結果から,分子内のアキシオンを介する電子-核子相互作用に対する振動の影響は,従来研究されていた短距離電子-核子スカラー-ポドスカラー相互作用に対する影響に類似していることが示唆された。
論文参考訳(メタデータ) (Tue, 13 May 2025 15:29:39 GMT)