Position: Bayesian Deep Learning is Needed in the Age of Large-Scale AI [189.1] 本稿では,ベイズ深層学習(BDL)の強みを再考し,既存の課題を認識した。
これらの障害に対処するための、エキサイティングな研究の道のりが浮かび上がっている。
今後の議論は、大規模ファンデーションモデルをBDLと組み合わせて、その潜在能力を最大限に活用する方法に焦点を当てている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:32:38 GMT)
Tool Learning with Foundation Models [158.9] 基礎モデルの出現により、AIシステムは、人間としてのツールの使用に等しく適応できる可能性がある。
その大きな可能性にもかかわらず、この分野における重要な課題、機会、そして将来の取り組みに関する包括的な理解はいまだに欠けている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:14:36 GMT)
Guiding Language Model Reasoning with Planning Tokens [122.4] 大規模言語モデル(LLM)は、最近、複雑な推論タスクを実行する能力に対して、かなりの関心を集めている。
より構造的なチェーン・オブ・シークレット・ステップの創出を促す階層的な生成手法を提案する。
提案手法では、トレーニング可能なパラメータ(0.001%)の無視可能な増加が必要であり、完全な微調整か、よりパラメータ効率の良いスキームで適用することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:53:17 GMT)
Getting it Right: Improving Spatial Consistency in Text-to-Image Models [103.5] 現在のテキスト・トゥ・イメージ(T2I)モデルにおける重要な欠点の1つは、テキスト・プロンプトで指定された空間的関係を忠実に追従するイメージを一貫して生成できないことである。
4つの広く使用されている視覚データセットから600万の画像を再キャプチャすることで、空間的に焦点を絞った最初の大規模データセットであるSPRIGHTを作成します。
対象物を多数含む画像のトレーニングは,500枚の画像の微調整により,T2I-CompBenchの空間スコア0.2133の最先端結果を含む空間的整合性を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:58:00 GMT)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.8] 制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:58:07 GMT)
MoMa: Efficient Early-Fusion Pre-training with Mixture of Modality-Aware Experts [90.3] MoMaは、モダリティを意識したミックス・オブ・エキスパートアーキテクチャで、混合モーダル、アーリーフュージョン言語モデルを事前訓練する。
MoMa 1.4Bモデルには4人のテキスト専門家と4人の画像専門家が参加し、FLOPの大幅な節約を実現している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:57:41 GMT)
Benchmarks and Challenges in Pose Estimation for Egocentric Hand Interactions with Objects [90.0] ロボティクス、AR/VR、アクション認識、モーション生成といったタスクにおいて、自己中心的な視点からこのようなインタラクションを理解することが重要である。
我々は、AmblyHandsとARCTICデータセットに基づいたHANDS23チャレンジを、慎重に設計されたトレーニングとテストの分割に基づいて設計する。
提案手法の結果と近年のリーダーボードのベースラインに基づいて,3Dハンド(オブジェクト)再構成タスクの徹底的な解析を行う。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:44:00 GMT)
Nemotron-4 340B Technical Report [89.1] 我々はNemotron-4-340B-Base、Nemotron-4-340B-Instruct、Nemotron-4-340B-Rewardを含むNemotron-4 340Bモデルファミリーをリリースする。
私たちのモデルはNVIDIA Open Model License Agreementの下でオープンアクセスです。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:37:06 GMT)
ReSyncer: Rewiring Style-based Generator for Unified Audio-Visually Synced Facial Performer [87.3] ReSyncerは運動と外観を統合トレーニングで融合する。
パーソナライズされたパーソナライズされた微調整、ビデオ駆動のリップシンク、話すスタイルの転送、顔交換までサポートしています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:31:45 GMT)
Achieving More with Less: A Tensor-Optimization-Powered Ensemble Method [86.4] アンサンブル学習(英: Ensemble learning)は、弱い学習者を利用して強力な学習者を生み出す方法である。
異なる学習者に対して,異なるクラスを予測する際に,様々な精度の学習者が現れることが観察された。
異なるクラス間でのベース分類器の性能評価が提案されたのはこれが初めてである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:42:38 GMT)
Doubly Stochastic Adaptive Neighbors Clustering via the Marcus Mapping [86.3] クラスタリングは機械学習とデータサイエンスにおける基本的なタスクであり、類似性グラフベースのクラスタリングはこの領域において重要なアプローチである。
マーカスマッピングと最適輸送の関係について検討する。
マーカス写像が特定の種類の最適輸送問題を解くことを証明し、マーカス写像によるこの問題の解法が最適輸送法を直接適用するよりも効率的であることを証明した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:34:43 GMT)
LMM-PCQA: Assisting Point Cloud Quality Assessment with LMM [84.0] 本研究の目的は,大規模マルチモダリティモデル(LMM)に対するポイントクラウド品質評価(PCQA)の知識付与の可能性を検討することである。
品質ラベルを微調整段階のテキスト記述に変換することにより、LMMは点雲の2次元投影から品質評価ロジットを導出することができる。
提案手法の有効性を実証し,PCQAへのLMMの新たな統合を実証した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:37:31 GMT)
LLaVA-OneVision: Easy Visual Task Transfer [80.0] LLaVA-OneVisionは、オープンな大規模マルチモーダルモデル(LMM)のファミリーであり、データ、モデル、視覚表現に関する洞察を統合することで開発されている。
実験の結果,LLaVA-OneVisionはオープンLMMの性能境界を同時に押し上げることのできる最初の単一モデルであることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:59:44 GMT)
LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion [79.2] 本稿では, 乱れ場面におけるロボットグルーピングのためのアモーダルセグメンテーションを探求する枠組みを提案する。
線形融合注意誘導畳み込みネットワーク(LAC-Net)を提案する。
その結果,本手法が最先端の性能を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:50:48 GMT)
DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model [77.8] 本稿では,LCM(Latent Consistency Model)を組み込んだDreamLCMを提案する。
提案手法は, 対象3次元モデルの最適化のために, 高精度かつ詳細な勾配を与えることができる。
実験により、DreamLCMは、生成品質とトレーニング効率の両方で最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:59:15 GMT)
GraphLearner: Graph Node Clustering with Fully Learnable Augmentation [76.6] Contrastive Deep Graph Clustering (CDGC)は、異なるクラスタにノードをグループ化するために、コントラスト学習のパワーを活用する。
我々は、GraphLearnerと呼ばれる、完全学習可能な拡張を備えたグラフノードクラスタリングを提案する。
学習可能な拡張器を導入し、CDGCのための高品質でタスク固有の拡張サンプルを生成する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:56:31 GMT)
Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.2] 都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:55:04 GMT)
Extend Model Merging from Fine-Tuned to Pre-Trained Large Language Models via Weight Disentanglement [73.0] 我々は、FTからPT LLMへのマージ技術の適用性を拡大するための先駆的な取り組みを行っている。
WeIght DisENtanglement (WIDEN) に基づくアプローチを導入し、マージ範囲を効果的に拡張する。
Qwen1.5-Chat (FT LLM with instruction-following skills) と Sailor (PT LLM with multilingual abilities) を7Bおよび14Bモデルスケールにマージする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:46:46 GMT)
ULLME: A Unified Framework for Large Language Model Embeddings with Generation-Augmented Learning [72.9] 我々は,LLM間の双方向の注目を可能にする,柔軟でプラグアンドプレイな実装であるLULME(Unified framework for Large Language Model Embedding)を紹介した。
また,テキスト埋め込みタスクのLLMを向上する新しい微調整手法であるGRL(Generation-augmented Representation Learning)を提案する。
フレームワークの柔軟性と有効性を示すために、異なるバックボーンアーキテクチャを持つULLMEから事前訓練された3つのモデルをリリースする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:53:54 GMT)
MMTrail: A Multimodal Trailer Video Dataset with Language and Music Descriptions [69.9] MMTrailは,2000万回以上のトレーラークリップと視覚的キャプションを組み込んだ大規模マルチモーダルビデオ言語データセットである。
本稿では,27.1k時間以上のトレーラービデオで様々なモダリティアノテーションを実現するシステムキャプションフレームワークを提案する。
我々のデータセットは、大きめのマルチモーダル言語モデルトレーニングのためのパスを舗装する可能性がある。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:25:48 GMT)
Compromising Embodied Agents with Contextual Backdoor Attacks [69.7] 大型言語モデル(LLM)は、エンボディドインテリジェンスの発展に変化をもたらした。
本稿では,このプロセスにおけるバックドアセキュリティの重大な脅威を明らかにする。
ほんの少しの文脈的デモンストレーションを毒殺しただけで、攻撃者はブラックボックスLDMの文脈的環境を隠蔽することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:20:12 GMT)
Synthesizing Text-to-SQL Data from Weak and Strong LLMs [68.7] オープンソースとクローズドソースの大規模言語モデル(LLM)の能力ギャップは、テキスト・トゥ・タスクにおいて依然として課題である。
より大規模で強力なモデルによって生成されたデータと、より小さく、不整合なモデルによって生成されたエラー情報データを組み合わせた合成データアプローチを導入する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:40:32 GMT)
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.1] LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、分類されたデータ構造と、これまででもっとも包括的な汎用医療用AIベンチマークである。
その結果, GPT-4o は 52% の精度しか得られず, 改善の余地があることが示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:59:21 GMT)
Practical and Robust Safety Guarantees for Advanced Counterfactual Learning to Rank [64.4] 我々は、既存の安全CLTRアプローチを一般化し、最先端の2重ロバストCLTRに適用する。
また,ユーザ行動に関する仮定を伴わずにデプロイの安全性を提供するPRPO(proximal ranking Policy Optimization)を提案する。
PRPOは、デプロイ時に無条件の安全性を持つ最初の方法であり、現実世界のアプリケーションの堅牢な安全性に変換される。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:16:16 GMT)
OpenFactCheck: A Unified Framework for Factuality Evaluation of LLMs [64.3] OpenFactCheckは、大規模な言語モデルのためのオープンソースのファクトチェックフレームワークである。
ユーザーは自動的にファクトチェックシステムを簡単にカスタマイズできる。
また、そのシステムを用いて、入力文書におけるすべてのクレームの事実性を評価する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:49:58 GMT)
InceptionHuman: Controllable Prompt-to-NeRF for Photorealistic 3D Human Generation [61.6] InceptionHumanは、異なるモードのプロンプトの組み合わせで簡単にコントロールでき、フォトリアリスティックな3D人間を生成することができるプロンプト・トゥ・NeRFフレームワークである。
InceptionHumanは、徐々に洗練されたNeRF空間内で、一貫した3Dヒューマン生成を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:31:34 GMT)
Online Temporal Action Localization with Memory-Augmented Transformer [61.4] オンライン時間的行動ローカライゼーションのためのメモリ拡張変換器(MATR)を提案する。
MATRは過去のセグメントの特徴を選択的に保存し、推論に長期的コンテキストを活用する。
また,現在進行中の動作の終了時刻を予測するために入力セグメントを観測し,メモリキューにアクセスして動作開始時刻を推定する新たな動作ローカライズ手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:55:33 GMT)
From Static Benchmarks to Adaptive Testing: Psychometrics in AI Evaluation [60.1] 本稿では,静的評価手法から適応テストへのパラダイムシフトについて論じる。
これには、ベンチマークで各テスト項目の特性と価値を推定し、リアルタイムでアイテムを動的に調整することが含まれる。
我々は、AI評価にサイコメトリックを採用する現在のアプローチ、アドバンテージ、そして根底にある理由を分析します。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:24:01 GMT)
On the Over-Memorization During Natural, Robust and Catastrophic Overfitting [58.6] オーバーフィッティングは、自然と敵対両方のトレーニングにおいて、ディープニューラルネットワーク(DNN)の一般化能力に悪影響を及ぼす。
本稿では,過メモリ化を明示的に防止する一般的なフレームワークである Distraction Over-Memorization (DOM) を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:01:01 GMT)
Learning Provably Robust Policies in Uncertain Parametric Environments [57.2] 環境全体にわたって堅牢なMDPポリシーを学習するためのデータ駆動型アプローチを提案する。
我々は、学習したポリシーを新しい、目に見えない環境で実行するための、おそらくほぼ正しい(PAC)保証を作成します。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:48:15 GMT)
CityX: Controllable Procedural Content Generation for Unbounded 3D Cities [55.7] そこで我々は,CityXという新しいマルチモーダル制御可能な手続き型コンテンツ生成手法を提案する。
OSM、セマンティックマップ、衛星画像など、複数のレイアウト条件でガイドされるリアルで無拘束の3D都市生成を強化する。
この効果的なフレームワークを通じて、CityXは3Dシーン生成のための革新的なエコシステムを構築する可能性を示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:36:21 GMT)
Hybrid diffusion models: combining supervised and generative pretraining for label-efficient fine-tuning of segmentation models [55.2] そこで本研究では,第1領域における画像のデノベーションとマスク予測を同時に行うことを目的とした,新しいプレテキストタスクを提案する。
提案手法を用いて事前学習したモデルを微調整すると、教師なしまたは教師なしの事前学習を用いて訓練した類似モデルの微調整よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:19:06 GMT)
GAOKAO-MM: A Chinese Human-Level Benchmark for Multimodal Models Evaluation [55.2] LVLM(Large Vision-Language Models)は画像認識と言語理解に優れた能力を示す。
中国大学入学試験(GAokao-MM)に基づくマルチモーダルベンチマークであるGAokao-MMを提案する。
GPT-4-Vison(48.1%)、Qwen-VL-Plus(41.2%)、Gemini-Pro-Vision(35.1%)が上位3位である。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:28:30 GMT)
Analysis of Unstructured High-Density Crowded Scenes for Crowd Monitoring [55.2] コンピュータビジョンアルゴリズムは、混雑したシーンのビデオから情報を抽出し、組織された動作中のグループを自動的に検出する。
組織化されたコホート内の参加者数,動きの速度と方向を3~4フレーム以内で推定できる。
脅威を呈するアクティビティと、脅威を呈しないアクティビティを区別できる分類方法を実装することにより、ソフトウェアの性能を最適化する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:09:50 GMT)
A Modular Approach for Multimodal Summarization of TV Shows [55.2] 分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。
我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。
我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:47:11 GMT)
A Picture Is Worth a Graph: A Blueprint Debate Paradigm for Multimodal Reasoning [53.4] この研究は、過剰な要約による意見の自明化と、画像から導入された散逸した概念による焦点の転換という2つの主要な課題に対処する。
この問題に対処するため,BDoG (Blueprint Debate on Graphs) と呼ばれる演目的(トップダウン)な議論手法を提案する。
BDoGでは、世界レベルの要約による意見の自明化を防止するために、ブループリントグラフに限定して議論を行う。さらに、BDoGはグラフ内の枝に証拠を格納することで、頻繁だが無関係な概念によって引き起こされる混乱を緩和する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:45:27 GMT)
MedTrinity-25M: A Large-scale Multimodal Dataset with Multigranular Annotations for Medicine [53.0] 本稿では,医療用大規模マルチモーダルデータセットであるMedTrinity-25Mを紹介する。
10のモダリティで2500万枚以上の画像をカバーしており、65以上の疾患に対する多彩なアノテーションがある。
画像テキストペアの可用性によって制限された既存のアプローチとは異なり、私たちは最初の自動パイプラインを開発しました。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:09:35 GMT)
Evaluating radiation impact on transmon qubits in above and underground facilities [52.9] 我々は,Fermilab SQMS地上施設および深部地下グラン・サッソ研究所(INFN-LNGS)で最初に測定されたトランスモン量子ビットの応答の比較を行った。
その結果、クォービットは強いガンマ源に反応し、粒子の衝突を検出することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:13:50 GMT)
Training on the Fly: On-device Self-supervised Learning aboard Nano-drones within 20 mW [52.3] ナノドローンのような小さな機械学習(TinyML)を利用した小型サイバー物理システム(CPS)は、ますます魅力的な技術になりつつある。
単純な電子回路はこれらのCPSを安価にすることができるが、計算、メモリ、センサーの資源を著しく制限する。
本稿では,ナノドロンの限られた超低消費電力資源にのみ依存する,オンデバイスファインチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:11:36 GMT)
Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.0] 共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:56:36 GMT)
KOI: Accelerating Online Imitation Learning via Hybrid Key-state Guidance [51.1] 鍵状態ガイド型オンライン模倣(KOI)学習手法について紹介する。
我々は、タスク認識報酬推定のためのガイダンスとして、セマンティック・キー状態とモーション・キー状態の統合を利用する。
実験の結果,メタワールド環境とLIBERO環境において,本手法がより効率的であることが確認された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:53:55 GMT)
Position: Topological Deep Learning is the New Frontier for Relational Learning [51.1] トポロジカルディープラーニング(TDL)は、トポロジカルな特徴を用いてディープラーニングモデルを理解し設計する、急速に進化する分野である。
本稿では,TDLがリレーショナル学習の新たなフロンティアであることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:38:41 GMT)
A Non-negative VAE:the Generalized Gamma Belief Network [50.0] ガンマ信念ネットワーク(GBN)は、テキストデータ中の多層解釈可能な潜在表現を明らかにする可能性を実証している。
本稿では、一般化ガンマ信念ネットワーク(Generalized GBN)を導入し、元の線形生成モデルをより表現力のある非線形生成モデルに拡張する。
また、潜伏変数の後方分布を近似する上向きのワイブル推論ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:18:37 GMT)
Leveraging Entity Information for Cross-Modality Correlation Learning: The Entity-Guided Multimodal Summarization [49.1] Multimodal Summarization with Multimodal Output (MSMO) は、テキストと関連する画像の両方を統合するマルチモーダル要約を作成することを目的としている。
本稿では,Entity-Guided Multimodal Summarization Model (EGMS)を提案する。
我々のモデルは,BART上に構築され,共有重み付きデュアルマルチモーダルエンコーダを用いて,テキスト画像とエンティティ画像情報を並列に処理する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:45:56 GMT)
Diffusion Model Meets Non-Exemplar Class-Incremental Learning and Beyond [48.5] 非典型的なクラス増分学習(Non-exemplar class-incremental learning、NECIL)は、古いクラスサンプルを保存せずに破滅的な忘れ込みに抵抗することである。
NECILのためのシンプルで効果的な textbfDiffusion ベースの textbfFeature textbfReplay (textbfDiffFR) 法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:33:24 GMT)
FKA-Owl: Advancing Multimodal Fake News Detection through Knowledge-Augmented LVLMs [48.3] 本稿では,FKA-Owlを提案する。FKA-Owlは,偽情報を利用した大規模視覚言語モデル(LVLM)の拡張のためのフレームワークである。
パブリックベンチマークの実験では、FKA-Owlは従来の手法よりも優れたクロスドメイン性能を達成している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:40:11 GMT)
Prototype Learning for Micro-gesture Classification [47.9] 我々は,IJCAI 2024におけるMiGAチャレンジにおいて,マイクロ位置分類のためのHFUT-VUTの開発したソリューションを紹介した。
マイクロジェスチャー分類タスクのタスクは、より微細で微妙な身体の動きに焦点を当てたビデオクリップのカテゴリを認識することである。
我々は、MG特徴の識別能力を向上させるために、2つの革新的なモジュール、すなわち、クロスモーダル融合モジュールと原型精製モジュールを利用する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:56:53 GMT)
Imitation Learning from Purified Demonstrations [47.5] 本稿では,まず不完全な実演における潜在的な雑音を除去し,その後,これらの実演から模擬学習を行うことを提案する。
提案手法を裏付ける理論的証拠を提示し, 精製された実演と最適実演との距離を有界化できることを実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:51:37 GMT)
Active Visual Localization for Multi-Agent Collaboration: A Data-Driven Approach [47.4] 本研究は、視点変化の課題を克服するために、アクティブな視覚的ローカライゼーションをどのように利用できるかを検討する。
具体的には、与えられた場所における最適な視点を選択する問題に焦点をあてる。
その結果,既存の手法と比較して,データ駆動方式の方が優れた性能を示した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:08:40 GMT)
StructEval: Deepen and Broaden Large Language Model Assessment via Structured Evaluation [46.6] 本稿では,StructEvalと呼ばれる新しい評価フレームワークを提案する。
原子テストの目的から始めて、StructEvalは、複数の認知レベルと批判的概念にまたがって構造化された評価を行うことによって、評価をさらに深め、拡張する。
広く使用されている3つのベンチマークの実験は、StructEvalがデータ汚染のリスクに抵抗する信頼性の高いツールであることを示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:28:30 GMT)
SentenceVAE: Enable Next-sentence Prediction for Large Language Models with Faster Speed, Higher Accuracy and Longer Context [46.6] 文変分自動エンコーダ(文変分自動エンコーダ)は,文変分自動エンコーダ(文変分自動エンコーダ)と文変分自動エンコーダ(文変分自動エンコーダ)からなる小型モデルである。
センテンス・デコーダは、圧縮されたトークンを文に再構築する一方、センテンス・デコーダは、文内の情報を単一のトークンに効果的にコンデンスすることができる。
提案手法は, 推定速度を204365%高速化し, パープレキシティ(PPL)を4675%まで低減し, メモリオーバーヘッドを8691%削減できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:38:50 GMT)
Rethinking Jailbreaking through the Lens of Representation Engineering [45.7] 最近のジェイルブレイク手法の急増により、悪意のある入力に対するLarge Language Models(LLM)の脆弱性が明らかになった。
本研究では, 特定の行動パターンを明らかにすることで, 安全性に配慮したLCMの脆弱性を明らかにする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:46:37 GMT)
Low energy excitations in bosonic quantum quasicrystals [45.0] ボソニック自己組織結晶に対する低エネルギー有効作用の第一原理を提示する。
我々の一般化された弾力性アプローチは、相と共役の量子密度の次数-自由度を適切に保持する。
量子準結晶相を制限する低密度および高密度相転移における各励起モードの運命について論じる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:14:17 GMT)
Towards Activated Muscle Group Estimation in the Wild [44.7] 野生の身体活動における活動筋領域の同定を目的としたビデオベースの活動筋群推定(AMGE)の課題に取り組む。
我々は135の異なる活動と20のラベル付き筋群を持つ15Kビデオクリップを特徴とする筋マップデータセットを提供する。
このデータセットはYouTubeのビデオで構築されており、特にハイインテンシティ・インターバルトレーニング(HIIT)をターゲットとしている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:39:05 GMT)
Enabling Regional Explainability by Automatic and Model-agnostic Rule Extraction [44.2] ルール抽出は、疾患の診断、疾患の進行予測、薬物発見などの分野に大きく貢献する可能性がある。
既存のメソッドは、全体のパフォーマンスを最大化するために、マイナークラスのルールのパフォーマンスを損なう。
本稿では,特定のサブグループからルールを抽出するモデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:06:11 GMT)
HARMONIC: Harnessing LLMs for Tabular Data Synthesis and Privacy Protection [44.2] 本稿では,表データ生成と評価のための新しいフレームワークHARMONICを提案する。
本フレームワークは, 既存の手法と同等の性能を向上し, また, 合成データの有効性とプライバシーリスクを評価するための評価枠組みを実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:21:13 GMT)
Skeleton-Based Human Action Recognition with Noisy Labels [43.6] ラベルノイズはモデルのトレーニングに悪影響を及ぼし、認識品質が低下する。
NoiseEraSARは、グローバルなサンプル選択、コティーチング、クロスモーダル・ミックス・オブ・エキスパート戦略を統合している。
提案手法は,確立されたベンチマークの性能向上を実証し,新しい最先端標準を設定した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:28:44 GMT)
I am a Strange Dataset: Metalinguistic Tests for Language Models [42.6] I am a Strange dataset"は、大規模言語モデルがメタ言語を扱えるかどうかという問題に対処する新しいデータセットである。
データセットは専門家によって手作りされ、専門家でないアノテーションによって検証される。
すべてのモデルは、サブタスクと、自己参照的でないメタinguistic Controlデータの両方で、ほぼ偶然に実行されます。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:24:42 GMT)
Benchmarking In-the-wild Multimodal Disease Recognition and A Versatile Baseline [42.5] そこで本研究では,植物病原体認識データセットを提案する。
病気のクラスが最も多いだけでなく、各疾患に関するテキストベースの記述も含んでいる。
提案したデータセットは,実世界の疾患認識手法を評価するための理想的なテストベッドとみなすことができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:49:13 GMT)
Making Long-Context Language Models Better Multi-Hop Reasoners [42.1] 本稿では,各アサーションに対するアトリビューションの供給を促す新しいアプローチであるReasoning with Attributionsを紹介する。
我々は,プロプライエタリモデルとオープンソースモデルの両方を用いて,3つのマルチホップデータセットの実験を通じてアプローチを検証する。
本モデルでは,ChatGPT や Claude-Instant などの独自の LM を並列化して,マルチホップ推論ベンチマーク上での競合性能を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:06:40 GMT)
CR3DT: Camera-RADAR Fusion for 3D Detection and Tracking [40.6] Camera-RADAR 3D Detection and Tracking (CR3DT)は3Dオブジェクト検出のためのカメラ・レーダ融合モデルであり、Multi-Object Tracking (MOT) である。
State-of-the-Art (SotA)カメラ専用のBEVDetアーキテクチャの基礎の上に構築されたCR3DTは、検出機能とトラッキング機能の両方で大幅に改善されている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:58:35 GMT)
Diffusion Feedback Helps CLIP See Better [40.1] 対照的に、CLIP(Contrastive Language- Image Pre-Training)は、ドメインとモダリティをまたいだオープンワールド表現の抽象化に優れている。
CLIPには、方向、量、色、構造をほとんど区別できないような、深刻な視覚的欠点がある。
自己教師付き拡散プロセスによって視覚的欠点を克服するCLIPモデルに対する後学習手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:42:47 GMT)
Pose Magic: Efficient and Temporally Consistent Human Pose Estimation with a Hybrid Mamba-GCN Network [40.1] 我々は,Hybrid Mamba-GCN(Pose Magic)という,注目のない新しいハイブリッドアーキテクチャを提案する。
MambaとGCNの表現を適応的に融合させることで、Pose Magicは基礎となる3D構造を学ぶ上で優れた能力を示している。
実験によると、Pose Magicは74.1%のFLOPを節約しながら新しいSOTA結果を達成する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:15:18 GMT)
CKNN: Cleansed k-Nearest Neighbor for Unsupervised Video Anomaly Detection [40.1] クリーズドk-Nearest Neighbor (CKNN) と呼ばれる新しい手法を提案する。
CKNNはトレーニングデータセットをきれいにすることで、Anomaly Clustersを明示的にフィルタリングする。
提案手法を様々なベンチマークデータセットで評価し、CKNNが従来の最先端UVAD法よりも最大8.5%優れていたことを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:51:20 GMT)
Data Checklist: On Unit-Testing Datasets with Usable Information [38.7] 本稿では,データセット評価のためのV情報文献に基づく分類法を提案する。
我々は、SNLIなどのデータセットで既知のアーティファクトを復元するために、データチェックリストとしてそのようなユニットテストのコレクションを使用します。
データチェックリストはさらに、リセプションアライメントの有効性とデータ効率を改善するために、新しい種類のデータフィルタリングを可能にする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:08:36 GMT)
The Crowd in MOOCs: A Study of Learning Patterns at Scale [38.0] 2年以内に1.6万以上のコースに登録された0.8万のユニークな学習者の3100万の学習活動のデータセットを分析した。
その結果,学習者の連続学習活動の時間間隔は,パワー・ローと周期的コサイン関数の分布の混合を呈することがわかった。
これらの発見は、コース上の推薦タスクを含む多様体の応用を促進することを実証する。
論文参考訳(メタデータ) (Tue, 06 Aug 2024 08:16:26 GMT)
ARIES: A Corpus of Scientific Paper Edits Made in Response to Peer Reviews [36.8] 我々は、ピアフィードバックに基づいて科学論文を自動修正するタスクを導入する。
著者が作成した特定の論文にレビュアーコメントをリンクするラベルを提供する。
アートの状態をカバーした10のモデルを用いた実験では、どの編集がコメントに対応するかを特定するのに苦労していることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:02:27 GMT)
NetLLM: Adapting Large Language Models for Networking [36.6] 我々は,ネットワーク問題を解決するために低努力でLLMの強力な能力を活用するためのコヒーレントな設計を提供する最初のフレームワークであるNetLLMを紹介する。
具体的には、NetLLMはLLMにネットワーク上のマルチモーダルデータを効果的に処理し、タスク固有の回答を効率的に生成する権限を与える。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:15:27 GMT)
Solving QUBO on the Loihi 2 Neuromorphic Processor [36.4] 本稿では,Intel Loihi 2 のニューロモルフィックプロセッサ上での擬似非拘束バイナリ最適化問題の解法について述べる。
予備的な結果から,提案手法はCPU上で動作している2つのベースラインソルバに比べて,最大1ミリ秒,最大37倍のエネルギー効率で実現可能な解を生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:07:43 GMT)
Enhancing Complex Causality Extraction via Improved Subtask Interaction and Knowledge Fusion [35.1] Event Causality extractは、テキストから因果イベントペアを抽出することを目的としている。
既存の微調整ベースのECEメソッドは、ECEの3つの重要な課題に同時に対処できない。
本稿では,ECE の3つの問題に同時に対処する統合 ECE フレームワーク (UniCE) を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:15:15 GMT)
LAMPO: Large Language Models as Preference Machines for Few-shot Ordinal Classification [34.9] LAMPOは,Large Language Models (LLMs) を多クラス順序分類タスクに応用した新しいパラダイムである。
7つの公開データセットに関する大規模な実験は、多様なアプリケーションにわたるLAMPOの極めて競争力のあるパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:55:05 GMT)
CADRL: Category-aware Dual-agent Reinforcement Learning for Explainable Recommendations over Knowledge Graphs [34.8] 本稿では,知識グラフに対する説明可能なレコメンデーションのためのカテゴリ認識型二エージェント強化学習モデルを提案する。
本モデルは,(1)近隣のエンティティやカテゴリからコンテキスト対応のアイテム表現を共同でキャプチャするカテゴリ対応グラフニューラルネットワークと,(2)2つのエージェントが効率的に長い経路をたどって適切な項目を探索するデュアルエージェントRLフレームワークの2つのコンポーネントから構成される。
論文参考訳(メタデータ) (Tue, 06 Aug 2024 13:07:08 GMT)
FastEdit: Fast Text-Guided Single-Image Editing via Semantic-Aware Diffusion Fine-Tuning [34.6] 我々は,テキストガイドによる高速な単一画像編集手法であるFastEditを紹介した。
FastEditは、編集プロセスを劇的に17秒に加速する。
コンテンツ追加,スタイル転送,バックグラウンド置換,姿勢操作など,有望な編集機能を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:16:13 GMT)
Exceptional point and hysteresis trajectories in cold Rydberg atomic gases [33.9] 長距離相互作用は追加の散逸チャネルを誘導し、非エルミート多体力学をもたらす。
ここでは, コールド・リドバーグ原子ガス中の相互作用誘起異常点の実験的観察を報告する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:35:06 GMT)
A finite element-based physics-informed operator learning framework for spatiotemporal partial differential equations on arbitrary domains [33.7] 偏微分方程式(PDE)によって支配される力学を予測できる新しい有限要素に基づく物理演算子学習フレームワークを提案する。
提案した演算子学習フレームワークは、現在の時間ステップで温度場を入力として、次の時間ステップで温度場を予測する。
ネットワークは、FEM溶液と比較して、任意の初期温度場の時間的変化を高精度に予測することに成功した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:57:36 GMT)
Personalized Collaborative Fine-Tuning for On-Device Large Language Models [33.7] ローカルデータ利用率に制限のある大規模言語モデルのデバイス上での自己教師型協調微調整について検討する。
本稿では,信頼度重み付き勾配集約方式として,重み類似度ベース,予測類似度ベース,検証性能ベースという3つの方法を紹介する。
予測および性能指標によって駆動される当社のプロトコルは、FedAvgと局所的な微調整手法の両方を超越している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:54:20 GMT)
Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models [33.5] インストラクションチューニングは、大きな言語モデル(LLM)と人間の嗜好の整合において重要な役割を果たす。
自然言語処理(NLP)とディープラーニングの分野において,データアセスメントと選択手法が提案されている。
本稿では,データアセスメントと選択に関する既存の文献を総合的にレビューし,特にLLMの命令チューニングについて述べる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:19:25 GMT)
Can LLMs Serve As Time Series Anomaly Detectors? [33.3] 大規模言語モデル(LLM)における新たなトピックは、時系列予測への応用である。
本稿では,LLM,特にGPT-4とLLaMA3の時系列における異常の検出・説明能力について検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:14:39 GMT)
GenAI Arena: An Open Evaluation Platform for Generative Models [33.2] 本稿では,異なる画像および映像生成モデルを評価するためのオープンプラットフォームGenAI-Arenaを提案する。
GenAI-Arenaは、より民主的で正確なモデルパフォーマンスの指標を提供することを目指している。
テキスト・ツー・イメージ・ジェネレーション、テキスト・ツー・ビデオ・ジェネレーション、画像編集の3つのアリーナをカバーしている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:35:50 GMT)
Dual-path Collaborative Generation Network for Emotional Video Captioning [33.2] 感情的ビデオキャプション(Emotional Video Captioning)は、ビデオで表現される本質的な感情で事実的コンテンツを記述することを目的とした、新たなタスクである。
既存の感情的ビデオキャプション手法は、最初は世界的視覚的感情的手がかりを認識し、ビデオ機能と組み合わせて感情的キャプション生成を導く。
本稿では、感情的なキャプションを生成しながら、動的に視覚的な感情的手がかりを知覚するデュアルパス協調生成ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:30:53 GMT)
DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models [32.9] 本研究では,人間医師と比較して,大規模言語モデル(LLM)の推論能力と解釈可能性を評価することを目的とする。
臨床注記用診断推論データセット(DiReCT)は、511の臨床注記を含む。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:28:01 GMT)
Biomedical SAM 2: Segment Anything in Biomedical Images and Videos [32.8] SAM 2 に基づくバイオメディカルデータに最適化された基盤モデルである BioSAM 2 を開発した。
実験の結果,BioSAM 2は既存の基礎モデルの性能に勝るだけでなく,専門モデルに匹敵する,あるいは超越していることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:34:04 GMT)
Personalizing Federated Instrument Segmentation with Visual Trait Priors in Robotic Surgery [32.6] PFedSISは、SISの視覚的特徴を持つ新しいPFL法である。
グローバル・パーソナライズド・ディアンタングメント(GPD)、外観制御パーソナライズド・エンハンスメント(APE)、形状相似グローバルエンハンスメント(SGE)が組み込まれている。
PFedSIS は 1.51% Dice, +2.11% IoU, -2.79 ASSD, -15.55 HD95 で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:06:53 GMT)
500xCompressor: Generalized Prompt Compression for Large Language Models [32.4] 500xCompressorは、自然言語のコンテキストを最小1つの特別なトークンに圧縮する手法である。
あらゆるテキストを圧縮し、様々な種類の質問に答えるように設計されており、微調整を必要とせずにオリジナルの大言語モデル(LLM)によって利用することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:51:47 GMT)
Neuron Patching: Semantic-based Neuron-level Language Model Repair for Code Generation [32.2] 大規模言語モデル(LLM)はすでにソフトウェア工学、特にコード生成タスクで広く採用されている。
コーディングタスクにおけるLLMの修復のための新しい効果的なモデル編集手法であるtextscMENTを提案する。
TextscMENTは、1つまたは2つのニューロンにパッチを当てることで神経モデルを修正することができる、効果的で効率的で信頼性の高いものだ。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:57:33 GMT)
CoverBench: A Challenging Benchmark for Complex Claim Verification [31.7] 複雑な推論条件下でのLM出力の検証に重点を置いたベンチマークであるCoverBenchを紹介する。
CoverBenchは、さまざまなドメインにおける複雑なクレーム検証のための多彩な評価を提供する。
低レベルのラベルノイズを確実にするために、手動でデータの品質を検証します。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:58:53 GMT)
Integrating Controllable Motion Skills from Demonstrations [30.9] 制御可能スキル統合(CSI)という,フレキシブルなマルチスキル統合フレームワークを導入する。
CSIは、複雑な報酬チューニングを必要とせずに、様々なスタイルのさまざまなモーションスキルを単一のポリシーに統合することを可能にする。
我々の実験は、CSIがより総合的に多様な動きのスキルを柔軟に統合し、異なるスキル間の遷移を促進することを実証した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:01:02 GMT)
Best-of-Venom: Attacking RLHF by Injecting Poisoned Preference Data [30.3] ヒューマンフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、言語モデル(LM)を人間の価値観や嗜好と整合させる一般的な手法である。
RLHFはトレーニングデータとして多数の選好ペアを必要としており、スーパービジョン・ファインチューニングとリワードモデルの両方のトレーニングでよく使用される。
我々は、悪意あるアクターが、好みを害することによって、LM世代を操作できる範囲について研究する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:30:31 GMT)
Comprehensive Attribution: Inherently Explainable Vision Model with Feature Detector [30.2] Inherently explainable attribution methodはモデル行動の理解を高めることを目的としている。
これは、セレクタ(重要な特徴を特定するために属性マップを生成する)と予測器を協調的に訓練することで達成される。
マスクアウト領域における差別的特徴の存在を阻止する新たな目標を提案する。
我々のモデルは通常のブラックボックスモデルよりも高精度で正確な予測を行う。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:22:17 GMT)
Towards Optimal Sobolev Norm Rates for the Vector-Valued Regularized Least-Squares Algorithm [30.1] 無限次元ベクトル値リッジ回帰の最初の最適速度を、$L$と仮説空間の間を補間するノルムの連続スケールに提示する。
これらの値は、ほとんどの場合最適であり、出力空間の次元に依存しないことを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:47:50 GMT)
MMRA: A Benchmark for Evaluating Multi-Granularity and Multi-Image Relational Association Capabilities in Large Visual Language Models [29.8] 本稿では,複数画像関係関連課題と,厳密にキュレートされた多粒度マルチイメージアソシエーションのベンチマークを提案する。
実験の結果,MMRAベンチマークでは,現在のマルチイメージLVLMは様々なサブタスクに対して異なる利点と欠点を示すことがわかった。
その結果,LVLMは画像の詳細を知覚する強力な能力を示し,複数の画像ヒンジにまたがる情報を関連付ける能力を高め,言語モデルコンポーネントの推論能力の向上に寄与することが示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:44:44 GMT)
Automated Defects Detection and Fix in Logging Statement [29.6] 開発者はロギングステートメントを使用してソフトウェアを監視するが、ログの誤解を招くことは、実際のアクティビティを隠蔽することで、メンテナンスを複雑にする可能性がある。
ログ品質に関する既存の研究は限定的であり、主に単一欠陥と手動修正に焦点を当てている。
ログステートメントの自動検出と更新のための2段階フレームワークであるLogFixerを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:04:37 GMT)
SpecSTG: A Fast Spectral Diffusion Framework for Probabilistic Spatio-Temporal Traffic Forecasting [29.6] SpecSTGはトラフィック時間グラフ学習のための新しいスペクトル拡散フレームワークである。
将来の時系列のフーリエ表現を生成し、学習プロセスを空間情報に富んだスペクトル領域に変換する。
最先端技術と比較すると、SpecSTGはポイント推定において最大8%の改善を達成し、将来の不確実性を定量化するために最大0.78%の改善を達成している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:09:06 GMT)
Sharpness-Aware Cross-Domain Recommendation to Cold-Start Users [29.2] CDR(Cross-Domain Recommendation)は、推薦システムにおけるコールドスタート問題を解決するために、トランスファーラーニングにインスパイアされた有望なパラダイムである。
シャープネス対応CDR(SCDR)と呼ばれる新しいCDR法を提案する。
論文参考訳(メタデータ) (Tue, 06 Aug 2024 05:45:06 GMT)
An Empirical Study on Challenges for OpenAI Developers [28.7] 人気のあるOpenAI開発者フォーラムから29,075の質問をクロールして分析します。
2,364の質問を手動で分析した後、OpenAI開発者が直面している課題の分類を構築した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:46:28 GMT)
GADePo: Graph-Assisted Declarative Pooling Transformers for Document-Level Relation Extraction [28.4] 本稿では,共同テキストグラフ変換モデルとグラフ支援宣言型プール(GADePo)仕様を導入する。
GADePoにより、プールプロセスはドメイン固有の知識や望ましい結果によってガイドされるが、Transformerによって学習される。
提案手法は,手書きプーリング関数により達成された結果よりも一貫した有望な結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:44:47 GMT)
ASR-enhanced Multimodal Representation Learning for Cross-Domain Product Retrieval [28.1] 電子商取引はますますマルチメディア化され、画像やショートビデオ、ライブストリームのプロモーションなど、幅広い領域で商品が展示されている。
広義のシナリオでは、製品内変異が大きく、製品間類似度が高いため、視覚のみの表現は不十分である。
ASRによるマルチモーダル製品表現学習(AMPere)を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:24:10 GMT)
Prioritize Alignment in Dataset Distillation [27.7] 既存の方法はエージェントモデルを使用して、ターゲットデータセットから情報を抽出し、蒸留データセットに埋め込む。
既存の手法では,情報抽出と埋め込みの両方の段階において,不整合情報を導入している。
本稿では、以下の2つの視点から情報を整列するデータセット蒸留(PAD)における優先順位付けアライメントを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:07:28 GMT)
Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters [27.7] LLMにおける推論時間計算のスケーリングについて検討する。
どちらの場合も、テスト時間計算のスケーリングに対する異なるアプローチの有効性は、プロンプトの難しさによって大きく異なることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:35:05 GMT)
Diffusion Posterior Proximal Sampling for Image Restoration [27.4] 我々は拡散に基づく画像復元のための洗練されたパラダイムを提案する。
具体的には,各生成段階における測定値と一致したサンプルを選択する。
選択に使用する候補サンプルの数は、タイムステップの信号対雑音比に基づいて適応的に決定される。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:24:35 GMT)
NeurDB: On the Design and Implementation of an AI-powered Autonomous Database [27.1] 本稿では,AIによる自律データベースNeurDBを紹介する。
NeurDBは、データとワークロードのドリフトへの適応性を備えた、AIとデータベースの融合をさらに深める。
実証的な評価によると、NeurDBはAI分析タスクの管理において、既存のソリューションを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:48:51 GMT)
PT43D: A Probabilistic Transformer for Generating 3D Shapes from Single Highly-Ambiguous RGB Images [26.9] 本稿では,1枚のRGB画像から3次元形状を生成するトランスフォーマーを用いた自己回帰モデルを提案する。
フィールド・オブ・ビュー・トランケーションのような現実的なシナリオを扱うために、シミュレーション画像と形状のトレーニングペアを作成します。
次に、入力画像から最も関連性の高い領域を効果的に識別し、形状生成を行う。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:00:49 GMT)
AI-Generated Faces in the Real World: A Large-Scale Case Study of Twitter Profile Images [26.9] われわれは,Twitter上でAI生成プロフィール画像の普及状況について,大規模な調査を行った。
約1500万枚のTwitterプロフィール写真を分析したところ、0.052%が人工的に生成され、プラットフォーム上での存在が確認された。
結果は、スパムや政治的増幅キャンペーンなど、いくつかの動機も明らかにしている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:11:34 GMT)
Multi-Modal Dataset Creation for Federated Learning with DICOM Structured Reports [26.2] フェデレーショントレーニングは、多種多様なデータストレージオプション、一貫性のない命名方式、さまざまなアノテーション手順、ラベル品質の相違により、しばしば異種データセットによって妨げられる。
これは、均一なデータ表現とフィルタリングオプションを含むデータセット調和が最重要となる、新興のマルチモーダル学習パラダイムにおいて特に顕著である。
我々は、マルチモーダルデータセットの組み立てプロセスを簡単にする、データ統合と対話型フィルタリング機能のためのオープンプラットフォームを開発した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:43:53 GMT)
Combining Diverse Information for Coordinated Action: Stochastic Bandit Algorithms for Heterogeneous Agents [26.1] マルチエージェントの盗賊は、各腕からの報酬は固定分布に従うと仮定する。
報酬は各エージェントの 環境に対する感受性に依存する
UCBスタイルのアルゴリズムMin-Widthを導入し、多様なエージェントから情報を集約する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:56:29 GMT)
TextIM: Part-aware Interactive Motion Synthesis from Text [25.9] TextIMは、TEXT駆動のヒューマンインタラクティブモーションを合成するための新しいフレームワークである。
我々のアプローチは、人間の脳として機能する大きな言語モデルを利用して、相互作用する人間の身体部分を特定する。
トレーニングと評価のために,HUMANML3Dからインタラクティブな動きを慎重に選択し,再ラベルし,特殊なデータセットを開発した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:08:05 GMT)
A Taxonomy of Architecture Options for Foundation Model-based Agents: Analysis and Decision Model [25.8] 本稿では,基礎モデルに基づくエージェントのアーキテクチャに着目した分類法を提案する。
分類学は,これらの分類を統一し,詳細化することにより,基礎モデルに基づくエージェントの設計を改善することを目的としている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:10:52 GMT)
Beyond Accuracy: Evaluating the Reasoning Behavior of Large Language Models -- A Survey [25.7] 大規模言語モデル(LLM)は、最近、推論を含むタスクで顕著なパフォーマンスを示している。
これらの成功にもかかわらず、LLMの推論能力の深さは未だ不明である。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:58:53 GMT)
MGFs: Masked Gaussian Fields for Meshing Building based on Multi-View Images [25.3] 本稿では,建物表面の正確な再構築を時間効率で実現する新しいフレームワーク,Masked Gaussian Fields (MGFs)を提案する。
フレームワークはまずEfficientSAMとCOLMAPを使用して、ビルディングのマルチレベルマスクとそれに対応するマスクされた点雲を生成する。
UAV画像の総合的な実験により, 従来の手法と数種類のNeRF法, ガウス法によるSOTA法と比較して, 建物表面再構成の精度と効率を著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:23:24 GMT)
Automating Human Tutor-Style Programming Feedback: Leveraging GPT-4 Tutor Model for Hint Generation and GPT-3.5 Student Model for Hint Validation [25.3] 本稿では,人間の教師型プログラミングヒントの提供における生成型AIモデルの役割について検討する。
最近の研究は、様々なフィードバック生成シナリオのための最先端モデルのベンチマークを行っている。
我々はGPT4Hints-GPT3.5Valという新しい手法を開発し、生成AIモデルの限界を推し進める。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:25:33 GMT)
Few-shot Scooping Under Domain Shift via Simulated Maximal Deployment Gaps [25.1] 本稿では,少数のスクーピング問題を考察し,視覚に基づく適応型スクーピング戦略を提案する。
私たちは、オフラインのトレーニングデータセットからシミュレートされたデプロイメントギャップを作成することで、大規模なドメインシフトに対応するために、ディープカーネルモデルをトレーニングします。
提案手法はまた、ゼロショット転送能力を示し、NASA OWLATプラットフォームへの適応に成功した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:25:09 GMT)
Comb, Prune, Distill: Towards Unified Pruning for Vision Model Compression [24.1] 我々はモデル非依存とタスク非依存の両方に同時に対処する新しい統一型刈取フレームワークComb, Prune, Distill (CPD)を提案する。
当社のフレームワークは階層的な階層的な依存性問題を解決するための統合的なステップを採用しており、アーキテクチャの独立性を実現しています。
画像分類では、精度が1.8%、セマンティックセグメンテーションがx1.89、mIoUが5.1%のスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:02:31 GMT)
Beyond App Markets: Demystifying Underground Mobile App Distribution Via Telegram [23.6] この研究は、Telegramの地下モバイルアプリエコシステムを包括的に調査した初めてのものである。
調査の結果、これらのアプリはTelegramのユーザーベースの約1%に達し、主にギャンブルやポルノサービスに対応していることがわかった。
私たちの分析では、アプリの配布におけるiOS機能の誤用や、これらのアプリの悪意ある動作の頻度も明らかにしています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:55:39 GMT)
RULER: What's the Real Context Size of Your Long-Context Language Models? [23.2] 我々は、長文言語モデル(LM)を評価するための新しいベンチマークを作成する。
我々はRULERにおける13のタスクを含む17の長文LMを評価した。
ほぼ全てのモデルは、コンテキスト長が増加するにつれて大きなパフォーマンス低下を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:48:58 GMT)
Enabling Discriminative Reasoning in LLMs for Legal Judgment Prediction [23.0] 人間の推論に触発されたAsk-Discriminate-Predict(ADAPT)推論フレームワークを紹介する。
ADAPTは、ケース事実を分解し、潜在的な電荷を識別し、最終的な判断を予測する。
広く利用されている2つのデータセットに対して行われた実験は、法的な判断予測において、我々のフレームワークの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:06:20 GMT)
FedBAT: Communication-Efficient Federated Learning via Learnable Binarization [22.4] Federated Binarization-Aware Training (FedBAT)は、ローカルトレーニングプロセス中にバイナリモデルの更新を直接学習する新しいフレームワークである。
FedBATは革新的二項化演算子と巧妙に設計された導関数を組み込み、効率的な学習を容易にする。
その結果,FedBATは収束を著しく加速し,ベースラインの精度を最大9%超えることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:19:06 GMT)
Federated Learning Architectures: A Performance Evaluation with Crop Yield Prediction Application [22.2] 本稿では,長期記憶ネットワークに基づく収量予測のための集中型・分散型フェデレーション学習フレームワークを実装した。
2つのフレームワークのパフォーマンスは、予測精度、精度、リコール、F1スコア、トレーニング時間の観点から評価される。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:05:56 GMT)
Less but Better: Enabling Generalized Zero-shot Learning Towards Unseen Domains by Intrinsic Learning from Redundant LLM Semantics [21.3] 汎用ゼロショット学習(GZSL)は、ドメインシフト問題(DSP)に対する見知らぬクラスと見えないクラスを認識することに焦点を当てている。
我々は、GZSLに対処するクロスドメインGZSLのパイオニアである。
大規模言語モデル(LLM)を付加した冗長クラスセマンティクスによる情報非対称性問題を考えると,メタドメインアライメント・セマンティック・リファインメント(MDASR)を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:32:46 GMT)
Frame Interpolation with Consecutive Brownian Bridge Diffusion [21.2] ビデオフレーム補間(VFI)は、拡散に基づく条件付き画像生成問題としてVFIを定式化しようとする。
本稿では,Branian Bridge Diffusionを用いたフレーム補間法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:19:06 GMT)
The Art of Camouflage: Few-Shot Learning for Animal Detection and Segmentation [21.0] カモフラージュされた物体の検出とセグメンテーションにおける数ショット学習の問題に対処する。
そこで我々は, Camouflaged インスタンスを効率的に検出・分割するフレームワーク FS-CDIS を提案する。
提案手法は,新たに収集したデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:31:28 GMT)
Understanding Retrieval Robustness for Retrieval-Augmented Image Captioning [21.0] 検索強化キャプションモデルSmallCapのロバスト性を解析した。
より多様な集合から抽出したキャプションを抽出してモデルを訓練することを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:10:58 GMT)
Simple but Efficient: A Multi-Scenario Nearline Retrieval Framework for Recommendation on Taobao [21.0] 本稿では,革新的なマルチシナリオニアライン検索フレームワークを提案する。
さまざまなシナリオからのランキングログをFlinkを通じて活用して動作する。
当社の手法では,製品取引における5%のアップタイク,特に顕著な改善が見られた。
論文参考訳(メタデータ) (Tue, 06 Aug 2024 03:27:02 GMT)
Self-Evaluation as a Defense Against Adversarial Attacks on LLMs [20.8] 自己評価を生かした LLM に対する敵攻撃に対する防御策を導入する。
本手法では, モデル微調整を必要とせず, 生成モデルの入力と出力を評価するために, 事前学習モデルを用いる。
提案手法の有効性を解析し, 各種設定で評価器を攻撃しようとする試みを含む。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:15:00 GMT)
Citekit: A Modular Toolkit for Large Language Model Citation Generation [20.5] 大規模言語モデル(LLM)は質問応答(QA)タスクで引用を生成する。
現在、異なる引用生成方法を標準化し、適切に比較するための統一されたフレームワークは存在しない。
既存の引用生成手法の実装と評価を容易にするために設計されたオープンソースのモジュール型ツールキットであるnameを紹介する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:13:15 GMT)
Compress and Compare: Interactively Evaluating Efficiency and Behavior Across ML Model Compression Experiments [20.4] デバイス上で機械学習モデルをデプロイするには、圧縮アルゴリズムを使用して、高品質なアウトプットを維持しながらモデルを縮小および高速化する。
既存の圧縮ツールは比較を不十分にサポートし、退屈な結果となり、時には不完全な解析が非結合ツールに分散する。
実世界の比較を支援するために,Compress and Compareという対話型ビジュアルシステムを開発した。
コンプレックスとコンプレックスは、圧縮されたモデル間の前兆関係を可視化し、モデルの予測、重み、アクティベーションを比較することで圧縮誘起の挙動変化を明らかにすることで、圧縮戦略を約束する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:17:51 GMT)
Masked Random Noise for Communication Efficient Federaetd Learning [20.0] フェデレーション学習は、データプライバシを効果的に保護する、有望な分散トレーニングである。
本稿では,新たな視点からコミュニケーション効率を向上させることを目的とする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:26:09 GMT)
Online Electric Vehicle Charging Detection Based on Memory-based Transformer using Smart Meter Data [19.9] 電気自動車(EV)の人気は、グリッドオペレーターとインフラに固有の課題をもたらす。
1つの重要な側面は、グリッド内のEV充電の存在を正確に識別する能力である。
ストリーミングスマートメーターからEVの充電を検出するために,リアルタイム(オンライン)に動作可能な新しいメモリベーストランス (M-TR) を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:19:14 GMT)
RSB-Pose: Robust Short-Baseline Binocular 3D Human Pose Estimation with Occlusion Handling [19.7] 我々は、ポータビリティと幾何学的測定特性の両方を提供する短基線双眼設定に照準を合わせました。
両眼の基準線が短くなるにつれて, 第一に, 2次元誤差に対する3次元再構成の堅牢性は低下する。
本稿では,2次元キーポイントの表示一貫性を改善し,3次元ロバスト性を高めるためのステレオコキーポイント推定モジュールを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:36:11 GMT)
The Need for a Big World Simulator: A Scientific Challenge for Continual Learning [19.7] 小さなエージェント、大きな世界」のフレームは、継続的な学習の必要性を動機づける概念的な視点を提供する。
適切に機能させるためには、エージェントは適切な情報を取り込み、保持し、放出するように慎重に設計されなければならない。
本稿では,将来のシミュレート環境設計のための2つのデシデラタを形式化する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:26:01 GMT)
FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation [19.7] 本稿では,大規模テキスト・ツー・イメージ(T2I)拡散モデルとイメージ・ツー・イメージ(I2I)パラダイムをプラグ・アンド・プレイ方式で適用する,新しい,簡潔かつ効率的なアプローチを提案する。
本手法は,周波数帯域のタイプや帯域幅を調整するだけで,参照画像の導出係数と導出強度の両方を柔軟に制御できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:01:17 GMT)
SimEndoGS: Efficient Data-driven Scene Simulation using Robotic Surgery Videos via Physics-embedded 3D Gaussians [19.6] 立体内視鏡画像から3D Gaussianを学習可能な手術シーンの表現として紹介する。
本研究では3次元ガウスに物理特性を統合したマテリアルポイント法を適用し,現実的なシーン変形を実現する。
以上の結果から,内視鏡的画像から外科的シーンを効率的に再構成し,シミュレートし,外科的シーンを再構築するのにほんの数分しか要しないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:07:37 GMT)
Fast Point Cloud Geometry Compression with Context-based Residual Coding and INR-based Refinement [19.6] 我々は、KNN法を用いて、原表面点の近傍を決定する。
条件付き確率モデルは局所幾何学に適応し、大きな速度減少をもたらす。
暗黙のニューラル表現を精製層に組み込むことで、デコーダは任意の密度で下面の点をサンプリングすることができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:24:06 GMT)
Adv3D: Generating 3D Adversarial Examples for 3D Object Detection in Driving Scenarios with NeRF [19.6] Adv3DはNeural Radiance Fields (NeRFs)として初めて、敵の例をモデル化する。
NeRFは、フォトリアリスティックな外観と正確な3D生成を提供し、より現実的で実現可能な敵の例をもたらす。
本稿では,3次元パッチアタックをカモフラージュ対角テクスチャで実現するプリミティブ・アウェア・サンプリングとセマンティック・ガイドによる正規化を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:58:13 GMT)
An Object is Worth 64x64 Pixels: Generating 3D Object via Image Diffusion [19.5] 対象画像」という表現を通してUVマップを用いたリアルな3Dモデルを生成する新しい手法を提案する。
このアプローチは、64x64ピクセル画像内の表面形状、外観、パッチ構造をカプセル化し、複雑な3D形状をより管理可能な2Dフォーマットに変換する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:22:51 GMT)
Line-based 6-DoF Object Pose Estimation and Tracking With an Event Camera [19.2] イベントカメラは、高いダイナミックレンジ、低レイテンシ、動きのぼけに対するレジリエンスといった顕著な特性を持っている。
イベントカメラを用いた平面オブジェクトや非平面オブジェクトに対するラインベースロバストポーズ推定と追跡手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:36:43 GMT)
Holistic Evaluation for Interleaved Text-and-Image Generation [19.0] 我々はインターリーブドベンチ(InterleavedBench)について紹介する。
また、GPT-4oをベースとした強力な基準フリーメトリックであるInterleavedEvalを提案し、正確で説明可能な評価を行う。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:04:35 GMT)
Hummer: Towards Limited Competitive Preference Dataset [19.0] 我々は、嗜好データセット内の競合の度合いを定量化するために、新しいメトリクスAlignment Dimension Conflictを導入する。
我々は、textttHummerとその細粒度の変種である textttHummer-F を、コンフリクトアライメントの少ない革新的なペアワイズ選好データセットとして提示する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:12:26 GMT)
Multi-Level Querying using A Knowledge Pyramid [19.0] 精度とリコールのバランスを改善するために,RAGフレームワーク内の多層知識ピラミッドアプローチを提案する。
我々は,オントロジースキーマとインスタンスの包括的知識カバレッジと動的更新のために,層間拡張技術を採用している。
我々のアプローチであるPolyRAGは、ピラミッドの頂上からスタートし、自信ある答えが得られるまで進行する、検索のためのウォーターフォールモデルに従っています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:34:03 GMT)
Active Learning for Level Set Estimation Using Randomized Straddle Algorithms [19.0] 本稿では,関数が与えられたしきい値の上(または下)に値を取る入力点の集合を同定する新しい手法を提案する。
提案手法の信頼性パラメータは,反復数や候補点に依存しず,保守的でないという利点がある。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:39:12 GMT)
Augmented Object Intelligence with XR-Objects [18.6] 本稿では,デジタルと物理の境界線を曖昧にすることを目的としたインタラクションパラダイムであるXRの文脈において,人工知能について検討する。
我々は,オープンソースのプロトタイプシステムであるXR-Objectsの形で,AOIの概念を実装した。
このシステムにより、アナログオブジェクトは情報を伝えるだけでなく、詳細を問い合わせたりタスクを実行するといったデジタルアクションを開始することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:55:44 GMT)
A New Framework for Quantum Phases in Open Systems: Steady State of Imaginary-Time Lindbladian Evolution [18.5] 代替フレームワークとして、想像時間リンドブラディアン進化の概念を導入する。
この新しいアプローチは、想像上のリウヴィル超作用素のスペクトル特性を通じて、開系におけるギャップ付き量子位相を定義する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:53:40 GMT)
Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization [18.4] ブロック化最小化(BMM)は、非排他的部分空間推定のための単純な反復勾配である。
我々の分析はユークリッドの制約を明示的に用いている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:41:19 GMT)
EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions [18.4] 本稿では,直接音声合成手法を用いた新しいフレームワーク EMO を提案する。
本手法は,映像全体を通してシームレスなフレーム遷移と一貫したアイデンティティ保存を保証し,高い表現力とライフスタイルのアニメーションを実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:33:30 GMT)
HeTraX: Energy Efficient 3D Heterogeneous Manycore Architecture for Transformer Acceleration [18.4] 本稿では,変圧器モデルの高速化に特化して最適化されたHeTraXと呼ばれる3次元ヘテロジニアスアーキテクチャの設計を提案する。
実験の結果、HeTraXは既存の最先端技術よりも5.6倍のスピードアップを実現し、EDPを14.5倍改善し、熱的実現性を確保した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:48:01 GMT)
The Fine-Tuning Paradox: Boosting Translation Quality Without Sacrificing LLM Abilities [18.2] 機械翻訳のための微調整大型言語モデル(LLM)は、全体的な翻訳品質が改善されている。
モデルサイズは70億から65億までの範囲で,LLaMAおよびファルコン系のモデルに対して広範な翻訳評価を行う。
フォーマルなステアリングを行う能力の低下、数ショットの例による技術的翻訳の作成、文書レベルの翻訳を行う能力の低下を観察する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:46:29 GMT)
Are Female Carpenters like Blue Bananas? A Corpus Investigation of Occupation Gender Typicality [17.6] バナナの黄色い色が典型的であるのと同様に、職業の典型的な性別も存在する。
性別の言及は特に女性の職業性と相関している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:19:23 GMT)
Understanding the Learning Dynamics of Alignment with Human Feedback [17.4] 本稿では,人間の嗜好アライメントの学習力学を理論的に解析する試みについて述べる。
選好データセットの分布がモデル更新率にどのように影響するかを示し、トレーニング精度に厳密な保証を与える。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:33:26 GMT)
On the Generalization of Preference Learning with DPO [17.4] 大きな言語モデル(LLM)は目覚ましい能力を示してきたが、しばしば人間の好みに合わせるのに苦労している。
嗜好学習は、人間のフィードバックに基づいて、好ましくない反応と好ましくない反応を区別するモデルを訓練する。
本稿では、直接選好最適化(DPO)で訓練されたモデルの一般化保証を解析するための新しい理論的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:11:00 GMT)
TSC: A Simple Two-Sided Constraint against Over-Smoothing [17.3] グラフ畳み込みニューラルネットワーク(GCN)のための単純な2次元制約(TSC)を導入する。
ランダムマスキングは、隣人からの情報の集約の度合いを調整するために、表現行列の列に作用する。
表現行列の行に適用される対照的な制約は、ノードの識別可能性を高める。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:52:03 GMT)
Empathy Level Alignment via Reinforcement Learning for Empathetic Response Generation [17.2] 共感応答生成は人間のような対話システムの構築に不可欠である。
強化学習(EmpRL)フレームワークを用いた共感応答生成を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:16:00 GMT)
Closing the gap between SVRG and TD-SVRG with Gradient Splitting [17.1] 時間差(TD)学習は、分散還元法により性能を向上できる強化学習における政策評価である。
最近の研究は、TD学習の解釈を、適切に選択された関数の勾配の分割として利用し、アルゴリズムを簡素化し、SVRGとTDを融合させる。
本研究の主な成果は,1/8ドルの学習率を持つ幾何学的収束であり,凸条件下でSVRGが利用できる収束値と同一である。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:51:40 GMT)
SteP: Stacked LLM Policies for Web Actions [17.0] 本稿では,Web アクションのためのスタック型 LLM ポリシー (SteP) を提案する。
StePは、状態が制御状態を表すポリシーのスタックであるマルコフ決定プロセスを定義する。
我々は、WebArena、MiniWoB++、CRMなど、複数のベースラインとWeb環境に対してStePを評価する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:26:55 GMT)
On the Efficacy of Text-Based Input Modalities for Action Anticipation [16.8] 本稿では,アクションやオブジェクトのマルチモーダルな特徴やテキスト記述から学習するビデオトランスフォーマーアーキテクチャを提案する。
EpicKitchensデータセットの従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:28:25 GMT)
Distilling Large Language Models for Text-Attributed Graph Learning [16.4] Text-Attributed Graphs (TAG) は、接続されたテキストドキュメントのグラフである。
グラフモデルはTAGを効率的に学習できるが、トレーニングは人間にアノテートされたラベルに大きく依存している。
大規模言語モデル(LLM)は、最近、少数ショットとゼロショットのTAG学習において顕著な能力を示した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:34:06 GMT)
Anytime Multi-Agent Path Finding with an Adaptive Delay-Based Heuristic [16.4] MAPF-LNSの単一破壊ヒューリスティックな変種として,Adaptive Delay-based Destroy-and-Repair with Enhanced Success-based Self-Learning (ADDRESS)を提案する。
我々は,1000エージェントまでの大規模シナリオにおいて,MAPF-LNSと比較して,少なくとも50%のコスト改善を実証した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:15:35 GMT)
A Survey on Deep Learning for Theorem Proving [16.3] 定理証明は数学の基本的な側面であり、自然言語における非公式な推論から形式体系における厳密な導出にまで及ぶ。
ディープラーニング、特に大きな言語モデルの出現は、定理証明のプロセスを強化するためにこれらの技術を探究する研究の顕著な急増を引き起こした。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:30:11 GMT)
Towards Fixing Panic Bugs for Real-world Rust Programs [15.9] パニックエラーは、管理不能な実行時エラー、すなわちパニックエラーである。
本稿では,Rustのパニックバグの修正を目的とした系統的研究を紹介する。
Rustの実装を分析することで、パニックバグを修正するためのRust固有のパターンを特定します。
Rustのパニックバグに対して,最初の自動修正ツールであるPanicKillerを設計し,実装しています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:53:46 GMT)
High-Throughput Secure Multiparty Computation with an Honest Majority in Various Network Settings [15.8] 本稿では,セキュアな3次元計算(3PC)と悪意のある4次元計算(4PC)のためのリング上の新しいプロトコルを提案する。
高スループットに最適化されたオープンソースのC++フレームワークで、最先端プロトコル(Replicated 3PC, ASTRA, Fantastic Four, Tetrad)とともに、当社のプロトコルを実装しています。
実装された6つの3PCおよび4PCプロトコルのうち5つは、25Gbit/sのLAN環境において、毎秒10億以上の32ビット乗算または32億のANDゲートを達成する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:20:59 GMT)
Integrating ESG and AI: A Comprehensive Responsible AI Assessment Framework [15.5] ESG-AIフレームワークは28社の企業との関わりの洞察に基づいて開発された。
これは、AIアプリケーションの環境および社会的影響の概要を提供し、投資家のようなユーザーがAI利用の物質性を評価するのに役立つ。
投資家は、構造化されたエンゲージメントと特定のリスク領域の徹底的な評価を通じて、責任あるAIに対する企業のコミットメントを評価することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:12:50 GMT)
MambaMOS: LiDAR-based 3D Moving Object Segmentation with Motion-aware State Space Model [15.4] LiDARベースの移動物体(MOS)は、前回のスキャンからの動き情報を用いて、現在のスキャンの点雲における移動物体の特定と分割を目的としている。
MambaMOSと呼ばれる動き認識状態空間モデルを用いた新しいLiDARベースの3D移動物体を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:28:12 GMT)
Multitask and Multimodal Neural Tuning for Large Models [15.3] 多様なマルチモーダルタスクを同時に処理するために設計されたニューラルチューニングと呼ばれる新しいチューニング手法を提案する。
ニューラルチューニングは、タスクごとにニューロンの特定のサブセットのみが活性化される、人間の脳内のスパース分散表現をエミュレートする。
本稿では,各サンプルに複数のタスクラベルを付加した新しいベンチマークMMUDを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:19:51 GMT)
Unveiling LLMs: The Evolution of Latent Representations in a Dynamic Knowledge Graph [15.1] この研究は、大規模言語モデルが文レベルのクレーム検証のために内部的に表現する事実情報を明らかにする。
本稿では,トークン表現に埋め込まれた事実知識をベクトル空間から基底述語集合にデコードするエンド・ツー・エンドのフレームワークを提案する。
本フレームワークでは,推論中にトークン表現を変更するベクトルレベル手法であるアクティベーションパッチを用いて,符号化された知識を抽出する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:02:33 GMT)
LumiGauss: High-Fidelity Outdoor Relighting with 2D Gaussian Splatting [15.1] LumiGaussは,2次元ガウススプラッティングによるシーンの3次元再構成と環境照明を実現する技術である。
提案手法は高品質なシーン再構成を実現し,新しい環境マップ下でのリアルな照明合成を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:41:57 GMT)
Towards Detecting and Mitigating Cognitive Bias in Spoken Conversational Search [14.9] 本稿では,情報探索,心理学,認知科学,ウェアラブルセンサの知見をもとに,地域社会における新たな会話を促す。
実験的な設計と設定のためのマルチモーダル機器と手法を含むフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 Aug 2024 20:42:53 GMT)
Deep Variable-Block Chain with Adaptive Variable Selection [14.8] 本稿では,段階的欲求探索によって得られる連鎖構造を変数のブロックに課す枠組みを提案する。
変数ブロックは逐次的に分類するために使用されるため、複数の領域で訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多数の領域によって訓練された多くの領域によって訓練された多くの領域によって訓練された多くの領域によって訓練された多くの領域によって訓練された多くの領域によって訓練された複数の領域によって訓練された領域によって、変数を選択する能力を開発する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:50:41 GMT)
MLC-GCN: Multi-Level Generated Connectome Based GCN for AD Analysis [14.5] アルツハイマー病(英: Alzheimers Disease、AD)は、現在発症可能な神経変性疾患である。
アルツハイマー病(英語: Alzheimer's Disease、AD)は、現在発症可能な神経変性疾患である。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:18:36 GMT)
Deep Uncertainty-Based Explore for Index Construction and Retrieval in Recommendation System [14.5] マッチング結果の妥当性と斬新さのバランスをとることは、レコメンデーションシステムの設計と最適化における重要なステップである。
本稿では,UICR(Index Construction and Retrieval)アルゴリズムを提案する。
マッチング段階における不確実性モデリングの概念を導入し、モデル不確実性とインデックス不確実性のマルチタスクモデリングを実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:03:16 GMT)
Calo-VQ: Vector-Quantized Two-Stage Generative Model in Calorimeter Simulation [14.4] 本稿では,ベクトル量子化変分オートエンコーダ(VQ-VAE)を応用した,カロリー検出器応答の高速シミュレーションのための新しい機械学習手法を提案する。
我々のモデルは2段階生成戦略を採用している: 幾何対応のカロリーメータデータを離散潜在空間に圧縮し、次に列モデルを用いて潜在トークンを学習・生成する。
顕著なことに、我々のモデルはミリ秒以内のカロリーメータシャワーを発生させる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:20:00 GMT)
MaskAnyone Toolkit: Offering Strategies for Minimizing Privacy Risks and Maximizing Utility in Audio-Visual Data Archiving [14.3] 本稿では,研究における音声・視覚データの共有に関するプライバシーと倫理的懸念をナビゲートする新しいツールキットであるMaskAnyoneを紹介する。
MaskAnyoneは、顔のスワッピングと音声の修正を通じて、ビデオやオーディオコンテンツ中の個人を識別するための、スケーラブルでユーザフレンドリーなソリューションを提供する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:35:27 GMT)
Lighthouse: A User-Friendly Library for Reproducible Video Moment Retrieval and Highlight Detection [14.2] 再現性のあるビデオモーメント検索とハイライト検出(MR-HD)のためのユーザフレンドリーなライブラリLighthouseを提案する。
1つ目は、さまざまなメソッド、データセット、ビデオテキスト機能にまたがる包括的な再現可能な実験の欠如である。これは、統一されたトレーニングと評価が複数の設定をカバーすることができないためである。
ほとんどの作業はトレーニングコードのみをリリースし、MR-HDの推論プロセス全体を実装する必要がある。Lighthouseは6つのモデル、3つの機能、5つのデータセットを含む統一的な再現可能な実装によってこれらの問題に対処する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:15:12 GMT)
KaPO: Knowledge-aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models [14.1] 本稿では,実際の検索シナリオにおける制御可能な知識選択を実現することを目的とした,知識認識型推論最適化(KaPO)を提案する。
その結果,KaPOは従来の知識衝突処理手法を37%以上上回り,また,分布外一般化データセットの頑健性も示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:55:54 GMT)
Reinforcement Learning with Generalizable Gaussian Splatting [14.0] 優れた表現は強化学習(RL)のパフォーマンスに不可欠である。
本稿では、GSRLと呼ばれるRLタスクを表現するための新しい一般化可能なガウススティングフレームワークを提案する。
提案手法は,複数のタスクにおいて,他のベースラインよりも優れた結果が得られ,最も難しいタスクのベースラインと比較して10%,44%,15%の性能が向上する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:42:32 GMT)
AMES: Asymmetric and Memory-Efficient Similarity Estimation for Instance-level Retrieval [14.0] 本研究は,メモリ効率の制約を考慮に入れたインスタンスレベルの画像検索の問題について検討する。
提案モデルは、画像と画像の類似性を推定するために設計されたトランスフォーマーベースのアーキテクチャを使用する。
標準ベンチマークの結果は、手作りモデルと学習モデルの両方に対するアプローチの優位性を示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:29:51 GMT)
INSIGHT: Universal Neural Simulator for Analog Circuits Harnessing Autoregressive Transformers [13.9] INSIGHTはアナログフロントエンド設計自動化ループにおける効果的なユニバーサルニューラルネットワークシミュレータである。
アナログ回路の性能指標を数マイクロ秒の推論時間で正確に予測する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:14:17 GMT)
Diverse Generation while Maintaining Semantic Coordination: A Diffusion-Based Data Augmentation Method for Object Detection [13.9] 本稿では,このバランスを仲介するために,事前学習条件付き拡散モデルを利用した革新的拡張手法を提案する。
本手法は,データセットの多様性向上を目的としたカテゴリ親和性マトリックスの開発を念頭に置いている。
本手法は,3つの異なる物体検出モデルにおいて,既存の代替品に対して,+1.4AP,+0.9AP,+3.4APの実質的な平均的改善をもたらす。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:41:40 GMT)
Can Large Language Models Solve Robot Routing? [13.7] 大規模言語モデル(LLM)は、自然言語で記述されたタスクからロボットルートの生成へとパイプライン全体を置き換えることができる。
単一ロボットとマルチロボットの両方の設定において、8つの変種にまたがる80のユニークなロボットルーティング問題を持つデータセットを構築した。
その結果, 自己検証と自己検証は, 最適性ギャップを著しく低下させることなく, 成功率を高めることが明らかとなった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:14:23 GMT)
Mitigating Hallucinations in Large Vision-Language Models (LVLMs) via Language-Contrastive Decoding (LCD) [13.4] Large Vision-Language Models (LVLM) は、画像入力とテキスト入力の両方の処理を容易にし、AI機能を拡張したLarge Language Models (LLM)の拡張である。
本研究では,LVLMの出力をLarge Language Models分布の信頼性レベルに基づいて調整するLanguage Contrastive Decoding (LCD)アルゴリズムを提案する。
本手法は,複雑な後処理や再学習を必要とせず,LVLMを効果的に改善し,異なるモデルに容易に適用できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:10:34 GMT)
A Debiased Nearest Neighbors Framework for Multi-Label Text Classification [13.3] マルチラベルテキスト分類(MLTC)のためのDebiased Nearest Neighbors(DENN)フレームワークについて紹介する。
組込みアライメントバイアスに対処するために,ラベル共起における近傍の一貫性を向上する,非バイアス付きコントラスト学習戦略を提案する。
信頼度推定バイアスには,$k$NNの予測と帰納的二分分類の適応的組み合わせを改善し,偏りのある信頼度推定戦略を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:00:23 GMT)
Unveiling Factual Recall Behaviors of Large Language Models through Knowledge Neurons [13.3] 本研究では,Large Language Models (LLMs) が推論タスクに直面すると,その内部知識のリポジトリを積極的にリコールするか,回収するかを検討する。
我々は,LLMが特定の状況下での批判的事実関連を活用できないことを明らかにした。
複雑な推論タスクに対処する強力な手法であるChain-of-Thought(CoT)プロンプトの効果を評価する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:07:08 GMT)
Cross-cultural analysis of pedestrian group behaviour influence on crossing decisions in interactions with autonomous vehicles [12.8] 本研究では,文化的・状況的要因を考慮した横断行動に及ぼす共同歩行者の影響について検討した。
CARLAシミュレータでフルスケールのバーチャルリアリティ(VR)環境が作成され、スペインとオーストラリアの両方で実験を再現できるようになった。
本研究は,グループによる無謀な行動は信頼性を低下させ,状況がより複雑化するにもかかわらず,歩行者が同一の交通ギャップをまたぐ傾向があることを示唆する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:28:59 GMT)
ProCreate, Don't Reproduce! Propulsive Energy Diffusion for Creative Generation [12.8] ProCreateは、拡散に基づく画像生成モデルのサンプルの多様性と創造性を改善するための、シンプルで簡単に実装できる方法である。
ProCreateは,訓練用テキストプロンプトを用いた大規模評価において,トレーニングデータの複製を防止するのに有効であることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:12:35 GMT)
SeamPose: Repurposing Seams as Capacitive Sensors in a Shirt for Upper-Body Pose Tracking [12.7] シーム(英: Seam)は、2つ以上の布を縫い合わせることで形成された重なり合う生地の領域である。
SeamPoseでは,上半身ポーズの連続推定のためのシャツの容量センサとしてシームを再利用した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:31:05 GMT)
Set2Seq Transformer: Learning Permutation Aware Set Representations of Artistic Sequences [12.7] 離散時間ステップの時間的位置認識表現を学習することで、静的な視覚的複数インスタンス学習法を大幅に改善できることを示す。
本稿では,このSet2Seq Transformerを用いて,視覚アーティストの眼球運動のモデル化に視覚的集合と時間的位置認識表現を活用することにより,芸術的成功を予測できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:55:31 GMT)
LLM-Empowered Resource Allocation in Wireless Communications Systems [12.7] 大規模言語モデル(LLM)は、人工知能(AGI)対応無線ネットワークを実現する可能性を秘めている。
我々は,無線通信システムのための LLM ベースの資源割当方式を開発した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:08:26 GMT)
Leveraging Inter-Chunk Interactions for Enhanced Retrieval in Large Language Model-Based Question Answering [12.6] IIERは、構造、キーワード、セマンティックという3つのタイプの相互作用を考慮し、ドキュメントチャンク間の内部接続をキャプチャする。
対象の質問に基づいて複数のシードノードを特定し、関連するチャンクを反復的に検索して、支持する証拠を収集する。
コンテキストと推論チェーンを洗練し、推論と回答の生成において大きな言語モデルを支援する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:39:55 GMT)
DiffX: Guide Your Layout to Cross-Modal Generative Modeling [12.5] DiffXは、一般的なレイアウト誘導型クロスモーダル生成のための新しい拡散モデルである。
モダリティ共有ラテント空間において拡散および復調過程を行う。
3つのRGB+X'データセット間のクロスモーダル生成の堅牢性を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:54:41 GMT)
Multi-Modality Co-Learning for Efficient Skeleton-based Action Recognition [12.4] 本稿では,効率的な骨格に基づく行動認識のための多モード協調学習(MMCL)フレームワークを提案する。
MMCLフレームワークは,トレーニング期間中に多要素協調学習を行い,推論に簡潔な骨格のみを用いることで効率を向上する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:20:16 GMT)
SIGMA: Similarity-based Efficient Global Aggregation for Heterophilous Graph Neural Networks [12.3] グラフニューラルネットワーク(GNN)は、グラフ学習において大きな成功を収めているが、ヘテロフィリーに会うとパフォーマンス損失に悩まされる。
SIGMAは,SimRankの構造的類似度測定を統合した,効率的なグローバルヘテロ親和性GNNアグリゲーションである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:32:05 GMT)
OpenOmni: A Collaborative Open Source Tool for Building Future-Ready Multimodal Conversational Agents [11.9] Open Omniはオープンソースのエンドツーエンドパイプラインベンチマークツールである。
音声テキスト、感情検出、検索拡張生成、大規模言語モデルなどの高度な技術を統合している。
ローカルとクラウドのデプロイメントをサポートし、データのプライバシを確保し、レイテンシと精度のベンチマークをサポートする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:02:53 GMT)
SafePaint: Anti-forensic Image Inpainting with Domain Adaptation [11.6] 本稿では, SafePaint と名づけられた反法医学的イメージパインティングのためのエンドツーエンドトレーニングフレームワークを提案する。
提案手法は,他の方法では利用できない反法医学的能力を提供しながら,既存の画像インペイント手法に匹敵する結果が得られる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:04:41 GMT)
An Adaptive Second-order Method for a Class of Nonconvex Nonsmooth Composite Optimization [11.6] 本稿では,局所的なプロパティ収束の反復を$ell_p-$で行うような非スパース性プロモート正規化問題について検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:08:44 GMT)
Matrix Multiplication on Quantum Computer [11.5] 量子フーリエ変換(QFT)に基づく最適化量子加算器と乗算器を設計する。
基本普遍的量子行列乗法を構築し,それをストラッセンアルゴリズムに拡張する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:25:02 GMT)
A Survey and Evaluation of Adversarial Attacks for Object Detection [11.5] ディープラーニングモデルは、様々なコンピュータビジョンタスクにおいて優れているが、誤った予測につながる入力データの逆例-サブトル摂動の影響を受けやすい。
この脆弱性は、自動運転車、セキュリティ監視、航空機の健康監視など、安全に重要なアプリケーションに重大なリスクをもたらす。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:39:46 GMT)
Adversarial Robustness of Open-source Text Classification Models and Fine-Tuning Chains [11.4] オープンソースのAIモデルと微調整チェーンは、敵攻撃のような新たなセキュリティリスクに直面している。
本稿では,超微調整による上流-下流関係によって形成される,オープンソースのAIモデルとそのチェーンの対角的堅牢性を検討することを目的とする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:17:17 GMT)
Revisit Self-supervised Depth Estimation with Local Structure-from-Motion [11.4] 自己教師付き深度推定とSfM(Structure-from-Motion)の両方がRGBビデオからシーン深度を復元する。
本研究は,局所SfMによる代替スキームを提案する。
すでにSoTAが監督する深度と対応モデルの恩恵を受けています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:52:04 GMT)
Segment anything model 2: an application to 2D and 3D medical images [11.2] Segment Anything Model (SAM) は、様々なオブジェクトを画像にセグメント化できることから注目されている。
最近開発されたSAM 2は、この機能をビデオ入力に拡張した。
これにより、SAMを3D画像に適用する機会が開ける。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:40:07 GMT)
Dissecting the Infrastructure Used in Web-based Cryptojacking: A Measurement Perspective [11.2] 本稿では,暗号鍵処理を支援するインフラを網羅的に検討する。
これまでに暗号鍵サイトとして認識されていた887のWebサイトのデータセットをコンパイルし、分析して、観察された攻撃と悪意のあるアクティビティを分類した。
これらのサイトに関連する様々なマルウェアや違法な活動が特定され、不正なサイトによる不正な暗号通貨採掘の存在が示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:04:47 GMT)
LLMs as Probabilistic Minimally Adequate Teachers for DFA Learning [11.0] 大規模言語モデル(LLM)におけるインテリジェンス(インテリジェンス)の出現は、オートマチックラーニングへの統合に関する調査にインスピレーションを与えている。
本稿では,pMAT (probabilistic Minimally Adequate Teacher) の定式化について紹介する。
我々は,解答精度を向上し,学習したオートマタの正確性を確保する技術を開発した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:12:09 GMT)
ORBIT: Oak Ridge Base Foundation Model for Earth System Predictability [10.9] 我々はOak Ridge Base Foundation Model for Earth System Predictability (ORBIT)を紹介する。
ORBITは、その種の最大のモデルであり、現在の気候AIファンデーションモデルサイズを1000倍に超えている。
Frontierスーパーコンピュータの性能スケーリングテストでは、ORBITは684ペタFLOPSから1.6ペタFLOPSの持続スループットを達成した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:46:11 GMT)
WWW: Where, Which and Whatever Enhancing Interpretability in Multimodal Deepfake Detection [10.8] マルチモーダルディープフェイク検出のための最新のベンチマークでは、様々な生成手法を用いてフレーム全体を操作している。
これらのベンチマークは、現実世界のシナリオで提示されるフレーム単位の変更による動的ディープフェイク攻撃を検出するのに苦労している。
ビデオとオーディオの両方で操作されたセグメントを特定することを目的とした新しいクリップレベル評価ベンチマークであるFakeMixを紹介する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:44:10 GMT)
Understanding How Blind Users Handle Object Recognition Errors: Strategies and Challenges [10.6] 本稿では,視覚障害者と物体認識システムとのインタラクションの理解を目的とした,誤りの特定と回避を目的とした研究について述べる。
視覚障害者12名を対象に,視覚障害者12名を対象に調査を行った。
我々は、カメラベースの補助技術やオブジェクト認識システムにおいて、エラーを特定するためのユーザエクスペリエンス、課題、戦略に関する洞察を得た。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:09:56 GMT)
Where Do Large Language Models Fail When Generating Code? [10.5] 大規模言語モデル(LLM)はコード生成に大きな可能性を示しています。
LLMがどのようなコード生成エラーを発生させるのかは不明だ。
我々は、HumanEvalデータセット上で6つの人気のあるLCMが生成した誤りコードスニペットを分析した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:28:46 GMT)
Single-photon interference over 8.4 km urban atmosphere: towards testing quantum effect in curved spacetime with photons [10.4] 巨大空間を覆う単一光子干渉は、量子力学と一般相対性理論の界面を効果的に探究できることを示す。
量子ドットに基づく高輝度単一光子源を用いて、長距離ベースラインに沿って単一光子干渉を実演した。
この結果から,コレラ・オヴェルハウザー・ワーナー実験の単光子版による曲線時空における量子効果の検証の可能性が確認された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:50:49 GMT)
eSPARQL: Representing and Reconciling Agnostic and Atheistic Beliefs in RDF-star Knowledge Graphs [10.0] RDF-starと呼ばれるステートメントに対するステートメントを認めるRDFへの最近の拡張は、W3C標準になるように改訂されている。
これらのRDF星のステートメントのセマンティクスや、それらを操作するためのビルトイン・ファシリティの提案はない。
本稿では,eSPARQLと呼ばれる4値論理に基づくRDF-starメタデータのクエリ言語を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:34:16 GMT)
Evaluating Neural Radiance Fields (NeRFs) for 3D Plant Geometry Reconstruction in Field Conditions [9.8] 各種環境における植物の3次元再構成のための異なるニューラルレージアンスフィールド(NeRF)技術の評価を行った。
NeRFモデルは、GPUで30分トレーニングした後、74.6%のF1スコアを達成している。
我々は,平均F1スコアの7.4%の低下を達成しつつ,ほぼ半分のトレーニング時間を短縮するNeRFトレーニングの早期停止手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:39:03 GMT)
Elevating Software Trust: Unveiling and Quantifying the Risk Landscape [9.4] リスク評価フレームワークSRiQT(Software Risk Quantification through Trust)を提案する。
このフレームワークは、ソフトウェアサプライチェーンのリスクを定量化する動的でデータ駆動で適応可能なプロセスの必要性に基づいている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:50:08 GMT)
Efficient NeRF Optimization -- Not All Samples Remain Equally Hard [9.4] ニューラルレイディアンスフィールド(NeRF)の効率的なトレーニングのためのオンラインハードサンプルマイニングの応用を提案する。
NeRFモデルは、多くの3D再構成およびレンダリングタスクに対して最先端の品質を生み出すが、かなりの計算資源を必要とする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:49:01 GMT)
A Differential Smoothness-based Compact-Dynamic Graph Convolutional Network for Spatiotemporal Signal Recovery [9.4] 本稿では、時間的信号回復のためのコンパクト・フォールド・コングラフ・ネットワーク(CDCN)を提案する。
実世界のデータセットの実験では、CDCNは時間的信号回復の最先端モデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:42:53 GMT)
Enhancing AI-based Generation of Software Exploits with Contextual Information [9.3] この研究では、実際のシェルコードからなるデータセットを使用して、さまざまなシナリオでモデルを評価する。
実験は、不完全記述に対するモデルの弾力性、文脈を活用して精度を高める能力、無関係な情報を識別する能力を評価するように設計されている。
モデルは不要なコンテキストをフィルタリングし、攻撃的なセキュリティコードの生成において高いレベルの精度を維持する能力を示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:19:26 GMT)
Evaluating the Translation Performance of Large Language Models Based on Euas-20 [8.9] 我々は,翻訳タスクにおける大規模言語モデルの性能,異なる言語における翻訳能力,および研究者や開発者のLLMの翻訳能力に対する事前学習データの影響を評価する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:49:11 GMT)
An Investigation of Neuron Activation as a Unified Lens to Explain Chain-of-Thought Eliciting Arithmetic Reasoning of LLMs [8.9] 大型言語モデル (LLM) は、Chain-of-Thoughtプロンプトによって引き起こされるときに強い算術的推論能力を示す。
我々は、先行研究による観察を統一的に説明するために、レンズとしての「ニューロン活性化」について検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:53:51 GMT)
Boosting Disfluency Detection with Large Language Model as Disfluency Generator [8.8] 本稿では,拡散検出のための軽量なデータ拡張手法を提案する。
拡張データとして,大言語モデル(LLM)を用いて不自由な文を生成する。
文の質を向上させるために不確実性を考慮したデータフィルタリング手法を適用する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:41:59 GMT)
Conditioning of Banach Space Valued Gaussian Random Variables: An Approximation Approach Based on Martingales [8.8] ガウス確率変数として有意な2つのバナッハ空間の条件分布について検討する。
それらの手段と共分散は、マルティンゲールアプローチに基づく一般的な有限次元近似スキームによって決定されることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:53:09 GMT)
Research on Autonomous Driving Decision-making Strategies based Deep Reinforcement Learning [8.8] 行動決定サブシステムは、自律運転システムの重要な構成要素である。
本研究では、自律的に学習し、運転戦略を最適化する高度な強化学習モデルを採用する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:24:54 GMT)
TestART: Improving LLM-based Unit Test via Co-evolution of Automated Generation and Repair Iteration [8.7] 単体テストは個々のプログラムユニットのバグを検出するのに不可欠だが、時間と労力を消費する。
大規模言語モデル(LLM)は、顕著な推論と生成能力を示している。
本稿では,新しい単体テスト生成法であるTestARTを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:52:41 GMT)
RICA2: Rubric-Informed, Calibrated Assessment of Actions [8.6] 動作品質評価(AQA)の予測不確かさを考慮に入れた深層確率モデルRICA2を提案する。
本手法はFineDiving, MTL-AQA, JIGSAWSなどの公開ベンチマークにおいて, スコア予測と不確実性校正性能に優れた手法であることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:27:12 GMT)
Segment Anything in Medical Images and Videos: Benchmark and Deployment [8.5] まず,11種類の医用画像モダリティとビデオを対象としたSegment Anything Model 2 (SAM2) の総合的なベンチマークを行う。
そこで我々は,転写学習パイプラインを開発し,SAM2を微調整により医療領域に迅速に適用できることを実証した。
SAM2を3Dスライサプラグインとして,Gradio APIとして実装し,効率的な3D画像とビデオセグメンテーションを実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:58:18 GMT)
STAR: SocioTechnical Approach to Red Teaming Language Models [8.1] STARは、大きな言語モデルの赤いチーム安全性のための現在のベストプラクティスを改善する社会技術フレームワークである。
これは、人間のレッドチームのためにパラメータ化された命令を生成することで、ステアビリティを高め、リスク表面のカバレッジを改善する。
特定のグループに対する害を評価するために、人口統計と一致させることで信号品質を改善し、より敏感なアノテーションをもたらす。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:17:59 GMT)
EC-Guide: A Comprehensive E-Commerce Guide for Instruction Tuning and Quantization [8.0] EC-Guide hrefhttps://github.com/fzp0424/EC-Guide-KDDUP-2024は、LCMのチューニングと量子化のための総合的な電子商取引ガイドである。
私たちのソリューションはモデルに依存しないため、大規模なシステムにまたがる効果的なスケーラビリティを実現しています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:50:41 GMT)
Dual-View Pyramid Pooling in Deep Neural Networks for Improved Medical Image Classification and Confidence Calibration [8.0] 本稿では,DVPP(Dual-view pyramid pooling)と呼ばれる新しいプール方式を提案する。
DVPP は,SP と CCP 演算子の利点を十分に活用することにより,医用画像分類と信頼性校正性能の両立を目指している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:38:22 GMT)
Think-on-Graph 2.0: Deep and Interpretable Large Language Model Reasoning with Knowledge Graph-guided Retrieval [7.9] Think-on-Graph 2.0は、知識グラフと質問を一致させ、ナビゲーションツールとして使用する、拡張されたRAGフレームワークである。
KG誘導航法は、論理的整合性を維持するために深海と長距離の関連を育成する。
ToG$2.0$は、LLMの応答の精度と信頼性を改善するだけでなく、ハイブリッド構造化知識システムの可能性も示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:47:06 GMT)
High-dimensional quantum XYZ product codes for biased noise [7.7] 本稿では3次元チャモン符号の誤り訂正性能について検討し、3次元トーリック符号のCSS以外の変種と見なすことができる。
4Dホモロジー製品と比較して、4D XYZ製品は高次元またはコード距離の非CSSコードを構築することができることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:54:36 GMT)
Predictive Performance Test based on the Exhaustive Nested Cross-Validation for High-dimensional data [7.6] クロスバリデーションは、予測誤差の推定、正規化パラメータのチューニング、最も適切な予測モデルの選択など、いくつかのタスクに使用される。
K-foldクロスバリデーションは一般的なCV法であるが、その制限はリスク推定がデータの分割に大きく依存していることである。
本研究は, 完全ネスト型クロスバリデーションに基づく新たな予測性能試験と有効信頼区間を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:28:16 GMT)
Deep Clustering via Distribution Learning [7.4] 本稿では,分散学習によるクラスタリングの最適化を導く理論的解析を行う。
本稿では,クラスタリングのためのクラスタリング指向の分布学習手法であるMonte-Carlo Marginalizationを提案する。
提案したDeep Clustering via Distribution Learning (DCDL)は、一般的なデータセットの最先端の手法と比較して有望な結果が得られる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:01:47 GMT)
Sample-agnostic Adversarial Perturbation for Vision-Language Pre-training Models [7.4] AIセキュリティに関する最近の研究は、画像やテキストの微妙で意図的に設計された摂動に対するビジョンランゲージ事前学習モデルの脆弱性を強調している。
私たちの知る限りでは、どんな画像にも当てはまる普遍的でサンプルに依存しない摂動の生成を探索する、マルチモーダルな決定境界による最初の研究である。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:25:39 GMT)
Leveraging Generative AI for Urban Digital Twins: A Scoping Review on the Autonomous Generation of Urban Data, Scenarios, Designs, and 3D City Models for Smart City Advancement [7.3] 生成人工知能(AI)モデルは、データとコード生成において独自の価値を示してきた。
この調査は、一般的な生成AIモデルとその応用分野の導入と、既存の都市科学応用のレビューから始まる。
このレビューに基づいて、次世代の都市デジタル双生児に生成AIモデルを統合する可能性と技術的戦略について検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:32:39 GMT)
ColorSwap: A Color and Word Order Dataset for Multimodal Evaluation [6.9] そこで本研究では,マルチモーダルモデルの有効性を評価・改善するColorSwapデータセットを提案する。
データセットは2,000のユニークなイメージキャプチャーペアで構成されており、1000の例にまとめられている。
我々は、画像テキストマッチング(ITM)と視覚言語モデル(VLM)を評価し、最新のものでさえもまだこの課題において堅牢ではないことを発見した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:31:33 GMT)
Neural Network Emulator for Atmospheric Chemical ODE [6.8] 高速な化学濃度モデリングのためのニューラルネットワークエミュレータを提案する。
初期状態と今後の時間進化の間の隠れた相関関係を抽出するために,ChemNNEを提案する。
提案手法は,モデリング精度と計算速度において最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:30:08 GMT)
LLM-Aided Compilation for Tensor Accelerators [6.7] 我々は,大規模言語モデル(LLM)を用いてハードウェアアクセラレーター用のコンパイラを構築する方法について論じる。
具体的には,GPT-4がGemminiアクセラレータへのコード変換において高いパスレートを達成する能力を示す。
また,LLMを利用してハードウェア最適化コードを生成するための2フェーズワークフローを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:10:25 GMT)
Lisbon Computational Linguists at SemEval-2024 Task 2: Using A Mistral 7B Model and Data Augmentation [6.7] 我々はNLI4CTタスクのプロンプトを開発し、トレーニングデータセットの強化バージョンを使用してモデルの量子化バージョンを微調整する。
実験結果から,マクロF1スコアを用いて,本手法により顕著な結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:59:09 GMT)
Explaining Reinforcement Learning: A Counterfactual Shapley Values Approach [6.5] 本稿では、強化学習(RL)における説明可能性を高める新しいアプローチとして、CSV(Counterfactual Shapley Values)を提案する。
このアプローチは、異なる状態次元のコントリビューションをさまざまなアクション選択に定量化し比較することを目的としている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:32:02 GMT)
QADQN: Quantum Attention Deep Q-Network for Financial Market Prediction [6.4] 本稿では量子注意深度Q-Network(QADQN)アプローチを導入し,量子強化学習を通じてこれらの課題に対処する。
我々は、S&P500を含む主要市場指標の履歴データに基づいて、QADQNエージェントのパフォーマンスを評価する。
我々の実証結果はQADQNの優れた性能を示し、より優れたリスク調整リターンを実現した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:41:46 GMT)
Dopamin: Transformer-based Comment Classifiers through Domain Post-Training and Multi-level Layer Aggregation [6.3] 過剰なコメントは無意味で非生産的です。
本稿では,この問題を解決するためのトランスフォーマーベースのツールであるDopaminを紹介する。
本モデルは,複数の言語にまたがる共通カテゴリの知識共有を行うだけでなく,コメント分類における堅牢な性能を実現する上でも優れている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:08:43 GMT)
Intent-Based Access Control: Using LLMs to Intelligently Manage Access Control [6.3] 本稿では,Intent-Based Access Control for Databases (IBAC-DB) と呼ばれるアクセス制御の新しいパラダイムを提案する。
IBAC-DBでは、新しいフォーマットである自然言語アクセス制御マトリックス(NLACM)を使用して、アクセス制御ポリシーをより正確に表現する。
本稿では、IBAC-DBインタフェースの参照アーキテクチャ、LLM4ACと呼ばれる初期実装、およびそのようなシステムの精度を評価する初期ベンチマークについて述べる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:35:21 GMT)
VCHAR:Variance-Driven Complex Human Activity Recognition framework with Generative Representation [6.3] VCHAR(Variance-Driven Complex Human Activity Recognition)は、原子活動の出力を特定の間隔での分布として扱う新しいフレームワークである。
VCHARは、原子活動の正確な時間的・シーケンシャルなラベル付けを必要とせず、複雑な活動認識の精度を高める。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:14:01 GMT)
Phase Diagram of the Schwinger Model by Adiabatic Preparation of States on a Quantum Simulator [6.2] 我々は、状態の断熱的準備を通じて量子デバイス上の量子物理系の位相構造を研究することが可能であると主張している。
そこで我々は新しい手法を導入し、Swingerモデルに適用し、トポロジカルな$theta$-termの存在下でテストに成功した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:48:38 GMT)
AI Foundation Models in Remote Sensing: A Survey [6.0] 本稿では,リモートセンシング領域における基礎モデルの包括的調査を行う。
コンピュータビジョンおよびドメイン固有タスクにおけるそれらの応用に基づいて、これらのモデルを分類する。
これらの基盤モデルによって達成された、新しいトレンドと大きな進歩を強調します。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:39:34 GMT)
Television Discourse Decoded: Comprehensive Multimodal Analytics at Scale [6.0] 我々は、インドからのプライムタイムニュース討論番組に焦点をあてて、テレビ放送された討論を分析するという複雑な課題に取り組む。
以前は、しばしばテキストのみに頼っていたが、これらの議論のマルチモーダルな本質を捉えるには不足していた。
大規模マルチメディア分析に先進的なコンピュータビジョンと音声テキスト技術を用いた総合的自動ツールキットを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:08:12 GMT)
SETN: Stock Embedding Enhanced with Textual and Network Information [6.0] 本稿では,テキスト情報を埋め込むドメイン適応型事前学習型トランスフォーマーモデルと,ネットワーク情報を把握するためのグラフニューラルネットワークモデルを提案する。
また,提案モデルから得られたストック埋め込みは,ベースライン法から得られたものよりも,主題的資金の創出に優れることを示した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:07:37 GMT)
T-Explainer: A Model-Agnostic Explainability Framework Based on Gradients [5.9] T-ExplainerはTaylorの拡張に基づく新しい局所的な帰属説明器である。
局所的精度や一貫性などの望ましい特性があり、T-Explainerは複数の実行で安定している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:03:50 GMT)
Something from Nothing: Enhanced Laser Cooling of a Mechanical Resonator via Zero-Photon Detection [5.9] 光子の欠如の測定は、幅広い新しい実験的方向性に有意な可能性を秘めている。
反ストークス散乱光場におけるゼロ光子検出による機械共振器の冷却実験を行った。
我々の測定はマスター方程式によってよく捉えられ、ここで導入された技術は、冷却、量子熱力学、量子状態工学、量子計測と制御のための新しい道を開く。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:37:03 GMT)
Something from Nothing: A Theoretical Framework for Enhancing or Enabling Cooling of a Mechanical Resonator via the anti-Stokes or Stokes Interaction and Zero-Photon Detection [5.9] 我々は、ゼロ光子検出が反ストークス相互作用によるレーザー冷却を高めるためにどのように利用されるかを記述するための理論的枠組みを開発する。
冷却が検出効率や最適協調性などのシステムパラメータにどのように依存するかを論じる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:37:08 GMT)
BASED: Bundle-Adjusting Surgical Endoscopic Dynamic Video Reconstruction using Neural Radiance Fields [5.8] 内視鏡的映像から変形可能なシーンを再現することは,多くの応用において重要である。
我々の研究は、シーンの3D暗黙的表現を学習するために、NeRF(Neural Radiance Fields)アプローチを採用しています。
本稿では,ロボット手術の内視鏡的手術シーンについて述べる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:51:49 GMT)
Learning to Learn without Forgetting using Attention [5.7] 継続学習(きゅうがく、Continuous Learning, CL)とは、学習経験を維持しつつ、新たな知識を付加することで、時間とともに継続的に学習する能力である。
現在の機械学習手法は、以前に学んだパターンを上書きし、過去の経験を忘れやすい。
手作りの効果的な更新機構は難しいため,変圧器をベースとしたメタラーニングによるCLの強化を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:25:23 GMT)
FLASH: Federated Learning-Based LLMs for Advanced Query Processing in Social Networks through RAG [5.6] このシステムは、多様なソーシャルメディアデータソースをシームレスに集約し、キュレートするように設計されている。
GPTモデルは、プライバシとセキュリティを確保するために、分散データソースに基づいてトレーニングされている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:28:13 GMT)
Filtered Corpus Training (FiCT) Shows that Language Models can Generalize from Indirect Evidence [5.6] 本稿では,特定の言語構造をフィルタリングしてコーパス上で言語モデル(LM)を訓練するフィルタコーパストレーニングを紹介する。
本手法をLSTMとTransformer LMの両方に適用し,幅広い言語現象を対象とするフィルタコーパスを開発した。
以上の結果から,トランスフォーマーは(パープレキシティによって測定されるように)準LMよりも優れているが,両モデルとも言語一般化対策において等しく,驚くほどよく機能することがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:29:11 GMT)
SCREENER: A general framework for task-specific experiment design in quantitative MRI [5.5] SCREENERは、定量的MRIにおけるタスク固有の実験設計のための一般的なフレームワークである。
タスク固有の目的を取り入れ、深層強化学習(DRL)に基づく最適化戦略を用いて最適なプロトコルを求める。
その結果,SCREENERは,SNR条件下で,従来のアドホックおよび最適化プロトコルよりも優れていた。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:43:50 GMT)
Variance reduction techniques for stochastic proximal point algorithms [5.4] そこで本研究では,近点アルゴリズムにおける分散低減手法の統一化研究を提案する。
我々は,SVRG,SAGA,およびそれらの変種の近位バージョンを提供するために特定可能な,汎用的近位アルゴリズムを提案する。
本実験は, 勾配法よりも近似分散還元法の利点を実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:38:22 GMT)
Attacks and Defenses for Generative Diffusion Models: A Comprehensive Survey [5.3] 拡散モデル (DM) は様々な生成タスクにおいて最先端の性能を達成した。
近年の研究では、DMは幅広い攻撃を受けやすいことが示されている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:52:17 GMT)
Nighttime Pedestrian Detection Based on Fore-Background Contrast Learning [5.3] 本研究は,低照度環境下での片側片側夜間歩行者検出性能の課題に対処するものである。
チャネルアテンション機構に背景情報を組み込むことで,FBCA(Fe-Background Contrast Attention)を提案する。
実験結果から,FBCAは単一夜間歩行者検出において既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:24:47 GMT)
Highly Efficient Self-Adaptive Reward Shaping for Reinforcement Learning [5.2] Reward Shapingは、強化学習におけるスパース報酬の課題に対処する。
歴史的経験から得られた成功率を形づくりの報酬に組み込む新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:22:16 GMT)
Pre-training and in-context learning IS Bayesian inference a la De Finetti [5.1] 私たちは、デ・フィネッティのベイズ的推論に関する予測的な見解に戻ります。
デ・フィネッティは長い間、可観測物の交換可能なシーケンスをモデル化することを提唱してきた。
本稿では,不確実性が鍵となる下流タスクにおいて,交換可能な文書に対するシーケンス予測損失が性能を制御することを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:16:10 GMT)
Efficient Classical Shadow Tomography through Many-body Localization Dynamics [4.9] 我々は,多体ローカライゼーションのダイナミクスを基盤とした代替手法を提案する。
提案手法は浅部回路に匹敵する高い効率を達成できることを実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:43:38 GMT)
Capsule Network Projectors are Equivariant and Invariant Learners [4.9] 本稿では,Capsule Networks(CapsNets)を用いた不変な自己教師型アーキテクチャを提案する。
等価な自己教師型アーキテクチャにおけるCapsNetsの使用により,下流性能が向上することが実証された。
Capsule Invariant Equivariant Network(Capsule Invariant Equivariant Network)と呼ぶこのアプローチは、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:14:27 GMT)
SGSR: Structure-Guided Multi-Contrast MRI Super-Resolution via Spatio-Frequency Co-Query Attention [4.9] 高解像度MRIは一般的にスキャン時間を拡張し、モーションアーティファクトを導入する。
MRIの超高解像度化は、これらの課題を軽減するための有望なアプローチとして現れます。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:53:45 GMT)
Toward Cross-Layer Energy Optimizations in AI Systems [4.9] エネルギー効率は、人工知能の採用に歯止めをかける要因になる可能性が高い。
人工知能(AI)や機械学習(ML)ツールや技術の普及によって、そのエネルギー効率が採用への歯止め要因になりそうである。
これは、生成AI(GenAI)モデルが巨大なエネルギー豚であるからである。
推論はさらにエネルギーを消費する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:33:41 GMT)
Training LLMs to Recognize Hedges in Spontaneous Narratives [4.8] ヘッジは、話者が、非原型性または「ファジィ」をシグナルとして、発話を暫定的にマークすることを可能にする
ここでは,21人の話者が記憶から自然に生成した63のロードランナーの物語を実験的にパラメータ化したコーパスのヘッジに着目した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:51:42 GMT)
Bilateral Guided Radiance Field Processing [4.8] ニューラルラジアンス場(NeRF)は、新規なビュー合成の合成において、前例のない性能を達成する。
現代のカメラにおける画像信号処理(ISP)は、独立してそれらを強化し、再構成された放射場において「フローター」となる。
我々は、NeRFトレーニング段階におけるISPによる拡張を解消し、再構成されたラディアンスフィールドに対するユーザ希望の強化を再度適用することを提案する。
提案手法は,フロータを効果的に除去し,ユーザリタッチによる拡張を行うことにより,新規ビュー合成の視覚的品質を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:52:25 GMT)
Deep Unfolded Local Quantum Annealing [4.7] 深部展開LQAは,速度と性能の点で,元のLQAよりも優れていることを示す。
この結果は実世界のアプリケーションにとって重要な実践的意味と価値ある洞察をもたらす。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:19:51 GMT)
Scaling Laws for Data Poisoning in LLMs [4.6] 最近の研究では、LSMはデータ中毒に弱いことが示されており、部分的に破損または有害なデータで訓練されている。
我々は、悪意のある微調整、不完全なデータキュレーション、意図的なデータ汚染の3つの脅威モデルを考える。
より大きなLSMはますます脆弱になってきており、睡眠薬の行動を含む有害な行動の学習は、データ中毒を最小限に抑える小さなLSMよりもはるかに速くなっています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:14:29 GMT)
Learning-Based Optimal Control with Performance Guarantees for Unknown Systems with Latent States [4.5] 本稿では,潜在状態を持つ未知非線形系に対する最適入力軌道の計算法を提案する。
提案手法の有効性を数値シミュレーションで示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:28:57 GMT)
Mixing Individual and Collective Behaviours to Predict Out-of-Routine Mobility [4.4] 本研究では,個人と集団の移動行動を動的に統合する手法を提案する。
より高度な深層学習手法を超越して、ルーチン外モビリティを予測する上で、優れた性能を示す。
個人的行動と集団的行動のギャップを埋めることによって、我々のアプローチは透明で正確な予測を提供する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:09:10 GMT)
Multi-Agent 3D Map Reconstruction and Change Detection in Microgravity with Free-Flying Robots [4.4] 本研究は,宇宙基地のロボット保守を実現するための多エージェント協調マッピングと変更検出のためのフレームワークを提案する。
1つのエージェントは、画像のシーケンスと対応する深度情報から環境の3Dモデルを再構成するために使用される。
別のエージェントは、定期的に環境を3Dモデルに対して不整合としてスキャンするために使用される。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:35:04 GMT)
Infusing Environmental Captions for Long-Form Video Language Grounding [4.4] 長大なビデオ言語グラウンドリング(VLG)の問題に取り組む。
本稿では,マルチモーダル大規模言語モデル(MLLM)が提供するリッチなテキスト情報を利用したVLG手法であるEI-VLGを提案する。
提案手法の有効性を,EgoNLQベンチマークを用いた広範囲な実験により検証した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:04:23 GMT)
ResQuNNs:Towards Enabling Deep Learning in Quantum Convolution Neural Networks [4.3] 準進化ニューラルネットワーク(QuNN)の性能向上のための,トレーニング可能な準進化層の導入による新しいフレームワークを提案する。
この制限を克服するために、これらのレイヤ内でのトレーニングを可能にし、QuNNの柔軟性とポテンシャルを大幅に向上させました。
本稿では,Residual Quanvolutional Neural Networks (ResQuNNs)を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:30:52 GMT)
Strongest nonlocal sets with minimum cardinality in multipartite systems [4.2] 量子非局所性(quantum nonlocality)は、最近多部量子システムで発表された量子非局所性の最も強い形式である。
mathbbCd_1otimes mathbbCd_2otimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCdotimes mathbbCd
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:56:04 GMT)
Contrastive Learning for Image Complexity Representation [4.2] 教師付き学習は、よく注釈付けされたデータセットから画像の複雑さの特徴を効果的に学習することができる。
画像の複雑さを表現するために,CLICというコントラスト学習を提案する。
RCMは、多スケールの局所作物からなる正のサンプルを生成することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:44:55 GMT)
MVGT: A Multi-view Graph Transformer Based on Spatial Relations for EEG Emotion Recognition [4.2] 空間関係に基づく多視点グラフ変換器(MVGT)を提案する。
脳波チャネルの空間情報を符号化としてモデルに組み込むことにより,脳波チャネルの空間構造を知覚する能力を向上させる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:21:47 GMT)
RECE: Reduced Cross-Entropy Loss for Large-Catalogue Sequential Recommenders [4.2] 本稿では,RECE(Reduced Cross-Entropy)の損失について紹介する。
RECEは、完全なCE損失の最先端性能を享受しながら、メモリ消費を大幅に削減する。
各種データセットによる実験結果から,RECEは既存の手法に比べて最大12倍のトレーニングピークメモリ使用量を削減できることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:11:28 GMT)
SARA: Singular-Value Based Adaptive Low-Rank Adaption [4.1] パラメータ効率のよい微細チューニング(PEFT)手法としてのLoRAは、推論オーバーヘッドを加算しないために広く用いられている。
本研究ではまず,各層の性能とランクの関係をSVDを用いて解析する。
これに基づいてSARA(Singular-Value Based Adaptive Low-Rank Adaption)を設計する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:39:42 GMT)
Accuracy and Consistency of LLMs in the Registered Dietitian Exam: The Impact of Prompt Engineering and Knowledge Retrieval [4.1] 大規模言語モデル(LLMs)は、健康と幸福な領域において、人間の直面するアプリケーションを変革している。
我々は,登録栄養士試験(RD)を用いて,最先端のLDM,GPT-4o,Claude 3.5 Sonnet,Gemini 1.5 Proを評価した。
我々は,Zero-Shot (ZS), Chain of Thought (CoT), Chain of Thought with Self Consistency (CoT-SC), Retrieval Augmented Prompting (RAP) が応答の正確性と一貫性に与える影響を検討した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:21:13 GMT)
Contextual Cross-Modal Attention for Audio-Visual Deepfake Detection and Localization [3.9] デジタル時代には、ディープフェイクや合成メディアの出現は、社会的・政治的整合性に対する重大な脅威となる。
オーディオ視覚のようなマルチモーダル操作に基づくディープフェイクは、より現実的であり、より大きな脅威をもたらす。
本稿では,音声・視覚的ディープフェイク検出にコンテキスト情報を活用する,リカレントニューラルネットワーク(RNN)に基づく新しいマルチモーダルアテンションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:19:20 GMT)
Long-range optomechanical interactions in SiN membrane arrays [3.9] 膜・イン・ザ・ミドル構成を用いた光学系は、長距離の相互作用を示すことができる。
膜呼吸モードを含む長距離相互作用は、まだ実験的に実証されていない。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:38:35 GMT)
Convergence Analysis of Natural Gradient Descent for Over-parameterized Physics-Informed Neural Networks [3.7] 勾配勾配勾配(GD)や二次勾配勾配(SGD)のような一階法はニューラルネットワークのトレーニングに有効であることが証明されている。
しかし, 2層ニューラルネットワークの学習におけるGDの学習速度は, サンプルサイズとグラム行列に依存しない。
本稿では, 回帰問題である$L2$に対して, 学習率を$mathcalO(1)$から$mathcalO(1)$に改善できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:36:57 GMT)
Targeted Visual Prompting for Medical Visual Question Answering [3.6] マルチモーダル・大規模言語モデル(MLLM)は、古典的なモデルアーキテクチャの代替として登場した。
単純な視覚的誤りは、これらのモデルの実際の視覚的理解能力に疑問を投げかけた。
本稿では,MLLMに領域ベースの質問機能を持たせるための視覚的プロンプトを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:58:20 GMT)
Two-color Ytterbium MOT in a compact dual-chamber setup [3.6] 超低温イッテルビウム原子をコンパクトなデュアルチャンバーで製造するための実験計画
本稿では, 原子集合配列の各ステージに最適化されたパラメータを報告し, 高い転送効率を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:22:17 GMT)
Accelerating Multilingual Language Model for Excessively Tokenized Languages [3.6] 大型言語モデル(LLM)のトークン化子は、文字やUnicodeレベルのトークンを非ローマ語アルファベットの言語で断片化することが多い。
このような言語でテキスト生成を高速化する,シンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:23:30 GMT)
Feature Clock: High-Dimensional Effects in Two-Dimensional Plots [3.5] Feature Clockは、これらのkプロットを検査することなく、2次元で表現されたデータ構造に対する元の特徴の影響を把握するための新しいアプローチを提供する。
組み込みデータの視覚化の可視性とコンパクト性を高め、オープンソースのPythonライブラリで利用できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:24:07 GMT)
AmbigNLG: Addressing Task Ambiguity in Instruction for NLG [3.5] 本稿では,自然言語生成(NLG)タスクにおけるタスク曖昧性の課題に対処するための新しいタスクであるAmbigNLGを紹介する。
提案手法は,テキスト生成の質を著しく向上させ,明快かつ具体的命令の重要な役割を強調した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:42:22 GMT)
Postselected communication over quantum channels [3.5] 本稿では,受信者が追加で不確定な測定結果を許容する通信シナリオについて考察する。
我々は,絡み合い支援の設定において,選択された能力の正確なシングルレター特性を提供する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:36:41 GMT)
RayGauss: Volumetric Gaussian-Based Ray Casting for Photorealistic Novel View Synthesis [3.4] 微分レンダリング法は、新しいビュー合成に大きな進歩をもたらした。
不規則分布ガウスの異なる光線鋳造のための放射放射率cと密度シグマを一貫した定式化を行う。
適切なトレーニング時間を維持しつつ、Blenderデータセット上で25FPSの推論速度を達成しながら、最先端のレンダリングよりも優れた品質を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:59:58 GMT)
Don't Think It Twice: Exploit Shift Invariance for Efficient Online Streaming Inference of CNNs [3.3] 本稿では,オンラインストリーミング推論のための畳み込みニューラルネットワークの展開戦略であるStreamiNNCを紹介する。
ストリーミング推論の精度に対するゼロパディングとプールの悪影響について検討する。
シミュレーションデータと実世界の3つのバイオメディカル信号処理アプリケーションを用いて本手法の有効性を検証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:36:29 GMT)
Tripartite quantum entanglement with squeezed optomechanics [3.2] 本稿では,ハイブリッド光学系における量子エンタングルメントのコヒーレントな操作と拡張を実現する方法を提案する。
このシステムの利点は、(i)OPAを介して圧縮されたキャビティモードを導入することにより、光ミラー間相互作用を効果的に制御でき、(ii)圧縮されたキャビティモードと注入された圧縮された真空貯留層とのスクイーズパラメータを適切にマッチングした場合、光入力ノイズを完全に抑制できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:05:08 GMT)
Quantum Computation of Electronic Structure with Projector Augmented-Wave Method and Plane Wave Basis Set [3.1] 本稿では,エネルギーの量子計算のための平面波を用いたPAWの実装について述べる。
ダイヤモンド中の窒素空孔欠陥中心のエネルギー推定のための量子資源を提供する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:56:10 GMT)
Uncertainty relations from state polynomial optimization [3.1] 非可換次元オブザーバブルの分散における加法的不確実性関係に対する半定値プログラミング階層を開発する。
階層構造は、厳密な不確実性関係に収束するという意味で完備である。
この手法は、パウリ、ハイゼンベルク=ワイル、フェルミオン作用素を含む様々なシナリオに適用できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:24:54 GMT)
Self-Supervised Learning for Multi-Channel Neural Transducer [3.0] 本稿では,wav2vec 2.0 フレームワークに基づくマルチチャネルエンドツーエンド ASR モデルの自己教師型学習手法について検討する。
我々は,遠距離フィールド内データセットの事前学習を行わないモデルと比較して,文字誤り率を66%削減した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:12:31 GMT)
Intermediate direct preference optimization [3.0] 大規模言語モデル(LLM)を微調整するための補助的損失として,選択した中間層におけるDPO損失を計算するための中間的直接選好最適化(DPO)手法を提案する。
ウルトラフィードバックデータセットを用いた実験では, 中間DPOモデルの性能をGPT-4を用いて評価した。
その結果、32層SFTモデルの22層で算出した中間DPO損失を用いてトレーニングした中間DPOモデルは、従来のDPOモデルとSFTモデルとでそれぞれ52.5%と67.5%の勝利率を達成した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:16:09 GMT)
Krylov complexity of thermal state in early universe [3.0] 我々は、初期の宇宙全体にわたる熱状態のクリロフ複雑性の詳細な研究を行う。
クリロフの複雑性を正確に計算するために, 2つのモードを持つ純状態となる熱状態の浄化を行った。
以上の結果から, インフレは強い放散系として振る舞う一方で, 放射線支配と物質支配の期間は弱い放散系として振る舞うことが明らかとなった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:41:54 GMT)
CCVA-FL: Cross-Client Variations Adaptive Federated Learning for Medical Imaging [3.0] Federated Learning(FL)は、分散データ上でモデルをトレーニングするためのプライバシ保護アプローチを提供する。
Cross-Client Variations Adaptive Federated Learning (CCVA-FL)は、イメージを共通の特徴空間に変換することで、クロスクライアントのバリエーションを最小限にすることを目的としている。
その結果、CCVA-FLはプライバシーを損なうことなく、クライアント間でのデータ分散の違いを効果的に解決することで、Vanilla Federated Averagingよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:10:56 GMT)
MarQSim: Reconciling Determinism and Randomness in Compiler Optimization for Quantum Simulation [2.8] 既存のアプローチは、決定論的およびランダム化されたコンパイルの調整に不足している。
本稿では,新しいコンパイルフレームワークであるMarQSimを紹介する。
我々はアルゴリズムの効率と正しさの基準を厳格に証明する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:10:54 GMT)
Adversarial Safety-Critical Scenario Generation using Naturalistic Human Driving Priors [2.8] 本研究では,自然主義的人間運転先行と強化学習技術を用いた自然逆シナリオ生成ソリューションを提案する。
本研究は,本モデルにより,自然性と逆性の両方をカバーする現実的な安全クリティカルなテストシナリオを生成できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:58:56 GMT)
Fact Finder -- Enhancing Domain Expertise of Large Language Models by Incorporating Knowledge Graphs [2.7] ドメイン固有知識グラフ(KG)を用いた大規模言語モデルを拡張したハイブリッドシステムを導入する。
我々は,69個のサンプルを収集し,正しいKGノードの検索精度を78%向上した。
以上の結果から,ハイブリッドシステムは単独のLCMを超える精度と完全性を示した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:45:05 GMT)
MicroXercise: A Micro-Level Comparative and Explainable System for Remote Physical Therapy [2.7] MicroXerciseは、マイクロモーション分析とウェアラブルセンサーを統合している。
セラピストや患者に、ビデオ、テキスト、スコアなどの総合的なフィードバックインターフェースを提供する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:39:47 GMT)
A Novel Knapsack-based Financial Portfolio Optimization using Quantum Approximate Optimization Algorithm [2.7] 本稿では,量子ウォークミキサーの量子計算能力と量子近似最適化アルゴリズム(QAOA)を用いて,NPハード問題による課題に対処する手法を提案する。
p>=3の回路層を用いたポートフォリオ最適化手法の近似比を,古典的なknapsack問題の解法と比較した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:24:31 GMT)
Autoverse: An Evolvable Game Language for Learning Robust Embodied Agents [2.6] シングルプレイヤ2Dグリッドベースのゲームのための,進化可能なドメイン固有言語であるAutoverseを紹介する。
オープンエンデッドラーニング(OEL)アルゴリズムのスケーラブルなトレーニンググラウンドとしての利用を実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:39:14 GMT)
Future-Proofing Mobile Networks: A Digital Twin Approach to Multi-Signal Management [2.5] デジタルツイン(DT)は、将来の無線ネットワークにおいて重要な技術となることが期待されている。
我々のフレームワークは多様なデータソースを統合し、ネットワーク性能に関するリアルタイムで総合的な洞察を提供する。
従来の分析は、Generative AI(GenAI)のような新しいAIモデルに依存するように進化する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:25:16 GMT)
Transit Rider Heat Stress in Atlanta, GA under Current and Future Climate Scenarios [2.5] この研究は、異なる人口集団にわたるトランスポート利用者に極端な温度が与える影響のレベルを理解することを目的としている。
現在の気象条件下では、車を所有しないアトランタのトランジットライダーやアフリカ系アメリカ人のトランジットライダーは、極端な暑さに不当に影響を受けている。
発見は、都市交通ネットワークにおいて、熱緩和と適応戦略を実装する緊急の必要性を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:37:38 GMT)
On Poles and Zeros of Linear Quantum Systems [2.5] 量子力学の非可換性は、系の力学に基本的な制約を課す。
本稿では,線形量子系の零点とポーズについて検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:19:18 GMT)
An Analysis of Automated Use Case Component Extraction from Scenarios using ChatGPT [2.4] 大規模言語モデル(LLM)を用いたユーザ認可シナリオからユースケースコンポーネントを抽出する手法を提案する。
以上の結果から,LLMはUC成分を抽出するために追加のドメイン知識を必要とすることが明らかとなり,この知識を組み込むことで抽出したUC成分の品質が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:43:30 GMT)
Entanglement-enhanced learning of quantum processes at scale [2.2] 補助雑音量子メモリとの絡み合いと誤り軽減が量子過程の学習を著しく促進することを示す。
本研究は,補助雑音量子メモリとの絡み合いと誤り軽減が,量子過程の学習を著しく促進することを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:00:20 GMT)
Identifying treatment response subgroups in observational time-to-event data [2.2] 本研究は、観察研究における治療応答サブグループを特定するための、新しい結果誘導手法を提案する。
本手法では,各患者を2つの時間-時間分布に関連するサブグループ,すなわち治療中のサブグループとコントロール中のサブグループに割り当てる。
実験では, ランダム化処理と観察処理の両方において, 結果誘導サブグループ分析の最先端手法を著しく上回る結果を得た。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:38:14 GMT)
Segmenting Small Stroke Lesions with Novel Labeling Strategies [2.1] 深部神経回路は脳卒中病変のセグメンテーションにおいて異常な有効性を示した。
脳卒中診断に重要な小病変は依然として課題である。
小病変のセグメンテーション精度を高めるための2つの強力なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:23:42 GMT)
UnifiedNN: Efficient Neural Network Training on the Cloud [2.1] UnifiedNNは複数のNNモデルを"組み合わせ"し、複数のNNモデルを同時にトレーニングするためのメモリと時間保存機構を備えている。
その結果,UnifiedNNは,最先端フレームワークと比較してメモリ消費を最大52%削減し,トレーニング時間を最大41%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:10:34 GMT)
L3iTC at the FinLLM Challenge Task: Quantization for Financial Text Classification & Summarization [2.1] FinLLM Challenge Task 2024は、タスク1、ファイナンシャルテキスト分類、タスク2、ファイナンシャルテキスト要約の2つの重要な領域に焦点を当てた。
各タスクのパフォーマンスを最適化するために,複数の大規模言語モデル (LLM) を微調整した。
我々のモデルはF1スコア0.7543の財務分類タスクで3位を獲得し、公式試験データセットの財務要約タスクで6位を確保した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:25:49 GMT)
Developing Safe and Responsible Large Language Model : Can We Balance Bias Reduction and Language Understanding in Large Language Models? [2.1] 本研究では,大規模言語モデルが知識や理解を犠牲にすることなく,安全でバイアスのないアウトプットを生成できるかどうかを考察する。
セーフかつレスポンシブルな大規模言語モデル (textbfSR$_textLLM$) を導入する。
textbfSR$_textLLM$は知識の整合性を維持しながらバイアスを効果的に低減する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:18:16 GMT)
Convergence of Batch Asynchronous Stochastic Approximation With Applications to Reinforcement Learning [2.1] Reinforcement Learning (RL)のいくつかのアプリケーションでは、textitonlyの$theta_t$の1つのコンポーネントは、各$t$で更新される。
本稿では、 textbfBlock Asynchronous SA (BASA) について検討し、各ステップ $t$, textitsome で $theta_t$ のすべてのコンポーネントが更新される必要はない。
BASA の収束に十分な条件を提供し、$theta_t$ to の収束のテキスト化を証明します。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:19:46 GMT)
Evaluation of Segment Anything Model 2: The Role of SAM2 in the Underwater Environment [2.1] Segment Anything Model(SAM)とその拡張は、海洋科学における様々な水中可視化タスクに応用するために試みられている。
近年,Segment Anything Model 2 (SAM2) が開発され,実行速度とセグメンテーション精度が大幅に向上した。
本報告は, 海洋科学におけるSAM2の可能性について, UIIS と USIS10K をベンチマークした水中インスタンスセグメンテーションデータセットを用いて検討することを目的とする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:20:10 GMT)
Automatic Generation of Conversational Interfaces for Tabular Data Analysis [2.0] タブラルデータは、構造化されたデータをオンラインで公開し、交換する最も一般的なフォーマットである。
本稿では,公共行政機関が公開するデータソースを活用するための対話インタフェースを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:14:04 GMT)
DyFFPAD: Dynamic Fusion of Convolutional and Handcrafted Features for Fingerprint Presentation Attack Detection [2.0] ユーザの指紋を同意の有無にかかわらず偽造することにより、提示攻撃を行うことができる。
本稿では,プレゼンテーションアタックを検出するために,深層CNNと手作り特徴の動的アンサンブルを提案する。
提案したプレゼンテーション攻撃検出モデルは,個々の性能よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:25:29 GMT)
Kolmogorov-Arnold PointNet: Deep learning for prediction of fluid fields on irregular geometries [1.9] 不規則領域における非圧縮性定常流体場予測のための新しい教師付きディープラーニングフレームワークを提案する。
KA-PointNetでは、PointNetアーキテクチャのセグメンテーションブランチに共有KANを実装した。
我々は、共有kan(KA-PointNet)とPointNetのパフォーマンスを共有Multilayer Perceptrons(MLPs)と比較する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:28:16 GMT)
Probing structural constraints of negation in Pretrained Language Models [1.9] 文中の否定の存在を最もよくエンコードする文脈表現を,プローブを用いて識別する。
否定範囲内のトークンの文脈表現は、(i)スコープ外のトークンと比較して、存在を予測しやすくする。
しかし、さらなる制御実験により、同じ構文節内でトークンの文脈表現を使用する場合、他の語彙項目の存在もよりよく捉えられることが明らかになった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:54:49 GMT)
IPAdapter-Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts [1.9] IPAdapter-Instructは、自然画像の条件付けとInstruct'のプロンプトを組み合わせることで、同じ条件付け画像の解釈を切り替える。
タスクごとの専用モデルと比較して、品質の損失を最小限に抑えた複数のタスクを効率的に学習する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:08:22 GMT)
Huge Ensembles Part I: Design of Ensemble Weather Forecasts using Spherical Fourier Neural Operators [1.9] 機械学習を使って、巨大な天気のアンサンブルのヒンドキャストを生成します。
第1部:球状フーリエニューラル演算子(SFNO)に基づくアンサンブル天気予報システムの構築
パートII: MLの極端な天気予報は信頼性と差別性を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:04:25 GMT)
Topic Modeling with Fine-tuning LLMs and Bag of Sentences [1.9] FT-Topicはトピックモデリングのための教師なしの微調整手法である。
SenCluは1つのトピックに対する文群の高速な推測とハードな割り当てを実現する、最先端のトピックモデリング手法である。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:04:07 GMT)
When a Relation Tells More Than a Concept: Exploring and Evaluating Classifier Decisions with CoReX [1.8] 入力画素の関連性に基づく畳み込みニューラルネットワーク(CNN)の解説は、どの入力特徴がモデル決定にどのように影響するかを評価するには、あまり特異ではないかもしれない。
本研究では,概念と関係に基づく説明器(CoReX)を用いたCNNモデルの説明と評価を行う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:54:26 GMT)
Towards Next-Generation Urban Decision Support Systems through AI-Powered Construction of Scientific Ontology using Large Language Models -- A Case in Optimizing Intermodal Freight Transportation [1.6] 本研究では,事前学習された大規模言語モデル(LLM)を活用する可能性について検討する。
推論コアとしてChatGPT APIを採用することで、自然言語処理、メソノロジーベースのプロンプトチューニング、トランスフォーマーを含む統合ワークフローを概説する。
我々の方法論の成果は、広く採用されているオントロジー言語(OWL、RDF、SPARQLなど)の知識グラフである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:03:04 GMT)
OpenECAD: An Efficient Visual Language Model for Editable 3D-CAD Design [1.5] OpenECADモデル(0.55B, 0.89B, 2.4B, 3.1B)を作成するための事前学習モデルの微調整を行った。
OpenECADモデルは、入力として3Dデザインの画像を処理することができ、高度に構造化された2Dスケッチと3D構築コマンドを生成する。
これらの出力は、プロジェクトファイルを生成するために既存のCADツールのAPIで直接使用することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:27:55 GMT)
ENet-21: An Optimized light CNN Structure for Lane Detection [1.5] 本研究では,車線検出問題に対する最適構造について検討する。
現代の車両の運転支援機能には有望なソリューションを提供する。
TuSimpleデータセットの実験は提案手法の有効性を支持する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:14:43 GMT)
Synaptic Modulation using Interspike Intervals Increases Energy Efficiency of Spiking Neural Networks [1.4] 我々は、Interspike Intervals (ISI) によって重みを変調した新しいシナプスモデルを提案する。
IMSNNの学習アルゴリズムは、この情報を利用して勾配を選択的に伝播する。
MNISTおよびFashionMNISTデータセットを用いて,高密度・畳み込み層を有するIMSNNの性能を分類精度およびスパイク数の観点から評価した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:15:57 GMT)
Hedge Fund Portfolio Construction Using PolyModel Theory and iTransformer [1.4] ヘッジファンドポートフォリオ構築のためのPolyModel理論を実装した。
我々は,長期アルファ,長期比,SVaRなどの定量的尺度を作成する。
また、最新のディープラーニング技術(iTransformer)を使って、上昇傾向を捉えています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:55:58 GMT)
Iterative CT Reconstruction via Latent Variable Optimization of Shallow Diffusion Models [1.4] 拡散確率モデルと反復的CT再構成を組み合わせた新しいCT再構成法を提案する。
1/10ビュー投影データのスパースCT再構成により,提案手法の有効性を実証する。
提案手法はCTだけでなく,MRI,PET,SPECTなどの他の画像モダリティにも広く応用できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:55:17 GMT)
A TVD neural network closure and application to turbulent combustion [1.4] トレーニングニューラルネットワーク(NN)は、支配方程式を閉じるための魅力的な特徴を持っているが、それらは物理的な現実から逸脱することができる。
NNの定式化は、溶液の有界性や陽性性に反する刺激発振を防止するために導入される。
離散化方程式に機械学習のクロージャとして組み込まれ、厳格に制約されている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:22:13 GMT)
Dilated Convolution with Learnable Spacings makes visual models more aligned with humans: a Grad-CAM study [1.4] DCLSは、いくつかのコンピュータビジョンベンチマークにおいて標準および拡張畳み込みよりも優れていることが示されている。
さらに、DCLSは人間の視覚的戦略との整合性として定義されるモデルの解釈可能性を高めていることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:05:32 GMT)
LLM Stability: A detailed analysis with some surprises [1.3] 評価されたLSMは、生の出力レベルでは、まれに決定論的である。
パースされた出力/アンサーレベルでは決定論的だが、同じデータ入力を持つ5回の再実行で100%安定することはめったにない。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:43:35 GMT)
Shape Constraints in Symbolic Regression using Penalized Least Squares [1.3] 記号回帰(SR)のパラメータ識別段階における形状制約(SC)の追加とその考慮について検討する。
SCは、他の未知のモデル関数の形状に関する事前知識をSRに導入する手段として機能する。
SRでSCを探索した以前の研究とは異なり、勾配に基づく数値最適化を用いてパラメータ識別時にSC違反を最小限に抑えることを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:45:42 GMT)
Communication-Aware Consistent Edge Selection for Mobile Users and Autonomous Vehicles [1.2] 時間に敏感で計算集約的なタスクをオフロードすることで、サービスの効率が向上する。
本稿では,Deep Deterministic Policy Gradient (DDPG)アルゴリズムに基づく深層強化学習フレームワークを提案する。
計算負荷, サービス遅延, 割り込みを最小限に抑えるために, APの通信と切替の同時割り当て方式を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:21:53 GMT)
COVID-19 Detection Based on Blood Test Parameters using Various Artificial Intelligence Methods [1.2] 2019年には、新型コロナウイルスによる新型コロナウイルス感染症SARS-CoV-2(SARS-CoV-2)という新たな課題に直面した。
本研究は、自己分類分類器を用いて、さまざまなAI手法を用いて、新型コロナウイルス患者と他者とを区別することを目的とした。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:16:43 GMT)
Unveiling Intrinsic Many-Body Complexity by Compressing Single-Body Triviality [1.2] 総軌道相関は波動関数の内在的な複雑さを実際に明らかにし、定量化する。
軌道を最適化するための反復的なスキームが提案されている。
最適化された軌道により、限られたTCCSDアンサッツはより非自明な情報をキャプチャすることができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:29:46 GMT)
Flexible Type-Based Resource Estimation in Quantum Circuit Description Languages [1.2] 入力プログラムが生成する回路の大きさの上限を導出するクイッパー言語のための型システムを提案する。
この大きさは、幅、深さ、ゲート数など様々な測定値に基づいて測定できるが、ワイヤの種類やゲートの種類のみを考慮しても測定できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:49:25 GMT)
Post-Mortem Human Iris Segmentation Analysis with Deep Learning [1.1] 本稿では,被検者から収集した虹彩画像の分割を目的としたDeep Learning(DL)モデルを提示し,比較する。
提案手法は, 死後の試料に固有の変形を効果的に学習し, 同定する。
我々の知る限り, 本研究は, 死後虹彩分節に対するDLモデルの最も広範囲な評価を提供するものである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:00:02 GMT)
Robustness Assessment of a Runway Object Classifier for Safe Aircraft Taxiing [1.1] ディープニューラルネットワーク(DNN)は多くの計算問題の顕著な解決策になりつつある。
本稿では,航空機のタクシー走行時に使用する画像分類器DNNのロバスト性を実証する。
我々は、このDNNの頑健さを、ノイズ、明るさ、コントラストという3つの一般的なイメージ摂動タイプに評価するために、フォーマルな手法を用いています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:36:06 GMT)
COMMENTATOR: A Code-mixed Multilingual Text Annotation Framework [1.1] コード混在型テキストアノテーションフレームワークであるCOMMENTATORを導入する。
このツールは、Hinglishテキストのトークンレベルおよび文レベル言語アノテーションタスクにおいて、その効果を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:56:26 GMT)
Equivariance and partial observations in Koopman operator theory for partial differential equations [1.1] システム力学の対称性はクープマン作用素に受け継がれることを示す。
我々は、完全な状態を測定することができない非常に関連性の高いケースに対処する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:09:47 GMT)
LOGIC-LM++: Multi-Step Refinement for Symbolic Formulations [1.0] 本稿では Logic-LM++ を改良した Logic-LM++ を提案する。
LLMの機能をペアで比較し、LLMが提案する改善点の評価を可能にする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:39:02 GMT)
Fusing Forces: Deep-Human-Guided Refinement of Segmentation Masks [1.0] エトルリアの鏡はエトルリアの芸術において重要なカテゴリーであり、裏面に描かれた精巧な図形が特徴である。
人間の指示に基づいて既存のアノテーションをインタラクティブに洗練するよう訓練されたディープニューラルネットワークを提案する。
提案手法は有効性を大幅に改善し,エトルリアミラー以外の広い範囲のアプリケーションに転送可能である。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:11:40 GMT)
Conditioning LLMs with Emotion in Neural Machine Translation [1.0] 本稿では,音声感情認識(SER)モデルから抽出した感情情報をLarge Language Models(LLM)に統合するパイプラインを提案する。
実験の結果,情動情報,特に覚醒情報の統合は,翻訳品質の顕著な改善につながることが明らかとなった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:49:33 GMT)
Biomedical Image Segmentation: A Systematic Literature Review of Deep Learning Based Object Detection Methods [1.0] 深層学習に基づく物体検出法は、バイオメディカルイメージセグメンテーションに一般的に用いられている。
既存の調査では、標準化されたアプローチやより広範なセグメンテーション技術に重点を置いていないことが多い。
これらの手法を批判的に分析し,課題を特定し,今後の方向性について考察した。
このSLRは、研究コミュニティにこれらのセグメンテーションモデルについて素早く深く理解することを目的としています。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:38:55 GMT)
Enhanced Local Explainability and Trust Scores with Random Forest Proximities [0.9] 我々は任意のランダム森林回帰モデルと分類モデルを適応重み付きK近傍モデルとして数学的に定式化できるという事実を利用する。
この線形性は、トレーニングセットの観測における任意のモデル予測に対する属性を生成するRF予測の局所的な説明可能性を促進する。
本稿では, モデル予測だけでなく, サンプル外性能を説明するために, SHAPと組み合わせて, この近接性に基づく説明可能性のアプローチをいかに活用できるかを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:45:44 GMT)
Body of Her: A Preliminary Study on End-to-End Humanoid Agent [0.9] 本稿では,現実的なエージェントの動作をモデル化可能な,リアルタイムで複雑な対話型エンド・ツー・エンド・ネットワークを提案する。
この研究は、この分野でエンド・ツー・エンドのアプローチを予備的な調査を行い、スケールアップに向けたさらなる研究を刺激することを目的としている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:13:09 GMT)
Advancing EEG-Based Gaze Prediction Using Depthwise Separable Convolution and Enhanced Pre-Processing [0.8] 本稿では,脳深度分離可能な畳み込みニューラルネットワーク(CNN)と視覚変換器を組み合わせたEEG-DCViT(Deeper Clustered Vision Transformer)を提案する。
この新しいアプローチは優れたパフォーマンスを示し、51.6mmのRoot Mean Square Error(RMSE)で新しいベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:43:03 GMT)
Stability-Informed Initialization of Neural Ordinary Differential Equations [0.8] 統合手法の選択が学習モデルを暗黙的に正規化する方法と,学習者の安定領域がトレーニングや予測性能にどのように影響するかを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:47:24 GMT)
Deep-learning Assisted Detection and Quantification of (oo)cysts of Giardia and Cryptosporidium on Smartphone Microscopy Images [0.8] 我々は,GiardiaとCryptosporidiumの(o)嚢胞を検出する4つの最先端物体検出器の性能を評価した。
深層学習モデルは、その有効性と限界を探求するために用いられた。
以上の結果から, 深層学習モデルでは, 明視野顕微鏡画像データセットの方が精度がよいが, スマートフォンの顕微鏡による予測は, 非専門家の予測性能に匹敵することがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:09:59 GMT)
Integrating HCI Datasets in Project-Based Machine Learning Courses: A College-Level Review and Case Study [0.7] 本研究では,HCI(Human-Computer Interface)データセットを用いた実世界の機械学習プロジェクトの統合について検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:05:15 GMT)
VizECGNet: Visual ECG Image Network for Cardiovascular Diseases Classification with Multi-Modal Training and Knowledge Distillation [0.7] 実際には、ECGデータはデジタル化された信号または印刷された画像として格納される。
本稿では,複数の心血管疾患の予後を決定するために,心電図のみを用いたVizECGNetを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:34:43 GMT)
Training Compute Thresholds: Features and Functions in AI Regulation [0.7] 米国とEUのレギュレータは、トレーニング計算に基づくしきい値を使用して、大規模社会被害のリスクを引き起こす可能性のあるGPAIモデルを特定している。
現在、トレーニング計算は、規制の監視とさらなる精査に値するGPAIモデルを特定するのに最も適した指標である、と我々は主張する。
GPAI技術と市場構造が進化するにつれて、規制当局は計算しきい値を更新し、他のメトリクスを規制審査プロセスに補完する必要がある。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:33:20 GMT)
Explicit quantum surrogates for quantum kernel models [0.7] 暗黙的モデルの明示的量子サロゲート(EQS)を作成するための量子古典ハイブリッドアルゴリズムを提案する。
これには、暗黙のモデルから観測可能なものを対角化し、対応する量子回路を構築することが含まれる。
EQSフレームワークは予測コストを削減し、不毛の高原問題を軽減し、両方のQMLアプローチの長所を組み合わせる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 07:15:45 GMT)
Deep Reinforcement Learning with Enhanced PPO for Safe Mobile Robot Navigation [0.7] 本研究では,複雑な環境下での自律走行のための移動ロボットの訓練における深層強化学習の適用について検討する。
このロボットは、LiDARセンサデータとディープニューラルネットワークを用いて、障害物を回避しつつ、特定の目標に向かって誘導する制御信号を生成する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:26:31 GMT)
A Study on Quantum Graph Neural Networks Applied to Molecular Physics [0.5] 本稿では,従来の文献とは大きく異なる量子グラフニューラルネットワークのアーキテクチャを提案する。
提案手法は, 従来のモデルと類似した結果をもたらすが, パラメータが少なかったため, 問題の基礎となる物理に根ざした極めて解釈可能なアーキテクチャがもたらされる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:06:48 GMT)
GP-VLS: A general-purpose vision language model for surgery [0.5] GP-VLSは手術のための汎用視覚言語モデルである。
医学的および外科的知識と視覚的シーン理解を統合している。
GP-VLSは,手術用視覚言語タスクにおいて,オープンソースモデルやクローズドソースモデルよりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:07:17 GMT)
Convergence Conditions for Stochastic Line Search Based Optimization of Over-parametrized Models [0.5] 有限サム適合オーバーパラミライズされたモデルの解法をアルゴリズムで処理する。
特に、PLetrized line search に基づくアプローチに焦点をあて、一般的な探索方向を用いる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:58:37 GMT)
Multivariable QSP and Bosonic Quantum Simulation using Iterated Quantum Signal Processing [0.5] 我々は、繰り返し量子信号処理と呼ぶモジュラ量子信号処理の形式を提供する。
この方法は、他の量子信号処理ステップの出力に量子信号処理を適用する。
量子シミュレーションに関係のある位相関数を構築するためにこれらのアイデアをどのように利用できるかについて議論する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:27:43 GMT)
Spacecraft inertial parameters estimation using time series clustering and reinforcement learning [0.5] 本稿では,その操作中に変化した場合に,宇宙船の慣性パラメータを推定する機械学習手法を提案する。
提案手法の性能は, マルチサテライト配置システムの場合に対して評価され, アルゴリズムはそのような操作において, 一般的な障害に対する耐性を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:53:02 GMT)
SCOPE: A Synthetic Multi-Modal Dataset for Collective Perception Including Physical-Correct Weather Conditions [0.5] SCOPEは、現実的なカメラとLiDARモデル、パラメータ化および物理的に正確な気象シミュレーションを組み込んだ最初の合成マルチモーダルデータセットである。
データセットには、40以上のシナリオから17,600フレームが含まれており、最大24の協調エージェント、インフラセンサー、自転車や歩行者を含む受動的トラフィックが含まれている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:35:50 GMT)
Malicious Internet Entity Detection Using Local Graph Inference [0.5] 大規模ネットワークにおける悪意ある行動の検出は、コンピュータセキュリティにおける機械学習にとって難しい問題である。
現在のサイバーセクト対応アプローチはまだ表現力に制限があるが、他の領域で成功した手法は大量のデータに対してうまくスケールしない。
本研究では,ネットワークエンティティ間の相互作用を異種グラフとしてモデル化するグラフデータから学習する新たな視点を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:35:25 GMT)
Measurement-Based Long-Range Entangling Gates in Constant Depth [0.5] 中間回路計測とフィードフォワード演算を用いて,量子サブルーチンの深さを一定深さにする方法を示す。
実量子ハードウェア上で測定ベースの量子ファンアウトゲートと長距離CNOTゲートを実装することで実現可能性を検証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:35:42 GMT)
Investigation of Purcell enhancement of quantum dots emitting in the telecom O-band with an open fiber-cavity [0.5] 光マイクロキャビティに統合された単一光子エミッタは、量子通信アプリケーションにおいて重要な要素である。
通信Oバンドに放出される半導体量子ドット(QD)について検討し,オープンファイバキャビティに集積する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:00:49 GMT)
Leveraging Parameter Efficient Training Methods for Low Resource Text Classification: A Case Study in Marathi [0.4] Indic low-resource language Marathi のPEFT法について検討する。
これらのアプローチは、MahaSent、MahaHate、MahaNewsといった著名なテキスト分類データセットに基づいて評価される。
これらの手法は完全微調整と競合し,精度を損なうことなく使用できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:16:16 GMT)
Quantum Imaging Using Spatially Entangled Photon Pairs from a Nonlinear Metasurface [0.4] サブ波長の厚さを持つ 準曲面は 最近 エンタングルド光子対の 強化と 調整が可能な生成のための 汎用プラットフォームとして確立されました
ここでは、赤外波長における量子イメージングのための非線形準曲面のユニークな利点と実用可能性を示す。
我々は,信号経路内の1次元検出器アレイとバケット検出器のみを用いて2次元物体の像を再構成し,ポンプ波長における光子偶然の依存関係を記録する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:25:34 GMT)
Hide and Seek: Fingerprinting Large Language Models with Evolutionary Learning [0.4] 本稿では,Large Language Model (LLM) モデルの指紋認証のための新しいブラックボックス手法を提案する。
モデルの正しいファミリーを特定する際には, 72%の精度が得られた。
この研究は、LLMの振る舞いを理解するための新しい道を開き、モデル帰属、セキュリティ、そしてAI透明性の幅広い分野に重大な影響を与える。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:13:10 GMT)
RHiOTS: A Framework for Evaluating Hierarchical Time Series Forecasting Algorithms [0.4] RHiOTSは、階層的な時系列予測モデルとアルゴリズムを実世界のデータセット上で堅牢性を評価するように設計されている。
RHiOTSは、複雑な多次元ロバストネス評価結果を直感的で容易に解釈可能なビジュアルに変換する革新的な可視化コンポーネントを組み込んでいる。
従来の統計的手法は、変換効果が非常に破壊的である場合を除き、最先端のディープラーニングアルゴリズムよりも頑健であることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:52:15 GMT)
Sequential Conditional Transport on Probabilistic Graphs for Interpretable Counterfactual Fairness [0.4] 我々は、個別の公正性について議論するために、シーケンシャルトランスポート(Sequence transport)と呼ばれる反事実的アプローチを用いる。
合成データと実データの両方を用いた数値実験により,その応用を実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:02:57 GMT)
EEGMobile: Enhancing Speed and Accuracy in EEG-Based Gaze Prediction with Advanced Mobile Architectures [0.4] 本研究では,脳波の回帰タスクにおいて,事前学習したMobileViTと知識蒸留(KD)を併用したモデルを提案する。
その結果,EEGEyeNet Absolute Position Task の以前の State-Of-The-Art (SOTA) に匹敵するレベル(3%以下)で動作可能であることが示された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:02:27 GMT)
Modulated time evolution for efficient variational ground-state preparation [0.4] 時間進化中にハミルトンエネルギーを変調するスケーリング因子を導入し、非スケールのハミルトンエネルギーの変動原理で制御する。
最適化された時間進化は、局所的な断熱時間進化に類似しており、さらにスケールの急激な変調がある。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:18:45 GMT)
Static IR Drop Prediction with Attention U-Net and Saliency-Based Explainability [0.3] 高速かつ高精度な画像ベース静的IRドロップ予測を実現するために,注目ゲートを備えたU-Netニューラルネットワークモデルを提案する。
PDNの抵抗エッジの小さな部分のアップサイズを模倣することにより、高IRドロップピクセルを平均18%削減できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:41:33 GMT)
Probabilistic Scores of Classifiers, Calibration is not Enough [0.3] 二項分類タスクでは、確率的予測の正確な表現が実世界の様々な応用に不可欠である。
本研究では,予測スコアと真の確率分布の一致を優先するアプローチを強調した。
その結果,従来の校正基準の限界が明らかとなり,重要な意思決定のための予測モデルの信頼性を損なう可能性が示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:53:00 GMT)
Mitigating Text Toxicity with Counterfactual Generation [0.3] 毒性の軽減は、有害な意味を取り除くためにテキストを言い換えることである。
現在のメソッドは、最初の非有毒な意味を保ちながら、テキストをデトックスすることができない。
この研究は、カウンターファクト生成とテキストのデトックス化のギャップを埋める最初のものである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:41:25 GMT)
Effects of retardation on many-body superradiance in chiral waveguide QED [0.3] 我々は、キラル導波路に結合した原子鎖の超ラジカル崩壊を研究する。
集団崩壊と遅延の競合により、有効数の原子が出現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:27:25 GMT)
Training-Free Condition Video Diffusion Models for single frame Spatial-Semantic Echocardiogram Synthesis [0.2] 条件付きビデオ拡散モデル(CDM)はビデオ合成に有望な結果を示した。
本稿では,1つの終端セグメントマップからリアルな心エコー画像を生成するFree-Echoという新しい手法を提案する。
我々のモデルでは,入力セグメンテーションマップに空間的に整合したプラウシブル心エコー図を作成でき,トレーニングベースのCDMに匹敵する性能を達成できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:31:34 GMT)
ClassiFIM: An Unsupervised Method To Detect Phase Transitions [0.1] ClassiFIMは、FIM推定タスクを解決するために設計された新しい機械学習手法である。
古典的および量子的位相遷移を記述するデータセットを含む,複数のデータセットにClassiFIMを実装した。
また,本手法の汎用性を強調するため,MNIST-CNNデータセットの提案と生成を行う。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:58:29 GMT)
Comparison analysis between standard polysomnographic data and in-ear-EEG signals: A preliminary study [0.1] ポリソムノグラフィー(PSG)は、現在睡眠障害評価の指標となっている。
有望な競合製品の一つが、ear-EEGセンサーだ。
本研究の目的は,単一チャネル内EEGと標準PSGの類似性を評価する手法を確立することである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:39:33 GMT)
Shortcuts to adiabaticity in harmonic traps: a quantum-classical analog [0.1] 本稿では,量子システムを初期状態から最終定常状態へ効率的に遷移させる新しい手法を提案する。
我々のアプローチは、古典的ブラウン過程として量子系を表すネルソンの量子化を利用する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:33:58 GMT)
Pathology Foundation Models [0.0] 深層学習技術の発達は、病理AI(Artificial Intelligence)の広範な研究と発展に繋がった
Foundation Models (FM)として知られる大規模なAIモデルが登場し、医療分野のアプリケーション範囲を拡大した。
FMは従来のAIよりも正確で幅広いタスクに適用できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:42:42 GMT)
Working with Color: How Color Quantization Can Aid Researchers of Problematic Information [0.0] 我々は、問題のある情報キャンペーンから大量の画像を分析するために、幾何学的コンピュータグラフィックスと視覚手法を採用することに目を向ける。
我々は,アメリカ・メキシコ国境におけるオンラインヘイト画像の分析に向けたカラー量子化の実装について,有効事例を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:00:48 GMT)
When does the mean network capture the topology of a sample of networks? [0.0] この研究は、ブロックモデルのサンプルFr'echet平均の分析的推定を初めて提供するため、重要なものである。
本研究では,ハミング距離で計算した平均ネットワークが,トレーニングサンプル中のネットワークのトポロジを捕捉できないことを示す。
実践的な観点から、我々の研究は、サンプルFr'echet平均ネットワークを用いてネットワーク評価機械学習のためのネットワークのトポロジを特徴づけるコンテキストにおけるメトリクスの選択を通知する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:14:54 GMT)
Wave Interpolation Neural Operator: Interpolated Prediction of Electric Fields Across Untrained Wavelengths [0.0] Wave Interpolation Neural Operator (WINO) は、ブロードバンド波長の連続スペクトルにおけるシミュレーション条件を実現する新しいサロゲートソルバである。
本モデルでは,従来の有限差分周波数領域シミュレーションの約100倍の性能を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 06:00:17 GMT)
Towards an Analysis of Discourse and Interactional Pragmatic Reasoning Capabilities of Large Language Models [0.0] 本稿では,語学の分野の範囲について論じるとともに,対話語学と対話語学のサブディビジョンを提案する。
結果の異種現象と手法の集合を,LLMの文脈における談話実用学と相互作用実用学の研究の出発点とみなす。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:02:05 GMT)
The role of conjugacy in the dynamics of time of arrival operators [0.0] 時間核方程式(TKE)を、特定の分離性条件を満たす特別な種類のポテンシャルに対して正確に解析する。
この解により、共役保存TOA作用素の固有関数の時間的進化を調べることができる。
CPTOA演算子はワイル量子化演算子よりもスムーズでよりシャープなユニタリダイナミクスを数値的精度で有することがわかった。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 00:26:48 GMT)
The noisy Landau-Streater(Werner-Holevo) channel in arbitrary dimensions [0.0] Landau-Streater と Werner-Holevo の量子チャネルは3次元でのみ関係している。
任意の次元において、このチャネルはユニタリ演算の点で分解可能であることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:08:18 GMT)
The Use of Large Language Models (LLM) for Cyber Threat Intelligence (CTI) in Cybercrime Forums [0.0] 大規模言語モデル(LLM)は、サイバー犯罪フォーラムからサイバー脅威インテリジェンス(CTI)データを分析するために使用することができる。
本研究では,OpenAI GPT-3.5-turboモデルを用いてCTI情報を抽出するLLMシステムの精度を評価する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:15:25 GMT)
The Traveling Mailman: Topological Optimization Methods for User-Centric Redistricting [0.0] 本研究では,US Postal Service ネットワークを用いた地域間接続性評価手法を提案する。
我々は、地域境界がコミュニティの整合性に与える影響を評価するために、トポロジカルデータ分析とマルコフ・チェイン・モンテカルロ法を組み合わせる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:45:50 GMT)
The Role of Bases in Quantum Optimal Control [0.0] 量子最適制御(QOC)は、パルスレベルで問題に取り組むことで量子技術の進歩を支援する。
応用基底の選択が最適化の品質に影響を及ぼすかどうかを問うため、基底関数の観点から異なるパラメトリを考察する。
問題依存に基づく基本選択はQOC効率に影響を及ぼす要因であり、そのアプローチに対するアドバイスを提供すると結論付けている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:15:05 GMT)
The AI-Native Software Development Lifecycle: A Theoretical and Practical New Methodology [0.0] このホワイトペーパーは、完全にAIネイティブなSDLCの出現を提案する。
本稿では,AIを終端から終端まで組み込んだ従来のV-モデルの適応であるV-バウンスモデルを紹介する。
このモデルは、AIが実装エンジンとして機能するバリデータや検証者に至るまで、主要な実装者から人間の役割を再定義する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:30:49 GMT)
SuperSimpleNet: Unifying Unsupervised and Supervised Learning for Fast and Reliable Surface Defect Detection [0.0] SuperSimpleNetはSimpleNetから進化した革新的な差別モデルである。
これは前任者のトレーニング一貫性、推論時間、検出性能を大幅に向上させる。
SuperSimpleNetは、教師なし設定と教師なし設定の両方で最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:37:47 GMT)
State convertibility under genuinely incoherent operations [0.0] 状態変換性は、量子コヒーレンス(英語版)の資源理論の研究において基本的なものである。
本稿では,真に不整合な動作下での状態変換性の完全な評価について述べる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:28:53 GMT)
Squeezing equivalence of quantum harmonic oscillators under different frequency modulations [0.0] 周波数変調の形式を制御することに関心があるが、$r_f$ と $tau$ の値の選択を自由にしておくと、一般にこれらの値を見つけるために数値計算を要求する。
一方、これらの周波数の形式を以前に制御することに関心がない場合、むしろ$r_f$ と $tau$ とすると、これらの周波数に対して解析的な解が得られる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:59:12 GMT)
Spin entanglement in two-proton emission from $^6$Be [0.0] 本稿では,2陽子(2p$)放射性発光における結合スピン絡みの理論的評価について述べる。
時間依存計算を行い、放出された2つの陽子の結合スピン状態を算出する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:22:23 GMT)
Slowly generated anomalously large nuclear field in bulk n-AlGaAs [0.0] Al$_x$Ga$_1-x$Asバルク試料を用いた電子核スピンカップリング系のダイナミクスの研究
核四重極相互作用による低速核スピン拡散は、核場の形成過程を促進する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:50:42 GMT)
Robustness of electron charge shuttling: Architectures, pulses, charge defects and noise thresholds [0.0] 単純なSi/SiO2デバイスに対する様々な「コンベヤベルト」シャットリングシナリオを数値シミュレーションした。
本研究の結果から,コンベヤベルトシャットリングは半導体量子デバイスにおける接続性に優れた候補である,という結論が得られた。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:39:48 GMT)
Revealing the Berry phase under the tunneling barrier [0.0] 量子力学において、量子ウェーブパケットは、それが進化するにつれて幾何学的な位相を取得することができる。
凝縮物質系では、ベリー相は基本的な現象において重要な役割を果たす。
凝縮物質系における強磁場光物質相互作用による複雑な値のベリー相を観測する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:18:04 GMT)
Relevance of Anisotropy in the Kondo Effect -- Lessons From the Symplectic Case [0.0] シンプレクティック対称性を持つ近藤模型は, 超伝導アイランドデバイスの有効低エネルギー理論として最近提案された。
鉛とのカップリングにおける非対称性が非フェルミ液体を不安定化することを示す。
結果は、近藤結合における異方性は常に無関係であるという共通の誤解を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:35:49 GMT)
Quantum simulation of entanglement dynamics in a quantum processor [0.0] 我々は、エンタングルメントダイナミクスを研究するために、IBM量子プロセッサに5量子ビットプロトコルを実装した。
突然の死亡と,異なる初期状態に対する絡み合いの突然の生着を観察する。
この研究は、量子情報の基本的な概念をテストするために、現在のノイズ量子デバイスの有用性を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 20:16:17 GMT)
Quantum energy teleportation in phase space quantum mechanics [0.0] 量子力学の位相空間定式化における量子エネルギーテレポーテーションプロトコルについて検討する。
伝送されたエネルギーは、初期基底状態に存在する絡み合いの量に比例することを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:31:29 GMT)
Quantum Simulations of Chemistry in First Quantization with any Basis Set [0.0] 分子や物質のエネルギーの量子計算は、フォールトトレラント量子コンピュータの最も有望な応用の1つである。
それまでの研究は、主に第2量子化におけるシステムのハミルトニアンを表している。
本稿では,任意の基底集合を用いたフォールトトレラント量子コンピュータ上での第一量子化における一般基底状態化学問題の解法を提案する。
これにより、現代の量子化学基底集合を用いた活性空間での計算が可能となる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:40:32 GMT)
Probabilistic Surrogate Model for Accelerating the Design of Electric Vehicle Battery Enclosures for Crash Performance [0.0] 本稿では,事故性能に着目した電気自動車用バッテリケースの高速化設計のための確率的サロゲートモデルを提案する。
このモデルは、様々な材料およびプロセスパラメータのサーモフォーミングとクラッシュシミュレーションから生成されたデータを用いて訓練された。
新しいシミュレーションデータに対する検証では、全ての出力変数に対して平均絶対パーセンテージ誤差8.08%でモデルの予測精度を実証した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 21:03:16 GMT)
Privacy-Preserving Logistic Regression Training with A Faster Gradient Variant [0.0] 我々は、プライバシー保護ロジスティック回帰トレーニングのために、$textttquadratic gradient$と呼ばれるより高速な勾配変種を提案する。
実験により,拡張された手法は収束速度において最先端の性能を有することが示された。
一般的な数値最適化問題に対する他の一階勾配法を強化するために、$textttquadratic gradient$が使える可能性は期待できる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:34:27 GMT)
Preservation of Feature Stability in Machine Learning Under Data Uncertainty for Decision Support in Critical Domains [0.0] 人間の活動における決定は、しばしば重要な領域であっても不完全なデータに依存する。
本稿では,従来の機械学習手法を用いた一連の実験を行うことで,このギャップに対処する。
ML記述法は,データの不完全性が増大するにつれて特徴選択の安定性を確保しつつ,高い分類精度を維持する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 11:29:06 GMT)
Optomechanics of optically-levitated particles: A tutorial and perspective [0.0] 光は個々のイオンと原子の自由度に対する量子制御の冷却と実証に使われてきた。
放射圧によって物体が吊り下げられ、その環境から大きく切り離された光浮上は、近年、豊富な研究分野として確立されている。
この記事では、フィールドにおけるいくつかの現在の活動について、関連するキーコンセプトとメソッドを説明するチュートリアルとともに調査する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:56:31 GMT)
Optimally generating $\mathfrak{su}(2^N)$ using Pauli strings [0.0] 我々は、$mathfraksu (2N)$を生成する最小のそのような集合が、2N+1$要素を含むことを示す。
また,任意のパウリ回転に対応する回転列を生成するアルゴリズムも提供する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:42:01 GMT)
Optimality and Noise-Resilience of Critical Quantum Sensing [0.0] 臨界量子センシングと受動量子戦略を比較して周波数推定を行う。
ユニタリの場合、どちらの戦略も光子数と精度2次スケーリングを達成するが、散逸の存在下では、これは批判的戦略にのみ当てはまる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:38:44 GMT)
Non-reciprocal dynamics and the non-Hermitian skin effect of repulsively bound pairs [0.0] 本稿では,Bose-Hubbardモデルとエンジニアリング環境との結合について検討する。
単一粒子と二重粒子は反対の方向で拡散できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:21:22 GMT)
Narrowband-IoT (NB-IoT) and IoT Use Cases in Universities, Campuses, and Educational Institutions: A Research Analysis [0.0] この研究は、高等教育におけるIoT採用のメリットについて調査している。
本研究は,NB-IoT技術が教育機関の様々な側面を強化する大きな可能性を秘めていることを結論付けている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:55:20 GMT)
Microwave driven singlet-triplet qubits enabled by site-dependent g-tensors [0.0] 量子プロセッサのワークホースとして、ホールスピン量子ビットが出現している。
スピン軌道相互作用はデバイスにおける非均一性を引き起こし、局所的に異なる量子エネルギーをもたらす。
二重量子ドットにおける2つのスピンの異方性を制御する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:36:32 GMT)
Maximal Volume Matrix Cross Approximation for Image Compression and Least Squares Solution [0.0] 最大体積サブマトリクスに基づく古典行列クロス近似について検討する。
改良された定数による古典的不等式推定の新しい証明を示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:41:52 GMT)
Logistic Regression makes small LLMs strong and explainable "tens-of-shot" classifiers [0.0] 大規模な商用モデルではなく,小規模でローカルな生成言語モデルを使用することのメリットを,ユーザが享受できることが示される。
プライバシ、可用性、コスト、説明可能性といったこれらのアドバンテージは、商用アプリケーションにおいても、AIの広範な民主化においても重要です。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:23:42 GMT)
Local ergotropy and its fluctuations across a dissipative quantum phase transition [0.0] 局所エルゴトロピーに着目した2ビットオープンなRabiモデルについて検討する。
2ビットシステムの充電、保存、放電のためのプロトコルを定義する。
本研究では, 相転移がエルゴトロピーに及ぼす影響について検討し, 潜在マーカーの同定を行った。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:31:40 GMT)
Left of Fab: Securing Design and Collaboration in the Semiconductor Value Chain [0.0] 本稿では,IC設計のワークフローとプリント回路基板のワークフローを比較した。
脅威の定義とセキュリティの必要性は、半導体製造への米国の投資と、AIアプリケーションに影響を与える市場の両方によって増幅されている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:48:25 GMT)
LLMs are Not Just Next Token Predictors [0.0] LLMは、次のトークン予測目標を持つ勾配降下による言語学習の統計モデルである。
LLMは次のトークン予測を用いて設計され、このタスクの成功に基づいてトレーニングされていますが、次のトークン予測器への還元はLLMを短く販売する、というのが私たちの見解です。
これを引き出すため、遺伝子の観点から進化と発達を説明する生物学におけるかつての著名な研究プログラムと類似する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:36:28 GMT)
Joint Image De-noising and Enhancement for Satellite-Based SAR [0.0] 合成開口レーダ(SAR)データから再構成した画像は、乗算ノイズと低コントラストレベルに悩まされる。
本稿では,これらの欠点を同時に扱う手法を提案する。
実際、ノイズ除去とコントラスト強化のプロセスを統一されたアルゴリズムに組み合わせる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:44:16 GMT)
Interoperability and Explicable AI-based Zero-Day Attacks Detection Process in Smart Community [0.0] 本稿では,6Gモバイル通信,インターネット・オブ・エコノミクス(IoE),人工知能(AI),スマートコントラクトを組み込んだWPA3プロトコルベースのWiFi-8が連携して,既知の攻撃ベクトルを防止し,ゼロデイ攻撃に対する保護を実現する方法について説明する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:11:36 GMT)
Inhomogeneous adiabatic preparation of a quantum critical ground state in two dimensions [0.0] 当初、パラメータは格子の中心で臨界となる。
1Dおよび2D量子イジングモデルでは、臨界点における音速が明確に定義された場合、ランプは亜音速で断熱する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:13:14 GMT)
Inference Optimizations for Large Language Models: Effects, Challenges, and Practical Considerations [0.0] 大規模な言語モデルは自然言語処理においてユビキタスである。
本稿では,資源要件の低減と大規模言語モデルの圧縮に関する諸技術について概説する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:07:32 GMT)
Hybrid quantum-classical computation for automatic guided vehicles scheduling [0.0] 自動誘導車両をスケジューリングするビジネス中心の問題に対処するために、最先端ハイブリッド(必ずしも量子ではない)解決器の有効性を実証する。
我々は、量子処理ユニットから潜在的に補助を受ける古典的手法を実装するD-Waveハイブリッドソルバを利用する。
デッドロックの可能性を秘めた最大21AGVのシナリオを,ハイブリッドソルバで数秒で効率的に処理できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:41:27 GMT)
Hong-Ou-Mandel Comb and Switch using parallel chains of non-identical Micro-Ring Resonators [0.0] マイクロリング共振器(MRR)は,様々な可変パラメータの組み合わせでHong-Ou-Mandel(HOM)効果にアクセスできる。
我々は、香港・ウー・マンデル多様体(HOMM)の変化のために、非同一のMRRパラメータを調整する方法について議論する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 17:22:59 GMT)
Gibbs Sampling gives Quantum Advantage at Constant Temperatures with $O(1)$-Local Hamiltonians [0.0] 古典ギブス状態は量子コンピュータを用いて効率的に生成可能であることを示す。
特に、3次元格子上でハミルトニアンに対してもサンプリングの硬さが維持されることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 03:35:20 GMT)
General quantum-classical dynamics as measurement based feedback [0.0] このノートは、一般的なハイブリッド量子-古典力学の微分方程式と偏微分方程式を連続測定理論と一般(非マルコフ)フィードバックから導いたものである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:13:53 GMT)
Fake News Detection via Wisdom of Synthetic & Representative Crowds [0.0] ソーシャルメディア企業は「フェイクニュース」の民主的合法的な定義を提供するのに苦労してきた
本稿では,X 上での「合成・代表的群集の知恵」を介して偽ニュースを検出する,新しいエンドツーエンド手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:54:41 GMT)
FAKER: Full-body Anonymization with Human Keypoint Extraction for Real-time Video Deidentification [0.0] 本稿では,ビデオ中の個人をリアルタイムに完全匿名化するために,はるかに小さなモデルを用いた新しいアプローチを提案する。
ポーズ推定アルゴリズムを利用することで、個人の位置、動き、姿勢に関する情報を正確に表現する。
このアルゴリズムは、様々な産業環境にインストールされたCCTVやIPカメラシステムにシームレスに統合することができる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 04:59:23 GMT)
Enhancing Tree Type Detection in Forest Fire Risk Assessment: Multi-Stage Approach and Color Encoding with Forest Fire Risk Evaluation Framework for UAV Imagery [0.0] 森林火災は世界中の生態系、経済、人間の健康に重大な脅威をもたらす。
高度なコンピュータビジョンアルゴリズムを備えた無人航空機は森林火災の検出と評価に有望な解決策を提供する。
UAVと多段階物体検出アルゴリズムを用いた統合森林火災リスク評価フレームワークを最適化する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:36:04 GMT)
Enhanced sensing of Stark weak field under the influence of Aubry-Andr{é}-Harper criticality [0.0] 局在化-非局在化遷移は、パラメータ推定における量子増強感度を達成するためのリソースとして利用することができる。
局所化-非局在化遷移ポテンシャルの異なるクラスを利用することで、パラメータ推定の精度を大幅に向上できることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:45:56 GMT)
Enabling Intelligent Traffic Systems: A Deep Learning Method for Accurate Arabic License Plate Recognition [0.0] 本稿では,エジプト自動車ナンバープレート認識(EVLPR)のための新しい2段階フレームワークを提案する。
第1段では、画像処理技術を用いてライセンスプレートを確実にローカライズし、第2段では、アラビア文字認識のためのカスタム設計のディープラーニングモデルを使用する。
提案システムは,既存手法を超越した多種多様なデータセットにおいて,99.3%の精度を実現する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:27:54 GMT)
Effect of Kernel Size on CNN-Vision-Transformer-Based Gaze Prediction Using Electroencephalography Data [0.0] EEGベースの視線予測は、従来のビデオベースの視線追跡の代替となる新しい研究トピックである。
従来のSOTA法と比較して,脳波による視線予測の根平均2乗誤差を53.06mmに改善した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 23:34:49 GMT)
Edge states in all-dielectric square-lattice arrays of bianisotropic microwave resonators [0.0] 両異方性共振器の逆方向を持つ2つの領域間の界面におけるエッジ状態の存在を数値解析および実験的に実証する。
検討された設計は、異なる共振器領域または共振器領域と自由空間の間の界面にエッジ状態を含む光学構造とマイクロ波構造を同時に構築する新たな可能性を開く。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:56:34 GMT)
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers [0.0] 本稿では,視覚変換器のための分散親和性・外乱性を考慮したポストトレーニング量子化手法を提案する。
DopQ-ViTは、現在の量子化器の非効率性を分析し、TanQと呼ばれる分布に優しいタン量子化器を導入する。
DopQ-ViTは広範な検証を行っており、量子化モデルの大幅な性能向上を実証している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 16:40:04 GMT)
Dirac and Weyl Fermions -- the Only Causal Systems [0.0] 因果系は、特殊相対性理論と初等因果原理に従う相対論的量子系のローカライズ可能性を記述する。
因果系が因果論理の表現を誘導し、したがって空間的な超平面よりも適切な時空領域に局所化を与えるかどうかという問題に取り組む。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:45:02 GMT)
Detecting Quantum and Classical Phase Transitions via Unsupervised Machine Learning of the Fisher Information Metric [0.0] そこで我々はClassiFIMと呼ばれる教師なし機械学習(ML)手法を開発した。
クラスiFIMは、トポロジカル(例えばXXZ鎖)と動的(例えば、ハバードモデルにおける金属絶縁体遷移)の両方を確実に検出する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 19:34:04 GMT)
Demonstrating anyonic non-Abelian statistics with a minimal $d = 6$ qudit lattice [0.0] 我々は、$d=6$ qudits の格子を$mathbfD(mathbfS_3)$非アベリア随伴体とみなす。
本稿では, ブレイディングおよび融合進化の非可換性を示す手法を提案する。
この研究は、非アベリア量子誤り訂正符号の実現に向けた基本的なステップである。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:00:59 GMT)
Defect groups of class $\mathcal{S}$ theories from the Coulomb branch [0.0] クラス $mathcalS[A_N-1]$ 4d $mathcalN = 2$理論をクーロン分岐データからそれらの欠陥群を導出することにより研究する。
欠陥群が$(mathbbZ_N)2g$であり、$g$が対応する曲面の種数であることを示すために、完全正則句読点の場合、BPS quiver を明示的に構成する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 12:26:48 GMT)
Data-Driven Stochastic Closure Modeling via Conditional Diffusion Model and Neural Operator [0.0] クロージャモデルは、乱流や地球系のような複雑なマルチスケール力学系をシミュレートするのに広く用いられている。
明確なスケールを持たないシステムでは、一般化決定論的および局所閉包モデルは十分な能力に欠けることが多い。
ニューラル演算子と非局所クロージャモデルを構築するためのデータ駆動モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 05:21:31 GMT)
Cosmic muon flux attenuation methods for superconducting qubit experiments [0.0] 超伝導量子ビットを含む実験と互換性のある宇宙ムーンフラックスを減衰させる2つの実用的な緩和法を提案し,実証する。
特別に構築された宇宙ムーン検出器を用いて、都市環境に広く存在する地下地を同定し、宇宙ムーンフラックスの大きな減衰を達成できる。
地上実験室では2つのゲルマニウムウェハを用い,それぞれに粒子センサを装着し,天空に対するチップの配向が基板上に堆積したエネルギー量と種類にどのように影響するかを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:57:03 GMT)
Continuous-variable quantum kernel method on a programmable photonic quantum processor [0.0] CV量子カーネル法は,実験上の不完全条件下であっても,複数のデータセットを頑健に分類できることを実験的に証明した。
このデモンストレーションは、QMLのためのCV量子システムの実用性に光を当て、他のCVQMLアルゴリズムにおけるさらなる研究を刺激する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 01:22:13 GMT)
Characteristics and Implementation of B$^α$ Gates [0.0] B$alpha$ゲートの2つの応用により生成される2量子ゲートの条件を提供する。
イオントラップシステムにB$alpha$ゲートを実装する実験手法を提案する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 18:49:49 GMT)
CardioGenAI: A Machine Learning-Based Framework for Re-Engineering Drugs for Reduced hERG Liability [0.0] CardioGenAIは、HERG活性を減少させるために、開発用および市販用両方の薬物を再設計するための機械学習ベースのフレームワークである。
FDAが承認した抗精神病薬であるピモジドに完全な枠組みを適用し,100種類の精製候補を作成した。
本手法は,hERG関連の安全性上の懸念から停止した医薬品開発プログラムを救済する手段として,hERGの障害を示す化合物に効果的に適用できると考えられる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 22:37:21 GMT)
Boson sampling with ultracold atoms in a programmable optical lattice [0.0] 偏光合成光学格子における超低温原子を用いたボソンサンプリング装置の実装手法を提案する。
4モード干渉計における2つのボソニック原子の香港-奥羽-マンデル干渉を明らかにすることにより,そのような機械の基本構成ブロックを実験的に実証した。
以上の結果から, 現在最高のスーパーコンピュータである$N gtrsim 40$に対して, 量子的優位性が得られる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:01:55 GMT)
BodySLAM: A Generalized Monocular Visual SLAM Framework for Surgical Applications [0.0] 本研究では,最先端モデルと新たに開発されたモデルを組み合わせた,堅牢なディープラーニングベースのSLAM手法を提案する。
SLAM法は内視鏡手術の精度と効率を向上させる可能性を秘めている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:13:57 GMT)
Benchmarking Variational Quantum Algorithms for Combinatorial Optimization in Practice [0.0] 変分量子アルゴリズム、特に変分量子固有解器の変種は最適化(CO)問題に対処するために提案されている。
ベンチマークとしてMax-Cutを用いてCO問題を解く上で,このスケーリング結果がどのような意味を持つのかを数値的に検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:57:34 GMT)
Automation of Quantum Dot Measurement Analysis via Explainable Machine Learning [0.0] 本研究では,合成三角形の数学的モデリングによる画像ベクトル化手法を提案する。
本手法は,精度を犠牲にすることなく,モデル予測の優れた説明性を提供することを示す。
この研究は、量子ドット計測の分析に説明可能な機械学習技術を適用する可能性と利点を実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:32:36 GMT)
Automated Explanation Selection for Scientific Discovery [0.0] 本稿では,機械学習と自動推論を組み合わせた科学的発見のサイクルを提案する。
本稿では,社会学と認知科学の知見に基づく説明選択問題の分類について述べる。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:52:18 GMT)
Artificial Intelligence for Literature Reviews: Opportunities and Challenges [0.0] この写本は、システム文献レビューにおける人工知能の使用に関する包括的なレビューを提示する。
SLRは、あるトピックに関する以前の研究を評価し、統合する厳格で組織化された方法論である。
従来の23の機能と11のAI機能を組み合わせたフレームワークを用いて、主要なSLRツール21について検討する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 15:40:04 GMT)
Analyzing Polysemy Evolution Using Semantic Cells [0.0] 本研究は, セマンティック・セルの進化的帰結として, ポリーセミー(polysemy)という言葉が現れることを示唆する。
特に、Chat GPTを用いて収集された単語Springの4つの感覚のそれぞれに対して、ある順序で1000文の文列を解析すると、単語が最も多節単調に取得されることを示す。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:37:51 GMT)
Analysis of Partially-Calibrated Sparse Subarrays for Direction Finding with Extended Degrees of Freedom [0.0] 本稿では,部分キャリブレーションされたスパースサブアレイのシナリオに対して,一般カレー多重信号分類(GCA-MUSIC) DOA推定アルゴリズムを提案する。
提案したGAA-MUSICアルゴリズムは,各サブアレイの差分コアレイを利用し,次いで特定の擬似スペクトルマージ規則を用いる。
数値シミュレーションにより,提案したGCA-MUSICは類似の手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 14:48:34 GMT)
Analysis of Argument Structure Constructions in a Deep Recurrent Language Model [0.0] 本稿では,再帰型ニューラルネットワークモデルにおけるArgument Structure Constructions(ASC)の表現と処理について検討する。
その結果, 文表現は, 全層にまたがる4つのASCに対応する異なるクラスタを形成することがわかった。
これは、脳に拘束された比較的単純なリカレントニューラルネットワークでさえ、様々な構成タイプを効果的に区別できることを示している。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 09:27:41 GMT)
Analysis for satellite-based high-dimensional extended B92 and high-dimensional BB84 quantum key distribution [0.0] HD-Ext-B92(HD-Ext-B92)および高次元BB84(HD-BB84)プロトコルを解析した。
高次元では、HD-BB84は、キーレートとノイズ耐性の両方でHD-Ext-B92を上回っている。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 13:57:17 GMT)
Adversarial Domain Adaptation for Cross-user Activity Recognition Using Diffusion-based Noise-centred Learning [0.0] HAR(Human Activity Recognition)は、人間とコンピュータの相互作用や医療モニタリングなど、様々な用途において重要な役割を担っている。
本稿では,拡散に基づく雑音中心型適応型適応(Diff-Noise-Adv-DA)という新しいフレームワークを提案する。
生成拡散モデリングと逆学習技術を活用することで,これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 08:55:49 GMT)
A generalization of the Choi isomorphism with application to open quantum systems [0.0] 1976年のGorini, Kossakowski and Sudarshan (GKS) の論文は、既にさらなる一般化の鍵を握っている。
一般開量子系の時間発展のGKS行列を時間的に2階まで計算する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 10:33:00 GMT)
A Metric Driven Approach to Mixed Precision Training [0.0] 数値の選択を支援するための計量駆動手法を同定する。
このような方法論が言語表現モデルのスケールトレーニングにどのように役立つかを実証する。
論文参考訳(メタデータ) (Tue, 6 Aug 2024 02:06:04 GMT)