Fact :Teaching MLLMs with Faithful, Concise and Transferable Rationales [102.5] MLLMの教えに忠実で簡潔で伝達しやすい多モーダル論理を生成するために設計された新しいパラダイムであるFactを紹介する。
プログラミングパラダイムからエンドツーエンドパラダイムに転送可能な合理性をフィルタリングして、転送可能性を保証する。
また,画像とテキストの相関性が高いため,幻覚の低減も図っている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:39:06 GMT)
What Do Language Models Learn in Context? The Structured Task Hypothesis [89.7] 大規模言語モデル(LLM)は、インコンテキスト学習(ICL)と呼ばれるデモで提示されたインコンテキストの例から新しいタスクを学習する
一般的な仮説の一つは、タスク選択によるICLの説明である。
もう一つの一般的な仮説は、ICLはメタ学習の一形態である、すなわち、モデルが事前学習時に学習アルゴリズムを学習し、それを実演に適用する、というものである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:08:02 GMT)
SocialBench: Sociality Evaluation of Role-Playing Conversational Agents [85.7] 大規模言語モデル(LLM)は、様々なAI対話エージェントの開発を進めてきた。
SocialBenchは、ロールプレイングの会話エージェントの社会的性を個人レベルとグループレベルで評価するために設計された最初のベンチマークである。
個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:32:40 GMT)
Revisiting Class-Incremental Learning with Pre-Trained Models: Generalizability and Adaptivity are All You Need [84.4] クラスインクリメンタルラーニング(Class-incremental Learning, CIL)は、古いクラスを忘れずに新しいクラスに適応することを目的としている。
近年の事前訓練は大きな進歩を遂げており、CILには膨大な事前訓練モデル(PTM)が利用できるようになった。
CILの中核となる要素は、モデル更新の適応性と知識伝達の一般化性である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:34:43 GMT)
Group Multi-View Transformer for 3D Shape Analysis with Spatial Encoding [81.2] 近年,ビューベース3次元形状認識手法の結果は飽和しており,メモリ制限デバイスに優れた性能を持つモデルは展開できない。
本稿では,本分野の知識蒸留に基づく圧縮手法を提案し,モデル性能を極力保ちながらパラメータ数を大幅に削減する。
具体的には、小型モデルの能力を高めるため、GMViT(Group Multi-view Vision Transformer)と呼ばれる高性能な大型モデルを設計する。
GMViTは、ベンチマークデータセットであるModelNet、ShapeNetCore55、MCBにおいて、優れた3D分類と検索結果を得る。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:51:21 GMT)
AIR-Bench 2024: A Safety Benchmark Based on Risk Categories from Regulations and Policies [80.9] AIR-Bench 2024は、新しい政府の規制や企業のポリシーに適合する最初のAI安全ベンチマークである。
8つの政府規制と16の企業政策を4階層の安全分類に分解し、最も低い階層に粒度の細かいリスクカテゴリを分類する。
AIR-Bench 2024上での言語モデルの評価を行い,その安全性に関する知見を明らかにした。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:12:27 GMT)
On the consistent reasoning paradox of intelligence and optimal trust in AI: The power of 'I don't know' [79.7] 一貫性推論(Consistent reasoning)は、人間の知性の中心にある、同等のタスクを扱う能力である。
CRPは、一貫性のある推論は誤認を意味する、と論じている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:06:53 GMT)
MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models [76.2] MMIU(Multimodal Multi-image Understanding)は、LVLM(Large Vision-Language Models)を評価するための総合的な評価スイートである。
MMIUには7種類のマルチイメージ関係、52のタスク、77Kのイメージ、1Kの微調整された複数選択質問が含まれている。
オープンソースモデルとプロプライエタリモデルの両方を含む24種類のLVLMを評価した結果,マルチイメージ理解における大きな課題が明らかになった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:56:41 GMT)
De-fine: Decomposing and Refining Visual Programs with Auto-Feedback [75.6] De-fineは、複雑なタスクを単純なサブタスクに分解し、オートフィードバックを通じてプログラムを洗練する、トレーニング不要のフレームワークである。
様々な視覚的タスクに対する我々の実験は、De-fineがより堅牢なプログラムを生成することを示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:10:02 GMT)
A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.5] ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 23:20:32 GMT)
Caution for the Environment: Multimodal Agents are Susceptible to Environmental Distractions [68.9] 本稿では,グラフィカルユーザインタフェース(GUI)環境におけるマルチモーダル大規模言語モデル(MLLM)エージェントの忠実さについて検討する。
ユーザとエージェントの両方が良性であり、環境は悪質ではないが、無関係なコンテンツを含む、一般的な設定が提案されている。
実験結果から、ジェネラリストエージェントや専門的なGUIエージェントなど、最も強力なモデルでさえ、気晴らしの影響を受けやすいことが明らかとなった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:16:22 GMT)
REVISION: Rendering Tools Enable Spatial Fidelity in Vision-Language Models [67.6] 視覚言語モデルには、空間的関係を正しく推論する能力がない。
視覚言語モデルにおける空間忠実度を改善するREVISIONフレームワークを開発した。
本研究の結果から,レンダリングベースのフレームワークは空間認識モデルの開発に有効な手法であることが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:51:46 GMT)
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [65.3] 本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:31:18 GMT)
EchoTrack: Auditory Referring Multi-Object Tracking for Autonomous Driving [64.6] 聴覚参照マルチオブジェクトトラッキング(AR-MOT)は、自律運転において難しい問題である。
私たちは、デュアルストリーム・ビジョン・トランスフォーマーを備えたエンドツーエンドのAR-MOTフレームワークであるEchoTrackを提案しました。
大規模AR-MOTベンチマークの最初のセットを確立する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 23:48:12 GMT)
Algorithm Design for Online Meta-Learning with Task Boundary Detection [63.3] 非定常環境におけるタスクに依存しないオンラインメタ学習のための新しいアルゴリズムを提案する。
まず,タスクスイッチと分散シフトの簡易かつ効果的な2つの検出機構を提案する。
軽度条件下では,線形タスク平均的後悔がアルゴリズムに対して達成可能であることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:10:35 GMT)
Exploring Query Understanding for Amazon Product Search [62.5] 問合せ理解に基づくランキング機能がどのようにランキングに影響を及ぼすかを検討する。
ランク付けのためのクエリ理解に基づくマルチタスク学習フレームワークを提案する。
本研究は,Amazon Searchにおける実世界のシステムを用いた調査・調査である。
論文参考訳(メタデータ) (Mon, 05 Aug 2024 03:33:11 GMT)
Fairness and Bias Mitigation in Computer Vision: A Survey [61.0] コンピュータビジョンシステムは、高精細な現実世界のアプリケーションにますますデプロイされている。
歴史的または人為的なデータにおいて差別的な傾向を伝播または増幅しないことを確実にする必要がある。
本稿では,コンピュータビジョンの文脈における現在進行中の傾向と成功をまとめた,公平性に関する総合的な調査を行う。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:44:22 GMT)
Let Me Speak Freely? A Study on the Impact of Format Restrictions on Performance of Large Language Models [60.0] 本研究では、生成空間におけるそのような制約が大言語モデルの能力に影響を及ぼすかどうかを考察する。
構造化形式に順応することを制限した場合と自由形式の応答を生成する場合とでLLMの性能を評価する。
より厳密なフォーマット制約は、一般的に推論タスクのパフォーマンス低下につながる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:08:24 GMT)
Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0] 従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:37:06 GMT)
Improving Intervention Efficacy via Concept Realignment in Concept Bottleneck Models [57.9] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念に基づいて、解釈可能なモデル決定を可能にする画像分類である。
既存のアプローチは、強いパフォーマンスを達成するために、画像ごとに多数の人間の介入を必要とすることが多い。
本稿では,概念関係を利用した学習型概念認識介入モジュールについて紹介する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:20:39 GMT)
Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.1] セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。
提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:57:42 GMT)
Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages [55.2] ニューラルマシン翻訳システムは、異なる言語の文を共通の表現空間にマッピングすることを学ぶ。
本研究では、この仮説を未知の言語からのゼロショット翻訳により検証する。
この設定により、全く見えない言語からのゼロショット翻訳が可能になることを実証する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:58:58 GMT)
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba [54.9] 局所的意図的マンバブロックは、大域的コンテキストと局所的詳細の両方を線形複雑性でキャプチャする。
このモデルは, 256x256の解像度で, ImageNet上の様々なモデルスケールでDiTの性能を上回り, 優れたスケーラビリティを示す。
ImageNet 256x256 と 512x512 の最先端拡散モデルと比較すると,最大 62% GFLOP の削減など,我々の最大のモデルには顕著な利点がある。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:39:39 GMT)
Hallu-PI: Evaluating Hallucination in Multi-modal Large Language Models within Perturbed Inputs [54.5] Hallu-PIは、Perturbed Inputs内のMLLMの幻覚を評価するために設計された最初のベンチマークである。
Hallu-PIは7つの摂動シナリオで構成され、11種類のオブジェクトから1,260の摂動イメージを含んでいる。
我々の研究は、MLLMが様々な種類の幻覚を処理できる能力に深刻なバイアスがあることを明らかにした。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:14:54 GMT)
GAReT: Cross-view Video Geolocalization with Adapters and Auto-Regressive Transformers [53.8] クロスビュービデオのジオローカライゼーションは、ストリートビュービデオからGPSトラジェクトリを空中ビュー画像と整列させることを目的としている。
現在のCVGL法では、現実のシナリオでは一般的に欠落しているカメラとオドメトリーのデータを使用する。
本稿では,カメラやオドメトリーデータを必要としないCVGLのフルトランスフォーマ方式であるGAReTを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:29:33 GMT)
The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective [53.5] モデルとデータの開発は2つの別々のパスではなく、むしろ相互接続であることがわかった。
一方,MLLMはデータ開発に役立てることができるため,MLLMの性能向上に寄与する。
MLLMコミュニティにおけるデータモデル共同開発を促進するために,データモデル共同開発の観点からMLLMに関連する既存の研究を体系的にレビューする。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:31:24 GMT)
Mixture-of-Noises Enhanced Forgery-Aware Predictor for Multi-Face Manipulation Detection and Localization [52.9] 本稿では,多面的操作検出と局所化に適したMoNFAPという新しいフレームワークを提案する。
このフレームワークには2つの新しいモジュールが含まれている: Forgery-aware Unified Predictor (FUP) Module と Mixture-of-Noises Module (MNM)。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:35:59 GMT)
Enhancing Supply Chain Visibility with Knowledge Graphs and Large Language Models [49.9] 本稿では,サプライチェーンの可視性を高めるために,知識グラフ(KG)と大規模言語モデル(LLM)を活用した新しいフレームワークを提案する。
我々のゼロショットLPM駆動アプローチは、様々な公共情報源からのサプライチェーン情報の抽出を自動化する。
NERとREタスクの精度が高く、複雑な多層供給ネットワークを理解する効果的なツールを提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:11:29 GMT)
Quantum information scrambling in adiabatically-driven critical systems [49.2] 量子情報スクランブル(quantum information scrambling)とは、量子多体系の多くの自由度に初期記憶された情報の拡散を指す。
我々は、量子情報スクランブルの概念を、断熱進化中の臨界量子多体システムに拡張する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:00:05 GMT)
Unpacking Human-AI Interaction in Safety-Critical Industries: A Systematic Literature Review [48.1] 文献でHAIIを記述するために1つの用語は使われていない。
HAIIは、ユーザ関連の主観的指標で最もよく測定される。
研究者と開発者はHAIIの用語を体系化する必要がある。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:55:50 GMT)
Chain-of-Symbol Prompting Elicits Planning in Large Langauge Models [47.2] 自然言語計画と行動(Natala)という,一連の新しいタスクからなるベンチマークを提案する。
現在、ChatGPTのようなLLMには複雑な計画能力がないことが分かっています。
本稿では,凝縮した記号空間表現を持つ複雑な環境を表現するCoS(Chain-of-Symbol Prompting)を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:52:16 GMT)
Generalized Quantum Stein's Lemma and Second Law of Quantum Resource Theories [47.0] 量子情報理論における根本的な疑問は、量子情報処理のためのリソースの変換性を特徴づけるために、類似の第2法則を定式化できるかどうかである。
2008年、有望な定式化が提案され、仮説テストの量子バージョンの変種における最適性能とリソース変換可能性のリンクが提案された。
2023年、この補題の元々の証明に論理的ギャップが発見され、そのような第二法則の定式化の可能性に疑問が投げかけられた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:00:00 GMT)
AppAgent v2: Advanced Agent for Flexible Mobile Interactions [46.8] 本研究は,モバイル機器向けの新しいLLMベースのマルチモーダルエージェントフレームワークを提案する。
我々のエージェントは、様々なアプリケーションにまたがる適応性を高めるフレキシブルなアクション空間を構築する。
本研究は,実世界のシナリオにおいて,フレームワークの優れた性能を実証し,その有効性を確認した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:31:39 GMT)
Learning rheological parameters of non-Newtonian fluids from velocimetry data [46.2] せん断薄い流体の最も可能性が高いカラオウパラメータを学習するアルゴリズムを考案する。
このアルゴリズムは,最も可能性の高いCarreauパラメータを学習することで,流れ場を再構築できることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:27:38 GMT)
On the influence of dependent features in classification problems: a game-theoretic perspective [46.1] 本稿では,各特徴が分類問題における応答変数に与える影響を,新たな尺度として扱う。
特定の特徴を特徴とする個体のサンプルを考察し、各特徴は有限範囲の値を含み、二値応答変数に基づいて分類する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:02:26 GMT)
A Sharp Convergence Theory for The Probability Flow ODEs of Diffusion Models [45.6] 拡散型サンプリング器の非漸近収束理論を開発する。
我々は、$d/varepsilon$がターゲット分布を$varepsilon$トータル偏差距離に近似するのに十分であることを証明した。
我々の結果は、$ell$のスコア推定誤差がデータ生成プロセスの品質にどのように影響するかも特徴付ける。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:02:24 GMT)
An approach to optimize inference of the DIART speaker diarization pipeline [45.0] 低レイテンシの話者ダイアリゼーションをオンライン話者ダイアリゼーションと呼ぶ。
DIARTパイプラインはオンライン話者ダイアリゼーションシステムである。
本研究の目的は,DIARTパイプラインの推論遅延を最適化することである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:38:07 GMT)
Embedding Compression in Recommender Systems: A Survey [44.9] 本稿では,ディープラーニングレコメンデーションモデルと,レコメンデーションシステムへの埋め込み圧縮の基本概念を紹介する。
既存のアプローチを,低精度,混合次元,重量共有という3つのカテゴリに体系的に分類する。
論文参考訳(メタデータ) (Mon, 05 Aug 2024 08:30:16 GMT)
To Aggregate or Not to Aggregate. That is the Question: A Case Study on Annotation Subjectivity in Span Prediction [44.5] 我々は、法律家によって注釈付けされた英語で平凡な人々によって書かれた問題記述のコーパスを使用する。
法的な領域分類は複雑なタスクであるため、本タスクには本質的な主観性が存在する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:16:31 GMT)
MARCO: A Memory-Augmented Reinforcement Framework for Combinatorial Optimization [44.2] 本稿では,MARCO(Memory-Augmented Reinforcement for Combinatorial Optimization)と呼ばれる多機能フレームワークを紹介する。
MARCOは最適化軌道全体を通して収集されたデータを格納し、各状態におけるコンテキスト関連情報を検索する。
NCOモデルの並列性により、複数の検索スレッドが同時に動作し、すべて同じメモリモジュールを共有することができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:15:21 GMT)
Improving Black-box Robustness with In-Context Rewriting [43.7] テキスト分類のための機械学習モデルは、しばしばIn-distribution (ID)データに優れるが、目に見えないout-of-distriion (OOD)入力に苦労する。
OODロバスト性を改善するほとんどのテクニックは、モデルが事実上ブラックボックスであるような設定には適用できない。
TTA(Test-time augmentation)は、ブラックボックス制約をサイドステップする堅牢性を改善するためのシンプルなポストホック手法である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 00:54:02 GMT)
Explosive neural networks via higher-order interactions in curved statistical manifolds [43.5] 我々は、高次現象を研究するためのプロトタイプモデルのクラスとして、曲面ニューラルネットワークを紹介した。
これらの曲線ニューラルネットワークは、メモリ検索を高速化する自己制御プロセスを実装している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:10:29 GMT)
HyperSpaceX: Radial and Angular Exploration of HyperSpherical Dimensions [43.2] HyperSpaceXとして知られる新しい機能探索の分野が提案されている。
これは多球面空間における角次元と半径次元の両方を探索することによってクラス識別を強化する。
7つのオブジェクト分類と6つの顔認識データセットによる実験は、最先端の結果を示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:18:29 GMT)
Developing PUGG for Polish: A Modern Approach to KBQA, MRC, and IR Dataset Construction [43.0] KBQA、Machine Reading(MRC)、Information Retrieval(IR)といったタスクを含む、データセット作成のための最新の半自動アプローチを導入する。
本稿では,包括的実装,洞察力のある発見,詳細な統計,ベースラインモデルの評価を行う。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:23:49 GMT)
Probabilistic Forecasting with Coherent Aggregation [42.2] MQForecasterニューラルネットワークアーキテクチャを構築によりコヒーレンスを実現するための新しい深いガウス因子予測モデルで拡張する。
DeepCoFactorはモデルパラメータに関して区別できるサンプルを生成する。
CRPS予測精度は4.16から54.40%向上し、一般に公開されている3つの階層的予測データセットで測定される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 23:23:14 GMT)
Progressively Selective Label Enhancement for Language Model Alignment [42.0] 本稿では,言語モデルアライメントのためのプログレッシブなラベル拡張を提案する。
このフレームワークは、アウトプットを人間の期待と一致させる原則をモデルに導くことによって、生成されたすべてのデータを完全に活用する。
複数のデータセットに対する実験結果から,既存の言語モデルアライメント手法と比較してPSLEの有効性が示された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:21:17 GMT)
What if LLMs Have Different World Views: Simulating Alien Civilizations with LLM-based Agents [40.1] コスモアジェント(CosmoAgent)は、人類と地球外文明の複雑な相互作用をシミュレートする人工知能の枠組みである。
目標は、善意の文明を脅かす可能性のあるリスクを考慮しつつ、平和的な共存の実現可能性を評価することである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:45:55 GMT)
ReDel: A Toolkit for LLM-Powered Recursive Multi-Agent Systems [39.9] ReDelは複雑なマルチエージェントシステムを構築するためのツールキットである。
カスタムツールの使用、デリゲートスキーム、イベントベースのロギング、インタラクティブなリプレイをサポートする。
私たちのコード、ドキュメンテーション、およびPyPIパッケージはオープンソースで、MITライセンス下で自由に使用できます。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:43:23 GMT)
Latent-INR: A Flexible Framework for Implicit Representations of Videos with Discriminative Semantics [38.5] Implicit Neural Networks(INR)は、画像、ビデオ、オーディオ、シーンなど、あらゆる形式のデータをエンコードする強力な表現として登場した。
これらの符号化された表現は意味を欠くため、検索のようなそのような特性を必要とする下流のタスクには使用できない。
ビデオINRの空間的側面と時間的側面を分離するフレキシブルなフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:59:51 GMT)
LMEMs for post-hoc analysis of HPO Benchmarking [38.4] 我々は,HPOベンチマークの実行後解析に線形混合効果モデル(LMEM)の意義試験を適用した。
LMEMは、ベンチマークメタ機能などの情報を含む実験データ全体のフレキシブルで表現力のあるモデリングを可能にする。
本稿では,本論文で報告されていない知見を見つけるために,PresideBand論文の実験データに関するケーススタディを通じてこれを実証する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:03:19 GMT)
MetaEnzyme: Meta Pan-Enzyme Learning for Task-Adaptive Redesign [38.2] 酵素設計フレームワークのMetaEnzymeを紹介する。
本稿では, 機能設計, 突然変異設計, シーケンス生成設計の3つの基本的低リソース酵素再設計タスクに焦点をあてる。
新たな統一パラダイムと拡張表現能力を通じて、MetaEnzymeは多様な酵素設計タスクへの適応性を実証し、優れた結果をもたらす。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:48:39 GMT)
CIResDiff: A Clinically-Informed Residual Diffusion Model for Predicting Idiopathic Pulmonary Fibrosis Progression [38.1] 特発性肺線維症(IPF)は患者の死亡率に大きく相関する。
現在の臨床基準では1年間隔で2回のCT検査を必要とする疾患の進行を規定している。
そこで我々は, 患者のCT画像からIPFの進行を正確に予測する新しい拡散モデルを開発した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:32:30 GMT)
Evaluating and Enhancing LLMs Agent based on Theory of Mind in Guandan: A Multi-Player Cooperative Game under Imperfect Information [36.1] 大規模言語モデル(LLM)は、不完全な情報で単純なゲームを扱うことに成功している。
本研究では,オープンソースのLLMとAPIベースのLLMが獲得した知識を,洗練されたテキストベースのゲームに適用する可能性について検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:36:46 GMT)
Multi-weather Cross-view Geo-localization Using Denoising Diffusion Models [35.9] クロスビュージオローカライゼーションは、ドローンビュー画像と、大きなギャラリーからの正確なジオタグ付き衛星ビュー画像とをマッチングすることにより、未知の場所を決定することを目的としている。
近年の研究では、特定の気象条件下での識別的画像表現の学習が、性能を著しく向上させることが示されている。
本稿では,気象条件に適応する多天候クロスビュージオローカライゼーションフレームワークであるMCGFを紹介する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:09:38 GMT)
MDM: Advancing Multi-Domain Distribution Matching for Automatic Modulation Recognition Dataset Synthesis [35.1] ディープラーニング技術は、AMR(Automatic Modulation Recognition)タスクにうまく導入されている。
ディープラーニングの成功はすべて、大規模なデータセットのトレーニングによるものだ。
大量のデータの問題を解決するため、一部の研究者はデータ蒸留法を提唱した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:16:54 GMT)
Operationalizing Contextual Integrity in Privacy-Conscious Assistants [34.7] 我々は、プライバシーと所定のコンテキストにおける適切な情報の流れを一致させるフレームワークである$textitcontextual integrity$ (CI)を運用することを提案する。
我々の評価は、合成データと人間のアノテーションからなる新しいフォームフィリングベンチマークに基づいている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:53:51 GMT)
Vertical Federated Learning: Challenges, Methodologies and Experiments [34.5] 垂直学習(VFL)は、異なるクライアントからサブモデルを受け入れることで、ハイパーMLモデルを構築することができる。
本稿では,VFLにおける課題を効果的に解決し,実生活データセット上で実験を行う。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:58:37 GMT)
Exploiting Scale-Variant Attention for Segmenting Small Medical Objects [33.9] 医用画像中の小型物体を正確にセグメント化するためのスケール可変アテンションベースネットワーク(SvANet)を提案する。
SvANetは、Dice係数の平均96.12%、96.11%、89.79%、84.15%、80.25%、73.05%、および72.58%を達成した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:56:29 GMT)
GenAI Arena: An Open Evaluation Platform for Generative Models [33.2] 本稿では,異なる画像および映像生成モデルを評価するためのオープンプラットフォームGenAI-Arenaを提案する。
GenAI-Arenaは、より民主的で正確なモデルパフォーマンスの指標を提供することを目指している。
テキスト・ツー・イメージ・ジェネレーション、テキスト・ツー・ビデオ・ジェネレーション、画像編集の3つのアリーナをカバーしている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:18:25 GMT)
Variational Flow Models: Flowing in Your Style [32.9] 我々は「線形」過程の確率フローを正定速度(SC)の流れに変換する。
この変換は、SCフローの新しいモデルを訓練することなく、Euler法による元の確率フローに沿って高速なサンプリングを容易にする。
高次数値解法を変換SC流に容易に組み込むことができ、サンプリング精度と効率をより高めることができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:24:52 GMT)
Spatiotemporal Graph Guided Multi-modal Network for Livestreaming Product Retrieval [32.5] そこで本研究では,営業担当者の音声コンテンツを活用したテキスト誘導型アテンション機構を提案する。
長距離時間グラフネットワークは、インスタンスレベルの相互作用とフレームレベルのマッチングの両方を達成するように設計されている。
提案するSGMNモデルの優れた性能を実証し,最先端の手法をかなり上回る性能を示した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:05:59 GMT)
Hybrid Oscillator-Qubit Quantum Processors: Instruction Set Architectures, Abstract Machine Models, and Applications [32.4] CV-DVハイブリッドハードウェアは,DVプロセッサとCVプロセッサの両方の長所を継承する,強力な計算パラダイムを提供する。
本稿では,様々なハイブリッドCV-DVコンパイル技術,アルゴリズム,アプリケーションについて述べる。
ハイブリッドCV-DV量子計算は超伝導、閉じ込められたイオン、中性原子プラットフォームで実行され始めている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:50:57 GMT)
Vision Learners Meet Web Image-Text Pairs [32.4] 本研究では,ノイズの多いWebソースと画像テキストのペアデータに対する自己教師付き事前学習について検討する。
マスク付きトレーニング目標を用いたシングルモーダルトレーニングや,画像テキストコンストラシティブトレーニングを用いたマルチモーダルトレーニングなど,さまざまな手法を比較した。
我々は、スケーラブルなWebソース画像テキストデータから学習する新しいビジュアル表現事前学習手法MUlti-modal Generator(MUG)を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:38:05 GMT)
Reinforcement Learning Friendly Vision-Language Model for Minecraft [31.9] クロスモーダルなコントラスト学習フレームワークであるCLIP4MCを提案する。
オープンなタスクに対する本質的な報酬関数として機能する強化学習(RL)フレンドリな視覚言語モデル(VLM)を学習することを目的としている。
提案手法は,ベースラインよりもRLタスクの性能がよいことを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:44:04 GMT)
Diversity and Multiplexing in Quantum MIMO Channels [31.4] 近似量子クローニングを用いて、同じ量子状態の複数のコピーを多重入力多重出力(MIMO)チャネル上で送信する。
この設定に対する平均的忠実度と通信速度の間には、達成可能なトレードオフがある。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:04:33 GMT)
Realistic Human Motion Generation with Cross-Diffusion Models [30.9] クロスヒューマンモーション拡散モデル(クロスディフ)
拡散モデルのトレーニングでは,共有変圧器ネットワークを用いて3次元情報と2次元情報を統合する。
CrossDiffは、両方の表現の強みを効果的に組み合わせて、より現実的なモーションシーケンスを生成する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:58:58 GMT)
CodeACT: Code Adaptive Compute-efficient Tuning Framework for Code LLMs [30.4] 既存の方法は、微調整のための膨大な量の合成データを生成し、訓練の効率を損なう。
CodeACTはCDAS(Complexity and Diversity Aware Smpling)メソッドを導入し、高品質なトレーニングデータを選択する。
CodeACTはHumanEvalのパフォーマンスが8.6%向上し、トレーニング時間を78%削減し、ピーク時のGPUメモリ使用量を27%削減した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:38:48 GMT)
From Recognition to Prediction: Leveraging Sequence Reasoning for Action Anticipation [30.2] 本稿では,ARR(Accence and Reasoning, 認識・推論)と呼ばれる注意機構を利用した新しいエンドツーエンドビデオモデリングアーキテクチャを提案する。
ARRは行動予測タスクを行動認識と推論タスクに分解し、次の行動予測(NAP)によって行動間の統計的関係を効果的に学習する。
さらに、広範囲なトレーニングデータを必要とする関係モデリングの課題に対処するために、デコーダの教師なし事前学習のための革新的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:38:29 GMT)
StyEmp: Stylizing Empathetic Response Generation via Multi-Grained Prefix Encoder and Personality Reinforcement [30.1] StyEmpは、共感反応生成を一貫した個性でスタイリングすることを目的としている。
システムの性格と共感的表現の関係を捉えるために設計された、多義的なプレフィックス機構が組み込まれている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:59:56 GMT)
On The Stability of Moral Preferences: A Problem with Computational Elicitation Methods [30.0] 参加者の真の道徳的嗜好が変化したり、一時的な気分や気まぐれを伴ったり、追跡しない環境要因の影響を受けている可能性がある。
同じ調査参加者に対して,2週間に10回の異なるセッションで1回のみ10回実施した場合に,どの患者に腎臓を投与すべきかという道徳的な質問を行った。
参加者が単純(研究1)と複雑(研究2)の繰り返しシナリオに対して異なる反応を示す頻度を測定した。平均的に、参加者の反応を議論のあるシナリオに変更した回数は、研究全体で約10~18%であり、この不安定性は観察されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 23:20:47 GMT)
Enhanced Superconducting Qubit Performance Through Ammonium Fluoride Etch [29.7] 超伝導量子ビットの性能は、散逸と2レベルシステム(TLS)の損失によって制限されることが多い。
ここではジョセフソン接合基板と基板-空気界面での新しい湿式化学表面処理について検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 23:25:46 GMT)
Large Language Model for Verilog Generation with Golden Code Feedback [29.1] 本研究は,ゴールドコードフィードバックを用いた強化学習を利用して,事前学習モデルの性能を向上させる手法を提案する。
我々は、最先端のSOTA(State-of-the-art)の結果をかなりの差で達成した。特に、我々の6.7Bパラメータモデルは、現行の13Bモデルと16Bモデルと比較して優れた性能を示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:12:46 GMT)
Optimization of Iterative Blind Detection based on Expectation Maximization and Belief Propagation [29.1] ブロックフェーディング線形シンボルチャネルに対するブラインドシンボル検出法を提案する。
本研究では,研究予測アルゴリズムとユビキタスな信条伝搬アルゴリズムを組み合わせた共同チャネル推定・検出手法を設計する。
提案手法は,効率よく一般化したスケジュールを学習し,高信号対雑音シナリオにおけるコヒーレントBP検出よりも優れることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:45:50 GMT)
A Hessian-Aware Stochastic Differential Equation for Modelling SGD [29.0] Hessian-Aware Modified Equation (HA-SME) は、対象関数の Hessian 情報をそのドリフトと拡散の両項に組み込む近似 SDE である。
二次的な目的のために、HA-SMEは分布感覚におけるSGDのダイナミクスを正確に回復する最初のSDEモデルであることが証明された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:25:10 GMT)
Is Large Language Model Good at Database Knob Tuning? A Comprehensive Experimental Evaluation [28.8] 本研究は,経験豊富なDBAとして大規模言語モデル(LLM)を,慎重に設計されたプロンプトを用いたノブチューニングタスクに活用する。
我々は,LLM方式のアプローチと従来の手法との比較実験を行った。
以上の結果から, LLMは従来の手法に適合するだけでなく, 解釈可能性も顕著であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:26:01 GMT)
PEneo: Unifying Line Extraction, Line Grouping, and Entity Linking for End-to-end Document Pair Extraction [28.2] ドキュメントペア抽出は、キーエンティティとバリューエンティティの識別と、視覚的に豊富なドキュメントからの関連性の実現を目的としている。
既存のほとんどのメソッドは、セマンティックエンティティ認識(SER)と関係抽出(RE)の2つのタスクに分割している。
本稿では,統一パイプラインで文書ペア抽出を行う新しいフレームワークであるPEneoを紹介する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:24:18 GMT)
ExoViP: Step-by-step Verification and Exploration with Exoskeleton Modules for Compositional Visual Reasoning [27.7] 本研究では,計画段階と実行段階の誤りを訂正する"plug-and-play"手法であるExoViPを提案する。
我々は、現在の視覚言語プログラミング手法を強化するために、検証モジュールを"exoskeletons"として採用する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:22:10 GMT)
Strategic Federated Learning: Application to Smart Meter Data Clustering [27.7] フェデレートラーニング(FL)には、各クライアントが独自のデータでトレーニングしたモデルと、融合センタ(FC)を共有する複数のクライアントが含まれる。
本稿では,FCがモデル情報の集約版を使用して,クライアントのユーティリティ機能に影響を与える決定を行う新しいFLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:16:26 GMT)
A First Look at License Compliance Capability of LLMs in Code Generation [27.4] 大規模言語モデル(LLM)はコード生成に革命をもたらし、開発者によるAIコーディングツールの普及につながった。
LLMは、ライセンス情報を提供することなくライセンス保護されたコードを生成することができ、ソフトウェア製造中に知的財産権侵害を引き起こす可能性がある。
本稿では,LLM生成コードにおけるライセンスコンプライアンスの重要かつ未解明な問題に対処する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:09:30 GMT)
Generative Organizational Behavior Simulation using Large Language Model based Autonomous Agents: A Holacracy Perspective [27.2] CareerAgentは、大規模言語モデルに基づく自律エージェントを使用して、ホラクラシー組織のための生成シミュレーションフレームワークを構築することを目指している。
組織レベルでは、マネジメント能力と機能能力の平均値の増加は、メンバー全体のストレスレベルを低下させる可能性がある。
ソーシャルネットワークの分析から,有能なメンバが特定のタスクに選択的に参加し,より多くの責任を負うことがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:39:03 GMT)
VisionUnite: A Vision-Language Foundation Model for Ophthalmology Enhanced with Clinical Knowledge [26.9] 臨床知識によって強化された眼科の新しい視覚言語基盤モデルであるVisionUniteを紹介する。
VisionUniteは、124万の画像テキストペアからなる広範囲なデータセットで事前訓練されている。
実験の結果,VisionUnite は GPT-4V や Gemini Pro などの既存の生成基盤モデルよりも優れていた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 23:31:07 GMT)
More Than Positive and Negative: Communicating Fine Granularity in Medical Diagnosis [26.2] 医用画像からの微粒化学習に関する新しいベンチマークを提案する。
具体的には,医学的知識に基づく分類法を考案し,正の症例を非典型的陽性と典型的陽性の2つのサブカテゴリに分けた。
また、トレーニングにおいて粗いラベルのみを用いることで、この問題に対する簡易なリスク変調手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:33:00 GMT)
Lost in Translation: Latent Concept Misalignment in Text-to-Image Diffusion Models [25.9] テキスト・ツー・イメージの拡散モデルは、しばしばテキストと画像のミスアライメント問題に遭遇する。
我々は拡散モデルの潜在意味論をテキストプロンプトに整合させる自動パイプラインを開発する。
経験的評価は我々のアプローチの有効性を裏付ける。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:36:20 GMT)
Leveraging the Power of LLMs: A Fine-Tuning Approach for High-Quality Aspect-Based Summarization [25.1] 大規模言語モデル(LLM)は、自然言語処理における多様なタスクに革命をもたらす可能性を実証している。
本稿ではアスペクトベース要約タスクにおける微調整LDMの可能性について検討する。
我々は,Llama2,Mistral,Gemma,Ayaなどオープンソースファウンデーションの微調整が,パブリックドメイン固有のアスペクトベース要約データセットに与える影響を評価する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:00:21 GMT)
Automatic rating of incomplete hippocampal inversions evaluated across multiple cohorts [24.5] Incomplete Hippocampal Inversion (IHI) は一般人口の約20%にみられる海馬の非定型解剖学的パターンである。
IHIはいくつかの脳疾患(てんかん、統合失調症)と関連している
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:19:03 GMT)
Perception Matters: Enhancing Embodied AI with Uncertainty-Aware Semantic Segmentation [24.3] Embodied AIは、探索されていない環境での行動に大きな進歩を遂げた。
我々は、日付付き知覚モデルに焦点をあて、時間的集約を無視し、地上の真実からテスト時にノイズの多い知覚へと直接移行する。
本研究は,アグリゲーション間の知覚確率と不確かさを校正し,決定を下すことによって,同定された問題に対処する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:14:28 GMT)
Detection of Compromised Functions in a Serverless Cloud Environment [24.3] サーバレスコンピューティングは、サーバーレス関数が中心となる、新たなクラウドパラダイムである。
既存のセキュリティソリューションは、すべてのサーバレスアーキテクチャに適用できない。
拡張可能なサーバレスセキュリティ脅威検出モデルを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:14:35 GMT)
Joint-Motion Mutual Learning for Pose Estimation in Videos [21.8] ビデオにおける人間のポーズ推定は、コンピュータビジョンの領域において、説得力がありながら挑戦的な課題だった。
最近の手法では、ポーズ推定のためにバックボーンネットワークによって生成された複数フレームの視覚的特徴を統合することを目指している。
ポーズ推定のための新しい共同動作相互学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:37:55 GMT)
Be More Real: Travel Diary Generation Using LLM Agents and Individual Profiles [21.7] 本研究では,現実の文脈に応じたリアルな軌跡を生成するためのエージェントベースフレームワーク(MobAgent)を提案する。
当フレームワークを0.2万回の旅行調査データで検証し,個人化された正確な旅行日記を作成する上での有効性を実証した。
本研究は、実世界の移動データを通して、人間の移動性に関する詳細かつ洗練された理解を提供するLLMの能力を強調した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:59:39 GMT)
Operationalizing content moderation "accuracy" in the Digital Services Act [21.7] EUが採択したデジタルサービス法(Digital Services Act)では、ソーシャルメディアプラットフォームが自動コンテンツモデレーションシステムの「正確性」を報告する必要がある。
さらなる仕様がなければ、規制要件は不十分な報告を可能にする。
我々は、法的概念を精査し、技術的実装に関連する「正確さ」レポートを運用する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:50:55 GMT)
FE-Adapter: Adapting Image-based Emotion Classifiers to Videos [21.3] 本稿では,映像タスクの微調整を効率よく行うために設計された表情適応器(FE-Adapter)について述べる。
FE-Adapterは、パフォーマンスと効率の両方で、既存の微調整とビデオの感情モデルにマッチしたり、超えたりできる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:27:28 GMT)
Dissecting Deep RL with High Update Ratios: Combatting Value Divergence [21.3] ネットワークパラメータをリセットすることなく、深層強化学習アルゴリズムが学習能力を維持できることを示す。
我々は,大規模な更新率での学習を可能にする,単純な単球正規化を採用している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:55:19 GMT)
Solving Token Gradient Conflict in Mixture-of-Experts for Large Vision-Language Model [21.0] 大規模視覚言語モデル(LVLM)の研究において、Mixture-of-Experts(MoE)が注目を集めている。
LVLMの既存のMoEメソッドは、異なる専門家に異なるトークンを扱うように促し、通常、各トークンのルーティングを予測するためにルータを使用する。
本稿ではトークンレベルの勾配解析に基づく新しい手法,すなわち解決トークンのグラディエント・コンフリクト(STGC)を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:12:48 GMT)
Active Learning for WBAN-based Health Monitoring [20.9] 我々は、無線体温ネットワーク(WBAN)における健康モニタリングのための機械学習モデルの必要性から、新しいアクティブな学習問題を考える。
身体センサーの資源が限られているため、WBANでラベル付けされていないサンプルを収集することは、非自明なコストを発生させる。
我々のソリューションは、ターゲットモデルの品質を犠牲にすることなく、データキュレーションコストを大幅に削減することができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:19:01 GMT)
LLM economicus? Mapping the Behavioral Biases of LLMs via Utility Theory [20.8] ユーティリティ理論は、大きな言語モデルの経済バイアスを評価するためのアプローチである。
現在のLLMの経済行動は、完全に人間的でも、完全に経済的なものでもない。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:00:43 GMT)
Confidence-aware Self-Semantic Distillation on Knowledge Graph Embedding [20.5] 信頼を意識した自己知識蒸留はモデル自体から学習し、KGEを低次元空間で強化する。
特定のセマンティックモジュールは、以前に学習した埋め込みの信頼度を推定することにより、信頼できる知識をフィルタリングする。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:55:34 GMT)
GazeXplain: Learning to Predict Natural Language Explanations of Visual Scanpaths [20.4] 本稿では,視覚スキャンパス予測と説明の新しい研究であるGazeXplainを紹介する。
これには、視線追跡データセットにまたがる修正のための自然言語の説明が注釈付けされる。
多様な視線追跡データセットの実験は、スキャンパス予測と説明の両方においてGazeXplainの有効性を示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:11:46 GMT)
Gaussian Mixture based Evidential Learning for Stereo Matching [20.1] 本フレームワークは,ステレオマッチングにおいて,個々の画像データが混合ガウス分布に従属することを示す。
提案手法は、ドメイン内検証データとクロスドメインデータセットの両方に対して、最先端の新たな結果を得た。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:23:45 GMT)
Network Fission Ensembles for Low-Cost Self-Ensembles [20.1] NFE(Network Fission Ensembles)と呼ばれる低コストのアンサンブル学習と推論を提案する。
まず、トレーニングの負担を軽減するために、いくつかの重みを取り除きます。
次に、残りの重みを複数の集合に分けて、各集合を用いて複数の補助経路を作成し、複数の集合を構成する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:23:59 GMT)
Low-Cost Self-Ensembles Based on Multi-Branch Transformation and Grouped Convolution [20.1] 本稿では,高い効率と分類性能を実現するために,低コストなアンサンブル学習を提案する。
学習には,教師の信号として出力のアンサンブルを用いた知識蒸留を用いる。
実験結果から,本手法は最先端の分類精度と精度の高い不確実性推定性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:36:13 GMT)
EAR: Edge-Aware Reconstruction of 3-D vertebrae structures from bi-planar X-ray images [19.9] 本稿では,新しいエッジ・アウェア・コンストラクション・ネットワーク(EAR)を提案する。
自動エンコーダアーキテクチャをバックボーンとして,エッジアテンションモジュールと周波数拡張モジュールを提案する。
提案手法は3つの公開データセットを用いて評価し、4つの最先端モデルと比較した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:27:39 GMT)
SelfGeo: Self-supervised and Geodesic-consistent Estimation of Keypoints on Deformable Shapes [19.7] 自己教師型手法であるSelfGeoは、人間のアノテーションを必要とせず、任意のPCDから非剛体物体の3次元キーポイントを計算する。
我々の主な貢献は、そのキーポイントをその形状に沿って変形させ、その間の測地線距離を一定に保つことである。
本研究では,測地学の利用が動的シーンに挑戦する上で明らかな優位性があることを実験的に示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:00:30 GMT)
miniCTX: Neural Theorem Proving with (Long-)Contexts [19.5] miniCTXは、訓練中に観察されていない文脈情報に依存する形式的な数学的定理を証明するモデルの能力をテストする。
miniCTXには、実際のリーンプロジェクトと教科書に由来する定理が含まれており、それぞれに数万のトークンにまたがるコンテキストが関連付けられています。
本稿では,前回のファイル内容に条件付き証明ステップを生成するためにモデルを訓練する簡単なレシピであるファイルチューニングを紹介する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:19:18 GMT)
SEAS: Self-Evolving Adversarial Safety Optimization for Large Language Models [19.5] 大規模言語モデル(LLM)は能力と影響力を向上し続け、セキュリティを確保し、有害な出力を防ぐことが重要になっている。
これらの問題に対処するための有望なアプローチは、レッドチームのための敵のプロンプトを自動的に生成するトレーニングモデルである。
mathbfStextelf-mathbfEtextvolving mathbfAtextdversarial mathbfStextafetyety mathbf(SEAS)$ Optimization frameworkを紹介します。
SEASはイニシアティブ、アタック、アドバーサの3段階を繰り返す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:55:06 GMT)
DrawTalking: Building Interactive Worlds by Sketching and Speaking [19.4] そこで我々はDrawTalkingを紹介した。DrawTalkingは、ストーリーを語りながらスケッチや会話によってインタラクティブな世界を構築し、制御するアプローチである。
ユーザコントロールと柔軟性を強調し、コードを必要とせずにプログラミングのような機能を提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:46:34 GMT)
Single-tap Latency Reduction with Single- or Double- tap Prediction [19.3] そこで我々はPredicTapsと呼ばれる新しい機械学習に基づくタップ予測手法を提案する。
検出したタップが1タップか、数百ミリ秒待つことなくダブルタップの最初の接触かを予測する。
その結果、PredicTapsはシングルタップのレイテンシを、ラップトップでは150-500msから12ms、スマートフォンでは17.6msに削減した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:46:04 GMT)
Clustering and Mining Accented Speech for Inclusive and Fair Speech Recognition [18.9] フェア音声認識システムのためのアクセントクラスタリングとマイニング方式を提案する。
アクセント認識のために,教師付きアクセントデータの限られたサイズを克服するために3つのスキームを適用した。
インドアクセント音声の微調整では,無作為なサンプル音声の微調整に比べて10.0%と5.3%の相対的な改善が見られた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:00:07 GMT)
An Evaluation of Requirements Modeling for Cyber-Physical Systems via LLMs [18.7] 問題フレームアプローチは、コンポーネントの特性と相互接続をキャプチャすることで、現実世界の問題を形成することを目的としている。
大規模言語モデル(LLM)は、自然言語理解において優れた性能を示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:20:14 GMT)
Lesion Elevation Prediction from Skin Images Improves Diagnosis [18.5] 深層学習モデルを用いて2次元皮膚病変画像から画像レベルの病変標高ラベルを予測する。
以上の結果より,AUROCは6.29%,AUROCは2.69%に改善した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:19:29 GMT)
The Power of Combining Data and Knowledge: GPT-4o is an Effective Interpreter of Machine Learning Models in Predicting Lymph Node Metastasis of Lung Cancer [18.3] リンパ節転移(LNM)は肺癌患者の早期治療を決定する重要な因子である。
近年,大きな言語モデル (LLM) が注目されている。
本稿では,LLMが取得した医療知識と機械学習モデルで同定した潜伏パターンを組み合わせた新しいアンサンブル手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:06:14 GMT)
Reliable Academic Conference Question Answering: A Study Based on Large Language Model [18.1] 我々は,7つの学術会議からなるコンファレンスQAデータセットを開発した。
まず,学術会議データを木構造形式で半自動で整理する。
次に、質問応答ペアに注釈を付け、ペアを4つの異なるタイプに分類し、それらの難易度をよりよく区別する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:47:59 GMT)
Solving PDEs on Spheres with Physics-Informed Convolutional Neural Networks [17.7] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法において効率的であることが示されている。
本稿では,物理インフォームド畳み込みニューラルネットワーク(PICNN)の厳密な解析を行い,球面上のPDEを解く。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:53:12 GMT)
Regularized Multi-Decoder Ensemble for an Error-Aware Scene Representation Network [17.6] SRN(Feature Grid Scene Representation Networks)は、分析と可視化のためのコンパクトな機能的サロゲートとして科学データに適用されている。
複数の軽量パーセプトロンデコーダを持つ共有特徴格子からなるパラメータ効率のよいマルチデコーダSRNアンサンブルアーキテクチャを提案する。
本研究では,モンテカルロの降雨量,平均場変動推定,深部アンサンブル,予測変数の分散とデータ再構成の質を評価する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:09:50 GMT)
Language Model Can Listen While Speaking [17.6] 聴取時言語モデル (LSLM) は、聴取チャネルと発声チャネルの両方を備えたエンドツーエンドシステムである。
本研究は,既存のシステムに最小限の影響を伴って,重複通信を実現するLSLMの能力を強調した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:47:22 GMT)
Interactive 3D Medical Image Segmentation with SAM 2 [17.5] ビデオで訓練した次世代のMeta SAMモデルSAM 2のゼロショット機能について, 医用画像のセグメンテーションについて検討する。
3D画像のシーケンシャルな2Dスライスをビデオフレームとして扱うことで、SAM 2は単一のフレームから3Dボリューム全体へのアノテーションの完全な伝達を可能にする。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:58:56 GMT)
Segmentation Style Discovery: Application to Skin Lesion Images [17.2] StyleSegは、画像とマスクのペアのコーパスから可塑性、多様性、意味的に一貫性のあるセグメンテーションスタイルを学ぶセグメンテーション手法である。
StyleSegは、4つの公開スキン病変セグメンテーション(SLS)データセットの競合メソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:11:05 GMT)
Local Differential Privacy in Graph Neural Networks: a Reconstruction Approach [17.0] ユーザレベルでノードのプライバシを提供するための学習フレームワークを提案する。
我々は、分散化された微分プライバシーの概念、すなわちローカル微分プライバシに焦点を当てる。
摂動データから特徴やラベルを近似する再構成手法を開発した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:54:54 GMT)
Avatar Fingerprinting for Authorized Use of Synthetic Talking-Head Videos [16.7] これをアバターフィンガープリントと呼ぶ。
まず、ビデオ通話で対話する人々の実・合成ビデオの大規模なデータセットを紹介する。
顔の表情に依存しない動きのシグネチャを学習することにより、合成ビデオで表現を駆動するアイデンティティを検証する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:38:33 GMT)
Transformer Layers as Painters [16.4] 事前学習したトランスの下位層と最終層は中間層と異なるが,中間層は驚くほど均一であることを示す。
また、いくつかの問題のクラスは、レイヤのスキップ、レイヤのトレーニング方法と異なる順序での実行、レイヤの並列実行に対して堅牢性が必要であることも示しています。
我々の観察では、凍結した事前学習モデルでさえ、レイヤをスキップしたり、並列にレイヤを走らせることで、遅延の正確さを優雅に交換できる可能性が示唆されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:10:25 GMT)
Multi-level Traffic-Responsive Tilt Camera Surveillance through Predictive Correlated Online Learning [16.3] 本稿では,TTC-Xのマルチレベル交通タイミングカメラ監視システムについて紹介する。
TTC-Xは、従来の監視システムにおける固定視野の限界を克服し、動員および360度のカバレッジを提供する。
ニューヨーク州ブルックリンの現実世界の交通データを用いて,3つの実験シナリオで検証および評価を行った。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:17:44 GMT)
AVS-Net: Point Sampling with Adaptive Voxel Size for 3D Scene Understanding [16.0] 本稿では,精度と効率性を両立する高度サンプリング器を提案する。
本稿では,Voxel Adaptation Module(Voxel Adaptation Module,Voxel Adaptation Module,Voxel Adaptation Module,Voxel Adaptation Module,Voxel Adaptation Module,Voxel Adaptation Module)を提案する。
既存の最先端手法と比較して,本手法は屋外および屋内の大規模データセットの精度を向上する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:16:03 GMT)
The NPU-ASLP System Description for Visual Speech Recognition in CNVSRC 2024 [15.9] 本稿では,第2回中国連続視覚音声認識チャレンジ(CNVSRC 2024)において,NPU-ASLP (Team 237) が導入した視覚音声認識システムについて述べる。
データ処理に関しては,ベースライン1からリップモーション抽出器を利用してマルチスケール映像データを生成する。
トレーニング中に、速度摂動、ランダム回転、水平反転、色変換を含む様々な拡張技術が適用される。
提案手法では, 単一話者タスクが30.47%, 複数話者タスクが34.30%, 単一話者タスクがオープントラックで第2位を確保している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:38:50 GMT)
Why Are My Prompts Leaked? Unraveling Prompt Extraction Threats in Customized Large Language Models [15.8] 我々は,突発的漏洩のメカニズムを解析し,その機構を即発的記憶と呼び,対応する防御戦略を開発する。
現在のLSMは、GPT-4のような安全アライメントを持つものでさえ、抽出攻撃の迅速化に非常に脆弱であることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:20:39 GMT)
From LLMs to LLM-based Agents for Software Engineering: A Survey of Current, Challenges and Future [15.6] 本稿では,大規模言語モデル (LLM) と LLM をベースとしたソフトウェア工学エージェントの実践とソリューションについて検討する。
特に、要件エンジニアリング、コード生成、自律的な意思決定、ソフトウェア設計、テスト生成、ソフトウェアメンテナンスの6つの主要なトピックを要約します。
我々は、使用するモデルとベンチマークについて論じ、ソフトウェア工学におけるそれらの応用と有効性について包括的に分析する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:01:15 GMT)
HQOD: Harmonious Quantization for Object Detection [15.4] タスク不調和問題は、現代のオブジェクト検出器で一般的に発生し、分類と回帰タスクの間に一貫性のない性質をもたらす。
本稿では,2つのコンポーネントから構成されるHormonious Quantization for Object Detection (HQOD)フレームワークを提案する。
ResNet-50のバックボーンを持つ4ビットATSSは、最先端のmAPを39.6%達成し、完全な精度を超えています。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:37:18 GMT)
Integer-Valued Training and Spike-Driven Inference Spiking Neural Network for High-performance and Energy-efficient Object Detection [15.2] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)に対するバイオプラウと低消費電力のアドバンテージを持つ
本研究では,オブジェクト検出におけるANNとSNNのパフォーマンスギャップを埋めることに焦点を当てる。
我々は,バニラYOLOを単純化し,メタSNNブロックを組み込むことで,この問題を解決するためにSpikeYOLOアーキテクチャを設計する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:53:55 GMT)
Threats, Attacks, and Defenses in Machine Unlearning: A Survey [15.1] マシン・アンラーニング(MU)は最近、安全なAIを実現する可能性についてかなりの注目を集めている。
この調査は、機械学習における脅威、攻撃、防衛に関する広範な研究のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:32:22 GMT)
Retargeting Visual Data with Deformation Fields [14.7] Seam Carvingは、オブジェクトの削除などの操作を含むコンテンツ認識を可能にする画像編集方法である。
本稿では、低情報量放射率の場所で変形を試みながら、出力を可塑性に保つニューラルネットワークを用いて変形を学習することを提案する。
異なる視覚データを用いて実験を行った結果,本手法は従来の手法に比べてコンテンツ認識に優れていた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:49:58 GMT)
Intent Detection and Entity Extraction from BioMedical Literature [14.5] 言語モデル(LLM)は、汎用知性を達成するための努力によって動機付けられ、タスクやドメイン固有の自然言語理解アプローチを置き換える効果は疑問視されている。
スーパーバイザード・ファイン・チューン(Supervised Fine Tuned)アプローチは, 汎用LLMよりも有用であり, 有効であることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:01:13 GMT)
Exploiting Hankel-Toeplitz Structures for Fast Computation of Kernel Precision Matrices [14.3] ヒルベルト空間ガウス過程(HGP)アプローチは、GP推論を高速化するための超独立基底関数近似を提供する。
本稿では,この計算複雑性を,余分な近似を伴わずに$mathcalO(NM)$に下げる。
我々の貢献は、いくつかの既存の、広く使われているGP近似の純粋なスピードアップを提供するが、それ以上の近似は行わない。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:45:31 GMT)
Reinforcement Learning with Generalizable Gaussian Splatting [14.0] 優れた表現は強化学習(RL)のパフォーマンスに不可欠である。
本稿では、GSRLと呼ばれるRLタスクを表現するための新しい一般化可能なガウススティングフレームワークを提案する。
提案手法は,複数のタスクにおいて,他のベースラインよりも優れた結果が得られ,最も難しいタスクのベースラインと比較して10%,44%,15%の性能が向上する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:45:42 GMT)
A Multimodal Knowledge-enhanced Whole-slide Pathology Foundation Model [14.0] スライド画像全体のH&E診断と関連する病理報告とRNA-Seqデータからなる最大マルチモーダルデータセットをキュレートした。
そこで,本論文では,病的FMにマルチモーダルな知識を注入する新パラダイムを提案する。
提案したパラダイムはCPathの事前トレーニングのワークフローに革命をもたらす。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:26:24 GMT)
VyAnG-Net: A Novel Multi-Modal Sarcasm Recognition Model by Uncovering Visual, Acoustic and Glossary Features [13.9] サルカズム認識は、日常の対話に埋め込まれた隠された皮肉、批判、比喩的な情報を識別することを目的としている。
本稿では,軽量な奥行き注意モジュールと自己制御型ConvNetを組み合わせることで,視覚データの最も重要な特徴に集中する手法を提案する。
我々はまた、別のデータセットMUStARD++の見知らぬサンプルを用いて、VyAnG-Netの適応性をテストするために、クロスデータセット解析を行った。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:36:52 GMT)
Target-Dependent Multimodal Sentiment Analysis Via Employing Visual-to Emotional-Caption Translation Network using Visual-Caption Pairs [13.9] 本研究では,VECTN(Visual-to-Emotional-Caption Translation Network)と呼ばれる新しい手法を提案する。
この戦略の主な目的は、表情を分析して視覚的感情の手がかりを効果的に獲得することである。
得られた感情的手がかりとキャプションモードの目標属性を効果的に調整し、ブレンドする。
実験結果から,提案モデルが81.23%,マクロF1が80.61%の精度をTwitter-15データセット上で達成していることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:56:55 GMT)
Contrastive Learning-based Multi Modal Architecture for Emoticon Prediction by Employing Image-Text Pairs [13.9] 本研究の目的は,文,視覚,エモティコン間の関係を分析することである。
我々は,新しいコントラスト学習に基づくマルチモーダルアーキテクチャを提案する。
提案モデルの精度は91%,MCCスコアは90%,エモティコンは90%であった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:45:59 GMT)
A Landscape-Aware Differential Evolution for Multimodal Optimization Problems [13.8] マルチモーダル最適化問題(MMOP)を解く上では,複数のグローバルピークを同時に検出し,検出したピーク上で一定の精度を達成する方法が重要な2つの課題である。
本稿では,ランドスケープ・アウェア・ディファレンシャル・進化(LADE)アルゴリズムを提案する。
LADEは、最近提案された7つの高性能アルゴリズムと、マルチモーダル最適化のためのIEEE CECコンペティションにおける4つの勝者アルゴリズムと比較して、一般的に良い、あるいは競争的な性能が得られることを示した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:37:55 GMT)
A Review on Organ Deformation Modeling Approaches for Reliable Surgical Navigation using Augmented Reality [13.8] Augmented Reality(AR)は、外科医が患者の体内で重要な構造を可視化できるようにすることで、外科手術に革命をもたらす可能性を秘めている。
手術中の臓器の動的変形から生じる課題は、手術前モデルが術中解剖を忠実に表現するには不十分である。
本稿では,ARガイド下手術における臓器変形モデリングの理解を深め,今後の進歩の可能性について考察する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:03:17 GMT)
COM Kitchens: An Unedited Overhead-view Video Dataset as a Vision-Language Benchmark [13.6] スマートフォンで撮影した未編集のオーバヘッドビュービデオからなる新しいデータセットであるCOM Kitchensを提案する。
未編集のオーバヘッドビュービデオ(DVC-OV)上の新しいビデオ検索タスクOnRRと新しいビデオキャプションドメインDense Video Captioningを提案する。
本実験は,現在のWebビデオベースSOTA方式のタスク処理能力と限界を検証した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:00:10 GMT)
Dynamic Structure Estimation from Bandit Feedback using Nonvanishing Exponential Sums [13.6] ユークリッド空間における周期的に振る舞う離散力学系の動的構造推定問題に取り組む。
我々の主な成果は、指数和の挙動を利用してノイズ効果を効果的に平均化する(計算とサンプル)効率的なアルゴリズムである。
特に、指数和の変種であるワイル和の新しい利用により、線形系に対するスペクトル情報を抽出することができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:47:54 GMT)
Channel Simulation: Finite Blocklengths and Broadcast Channels [13.6] 有限ブロック長系における共通ランダム性支援下でのチャネルシミュレーションについて検討する。
固定誤差耐性の最小シミュレーションコストについて,スムーズなチャネル最大値情報を線形プログラムのワンショット・コンバースとして同定する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:28:04 GMT)
SoK: Fighting Counterfeits with Cyber-Physical Synergy Based on Physically-Unclonable Identifiers of Paper Surface [13.2] 偽造品はサプライチェーンを浸透させることで公衆の安全と健康に深刻な害を与える。
多数の反偽造技術が提案され、その中では、紙表面の固有の不規則性の使用は、高性能な経済ソリューションとして有意義な可能性を示唆している。
本研究は、サプライチェーンのニーズを包括的に分析することにより、これら2つの別個の研究領域を体系的に統一することを目的としている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:53:41 GMT)
Automatic Voice Identification after Speech Resynthesis using PPG [13.0] 音声の再合成は、入力として別の音声で音声を合成したいという一般的なタスクである。
本稿では, PPGに基づく音声合成システムを提案する。
知覚的評価は、それが正しい音質を生み出すことを評価する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:59:40 GMT)
Dissecting Dissonance: Benchmarking Large Multimodal Models Against Self-Contradictory Instructions [13.0] 矛盾するコマンドを認識する上でのLMMの能力を評価するために,自己コントラクショナルインストラクションベンチマークを導入する。
言語とビジョンのパラダイムに均等に分散した2万のコンフリクトで構成されている。
我々の総合的な評価では、現在のLMMは、自己認識の欠如により、マルチモーダルな命令の不一致を特定するのに一貫して苦労している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:56:44 GMT)
A Conceptual Framework for Ethical Evaluation of Machine Learning Systems [12.9] 倫理的意味は、機械学習システムの評価を設計する際に現れる。
本稿では,倫理的評価における重要なトレードオフを,潜在的な倫理的害に対する情報ゲインのバランスとして特徴付けるユーティリティ・フレームワークを提案する。
我々の分析は、倫理的な複雑さを意図的に評価し、管理する開発チームにとって重要な必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:06:49 GMT)
ProCreate, Dont Reproduce! Propulsive Energy Diffusion for Creative Generation [12.8] ProCreateは、拡散に基づく画像生成モデルのサンプルの多様性と創造性を改善するための、シンプルで簡単に実装できる方法である。
ProCreateは,訓練用テキストプロンプトを用いた大規模評価において,トレーニングデータの複製を防止するのに有効であることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:10:52 GMT)
Modelling Visual Semantics via Image Captioning to extract Enhanced Multi-Level Cross-Modal Semantic Incongruity Representation with Attention for Multimodal Sarcasm Detection [12.7] 本研究では,入力三重項を処理可能なマルチモーダルサルカズム検出のための新しいフレームワークを提案する。
提案したモデルは、TwitterのマルチモーダルサルカムとMultiBullyデータセットでそれぞれ92.89%と64.48%の精度を達成する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:07:31 GMT)
Towards AI-Safety-by-Design: A Taxonomy of Runtime Guardrails in Foundation Model based Systems [12.6] ガードレールの特徴と設計の選択肢を分類・比較するために,ガードレールの分類法を提案する。
私たちの分類学は、ランタイムガードレールの採用の背後にあるモチベーション、考慮すべき品質特性、利用可能な設計オプションの3つの主要なカテゴリに分類されます。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:08:51 GMT)
Do Large Language Models Speak All Languages Equally? A Comparative Study in Low-Resource Settings [12.5] 大規模言語モデル (LLM) は自然言語処理 (NLP) に大きな関心を寄せている。
近年の研究では、低リソース言語におけるLLMの限界が強調されている。
英語からバングラ語、ヒンディー語、ウルドゥー語に翻訳することで、感情と憎悪の音声タスクのデータセットを提示する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:09:23 GMT)
SiCo: A Size-Controllable Virtual Try-On Approach for Informed Decision-Making [12.4] VTO(Virtual try-on)アプリケーションは、ユーザが衣服をプレビューできるようにすることで、オンラインショッピング体験を改善することを目的としている。
多くのVTOツールは、衣服のサイズと利用者の身体サイズの間に重要な関係を考慮できない。
SiCoはオンラインのVTOシステムで、ユーザーは自分の画像をアップロードし、服のサイズがどう見えるかを視覚化できる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:46:59 GMT)
SIGMA: Similarity-based Efficient Global Aggregation for Heterophilous Graph Neural Networks [12.3] グラフニューラルネットワーク(GNN)は、グラフ学習において大きな成功を収めているが、ヘテロフィリーに会うとパフォーマンス損失に悩まされる。
我々は,SimRankの構造的類似度測定を統合した,効率的なグローバルヘテロ親和性GNNアグリゲーションであるaggnameを提案する。
より優れた集約と全体的な効率で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:24:09 GMT)
Enhancing Whole Slide Pathology Foundation Models through Stain Normalization [12.2] Stain Normalized Pathology Foundational Model is training using 285,153,903 patch from a total of 34,795 whole slide image (WSIs)
本実験は,Stain Normalized Pathology Foundational Modelが特徴崩壊問題を著しく軽減することを示した。
このことは、染色正規化の適用によりモデルの効率性と一般化能力が大幅に向上したことを示唆している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:45:50 GMT)
Bridging Smoothness and Approximation: Theoretical Insights into Over-Smoothing in Graph Neural Networks [12.0] グラフ上で定義される関数の近似理論について検討する。
グラフ畳み込みネットワーク(GCN)を用いて,対象関数に対する近似の下位境界を評価する枠組みを確立する。
出力の高周波エネルギーがGCNの過度な平滑化の指標である崩壊する様子を示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:50:32 GMT)
PTM4Tag+: Tag Recommendation of Stack Overflow Posts with Pre-trained Models [12.0] 言語モデリングにおいて事前学習モデル(PTM)を利用するStack Overflowポスト用のタグレコメンデーションフレームワークであるPTM4Tag+を提案する。
PTM4Tag+はトリプルトアーキテクチャで実装されており、投稿の3つの重要なコンポーネント、すなわち、タイトル、記述、コード、および独立なPTMを考慮に入れている。
PTM4Tag+ フレームワークで CodeT5 を活用することで,8つの PTM の中で最高の性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:45:27 GMT)
UnifiedMLLM: Enabling Unified Representation for Multi-modal Multi-tasks With Large Language Model [11.9] 統一表現を用いて様々なタスクを表現するために設計された包括的モデルを提案する。
本モデルは,ユーザ指示の暗黙的な意図を理解する上で,強力な能力を示す。
私たちのアプローチは、例外的なスケーラビリティと汎用性を示します。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:27:39 GMT)
Doubly-Dynamic ISAC Precoding for Vehicular Networks: A Constrained Deep Reinforcement Learning (CDRL) Approach [11.8] 車両ネットワークの実現にはISAC技術が不可欠である。
本稿では,ISACプリコーダ設計の動的更新を容易にするために,制約付き深部強化学習(CDRL)を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:46:36 GMT)
The Sociotechnical Stack: Opportunities for Social Computing Research in Non-consensual Intimate Media [11.7] 非合意的親密なメディア(NCIM)は、人物の同意なしに親密なコンテンツを共有することであり、その中には「復讐ポルノ」や性的に露骨なディープフェイクが含まれる。
本稿では,NCIMとそれを促進する特定の技術コンポーネントを結びつけることで,そのギャップを解消する。
技術的スタックをそれに対応する社会的影響にマッピングするために設計された概念的フレームワークである社会技術的スタックを紹介する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:25:29 GMT)
Soft Prompting for Unlearning in Large Language Models [11.5] この研究は、データ保護規制を動機とした大規模言語モデルのための機械学習の研究に焦点をあてる。
我々はtextbfUntextbflearning (SPUL) のための textbfSoft textbfPrompting フレームワークを提案する。
本研究では,提案手法の厳密な評価を行い,SPULが実用性と忘れとのトレードオフを大幅に改善できることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:48:22 GMT)
Learning to Predict Program Execution by Modeling Dynamic Dependency on Code Graphs [11.3] 本稿では,新しい機械学習フレームワークであるCodeFlowrepresentsを紹介する。
コードカバレッジを予測し、動的依存性学習を通じて実行時のエラーを検出する。
経験的評価は、コードカバレッジ予測精度と実行時のエラーの効果的なローカライゼーションにおいて、大幅な改善を示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:32:00 GMT)
SeqLink: A Robust Neural-ODE Architecture for Modelling Partially Observed Time Series [11.3] シーケンス表現の堅牢性を高めるために設計された,革新的なニューラルアーキテクチャであるSeqLinkを紹介する。
我々はSeqLinkが断続時系列のモデリングを改善し、一貫して最先端のアプローチより優れていることを示した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:35:48 GMT)
BioMamba: A Pre-trained Biomedical Language Representation Model Leveraging Mamba [11.0] 本稿では,生物医学的テキストマイニングに特化した事前学習モデルであるBioMambaを紹介する。
実験により、BioMambaは、BioBERTや一般ドメインのMambaなど、様々なバイオメディカルタスクにおいて、かなり優れています。
例えば、BioMambaはBioASQテストセットで100倍のパープレキシティ低下と4倍のクロスエントロピー損失を達成している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:21:36 GMT)
Unsupervised Region-Growing Network for Object Segmentation in Atmospheric Turbulence [10.8] 大気乱流による動画中の移動物体のセグメンテーションに対する教師なしのアプローチを提案する。
まず、高信頼で動く物体の小さな集合を識別し、その後、これらの種子から徐々に前景マスクを成長させ、すべての動く物体を分割する。
その結果, 移動物体のセグメンテーションにおける精度は良好であり, 様々な乱流強度を持つ長距離ビデオに対してロバストであることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:05:54 GMT)
Leveraging Language Model Capabilities for Sound Event Detection [10.8] 本稿では,音声イベントとその時間的位置を同時に生成しながら,音声特徴を理解するためのエンドツーエンドフレームワークを提案する。
具体的には、事前学習された音響モデルを用いて、異なるカテゴリーにわたる識別的特徴を捉え、自動回帰テキスト生成のための言語モデルを用いる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:28:32 GMT)
The Mechanics of Conceptual Interpretation in GPT Models: Interpretative Insights [10.8] 本稿では,大規模言語モデルにおける概念化機構を明らかにする知識編集の革新的バリエーションである概念編集を紹介する。
我々は、トランスモデルのマルチ層パーセプトロン(MLP)、マルチヘッドアテンション(MHA)、および隠れ状態成分を解析する。
我々の研究は、LLMにおける複雑な階層化されたセマンティック処理の性質と、これらのモデルにおける特定の概念の分離と修正の課題を強調している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:50:08 GMT)
GTNet: Graph Transformer Network for 3D Point Cloud Classification and Semantic Segmentation [10.6] グラフベースのディープラーニングネットワークとTransformerベースのディープラーニングネットワークは、さまざまなポイントクラウドタスクで優れたパフォーマンスを示している。
本稿では,Graph Transformerという新機能抽出ブロックを提案し,GTNetと呼ばれる3Dポイントクラウド学習ネットワークを構築した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:40:52 GMT)
Adaptive Learning for Quantum Linear Regression [10.4] 最近の研究で、線形回帰は二次二進最適化問題として定式化された。
このアプローチは、大規模なデータセットに対する計算時間のアドバンテージを約束する。
しかし、解の質は精度ベクトルの必要利用によって制限される。
本研究では,精度ベクター符号化の改良に焦点をあてる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:09:01 GMT)
Zero shot VLMs for hate meme detection: Are we there yet? [10.0] 本研究では,ヘイト・ミーム検出などの複雑なタスクに対する視覚言語モデルの有効性について検討した。
我々は、大きなVLMが未だにゼロショットのヘイトミーム検出に弱いことを観察する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:20:49 GMT)
Deep Unlearning: Fast and Efficient Gradient-free Approach to Class Forgetting [9.9] 学習モデルから特定のクラスを戦略的に除去する新しいクラスアンラーニングアルゴリズムを提案する。
我々のアルゴリズムは、メンバーシップ推論攻撃(MIA)に対する競争的アンラーニング性能とレジリエンスを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:40:07 GMT)
Flow with FlorDB: Incremental Context Maintenance for the Machine Learning Lifecycle [9.8] コード、データ、設定、フィードバックを予測モデルに統合するメタデータは様々で複雑です。
FlorDBは、マルチバージョン後見ロギングとインクリメンタルコンテキストメンテナンスによる摩擦を低減する。
デモで示されているように、FlorDBデータセットを使用して、統合されたトレインインファーパイプラインとマネージドフィードバックループを備えたAI/MLアプリケーションを構築することができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:21:00 GMT)
Optimizing Cox Models with Stochastic Gradient Descent: Theoretical Foundations and Practical Guidances [9.7] 勾配降下(SGD)は、最近Coxモデルの最適化に適応した。
本研究では,SGD推定器がバッチサイズ依存の目的関数を対象とすることを示す。
SGDアプリケーションでバッチサイズを選択するためのガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:25:10 GMT)
Fakes of Varying Shades: How Warning Affects Human Perception and Engagement Regarding LLM Hallucinations [9.7] 本研究の目的は,幻覚の程度を体系的に変化させることで,幻覚の人間の知覚を理解することである。
その結果,真の内容の正しさに悪影響を及ぼすことなく,覚醒検出の精度が向上することが確認された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:05:08 GMT)
VidGen-1M: A Large-Scale Dataset for Text-to-video Generation [9.7] テキスト・ビデオ・モデルのための優れたトレーニングデータセットであるVidGen-1Mを提案する。
このデータセットは、高品質なビデオと、時間的一貫性に優れた詳細なキャプションを保証する。
ビデオ生成モデルをトレーニングするために使用すると、このデータセットは、他のモデルで得られたものを上回る実験結果をもたらす。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:53:23 GMT)
Affect Recognition in Conversations Using Large Language Models [9.7] 影響認識は人間のコミュニケーションにおいて重要な役割を担っている。
本研究では,会話における人間の影響を認識するための言語モデル(LLM)の能力について検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:13:39 GMT)
A Novel Hybrid Approach for Tornado Prediction in the United States: Kalman-Convolutional BiLSTM with Multi-Head Attention [9.5] 竜巻は最も激しい大気渦現象の1つであり、検出と予測に重大な課題を提起している。
地上観測やレーダーデータに大きく依存する従来の手法は、遠距離での精度の低下や偽陽性率の上昇といった問題によって制限されている。
本研究では,Multi-Radar Multi-Sensor(MRMS)システムからSeamless Hybrid Scan Reflectivityデータセットを用いて精度を向上させる。
Kalman-Convolutional BiLSTMとMulti-Head Attentionというハイブリッドモデルを導入し、動的状態推定を改善し、データ内の空間的および時間的依存関係をキャプチャする。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:11:23 GMT)
One-Shot Collaborative Data Distillation [9.4] 大規模な機械学習トレーニングデータセットは、情報的合成データサンプルの小さなコレクションに蒸留することができる。
これらの合成セットは効率的なモデル学習をサポートし、データ共有の通信コストを低減する。
分散環境で合成セットを構築するための簡単な方法は、各クライアントがローカルデータ蒸留を行い、中央サーバでローカルデータ蒸留をマージできるようにすることである。
私たちはCollabDMと呼ばれる最初の共同データ蒸留技術を導入し、これはデータのグローバルな分布を捉え、クライアントとサーバ間の通信を1ラウンドだけ必要とします。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:47:32 GMT)
Enhancing AI-based Generation of Software Exploits with Contextual Information [9.3] この研究では、実際のシェルコードからなるデータセットを使用して、さまざまなシナリオでモデルを評価する。
実験は、不完全記述に対するモデルの弾力性、文脈を活用して精度を高める能力、無関係な情報を識別する能力を評価するように設計されている。
モデルは不要なコンテキストをフィルタリングし、攻撃的なセキュリティコードの生成において高いレベルの精度を維持する能力を示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:52:34 GMT)
Automata-based constraints for language model decoding [9.1] 言語モデル(LM)は、いくつかの形式言語で文字列を生成することがしばしば期待されている。
チューニングにはかなりのリソースが必要で、一般的でない、あるいはタスク固有のフォーマットでは実用的ではない。
我々はこれらの問題をオートマトン理論を適用して解決する。
我々のシステムは、7000倍高速に制約をコンパイルし、確実に正確であり、モジュール方式で拡張することができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:08:31 GMT)
Conditioning of Banach Space Valued Gaussian Random Variables: An Approximation Approach Based on Martingales [8.8] ガウス確率変数として有意な2つのバナッハ空間の条件分布について検討する。
それらの手段と共分散は、マルティンゲールアプローチに基づく一般的な有限次元近似スキームによって決定されることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:01:47 GMT)
PROF: Protected Order Flow in a Profit-Seeking World [8.8] この研究は、既存のPBSシステムにおける有害な最大抽出値(MEV)を制限するためにPROFと呼ばれるシステムを導入している。
PROFは、プライベートに入力されたトランザクションのセット(バンドル)に注文を課し、プロダクションをブロックするためにすべての注文を強制します。
我々はPROFのインセンティブ構造を定量的に定性的に分析し、既存のソリューションと比較してユーザに対して有用性を示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:26:10 GMT)
Heterogeneous graph attention network improves cancer multiomics integration [8.7] 癌診断を改善するため,オミクス統合のための異種グラフアテンションネットワーク(HeteroGATomics)を導入する。
3つのがんマルチオミクスデータセットの実験は、HeteroGATomicsのがん診断における優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:01:13 GMT)
LC-LLM: Explainable Lane-Change Intention and Trajectory Predictions with Large Language Models [8.6] 既存の動き予測手法は、特に長期予測精度と解釈可能性の観点から、改善の余地が十分にある。
本稿では,大規模言語モデルの強い推論能力と自己説明能力を活用する,説明可能なレーン変更予測モデルLC-LLMを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:47:09 GMT)
Review of coreference resolution in English and Persian [8.6] 参照解決(CR)は、同じ現実世界の実体を参照する表現を識別する。
本稿では、コア参照とアナフォラ分解能にまたがるCRの最近の進歩について考察する。
ペルシャのCRの独特な課題を認識し、このアンダーリソース言語に焦点をあてる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:24:09 GMT)
FroSSL: Frobenius Norm Minimization for Efficient Multiview Self-Supervised Learning [8.6] FroSSLは、共分散固有値正則化を調整し、より多くのビューを使用する。
我々は,FroSSLが他のSSLメソッドよりも高速に競合精度に達することを示す。
また、FroSSLは、複数のデータセット上でResNet-18をトレーニングする際に、線形プローブ評価の競合表現を学習することを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:24:09 GMT)
RAG Foundry: A Framework for Enhancing LLMs for Retrieval Augmented Generation [8.4] 我々は、RAGのユースケースのための大規模言語モデルを拡張するためのオープンソースのフレームワークであるRAG Foundryを紹介します。
RAG Foundryはデータ生成、トレーニング、推論、評価を単一のワークフローに統合する。
多様なRAG構成を持つLlama-3およびPhi-3モデルを拡張し,微調整することで,フレームワークの有効性を示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:16:24 GMT)
APARATE: Adaptive Adversarial Patch for CNN-based Monocular Depth Estimation for Autonomous Navigation [8.2] 単眼深度推定(MDE)は、革新的なアーキテクチャ、すなわち畳み込みニューラルネットワーク(CNN)とトランスフォーマーの統合により、性能が大幅に向上した。
これらのモデルの敵攻撃に対する感受性は、特に安全性とセキュリティが最優先の領域において注目に値する関心事となっている。
この懸念は、正確なシーン理解が重要である自律運転やロボットナビゲーションといったアプリケーションにおいて重要な役割を担っているため、MDEにとって特に重みとなる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:37:37 GMT)
On the Growth of Mistakes in Differentially Private Online Learning: A Lower Bound Perspective [8.1] 我々は、差分的プライベート(DP)オンライン学習アルゴリズムに対して、より低いバウンダリを提供する。
我々の研究は、DP-オンライン学習の下位境界の設定に向けた最初の成果である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:08:49 GMT)
Explain via Any Concept: Concept Bottleneck Model with Open Vocabulary Concepts [8.0] OpenCBMはオープン語彙の概念を持つ最初のCBMである。
ベンチマークデータセットCUB-200-2011の分類精度は,従来のCBMよりも9%向上した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:42:00 GMT)
Think-on-Graph 2.0: Deep and Interpretable Large Language Model Reasoning with Knowledge Graph-guided Retrieval [7.9] Think-on-Graph 2.0は、知識グラフと質問を一致させ、ナビゲーションツールとして使用する、拡張されたRAGフレームワークである。
KG誘導航法は、論理的整合性を維持するために深海と長距離の関連を育成する。
ToG$2.0$は、LLMの応答の精度と信頼性を改善するだけでなく、ハイブリッド構造化知識システムの可能性も示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:51:15 GMT)
SpecRover: Code Intent Extraction via LLMs [7.7] 仕様推論は、高品質なプログラムパッチを作成するのに役立ちます。
当社のアプローチであるSpecRover(AutoCodeRover-v2)は,オープンソースのLLMエージェントであるAutoCodeRover上に構築されています。
2294のGitHubイシューからなる完全なSWE-Benchの評価では、AutoCodeRoverよりも50%以上改善されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:53:01 GMT)
SSAP: A Shape-Sensitive Adversarial Patch for Comprehensive Disruption of Monocular Depth Estimation in Autonomous Navigation Applications [7.6] SSAP(Shape-Sensitive Adrial Patch)は,自律ナビゲーションアプリケーションにおける単眼深度推定(MDE)を阻害する新しい手法である。
我々のパッチは、推定距離を歪ませたり、システムの観点から消える物体の錯覚を作り出すことによって、2つの異なる方法でMDEを選択的に弱体化させる。
提案手法は平均深度推定誤差が0.5を超え,CNNベースMDEモデルの目標領域の99%に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:39:15 GMT)
Faux Polyglot: A Study on Information Disparity in Multilingual Large Language Models [7.6] Retrieval Augmented Generation (RAG)により、Large Language Models (LLM) は情報検索において重要な役割を担っている。
RAGに基づく情報検索において,LLMの言語的嗜好について検討した。
その結果,LLMは問合せ言語と同一言語における情報に対して,情報検索と回答生成の両方において,体系的な偏りを示した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:22:58 GMT)
Multistain Pretraining for Slide Representation Learning in Pathology [7.6] 自己教師付き学習モデルは、全スライド画像の普遍的および伝達可能な表現を学習することができる。
スライド表現学習のためのマルチモーダル事前学習戦略であるMadeleineを導入する。
マドレーヌが様々な下流評価で学んだスライド表現の質を実証する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:59:50 GMT)
You Only Acquire Sparse-channel (YOAS): A Unified Framework for Dense-channel EEG Generation [7.5] スパースチャネル脳波信号から高密度チャネルデータを生成するためのフレームワークを開発する。
YOASは、データ準備、データ前処理、バイアスドEEG生成、合成EEG生成の4段階からなる。
疎チャネルデータから高密度チャネルEEG信号を生成するこのブレークスルーは、EEG信号処理と応用の新たな道を開く。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:23:17 GMT)
Towards Identifying Code Proficiency through the Analysis of Python Textbooks [7.4] 目的は、開発者がソースコードの一部を理解する必要がある熟練度を測定することである。
専門家の意見や開発者調査に大きく依存した以前の試みは、かなりの相違を招いた。
本稿では,Python プログラミング教科書の体系的解析を通じて,Python の能力レベルを同定する手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:37:10 GMT)
An investigation into the causes of race bias in AI-based cine CMR segmentation [7.3] 心臓磁気共鳴(CMR)画像の分類とセグメンテーションの一連の実験を英国バイオバンクで行った。
画像だけでは高い精度でレースを予測できるが、地上の真実のセグメンテーションでは精度は低い。
分類モデルで最も注目されたのは皮下脂肪などの非ハート領域であった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:40:33 GMT)
Quantised Global Autoencoder: A Holistic Approach to Representing Visual Data [7.2] 量子化されたオートエンコーダでは、画像は通常、局所的なパッチに分割され、それぞれが1つのトークンでエンコードされる。
本手法は,入力信号を大域周波数の重畳に変換するスペクトル分解に着想を得たものである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:50:03 GMT)
Large Language Model Aided QoS Prediction for Service Recommendation [7.1] 大規模言語モデル(LLM)は近年急速に改善され、広範囲のアプリケーションで使用されている。
本稿では、LLMを用いてWebユーザやサービスの属性から有用な情報を抽出する、大規模言語モデル支援予測(llmQoS)モデルを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:54:52 GMT)
Spatial-temporal Graph Convolutional Networks with Diversified Transformation for Dynamic Graph Representation Learning [6.9] 本研究では,多角化変換(STGCNDT)を用いた時空間グラフ畳み込みネットワークを提案する。
a) テンソルM-積を用いてテンソルM-積を個別に表現することなく統一グラフテンソル畳み込みネットワーク(GTCN)を構築するb) 時間的情報を集約するために複雑な時間的パターンをモデル化するためにGTNに3つの変換スキームを導入する、c) 多様化された変換のアンサンブルを構築して高い表現能力を得る、という3つの側面を含む。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:40:47 GMT)
PENDRAM: Enabling High-Performance and Energy-Efficient Processing of Deep Neural Networks through a Generalized DRAM Data Mapping Policy [6.9] 畳み込みニューラルネットワーク(CNN)は、機械学習タスクを解決する最先端のソリューションとして登場した。
CNNアクセラレータは、高オフチップメモリ(DRAM)アクセスレイテンシとエネルギのために、パフォーマンスとエネルギー効率の課題に直面している。
本稿では,高性能でエネルギー効率の良いCNN加速を実現する新しい設計空間探索手法であるPENDRAMを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:11:09 GMT)
Evaluating the Performance of Large Language Models for SDG Mapping (Technical Report) [6.8] 大規模言語モデル(LLM)は、サードパーティにデータを提供する必要をなくすことで、データのプライバシ保護を可能にする。
持続可能な開発目標マッピングタスクにおいて,様々な言語モデルの性能を比較した。
この研究の結果によると、LLaMA 2とGemmaは依然として改善の余地がある。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:05:02 GMT)
Enhanced quantum hypothesis testing via the interplay between coherent evolution and noises [6.7] 量子仮説テスト(QHT)におけるノイズの役割は、十分に解明されていない。
超低磁場核磁気共鳴スピン系の設定において、ノイズ支援QHTプロトコルを考案し、実験的に実装した。
実験結果から,QHTのノイズダイナミクスによる成功確率は,単体進化のみによって設定された天井を超えることが確認された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:32:24 GMT)
Algorithm-Informed Graph Neural Networks for Leakage Detection and Localization in Water Distribution Networks [6.7] 漏水は配水ネットワークの効率的かつ持続可能な管理にとって重要な課題である。
近年のアプローチでは、グラフベースのデータ駆動方式が採用されている。
本稿では,アルゴリズムインフォームドグラフニューラルネットワーク(AIGNN)を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:25:05 GMT)
SNFinLLM: Systematic and Nuanced Financial Domain Adaptation of Chinese Large Language Models [6.6] 大規模言語モデル (LLM) は、金融業界において自然言語処理を推進するための強力なツールとなっている。
SNFinLLMという中国の金融ドメイン向けに設計された新しい大規模言語モデルを提案する。
SNFinLLMは、質問への回答、財務調査レポートの要約、感情の分析、財務計算の実行など、ドメイン固有のタスクに優れています。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:24:24 GMT)
Integer Programming for Learning Directed Acyclic Graphs from Non-identifiable Gaussian Models [6.5] 本研究では,連続観測データから有向非巡回グラフを学習する問題について検討する。
中規模の問題を学習するための混合整数プログラミングフレームワークを開発した。
提案手法は最先端のアルゴリズムより優れ,ノイズの不均一性に対して頑健である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:52:54 GMT)
Counterfactual Shapley Values for Explaining Reinforcement Learning [6.5] 本稿では、強化学習(RL)における説明可能性を高める新しいアプローチとして、CSV(Counterfactual Shapley Values)を提案する。
このアプローチは、異なる状態次元のコントリビューションをさまざまなアクション選択に定量化し比較することを目的としている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:49:12 GMT)
UniHENN: Designing More Versatile Homomorphic Encryption-based CNNs without im2col [6.5] ホモモルフィック暗号化(HE)は、復号化せずに暗号化データの計算を可能にすることによって、プライバシー保護の深層学習を可能にする。
HEで畳み込みニューラルネットワーク(CNN)をデプロイするのは、im2col技術を用いて、入力データを畳み込みのための2次元行列に変換する必要があるため、難しい。
UniHENNは、新しいHEベースのCNNアーキテクチャで、im2colの必要性を排除し、その汎用性と幅広いCNNモデルとの互換性を高める。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:35:36 GMT)
Infusing Emotions into Task-oriented Dialogue Systems: Understanding, Management, and Generation [6.4] 感情は人間のコミュニケーションには不可欠であるが、タスク指向対話(ToD)モデリングでは見過ごされがちである。
本研究では,完全なToD処理ループに感情を組み込み,理解,管理,生成を行う。
提案手法がユーザの感情経験とタスク成功を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:21:04 GMT)
Sparse Deep Learning Models with the $\ell_1$ Regularization [6.3] スパースニューラルネットワークはディープラーニングにおいて非常に望ましい。
正規化パラメータの選択が学習ニューラルネットワークのスパーシリティレベルに与える影響について検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:38:45 GMT)
Bidirectional classical communication cost of a bipartite quantum channel assisted by non-signalling correlations [6.1] 本稿では,非シグナリング相関による二部分量子チャネルのシミュレーションによる双方向の古典的通信コストについて検討する。
非シグナリング双極子超チャネルによる一ショットの双方向古典通信コストに対する半定値プログラミング(SDP)の定式化を導出する。
我々の結果は、量子通信における非局所性の役割を解明し、バイパルタイトシナリオにおける量子反転シャノン理論の探索の道を開く。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:30:50 GMT)
HAIFIT: Fashion Image Translation for Human-to-AI Style Learning and Generation [6.0] 本稿では,スケッチを高忠実なライフスタイルの衣料品画像に変換する新しいアプローチであるHAIFITを紹介する。
本手法は, ファッションデザインに欠かせない, 独特のスタイルの保存に優れ, 細部が複雑である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:37:48 GMT)
AutoFL: A Tool for Automatic Multi-granular Labelling of Software Repositories [6.0] AutoFLは、ソースコードからソフトウェアリポジトリを自動的にラベル付けするツールである。
textitfile、textitpackage、textitproject-levelを含む、複数の粒度のアノテーションを可能にする。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:34:26 GMT)
SLO-aware GPU Frequency Scaling for Energy Efficient LLM Inference Serving [6.0] 本稿では,Service-Level Objectives に適合しながら,消費電力を削減するフレームワーク textitthrottLL'eM を提案する。
textitthrottLL'eMは将来のKVキャッシュ使用量とバッチサイズを予測するメカニズムを備えている。
提案したMLモデルは0.97以上のR2$スコアを達成し,平均1秒あたり1イテレーション未満のパフォーマンスを予測した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:07:06 GMT)
TinyCL: An Efficient Hardware Architecture for Continual Learning on Autonomous Systems [6.0] 資源制約された自律システム上で連続学習を行うためのハードウェアアーキテクチャであるTinyCLを提案する。
TinyCLは、前方と後方の両方の伝搬を実行する処理ユニットと、メモリベースのCLワークロードを管理する制御ユニットで構成される。
我々の知る限り、提案したTinyCLは、自律システム上でCLを実行する最初のハードウェアアクセラレータである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:56:33 GMT)
Revolutionizing Urban Safety Perception Assessments: Integrating Multimodal Large Language Models with Street View Images [5.8] 都市の安全知覚を測定することは、伝統的に人的資源に大きく依存する重要かつ複雑な作業である。
マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、強力な推論と分析能力を示している。
都市全体の安全指標を迅速に評価するための,CLIP機能とK-Nearest Neighbors(K-NN)検索に基づく手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:29:47 GMT)
Synergistic Learning with Multi-Task DeepONet for Efficient PDE Problem Solving [5.7] マルチタスク学習(MTL)は、複数のタスクから有用な情報を活用し、一般化性能を向上させるために設計された帰納的伝達機構である。
本研究では、偏微分方程式(PDE)によって支配される科学と工学の問題にMTLを適用した。
マルチタスク・ディープ・オペレーター・ネットワーク(MT-DeepONet)を用いて、PDEと複数のジオメトリの様々な関数型ソース・用語の解を同時学習セッションで学習する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:50:58 GMT)
Practical Attacks against Black-box Code Completion Engines [5.6] 我々は、脆弱性のあるコードを生成するためのコード補完エンジンを誘導する新しい攻撃であるINSECを提示する。
GitHub Copilotのようなほとんどの商用補完エンジンと同様に、INSECはターゲットエンジンへのブラックボックスクエリアクセスのみを前提としている。
我々の攻撃は、完了入力に悪意のある攻撃文字列を短いコメントとして挿入することで機能する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:31:26 GMT)
Terracorder: Sense Long and Prosper [5.5] In-situSensorデバイスは、長期間にわたってリモート環境にデプロイする必要がある。
Terracorderは多機能なマルチセンサーデバイスである。
デバイス上での強化学習スケジューラを用いて、非常に低消費電力の電力を実演する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:01:42 GMT)
The Cultivated Practices of Text-to-Image Generation [5.5] 人間は誰でも生成人工知能(AI)を使ってデジタル情報を合成できる新しい創造的時代に入った
特にテキスト・ツー・イメージ・ジェネレーションは非常に人気があり、何百万人もの実践者がAI生成画像やAIアートをオンラインで制作している。
この章ではまず、健全な共同創造型オンラインエコシステムが急速に出現する上で重要な展開の概要を紹介します。
AIアートコミュニティによって受け入れられた創造的なプラクティスである、プロンプトエンジニアリングに特に焦点が当てられている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:28:59 GMT)
PathoDuet: Foundation Models for Pathological Slide Analysis of H&E and IHC Stains [5.4] PathoDuetは、病理組織像の事前訓練された一連のモデルであり、組織化学における新しい自己教師型学習フレームワークである。
このフレームワークは、新しく導入されたプリテキストトークンと後続のタスクライザーによって特徴付けられ、画像間の特定の関係を明示的に活用する。
クロススケール位置決めとクロスステイン転送という2つのプレテキストタスクは、モデルがヘマトキシリンとエオシンの画像で事前訓練されるように設計されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:21:16 GMT)
On the resilience of the quadratic Littlewood-Offord problem [5.3] 本稿では,Rademacher計算の反集束特性の統計的レジリエンスについて検討する。
双線型形式と二次形式に特に重点を置いており、より強く見積もられている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:22:56 GMT)
PBSCR: The Piano Bootleg Score Composer Recognition Dataset [5.3] PBSCR(PBSCR)は、クラシックピアノ音楽の作曲家認識を研究するためのデータセットである。
9クラス認証タスクには4万の62x64ブートレグスコアイメージ、100クラス認証タスクには10万の62x64ブートレグスコアイメージ、事前トレーニングには未ラベルの可変長ブートレグスコアイメージ29,310が含まれる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:55:11 GMT)
XMainframe: A Large Language Model for Mainframe Modernization [5.2] メインフレームオペレーティングシステムは、金融や政府といった重要なセクターをサポートし続けている。
これらのシステムは時代遅れと見なされ、大規模な保守と近代化を必要としている。
我々は,レガシシステムやメインフレームの知識に特化して設計された,最先端の大規模言語モデル(LLM)であるXMainframeを紹介した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:01:10 GMT)
Curriculum learning based pre-training using Multi-Modal Contrastive Masked Autoencoders [5.1] 本稿では,RGB-Dを利用したカリキュラム学習(CL)パラダイムに基づく画像理解タスクの事前学習手法を提案する。
マルチモーダル・コントラスト・マスケッド・オートエンコーダとデノライズ技術を利用する。
我々のアプローチはスケーラブルで堅牢で、限られたRGB-Dデータセットで事前トレーニングに適しています。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:33:59 GMT)
The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control [5.0] 2024年は、分析翻訳品質評価のための多次元品質指標フレームワークの10周年である。
本稿では,最新のMQM開発について詳述し,3つのサンプルサイズ範囲にわたる翻訳品質測定への普遍的アプローチを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:54:39 GMT)
Infusion: internal diffusion for inpainting of dynamic textures and complex motion [4.9] ビデオの塗装は、ビデオ内の領域を視覚的に説得力のある方法で埋める作業である。
拡散モデルは、画像やビデオを含む複雑なデータ分散をモデル化する際、印象的な結果を示している。
ビデオインペイントの場合,ビデオの自己相似性が高いため,拡散モデルのトレーニングデータは入力ビデオに制限され,満足な結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:47:19 GMT)
Scribble-Based Interactive Segmentation of Medical Hyperspectral Images [4.7] 本研究は、医用ハイパースペクトル画像のためのスクリブルベースのインタラクティブセグメンテーションフレームワークを導入する。
提案手法は,特徴抽出のための深層学習と,ユーザが提供するスクリブルから生成された測地距離マップを利用する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:33:07 GMT)
Relational Representation Learning Network for Cross-Spectral Image Patch Matching [4.6] 既存の研究は、画像パッチの特徴間の多様な関係を抽出することに焦点を当てている。
本稿では,個々の画像パッチの内在的特徴を十分にマイニングすることに焦点を当てた,革新的な表現学習概念を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:22:13 GMT)
Unsupervised Change Detection for Space Habitats Using 3D Point Clouds [4.6] この研究は、将来の宇宙空間における自律的なロボットケアを可能にするために、点雲からシーン変化を検出するアルゴリズムを提案する。
このアルゴリズムは、NASA Ames Granite LabのAstrobeeロボットが収集したテストデータセットを用いて、定量的かつ質的に検証されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:49:51 GMT)
Non-Hermitian entanglement dip from scaling-induced exceptional criticality [4.6] 我々は, エントロピースケーリングにおいて, 劇的なばらつきを示す非エルミート臨界遷移のクラスを報告した。
スケーリングによって誘導される例外臨界(SIEC)は、例外的境界状態や非エルミート皮膚効果(NHSE)によるギャップ閉鎖のような既存の非エルミート的メカニズムを超越する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:00:06 GMT)
Dialogue Ontology Relation Extraction via Constrained Chain-of-Thought Decoding [4.5] 本研究では,伝達学習における関係抽出に焦点をあてる。
我々は最近、推論問題のために開発されたChain-of-Thoughtデコーディングを生成的関係抽出に適用した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:10:01 GMT)
Examining Gender and Power on Wikipedia Through Face and Politeness [4.4] 社会言語学理論の2つの相互依存概念(顔の振る舞いと丁寧さ)を組み合わせることで談話を分析する枠組みを提案する。
我々は、ウィキペディアのトークページに顔のアクトをアノテートして作成した新しいコーパスを導入し、これを使って顔のアクトタグを訓練する。
次に、ウィキペディアの編集者間の議論において、顔と礼儀正しさがジェンダーとパワーとどのように相互作用するかを研究するために、我々のフレームワークを使用します。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:28:58 GMT)
AltCanvas: A Tile-Based Image Editor with Generative AI for Blind or Visually Impaired People [4.4] 視覚障害のある人は、しばしば視覚要素に大きく依存するコンテンツを作成するのに苦労する。
イメージを並べて構築する既存の描画ツールは、数学のような単純なタスクには適しているが、表現力のあるアートワークには向いていない。
我々の研究は、ジェネレーティブAIと建設的なアプローチを統合し、ユーザーが制御と編集能力を増強する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:47:36 GMT)
Earth System Data Cubes: Avenues for advancing Earth system research [4.4] 地球系データキューブ(ESDC)は、このデータの洪水をシンプルで堅牢なフォーマットに変換するのに適したソリューションの1つとして登場した。
ESDCは、データをテンポラリグリッドを備えた分析可能なフォーマットに整理することで、これを実現している。
新たなクラウドベースの技術に照らして、データの潜在能力を最大限に実現するための障壁がある。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:50:16 GMT)
Context Conquers Parameters: Outperforming Proprietary LLM in Commit Message Generation [4.4] オープンソースのLarge Language Modelsは、OMGが生成したものに匹敵するコミットメッセージを生成することができる。
4ビット量子化8BオープンソースLLMを用いたCMG手法であるlOcal MessagE GenerAtorを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:26:41 GMT)
Infusing Environmental Captions for Long-Form Video Language Grounding [4.4] 長大なビデオ言語グラウンドリング(VLG)の問題に取り組む。
本稿では,マルチモーダル大規模言語モデル(MLLM)が提供するリッチなテキスト情報を利用したVLG手法であるEI-VLGを提案する。
提案手法の有効性を,EgoNLQベンチマークを用いた広範囲な実験により検証した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:19:52 GMT)
Reinforcement learning-based architecture search for quantum machine learning [4.3] 量子機械学習モデルは符号化回路を使用して、データを量子ヒルベルト空間にマッピングする。
本稿では,問題固有の符号化回路を生成するために,強化学習技術を用いた新しい手法を提案する。
本研究は,QMLモデルの性能向上における問題固有符号化回路の有効性を強調した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:02:26 GMT)
Entity Retrieval for Answering Entity-Centric Questions [4.3] 本稿では,質問文書の類似性に頼るのではなく,検索文書を識別するために,質問内の健全な実体に依存する新しい検索手法を提案する。
以上の結果から,本手法はエンティティ中心の質問に対してより正確な回答をもたらすだけでなく,より効率的に操作できることが判明した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:23:20 GMT)
On the Robustness of Malware Detectors to Adversarial Samples [4.3] 逆の例では、入力に知覚不可能な変更を加え、機械学習モデルで誤分類を誘発する。
彼らは画像分類のような領域で重要な課題を提起することが示されている。
敵対的な例は、マルウェア分析においても研究されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:41:07 GMT)
RECE: Reduced Cross-Entropy Loss for Large-Catalogue Sequential Recommenders [4.2] 本稿では,RECE(Reduced Cross-Entropy)の損失について紹介する。
RECEは、完全なCE損失の最先端性能を享受しながら、メモリ消費を大幅に削減する。
各種データセットによる実験結果から,RECEは既存の手法に比べて最大12倍のトレーニングピークメモリ使用量を削減できることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:02:29 GMT)
Generative User-Experience Research for Developing Domain-specific Natural Language Processing Applications [4.1] 本稿では、生成UX研究をドメインNLPアプリケーションに組み込むための新しい手法を提案する。
生成UX研究は、プロトタイプ開発の初期段階、すなわちアイデアと概念評価、およびシステムの有用性とユーザ有用性を評価するための最終段階において、ドメインユーザーを採用する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:45:44 GMT)
Perfect Information Monte Carlo with Postponing Reasoning [4.1] In this study introduceds Extended Perfect Information Monte Carlo (EPIMC), a online algorithm that the state-of-the-the-art determinization-based approach Perfect Information Monte Carlo (PIMC)。
EPIMCは完全な情報解決を延期し、戦略融合に関連する問題を緩和する。
戦略融合がゲームプレイに大きく影響を与えるゲームでは,特に顕著なパフォーマンス向上がみられた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:12:48 GMT)
An investigation on the use of Large Language Models for hyperparameter tuning in Evolutionary Algorithms [4.1] 最適化ログをオンラインで分析するために,オープンソースのLarge Language Models (LLM) を2つ採用している。
本研究では, (1+1)-ESのステップサイズ適応の文脈におけるアプローチについて検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:20:41 GMT)
Advancing Post-OCR Correction: A Comparative Study of Synthetic Data [4.0] 我々は,コンピュータビジョン特徴検出アルゴリズムを利用して,OCR後合成データ構築のためのグリフ類似性を計算するアルゴリズムを提案する。
ByT5のようなモデルでは、手動でアノテートするデータを必要とせずにキャラクタエラー率(CER)を大幅に削減できることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:56:37 GMT)
Observation of the Quantum Zeno Effect on a NISQ Device [3.9] 我々は、IBMの量子体験デバイス上で、単一の量子ビット上で量子ゼノ効果(QZE)を研究する。
我々はラビの進化と自由崩壊の2つの可能性を考える。
いずれの場合も、QZEの発生は、測定回数による生存確率の増加として観察される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:24:34 GMT)
Critical sensing with a single bosonic mode without boson-boson interactions [3.9] 我々はこれらの条件のどちらも必要としない単純な臨界量子センシング手法を提案する。
このスキームは、イオントラップや超伝導回路など、様々なシステムで実現可能である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:27:03 GMT)
Sky-GVIO: an enhanced GNSS/INS/Vision navigation with FCN-based sky-segmentation in urban canyon [3.9] 都市キャニオン環境では、高層建築物によるスタンドアロンセンサと非視線(NLOS)の脆弱性が位置決め結果に深刻な影響を及ぼす。
これらの課題に対処するために、NLOS検出のためにFCN(Fully Convolutional Network)に基づくスカイビュー画像分割アルゴリズムを提案する。
新たなNLOS検出・緩和アルゴリズム(S-NDM)は、密結合したグローバルナビゲーション衛星システム(GNSS)、慣性計測ユニット(IMU)、Sky-GVIOと呼ばれる視覚機能システムに拡張されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:13:06 GMT)
Stem-JEPA: A Joint-Embedding Predictive Architecture for Musical Stem Compatibility Estimation [3.9] マルチトラックデータセットでトレーニングした新しいJEPA(Joint-Embedding Predictive Architecture)であるStem-JEPAを紹介する。
本モデルでは, エンコーダと予測器の2つのネットワークから構成される。
MUSDB18データセットの検索タスクにおいて、本モデルの性能を評価し、ミキシングから欠落した茎を見つける能力を検証した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:34:40 GMT)
BSRBF-KAN: A combination of B-splines and Radial Basic Functions in Kolmogorov-Arnold Networks [3.8] BSRBF-KANはコルモゴロフ・アーノルドネットワーク (KAN) で、Bsplines と radial basis function (RBF) を組み合わせてベクトルをデータトレーニングに適合させる。
BSRBF-KANは5回のトレーニングセッションで安定性を示し、MNISTでは97.55%、FashionMNISTでは89.33%である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:39:17 GMT)
Enhancing Heterogeneous Knowledge Graph Completion with a Novel GAT-based Approach [3.8] 異種知識グラフのための新しいGATベースの知識グラフ補完法を提案する。
GATHには2つの異なるアテンションネットワークモジュールが組み込まれている。
我々のモデルは、FB15K-237データセットで5.2%と5.2%、WN18RRデータセットで4.5%と14.6%の性能を改善する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:28:51 GMT)
DisCoM-KD: Cross-Modal Knowledge Distillation via Disentanglement Representation and Adversarial Learning [3.8] クロスモーダル知識蒸留(英語: Cross-modal knowledge distillation, CMKD)とは、学習フレームワークが、モダリティミスマッチを示すトレーニングとテストデータを扱う必要があるシナリオを指す。
DisCoM-KD (Disentanglement-learning based Cross-Modal Knowledge Distillation) は、モジュールごとの情報の種類を明示的にモデル化する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:44:15 GMT)
Quantum Clustering for Cybersecurity [3.7] 我々は、2022年のCISA Known Exploited Vulnerabilitiesカタログのデータを用いて、サイバーセキュリティの脆弱性を分析する新しい量子機械学習(QML)フレームワークを開発した。
我々のフレームワークは、これらのデータを量子互換フォーマットにプリプロセスし、先進的な量子技術によるクラスタリング分析を可能にします。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:48:03 GMT)
Mitigating Malicious Attacks in Federated Learning via Confidence-aware Defense [3.7] Federated Learning(FL)は、複数のクライアントがプライベートなローカルデータを共有せずにグローバルモデルのトレーニングを行うことのできる、新興の分散機械学習パラダイムである。
FLシステムは悪意のあるクライアントからの攻撃に弱いため、データ中毒やモデル中毒によってグローバルモデルのパフォーマンスを低下させることができる。
既存の防衛方法は通常、ビザンティン攻撃やバックドア攻撃のような単一のタイプの攻撃に焦点を当てる。
本稿では,クライアントモデル更新の不確実性を評価し,悪意のあるクライアントを検知・防御するモデル信頼性スコアに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:27:45 GMT)
Less Is More: A Mixed-Methods Study on Security-Sensitive API Calls in Java for Better Dependency Selection [3.7] 本研究の目的は,コールグラフ解析を通じて,セキュリティに敏感なAPIを依存性として理解することで,依存関係の選択を支援することである。
機能的に類似したパッケージのセキュリティに敏感なAPI呼び出しの数は、1つのAPIカテゴリで0から368、合計で0から429まで様々である。
調査の結果,73%の開発者が,機能的に類似したパッケージのセキュリティに敏感なAPI呼び出しの数やタイプに関する情報が,依存関係の選択に有用であることを確認した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:01:18 GMT)
A Multi-Source Heterogeneous Knowledge Injected Prompt Learning Method for Legal Charge Prediction [3.5] 本稿では,ケース記述をモデル化するための素早い学習フレームワークに基づく手法を提案する。
我々は,法的知識ベース,会話型LLM,法的記事から多元的外部知識を活用する。
提案手法は,CAIL-2018の法定電荷予測データセットとして最大である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:53:17 GMT)
VoxelTrack: Exploring Voxel Representation for 3D Point Cloud Object Tracking [3.5] 現在のLiDARポイントクラウドベースの3Dオブジェクトトラッキング(SOT)手法は、通常、ポイントベースの表現ネットワークに依存している。
本稿では,VoxelTrackと呼ばれる新しいトラッキングフレームワークを紹介する。
本質的に乱れた点雲を3Dボクセルにボクセル化することで、VoxelTrackは正確で堅牢な3D空間情報を効果的にモデル化する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:38:43 GMT)
StoDIP: Efficient 3D MRF image reconstruction with deep image priors and stochastic iterations [3.4] StoDIPは, 3次元MRFイメージングに基いて, 地上構造のないDeep Image Prior (DIP) 再構成を拡張した新しいアルゴリズムである。
健康なボランティアの脳全体をスキャンしたデータセットで、StoDIPは、質的にも質的にも、地道な再建ベースラインよりも優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:32:06 GMT)
DRFormer: Multi-Scale Transformer Utilizing Diverse Receptive Fields for Long Time-Series Forecasting [3.4] 本稿では,動的スパース学習アルゴリズムを用いた動的トークン化手法を提案する。
提案するDRFormerは,実世界の様々なデータセットを用いて評価し,既存の手法と比較して,その優位性を示す実験結果を得た。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:26:47 GMT)
Fine-Tuning Large Language Models for Stock Return Prediction Using Newsflow [3.3] 大規模言語モデル(LLM)とその微調整技術は、様々な言語理解および生成タスクにおいて優れた性能を示している。
本稿では,金融ニュースフローを用いた株価リターン予測のための微調整LDMについて検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:13:57 GMT)
On the Variability of AI-based Software Systems Due to Environment Configurations [3.3] 環境構成がこれらのシステムの多様性にどのように影響するかはまだ検討されていない。
我々は、30のオープンソースAIベースのシステム上で、3つの主要な環境変数を8つの異なる組み合わせで実験を行った。
以上の結果から,3つの指標すべてに変動性が存在することが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:47:14 GMT)
Maximum mean discrepancies of Farey sequences [3.3] クラスは、少なくとも1-半の順序のすべてのマトエルン核を含む。
このクラスは、少なくとも半順序のすべてのマトエルン核を含む。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:33:24 GMT)
Can Reinforcement Learning Unlock the Hidden Dangers in Aligned Large Language Models? [3.3] 大規模言語モデル(LLM)は、自然言語処理における印象的な機能を示している。
しかし、これらのモデルによって有害なコンテンツを生成する可能性は持続しているようだ。
本稿では,LLMをジェイルブレイクし,敵の引き金を通したアライメントを逆転させる概念について検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:27:29 GMT)
Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval [3.2] ANNEALは、類似した、異種のイメージペアで構成された、小さくて情報的なトレーニングセットを作成することを目的としている。
不確実性と多様性の基準を組み合わせることにより、画像対の情報性を評価する。
このアノテート方式は、ランド・ユース・ランド・カバー・クラスラベルによるアノテート画像と比較して、アノテーションコストを著しく削減する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:06:35 GMT)
OneLove beyond the field -- A few-shot pipeline for topic and sentiment analysis during the FIFA World Cup in Qatar [3.2] カタールで開催されたFIFAワールドカップはニュースやソーシャルメディアで広く議論された。
OneLoveのアームバンドを着用することは、計画された抗議活動の一部だった。
FIFAがこれを着用する船長に制裁を課すと脅したことで、論争が巻き起こった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:40:40 GMT)
Comparison of Code Quality and Best Practices in IoT and non-IoT Software [3.1] 私たちは、IoTと非IoTシステムの2つの等価セットのコード品質を比較します。
次に、IoTと非IoTコードの観察された違いに対処するためのベストプラクティスのリストを選択して提示します。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:39:04 GMT)
Approximating under the Influence of Quantum Noise and Compute Power [3.0] 量子近似最適化アルゴリズム(QAOA)は、量子コンピュータのパワーと古典的な高性能コンピューティングアプライアンスを組み合わせて最適化することを目的とした多くのシナリオの中核である。
総合密度行列に基づくシミュレーションを用いて, 4種類のQAOA変異体の解の質と時間的挙動に影響を与える因子について検討した。
本研究の結果は, 包括的複製パッケージを伴い, 狭小かつ特異な影響を指摘できるQAOA変異体との違いが強く認められた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:48:49 GMT)
Active Sensing of Knee Osteoarthritis Progression with Reinforcement Learning [2.8] 変形性関節症(OA)は最も一般的な筋骨格疾患であり、治療法がない。
Knee OA (KOA) は障害の最も高い原因の1つであり、世界社会には数十億ドルの費用がかかる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:54:08 GMT)
Process-constrained batch Bayesian approaches for yield optimization in multi-reactor systems [2.8] 本研究は,マルチリアクタ系における反応の収率を最適化する新しい手法を提案する。
シーケンシャルなバッチ最適化戦略において、探索とエクスプロイトの間の実験的制約とバランスを統合する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:26:39 GMT)
Back-Projection Diffusion: Solving the Wideband Inverse Scattering Problem with Diffusion Models [2.7] 広帯域散乱データから逆散乱マップによって誘導される後部分布を近似するエンドツーエンドの確率的フレームワークであるtextitWideband back-projection diffusionを提案する。
この枠組みは、問題における波動伝播と対称性の基礎物理学と結合した条件拡散モデルを利用して、高精度な再構成を生成する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 23:33:24 GMT)
Introducing a Comprehensive, Continuous, and Collaborative Survey of Intrusion Detection Datasets [2.7] COMIDDSは、侵入検出データセットを前例のないレベルで包括的に調査する試みである。
実際のデータサンプルや関連する出版物へのリンクを含む、各データセットに関する構造化されたクリティカルな情報を提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:40:41 GMT)
Non-Markovianity in High-Dimensional Open Quantum Systems using Next-generation Multicore Optical Fibers [2.7] マルチコア光ファイバにおける高次元非マルコフ開量子系について検討する。
マルチコアファイバの位相ノイズをよりよく理解することで、複数の実世界の通信プロトコルの安定性と品質を向上させることができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 04:38:22 GMT)
Cross-Modality Clustering-based Self-Labeling for Multimodal Data Classification [2.7] CMCSL(Cross-Modality Clustering-based Self-Labeling)
CMCSLは、深い特徴空間の各モードに属するインスタンスをグループ化し、その結果のクラスタ内で既知のラベルを伝搬する。
MM-IMDbデータセットから抽出した20個のデータセットに対する実験的検討
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:43:56 GMT)
Refined Infrared Small Target Detection Scheme with Single-Point Supervision [2.7] 単一点監視を用いた革新的赤外線小目標検出手法を提案する。
提案手法は最先端(SOTA)性能を実現する。
特に、提案手法は「ICPR 2024 Resource-Limited Infrared Small Target Detection Challenge Track 1: Weakly Supervised Infrared Small Target Detection」で3位を獲得した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:49:58 GMT)
LR-Net: A Lightweight and Robust Network for Infrared Small Target Detection [2.7] 我々は、革新的な軽量で堅牢なネットワーク(LR-Net)を提案する。
LR-Netは複雑な構造を放棄し、検出精度と資源消費のバランスをとる。
第3位は「ICPR 2024リソース制限赤外小ターゲット検出チャレンジトラック2:軽量赤外小ターゲット検出」である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:57:33 GMT)
Cascading Refinement Video Denoising with Uncertainty Adaptivity [2.5] 本稿では,画像のアライメントと復元を同時に行うカスケード精細ビデオ復調手法を提案する。
この方法を適用することで、計算全体の平均25%が削減された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:34:44 GMT)
Long Input Benchmark for Russian Analysis [2.5] LIBRAは、LLMの長文を徹底的に理解する能力を研究するために、21の適応データセットで構成されている。
テストは4つの複雑性グループに分けられ、4kから128kまでの様々な長さのモデルの評価が可能である。
我々はLIBRAのオープンソースデータセット、コンテキスト、および公開リーダボードを提供し、今後の研究をガイドしています。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:59:35 GMT)
How cosmological expansion affects communication between distant quantum systems [2.5] 宇宙論的な粒子生成のような膨張する宇宙で起こる量子効果が、2つの離れた部分間の通信を促進できるかどうかを確かめることが目的である。
完全な宇宙流体を考えると、結果として、プロトコルの古典的な容量が増加することが分かる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:59:27 GMT)
Backward explanations via redefinition of predicates [2.5] ヒストリーeXplanation(HXP)は、強化学習(RL)エージェントの環境との相互作用のシーケンスにおける挙動を研究する。
アクション重要度スコアは、履歴中の各アクションに対して計算される。
その説明は、ユーザに最も重要なアクションを表示することである。
我々は,これらの履歴について,スコアを近似することなく説明を行うため,backward-HXPと呼ばれる新しいHXP法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:31:38 GMT)
Dynamics of Relativistic Vortex Electrons in External Laser Fields [2.5] 電磁場との渦電子相互作用は、粒子加速技術の進歩、背景場の散乱理論、材料診断のための新しい電子ビームの獲得に不可欠である。
線形偏光(LP)および円偏光(CP)レーザーパルスにおける渦電子の伝播を2モードレーザーパルスで分離・結合した形で検討した。
レーザーパルスによる渦電子の多角的制御は, レーザー背景における渦散乱の基準となり, レーザー制御による新たな渦モードの達成を刺激し, 特殊な材料を標的とした診断プローブとして実現した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:32:50 GMT)
RCDM: Enabling Robustness for Conditional Diffusion Model [2.5] 条件拡散モデル(CDM)は、より多くの制御を提供することで標準拡散モデルを強化する。
CDMの逆過程における不正確な条件入力は、ニューラルネットワークの固定エラーを生じさせるのが容易である。
本稿では,ロバスト条件拡散モデル(RCDM)を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:12:57 GMT)
Teaching Action Research [2.5] アクションリサーチは、最後の千年紀の終わりにソフトウェアエンジニアリング研究の危機に対する反応の1つとして、ソフトウェアエンジニアリングに参入した。
この章では、アクションリサーチの柱を方法論として記述し、それらを教える方法について説明する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:44:49 GMT)
Fairness in Large Language Models in Three Hour [2.4] このチュートリアルは、大規模言語モデルに関する文献の最近の進歩を体系的に概説する。
LLMにおける公平性の概念を考察し、バイアスを評価するための戦略と公正性を促進するために設計されたアルゴリズムを要約する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:09:58 GMT)
MaFreeI2P: A Matching-Free Image-to-Point Cloud Registration Paradigm with Active Camera Pose Retrieval [2.4] Image-to-pointクラウド登録は、相対的なカメラのポーズを推定する。
最近のマッチングベースの手法は、2D-3D対応を構築することでこの問題に対処する傾向がある。
我々はMaFreeI2Pというマッチングフリーのパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:39:22 GMT)
CMR-Agent: Learning a Cross-Modal Agent for Iterative Image-to-Point Cloud Registration [2.4] Image-to-point cloud registrationは、ポイントクラウドに対するRGBイメージの相対的なカメラポーズを決定することを目的としている。
学習に基づくほとんどの手法は、反復最適化のためのフィードバック機構を使わずに、特徴空間における2D-3D点対応を確立する。
本稿では,登録手順を反復マルコフ決定プロセスとして再構成し,カメラポーズの漸進的な調整を可能にすることを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:40:59 GMT)
The Role of Functional Muscle Networks in Improving Hand Gesture Perception for Human-Machine Interfaces [2.4] 表面筋電図(sEMG)はその豊富な情報コンテキストとアクセシビリティのために研究されている。
本稿では,個々の筋活性化ではなく,筋同期の復号化を提案する。
85.1%の精度を実現し、既存の手法に比べて性能が向上した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:17:34 GMT)
A Study of Undefined Behavior Across Foreign Function Boundaries in Rust Libraries [2.4] Rustは、他の言語との相互運用に頻繁に使用される。
Miriは、これらのモデルに対してアプリケーションを検証できる唯一の動的解析ツールである。
Miriは外部機能をサポートしておらず、Rustエコシステムの中心に重要な正当性ギャップがあることを示唆している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:28:13 GMT)
Going Beyond Gadgets: The Importance of Scalability for Analogue Quantum Simulators [2.3] 量子ハードウェアは、物理学や化学における計算的に難しい問題を効率的に解くことができる。
従来のアナログ量子シミュレーションの理論的アプローチは,スケーラブルな実験実装を禁止した基本障壁に悩まされていた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:53:29 GMT)
YOWOv3: An Efficient and Generalized Framework for Human Action Detection and Recognition [2.3] YOWOv3はYOWOv2の改良版である。
YOWOv3 はパラメータや GFLOP の数を大幅に削減すると同時に、同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:48:03 GMT)
Spin glass model of in-context learning [2.3] 大規模な言語モデルは、驚くべきコンテキスト内学習能力を示している -- クエリの予測にプロンプトを使用することができるが、追加のトレーニングを必要としない。
この構造を実数値スピンを持つスピンガラスモデルにマッピングする。
我々の理論は、単一インスタンス学習においてタスクの多様性の増大がコンテキスト内学習の出現に繋がることを示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:54:01 GMT)
Selective Fine-tuning on LLM-labeled Data May Reduce Reliance on Human Annotation: A Case Study Using Schedule-of-Event Table Detection [2.2] ゲミニ-pro 1.0から得られたノイズラベルを用いて,パラメータ効率の良い微細チューニング(PEFT)を施したPaLM-2を微調整した。
これらのラベルを微調整した PaLM-2 は gemini-pro 1.0 や他の LLM を超える性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:51:50 GMT)
AI-Driven Strategies for Reducing Student Withdrawal -- A Study of EMU Student Stopout [2.0] 2013年12月の時点では2900万人が大学教育を受けていたが、学位は無かった。
東ミシガン大学(EMU)は学生の留学生に重大な課題に直面しており、大学生の約55%は6年以内に学位を取得できない。
我々は,学生が研究を放棄する潜在的なリスクを評価するために,人工知能技術を用いた予測モデルを開発した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:15:31 GMT)
From Generalist to Specialist: Exploring CWE-Specific Vulnerability Detection [1.9] Common Weaknession(CWE)は、異なる特徴、コードセマンティクス、パターンを持つ脆弱性のユニークなカテゴリである。
すべての脆弱性をバイナリ分類アプローチで単一のラベルとして扱うことは、問題を単純化する可能性がある。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:12:39 GMT)
Bayesian Kolmogorov Arnold Networks (Bayesian_KANs): A Probabilistic Approach to Enhance Accuracy and Interpretability [1.9] 本研究では,Bayesian Kolmogorov Arnold Networks(BKANs)と呼ばれる新しいフレームワークを提案する。
BKANはコルモゴロフ・アーノルドネットワークの表現能力とベイズ推定を組み合わせたものである。
提案手法は,予測信頼度と決定境界に関する有用な知見を提供し,予測精度の観点から従来のディープラーニングモデルより優れている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:38:34 GMT)
SnapE -- Training Snapshot Ensembles of Link Prediction Models [1.9] 本稿では,ナレッジグラフの予測モデルをリンクするために,スナップショットアンサンブルのアイデアを伝達するアプローチを提案する。
本稿では,従来のスナップショットモデルを用いて,ネガティブな例を反復的に生成する新たなトレーニングループを提案する。
4つのデータセットにまたがる4つのベースモデルによる評価は、このアプローチが単一モデルアプローチよりも常に優れていることを示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:02:10 GMT)
Strong and weak alignment of large language models with human values [1.7] AI(Artificial Intelligent)システムの負の影響を最小限に抑えるには、人間の価値観に合わせる必要がある。
これは、大きな言語モデル(LLM)のようなAIシステムにおいて、人間の価値が浮かび上がるリスクを示す状況を認識するために必要である、と我々は主張する。
そこで我々は,ジョン・サールの有名な提案を拡張して,「単語遷移辞書付き中国語室」と呼ぶ新しい思考実験を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:27:51 GMT)
Scalable Expressiveness through Preprocessed Graph Perturbations [1.7] グラフニューラルネットワーク(GNN)は,グラフ構造化データを解析するための主要な手法である。
前処理グラフ摂動(SE2P)によるスケーラブル表現性の導入
SE2Pは4つの異なる設定クラスでスケーラビリティと一般化性の間の柔軟なバランスを提供する。
この結果から,SE2P構成の選択により,最大8倍の速度向上を達成しつつ,ベンチマークよりも一般化性を向上させることが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:02:55 GMT)
Modular Architectures and Entanglement Schemes for Error-Corrected Distributed Quantum Computation [1.6] モジュール型量子コンピュータを固体量子ハードウェアで研究する。
分散曲面符号の誤り訂正しきい値と論理的故障率について検討する。
コードの性能は絡み合い生成方式の選択に大きく依存することがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:20:03 GMT)
High-arity PAC learning via exchangeability [1.6] 我々は「構造化相関」の存在下での統計的学習である高純度PAC学習の理論を開発する。
我々の主定理は、統計学習の基本的な定理の高次性(不可知性)バージョンを確立する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:59:27 GMT)
FPT+: A Parameter and Memory Efficient Transfer Learning Method for High-resolution Medical Image Classification [1.6] FPT+(Fun-fine Prompt Tuning plus)は、高解像度の医用画像分類のために設計されたPETL法である。
FPT+は、軽量なサイドネットワークをトレーニングし、大規模な事前学習モデルから事前学習された知識にアクセスすることによって、転送学習を行う。
実験の結果、FPT+は他のPETL法よりも優れており、学習可能なパラメータの1.03%とViT-Bモデル全体を微調整するために必要なメモリの3.18%しか使用していない。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:33:07 GMT)
Cross-Domain Semantic Segmentation on Inconsistent Taxonomy using VLMs [1.4] 視覚言語モデル(CSI)を用いた不整合分類のクロスドメイン意味論
本稿では、視覚言語モデル(CSI)を用いた、一貫性のない分類に関するクロスドメインセマンティックという新しいアプローチを紹介する。
ソースターゲットクラスミスマッチの状況であっても、ドメイン適応セマンティックセマンティックセマンティクスを効果的に実行する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:32:20 GMT)
Analyzing Data Efficiency and Performance of Machine Learning Algorithms for Assessing Low Back Pain Physical Rehabilitation Exercises [1.4] ロボットコーチシステムを用いた身体リハビリの文脈における人間の動作分析に焦点をあてる。
この評価は、以前ロボットPoppyが指導した低背痛リハビリテーション演習を行う臨床患者の医療データベース上で実施される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:49:20 GMT)
A Few-Shot Approach for Relation Extraction Domain Adaptation using Large Language Models [1.4] 本稿では,大規模言語モデルの文脈内学習機能を活用してデータアノテーションを実行する実験を行う。
提案手法は,構造化プロンプトと最小限のエキスパートアノテーションを併用した数発の学習戦略を用いることで,科学的なKG生成モデルのドメイン適応を支援することができることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:06:36 GMT)
Cooperation and Control in Delegation Games [1.4] マルチプリンシパル・マルチエージェントシナリオをデリゲートゲームとして研究する。
このようなゲームでは、制御の問題と協調の問題の2つの重要な障害モードがある。
理論上、実証的に、これらの措置が校長の福祉をどのように決定するかを示します。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:54:36 GMT)
Assessing the Effects of Container Handling Strategies on Enhancing Freight Throughput [1.3] 世界のサプライチェーンや貨物量の増加に伴い、米国は交通需要の増大に直面している。
サンペドロ港複合施設(SPPC、San Pedro Port Complex)は、これらの課題のかなりの部分を占めている。
我々はエージェント・ベース・シミュレーションを用いて実世界のシナリオを再現する。
コンテナの分類は、ポートエリアのみではなく、カリフォルニア、ユタ、アリゾナ、ネバダの潜在的な倉庫に移される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:38:27 GMT)
4D-Var using Hessian approximation and backpropagation applied to automatically-differentiable numerical and machine learning models [1.3] 本稿では,誤差のバックプロパゲーションとヘッセン近似を組み合わせることで,ガウスニュートン法を効率よく近似できることを示す。
この結果は、次世代の運用予測システムにおいて、モデリング、データ同化、および新しい技術のより深い統合の可能性を示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:36:13 GMT)
On Probabilistic Embeddings in Optimal Dimension Reduction [1.2] 次元減少アルゴリズムは多くのデータサイエンスパイプラインの重要な部分である。
広く利用されているにもかかわらず、多くの非線形次元還元アルゴリズムは理論的観点からは理解されていない。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:46:21 GMT)
Credit Risk Meets Large Language Models: Building a Risk Indicator from Loan Descriptions in P2P Lending [1.2] ピアツーピア(P2P)融資は、借り手と貸し手とをオンラインプラットフォームを通じて結びつける独特の融資メカニズムとして登場した。
しかしながら、P2P貸与は情報非対称性の課題に直面している。
本稿では,ローン申請プロセスにおいて,借主が提供したテキスト記述を活用することで,この問題に対処する新たなアプローチを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:59:19 GMT)
Assessing the Requirements for Industry Relevant Quantum Computation [1.2] 我々は、業界関連量子計算の要件を評価するためにオープンソースのツールを使用します。
我々は現在の技術と超伝導量子ビットプラットフォームのための理論上の高忠実性シナリオに基づく。
ゲートと測定操作の実行時間は,システムエラー率よりも計算全体の実行時間を強く決定することがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:00:49 GMT)
A Public and Reproducible Assessment of the Topics API on Real Data [1.2] Topics API for the Webは、サードパーティのクッキーに代わる、Googleのプライバシ向上のためのAPIだ。
実閲覧履歴の最大かつ一般公開されたデータセット上で,最新の Topics API の再現可能な評価を行う。
データセット内の127ユーザーの2%、3%、4%が、広告主によるトピックの観察の後、ウェブサイト間で一意に識別されていることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:52:50 GMT)
Anatomy of a Robotaxi Crash: Lessons from the Cruise Pedestrian Dragging Mishap [1.1] 2023年10月、GMクルーズのロボタクシーとサンフランシスコの歩行者が衝突し、重傷を負った。
本誌は、Cruiseがロボットタクシーで車の下に歩行者を引きずり込んだときの対応を誤認している様子を調べた。
我々は、近隣の不幸を認識して対応すること、衝突後のシナリオの正確な世界モデルを構築すること、不幸に対応するための組織的な規律を欠くことなど、学習されるであろう安全に関する教訓を探求する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:48:32 GMT)
DaCapo: a modular deep learning framework for scalable 3D image segmentation [1.1] DaCapoは、大規模でほぼ等方的な画像データに対する既存の機械学習アプローチのトレーニングと適用を迅速化するために設計された、特殊なディープラーニングライブラリである。
我々は,大規模な等方的イメージセグメンテーションへのアクセスを改善する可能性について論じ,コミュニティにこのオープンソースイニシアチブを探求し,貢献するよう依頼する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:11:34 GMT)
Toward Smart Scheduling in Tapis [1.0] 本稿では,Tapisにおけるインテリジェントなジョブスケジューリング機能の開発について紹介する。
我々は、異なるHPCシステムとキュー上でジョブの待ち時間を予測すること。
私たちの最初の結果セットは、既存のオプションリストから最適なシステムを選択するのに使用できる回帰としてこの問題を提起しました。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:01:31 GMT)
Training a multilayer dynamical spintronic network with standard machine learning tools to perform time series classification [1.0] 本稿では,スピントロニック振動子を動的ニューロンとして用いたハードウェア上でのリカレントニューラルネットワークの実現を提案する。
9.83pm2.91%の精度でシーケンシャル桁分類タスクを解く。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:12:12 GMT)
Quantile Regression using Random Forest Proximities [0.9] 量子回帰林は、対象変数の条件分布全体を単一のモデルで推定する。
本研究では,ランダムフォレスト近似を用いた量子レグレッションを用いて,QRFの原バージョンに対する条件目標分布と予測間隔の近似において,優れた性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:02:33 GMT)
Polynomial-Time Classical Simulation of Hidden Shift Circuits via Confluent Rewriting of Symbolic Sums [0.9] 量子回路の族は、実際には記号経路積分によって時間内にシミュレートできることを示す。
したがって、このクラスの回路時間の効率的なシミュラビリティに関する開予想を解く。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:56:20 GMT)
Command-line Obfuscation Detection using Small Language Models [0.7] 敵はしばしば検出を避けるためにコマンドライン難読化を使用する。
我々は、カスタムトレーニングされた小さなトランスフォーマー言語モデルを活用する、スケーラブルなNLPベースの検出手法を実装した。
確立したマルウェアのシグネチャに対するモデルの優位性を示すとともに,本モデルが検出した未確認の難読化サンプルを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:01:33 GMT)
Resilience-Runtime Tradeoff Relations for Quantum Algorithms [0.7] アルゴリズム設計における主要なアプローチは、アルゴリズムのコンパイルにおける操作数を最小化することである。
摂動雑音に対するアルゴリズムのレジリエンスを特徴付ける枠組みを開発する。
我々は、このフレームワークがどのようにして特定のノイズに耐えられるアルゴリズムのコンパイルを識別できるかを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:31:14 GMT)
Hardware Aware Ensemble Selection for Balancing Predictive Accuracy and Cost [0.6] ハードウェア対応のアンサンブル選択手法を導入し,推論時間をポストホックアンサンブルに統合する。
提案手法は,既存のアンサンブル選択フレームワークと品質多様性最適化を利用して,その予測精度とハードウェア効率について,アンサンブル候補の評価を行う。
83の分類データセットを用いて評価したところ,本手法は競争精度を保ち,アンサンブルの操作効率を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:30:18 GMT)
Enhancing Conceptual Understanding in Multimodal Contrastive Learning through Hard Negative Samples [0.6] 本稿では,合成ハードネガティブテキストを取り入れた新しい事前学習手法を提案する。
硬い負の項は視覚的概念に対応し、よりきめ細かい視覚的概念とテキスト的概念のアライメントをもたらす。
InpaintCOCOは、視覚言語モデルにおける色、オブジェクト、サイズをきめ細かいアライメントを評価するための新しいデータセットである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:01:26 GMT)
MARINE: A Computer Vision Model for Detecting Rare Predator-Prey Interactions in Animal Videos [0.6] この論文はモデルMARINEを提案することによってギャップに対処する。
高速動物行動用に設計されたモーションベースのフレーム選択と、訓練可能な分類ヘッドを備えたDINOv2特徴抽出を利用する。
魚の動画における捕食者攻撃の特定において、ビデオMAEよりも優れています。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:53:43 GMT)
Leveraging Foundation Models via Knowledge Distillation in Multi-Object Tracking: Distilling DINOv2 Features to FairMOT [0.6] この研究は、知識蒸留を用いて、DINOv2と呼ばれる1つの基礎モデルを活用することを試みている。
その結果,提案手法は特定のシナリオの改善を示すが,本来のFairMOTモデルよりも常に優れているわけではないことが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:50:44 GMT)
Heart Rate and its Variability from Short-term ECG Recordings as Biomarkers for Detecting Mild Cognitive Impairment in Indian Population [0.6] 完全信号処理パイプラインを設計し、R波ピークを検出し、ECG記録からHRとHRVの特徴を10秒で計算する。
MCI患者は健常者よりも比較的高いHRを有することが観察されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:14:04 GMT)
UlRe-NeRF: 3D Ultrasound Imaging through Neural Rendering with Ultrasound Reflection Direction Parameterization [0.6] 従来の3D超音波イメージング法には、解像度の固定化、ストレージ効率の低さ、コンテキスト接続性の不足といった制限がある。
暗黙的なニューラルネットワークと明示的な超音波レンダリングアーキテクチャを組み合わせた新しいモデルUlRe-NeRFを提案する。
実験の結果,UlRe-NeRFモデルは高忠実度超音波画像再構成の現実性と精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:00:40 GMT)
High Purcell-enhancement in quantum-dot hybrid circular Bragg grating cavities for GHz-clockrate generation of indistinguishable photons [0.5] 本稿では、Purcell-enhanced semiconductor InAs quantum dotradive lifetimes of $T_mathrmP > 25$。
強いパーセルによる崩壊時間により、最大30Kまでの高温で高い不明瞭性が得られる。
我々の研究は、GHzクロックレートで動作する量子情報や技術への応用のための高紫外高強度固体量子エミッタの展望を強調した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:16:15 GMT)
Optimisation of Pulse Waveforms for Qubit Gates using Deep Learning [0.5] 量子ビット状態を操作するためにパルス波形のパラメータを最適化するために,Deep Neural Networks (DNN) を用いた新しい手法を提案する。
高忠実度量子シミュレーションは、現在の量子コンピュータのスケールアップに不可欠である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:02:59 GMT)
Hybrid Quantum Solvers in Production: how to succeed in the NISQ era? [0.4] 我々は、最も頻繁に使用されるハイブリッド・ソルバについて記述し分類する。
現在実運用にデプロイされている2つの解決器に特化しています。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:41:43 GMT)
Empathic Responding for Digital Interpersonal Emotion Regulation via Content Recommendation [0.4] 本稿では、コンテンツレコメンデーションを通じて、オンラインプラットフォーム上での対人感情規制を強化するアプローチを提案する。
提案する推薦システムは,システム開始とユーザ開始の感情制御を融合させることが期待される。
この研究はReddit上で1年間に37.5万件のユーザー投稿と対話を収集し、CMAB(Contextual Multi-Armed Bandits)ベースのレコメンデーションシステムを設計した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:27:28 GMT)
BOTS-LM: Training Large Language Models for Setswana [0.4] BOTS-LM (英語: BOTS-LM) は、セツワナ語と英語の両方で熟達したバイリンガル言語モデルである。
Seswana最大のWebデータセットであるSetsTextをリリースし、2億6700万以上のトークンを合計しました。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:15:17 GMT)
Graphical Modelling without Independence Assumptions for Uncentered Data [0.3] ゼロ平均仮定がモデリングにおいて過度な誤りを引き起こすことを示す。
具体的には,そのような誤りを回避できるゼロ平均仮定の緩和を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:40:23 GMT)
Continuous Monitoring via Repeated Significance [0.2] テストの重要度に対する一定の要件を維持することは不可能であるが、その目標に任意に近づくことは可能である。
テストの重要度に対する一定の要件を維持することは不可能であるが、その目標に任意に近づくことは可能である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:39:06 GMT)
Conditions for a quadratic quantum speedup in nonlinear transforms with applications to energy contract pricing [0.2] 本稿では,量子アダマール積を用いて計算した非線形関数の近似に基づくアルゴリズムを開発する。
我々の設定では、形が双対数因子である場合にのみ量子スピードアップが証明できる。
我々は、最近IBMの量子デバイスに導入された動的回路機能を利用して、量子アダマール製品回路証明の平均深度を下げる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:51:36 GMT)
Attenuation-adjusted deep learning of pore defects in 2D radiographs of additive manufacturing powders [0.2] 添加剤製造用金属原料粉末中のガス細孔の存在は、最終AM生成物に大きな影響を及ぼす。
この研究は、単一の2次元粉体に細孔ピクセルをラベル付けすることで、このような将来の効率的なセットアップをシミュレートすることを目指している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:34:49 GMT)
Generalized Gaussian Temporal Difference Error For Uncertainty-aware Reinforcement Learning [0.2] 深部強化学習における一般化されたガウス誤差モデリングのための新しい枠組みを提案する。
我々のフレームワークは、高次モーメント、特にクルトシスを取り入れることで、エラー分散モデリングの柔軟性を向上させる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:12:25 GMT)
Implementing a synthetic magnetic vector potential in a 2D superconducting qubit array [0.2] 多くの興味深い凝縮マター現象は、電磁場の存在によってのみ現れる。
超伝導量子シミュレータを用いて電磁場における荷電粒子の動力学をエミュレートする。
電界中を伝播する荷電粒子の逆偏向であるホール効果が, 合成電磁場の存在下では存在することを実証する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:49:58 GMT)
Geometric Algebra Meets Large Language Models: Instruction-Based Transformations of Separate Meshes in 3D, Interactive and Controllable Scenes [0.1] 本稿では,制御可能な3Dシーン編集に革命をもたらすために,Large Language Models (LLMs) とConformal Geometric Algebra (CGA) の統合を提案する。
CGAを頑健な形式言語として利用し,精度の高いオブジェクト再構成に必要な空間変換を正確にモデル化する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 07:10:40 GMT)
The advantage of quantum control in many-body Hamiltonian learning [0.1] 実験データから多体量子系のハミルトニアンを学習する問題について検討する。
学習速度は,実験中に利用可能な制御量に依存することを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:17:46 GMT)
KAN we improve on HEP classification tasks? Kolmogorov-Arnold Networks applied to an LHC physics example [0.1] Kolmogorov-Arnold Networks (KAN) は多層パーセプトロンの代替として提案されている。
高エネルギー物理における二項イベント分類の典型的な課題について検討する。
1層カンの学習活性化関数は入力特徴の対数類似度に類似していることが判明した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:01:07 GMT)
The competent Computational Thinking test (cCTt): a valid, reliable and gender-fair test for longitudinal CT studies in grades 3-6 [0.1] 本研究では,2709人の生徒のデータを用いて,3年生から6年生(年齢7~11歳)までの学習を確実に評価できるかどうかを検討した。
以上の結果から,cCTtは学年3-6では有効で信頼性が高く,ジェンダーフェアであり,より複雑な項目は学年5-6では有益であることが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:02:54 GMT)
Coulomb coupling between two nanospheres trapped in a bichromatic optical tweezer [0.0] 異なる波長で動作する2つの共プロパゲーティングレーザーによって生成される2つの光ツイーザ内の2つのナノ球のトラップを実証する。
その結果、強結合発振器のシステムに関する今後の研究のための実験的なスキームの可能性が浮き彫りになった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:15:01 GMT)
A Novel Stabilizer-based Entanglement Distillation Protocol for Qudits [0.0] エンタングルメント蒸留は、エラー発生環境における堅牢な量子情報処理に重要である。
安定化器符号に基づく構築は、そのようなプロトコルを設計するための効果的な方法を提供する。
本稿では,任意の素次元のベル対角線状態に対する繰り返し毎の忠実度増加を最大化する新しい2コピー蒸留プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:14:28 GMT)
XDC Network Assessment: Decentralization, Scalability and Security [0.0] 2019年にXinFinは、エンタープライズ対応のハイブリッドブロックチェーンプラットホームXDCネットワークを発表した。
XDCネットワークの概観は、XDCネットワークの成長、強化、導入を促進するために設立された非営利組織であるXDC Foundationである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:01:43 GMT)
X.509 Information Security Certification Based on Post-Quantum Cryptography [0.0] 本研究では,ポスト量子暗号(PQC)に基づくX.509セキュリティ証明書について検討する。
本研究では、主流非対称暗号法と標準PQC法を比較した。
X.509セキュリティ証明書のPQCに基づくソリューションの推奨が提案されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:38:36 GMT)
Wormholes and Factorization in Exact Effective Theory [0.0] 我々は、その自由度のあるセクターに関する完備理論の正確な経路積分を通じて得られる有効理論の一般的な枠組みについて研究する。
量子ワームホールは真の非局所的相互作用である。
この枠組みは量子重力で観測される現象の多くを統一し、新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:51:56 GMT)
Wave-RVFL: A Randomized Neural Network Based on Wave Loss Function [0.0] 本稿では,ウェーブロス関数を組み込んだ RVFL モデル Wave-RVFL を提案する。
Wave-RVFLは、偏差の過料金化を防ぎ、ノイズや外れ値に対する堅牢性を示す。
実験結果から,Wave-RVFLの性能とロバスト性は,ベースラインモデルよりも優れていたことが確認された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:46:54 GMT)
WRDScore: New Metric for Evaluation of Natural Language Generation Models [0.0] 堅牢な計量は、意味的および統語的バリエーションの両方を考慮して、メソッド命名の汎用性を考慮する必要がある。
既存の埋め込みベースのメトリクスは、しばしば不均衡な精度とリコール、正規化されたスコアの欠如、シーケンスに関する非現実的な仮定に悩まされる。
WRDScoreは,単純さと有効性のバランスをとる新しい指標である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:02:06 GMT)
Utilizing small quantum computers for machine learning and ground state energy approximation [0.0] 量子回路分割(Quantum circuit partitioning, QCP)は、小さな量子コンピュータ上の大規模量子システムをシミュレートすることを目的としたハイブリッド量子古典的アプローチである。
小型の量子システムを用いて,大規模量子系上で観測可能な観測値を測定するためのQCP戦略を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:19:03 GMT)
Using Letter Positional Probabilities to Assess Word Complexity [0.0] いくつかのLPPと複雑性の間には強い統計的関連性がある。
単純な単語はw, b, s, h, g, k, j, t, y, f で始まる傾向が著しく(p.001)、複雑な単語は i, a, e, r, v, u, d で始まる傾向が著しく(p.001)である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:12:32 GMT)
Tree species classification at the pixel-level using deep learning and multispectral time series in an imbalanced context [0.0] 本稿では,Sentinel-2マルチスペクトル衛星画像時系列を用いた木種分類について検討する。
ディープラーニングモデルを使用することで,分類結果の大幅な改善が期待できる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:44:42 GMT)
TrIM: Triangular Input Movement Systolic Array for Convolutional Neural Networks -- Part II: Architecture and Hardware Implementation [0.0] TrIMは、入力の三角移動に基づく革新的なデータフローである。
TrIMは、最先端のシストリックアレイと比較して1桁のメモリアクセス数を削減できる。
アーキテクチャは、毎秒453.6ギガオペレーションのピークスループットを達成する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:18:00 GMT)
Towards Semantic Markup of Mathematical Documents via User Interaction [0.0] 本稿では,既存の s マクロ定義から文法を自動生成し,それらを解析することで,式の意味的マークアップにアプローチする。
また、解析結果を曖昧にするためのGUIベースのツールも提示し、未入力の$lambda$-termsを解析するための文法を用いてその可能性を示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:36:40 GMT)
Towards Explainable Evolution Strategies with Large Language Models [0.0] 本稿では,自己適応的進化戦略(ES)と大規模言語モデル(LLM)を統合するアプローチを提案する。
再起動機構を備えた自己適応型ESを用いることで、ベンチマーク関数の難易度を効果的にナビゲートする。
LLMを使用してこれらのログを処理し、簡潔でユーザフレンドリーな要約を生成する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:13:37 GMT)
Towards Coarse-grained Visual Language Navigation Task Planning Enhanced by Event Knowledge Graph [0.0] 視覚言語ナビゲーション(VLN)は、AIの具現化における重要な研究の1つである。
VLN命令は粗粒度と細粒度に分類できる。
本稿では,イベント知識の強化により,VLNの粗粒度を考慮に入れたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Aug 2024 15:08:26 GMT)
Time-Series Classification in Smart Manufacturing Systems: An Experimental Evaluation of State-of-the-Art Machine Learning Algorithms [0.0] ResNet, DrCIF, InceptionTime, ARSENALは最高のパフォーマンスのアルゴリズムであり、22のTSCデータセットの平均精度は96.6%以上である。
LSTM, BiLSTM, TS-LSTMアルゴリズムは, RNN構造を用いた時系列データにおける特徴抽出の有効性を認識すべきである。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:06:24 GMT)
Third-Order Perturbative OTOC of the Harmonic Oscillator with Quartic Interaction and Quantum Chaos [0.0] 時間外3次相関器(OTOC)の計算
OTOCの早期特性を解析し, カオスを示す指数的成長が3次摂動において明らかであることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:49:42 GMT)
The effect of quantum decoherence on inflationary gravitational waves [0.0] インフレーションの理論は、現在宇宙で観測されている構造を量子力学的に生成されたゆらぎから説明するためのメカニズムを提供する。
インフレーションの間、テンソル摂動は他の場と(少なくとも重力的に)相互作用する。
この量子デコヒーレンスにより, 重力波パワースペクトルのスケール依存的な増加が, システムと環境間の相互作用の強度と時間依存性に依存することを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:39:51 GMT)
The Literature Review Network: An Explainable Artificial Intelligence for Systematic Literature Reviews, Meta-analyses, and Method Development [0.0] Literature Review Network(LRN)は、PRISMA 2020標準に準拠した、この種の説明可能なAIプラットフォームの最初のものだ。
LRNは,専門家がPubMedに問い合わせるために開発した3本の検索文字列を用いて,手術用手袋の領域で評価した。
モデルは専門家の訓練を受けずに優れた分類精度を示し、84.78%と85.71%の精度を達成した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:25:16 GMT)
Text Conditioned Symbolic Drumbeat Generation using Latent Diffusion Models [0.0] 本研究では,ラテント拡散モデル(LDM)を用いたドラムビート生成のためのテキスト条件付き手法を提案する。
マルチモーダルネットワーク内のコントラスト学習を通じてテキストとドラムのエンコーダを事前学習することにより,テキストと音楽のモダリティを密に調整する。
生成したドラムビートは新規で、即興のテキストに順応し、人間の音楽家によるものと同等の品質を示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:23:05 GMT)
Tensorial template matching for fast cross-correlation with rotations and its application for tomography [0.0] 我々は、テンソル場を持つテンプレートのすべての回転を表す数学的枠組みに基づいて、テンソルテンプレートマッチングと呼ばれる新しいアルゴリズムを実装した。
テンソルテンプレートマッチングはテンプレートマッチングよりもはるかに高速であり,精度向上の可能性が示された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:42:41 GMT)
Tell me why: Training preferences-based RL with human preferences and step-level explanations [0.0] そこで我々は,人間にフィードバックを与えるためのより表現力豊かなインタフェースを提供する,嗜好に基づく新しい学習手法を提案する。
以上の結果から,拡張されたフィードバックによって学習速度が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:59:32 GMT)
Synthesizing the Born rule with reinforcement learning [0.0] 我々は、現実的な(非理想的な)エージェントが、その決定においてボルンルールから逸脱する可能性について検討する。
我々は、アルゴリズムの意思決定行動がボルンルールの理想的な形式からどのくらい離れているかを定量化し、制限要因について検討する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:23:50 GMT)
Superradiant droplet emission from a single hydrodynamic cavity near a reflective boundary [0.0] 潜水キャビティを用いた薄い振動流体からの液滴放出の操作の最近の進歩は、量子および光学系の動的アナログを生成する革新的なプラットフォームを導入している。
本研究では,最近報告された流体力学的超放射能現象が,単一の流体力学的キャビティが水中反射障壁と相互作用する際の影響について検討した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:45:53 GMT)
Strong Spin-Motion Coupling in the Ultrafast Dynamics of Rydberg Atoms [0.0] 本研究では,波動関数の拡散による相互作用電位の大きな変動から,強いスピンモーション結合が生じることを示す。
トラップ電位によって設定された運動エネルギースケールに対して、スピン-運動結合の強度を任意に調整する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:55:21 GMT)
Strip-Loaded Nanophotonic Interfaces for Resonant Coupling and Single-Photon Routing [0.0] 共振結合と光子ルーティング効率の向上を目的としたストリップ装荷ナノフォトニックインタフェースの設計とシミュレーションについて報告する。
我々の設計では、誘導モードは高インデックス薄膜によって平面内に閉じ込められ、低インデックスストリップによって横に緩く閉じ込められている。
本稿では, ポリマーを用いたブラッグ格子キャビティとリング共振器を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:53:20 GMT)
Strategic AI adoption in SMEs: A Prescriptive Framework [0.0] 中小企業におけるAI技術の採用は、主にコスト、技術スキルの欠如、従業員の受け入れに関連する大きな障壁に直面している。
本研究では,中小企業におけるAIの効果的な採用を促進するために,総合的な段階的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:49:37 GMT)
Static Code Analysis with CodeChecker [0.0] CodeCheckerは、さまざまな静的解析ツールを統合するオープンソースプロジェクトである。
静的解析ツールのレポート評価を容易にするために,強力なイシュー管理システムを備えている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:48:16 GMT)
Sparks of Quantum Advantage and Rapid Retraining in Machine Learning [0.0] 本研究では、最小パラメータで複雑な関数を表現するために、強力なニューラルネットワークアーキテクチャを最適化する。
高速再トレーニング機能を導入し、古いサンプルを再処理することなく、ネットワークを新しいデータで再トレーニングできるようにする。
量子ハードウェアとアルゴリズム最適化のさらなる進歩により、量子最適化機械学習モデルが幅広い応用をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 02:01:12 GMT)
Setting the duration of online A/B experiments [0.0] 本稿では, 比例処理効果推定器に基づくCI幅の解析式について述べる。
本稿では,YouTubeにおける実A/B実験のCI幅を詳細に解説する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:55:14 GMT)
Search for Pauli Exclusion Principle Violations with Gator at LNGS [0.0] 我々は,ナチナリ・デル・グラン・サッソ研究所で運用されている低背景高純度ゲルマニウム検出器であるゲーターによる専用測定について報告する。
この技術は、直接電流を通して既存の電子系に電子を導入することで新しい対称性状態を形成することに依存し、メシア・グリーンバーグ超選択則の条件を満たす。
PEP違反は観測されておらず、PEP違反確率の上限は$beta2/2 4.8 cdot 10-29$ (90% CL)である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:22:39 GMT)
Relational dynamics and Page-Wootters formalism in group field theory [0.0] 群体論は時空が創発的であり、従って空間や時間という背景概念なしで定義されることを仮定する。
座標変換や制約の明確な概念はなく、確立された量子化法を直接適用することはできない。
群場理論のパラメトリ版を使い、すべての(幾何学と物質)自由度がフィデューシャルパラメータで進化する。
関係力学のトレイン性」を用いて、結果として生じる「時計ニュートラル」理論は非対称な標準群場理論と完全に等価であることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:40:18 GMT)
Reduced storage direct tensor ring decomposition for convolutional neural networks compression [0.0] 記憶率の低下した直接テンソルリング分解(RSDTR)に基づく新しい低ランクCNN圧縮法を提案する。
提案手法は, 円モードの順応性が高く, パラメータが大きいこと, FLOPS圧縮率が高いことが特徴である。
CIFAR-10とImageNetデータセットで実施された実験は、他の最先端のCNN圧縮アプローチと比較して、RDDTRの効率を明らかに示している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:20:11 GMT)
Reasons to Doubt the Impact of AI Risk Evaluations [0.0] 本稿では、評価がAIリスクに対する理解と、そのリスクを緩和する能力を大幅に改善するかどうかを問う。
評価プラクティスの改善と、AIラボ、外部評価者、規制当局、学術研究者のための12の推奨事項を結論付けている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:42:51 GMT)
Realizing mechanical dynamical Casimir effect with low-frequency oscillator [0.0] ハイブリッド光学系における力学力学的カシミール効果(DCE)を実現する。
機械エネルギーは3波混合機構により出力光子に直接変換される。
機械周波数は出力光子よりも約2桁小さいことが判明した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:38:44 GMT)
Quasi-classical Limit of a Spin Coupled to a Reservoir [0.0] スピン(量子ビット)はボソニック貯水池と接触する。
貯水池の状態は、量子的および古典的な貯水池の特徴を補間するパラメータ・ヴァレプシロンを含む。
我々はデコヒーレンスとマルコビアン性について研究する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:34:57 GMT)
Quantum simulation of dynamical gauge theories in periodically driven Rydberg atom arrays [0.0] 我々は、時間周期駆動に基づくチューニング可能な多体インタラクションを生成する方法を開発した。
このような駆動は、それぞれの演算子重みにおいて強度が摂動的でない多体相互作用を持つ実効ハミルトニアンの族を生じさせることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:00:03 GMT)
Quantum information theory on sparse wavefunctions and applications for Quantum Chemistry [0.0] SparQ は、基本量子情報理論をハートリー-フォック後の波動関数の定義空間でスパースに効率よく計算するように設計されている。
SparQの有効性は、水分子の波動関数の相互情報行列と、ベンゼン分子を記述した$sim 102$ qubitsの全エントロピーを解析することによって検証される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:54:20 GMT)
Quantum conditional entropies and fully entangled fraction of states with maximally mixed marginals [0.0] 完全に絡み合った分数(FEF)は、最大絡み合った状態への量子状態の近接を測定する。
量子条件エントロピー(Quantum Conditional Entropy、QCE)は、量子系における相関の尺度である。
FEFは、$k$-コピー非ローカル性と$k$-コピーステアビリティと複雑に関連付けられている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 06:16:51 GMT)
Quantum Transfer Learning for MNIST Classification Using a Hybrid Quantum-Classical Approach [0.0] 本研究は、画像分類タスクにおける量子コンピューティングと古典的機械学習の統合について検討する。
両パラダイムの強みを生かしたハイブリッド量子古典的アプローチを提案する。
実験結果から、ハイブリッドモデルが量子コンピューティングと古典的手法を統合する可能性を示す一方で、量子結果に基づいて訓練された最終モデルの精度は、圧縮された特徴に基づいて訓練された古典的モデルよりも低いことが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 22:16:27 GMT)
Quantum Target Ranging for LiDAR [0.0] マルチハイポテーシステストの文脈における量子ターゲットランキングとその実世界のLiDARシステムへの適用性について検討する。
我々は、目標検出のよく研究された問題と比較すると、レンジは一般的に簡単な作業であることを示した。
次に、位相非感応測定の文脈における量子レンジの理論的境界と利点を分析する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:00:14 GMT)
Predicting and Understanding Human Action Decisions: Insights from Large Language Models and Cognitive Instance-Based Learning [0.0] 大きな言語モデル(LLM)は、様々なタスクにまたがってその能力を実証している。
本稿では,LLMの推論と生成能力を利用して,2つの逐次意思決定タスクにおける人間の行動を予測する。
我々は,LLMの性能を,人間の経験的意思決定を模倣した認知的インスタンスベース学習モデルと比較した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:16:27 GMT)
Phonon-Induced Exchange Gate Infidelities in Semiconducting Si-SiGe Spin Qubits [0.0] Si-SiGeヘテロ構造における半導体二重量子ドットスピン量子ビットとの交換操作の忠実性を考慮する。
その結果,200-300mK以内の高温では,交換ゲートの動作はバルクフォノンで制限されていないことが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:01:02 GMT)
Peer-induced Fairness: A Causal Approach to Reveal Algorithmic Unfairness in Credit Approval [0.0] 本稿では,アルゴリズムフェアネスを科学的に評価するための新しい枠組みである「ピア誘導フェアネス」を紹介する。
アルゴリズムによる差別による有害な結果と、個人の能力不足による結果の区別である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:35:34 GMT)
Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0] 本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:00:00 GMT)
Operational range bounding of spectroscopy models with anomaly detection [0.0] 孤立林は、予測モデルが失敗する可能性のあるコンテキストを効果的に識別する。
セカンダリフォレストモデルが予測モデルの説明可能性 SHAP 値の予測を行うと、最高のパフォーマンスが得られる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:59:36 GMT)
Open-system eigenstate thermalization in a noninteracting integrable model [0.0] 完全可積分モデルにおいても、システム・バス・セットアップがハミルトニアンの典型的な固有状態にあるとき、系オブザーバブルは熱化を示す。
熱化の要因はカオスと非可積分性だけではないことが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:51:21 GMT)
Open Sesame! Universal Black Box Jailbreaking of Large Language Models [0.0] 大規模言語モデル(LLM)は、有用で安全な応答を提供するように設計されている。
LLMは、しばしばユーザーの意図や社会的ガイドラインに合わせるためにアライメント技術に頼っている。
モデルアーキテクチャやパラメータがアクセスできない場合に,遺伝的アルゴリズム(GA)を用いてLLMを操作する手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:34:10 GMT)
On Using Quasirandom Sequences in Machine Learning for Model Weight Initialization [0.0] 本研究では,低分解能準ランダム数生成器(QRNG)のPRNGを初期化器のランダム性源として置換することで,モデル性能が向上するかどうかを検討する。
以上の結果から,QRNGベースのニューラルネットワーク初期化器は,PRNGベースの初期化器よりも高い精度に達するか,より高速に同じ精度が得られることが示唆された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:33:09 GMT)
On Interstellar Quantum Communication and the Fermi Paradox [0.0] 恒星間チャネルの周波数容量を$Q$で解析する。
地球上の直径$D$とProxima Centauriの2つの望遠鏡の場合、これはD>100,km$!
これは、信頼できる一方通行の量子通信を可能にするための技術的しきい値である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:11:39 GMT)
Non-symmetric GHZ states; weighted hypergraph and controlled-unitary graph representations [0.0] 非対称なGHZ状態は、量子情報に潜在的に適用可能な多部交絡状態である。
非対称なGHZ状態に対する2つの新しいグラフ形式と安定化器を導入する。
本研究は,非対称GHZ状態の理解を深め,量子情報科学への応用の可能性を示した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:00:18 GMT)
Non-commutative optimization problems with differential constraints [0.0] 作用素変数のサブセットが通常の微分方程式の系を満たすような NPO 問題の変種について検討する。
これにより、元の微分問題に取り組むために、SDPの完全な階層を定義することができる。
この手法を用いて、半デバイス非依存の方法で量子時系列を外挿する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:46:57 GMT)
Non-Hermitian-Hamiltonian-induced unitarity and optional physical inner products in Hilbert space [0.0] ヒルベルト空間幾何学の等方性の弱化は、進化がユニタリであるパラメータの領域を拡大するのに役立ちます。
このアイデアは、資格のあるメトリクスの単純化されたサブセットと、正確に解決可能な2つのモデルを使ってテストされる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:14:51 GMT)
Neural networks for bifurcation and linear stability analysis of steady states in partial differential equations [0.0] パラメータ化非線形PDEから分岐図を構築するニューラルネットワークを提案する。
固有値問題を解き、解の線形安定性を解析するためのニューラルネットワークアプローチも提示される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:22:34 GMT)
Methods to improve run time of hydrologic models: opportunities and challenges in the machine learning era [0.0] 機械学習(ML)を水理モデルに応用することは、未熟である。
物理ベースのモデルよりもMLアルゴリズムを採用する主な理由の1つは、計算効率の優位性と様々なデータセットを扱う柔軟性である。
本稿では,水文モデルにMLを採用する機会と課題について述べる。その後,物理モデルによるシミュレーション時間の改善と今後の課題について述べる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:27:19 GMT)
MaterioMiner -- An ontology-based text mining dataset for extraction of process-structure-property entities [0.0] 本稿では,MaterioMinerデータセットと,オントロジの概念がテキストの実体と結びついている材料オントロジーについて述べる。
本稿では,3つのレーダ間の整合性について検討し,名前付きプロセス認識モデルトレーニングの実現可能性を示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:42:59 GMT)
Many-body localization crossover is sharper in quasiperiodic spin chains [0.0] ランダムおよび準周期系におけるMBLクロスオーバーにおける標準エルゴディディティ破壊指標の挙動の相違を数値的に示す。
我々の重要な発見は、準周期系のシステムサイズとMBLクロスオーバーのシャープネスが指数関数的に増加することである。
これは、多体力学の理解における準周期系の重要性を強調している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:01:20 GMT)
Machine Learning Applications in Medical Prognostics: A Comprehensive Review [0.0] 機械学習(ML)は、高度なアルゴリズムと臨床データを統合することで、医学的診断に革命をもたらした。
RFモデルは高次元データの処理において堅牢な性能を示す。
CNNは、がん検出において異常な精度を示している。
LSTMネットワークは、時間的データの解析に優れ、臨床劣化の正確な予測を提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:41:34 GMT)
Local ergotropy and its fluctuations across a dissipative quantum phase transition [0.0] 局所エルゴトロピーに着目した2ビットオープンなRabiモデルについて検討する。
2ビットシステムの充電、保存、放電のためのプロトコルを定義する。
本研究では, 相転移がエルゴトロピーに及ぼす影響について検討し, 潜在マーカーの同定を行った。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:40:43 GMT)
Interpretation of the Intent Detection Problem as Dynamics in a Low-dimensional Space [0.0] 本研究では,異なるRNNアーキテクチャがSNIPSインテント検出問題をどのように解決するかを検討する。
予測を生成するため、RNNは、出力層行列列方向に空間的に整列して、具体的な領域に向かって軌道を操縦する。
本研究は,意図検出タスクを解くネットワークの内部動作に関する新たな知見を提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:22:36 GMT)
Individually-addressed quantum gate interactions using dynamical decoupling [0.0] 本稿では,ゲート間相互作用を個別に調整する手法を提案する。
単一イオンを用いた状態依存力の抑制効果を実験的に実証した。
我々は17キュービットのイオン結晶のスキームをモデル化し、平均のクロストーク誤差が$sim 10-5$である場合、任意のイオン対が対応可能であることを発見した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:04:57 GMT)
Highly-efficient quantum Fourier transformations for some nonabelian groups [0.0] 我々は、高エネルギー物理学に対する多くの非アーベル群に対する高速量子フーリエ変換を示す。
各グループに対して、明示的な量子回路とフォールトトレラント実装のリソーススケーリングを導出する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:15:36 GMT)
High-order harmonic generation probing of a ring-opening reaction [0.0] 分子系の非線形非摂動応答は光異性化反応のために研究される。
レーザー誘起電子励起を計算し,HHGスペクトルに対する励起の影響を考察した。
異性体の超高速検出に用いる異性体の非線形応答特性について述べる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:36:12 GMT)
Hierarchical Clustering using Reversible Binary Cellular Automata for High-Dimensional Data [0.0] セルオートマトン(CA)ベースのクラスタリングでは、2つのオブジェクトが同じサイクルに属している場合、それらは密接に関連しており、同じクラスタの一部であると考えられている。
本稿では,各サイクルの各要素の中央値に基づいて,2つの異なるサイクルのオブジェクト間の関係を同定し,次の段階にグループ化できるようにする。
様々なパフォーマンス指標を持つ標準ベンチマークデータセットに対して検証された場合、アルゴリズムは2次時間複雑性を持つ既存のアルゴリズムと同等である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:48:45 GMT)
Full error analysis of policy gradient learning algorithms for exploratory linear quadratic mean-field control problem in continuous time with common noise [0.0] 政策勾配学習(PG)について検討し,まずモデルベース環境での収束を実証する。
モデルフリー環境では,2点勾配推定を用いたPGアルゴリズムの線形収束とサンプル複雑性を大域的に証明する。
この設定では、パラメータ化された最適ポリシーは、状態と人口分布のサンプルから学習される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:11:51 GMT)
Fock-space delocalization and the emergence of the Porter-Thomas distribution from dual-unitary dynamics [0.0] 量子多体系のカオス力学は、任意の構造化初期状態の素早いランダム化が期待されている。
ヒルベルト空間における初期積状態の拡散を双対単位力学の下で研究する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:00:03 GMT)
Floquet engineering of interactions and entanglement in periodically driven Rydberg chains [0.0] 我々はRydbergブロックシステムにおけるシステムのための新しいFloquetエンジニアリング技術を紹介する。
本手法は, 強いスピン交換を1次元鎖で, 閉塞と整合して行うことができることを示す。
さらに, ギャップレス励振とライドバーグ封鎖を組み合わせることで, 大規模多粒子絡みの動的生成が可能であることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:01:01 GMT)
Fast Partition-Based Cross-Validation With Centering and Scaling for $\mathbf{X}^\mathbf{T}\mathbf{X}$ and $\mathbf{X}^\mathbf{T}\mathbf{Y}$ [0.0] 機械学習モデルの分割に基づくクロスバリデーションを大幅に高速化するアルゴリズムを提案する。
我々のアルゴリズムは、例えば、主成分分析(PCA)、主成分回帰(PCR)、隆起回帰(RR)、通常最小二乗(OLS)、部分最小二乗(PLS)のモデル選択に応用できる。
文献に見られる代替手段とは異なり、前処理によるデータの漏洩を避ける。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:01:48 GMT)
FRACTAL: An Ultra-Large-Scale Aerial Lidar Dataset for 3D Semantic Segmentation of Diverse Landscapes [0.0] 我々は、TArgeted Landscapes (FRACTAL) データセットからFRench ALS Cloudsを提示する。
超大型のLidarデータセットで、7つのセマンティッククラスのための高品質なラベルを持つ10万個の高密度の雲で構成されている。
希少なクラスや挑戦的な風景を明示的に集中するサンプリングスキームによって空間的・意味的な多様性を実現する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:53:28 GMT)
Evaluating Vision-Language Models for Zero-Shot Detection, Classification, and Association of Motorcycles, Passengers, and Helmets [0.0] 本研究では,映像データを用いたオートバイ利用者のヘルメット着用状況の検出と分類において,高度な視覚言語基盤モデルOWLv2の有効性について検討した。
我々は、OWLv2とCNNモデルを統合して、検出および分類タスクにカスケードモデルアプローチを採用する。
結果は、不完全で偏りのあるトレーニングデータセットから生じる課題に対処するためのゼロショット学習の可能性を強調している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:30:36 GMT)
Estimating Pore Location of PBF-LB/M Processes with Segmentation Models [0.0] 本稿では,ガウス核密度推定を用いて単一層内における位置を推定する多孔性局所化手法を提案する。
これにより、セグメンテーションモデルは、その場監視データと細孔発生の導出確率分布との相関を学習することができる。
以上の結果から,本手法は最小限のデータ前処理を必要とする細孔の正確な局所化を可能にすると結論付けた。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:31:09 GMT)
Entangling four logical qubits beyond break-even in a nonlocal code [0.0] 量子誤り訂正は、論理量子情報を環境デコヒーレンスから保護する。
我々は、4つの論理量子ビットのGHZ状態を99.5 pm 0.15 % le F le 99.7 pm 0.1%$でエンコードする(結果の98%以上でポストセレクトした後)。
我々の結果は、幾何学的に非局所的な量子低密度パリティチェック符号で符号化された論理量子ビットを用いたフォールトトレラント量子計算の実現に向けた第一歩である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 21:35:58 GMT)
Entanglement Holonomy for Photon Pairs in Curved Spacetime [0.0] 分極ホロノミーは、カー計量の閉軌道のクラスを通過する最大絡み合った光子対に対して解析的に決定される。
これは構成積状態とは無関係な絡み合いホロノミーを定義し、研究するために用いられる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:30:22 GMT)
Enhancing Medical Learning and Reasoning Systems: A Boxology-Based Comparative Analysis of Design Patterns [0.0] 本研究では,ハイブリッドAIシステムの設計パターンとその臨床的意思決定における有効性について分析する。
Boxologyの構造化されたモジュール型アポラチは、ハイブリッドAIシステムの開発と分析において、大きなアドバンテージを提供する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:53:04 GMT)
Eigenstate Correlations in Dual-Unitary Quantum Circuits: Partial Spectral Form Factor [0.0] 固有状態相関の解析的な洞察は、最近導入された部分スペクトル形状因子によって得られる。
熱力学限界におけるカオス二重単位量子回路における部分スペクトル形状因子について検討した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:01:27 GMT)
Dynamical phases of a BEC in a bad optical cavity at optomechanical resonance [0.0] 散逸性空洞モードと光学的に結合したボース・アインシュタイン凝縮体の動的相の出現について検討した。
我々は、自由度の空洞を除去する原子運動の効果的なモデルを得る。
このようなリミットサイクルソリューションは,アディバティックモデルのメタスタブルな構成であることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:01:13 GMT)
Disentangling Dense Embeddings with Sparse Autoencoders [0.0] スパースオートエンコーダ(SAE)は、複雑なニューラルネットワークから解釈可能な特徴を抽出する可能性を示している。
大規模言語モデルからの高密度テキスト埋め込みに対するSAEの最初の応用の1つを提示する。
その結果,解釈可能性を提供しながら意味的忠実さを保っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:25:01 GMT)
Discovering Artificial Viscosity Models for Discontinuous Galerkin Approximation of Conservation Laws using Physics-Informed Machine Learning [0.0] 人工粘度モデルの発見を自動化する物理インフォームド機械学習アルゴリズムを提案する。
このアルゴリズムは強化学習にインスパイアされ、細胞ごとに作用するニューラルネットワークを訓練する。
このアルゴリズムは,最先端のルンゲ・クッタ不連続ガレルキン解法に組み込むことで有効であることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 16:02:51 GMT)
Dimensionality Reduction and Nearest Neighbors for Improving Out-of-Distribution Detection in Medical Image Segmentation [0.0] この研究は、肝臓を分断する4つのSwin UNETRとnnU-netモデルのボトルネック特徴にマハラノビス距離(MD)ポストホックを適用した。
モデルが失敗した画像は、高性能で最小の計算負荷で検出された。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:24:48 GMT)
Development of REGAI: Rubric Enabled Generative Artificial Intelligence [0.0] 本稿では,新しい検索拡張生成(RAG)と大規模言語モデル(LLM)に基づく人工知能技術:有効生成人工知能(REGAI)を提示し,評価する。
REGAIは、システムによって手動または自動で作成できるルーブリックを使用して、評価目的のLLMの性能を向上させる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 20:21:54 GMT)
Dephasing-assisted transport in a tight-binding chain with a linear potential [0.0] 境界駆動型強結合鎖におけるバルクデファスティングと線形ポテンシャルの相互作用について検討した。
線形ポテンシャルはノイズがないときにワニエ・スタークの局在を誘導し、デフォーカスは傾きがないときに拡散輸送を誘導する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 10:19:38 GMT)
Deciphering Air Travel Disruptions: A Machine Learning Approach [0.0] 本研究は、出発時間、航空会社、空港などの要因を調べることにより、飛行遅延傾向を調査する。
遅延に対する様々なソースのコントリビューションを予測するために、回帰機械学習手法を採用している。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 19:45:07 GMT)
Cross Psuedo Supervision Framework for Sparsely Labelled Geo-spatial Images [0.0] 土地利用土地被覆(LULC)マッピングは都市・資源計画に不可欠である。
本研究では,高解像度衛星画像を用いたLULC予測のための半教師付きセグメンテーションモデルを提案する。
粗いラベル付きデータに基づいて画像分割モデルをトレーニングするクロス擬似スーパービジョンフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:14:23 GMT)
Contrastive Learning and Abstract Concepts: The Case of Natural Numbers [0.0] 対照的な学習は、人間でも超人的範囲でも高い精度で、一目で数えられるように訓練できることを示す。
類似アーキテクチャのニューラルネットワークスキームを,一見教師付き学習(SL)のトレーニング・ツー・カウントの結果と比較した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:41:16 GMT)
Context-dependent communication under environmental constraints [0.0] 本研究では,状況に依存したコミュニケーションの出現条件について検討する。
本研究では,受信者の参照選択に対する環境制約を,送信側が一方的に利用可能であることを示す。
一般的な仮定と一致して、送信者のコンテキストに対する認識は、コンテキストコミュニケーションに必要であると考えられる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 00:51:59 GMT)
Compact Multi-Threshold Quantum Information Driven Ansatz For Strongly Interactive Lattice Spin Models [0.0] 近似量子相互情報(QMI)に基づくアンザッツ建築の体系的手順を提案する。
提案手法は,QMI値に基づいて各層の量子ビット対が選択される層状アンサッツを生成し,より効率的な状態生成と最適化ルーチンを実現する。
その結果,Multi-QIDA法は高い精度を維持しながら計算複雑性を低減し,格子スピンモデルにおける量子シミュレーションに有望なツールであることがわかった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 17:07:08 GMT)
Cluster Exploration using Informative Manifold Projections [0.0] 次元減少(DR)は、高次元データの視覚的探索の鍵となるツールの1つである。
本稿では,様々な事前知識に関連付けられた構造を抽出する情報埋め込みを生成する手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 11:20:33 GMT)
Climate-Driven Doubling of Maize Loss Probability in U.S. Crop Insurance: Spatiotemporal Prediction and Possible Policy Responses [0.0] 人工ニューラルネットワークを用いて、米国コーンベルトの将来のトウモロコシ収量を予測する。
我々は,連邦作物保険プログラムにおいて,制度上のリスク曝露に対する警告的な変化を見出した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 03:38:38 GMT)
Classification of Raw MEG/EEG Data with Detach-Rocket Ensemble: An Improved ROCKET Algorithm for Multivariate Time Series Analysis [0.0] 本稿では,脳波やMEGなどの高次元データを扱うための新しいROCKETアルゴリズムであるDetach-Rocket Ensembleを提案する。
我々のアルゴリズムはプルーニングを利用してチャネルの重要度を総合的に推定し、より正確な精度とラベルの確率を与える。
Detach-Rocket Ensembleは、生の脳データに直接適用しても、解釈可能なチャネル関連性と競合する分類精度の両方を提供できることを示す。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:24:09 GMT)
Certification of quantum state functions under partial information [0.0] 情報的不完全測定に基づいて凸関数の厳密な信頼境界を決定する2つの方法を提案する。
提案手法は、信頼度と測定回数の固定化のために、より厳密なバウンダリを提供することにより、既存のプロトコルよりも優れている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:09:37 GMT)
Bridging the Gap to Next Generation Power System Planning and Operation with Quantum Computation [0.0] 再生可能エネルギー世代の統合, 自然負荷の変化, 配電システムの積極的な役割の重要性, グリッド運用における消費者の参加が, 従来の電力グリッドの景観を変えた。
有用な情報を生成するために大量のデータを処理するための高度な計算は、将来のグリッド演算のパラダイムであるが、計算複雑性の重荷を伴っている。
量子技術の進歩は、電力系統関連アプリケーションの計算複雑性の要求に対処するための有望な解決策である。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:41:28 GMT)
Biomimetic Machine Learning approach for prediction of mechanical properties of Additive Friction Stir Deposited Aluminum alloys based walled structures [0.0] 本研究は, バイオミメティック・機械学習を用いてAFSD(Additive Friction Stir deposited)アルミニウム合金壁構造の機械的特性を予測する新しい手法を提案する。
この研究は、AFSDプロセスの数値モデリングと遺伝的アルゴリズム最適化機械学習モデルを組み合わせて、von Misesストレスと対数ひずみを予測する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 13:27:54 GMT)
Backward Compatibility in Attributive Explanation and Enhanced Model Training Method [0.0] 本稿では,事前および更新後のモデル間の特徴属性説明の後方互換性を評価する指標であるBCXを紹介する。
BCXは、事前および更新後のモデルの説明の間の平均合意を計算するために、実践的な合意メトリクスを利用する。
モデルの説明の中でL2距離を利用して,すべての合意基準を改善するBCXRの普遍的変種を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:14:32 GMT)
AssemAI: Interpretable Image-Based Anomaly Detection for Manufacturing Pipelines [0.0] 製造パイプラインにおける異常検出は、産業環境の複雑さと変動性によって強化され、依然として重要な課題である。
本稿では,スマート製造パイプラインに適した解釈可能な画像ベース異常検出システムAssemAIを紹介する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 01:50:09 GMT)
Artificial Intelligence for Public Health Surveillance in Africa: Applications and Opportunities [0.0] 本稿では、大陸の公衆衛生監視におけるAIの適用について検討する。
我々の論文は、AIが病気のモニタリングと健康状態を改善する可能性を強調している。
アフリカの公衆衛生システムにAIが広く採用されるには、大きな障壁が指摘されている。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 15:48:51 GMT)
An integrated view of Quantum Technology? Mapping Media, Business, and Policy Narratives [0.0] 本研究は,QTのビジネス,メディア,政府テキストにおける提示方法について,主題的ナラティブ分析を用いて検討する。
我々は、BERTopicモデリングと定性評価を組み合わせて、テーマや物語を抽出する計算社会科学のアプローチを採用する。
その結果,QTに関する公的な言論は社会的・政治的課題を反映し,技術的・商業的可能性,国際紛争,国家戦略,社会問題に焦点をあてていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 05:00:57 GMT)
AI-Powered Energy Algorithmic Trading: Integrating Hidden Markov Models with Neural Networks [0.0] 本研究では,HMM(Hidden Markov Models)とニューラルネットワークを組み合わせた新たなアプローチを提案する。
COVID(2019-2022)期間中、この二重モデルアプローチはシャープ比0.992で97%のリターンを達成した。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 12:42:38 GMT)
A study on general visual categorization of objects into animal and plant groups using global shape descriptors with a focus on category-specific deficits [0.0] 動物と植物の一般的な分類は,テキスト情報を処理せずに視覚的に識別可能であることを示す。
結果は教師なし学習機構と教師なし学習機構の両方を用いて評価される。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 09:42:46 GMT)
A new indeterminacy-based quantum theory [0.0] 環境決定性に基づく量子理論(EnDQT)の新たな解釈を提案する。
自然崩壊理論のような理論とは異なり、量子論の基本方程式の修正は、決定的な値が生じる際には必要とされない。
EnDQTは、物理学の他の分野や宇宙論などの基礎への支払いを提供することができる。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 14:34:36 GMT)
A Lean Transformer Model for Dynamic Malware Analysis and Detection [0.0] マルウェアは現代のコンピューティングの世界にとって急速に成長する脅威であり、既存の防衛線はこの問題に対処するのに十分な効率性を持っていない。
これまでの研究では、実行レポートから抽出したニューラルネットワークとAPI呼び出しシーケンスを活用することに成功した。
本稿では,悪意のあるファイルを検出するために,Transformersアーキテクチャに基づくエミュレーションオンリーモデルを設計する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 08:46:46 GMT)
A Classifier-Based Approach to Multi-Class Anomaly Detection Applied to Astronomical Time-Series [0.0] 異常検出は多くの科学分野において 未解決の問題です
天文時系列のほとんどの異常検出アルゴリズムは、手作りの特徴か、教師なし表現学習によって生成された特徴に依存している。
本稿では,ニューラルネットワーク分類器の潜時空間を利用した異常検出手法を提案する。
論文参考訳(メタデータ) (Mon, 5 Aug 2024 18:00:00 GMT)