Fugu-MT: arxivの論文翻訳(概要)

Autoregressive Speech Synthesis without Vector Quantization [135.5]
テキストから音声合成(TTS)のための新しい連続値トークンに基づく言語モデリング手法であるMELLEを提案する。 MELLEはテキスト条件から直接連続メル-スペクトログラムフレームを自動回帰生成する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:36:53 GMT)
Entropy Law: The Story Behind Data Compression and LLM Performance [115.7]
モデル性能はトレーニングデータの圧縮比と負の相関関係にあり,トレーニング損失が小さくなるのが普通である。エントロピー法則の知見に基づいて, 極めて効率的で普遍的なデータ選択法を提案する。また,モデルトレーニング開始時の潜在的な性能リスクを検出するエントロピー法則の興味深い応用を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:06:45 GMT)
Evaluating Copyright Takedown Methods for Language Models [100.4]
言語モデル(LM)は、潜在的に著作権のある資料を含む様々なデータに対する広範な訓練からその能力を引き出す。本稿では,LMの著作権削除の可能性と副作用を初めて評価する。システムプロンプトの追加、デコード時間フィルタリングの介入、未学習アプローチなど、いくつかの戦略を検討する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:45:04 GMT)
HiRes-LLaVA: Restoring Fragmentation Input in High-Resolution Large Vision-Language Models [96.8]
HiRes-LLaVAは、元の文脈情報や幾何学的情報を変更することなく、高解像度入力のサイズを処理するように設計された新しいフレームワークである。 HiRes-LLaVAは、2つの革新的なコンポーネントで構成されている: (i)スライスしたパッチを元の形式に再構築し、ダウンアップサンプリング層と畳み込み層を通じてグローバルとローカルの両方の特徴を効率的に抽出するSliceRestoreアダプタ、(ii)自分自身に基づいてビジョントークンを圧縮するセルフマイニングサンプリング。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:42:17 GMT)
A Latent-Variable Model for Intrinsic Probing [93.6]
固有プローブ構築のための新しい潜在変数定式化を提案する。我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:13:10 GMT)
Q-GaLore: Quantized GaLore with INT4 Projection and Layer-Adaptive Low-Rank Gradients [86.4]
量子化と低ランク投影を組み合わせることでメモリ使用量を大幅に削減する新しい手法であるQ-Galoreを導入する。本稿では,Q-Galoreがメモリ効率に優れた競合性能を実現することを実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:42:58 GMT)
PredBench: Benchmarking Spatio-Temporal Prediction across Diverse Disciplines [86.4]
予測時間ネットワークの総合評価に適したベンチマークであるPredBenchを紹介する。このベンチマークでは、広く採用されている12のメソッドと、複数のアプリケーションドメインにまたがる多様なデータセットを統合する。その多次元評価フレームワークは、総合的なメトリクスセットで分析を広げる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:51:36 GMT)
Understanding Transferable Representation Learning and Zero-shot Transfer in CLIP [84.9]
CLIPの基盤となるトランスファーブル表現学習について検討し、異なるモダリティの特徴の整合性を実証する。そこで本研究では,ベンチマークデータセット上でのCLIPや他の最先端手法よりも優れた性能を実現するCLIP型アプローチを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:38:08 GMT)
AutoBencher: Creating Salient, Novel, Difficult Datasets for Language Models [84.7]
3つのデシラタを言語モデルのための優れたベンチマークとして提示する。ベンチマークでは、以前のベンチマークでは示されていなかったモデルランキングの新しいトレンドが明らかになった。 AutoBencherを使って、数学、多言語、知識集約的な質問応答のためのデータセットを作成しています。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:03:47 GMT)
Nonverbal Interaction Detection [83.4]
この研究は、社会的文脈における人間の非言語的相互作用を理解するという新たな課題に対処する。我々はNVIと呼ばれる新しい大規模データセットを寄贈し、人間とそれに対応する社会グループのための境界ボックスを含むように細心の注意を払ってアノテートする。第2に,非言語的インタラクション検出のための新たなタスクNVI-DETを構築し,画像から三つ子を識別する。第3に,非言語相互作用検出ハイパーグラフ (NVI-DEHR) を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:14:06 GMT)
Using Natural Language Explanations to Rescale Human Judgments [81.7]
大規模言語モデル(LLM)を用いて順序付けアノテーションと説明を再スケールする手法を提案する。我々は、アノテータのLikert評価とそれに対応する説明をLLMに入力し、スコア付けルーリックに固定された数値スコアを生成する。提案手法は,合意に影響を及ぼさずに生の判断を再スケールし,そのスコアを同一のスコア付けルーリックに接する人間の判断に近づける。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:47:00 GMT)
Still-Moving: Customized Video Generation without Customized Video Data [81.1]
テキスト・トゥ・ビデオ(T2V)モデルをカスタマイズするための新しいフレームワークであるStill-Movingを紹介する。このフレームワークは、ビデオモデルをテキスト・トゥ・イメージ(T2I)モデル上に構築する、著名なT2V設計に適用される。私たちは、注入されたT2I層によって生成された機能を調整する軽量な$textitSpatial Adapters$をトレーニングします。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:06:53 GMT)
AIR-Bench 2024: A Safety Benchmark Based on Risk Categories from Regulations and Policies [80.9]
AIR-Bench 2024は、新しい政府の規制や企業のポリシーに適合する最初のAI安全ベンチマークである。 8つの政府規制と16の企業政策を4階層の安全分類に分解し、最も低い階層に粒度の細かいリスクカテゴリを分類する。 AIR-Bench 2024上での言語モデルの評価を行い,その安全性に関する知見を明らかにした。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:16:48 GMT)
WildGaussians: 3D Gaussian Splatting in the Wild [80.5]
3DGSによる閉塞や外見の変化に対処する新しいアプローチであるWildGaussiansを紹介した。我々はWildGaussianが3DGSとNeRFのベースラインを越えながら3DGSのリアルタイムレンダリング速度と一致していることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:41:32 GMT)
Loss Shaping Constraints for Long-Term Time Series Forecasting [79.4]
本稿では,長期時系列予測のための制約付き学習手法を提案する。提案手法は, 予測ウィンドウ上でエラーを発生させながら, 時系列ベンチマークにおける競合平均性能を示すことを示すための, 実用的なプリマル・デュアルアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:43:18 GMT)
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Cross-Regularization [78.6]
本稿では,事前学習した重量を効率的に更新する直交微調整法を提案する。また、VLMのゼロショット一般化の観点から安定性を維持するために、クロスレギュラー化戦略を利用する。下流タスクのサンプルの多様性を強化するために、我々はまず、効率的な微調整を促進するためにカットアウトデータ拡張を探索する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:35:53 GMT)
MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model [78.1]
MOFA-Videoは、様々な制御可能な信号を用いて、所定の画像から映像を生成する高度な制御可能な画像アニメーション手法である。ビデオ生成パイプラインの動作を制御するために,複数のドメイン対応モーションフィールドアダプタを設計する。トレーニングの後、異なるドメインのMOFA-Adaptersは、より制御可能なビデオ生成のために協力することもできる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:26:03 GMT)
Quality-Aware Translation Models: Efficient Generation and Quality Estimation in a Single Model [77.2]
そこで我々は,ニューラルネットワーク翻訳(NMT)モデルを用いて,その品質を学習し,その品質を推定する手法を提案する。我々は、単一パスの復号化の効率性よりも、品質向上や品質改善のアプローチよりも優れた品質向上を得る。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:25:06 GMT)
Single-Image Shadow Removal Using Deep Learning: A Comprehensive Survey [77.2]
影のパターンは任意で変化しており、しばしば非常に複雑な痕跡構造を持つ。影による劣化は空間的に不均一であり、照度と影と非陰影領域間の色に矛盾が生じている。この分野での最近の開発は、主にディープラーニングベースのソリューションによって進められている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:58:38 GMT)
MAGNET: Improving the Multilingual Fairness of Language Models with Adaptive Gradient-Based Tokenization [75.3]
マルチ言語設定では、非ラテン語スクリプトと低リソース言語は通常、言語モデルの実用性、効率、コストの点で不利である。適応的勾配に基づくサブワードトークン化による過分割を低減するために,多言語適応型勾配ベーストークン化を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:59:21 GMT)
Benchmarking Complex Instruction-Following with Multiple Constraints Composition [72.8]
大規模言語モデル(LLM)の複雑な命令追従能力の評価方法が重要な研究課題となっている。既存のベンチマークは主に、異なる制約の構成を無視しながら、人間の指示で異なるタイプの制約をモデル化することに焦点を当てている。複数の制約からなる複雑な命令に従うLLMの能力を総合的に評価するためのベンチマークである ComplexBench を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:44:47 GMT)
Learning Program Behavioral Models from Synthesized Input-Output Pairs [71.0]
我々は、_neural machine translation_を用いて入力/出力動作から_modelを学習するフレームワークであるModelizerを紹介した。 Modelizerは_grammars_を使って入力を合成し、結果の出力を解析し、トークンストリーム間のシーケンスとシーケンスの関連を学習する。入力と出力の文法以外は、Modelizerはプログラムを実行する能力だけを必要とする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:25:02 GMT)
HDT: Hierarchical Document Transformer [70.2]
HDTは補助的なアンカートークンを導入し、アテンション機構をスパースなマルチレベル階層に再設計することでドキュメント構造を利用する。文書の階層構造を考慮した新しいスパークアテンションカーネルを開発した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:28:04 GMT)
Controlling the Fidelity and Diversity of Deep Generative Models via Pseudo Density [70.1]
本稿では, GAN や拡散モデルなどのバイアス深層生成モデルへのアプローチを導入し, 忠実度の向上や多様性の向上を図ったデータ生成手法を提案する。提案手法では, 擬似密度という, 個人サンプルの新たな測定基準を用いて, トレーニングとデータ生成の分布を操作する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:46:04 GMT)
Evaluating and Analyzing Relationship Hallucinations in LVLMs [69.8]
視覚関係の幻覚を評価するための新しいベンチマークであるR-Benchを紹介する。 R-Benchは、関係の存在に焦点を当てたイメージレベルの質問と、局所的な視覚的理解を評価するインスタンスレベルの質問を特徴としている。我々は,関係関連性,主観関連性,関係対象性という,幻覚につながる3つの関係共起関係を同定する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:48:39 GMT)
Photonic implementation of the quantum Morra game [69.7]
本研究は,古典ゲームを特殊なケースとして含めることにより,従来の研究を基盤とした2プレーヤ量子モラゲームの忠実な翻訳について研究する。本稿では、アリスが古典ゲームのバランスを崩し、勝利の優位性を持つ量子状態におけるゲームの自然な変形を提案する。量子情報と通信の研究における量子モラゲームの可能性について論じる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:35:38 GMT)
Speculative RAG: Enhancing Retrieval Augmented Generation through Drafting [68.9]
Speculative RAG(投機的RAG)は、より大規模なジェネラリストLMを利用して、より小さな蒸留専門のLMによって並列に生成された複数のRAGドラフトを効率よく検証するフレームワークである。提案手法は,より小さな専門家のLMにドラフト作成を委譲することでRAGを加速し,より大きなジェネラリストのLMがドラフトに1回の検証パスを実行する。 PubHealthの従来のRAGシステムと比較して、レイテンシを51%削減しながら、最大12.97%の精度向上を実現している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:50:19 GMT)
FedMedICL: Towards Holistic Evaluation of Distribution Shifts in Federated Medical Imaging [68.7]
FedMedICLは統合されたフレームワークであり、フェデレートされた医療画像の課題を全体評価するためのベンチマークである。 6種類の医用画像データセットについて,いくつかの一般的な手法を総合的に評価した。単純なバッチ分散手法はFedMedICL実験全体の平均性能において,高度な手法を超越していることがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:12:23 GMT)
LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuning [67.4]
LLMには、微調整なしで長いコンテキストを処理できる固有の能力がある、と我々は主張する。バイレベルアテンション情報を構築することで,LLMのコンテキストウィンドウを拡張するためのSelfExtendを提案する。複数のベンチマークで包括的な実験を行い、その結果、既存のLLMのコンテキストウィンドウ長を効果的に拡張できることが示されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:11:46 GMT)
Extracting Training Data from Document-Based VQA Models [67.1]
VLM(Vision-Language Models)は、文書ベースの視覚質問回答において顕著な進歩を遂げている(つまり、画像として提供される入力文書の内容に関する問い合わせに応答する)。これらのモデルでは、関連する視覚情報が削除された場合でも、トレーニングサンプルに対する応答を記憶し、それらをリグルジタイズすることができる。これには、トレーニングセットで繰り返し繰り返されるパーソナライズ可能な情報が含まれており、これらのモデルが機密情報を漏らし、したがってプライバシーリスクを引き起こす可能性があることを示している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:44:41 GMT)
SEED-Story: Multimodal Long Story Generation with Large Language Model [66.4]
SEED-Storyは、MLLM(Multimodal Large Language Model)を利用して拡張マルチモーダルストーリーを生成する新しい手法である。マルチモーダルアテンションシンク機構を提案し,最大25個のストーリー(トレーニング用10個)を高い効率で自動回帰的に生成する。本稿では,大規模かつ高解像度なStoryStreamというデータセットを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:21:03 GMT)
A Dialogue Game for Eliciting Balanced Collaboration [64.6]
本稿では、プレイヤーがゴール状態自体を交渉しなければならない2Dオブジェクト配置ゲームを提案する。我々は,人間プレイヤーが様々な役割を担っていることを実証的に示し,バランスの取れた協調によってタスクのパフォーマンスが向上することを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:51:34 GMT)
MAVIS: Mathematical Visual Instruction Tuning [64.3]
改善すべきMLLM内の3つの重要な領域を同定する。数学図形の視覚的エンコーディング、図形言語アライメント、数学的推論スキル。 MLLMのための算術的ViSual命令チューニングパラダイムであるMAVISを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:59:47 GMT)
Live2Diff: Live Stream Translation via Uni-directional Attention in Video Diffusion Models [64.2]
大規模言語モデルは、テキストやオーディオなどのストリーミングデータの生成において顕著な効果を示している。本稿では,一方向の時間的注意を向けたビデオ拡散モデルを設計するための最初の試みであるLive2Diffを紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:34:51 GMT)
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs [63.8]
FunAudioLLMは、人間と大規模言語モデル(LLM)の間の自然な音声相互作用を強化するために設計されたモデルファミリーである中心となる2つの革新的なモデルとして、多言語音声認識、感情認識、音声イベント検出を処理するSenseVoiceと、複数の言語、音色、話し方、話者識別を制御した自然言語生成を容易にするCosyVoiceがある。 SenseVoiceとCosyVoiceに関連するモデルは、GitHubでリリースされたトレーニング、推論、微調整コードとともに、ModelscopeとHuggingfaceでオープンソース化されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:08:35 GMT)
Model Surgery: Modulating LLM's Behavior Via Simple Parameter Editing [63.2]
大言語モデル(LLM)は、ジェネラリストアシスタントとして大きな可能性を示している。これらのモデルは、非毒性や脱獄の試みに対するレジリエンスなど、望ましい行動特性を示すことが重要である。本稿では,パラメータの小さなサブセットを直接編集することで,LLMの特定の振る舞いを効果的に調節できることを観察する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:52:03 GMT)
Adaptive Selection for Homogeneous Tools: An Instantiation in the RAG Scenario [62.6]
ツール学習に関する現在の研究は、主に様々な選択肢から最も効果的なツールを選択することに焦点を当てており、しばしば費用対効果を見落としている。本稿では,タスクの達成に必要な性能と関連するコストの両方を予測し,同種ツールの選択に対処する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:37:47 GMT)
ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation [62.6]
本研究では,新しい単分子深度推定法であるScaleDepthを提案する。提案手法は,距離深度をシーンスケールと相対深度に分解し,セマンティック・アウェア・スケール予測モジュールを用いて予測する。本手法は,室内と屋外の両方のシーンを統一した枠組みで距離推定する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:11:56 GMT)
One Model to Rule them All: Towards Universal Segmentation for Medical Images with Text Prompts [62.6]
我々は、SATと呼ばれるテキストプロンプトによって駆動される放射線学的スキャンにおいて、任意のセグメンテーションを可能にするモデルを構築することを目指している。トレーニングのために、最大かつ最も包括的なセグメンテーションデータセットを構築します。我々はSAT-Nano(110Mパラメータ)とSAT-Pro(447Mパラメータ)をトレーニングし、データセット/サブセット毎にトレーニングされた72の専門家nnU-Netに匹敵する性能を示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:09:39 GMT)
Label-anticipated Event Disentanglement for Audio-Visual Video Parsing [61.1]
我々は新しいデコードパラダイムであるアンダーライン・サンダーライン・エンダーライン・アンダーライン・インダーライン・プロジェクション(LEAP)を導入する。 LEAPは、音声/視覚セグメントの符号化された潜在機能を意味的に独立したラベル埋め込みに反復的に投影する。 LEAPパラダイムを促進するために,新しい音声・視覚的類似性損失関数を含むセマンティック・アウェア・最適化戦略を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:57:08 GMT)
Uncertainty Estimation of Large Language Models in Medical Question Answering [60.7]
大規模言語モデル(LLM)は、医療における自然言語生成の約束を示すが、事実的に誤った情報を幻覚させるリスクがある。医学的問合せデータセットのモデルサイズが異なる人気不確実性推定(UE)手法をベンチマークする。以上の結果から,本領域における現在のアプローチは,医療応用におけるUEの課題を浮き彫りにしている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:51:33 GMT)
Bridging the Gap between Human Motion and Action Semantics via Kinematic Phrases [59.3]
動作理解は、動作意味論と行動意味論の信頼性の高いマッピングを確立することを目的としている。本研究では,人間の動作の客観的な運動事実を適切な抽象化,解釈可能性,一般性で捉えたキネマティック・フェース(KP)を提案する。 KPに基づいて、動作知識ベースを統一し、動作理解システムを構築することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:39:02 GMT)
BlendFilter: Advancing Retrieval-Augmented Large Language Models via Query Generation Blending and Knowledge Filtering [58.4]
BlendFilterは、知識フィルタリングと組み合わせたクエリ生成を統合することで、検索強化された大規模言語モデルを高める新しいアプローチである。我々は3つのオープンドメイン質問応答ベンチマークで広範な実験を行い、我々の革新的なBlendFilterが最先端のベースラインをはるかに上回っていることを明らかにした。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:26:15 GMT)
OTSeg: Multi-prompt Sinkhorn Attention for Zero-Shot Semantic Segmentation [57.8]
Multi-Prompts Sinkhorn Attention (MPSA)は、マルチモーダル設定でTransformerフレームワーク内のクロスアテンションメカニズムを効果的に置き換える。 OTSegは、Zero-Shot Semantic (ZS3)タスクで大幅に向上した、最先端のSOTA(State-of-the-art)パフォーマンスを実現している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:09:48 GMT)
AddressCLIP: Empowering Vision-Language Models for City-wide Image Address Localization [57.3]
そこで我々は,より意味論的に問題を解決するために,AddressCLIPというエンドツーエンドのフレームワークを提案する。われわれはピッツバーグとサンフランシスコに3つのデータセットを構築した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:18:53 GMT)
A Matter of Annotation: An Empirical Study on In Situ and Self-Recall Activity Annotations from Wearable Sensors [56.6]
In-the-wildデータ収集に焦点をあてたユーザスタディにおいて,一般的な4つのアノテーション手法の評価と対比を行う実験的検討を行った。実際の記録プロセス中に参加者がアノテートするユーザ主導のin situアノテーションと、各日の終わりに参加者が振り返ってアノテートするリコールメソッドの両方に対して、参加者は自身のアクティビティクラスと対応するラベルを選択できる柔軟性を持っていた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:23:32 GMT)
Improving Molecular Modeling with Geometric GNNs: an Empirical Study [56.5]
本稿では,異なる標準化手法,(2)グラフ作成戦略,(3)補助的なタスクが性能,拡張性,対称性の強制に与える影響に焦点をあてる。本研究の目的は,分子モデリングタスクに最適なモデリングコンポーネントの選択を研究者に案内することである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:04:12 GMT)
RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models [56.1]
ポートレート画像から高忠実度3Dアバターを生成できるRodinHDを提案する。我々はまず、多くのアバターに連続して三葉飛行機を取り付けたときに生じる破滅的な忘れの問題を特定する。本研究では, より微細な階層表現を演算し, リッチな2次元テクスチャキューを捕捉し, 複数層での3次元拡散モデルに注入することにより, ポートレート画像の導出効果を最適化する。三葉機用に最適化されたノイズスケジュールを持つ46Kアバターでトレーニングを行うと、得られたモデルは従来の方法よりも顕著な詳細で3Dアバターを生成することができ、内蔵機器に一般化することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:46:45 GMT)
EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.8]
EvoAgentは進化的アルゴリズムによって専門家エージェントをマルチエージェントシステムに自動的に拡張する汎用的な手法である。 EvoAgentは複数の専門家エージェントを自動生成し,LLMエージェントのタスク解決能力を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:18:35 GMT)
Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On [55.4]
一般的な7B言語モデル上での教師付き微調整(SFT)であるSkywork-Mathモデルシリーズを紹介する。 Skywork-Math 7Bは競争レベルのMATHベンチマークで51.2%の精度を達成した。我々は,LLMの数学推論能力を高めるために,研究用と産業用の両方で,いくつかの実践的なテイクアウトを提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:56:51 GMT)
Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [54.2]
コネクショニストと象徴的人工知能(AI)の収束を探求する記事従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:00:53 GMT)
Virtual Context: Enhancing Jailbreak Attacks with Special Token Injection [54.1]
本稿では、以前LLMセキュリティで見過ごされていた特別なトークンを活用して、ジェイルブレイク攻撃を改善する仮想コンテキストを提案する。総合的な評価によると、仮想コンテキストによるジェイルブレイク攻撃は、4つの広く使われているジェイルブレイク手法の成功率を約40%向上させることができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:21:31 GMT)
DegustaBot: Zero-Shot Visual Preference Estimation for Personalized Multi-Object Rearrangement [53.9]
本稿では,視覚的嗜好学習のためのアルゴリズムであるDegustaBotを提案する。我々は、シミュレーション表設定タスクにおいて、自然主義的個人的嗜好の大規模なデータセットを収集する。私たちのモデルの予測の50%は、少なくとも20%の人々に受け入れられる可能性が高いことが分かりました。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:28:02 GMT)
The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective [53.5]
モデルとデータの開発は2つの別々のパスではなく、むしろ相互接続であることがわかった。一方,MLLMの性能向上には,大規模かつ高品質なデータが寄与する一方,MLLMはデータの開発を促進することができる。 MLLMコミュニティにおけるデータモデル共同開発を促進するために,データモデル共同開発の観点からMLLMに関連する既存の研究を体系的にレビューする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:08:11 GMT)
MetaUrban: A Simulation Platform for Embodied AI in Urban Spaces [52.1]
最近のロボティクスとエンボディードAIの進歩により、公共の都市空間はもはや人間専用ではない。フードデリバリーロボットと電動車椅子は歩道を歩行者と共有し始めている。都市空間の混雑する街路を走行する際には,これらのモバイル機器の汎用性と安全性の確保が不可欠である。本稿では,都市空間におけるEmbodied AI研究のための合成シミュレーションプラットフォームMetaUrbanを紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:56:49 GMT)
Generalizable Implicit Motion Modeling for Video Frame Interpolation [52.0]
フローベースビデオフレーム補間(VFI)における動きの重要性 General Implicit Motion Modeling (IMM)は、モーションモデリングVFIの新規かつ効果的なアプローチである。我々のGIMMは、既存のフローベースのVFIワークとスムーズに統合できます。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:13:15 GMT)
HAF-RM: A Hybrid Alignment Framework for Reward Model Training [51.6]
報酬モデルトレーニングのためのハイブリッドアライメントフレームワークHaF-RMを提案する。報酬モデルのパフォーマンスとアライメントを高めるための、原則的で効果的なアプローチを提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:35:06 GMT)
SRPose: Two-view Relative Pose Estimation with Sparse Keypoints [51.5]
SRPoseは、カメラ・トゥ・ワールドおよびオブジェクト・トゥ・カメラシナリオにおける2ビュー相対ポーズ推定のためのスパースキーポイントベースのフレームワークである。精度と速度の点で最先端の手法と比較して、競争力や優れた性能を達成する。さまざまな画像サイズやカメラ固有の機能に対して堅牢であり、低コンピューティングリソースでデプロイすることができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:46:35 GMT)
SoupLM: Model Integration in Large Language and Multi-Modal Models [51.1]
大規模言語モデル(LLM)の訓練には、かなりの計算資源が必要である。既存の公開LLMは通常、さまざまなタスクにまたがる、多種多様なプライベートにキュレートされたデータセットで事前トレーニングされる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:38:15 GMT)
Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.0]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:28:34 GMT)
Visible and Clear: Finding Tiny Objects in Difference Map [50.5]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:07:06 GMT)
Step-Back Profiling: Distilling User History for Personalized Scientific Writing [50.5]
大きな言語モデル(LLM)は、さまざまな自然言語処理タスクに優れていますが、個人向けにパーソナライズされたコンテンツを生成するのに苦労しています。ユーザ履歴を簡潔なプロファイルに抽出することで,LSMをパーソナライズするためのSTEP-BACK ProFIlingを導入する。本手法は,一般パーソナライゼーションベンチマークにおいて,ベースラインを最大3.6ポイント向上させる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:29:12 GMT)
BeTAIL: Behavior Transformer Adversarial Imitation Learning from Human Racing Gameplay [48.8]
模倣学習は、手作りの報酬関数を必要とせずに、デモンストレーションからポリシーを学ぶ。本稿では,BeTAIL: Behavior Transformer Adversarial Imitation Learningを提案する。我々は,Gran Turismo Sportにおけるリアルヒューマンゲームプレイのエキスパートレベルのデモンストレーションで,BeTAILを3つの課題でテストした。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:50:08 GMT)
RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL [48.5]
文脈内学習を伴う大規模言語モデル(LLM)は、テキスト・ツー・タスクの性能を大幅に改善した。 In-context prompt Engineering のための新しい検索ベースフレームワーク RB- を提案する。実験により,我々のモデルは,公開データセットのBIRDとSpiderの競合ベースラインよりも優れた性能が得られることが示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:19:58 GMT)
Unifying 3D Representation and Control of Diverse Robots with a Single Camera [48.3]
我々は,ロボットを視覚のみからモデル化し,制御することを自律的に学習するアーキテクチャであるNeural Jacobian Fieldsを紹介する。提案手法は,正確なクローズドループ制御を実現し,各ロボットの因果動的構造を復元する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:55:49 GMT)
Mask-Enhanced Segment Anything Model for Tumor Lesion Semantic Segmentation [48.1]
Mask-Enhanced SAM (M-SAM) は, 腫瘍の3次元セグメント化に適した革新的なアーキテクチャである。本稿では,M-SAM内におけるMask-Enhanced Adapter (MEA) を提案する。我々のM-SAMは高いセグメンテーション精度を達成し、またロバストな一般化を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:58:51 GMT)
Data Mixing Made Efficient: A Bivariate Scaling Law for Language Model Pretraining [47.8]
本研究は、データ混合物の低コストプロキシに基づく戦略を検証することによって、制限に対処する。我々は、データ量と混合比率の両方を正確にモデル化する、$textbfBiMix$と呼ばれる統一スケーリング法を提案する。この結果から,エントロピー駆動のトレーニングフリーなデータ混合は,資源集約的な手法よりも同等あるいはそれ以上の性能を達成できることがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:44:45 GMT)
Benchmarking GPT-4 on Algorithmic Problems: A Systematic Evaluation of Prompting Strategies [47.1]
大規模言語モデル(LLM)は自然言語処理の分野に革命をもたらした。 LLMは体系的な一般化を欠き、学習された統計正則をトレーニング分布の外へ外挿することができる。本稿では,最も先進的なLCMの1つであるGPT-4の系統的なベンチマークを行う。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:54:45 GMT)
Learning Neural Volumetric Pose Features for Camera Localization [47.1]
本稿では,PoseMapと呼ばれるニューラルボリュームポーズ機能を導入し,カメラのローカライゼーションを強化した。我々のフレームワークは、拡張されたNeRFモジュールとともにAPR(Absolute Pose Regression)アーキテクチャを活用している。室内および屋外のベンチマークシーンで平均14.28%, 20.51%の性能向上が得られた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:09:29 GMT)
TAKT: Target-Aware Knowledge Transfer for Whole Slide Image Classification [46.8]
本稿では,教師-学生パラダイムを取り入れた目標認識型知識伝達フレームワークを提案する。我々のフレームワークは、教師モデルがソースとターゲットドメインから共通知識を学習することを可能にする。本手法は,各種データセット上での知識伝達手法の最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:52:14 GMT)
Is Your Model Really A Good Math Reasoner? Evaluating Mathematical Reasoning with Checklist [46.7]
大規模言語モデル(LLM)の数学的能力を包括的に定義し評価する方法が重要な問題となっている。タスクの一般化とロバスト性の推論のためのよく設計されたチェックリストであるMATHCHECKを紹介する。我々はMATHCHECK-GSMとMATHCHECK-GEOを採用し、20 LLMと11 MLLMの総合的な数学的推論能力を評価した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:58:58 GMT)
Video Diffusion Alignment via Reward Gradients [46.6]
本研究では,映像拡散モデルに適応するために,強力な視覚識別モデル上での嗜好によって学習される事前学習報酬モデルを利用する。様々な報酬モデルとビデオ拡散モデルにまたがって結果を示し、報奨クエリや計算の点で、我々のアプローチがより効率的に学習できることを実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:59:45 GMT)
A Comprehensive Study of Multimodal Large Language Models for Image Quality Assessment [46.6]
MLLM(Multimodal Large Language Models)は、視覚的理解と推論において大きな進歩を経験している。画像品質評価(IQA)のための強力でフレキシブル、解釈可能、およびテキスト駆動モデルとして機能する可能性については、まだ明らかにされていない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:11:53 GMT)
Leveraging Large Language Models for Scalable Vector Graphics-Driven Image Understanding [46.0]
大規模言語モデル(LLM)は、自然言語理解において大きな進歩を遂げた。本研究は,LLMが画像の理解も可能かどうかを考察する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:59:53 GMT)
Vox Populi, Vox AI? Using Language Models to Estimate German Public Opinion [45.8]
我々は,2017年ドイツ縦断選挙研究の回答者の個人特性と一致するペルソナの合成サンプルを生成した。我々は,LSM GPT-3.5に対して,各回答者の投票選択を予測し,これらの予測を調査に基づく推定と比較する。 GPT-3.5は市民の投票選択を正確に予測せず、緑の党と左派に偏見を呈している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:52:18 GMT)
$β$-DPO: Direct Preference Optimization with Dynamic $β$ [45.6]
直接選好最適化(DPO)は、人間の嗜好に従うために大規模言語モデル(LLM)を訓練するための魅力的なアプローチとして登場した。我々は、$beta$とデータ品質がDPOに与える影響を分析し、最適な$beta$値がペアデータの情報性によって異なることを明らかにする。バッチレベルで$beta$を動的に校正する新しいフレームワークを導入し、データ品質を考慮に入れます。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:21:18 GMT)
BraTS-PEDs: Results of the Multi-Consortium International Pediatric Brain Tumor Segmentation Challenge 2023 [44.8]
小児脳腫瘍に焦点を当てた第1回BraTS-PEDs 2023チャレンジの結果を報告する。 BraTS-PEDs 2023は、磁気共鳴画像による小児脳グリオーマの体積分割アルゴリズムの評価を目的とした。小児腫瘍分析におけるトップパフォーマンスのAIアプローチには、nnU-NetとSwin UNETR、Auto3DSeg、あるいはnnU-Netの自己組織化フレームワークによるアンサンブルが含まれていた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:35:32 GMT)
SeaEval for Multilingual Foundation Models: From Cross-Lingual Alignment to Cultural Reasoning [44.5]
SeaEvalは多言語基盤モデルのベンチマークである。これらのモデルがどのように理解し、自然言語で推論するかを特徴付ける。また、文化の実践やニュアンス、価値観をいかに理解したかについても検討する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:01:41 GMT)
On Leakage of Code Generation Evaluation Datasets [44.5]
コード生成テストセットによる汚染について考察する。我々の発見の鍵は161のプロンプトと関連するピソン溶液のデータセットである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:37:20 GMT)
E2VIDiff: Perceptual Events-to-Video Reconstruction using Diffusion Priors [44.4]
イベント間再構成に拡散モデルを導入し、無彩色イベントからカラフルでリアルで知覚的に優れた映像生成を実現する。当社のアプローチは、与えられたイベントに忠実な、多様で現実的なフレームを作り出すことができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:10:58 GMT)
An Unsupervised Domain Adaptation Method for Locating Manipulated Region in partially fake Audio [43.9]
多様性とエントロピーを考慮したサンプルマイニング(SDE)という教師なし手法を提案する。本手法は、まず、ソースドメインの異なる視点から優れたパフォーマンスを達成する多様な専門家のコレクションから学習する。対象ドメインから未知のサンプルの10%を導入することで、F1スコアは43.84%となり、第2ベット法に比べて77.2%の相対的な増加を示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:32:16 GMT)
Constructing Benchmarks and Interventions for Combating Hallucinations in LLMs [43.6]
大型言語モデル(LLM)は幻覚を起こす傾向がある。最近の研究は、モデル世代に介入することで幻覚を緩和しようとする試みである。一般的な研究は異なる設定を採用しており、幻覚の原因を適切に区別していない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:31:31 GMT)
Featurizing Koopman Mode Decomposition For Robust Forecasting [43.5]
本稿では、FKMD(Featurized Koopman Mode Decomposition)と呼ばれる高度なクープマンモード分解技術を紹介する。 FKMDは遅延埋め込みと学習したマハラノビス距離を用いて高次元力学系の解析と予測を強化する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:28:07 GMT)
DenseFusion-1M: Merging Vision Experts for Comprehensive Multimodal Perception [43.4]
高品質な画像テキストデータセットは、多様な視覚的要素と画像記述全体を提供する。現在のキャプションエンジンは、完全かつ正確なアノテーションを提供していない。本稿では,低予算かつ高効率なキャプションエンジンを用いた知覚融合法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:48:06 GMT)
Deep Learning Safety Concerns in Automated Driving Perception [43.0]
本稿では、クロスファンクショナルなチームが共同で関心事に対処できるようにするとともに、理解を深めるための追加の分類を紹介します。近年のディープラーニング分野の進歩と認識のためのディープニューラルネットワーク(DNN)の性能向上により、自動走行(AD)システムへの需要が高まっている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:07:47 GMT)
Measurement-induced entanglement transition in chaotic quantum Ising chain [42.9]
本研究では,モデルの可積分性や対称性を損なう摂動,および測定プロトコルの変更について検討し,その結果として生じるカオスと解離スペクトル形因子(DSFF)による可積分性の欠如を特徴付ける。測定誘起相転移とその性質は, 積分性の欠如や$bbZ$対称性の破れに大きく敏感なように見えるが, 横方向から長手方向への測定ベースの変更により, 相転移は完全に消失することを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:39:29 GMT)
SR-Mamba: Effective Surgical Phase Recognition with State Space Model [42.8]
SR-マンバ(SR-Mamba)は、外科的位相認識の課題を満たすために特別に設計された、新しい無注意モデルである。 SR-Mambaでは、双方向のMambaデコーダを用いて、時間的コンテキストをオーバーロングシーケンスで効果的にモデル化する。 SR-Mambaは、Colec80とCATARACTS Challengeデータセットで最先端のパフォーマンスを示すことによって、外科的ビデオ分析の新たなベンチマークを確立する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:34:31 GMT)
LLMs in Biomedicine: A study on clinical Named Entity Recognition [42.7]
大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な汎用性を示す。本稿では,NERタスクの性能向上戦略について検討する。提案手法であるDiRAGは,バイオメディカルNERにおけるLDMのゼロショットF1スコアを高めることができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:09:30 GMT)
Enhancing ADHD Diagnosis with EEG: The Critical Role of Preprocessing and Key Features [41.9]
本研究は,ADHDと診断された小児および典型的には(TD)児の脳波データセットを用いた。 4つの前処理技術が適用された。前処理(Raw)、有限インパルス応答(FIR)フィルタリング、アーティファクト部分空間再構成(ASR)、独立成分分析(ICA)である。プリプロセッシングの欠如は, ノイズによる人為的に高い分類精度をもたらすが, 対照的に, ASRおよびICAプリプロセッシング技術は, 結果の信頼性を著しく向上させた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:07:22 GMT)
GLBench: A Comprehensive Benchmark for Graph with Large Language Models [41.9]
GLBenchは、教師付きシナリオとゼロショットシナリオの両方でGraphLLMメソッドを評価するための最初の包括的なベンチマークである。 GLBenchはグラフニューラルネットワークのような従来のベースラインとともに、GraphLLMメソッドのさまざまなカテゴリを公平かつ徹底的に評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:06:33 GMT)
DG-PIC: Domain Generalized Point-In-Context Learning for Point Cloud Understanding [41.5]
本稿では,ドメイン一般化ポイントクラウド理解のための統一モデルにおいて,複数のドメインと複数のタスクを扱う,新しい,実用的なマルチドメインマルチタスク設定を提案する。我々のDG-PICは、テスト中にモデル更新を一切必要とせず、見えないドメインと複数のタスク、例えば、ポイントクラウドの再構築、デノナイズ、登録を1つの統一モデルで処理できる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:21:40 GMT)
MeshAvatar: Learning High-quality Triangular Human Avatars from Multi-view Videos [41.5]
多視点ビデオから高品質な三角アバターを学習するための新しいパイプラインを提案する。本手法は暗黙のSDFフィールドから抽出した三角メッシュでアバターを表現する。我々は、幾何学とテクスチャを正確に分解するために物理ベースのレンダリングを取り入れた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:37:51 GMT)
Multi-modal Attribute Prompting for Vision-Language Models [40.4]
VLM(Pre-trained Vision-Language Models)は、タスクをダウンストリームする強力な一般化能力を示すが、少数のシナリオでは苦労する。既存のプロンプト技術は主にグローバルテキストと画像表現に重点を置いているが、マルチモーダル属性の特徴を見落としている。テキスト属性プロンプト,視覚属性プロンプト,属性レベルのアライメントを共同で探索し,マルチモーダル属性プロンプト法(MAP)を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:10:51 GMT)
Quantum Generative Diffusion Model: A Fully Quantum-Mechanical Model for Generating Quantum State Ensemble [40.1]
本稿では,量子生成拡散モデル (QGDM) を単純かつエレガントな量子モデルとして紹介する。 QGDMはQGAN(Quantum Generative Adversarial Network)よりも高速な収束を示す混合状態発生ではQGANよりも53.02%高い忠実性が得られる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:46:04 GMT)
Purifying quantum-dot light in a coherent frequency interface [39.6]
量子ネットワークは、光ファイバーの低損失伝送を利用するために、テレコム波長で動作する。明暗の量子ドット(QDs)は、InGaAs QDsのような光の非常に区別できない量子状態を放出し、近赤外線で光子を放出する。本稿では, 周期的に偏極した窒化リチウム導波路において, 単一光子のQD源からCバンドへのスペクトル浄化と周波数シフトを同時に実施する方法について報告する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:02:43 GMT)
Production and stabilization of a spin mixture of ultracold dipolar Bose gases [39.6]
本研究では, ゼーマン状態が162ドルDy原子の2つの最下層からなる混合物について実験を行った。干渉現象のため、そのような非弾性過程の速度はウィグナーしきい値法則により劇的に減少する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:37:01 GMT)
High-quality entangled photon source by symmetric beam displacement design [39.6]
絡み合った光子源は、量子通信、計算、センシングの進展において重要である。この研究は、0型自発パラメトリックダウンコンバージョンを利用する偏光共役光子源を導入する。平均的絡み合いの可視性は99%以上であった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:51:01 GMT)
Bifurcated Attention: Accelerating Massively Parallel Decoding with Shared Prefixes in LLMs [39.2]
Bifurcated attentionは、共有コンテキストバッチデコードシナリオにおける言語モデル推論を強化するために設計された手法である。提案手法は,高バッチサイズおよび拡張コンテキスト長のレイテンシに寄与する重要な要因である冗長メモリIOコストの課題に対処する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:07:30 GMT)
Distributed Deep Reinforcement Learning Based Gradient Quantization for Federated Learning Enabled Vehicle Edge Computing [38.9]
フェデレートラーニング(FL)は、車両エッジコンピューティング(VEC)における車両のプライバシーを保護する車両の局所モデルの勾配は通常、車載人工知能(AI)応用において大きい。本稿では,分散深部強化学習(DRL)に基づく量子化レベル割り当て方式を提案し,学習時間と量子化誤差の合計から長期報酬を最適化する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:58:47 GMT)
Reason2Drive: Towards Interpretable and Chain-based Reasoning for Autonomous Driving [38.3]
Reason2Driveは600万以上のビデオテキストペアを備えたベンチマークデータセットである。我々は、自律運転プロセスが知覚、予測、推論ステップの逐次的な組み合わせであると特徴付けている。本稿では,自律システムにおける連鎖型推論性能を評価するための新しい集計評価指標を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:15:19 GMT)
Explore the Potential of CLIP for Training-Free Open Vocabulary Semantic Segmentation [38.2]
トレーニング不要なセマンティックセグメンテーション戦略であるCLIPtraseを提案する。パッチ間の自己相関を補正することで、局所的な特徴認識を高める。実験の結果、CLIPよりも平均して9つのセグメンテーションベンチマークで22.3%先行していることがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:12:16 GMT)
Multi-Modal Prototypes for Open-World Semantic Segmentation [37.8]
セマンティックセグメンテーションをより包括的にサポートするために,テキストおよび視覚的手がかりを多モーダルプロトタイプとして包含することを提案する。我々は,高レベル言語情報を多視点プロトタイプとして分解し,低レベル視覚情報をより意味のあるプロトタイプとして集約する。弾性マスク予測モジュールに基づいて、ゼロショット、少数ショット、一般化されたタスクを1つのアーキテクチャで解くことができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:14:55 GMT)
Efficient Diffusion-Driven Corruption Editor for Test-Time Adaptation [37.7]
テスト時間適応(TTA)は、テスト時間中に発生する予期せぬ分散シフトに対処する。本稿では,遅延拡散モデル(LDM)に基づく画像編集モデルを利用した新しいTTA手法を提案する。我々のモデルは拡散ベースベースラインよりも100倍高速なランタイムで最高の性能を達成する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:12:07 GMT)
Natural language is not enough: Benchmarking multi-modal generative AI for Verilog generation [37.3]
視覚言語入力からのVerilog合成に適したマルチモーダル生成モデルのオープンソースベンチマークを提案する。また、オープンソースのビジュアルで自然言語のVerilogクエリ言語フレームワークについても紹介する。本結果は,自然言語のみに基づくクエリと比較して,マルチモーダル生成のVerilogが大幅に向上したことを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:10:09 GMT)
Characterizing Prompt Compression Methods for Long Context Inference [37.0]
長期のコンテキスト推論は、計算とメモリの要求が増大するにつれて、システムレベルでの課題を提示します。コンテクスト長を削減するためにプロンプトを圧縮するいくつかの方法が提案されている。我々は、異なるプロンプト圧縮法を包括的に評価し、評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:34:32 GMT)
SubspaceNet: Deep Learning-Aided Subspace Methods for DoA Estimation [36.6]
SubspaceNetは、観測を区別可能な部分空間に分割する方法を学ぶデータ駆動型DoA推定器である。 SubspaceNetは、コヒーレントソース、広帯域信号、低いSNR、配列ミスマッチ、限られたスナップショットに対処する様々なDoA推定アルゴリズムを実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:16:41 GMT)
Looks can be Deceptive: Distinguishing Repetition Disfluency from Reduplication [36.6]
本稿では,計算言語学を用いた音声における重複と繰り返しの大規模研究について述べる。我々は,Hindi,Telugu,Marathiテキストを含む新しい公開データセットであるIndicRedRepを紹介した。我々は,2つの現象を区別するためにReparandum-Interregnum-Repair構造を用いて,マルチクラス複製と繰り返しトークン分類のためのトランスフォーマーモデルの評価を行った。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:00:14 GMT)
Pistis-RAG: A Scalable Cascading Framework Towards Trustworthy Retrieval-Augmented Generation [36.5]
Pistis-RAGは、大規模検索拡張生成(RAG)システムの課題に対処するために設計されたスケーラブルなマルチステージフレームワークである。私たちのフレームワークは、マッチング、序列、ランク付け、推論、集約という、異なるステージで構成されています。我々の新しいランキングステージは、情報検索の原則を取り入れたRAGシステムに特化して設計されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:28:34 GMT)
$R^3$: "This is My SQL, Are You With Me?" A Consensus-Based Multi-Agent System for Text-to-SQL Tasks [36.2]
Review-Rebuttal-Revisionは、テキスト対タスクのためのコンセンサスベースのマルチエージェントシステムである。 Llama-3-8Bでは、$R3$はチェーン・オブ・シークレットを20%以上上回り、スパイダーの開発セットではGPT-3.5を上回ります。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:14:54 GMT)
Tri$^{2}$-plane: Thinking Head Avatar via Feature Pyramid [35.7]
本稿では,モノクラーフォトリアリスティックな頭部アバター再構成のための新しいアプローチTri$2$-planeを提案する。提案されたTri$2$-planeは、細部の改善のために特徴ピラミッドと3つの上下方向接続の原理を利用している。顔の詳細を複数のスケールで分析してレンダリングし、顔全体から特定の地域へ移行し、さらに洗練されたサブリージョンへと移行する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:03:27 GMT)
fairBERTs: Erasing Sensitive Information Through Semantic and Fairness-aware Perturbations [35.6]
フェアチューニングされたBERT系列モデルを学習するためのフレームワークである FairBERT を提示する。モデルユーティリティを維持しながら不公平を緩和する上で, フェアバーティの優れた優位性を実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:13:38 GMT)
The Career Interests of Large Language Models [35.2]
本研究は,Large Language Models (LLMs) に Occupation Network's Interest Profiler ショートフォームを適用することで,キャリアの関心事の側面に焦点を当てる。 LLMでは,特に社会的・芸術的領域において,キャリアへの関心が顕著であった。心理測定器と高度統計ツールをLCM上で使用するこの新しいアプローチは、彼らの専門的な環境への統合について、新たな視点を浮き彫りにする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:54:46 GMT)
Beyond Aesthetics: Cultural Competence in Text-to-Image Models [35.0]
CUBEは、テキスト・ツー・イメージ・モデルの文化的能力を評価するための最初のベンチマークである。 CUBEは、異なる地理的文化圏の8か国に関連する文化的アーティファクトをカバーしている。 CUBE-CSpaceは、文化的多様性を評価する基盤となる文化的アーティファクトのより大きなデータセットである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:57:37 GMT)
Adaptive Compressed Sensing with Diffusion-Based Posterior Sampling [34.5]
圧縮センシング(CS)は、高忠実度再構成に十分な測定値の小さなサブセットを選択することにより、高速な画像取得を容易にする。アダプティブCSは、既に取得したデータから得られる情報に基づいて、将来の計測を動的に選択することで、このプロセスをさらに強化しようとしている。 AdaSenseは、ゼロショット後部サンプリングと事前学習拡散モデルを利用する新しい適応CSアプローチである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:56:17 GMT)
Open Panoramic Segmentation [34.5]
我々は,FoV制限されたピンホール画像をオープン語彙設定でトレーニングする,Open Panoramic (OPS) と呼ばれる新しいタスクを提案する。また,DAN (Deformable Adapter Network) を用いた OOOPS モデルを提案し,パノラマセマンティックセマンティックセマンティクスの性能を大幅に向上させる。他の最先端のオープンボキャブラリセマンティックセマンティクスアプローチを超越すると、3つのパノラマデータセットのパフォーマンスが著しく向上する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 22:29:05 GMT)
Data Adaptive Traceback for Vision-Language Foundation Models in Image Classification [34.4]
我々はData Adaptive Tracebackと呼ばれる新しい適応フレームワークを提案する。具体的には、ゼロショット法を用いて、事前学習データの最もダウンストリームなタスク関連サブセットを抽出する。我々は、擬似ラベルに基づく半教師付き手法を採用し、事前学習画像の再利用と、半教師付き学習における確証バイアス問題に対処するための視覚言語コントラスト学習手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:01:58 GMT)
DebSDF: Delving into the Details and Bias of Neural Indoor Scene Reconstruction [34.1]
本稿では,単分子先行における不確実性の利用とSDFに基づくボリュームレンダリングにおけるバイアスに着目した。本稿では,より大規模な不確実性とモノラルな先行誤差を関連付ける不確実性モデリング手法を提案する。その後、バイアスを防ぐために、高い不確実性事前を最適化から除外する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:19:11 GMT)
Unsupervised Object Localization in the Era of Self-Supervised ViTs: A Survey [33.7]
近年の研究では、自己教師付き事前訓練機能を利用することで、クラスに依存しない非教師付きオブジェクトローカライゼーションが可能であることが示されている。本稿では、手動のアノテーションを必要とせず、画像中のオブジェクトを検出する教師なしオブジェクトローカライズ手法について調査する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:46:20 GMT)
LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models [33.4]
ドメイン内の課題として、マルチコンセプトのカスタマイズが登場します。既存のアプローチでは、複数のローランド適応(LoRA)の融合行列をトレーニングして、さまざまな概念をひとつのイメージにマージすることが多い。 LoRA-Composerは、複数のLoRAをシームレスに統合するために設計されたトレーニング不要のフレームワークである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:30:02 GMT)
AdaDiff: Accelerating Diffusion Models through Step-Wise Adaptive Computation [32.7]
拡散モデルは多彩で高忠実な画像を生成する上で大きな成功を収めるが、それらの応用は本質的に遅い生成速度によって妨げられる。本稿では,拡散モデルの生成効率を向上させるために,各サンプリングステップで動的に計算資源を割り当てる適応フレームワークであるAdaDiffを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:43:47 GMT)
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System [32.7]
大型言語モデル(LLM)は、プラグアンドプレイAIシステムへの需要を増大させた。 LLMベースのプラグアンドプレイ自動プロンプトエンジニアリング(APE)システムであるPASを提案する。 PAS は従来の APE モデルと比較して、平均 6.09 ポイントの改善を達成している。 PASは人間の評価に優れており、ユーザのためのプラグインとしての適合性を強調している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:30:01 GMT)
GTA: A Benchmark for General Tool Agents [32.4]
229個の実世界のタスクと実行可能なツールチェーンを設計し、主要な大言語モデル(LLM)を評価する。 GPT-4 はタスクの 50% 以下であり,ほとんどの LLM は 25% 以下である。この評価は、現実シナリオにおける現在のLLMのツール利用能力のボトルネックを明らかにし、汎用ツールエージェントを前進させるための今後の方向性を提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:50:09 GMT)
Is It Really Long Context if All You Need Is Retrieval? Towards Genuinely Difficult Long Context NLP [32.2]
異なるタスクをコンテキスト長で膨らませることは、生産的ではないと我々は主張する。我々は、長い文脈でそれらがより困難になる特性に基づいて、長い文脈の分類を解き放つことを提案する。必要な情報が非常に長く、入力内で非常に拡散している、最も困難で興味深い設定は、非常に過度に探索されている、と結論付けている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:17:09 GMT)
A Comprehensive Survey on Retrieval Methods in Recommender Systems [32.2]
本調査では,レコメンデータシステムの重要かつ見落とされがちな検索段階について検討する。高精度かつ効率的なパーソナライズされた検索を実現するために,既存の作業を3つの重要な領域にまとめる。特定の企業における検索実践のケーススタディを通じて、現在の産業応用を取り上げる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:09:59 GMT)
PreSight: Enhancing Autonomous Vehicle Perception with City-Scale NeRF Priors [31.8]
新しい都市をナビゲートする際、人間は徐々に、その後の訪問中にリアルタイムの知覚を補うための予備的なメンタルマップを開発していく。このような人間的アプローチに触発されて、私たちはPreSightという新しいフレームワークを導入しました。提案手法では,都市規模のニューラルフィールドを過去の旅行データで最適化し,ニューラルプライドを生成する。これらの先行は意味論と幾何学的詳細に富み、手動のアノテーションなしで導出され、様々な最先端の知覚モデルをシームレスに拡張することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:22:46 GMT)
WildRefer: 3D Object Localization in Large-scale Dynamic Scenes with Multi-modal Visual Data and Natural Language [31.7]
本稿では,自然言語記述とオンラインキャプチャによるマルチモーダル視覚データに基づく大規模動的シーンにおける3次元視覚接地作業について紹介する。本研究では,画像中のリッチな外観情報,位置,および点雲中の幾何学的手がかりをフル活用して,WildReferという新しい手法を提案する。われわれのデータセットは、野生の3Dビジュアルグラウンドの研究にとって重要なものであり、自動運転とサービスロボットの開発を促進する大きな可能性を秘めている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:20:31 GMT)
Neural Poisson Solver: A Universal and Continuous Framework for Natural Signal Blending [31.5]
Inlicit Neural Representation (INR) は視覚信号の表現法として人気がある。 InRによって表現される視覚信号を混合するプラグイン・アンド・プレイフレームワークであるNeural Poisson Solverを紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:54:21 GMT)
Strategy Synthesis for Zero-Sum Neuro-Symbolic Concurrent Stochastic Games [31.5]
ニューロシンボリック・コンカレントゲーム(NS-CSG)と呼ばれる新しいモデリング形式を提案する。本稿では,ボレル状態空間を持つNS-CSGのクラスに着目し,ゼロサム割引累積報酬に対する値関数の存在と可測性を証明する。我々は,この連続状態CSGの新たなサブクラスを解くために,実用的価値反復(VI)とポリシー反復(PI)アルゴリズムを初めて提示する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:40:13 GMT)
Diffusion-EXR: Controllable Review Generation for Explainable Recommendation via Diffusion Models [31.0]
Diffusion-EXR と呼ばれる説明可能なレコメンデーションに対する拡散モデルに基づくレビュー生成拡散-EXRと呼ばれる説明可能な勧告に対する拡散モデルに基づくレビュー生成を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:34:09 GMT)
IntrinsicAvatar: Physically Based Inverse Rendering of Dynamic Humans from Monocular Videos via Explicit Ray Tracing [30.9]
IntrinsicAvatarは、単眼ビデオのみから人間のアバターの本質的な特性を回復するための新しいアプローチである。本手法は, 単眼映像から高品質な形状, アルベド, 材料, 照明特性を復元する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:31:39 GMT)
High-resolution open-vocabulary object 6D pose estimation [30.8]
Horyonはオープン語彙のVLMベースのアーキテクチャで、見えないオブジェクトの2つのシーン間の相対的なポーズ推定に対処する。 4つのデータセットにまたがるさまざまな未知のオブジェクトをベンチマークで評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:03:29 GMT)
Enhancing Privacy of Spatiotemporal Federated Learning against Gradient Inversion Attacks [30.8]
本稿では,時空間データに適した勾配攻撃アルゴリズムである時空間勾配インバージョンアタック(GIA)を提案する。我々は、時間的連合学習における勾配反転攻撃を軽減するための適応的な防御戦略を設計する。提案した防衛戦略は,効果的なセキュリティ保護による時間的フェデレーション学習の有用性を十分に維持できることを明らかにした。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:17:02 GMT)
GPT4Rec: Graph Prompt Tuning for Streaming Recommendation [30.6]
本稿では,ストリームレコメンデーションのためのグラフプロンプトチューニング手法であるGPT4Recを提案する。特に、GPT4Recはグラフパターンを複数のビューに分解する。ユーザ-テムグラフ内のさまざまなインタラクションパターンにまたがってモデルをガイドする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:33:23 GMT)
Spiking Tucker Fusion Transformer for Audio-Visual Zero-Shot Learning [30.5]
音声・視覚ゼロショット学習のための新しいSTFT(Spking Tucker Fusion Transformer)を提案する。 STFTは、異なる時間ステップからの時間的および意味的な情報を活用して、堅牢な表現を生成する。本稿では,最大と平均のプール操作を組み合わせたグローバルローカルプール(GLP)を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:01:26 GMT)
BLOS-BEV: Navigation Map Enhanced Lane Segmentation Network, Beyond Line of Sight [30.5]
我々は,視線を超越した正確な知覚のためにSDマップを組み込んだ新しいBEVセグメンテーションモデルBLOS-BEVを提案する。我々のアプローチは一般的なBEVアーキテクチャに適用でき、SDマップから得られる情報を組み込むことで優れた結果を得ることができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:15:48 GMT)
NODE-Adapter: Neural Ordinary Differential Equations for Better Vision-Language Reasoning [30.4]
既存の手法は視覚言語推論において3つの大きな課題に直面している。ニューラル正規微分方程式を用いて視覚言語推論を改善する新しい手法NODE-Adapterを提案する。提案手法が既存の最先端手法を著しく上回っていることを示すために, 少数ショットの分類, ドメインの一般化, 視覚的推論を対象とする実験結果を得た。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:04:19 GMT)
Exploring the Compositional Deficiency of Large Language Models in Mathematical Reasoning [30.4]
数学的推論における大規模言語モデル(LLM)の構成性について検討する。論理的欠陥の問題は実世界では非常に稀であるため、これらは LLM に対する見当たらないケースを表している。実験の結果, LLM には必要知識の双方の構成要素があるが, これらの新規事例を扱うために, テキストbfspontanely に組み合わせることはできないことがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:26:18 GMT)
SLEDGE: Synthesizing Driving Environments with Generative Models and Rule-Based Traffic [30.4]
SLEDGEは、現実世界の走行ログに基づいて訓練された車両の運動訓練のための最初の生成シミュレータである。そのコアコンポーネントは学習モデルであり、エージェント境界ボックスとレーングラフを生成することができる。 SLEDGEは、nuPlanのような既存のデータ駆動シミュレータでは見られない500mのルートをサポートすることができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:27:49 GMT)
LUQ: Long-text Uncertainty Quantification for LLMs [30.0]
大規模言語モデル(LLM)は、非現実的なコンテンツを生成する傾向がある。不確実性定量化(UQ)は、モデルの生成に対する信頼性の理解を高める上で重要である。我々は,複数のモデルからの応答をアンサンブルし,最も低い不確実性で応答を選択するTextscLuq-Ensembleを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:22:32 GMT)
Global Spatial-Temporal Information-based Residual ConvLSTM for Video Space-Time Super-Resolution [29.7]
我々は、時空ビデオ超解像、すなわちGIRNetのための畳み込みニューラルネットワーク(CNN)を提案する。高精度な特徴を生成するため,提案ネットワークは,特徴レベル時間モジュールと変形可能な畳み込みと,大域空間時空間情報に基づく残差畳み込み長短期記憶(convLSTM)を統合した。 Vimeo90Kデータセットの実験により,提案手法は,STARnet,TMNet,3DAttGAN上でのピーク信号対雑音比(1.45dB,1.14dB,0.02dB)において,最先端技術よりも優れていた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:01:44 GMT)
Adaptive Parametric Activation [29.2]
本研究では,アクティベーション関数をデータ分布に整合させることにより,バランスの取れたタスクと不均衡なタスクの両方のパフォーマンスを向上させることを示す。適応パラメトリック活性化関数(Adaptive Parametric Activation function)を提案する。 APAは中間層とアテンション層の両方に適用でき、いくつかの不均衡なベンチマークで最先端を著しく上回っている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:57:27 GMT)
Projecting Points to Axes: Oriented Object Detection via Point-Axis Representation [29.1]
オブジェクト指向物体検出のための点軸表現を導入し、その柔軟性と幾何学的直感性を2つの重要な要素である点と軸で強調する。点軸表現は位置と回転を分離し、伝統的な境界ボックスベースのアプローチでよく発生する損失不連続問題に対処する。本稿では,正確な点軸予測と終端検出のためのDETRフレームワークをシームレスに統合したオブジェクト指向DETRモデルを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:23:04 GMT)
BANF: Band-limited Neural Fields for Levels of Detail Reconstruction [29.0]
簡単な修正により、低域通過フィルタのニューラルネットワークが得られることを示すとともに、これをどのように利用して信号全体の周波数分解を得ることができるかを示す。本研究では,提案手法の妥当性について検討し,粗い表現を効果的に計算する方法を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:29:47 GMT)
BiEquiFormer: Bi-Equivariant Representations for Global Point Cloud Registration [28.8]
最先端の深層学習手法は、任意の点の雲を空間に配置した場合、大きな性能劣化に悩まされることを示す。 We design BiEquiformer a novel and scalable textitbi-equivariant pipeline。これにより,高品質なスーパーポイント対応を抽出し,ロバストなポイントクラウド登録を行うことができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:58:10 GMT)
GAURA: Generalizable Approach for Unified Restoration and Rendering of Arbitrary Views [28.5]
本稿では,いくつかの劣化条件下で高忠実性新規ビュー合成が可能な一般化可能なニューラルレンダリング手法を提案する。我々の手法であるGAURAは学習ベースであり、テスト時間シーン固有の最適化を必要としない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:44:37 GMT)
HACMan++: Spatially-Grounded Motion Primitives for Manipulation [28.4]
本稿では,HACMan++における空間的パラメータ化動作プリミティブについて紹介する。環境中の空間的位置にプリミティブを接地することで、オブジェクトの形状を効果的に一般化し、バリエーションを表現できる。提案手法は既存の手法,特に高レベルシーケンシャル推論とオブジェクト一般化の両方を必要とする複雑なシナリオにおいて,優れた性能を発揮する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:10:14 GMT)
In-Context Explainers: Harnessing LLMs for Explaining Black Box Models [28.4]
大規模言語モデル(LLM)は、機械翻訳、常識推論、言語理解といった複雑なタスクにおいて、例外的な機能を示している。このような多様なタスクにおけるLLMの適応性の主要な理由の1つは、インコンテキスト学習(ICL)能力である。本稿では,LLMのICL機能を利用して,他の予測モデルによる予測を説明する新しい3つの手法,In-Context Explainersを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:42:12 GMT)
FYI: Flip Your Images for Dataset Distillation [28.3]
実画像のリッチなセマンティクスを合成物に蒸留できるFYIと呼ばれる、驚くほどシンプルで効果的なデータセット蒸留技術を導入する。 CIFAR-10/100、Tiny-ImageNet、ImageNetの実験では、FYIがいくつかの最先端メソッドにシームレスに統合できることが示されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:08:41 GMT)
An Economic Framework for 6-DoF Grasp Detection [28.3]
本研究では,訓練における資源コストの低減と効果的な把握性能の維持を目的とした,6-DoFグリップ検出のための経済的な枠組みを提案する。 EconomicGrasp は SOTA の把握法を平均 3AP で上回り,資源コストが極端に低い。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:19:48 GMT)
Defect Spectrum: A Granular Look of Large-Scale Defect Datasets with Rich Semantics [28.0]
Defect Spectrumは、広範囲の産業的欠陥に対して、正確でセマンティックな、そして大規模なアノテーションを提供する包括的なベンチマークである。 4つの重要な産業ベンチマークに基づいて、私たちのデータセットは既存のアノテーションを洗練し、単一のイメージ内の複数の欠陥タイプを識別する、リッチなセマンティックな詳細を導入します。また、高品質で多様な欠陥画像を作成するために設計された2段階拡散ベースジェネレータであるDefect-Genを紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:50:40 GMT)
Towards stable training of parallel continual learning [27.8]
マルチソース入力を用いた連続学習における並列連続学習課題の検討複数のタスクを同時にトレーニングする必要があるため、PCLの厳しいトレーニング不安定が生じる。本稿では,PCLの学習安定性を高める新しい手法として,SPCL(Stable Parallel Continual Learning)を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:31:04 GMT)
Feature Diversification and Adaptation for Federated Domain Generalization [27.6]
実世界のアプリケーションでは、ローカルクライアントは、しばしば制限されたドメイン内で動作し、クライアント間でのドメインシフトにつながる。フェデレーション(federated feature diversification)の概念を導入し,プライバシを保ちながら,ローカルモデルによるクライアント不変表現の学習を支援する。我々のグローバルモデルでは、目に見えないテスト領域データに対して堅牢な性能を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:45:10 GMT)
On the Universal Truthfulness Hyperplane Inside LLMs [27.0]
モデル内の事実的正確かつ誤った出力を区別する普遍真性超平面が存在するかどうかを考察する。その結果,トレーニングデータセットの多様性の向上が,すべてのシナリオのパフォーマンスを著しく向上させることが示唆された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:07:26 GMT)
Spectral State Space Models [26.7]
本稿では,長距離依存型予測タスクのシーケンスモデリングについて検討する。スペクトルフィルタリングアルゴリズムを用いて線形力学系の学習に基づく状態空間モデルの新しい定式化を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:35:23 GMT)
NormAd: A Benchmark for Measuring the Cultural Adaptability of Large Language Models [26.6]
我々は75カ国の社会的・文化的規範を表す2.6kストーリーを含む新しいデータセットであるNormAdを紹介した。我々の研究は、LLMがあらゆる文脈の粒度にわたる文化的推論に苦慮していることを明らかにした。 NormAdの評価によると、LLMは文化全体にわたるギフトギフトを含むストーリーに適応するのに苦労している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:05:59 GMT)
Bootstrapping Vision-language Models for Self-supervised Remote Physiological Measurement [26.5]
本稿では,一般的な視覚言語モデルとリモート生理計測タスクをうまく統合する新しいフレームワークを提案する。フレームワークを最適化する一連の生成的かつコントラスト的な学習メカニズムを開発した。本手法は,視覚・テキストモダリティにおける周波数関連知識の消化・調整にVLMを初めて適用した手法である。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:45:50 GMT)
Beyond Instruction Following: Evaluating Rule Following of Large Language Models [26.2]
大規模言語モデル(LLM)は、強力な命令追従能力を示す。本稿では,ルールフォローの概念を明確にし,ルールフォロー能力の多様性を評価するためのベンチマークであるルールベンチをキュレートする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:26:55 GMT)
Hypergraph Multi-modal Large Language Model: Exploiting EEG and Eye-tracking Modalities to Evaluate Heterogeneous Responses for Video Understanding [25.5]
ビデオの創造性と内容の理解はしばしば個人によって異なり、年齢、経験、性別によって焦点や認知レベルが異なる。実世界のアプリケーションとのギャップを埋めるために、textbfSubjective textbfResponse textbfIndicators for textbf— textbfVideos dataset, すなわちSRI-ADVを導入する。映像コンテンツの認知的理解度を分析・評価するタスクとプロトコルを開発した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:00:26 GMT)
BenthicNet: A global compilation of seafloor images for deep learning applications [25.5]
BenthicNetは海底画像のグローバルコンパイルである。最初の114万枚以上の画像が収集され、海底環境の多様性を表すためにキュレーションされた。このコンパイルに基づいて大規模なディープラーニングモデルをトレーニングし,その予備的な結果から,大規模かつ小規模の画像解析タスクの自動化に有効であることが示唆された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:24:52 GMT)
DACAD: Domain Adaptation Contrastive Learning for Anomaly Detection in Multivariate Time Series [25.4]
時系列異常検出では、ラベル付きデータの不足が正確なモデルの開発に困難をもたらす。時系列における異常検出のための新しいドメインコントラスト学習モデル(DACAD)を提案する。本モデルでは,ソース領域に対する教師付きコントラスト損失と,ターゲット領域に対する自己監督型コントラスト型3重項損失を用いる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:04:13 GMT)
Reading Subtext: Evaluating Large Language Models on Short Story Summarization with Writers [25.3]
我々は,最近のLarge Language Models (LLMs) について,短いストーリーを要約する難しい課題について評価する。私たちは著者と直接協力して、ストーリーがオンラインで共有されていないことを保証しています(従ってモデルによって見つからないのです)。 GPT-4、Claude-2.1、LLama-2-70Bを比較し、全3モデルが50%以上の要約で忠実さの誤りを犯していることを発見した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:46:52 GMT)
FairDomain: Achieving Fairness in Cross-Domain Medical Image Segmentation and Classification [25.0]
本稿では,ドメインシフト下での公平性に関する先駆的なシステム研究について述べる。我々は医学的セグメンテーションと分類作業の両方に最先端領域適応(DA)と一般化(DG)アルゴリズムを用いる。また,様々なDAアルゴリズムやDGアルゴリズムに適応して,自己注意を用いて人口統計特性を調整し,公平性を向上する,新規なプラグイン・アンド・プレイ・アイデンティティ・フェアアテンション(FIA)モジュールも導入する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:52:32 GMT)
AVCap: Leveraging Audio-Visual Features as Text Tokens for Captioning [24.6]
AVCap(Audio-Visual Captioning framework)を提案する。 AVCapは音声視覚機能をテキストトークンとして利用する。提案手法は,既存の音声・視覚のキャプション手法よりも優れた性能を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:38:14 GMT)
Fairness in Ranking under Disparate Uncertainty [24.4]
我々は、基礎となる関連モデルの不確実性がオプション群間で異なる場合、ランク付けは不公平をもたらす可能性があると論じる。ランク付けのための新しい公正基準として平等ランク付け(EOR)を提案する。異なる不確実性が存在する場合でも、EORは関連する選択肢の中でグループワイドフェア・宝くじに対応していることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:35:37 GMT)
SLRL: Structured Latent Representation Learning for Multi-view Clustering [24.3]
マルチビュークラスタリング(MVC)は、異なるビュー間の固有の一貫性と相補性を活用して、クラスタリングの結果を改善することを目的としている。 MVCでの広範な研究にもかかわらず、既存のほとんどのメソッドは、主にクラスタリングの有効性を高めるためにビューをまたいだ補完的な情報を活用することに重点を置いています。本稿では,構造化潜在表現学習に基づくマルチビュークラスタリング手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:43:57 GMT)
Towards Realistic Incremental Scenario in Class Incremental Semantic Segmentation [24.3]
重なり合うことで、実際の漸進的な学習シナリオとはかけ離れた、異なるピクセルラベルで、同じイメージが将来のタスクに再び現れることを指摘しています。メモリからデータを取得する際のコード実装の問題を特定し,対処する。メモリ上でのタスクのバックグラウンドシフトを処理するシンプルなメモリベースベースラインであるMiB-AugMを導入する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:09:00 GMT)
SA-DQAS: Self-attention Enhanced Differentiable Quantum Architecture Search [24.2]
SA-DQASは、勾配に基づく微分可能な量子アーキテクチャ探索(DQAS)を自己アテンション機構で拡張するフレームワークである。我々の研究は、DQASとの自己意識の初めての統合に成功したことを実証している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:19:14 GMT)
Exemplar-free Continual Representation Learning via Learnable Drift Compensation [24.1]
本稿では,任意の背骨のドリフトを効果的に軽減できるLearnerable Drift Compensation (LDC)を提案する。 LDCは、既存の継続的学習アプローチの上に、素早く簡単に統合できます。教師付き設定と半教師付き設定の両方で最先端の性能を実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:23:08 GMT)
Prediction Exposes Your Face: Black-box Model Inversion via Prediction Alignment [24.0]
モデル反転(MI)攻撃は、その出力から対象モデルのプライベートトレーニングデータを再構成する。ブラックボックスMI攻撃のための予測画像P2I手法を提案する。本手法は,攻撃精度を8.5%向上し,データセットCelebAのクエリ数を99%削減する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:58:35 GMT)
I-MedSAM: Implicit Medical Image Segmentation with Segment Anything [24.0]
提案するI-MedSAMは、連続表現とSAMの両方の利点を利用して、クロスドメイン能力と正確な境界線を求める。トレーニング可能なパラメータが1.6Mしかない提案手法は、離散的および暗黙的を含む既存の手法よりも優れている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:36:35 GMT)
FedLog: Personalized Federated Classification with Less Communication and More Flexibility [24.0]
FedAvgが提案するフェデレートラーニング(FL)では、クライアントがローカルモデルをプライベートデータでトレーニングし、モデルパラメータを中央集約のために共有する。クライアントはモデルパラメータとローカルデータサマリーを共有せず、共有コストを削減できることを提案する。我々は,局所データの十分な統計しか共有しないベイズ推定を用いた新しいアルゴリズムであるFedLogを開発した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:40:29 GMT)
WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds [23.9]
本稿では,動きデータセットの周期構造と意味を理解するための新しいアプローチを提案する。我々は,人間や犬などの複数の文字に対する共有位相多様体を,何の監督も受けずに学習する。改良された動きマッチングフレームワークと組み合わせて、いくつかのアプリケーションにおいて、時間と意味のアライメントの多様体の能力を実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:31:05 GMT)
Resampled Datasets Are Not Enough: Mitigating Societal Bias Beyond Single Attributes [23.8]
我々は、保護されたグループと画像属性の急激な相関を取り除き、画像テキストデータセットの社会的バイアスに取り組む。テキスト誘導インペイントモデルを用いることで、すべての属性から保護されたグループ独立を保証し、データフィルタリングによるインペイントバイアスを軽減する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:38:01 GMT)
InstructLayout: Instruction-Driven 2D and 3D Layout Synthesis with Semantic Graph Prior [23.5]
自然言語命令を補完することは、2Dおよび3Dレイアウト合成システムにとって魅力的な特性である。既存の手法は、オブジェクトの関節分布を暗黙的にモデル化し、オブジェクトの関係を表現し、生成物の可制御性合成システムを妨げる。 Instructは、セマンティックグラフとレイアウトデコーダを統合した、新しい生成フレームワークである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:19:08 GMT)
RPBG: Towards Robust Neural Point-based Graphics in the Wild [23.5]
我々は、ポイントベースグラフィックス(RPBG)と呼ばれる新しい点ベースニューラルリレンダリング手法を提案する。 RPBGは安定してベースラインを大きなマージンで上回り、最先端のNeRFベースの変種に対して大きな堅牢性を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:17:28 GMT)
Generalized Face Anti-spoofing via Finer Domain Partition and Disentangling Liveness-irrelevant Factors [23.3]
データセットではなくアイデンティティに基づいてドメインを再定義し、生きた属性とアイデンティティ属性をアンタングルすることを目的としています。提案手法は,クロスデータセットおよび限られたソースデータセットシナリオ下での最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:39:58 GMT)
RATT: A Thought Structure for Coherent and Correct LLM Reasoning [23.3]
本稿では,思考過程の各段階における論理的健全性と事実的正当性の両方を考慮した新しい思考構造であるRetrieval Augmented Thought Tree(RATT)を紹介する。様々な種類のタスクに関する実験では、RATT構造が既存の手法を事実的正当性と論理的整合性で著しく上回っていることが示されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:07:19 GMT)
Threats and Defenses in Federated Learning Life Cycle: A Comprehensive Survey and Challenges [22.8]
Federated Learning (FL)は、プライバシ保護協調機械学習(ML)のための革新的なソリューションを提供するその有望な可能性にもかかわらず、FLは分散した性質のため、様々な攻撃に対して脆弱である。本稿では、FLサービスライフサイクル全体を通じて最も代表的で最先端の脅威および防衛フレームワークについてレビューする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:50:03 GMT)
Generalization Error Matters in Decentralized Learning Under Byzantine Attacks [22.6]
分散学習は、ピアツーピア信号および情報処理パラダイムとして人気を博している。本稿では,Byzantine-Resilient decentralized gradient (DSGD)アルゴリズムの一般化誤差を初めて解析する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:12:53 GMT)
Investigating LLMs as Voting Assistants via Contextual Augmentation: A Case Study on the European Parliament Elections 2024 [22.5]
最近の研究は、大規模言語モデルにおける政治的偏見と政治的推論能力を探究している。 2024年の欧州議会議員選挙では、LLMsがVoting Advice Applications (VAA)として利用できるかどうかを調査している。我々は、MISTRALとMIXTRALモデルを評価し、最新の「EUとI」投票支援アンケートに基づいて、政党の姿勢を予測する際の精度を評価した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:29:28 GMT)
Decompose and Compare Consistency: Measuring VLMs' Answer Reliability via Task-Decomposition Consistency Comparison [22.4]
textttDeCCはVLMの直接応答の信頼性を測定する。 textttDeCCは既存の方法に比べてタスクの正確さとの相関性が良い。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:14:51 GMT)
Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.3]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。 RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:58:49 GMT)
Haar Nuclear Norms with Applications to Remote Sensing Imagery Restoration [22.3]
本稿では,Har Nuclear norm (HNN) という,高効率かつ効率的なリモートセンシング画像復元のための新しい低ランク正規化用語を提案する。 2次元前方スライス-ワイド・ハール離散ウェーブレット変換から導出されるウェーブレット係数の低ランク特性を利用する。ハイパースペクトル像の着色, マルチテンポラル画像雲の除去, ハイパースペクトル像の脱色実験により, HNNの可能性が明らかとなった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:46:47 GMT)
Lynx: An Open Source Hallucination Evaluation Model [22.0]
LYNXは幻覚検出LLMであり、現実の幻覚に挑戦するシナリオについて高度な推論を行うことができる。 HaluBenchは、さまざまな現実世界のドメインから得られた15kサンプルからなる、包括的な幻覚評価ベンチマークである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:22:17 GMT)
Model Tells You Where to Merge: Adaptive KV Cache Merging for LLMs on Long-Context Tasks [21.8]
KVMergerと呼ばれる新しいKVキャッシュマージ手法を提案し、長文タスクに対して適応的なKVキャッシュ圧縮を実現する。我々のアプローチは、キー状態が1つのシーケンス内のトークンレベルで高い類似性を示すという興味深い観察にインスパイアされている。我々は,制約メモリ予算下での長時間コンテキストタスクに対するKVMergerの有効性を示すため,広範囲な実験を行った。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:50:42 GMT)
SpikeGPT: Generative Pre-trained Language Model with Spiking Neural Networks [21.6]
スパイキングニューラルネットワーク(SNN)はスパースとイベント駆動のアクティベーションを活用して、モデル推論に関連する計算オーバーヘッドを削減する。イベント駆動型スパイクアクティベーションユニットを用いた生成言語モデルを実装した。 SpikeGPTは、これまでで最大のバックプロパゲーション訓練SNNモデルであり、自然言語の生成と理解の両方に適している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:16:12 GMT)
Scalar Function Topology Divergence: Comparing Topology of 3D Objects [21.5]
コンピュータビジョンのための新しいトポロジツール - Scalar Function Topology Divergence (SFTD) を提案する。 SFTDは、共通領域を持つ2つの函数の下位レベル集合の間の多重スケール位相の相似性を測定する。提案ツールは,関数が位相的相似性を持つ領域を視覚化する有用なツールである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:18:54 GMT)
AoA-Based Physical Layer Authentication in Analog Arrays under Impersonation Attacks [21.4]
本稿では、アナログアレイ多重出力多重出力(MIMO)システムにおける認証手段として、到着角(AoA)の使用について議論する。アナログアレイを備えた基地局は、認証されたパイロット送信から推定されるAoAに基づいてユーザを認証し、アクティブアタッカーは送信された信号を操作して偽装攻撃をマウントする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:30:04 GMT)
GeNet: A Multimodal LLM-Based Co-Pilot for Network Topology and Configuration [21.2]
GeNetは、大規模言語モデル(LLM)を利用してネットワーク設計を合理化するための新しいフレームワークである。視覚的およびテキスト的モダリティを使用して、ネットワークトポロジとデバイス構成をユーザ意図に基づいて解釈し、更新する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:51:57 GMT)
Boosting Adversarial Transferability for Skeleton-based Action Recognition via Exploring the Model Posterior Space [20.9]
ヒト活動認識(HAR)における骨格運動の役割以前の攻撃はすべて、未知のS-HARモデル間の転送に苦労した。本稿では,サロゲートの集合に対するモデル後部空間を効果的に探索できるDual Bayesian戦略を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:59:31 GMT)
UniINR: Event-guided Unified Rolling Shutter Correction, Deblurring, and Interpolation [20.9]
高速カメラ移動中にローリングシャッター(RS)カメラで捉えたビデオフレームは、RS歪みとぼやけを同時に示している。我々は、RSぼけフレームとペアイベントから任意のフレームレートのシャープGSフレームを復元する、UniINRという新しい手法を提案する。提案手法は, パラメータ0.38Mしか持たない軽量モデルであり, 高効率であり, RSブラーフレームの31倍のフレームレートで2.83ms/frameを実現している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:31:05 GMT)
Deep Understanding of Soccer Match Videos [20.8]
サッカーは世界中で最も人気のあるスポーツの1つであり、主要な試合で頻繁に放送される。本システムでは, サッカーボール, 選手, 審判などの重要な物体を検知できる。また、プレイヤーとボールの動きを追跡し、プレイヤーの番号を認識し、シーンを分類し、ゴールキックのようなハイライトを識別する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:54:13 GMT)
BiasPruner: Debiased Continual Learning for Medical Image Classification [20.6]
BiasPrunerは、学習のショートカットにつながる可能性のあるトレーニングデータの素早い相関を意図的に忘れるCLフレームワークである。推論中、BiasPrunerは、予測に最適なバイアス付きサブネットワークを選択するために、単純なタスクに依存しないアプローチを採用している。皮膚病変分類と胸部X線分類の3つの医学データセットについて実験を行い,BiasPrunerがSOTA CL法を常に上回っていることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:45:57 GMT)
On the Foundations of Shortcut Learning [20.5]
予測と可用性が形状モデルの特徴的利用とどのように相互作用するかを考察する。線形モデルは比較的偏りがないが、ReLUやTanhの単位を持つ単一の隠蔽層を導入するとバイアスが生じる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:03:09 GMT)
Large Pre-trained time series models for cross-domain Time series analysis tasks [20.2]
本稿では,事前学習中に最適なデータセット固有のセグメンテーション戦略を自動的に識別する,テクスタイディショナルセグメンテーションの新たな手法を提案する。これにより、異なるダウンストリーム時系列分析タスクに微調整され、ゼロショット設定下では、LPTMはドメイン固有の最先端モデルと同等かそれ以上の性能を発揮する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:32:12 GMT)
Operationalizing the Blueprint for an AI Bill of Rights: Recommendations for Practitioners, Researchers, and Policy Makers [20.2]
世界の様々な国でいくつかの規制の枠組みが導入されている。これらのフレームワークの多くは、AIツールの監査と信頼性向上の必要性を強調している。これらの規制の枠組みは実施の必要性を強調しているが、実践者はしばしば実施に関する詳細なガイダンスを欠いている。我々は、最先端の文献の分かりやすい要約を提供し、規制ガイドラインと既存のAI研究の間に存在する様々なギャップを強調します。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:28:07 GMT)
DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video [20.1]
DINO-Trackerは、ビデオの長時間の密集追跡のための新しいフレームワークだ。単一のビデオ上でのテスト時間トレーニングと、事前トレーニングされたDINO-ViTモデルによって学習された強力なローカライズされたセマンティック機能を組み合わせる。 DINOトラッカーは自己管理手法よりも優れ、最先端のトラッカーと競合する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:47:26 GMT)
TractGraphFormer: Anatomically Informed Hybrid Graph CNN-Transformer Network for Classification from Diffusion MRI Tractography [20.1]
拡散MRIトラクトグラフィーに適したグラフCNN-TransformerディープラーニングフレームワークであるTractGraphFormerを紹介する。このモデルは、ホワイトマター構造の局所解剖学的特徴と大域的特徴に依存する。 TractGraphFormerは、性予知テストにおいて、子供と若者の大規模なデータセットで強いパフォーマンスを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 22:14:57 GMT)
Joint Diffusion: Mutual Consistency-Driven Diffusion Model for PET-MRI Co-Reconstruction [19.8]
この研究は、MRIを加速し、PET画像の品質を向上させることを目的としている。従来のアプローチでは、PET-MRIシステム内の各モードを別々に再構成する。相互整合駆動拡散モード(MC-Diffusion)を用いた新しいPET-MRI関節再建モデルを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:51:11 GMT)
GraphMamba: An Efficient Graph Structure Learning Vision Mamba for Hyperspectral Image Classification [19.7]
GraphMambaは、深部空間スペクトル情報マイニングを実現するための効率的なグラフ構造学習ビジョンMamba分類フレームワークである。 GraphMambaのコアコンポーネントには、計算効率を改善するHyperMambaモジュールと、適応的な空間コンテキスト認識のためのSpectralGCNモジュールが含まれている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:56:08 GMT)
BiGym: A Demo-Driven Mobile Bi-Manual Manipulation Benchmark [19.7]
BiGymは、モバイル双方向のデモ駆動ロボット操作のための新しいベンチマークと学習環境である。 BiGymには、シンプルなターゲットから複雑なキッチンクリーニングまで、40の多様なタスクがホーム環境に設定されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:26:09 GMT)
Quantitative Evaluation of the Saliency Map for Alzheimer's Disease Classifier with Anatomical Segmentation [19.7]
アルツハイマー病(AD)の深層学習分類器の解釈には、唾液マップが広く用いられている。本稿では,解剖学的セグメンテーションを用いて,異なる脳領域に唾液価を割り当てる。 AD と NC (Normal Control) に対応する正当性マップの分布をプロットすることにより,モデルの決定過程を包括的に把握することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:30:49 GMT)
Neural Bipartite Matching [19.6]
本稿では,ニューラルネットワークが複雑なアルゴリズムに適用される方法について述べる。単一のGNNから生成された機能のみに基づいて、ニューラル実行によって実現される。評価の結果,ネットワークがほぼ100%の時間で最適なマッチングを達成できることが示唆された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:06:35 GMT)
UniMD: Towards Unifying Moment Retrieval and Temporal Action Detection [19.6]
時間的行動検出(TAD)は、事前に定義されたアクションを検出することに焦点を当て、モーメント検索(MR)は、未トリミングビデオの中で、オープンな自然言語によって記述される事象を特定することを目的としている。我々は,TADとMRの両方に対して統一モーメント検出(Unified Moment Detection, Unified Moment Detection, UniMD)と呼ばれる統一アーキテクチャを提案する。 TADのアクションやMRのイベントといった2つのタスクの入力を共通の埋め込み空間に変換し、2つの新しいクエリ依存デコーダを使用して、分類スコアと時間セグメントの均一な出力を生成する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:03:35 GMT)
Advancing Medical Image Segmentation with Mini-Net: A Lightweight Solution Tailored for Efficient Segmentation of Medical Images [19.6]
Mini-Netは医療画像用に設計された軽量セグメンテーションネットワークである。パラメータが38,000未満のMini-Netは、高周波数と低周波数の両方を効率的にキャプチャする。 DRIVE, STARE, ISIC-2016, ISIC-2018, MoNuSegなど,様々なデータセット上でMini-Netを評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:13:05 GMT)
DIDUP: Dynamic Iterative Development for UI Prototyping [19.5]
我々は,LLM生成コードプロトタイピングシステムであるGPT Pilotの形式的研究を行う。開発が開始されると、変更に対する柔軟性が低下し、障害防止や動的計画の弱点が生じることが分かりました。反復スパイラルモデルに従うコードベースのUIプロトタイピングシステムであるDIDUPを紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:10:11 GMT)
Diff-Tracker: Text-to-Image Diffusion Models are Unsupervised Trackers [19.4]
Diff-Trackerは、教師なしの視覚追跡タスクに挑戦する新しいアプローチである。我々の主な考えは、事前訓練された拡散モデルにカプセル化された豊富な知識を活用することである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:57:33 GMT)
SaMoye: Zero-shot Singing Voice Conversion Based on Feature Disentanglement and Synthesis [18.9]
そこで我々は,SaMoyeと名づけた,エンドツーエンドの機能不整合に基づくモデルを提案する。 SaMoyeは、歌声の特徴をそれぞれコンテンツ機能、音色機能、ピッチ機能に分解する。ゼロショット性能を保証するために,非並列な大規模データセットを構築した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:06:21 GMT)
Enhancing Transformer RNNs with Multiple Temporal Perspectives [18.9]
本稿では、リカレントニューラルネットワーク(RNN)アーキテクチャに適用可能な新しいアプローチである、複数時間視点の概念を紹介する。この方法は、以前遭遇したテキストの多様な時間的ビューを維持することを含み、コンテキストを解釈する言語モデルの能力を大幅に強化する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:43:59 GMT)
Towards Arbitrary-Scale Histopathology Image Super-resolution: An Efficient Dual-branch Framework via Implicit Self-texture Enhancement [18.9]
Inlicit Self-Texture Enhancement-based dual-branch framework (ISTE) を提案する。 ISTEには、まずピクセルの特徴とテクスチャの特徴を学習するテクスチャ学習ブランチと、画素学習ブランチが含まれている。我々はISTEが既存の固定スケールおよび任意のスケールのアルゴリズムを複数の倍率で上回ることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:50:13 GMT)
MARS: Mixture of Auto-Regressive Models for Fine-grained Text-to-image Synthesis [18.9]
特殊設計されたセマンティックビジョンランゲージ統合エキスパート(Semantic Vision-Language Integration Expert, SemVIE)を組み込んだ,T2I世代のための新しいフレームワークであるMARSを紹介する。この革新的なコンポーネントは、言語情報と視覚情報を独立に処理し、ビジュアルコンポーネントを微調整しながらテキストコンポーネントを凍結することにより、事前訓練されたLCMを統合する。 MARSはSD1.5に必要なGPU日のうち9%しか必要としないが、様々なベンチマークで顕著な結果が得られる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:05:53 GMT)
CoR-GS: Sparse-View 3D Gaussian Splatting via Co-Regularization [18.8]
3Dガウススティング(3DGS)は、シーンを表現するために3Dガウスアンからなる放射場を生成する。微妙なトレーニングビューでは、3DGSはオーバーフィッティングに苦しめられ、レンダリングに悪影響を及ぼす。本稿では、スパースビュー3DGSを改善するための新しい協調正規化視点を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:50:47 GMT)
PPTFormer: Pseudo Multi-Perspective Transformer for UAV Segmentation [18.6]
我々は,新しいtextbfPseudo Multi-textbfPerspective textbfTranstextbfformerネットワークであるPTFormerを紹介する。提案手法は,マルチパースペクティブ学習の強化のための疑似視点を作成することによって,実際のマルチパースペクティブデータの必要性を回避する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:15:27 GMT)
Real-Time Anomaly Detection and Reactive Planning with Large Language Models [18.6]
例えば、大規模な言語モデル(LLM)は、インターネットスケールのデータに基づいて訓練され、ゼロショット機能を持つ。本稿では,潜在的な異常に関する判断を安全な制御フレームワークに組み込む2段階の推論フレームワークを提案する。これにより、モニターは、四輪車や自動運転車のような動的ロボットシステムの信頼性を向上させることができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:59:22 GMT)
CE-QArg: Counterfactual Explanations for Quantitative Bipolar Argumentation Frameworks (Technical Report) [18.5]
定量的双極性論証フレームワーク (CE-QArg) に対する対実的説明法という反復的アルゴリズムを提案する。 CE-QArgは2つのコアモジュール(極性と優先度)に基づいて有効で費用対効果のある説明を特定できる。本稿では, CE-QArg をランダムに生成した QBAF 上で実証的に評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:34:11 GMT)
VideoMamba: Spatio-Temporal Selective State Space Model [18.3]
VideoMambaは、ビデオ認識用に特別に設計された純粋なMambaアーキテクチャの斬新な適応である。 VideoMambaは、リソース効率だけでなく、ビデオの長距離依存性のキャプチャにも有効だ。我々の研究は、ビデオ理解のための強力なツールとしてのVideoMambaの可能性を強調し、ビデオ分析における将来の研究のための、シンプルだが効果的なベースラインを提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:11:21 GMT)
Establishing Rigorous and Cost-effective Clinical Trials for Artificial Intelligence Models [18.2]
人工知能(AI)と医学における臨床実践の間には大きなギャップが残っている。最先端および最先端のAIモデル評価は、医療データセットの研究室研究や、患者中心または患者中心のコントロールを持たない直接臨床試験に限られる。臨床実習におけるAIモデルの厳格かつ費用対効果評価手法の重要性を初めて強調する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:37:08 GMT)
From Supervised to Generative: A Novel Paradigm for Tabular Deep Learning with Large Language Models [18.2]
GTL(Generative Tabular Learning)は、大規模言語モデル(LLM)の高度な機能を統合する新しいフレームワークである。我々の実証的研究は、GTLのスケーリングの振る舞いを厳格に分析し、384の公開データセットにまたがる。 GTL-LLaMA-2モデルは、多くの分類および回帰タスクにまたがる優れたゼロショットおよびインコンテキスト学習能力を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:09:19 GMT)
MuDiT & MuSiT: Alignment with Colloquial Expression in Description-to-Song Generation [18.2]
本稿では,口語記述から歌声生成への新たな課題を提案する。生成されたコンテンツと口語的人間の表現の整合性に焦点を当てている。この課題は、AIモデル内の言語理解と聴覚表現のギャップを埋めることを目的としている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:32:44 GMT)
OmniNOCS: A unified NOCS dataset and model for 3D lifting of 2D objects [18.1]
OmniNOCSは3次元正規化オブジェクト座標空間(NOCS)マップ,オブジェクトマスク,および3次元バウンディングボックスアノテーションを備えた大規模モノクラーデータセットである。我々はOmniNOCSを用いて、新しい変圧器ベースの単分子NOCS予測モデル(NOCSformer)を訓練する。これは、2Dボックスで誘導される場合に幅広いクラスに一般化できる最初のNOCSモデルである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:49:05 GMT)
Tactics, Techniques, and Procedures (TTPs) in Interpreted Malware: A Zero-Shot Generation with Large Language Models [18.0]
OSSマルウェアはソフトウェアサプライチェーン攻撃において重要な役割を果たす。我々は,解釈されたマルウェアパッケージのTTPを抽出するゼロショットアプローチであるGENTTPを提案する。 GENTTPは高い精度と効率でTPを生成することができることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:18:41 GMT)
Enhancing context models for point cloud geometry compression with context feature residuals and multi-loss [17.9]
点雲幾何学的圧縮では、コンテキストモデルは通常、ノード占有率の1ホット符号化をラベルとして使用する。コンテキスト間の差異を増幅するために、コンテキストモデルにコンテキスト特徴残差を導入する。また、出力とノード占有率の平均2乗誤差を損失関数として用いた多層知覚分岐も追加する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:08:37 GMT)
CoReS: Orchestrating the Dance of Reasoning and Segmentation [17.8]
セグメンテーションを推論する行為は、人間の視覚探索の認知段階を反映すべきである。本稿では,Reasoning and Segmenting (CoReS) の連鎖を紹介する。実験では、ReasonSegデータセットで最先端の手法を6.5%上回るCoReSの優れた性能を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:25:06 GMT)
SpecTra: Enhancing the Code Translation Ability of Language Models by Generating Multi-Modal Specifications [17.6]
大規模言語モデル(LLM)は、コード翻訳の自動化作業にますます利用されている。本稿では,新しい自己整合性フィルタを用いて,まず高品質な仕様を生成するマルチステージアプローチであるSpecTraを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:27:56 GMT)
The ODE Method for Stochastic Approximation and Reinforcement Learning with Markovian Noise [17.5]
近似アルゴリズムを解析する根本的な課題は、その安定性を確立することである。本稿では,マルティンゲール差分雑音設定からマルコフ雑音設定へ有界な安定に対するボルカー・メイン定理を拡張する。我々の分析の中心は、少数の関数の変化の減少率であり、これは多量の強い法則の形式とよく用いられるV4 Lynovドリフト条件の両方によって示唆される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:51:39 GMT)
SummaryMixing: A Linear-Complexity Alternative to Self-Attention for Speech Recognition and Understanding [17.4]
本稿では,自己注意に対する線形時間的代替案を提案する。すべての時間ステップの平均オーバーベクターとの発話を要約する。この単一の要約は、時間固有の情報と結合される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:20:23 GMT)
Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models? [17.0]
大規模言語モデル、特に多言語モデルは設計され、主張され、様々な言語の母語話者に適応することが期待されている。これらのモデルを微調整し評価する現在の実践は、翻訳に大きく依存しているため、この目的と完全に一致しない可能性があると仮定する。命令データの性質がモデル出力に影響を及ぼすかどうかは不明であるが、逆に、翻訳されたテストセットがそのようなニュアンスを捕捉できるかどうかは疑問である。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:37:24 GMT)
Slice-100K: A Multimodal Dataset for Extrusion-based 3D Printing [16.9]
Gコード(Geometric code)またはRS-274は、最も広く使われているコンピュータ数値制御(CNC)および3Dプリンティング言語である。現在、加法製造用のGコードファイルとともに、キュレートされたCADモデルの大規模なリポジトリは存在しない。本稿では,10000以上のGコードファイルからなる最初期のデータセットであるSLICE-100KとCADモデルについて述べる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:23:35 GMT)
Enhancing Thermal Infrared Tracking with Natural Language Modeling and Coordinate Sequence Generation [16.9]
本研究では,座標情報と時間情報の利用性を高めるNLMTrackという新しいモデルを提案する。実験により、NLMTrackは複数のベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:06:31 GMT)
Inference-Time Rule Eraser: Fair Recognition via Distilling and Removing Biased Rules [16.9]
機械学習モデルは、しばしば性別、人種、その他の社会的属性などのバイアスのある特徴に基づいて予測を行う。この問題に対処する従来のアプローチは、公正さを意識した最適化目標を持つニューラルネットワークの再トレーニングや微調整を含む。フェアネス問題に対処する新しい手法である推論時ルール消去器(Eraser)を紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:33:35 GMT)
Mitigating Catastrophic Forgetting in Language Transfer via Model Merging [16.8]
ブランチ・アンド・マージ(BaM)は複数のモデルを反復的にマージする手法である。 BaMは、これが低等級であるがより高い品質の重量変化をもたらすという知見に基づいている。ブルガリア語とドイツ語の実証研究において、BaMは、マッチングやターゲットドメインの性能の向上を伴いながら、忘れを著しく低減できることを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:32:40 GMT)
Learning to Break: Knowledge-Enhanced Reasoning in Multi-Agent Debate System [16.8]
マルチエージェント討論システム(MAD)は、真理を追求する人間の議論の過程を模倣する。様々なエージェントが、限られた知識の背景から、適切に、高度に一貫した認知をさせることは困難である。本稿では,Underline Knowledge-underlineEnhanced frameworkを用いたUnderlineMulti-underlineAgent UnderlineDebateを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:28:56 GMT)
VLind-Bench: Measuring Language Priors in Large Vision-Language Models [16.7]
LVLM(Large Vision-Language Models)は、様々なマルチモーダルタスクにおいて優れた性能を示す。それらは、画像情報を無視しながら、テキストパターンのみに基づいて応答が生成される、言語事前(Language prior)と呼ばれる問題に悩まされる。我々は,LVLMの言語先行性を測定するために設計された最初のベンチマークであるVLind-Benchという新しいベンチマークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:32:48 GMT)
AI-Enhanced Virtual Reality in Medicine: A Comprehensive Survey [16.7]
本稿では、医療・サービスにおけるAIによるVR応用の急成長分野を包括的に検討する。系統分類を導入することで、関連する技術と応用を慎重に3つの明確に定義されたカテゴリに分類する。この分類は、医療領域でAIによって駆動されるVRが果たす様々な役割を構造化された探索を可能にする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:50:50 GMT)
Semantic GUI Scene Learning and Video Alignment for Detecting Duplicate Video-based Bug Reports [16.5]
ビデオベースのバグレポートは、グラフィカルユーザインタフェース(GUI)を中心としたプログラムのバグの文書化にますます利用されている。我々は、視覚変換器のシーン学習機能に適応して、アプリUI画面に現れる微妙な視覚的およびテキスト的パターンをキャプチャする、JANUSと呼ばれる新しいアプローチを導入する。 Janus氏はまた、ビデオフレームの適応重み付けが可能なビデオアライメント技術を使用して、典型的なバグ発生パターンを考慮している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:48:36 GMT)
Don't Start from Scratch: Behavioral Refinement via Interpolant-based Policy Diffusion [16.4]
拡散モデルは、標準ガウスノイズから作用(あるいは状態)を拡散することでポリシーを形成することを学習する。学習対象のポリシーはガウスとは大きく異なり、少数の拡散ステップを使用すると性能が低下する可能性がある。提案手法は,情報ソースポリシーの利点を示す理論的結果,新しい方法,実証的な知見の両方に寄与する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:41:42 GMT)
Venomancer: Towards Imperceptible and Target-on-Demand Backdoor Attacks in Federated Learning [16.0]
本稿では,効果的なバックドア攻撃であるVenomancerを提案する。この方法は、Norm Clipping、Wak DP、Krum、Multi-Krum、RLR、FedRAD、Deepsight、RFLBATといった最先端の防御に対して堅牢である。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:29:06 GMT)
Do Zombies Understand? A Choose-Your-Own-Adventure Exploration of Machine Cognition [16.0]
我々は、この議論の反対者は理解のために異なる定義を持ち、特に意識の役割に対する彼らの見解が異なると論じる。我々は、Z$が理解できるかどうかを問うとともに、初歩的なAI研究における異なる思考の流派が、この疑問に異なる形で答えていることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:39:31 GMT)
ZeroI2V: Zero-Cost Adaptation of Pre-trained Transformers from Image to Video [16.0]
ビデオ領域に画像モデルを適用することは、ビデオ認識タスクを解くための効率的なパラダイムとして現れている。最近の研究は、パラメータ効率のよい画像から映像への適応に焦点を移している。画像変換器をビデオ認識タスクに転送する新たな適応パラダイム(ZeroI2V)を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:53:59 GMT)
Synchronous Diffusion for Unsupervised Smooth Non-Rigid 3D Shape Matching [15.8]
非剛性3次元形状整合問題において,正則化として用いる同期拡散過程を提案する。我々の新しい規則化は、特にトポロジカルノイズの存在下で、形状整合の最先端性を大幅に向上させることができることを実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:45:06 GMT)
Characterizing Large Language Model Geometry Helps Solve Toxicity Detection and Generation [15.8]
大規模言語モデル(LLM)は、現在のAIのブレークスルーを促進する。我々は幾何学のレンズを通してLLMの内部機構に光を当てた。我々は,任意の(事前学習された)LLMから抽出できる解釈可能な幾何学的特徴を導出する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:32:19 GMT)
An Improved Traditional Chinese Evaluation Suite for Foundation Model [15.7]
従来の中国語理解のための新しいベンチマークTMMLU+を提案する。小学校から専門職まで66名の被験者を対象とする多票質問回答データセットである。我々はまた、1.8Bから72Bまでのパラメータのクローズドソースモデルと26のオープンウェイト中国語大言語モデル(LLM)をベンチマークした。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:41:14 GMT)
Multimodal Sentiment Analysis with Missing Modality: A Knowledge-Transfer Approach [15.5]
マルチモーダル感情分析は、視覚的、言語的、音響的手がかりを通じて、個人が表現する感情を特定することを目的としている。既存の研究努力の多くは、すべてのモダリティがトレーニングとテストの両方で利用可能であり、そのアルゴリズムが欠落したモダリティシナリオに影響を受けやすいと仮定している。本稿では,欠落した音声のモダリティを再構築するために,異なるモダリティ間の翻訳を行う新しいナレッジ・トランスファーネットワークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:34:37 GMT)
Topological Generalization Bounds for Discrete-Time Stochastic Optimization Algorithms [15.5]
ディープニューラルネットワーク(DNN)は、顕著な一般化特性を示す。これらの能力の源泉は依然として解明され、確立された統計的学習理論を否定している。近年の研究では、訓練軌跡の性質が一般化の指標であることが示されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:56:03 GMT)
ElasticAST: An Audio Spectrogram Transformer for All Length and Resolutions [15.5]
オーディオスペクトログラム変換器(AST)のようなトランスフォーマーベースのモデルは、CNNから固定サイズの入力パラダイムを継承する。本稿では,ASTモデルを用いた可変長音声入力を,学習と推論の両方で利用するためのアプローチを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:29:56 GMT)
Hierarchical Consensus-Based Multi-Agent Reinforcement Learning for Multi-Robot Cooperation Tasks [15.2]
階層型合意に基づくマルチエージェント強化学習(HC-MARL)フレームワークを導入し,その限界に対処する。 HC-MARLは、エージェント間のグローバルコンセンサスを促進するために対照的な学習を採用し、直接のコミュニケーションなしに協調行動を可能にする。様々なタスクの動的な要求を満たすために、コンセンサスを複数の層に分割し、短期的および長期的考慮を包含する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:55:55 GMT)
A Temporal-Spectral Fusion Transformer with Subject-Specific Adapter for Enhancing RSVP-BCI Decoding [15.0]
RSVP-based Brain-Computer Interface (BCI) は脳波(EEG)信号を用いた標的探索のための効率的な技術である。従来の復号法は、新しい被験者からのかなりの量のトレーニングデータに依存している。そこで本研究では,既存の対象データから学習したモデルの知識を高速に伝達し,新たな対象データからデコードする対象特化アダプタを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:07:54 GMT)
Generalizable Sleep Staging via Multi-Level Domain Alignment [14.8]
本稿では、自動睡眠ステージングにドメイン一般化を導入し、一般化可能な睡眠ステージングの課題を提案する。既存の領域一般化手法に着想を得て,機能アライメントの考え方を採用し,SleepDGと呼ばれるフレームワークを提案する。 SleepDGは5つの公開データセットで検証され、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:38:32 GMT)
Self-Calibrating 4D Novel View Synthesis from Monocular Videos Using Gaussian Splatting [14.8]
本稿では,カメラパラメータの自己校正による高忠実度 4D GS シーン表現の学習手法を提案する。 3次元構造を頑健に表現する2次元点特徴の抽出を含む。その結果,4次元新規ビュー合成における最先端手法の大幅な改善が示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:02:38 GMT)
HO-FMN: Hyperparameter Optimization for Fast Minimum-Norm Attacks [14.6]
本稿では,よく知られた高速最小ノルム攻撃アルゴリズムのパラメトリック変種を提案する。我々は12のロバストモデルを再評価し、追加のチューニングを必要とせずに敵の摂動が小さくなることを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:30:01 GMT)
FlashAttention-3: Fast and Accurate Attention with Asynchrony and Low-precision [14.4]
注意は、大きな言語モデルと長いコンテキストアプリケーションのボトルネックです。我々はGPUに注意を向ける3つの主要な技術を開発した。提案手法であるFlashAttention-3は,FP16が最大740 TFLOPs/s(75%利用)に達し,FP8が1.2 PFLOPs/sに到達して,H100 GPU上で1.5-2.0$timesの高速化を実現していることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:44:48 GMT)
SliceMamba for Medical Image Segmentation [14.4]
SliceMambaは、ローカルに機密性の高い純粋なMamba医療画像セグメンテーションモデルである。提案されているSliceMambaには、効率的な双方向スライススキャンモジュール(BSS)が含まれている。これにより、空間的に隣接した特徴が走査シーケンスの近接性を維持することができ、セグメンテーション性能が向上する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:13:31 GMT)
RAIFLE: Reconstruction Attacks on Interaction-based Federated Learning with Adversarial Data Manipulation [14.4]
利用者は、中央サーバでプライベートなインタラクションを再構築するリスクが高くなる。我々は、新しい最適化ベースの攻撃フレームワークであるRAIFLEを紹介する。本実験は, RAIFLEが既存の再建攻撃よりもはるかに強力であることを示すものである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:04:27 GMT)
Unraveling overoptimism and publication bias in ML-driven science [14.4]
最近の研究では、機械学習モデルのパフォーマンスが過度に最適化されていることが示唆されている。本稿では,パラメトリック学習曲線と前述のバイアスを統合することで,観測精度の新たなモデルを提案する。神経学的条件の分類のメタ分析にモデルを適用し、各領域におけるMLに基づく予測の固有の限界を推定する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:40:20 GMT)
Improving Visual Place Recognition Based Robot Navigation Through Verification of Localization Estimates [14.4]
本研究では,視覚的位置認識のためのMLP(Multi-Layer Perceptron)整合性モニタを提案する。従来の最先端のSVMアプローチよりもパフォーマンスと一般化性が改善されている。提案手法を実世界の広範囲な実験で検証し、2つの実時間完全性に基づくVPR検証手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:47:14 GMT)
Lifelong Histopathology Whole Slide Image Retrieval via Distance Consistency Rehearsal [14.3]
本稿では,破滅的な忘れ事の課題に対処するために,生涯全スライド検索(LWSR)フレームワークを提案する。私たちのフレームワークは、継続的学習中に安定性と可塑性のバランスを達成することを目的としています。提案手法をTCGAプロジェクトの4つの公開WSIデータセット上で評価した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:12:28 GMT)
Constraining Ultralight Dark Matter through an Accelerated Resonant Search [14.2]
核磁気共鳴モードで動作する磁気センサを用いて,超軽量軸索ダークマターの核子結合について検討した。超高感度の0.73 fT/Hz$1/2$を約5Hzで達成し、約1.5$times 10-23,rmeV/Hz1/2$のエネルギー分解能に対応する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:36:08 GMT)
Towards Building Specialized Generalist AI with System 1 and System 2 Fusion [14.1]
特殊汎用人工知能(SGAI、SGI)は、人工知能(AGI)にとって重要なマイルストーンである。我々は,SGIを専門的スキルと一般性パフォーマンスのレベルに基づいて3つの段階に分類する。本稿では,システム1と2の認知処理の強みを統合したSGI開発のための概念的枠組みを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:23:16 GMT)
Three-layer deep learning network random trees for fault detection in chemical production process [14.0]
3層深層学習ネットワークランダムツリー(TDLN-trees)と呼ばれる新しい断層検出モデルを提案する。まず、ディープラーニングコンポーネントは、産業データから時間的特徴を抽出し、それらを組み合わせて高レベルのデータ表現に変換する。次に、機械学習コンポーネントは、最初のステップで抽出された特徴を処理し、分類する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:03:49 GMT)
Portrait4D-v2: Pseudo Multi-View Data Creates Better 4D Head Synthesizer [14.0]
フィードフォワードワンショット4Dヘッドアバター合成のための新しい学習手法を提案する。データ駆動方式で4Dヘッドシンセサイザーを学習するために擬似多視点ビデオを用いる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:59:02 GMT)
Rethinking the Threat and Accessibility of Adversarial Attacks against Face Recognition Systems [13.8]
顔認識パイプラインは、信頼、公平、責任あるAIアプリケーションにおいてミッションクリティカルなシステムに広くデプロイされている。敵の攻撃の出現は、認識パイプライン全体のセキュリティを脅かしている。我々は,ブラックボックスの顔認識パイプラインに対して,AdvColorという,効果的かつ容易に起動可能な物理的敵攻撃を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:58:09 GMT)
DALL-M: Context-Aware Clinical Data Augmentation with LLMs [13.8]
臨床データを用いた拡張技術により臨床コンテキストを向上する新しい手法を提案する。本稿では,大言語モデル(LLM)を用いて患者コンテキスト合成データを生成する臨床データ拡張の先駆的アプローチを提案する。この方法論は、医療におけるより堅牢なディープラーニングモデルのトレーニングに不可欠です。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:01:50 GMT)
Simulacra as Conscious Exotica [13.7]
人間的な振る舞いが増す会話エージェントの出現は、古い哲学的な疑問を新たな光に投げつける。ジェネレーティブ言語モデルから構築されたAIエージェントを意識的に話すことは理にかなっているだろうか? 本稿では,双対的思考の落とし穴を回避しつつ,この問題に対処しようとする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:42:47 GMT)
Joint Optimization of Age of Information and Energy Consumption in NR-V2X System based on Deep Reinforcement Learning [13.6]
5Gニューラジオ(NR)技術に基づくV2X仕様。モード2サイドリンク(SL)通信はLTE-V2Xのモード4に似ており、車両間の直接通信を可能にする。この影響を緩和するために干渉キャンセル法が使われています。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:54:38 GMT)
Deep Polarization Cues for Single-shot Shape and Subsurface Scattering Estimation [13.6]
半透明物体の形状と地下散乱(SSS)パラメータを共同で推定する新しい学習手法を提案する。観測の結果,SSSは光強度だけでなく偏光信号にも影響を及ぼすことがわかった。偏光半透明物体の大規模合成データセットを導入し,モデルの学習を行った。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:00:24 GMT)
Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models [13.5]
利用可能な最大規模でトレーニングされた最先端モデルの機能と推論能力の劇的な破壊を実演する。モデルは、問題の解決に影響を与えない、微妙な問題バリエーションでさえも強い変動を示すため、その分解は劇的である。これらの初期観測は、現在世代の大言語モデルが主張する能力の再評価を急激に促すものである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:17:36 GMT)
Multimodal contrastive learning for spatial gene expression prediction using histology images [13.5]
空間的トランスクリプトミクス表現予測のための Transformer と Densenet-121 エンコーダを用いたマルチモーダルコントラスト学習である textbfmclSTExp を提案する。 textbfmclSTExpは空間的遺伝子発現を予測するのに優れた性能を持つ。がん特異的な過剰発現遺伝子を解釈し、免疫関連遺伝子を解明し、病理学者によって注釈された特別な空間領域を特定することには、有望であることが示されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:33:38 GMT)
Automatic Pruning of Fine-tuning Datasets for Transformer-based Language Models [13.3]
微調整タスクのトレーニングセットを対象とした自動データセット解析手法を提案する。提案手法は,データセットのプルーニングに使用する複数のサブセットを提供する。 5つの下流タスクと2つの言語モデルの実験は、平均して、優勝チケットのサブセットを微調整すると、モデルの評価性能が0.1%上昇することを示している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 22:46:18 GMT)
Emergent Visual-Semantic Hierarchies in Image-Text Representations [13.3]
既存の基盤モデルの知識について検討し、視覚・意味的階層の創発的な理解を示すことを明らかにする。本稿では,階層的理解の探索と最適化を目的としたRadial Embedding (RE)フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:09:42 GMT)
Realization of Conditional Operations through Transition Pathway Engineering [13.3]
状態選択型遷移経路工学に基づく遷移複合ゲート(TCG)方式を提案する。回路圧縮の能力を実証するために、TGスキームを用いて3量子グリーンバーガー・ホーネ・ザイリンガー(GHZ)およびW状態を作成し、その忠実度は96.77%と95.72%である。 TCGスキームは特定の量子回路の利点を示し、大規模量子アルゴリズムに大きな可能性を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:24:51 GMT)
SLoRD: Structural Low-Rank Descriptors for Shape Consistency in Vertebrae Segmentation [13.2]
我々は,CT画像から脊椎を自動的に正確に分割するための輪郭型ネットワークを提案する。具体的には、SLoRDと呼ばれる形状整合性のための構造的低ランク記述子に基づく輪郭型ネットワークを提案する。輪郭記述子をより正確に表現するために、球面座標系を採用し、球面セントロイドを考案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:39:54 GMT)
DeepCodeProbe: Towards Understanding What Models Trained on Code Learn [13.1]
本稿では,MLモデルの構文と表現学習能力を調べるための探索手法であるDeepCodeProbeを紹介する。コードクローン検出,コード要約,コメント生成の最先端モデルにDeepCodeProbeを適用した。発見によると、小さなモデルは抽象構文表現をキャプチャするが、プログラミング言語の構文を完全に把握する能力は限られている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:16:44 GMT)
Long-range Turbulence Mitigation: A Large-scale Dataset and A Coarse-to-fine Framework [12.9]
大規模実時間長距離大気乱流データセット(RLR-AT)を構築した。このデータセットは、1Kmから13Kmまでの距離に1500の乱流配列を含む。本研究では, 動的乱流と静的背景に協調して, 強歪みの処理を行う粗大なフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:38:02 GMT)
A Taxonomy for Data Contamination in Large Language Models [12.6]
増大する懸念は、事前学習コーパスに評価データセットを含めることができるデータ汚染である。このようなデータを検知し、除去するプロセスである汚染除去は、潜在的な解決策である。下流タスクにおける言語モデルの性能に異なる種類の汚染がどのような影響を及ぼすかは、完全には理解されていない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:50:34 GMT)
ProxyGPT: Enabling Anonymous Queries in AI Chatbots with (Un)Trustworthy Browser Proxies [12.6]
本稿では,人気チャットボットプラットフォームにおける匿名クエリを可能にするプライバシ強化システムであるProxyGPTを提案する。このシステムはTLSが支援するデータ証明、エンドツーエンドの暗号化、匿名支払いといった重要なセキュリティ特性をサポートするように設計されている。人間の評価によると、従来のAIチャットボットと比べて、ProxyGPTはユーザーのプライバシーの感覚を高める。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:08:04 GMT)
Fairness-aware Vision Transformer via Debiased Self-Attention [12.4]
脱バイアス自己注意(Debiased Self-Attention, DSA)は、視覚変換器(ViT)を強制し、バイアス軽減のための感度ラベルと相関する刺激的な特徴を排除するフェアネススルー盲検アプローチである。本フレームワークは,目標予測性能を損なうことなく,複数の予測タスクに対する事前作業よりも公平性を保証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:11:49 GMT)
UP-FacE: User-predictable Fine-grained Face Shape Editing [12.4]
ユーザ予測可能な顔編集(UP-FacE)を提案する。試行錯誤による既存の顔編集法とは対照的に、UP-FacEによる編集は人間の手で予測可能である。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:22:27 GMT)
Spatially-Variant Degradation Model for Dataset-free Super-resolution [12.3]
本稿では,データセットのないBlind Image Super-Resolution (BISR)に焦点を当てる。我々は,各画素に対して空間変動分解モデルを明示的に設計した最初の人物である。提案手法は,従来のBISR法に比べて1dB(2x)の平均的な改善を実現している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:54:43 GMT)
A Graph-Based Approach for Category-Agnostic Pose Estimation [12.3]
任意のオブジェクトカテゴリに対するキーポイントのローカライズを可能にするために、カテゴリに依存しないポーズ推定(CAPE)を導入した。本稿では、入力ポーズデータをグラフとして扱うことにより、キーポイントを独立したエンティティとして扱う従来のCAPE技術との大きな違いを示す。提案手法は1ショット設定で0.98%向上し,CAPEの新たな最先端を実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:00:04 GMT)
Cloud Atlas: Efficient Fault Localization for Cloud Systems using Language Models and Causal Insight [12.3]
我々は、クラウドシステムのための因果グラフを自動的に合成する新しいアプローチであるAtlasを提示する。我々はAtlasをさまざまな障害局所化シナリオで評価し、Atlasがスケーラブルで一般化可能な方法で因果グラフを生成することができることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:31:12 GMT)
CLEO: Continual Learning of Evolving Ontologies [12.2]
継続的な学習(CL)は、知的システムに人間の生涯学習を浸透させることを目的としている。一般的な学習プロセスは、学習情報だけでなく、既存の情報の洗練にも限界がある。 CLEOは、時間とともに現実の変化に適応するインテリジェントなシステムの必要性によって動機付けられている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:32:33 GMT)
Federated Learning and AI Regulation in the European Union: Who is liable? An Interdisciplinary Analysis [12.1]
欧州連合人工知能法は、機械学習アプリケーションの開発とデプロイにおいて、明確な利害関係者の責任を委任する。 Federated Learningは、データサイロを越えた生成AIモデルのトレーニングを可能にし、データセキュリティを改善しながら、モデルパラメータのみを共有する。私たちの仕事は、双方の役割を明確にすることに貢献し、責任をサーバオペレータにシフトするための戦略を説明し、オープンな技術的課題を指摘します。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:41:16 GMT)
Differentiated Federated Reinforcement Learning Based Traffic Offloading on Space-Air-Ground Integrated Networks [12.1]
本稿では,SAGINにおけるトラヒックオフロード問題を解決するために,DFRL(differated federated reinforcement learning)を用いることを提案する。 SAGINの各領域の異なる特性を考慮すると、DFRLはトラフィックオフロードポリシー最適化プロセスをモデル化する。本稿では,この問題を解決するために,新たな微分型フェデレート・ソフト・アクター・クリティカル (DFSAC) アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:11:23 GMT)
Enhancing octree-based context models for point cloud geometry compression with attention-based child node number prediction [12.1]
点雲幾何学的圧縮では、ほとんどのオクツリーベースのコンテキストモデルでは、ノード占有率の1ホット符号化と、コンテキストモデルによって予測される確率分布との交差エントロピーを損失として利用する。まず,クロスエントロピー損失関数が1ホット符号化と予測確率分布の差を正確に測定できない理由を解析する。本稿では,注意に基づく子ノード数予測(ACNP)モジュールを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:16:41 GMT)
Semi-Supervised Object Detection: A Survey on Progress from CNN to Transformer [12.0]
本稿では,物体検出のための半教師付き学習における27の最先端開発について概説する。データ拡張テクニック、擬似ラベル戦略、一貫性の正則化、敵の訓練方法などをカバーする。我々は,既存の課題を克服し,物体検出のための半教師あり学習における新たな方向性を探るため,さらなる研究の関心を喚起することを目的としている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:58:13 GMT)
What do AI/ML practitioners think about AI/ML bias? [11.8]
我々の研究は、実践者の'AI/MLバイアス'に対する理解と、テック企業や研究者の定義との相違を明らかにした。これらの取り組みは、AI/ML実践者が偏見のないAI/MLシステムの開発を支援することによって、投資に多大な利益をもたらす可能性がある。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:43:25 GMT)
CLAP: Isolating Content from Style through Contrastive Learning with Augmented Prompts [11.8]
コンテンツの特徴を元の表現から切り離すために,データ拡張によるコントラスト学習を提案する。多様なデータセットを対象とした実験では、ゼロショットと少数ショットの分類タスクが大幅に改善された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:17:54 GMT)
Histopathological Image Classification with Cell Morphology Aware Deep Neural Networks [11.7]
本稿では,細胞形態を学習し,多数のがんタイプを同定するために事前訓練した新しいDeepCMorphモデルを提案する。 7175例の8736例の診断スライドから抽出した270K以上の組織パッチからなるPan-Cancer TCGAデータセット上で,本モジュールを事前訓練した。提案手法は, 82%以上の精度で32種類の癌を検出でき, 従来提案されていたすべてのソリューションを4%以上上回る性能を示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:03:59 GMT)
Multi-Group Proportional Representation [11.6]
交差するグループ間の表現を測定する新しい指標であるMPR(Multi-Group Proportional Representation)を導入する。 MPRは、リッチ関数クラスによって指定された複数の交叉群にまたがるより比例的な表現をもたらす。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:59:17 GMT)
Fish-bone diagram of research issue: Gain a bird's-eye view on a specific research topic [11.6]
本研究の目的は、因果関係を含む魚骨図を提供することによって、初心者研究者を支援することである。それは、関連性および論理的要因に基づいて、研究分野の幅広い、高度に一般化された視点を提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:18:54 GMT)
OMR-NET: a two-stage octave multi-scale residual network for screen content image compression [11.5]
スクリーンコンテンツ(SC)は、ノイズフリー、反復パターン、高コントラストといったユニークな特徴を持つ自然シーン(NS)とは異なる。高速・低周波特徴抽出のための改良された2段オクターブ畳み込み残差ブロック(IToRB)を提案する。また、特に画像中の高コントラスト領域の画素相関を捉えるために、ウィンドウベースアテンションモジュール(WAM)を用いる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:30:46 GMT)
DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance [11.4]
テキストと画像の拡散モデルは、高忠実度画像生成の可能性から、様々な領域で広く採用されている。既存の大規模拡散モデルでは、1K解像度の画像を生成できるが、これは現代の商用応用の要求を満たすには程遠い。本稿では,高分解能画像の生成を導くために,生成した低分解能画像を完全に活用する新しいプログレッシブアプローチを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:03:44 GMT)
Task-Driven Uncertainty Quantification in Inverse Problems via Conformal Prediction [11.4]
逆問題の画像化では、画像が欠落/破損した測定結果から回復しようとする。検索した画像が下流タスクに使用されるアプリケーションによって動機付けられ,不確実性定量化のためのタスク中心のアプローチを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:53:34 GMT)
HAFormer: Unleashing the Power of Hierarchy-Aware Features for Lightweight Semantic Segmentation [11.3]
本稿では,CNNの階層的特徴抽出能力とTransformerのグローバル依存性モデリング機能を組み合わせたモデルであるHAFormerを紹介する。 HAFormerは計算オーバーヘッドを最小限に抑え、コンパクトなモデルサイズで高性能を実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:19:44 GMT)
Turn-Level Empathy Prediction Using Psychological Indicators [11.3]
本稿では,WASSA 2024共感とパーソナリティ予測共有タスクのためのターンレベルの共感検出手法を提案する。大規模言語モデル(LLM)とDeBERTAの微調整によるテキストの豊かさのパイプラインは、共感検出のためのピアソン相関係数とF1スコアの大幅な改善を示している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:43:27 GMT)
Evaluating Deep Neural Networks in Deployment (A Comparative and Replicability Study) [11.2]
ディープニューラルネットワーク(DNN)は、安全クリティカルなアプリケーションでますます利用されている。デプロイにおけるDNNの信頼性を評価するために提案されている最近のアプローチについて検討する。複製パッケージ上でこれらのアプローチの結果を実行して再現することは困難であり、それ自身以外のアーティファクト上でも実行することがさらに困難であることに気付きました。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:58:12 GMT)
Hardware Neural Control of CartPole and F1TENTH Race Car [11.1]
この研究は、教師付き学習でNMPCを模倣するように訓練されたハードウェアFPGAニューラルネットワークコントローラの使用を実証する。我々は、安価な組み込みFPGAハードウェアに実装されたこれらのニューラルコントローラを用いて、物理カートポールとF1TENTHレースカーの高周波制御を行う。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:14:19 GMT)
SCPNet: Unsupervised Cross-modal Homography Estimation via Intra-modal Self-supervised Learning [11.0]
本研究では、モダル内自己教師付き学習、相関、一貫した特徴マップ、すなわちSCPNetに基づく教師なしクロスモーダルホモグラフィー推定フレームワークを提案する。 SCPNetは、128x128画像上の[-32,+32]オフセットの下で、衛星マップ画像ペアのクロスモーダルデータセットであるGoogleMap上で、効果的な教師なしホモグラフィー推定を初めて達成した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:00:21 GMT)
ST-Mamba: Spatial-Temporal Mamba for Traffic Flow Estimation Recovery using Limited Data [11.0]
交通流推定(TFE)は都市交通システムにおいて重要である。本稿では,畳み込みニューラルネットワーク(CNN)とMambaフレームワークを組み合わせた深層学習モデルである空間時空間Mamba(ST-Mamba)を紹介する。我々のモデルは、最小限のデータしか利用せず、広範なデータセットから得られる結果に匹敵する結果を達成することを目的としている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:43:03 GMT)
GazeMotion: Gaze-guided Human Motion Forecasting [11.0]
本稿では、過去の人間のポーズ情報と人間の目視情報を組み合わせた、人間の動き予測の新しい手法であるGazeMotionを紹介する。人間の目と身体の動きが密接に調整されていることを示す行動科学のエビデンスにインスパイアされたGazeMotionは、まず過去の視線から将来の視線を予測し、その後予測された将来の視線と過去のポーズを視線のグラフに融合し、最後に身体の動きを予測するための残差グラフ畳み込みネットワークを使用する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:09:49 GMT)
Potential Societal Biases of ChatGPT in Higher Education: A Scoping Review [10.8]
生成人工知能(GAI)モデル(ChatGPTなど)は、広範なデータセットのトレーニングによって社会的バイアスを継承または増幅することができる。高等教育機関(HEIs)における学生、教員、職員のGAI利用の増加に伴い、これらの技術に関連する倫理的問題や潜在的なバイアスについて検討することが急務である。このスコーピングレビューは,近年の学術出版物において,GAIに関連するバイアスがどのように研究され,議論されているかを明らかにすることを目的としている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:25:36 GMT)
Gap Completion in Point Cloud Scene occluded by Vehicles using SGC-Net [10.7]
本研究では,都市景観のギャップを埋めることのできるモデルを学ぶために,深層ニューラルネットワークを活用する新しい手法を提案する。我々は、空隙のないシーンにおける道路境界に沿って仮想車両モデルを配置し、レイキャストアルゴリズムを用いて、空隙のある新しいシーンを作成する革新的な手法を開発した。実験の結果、満点の97.66%が、高密度の地上真理点雲のシーンと比較して5cmの範囲内にあることが明らかとなった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:36:40 GMT)
Three-dimensional Microstructural Image Synthesis from 2D Backscattered Electron Image of Cement Paste [10.6]
フレームワーク(CEM3DMG)は、2D後方散乱電子(BSE)画像から微細構造情報を学習することにより3D画像を合成するように設計されている。視覚的な観察により、生成された3D画像は細孔や粒子形態を含む2D画像と類似した微細構造を示すことが確認された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:49:21 GMT)
Visual Multi-Object Tracking with Re-Identification and Occlusion Handling using Labeled Random Finite Sets [10.6]
本稿では、オブジェクトの出現と隠蔽を解消するオンライン視覚多目的追跡(MOT)アルゴリズムを提案する。我々の解は、ラベル付きランダム有限集合 (LRFS) フィルタリングアプローチに基づいている。本稿では,トラックの重なり合う部分とそのサイズを考慮したファジィ検出モデルを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:15:21 GMT)
Explicit_NeRF_QA: A Quality Assessment Database for Explicit NeRF Model Compression [10.5]
我々は、NeRF圧縮研究の課題に対処するため、Explicit_NeRF_QAと呼ばれる新しいデータセットを構築した。 4つの典型的なNeRFモデルをトレーニングするために,22個の3Dオブジェクトを多様なジオメトリ,テクスチャ,材料複雑度で使用しています。実験室環境における主観的な実験を行い、21人の視聴者から主観的なスコアを収集する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:02:05 GMT)
UICrit: Enhancing Automated Design Evaluation with a UICritique Dataset [10.4]
983のモバイルUIに対して,設計批判と品質評価をターゲットとしたデータセットを提示する。 LLM生成UIフィードバックにおける55%のパフォーマンス向上を実現するために,このデータセットを適用した。生成UI技術に対する報酬モデルのトレーニングを含む,このデータセットの今後の応用について論じる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:18:19 GMT)
Uncovering Emergent Spacetime Supersymmetry with Rydberg Atom Arrays [10.3]
我々は、Rydberg原子配列を用いた三臨界イジング遷移を実現することを提案する。このような系では、時空 SUSY はボソニックモードとそのフェルミオンパートナーの相関関数に自身を表わす。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:32:24 GMT)
Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression [10.2]
DLRMは最先端のレコメンデーションシステムモデルであり、様々な業界アプリケーションで広く採用されている。このプロセスの重大なボトルネックは、すべてのデバイスから埋め込みデータを集めるのに必要な全通信に時間を要することだ。本稿では,通信データサイズを削減し,DLRMトレーニングを高速化するために,エラーバウンドの損失圧縮を利用する手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:31:53 GMT)
Chromosomal Structural Abnormality Diagnosis by Homologous Similarity [10.2]
病原性染色体異常は一般人の間で非常に多い。本稿では,染色体の特徴のモデル化と構造異常のある染色体の同定に焦点をあてる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:04:21 GMT)
A Two-Stage Adverse Weather Semantic Segmentation Method for WeatherProof Challenge CVPR 2024 Workshop UG2+ [10.1]
We propose a two-stage Deep Learning framework for the WeatherProof dataset Challenge。この課題では,mIoU(Mean Intersection over Union)測定値で0.43の競争スコアを達成し,上位4位を確保した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:48:22 GMT)
Causal inference through multi-stage learning and doubly robust deep neural networks [10.0]
ディープニューラルネットワーク(DNN)は、大規模教師付き学習問題において顕著な経験的性能を示した。本研究は、複雑な因果推論タスクの幅広い範囲にわたるDNNの適用について検討する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:47:44 GMT)
Beyond Text: Leveraging Multi-Task Learning and Cognitive Appraisal Theory for Post-Purchase Intention Analysis [10.0]
本研究では,ユーザの行動を予測するための認知評価理論に基づくマルチタスク学習フレームワークを評価する。実験の結果, ユーザの言語や特徴は, テキストのみから予測するモデル以上の予測を改善することがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:57:52 GMT)
Urban Waterlogging Detection: A Challenging Benchmark and Large-Small Model Co-Adapter [10.0]
都市防水は公共の安全とインフラに大きなリスクをもたらす。近年の進歩では、監視カメラ画像とディープラーニングによる検出が採用されているが、データ不足と環境条件の悪化に苦戦している。我々は,現実の応用を進めるために,多様な有害な条件下で,挑戦的な都市水質評価ベンチマーク(UW-Bench)を構築した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:03:02 GMT)
Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.8]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:14:22 GMT)
Gradient Boosting Reinforcement Learning [9.7]
GBTの利点を強化学習領域に拡張するフレームワークであるGradient-Boosting RL(GBRL)を紹介する。 GBRLは、さまざまなタスクにまたがる競争的なパフォーマンスを実現し、構造的または分類的な特徴を持つドメインで優れている。本稿では,広く使用されているRLライブラリとシームレスに統合したGPU高速化実装を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:52:33 GMT)
LLMs' morphological analyses of complex FST-generated Finnish words [9.6]
この研究は、複雑なフィンランドの名詞形式の形態解析のタスクにおいて、最先端のLLMを評価し、この問題に光を当てることを目的としている。我々は、FSTツールを用いてフォームを生成し、LLMのトレーニングセットで発生することはありそうにないため、形態的一般化能力を必要とする。また, GPT-3.5-turbo と Llama2-70B と Poro-34B はほぼ完全に故障している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:12:28 GMT)
WhisperNetV2: SlowFast Siamese Network For Lip-Based Biometrics [9.5]
リップベースの生体認証(LBBA)は、過去10年間に多くの研究者を惹きつけてきた。我々はWhisperNetV2と呼ばれる新しいネットワーク構造を提案し、WhisperNetと呼ばれるネットワークを拡張した。オープンセットプロトコルを用いて、CREMA-Dデータセットを用いてネットワークをトレーニングし、テストセットで0.005のEER(Equal Error Rate)を取得しました。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:51:49 GMT)
Generating Contextually-Relevant Navigation Instructions for Blind and Low Vision People [9.5]
不慣れな環境をナビゲートすることは、盲目と低視(BLV)の個人にとって大きな課題となる。キッチンを探索したり、屋外でナビゲートしたりするなど、さまざまなシナリオで画像と目標のデータセットを構築します。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:40:36 GMT)
BriDe Arbitrager: Enhancing Arbitrage in Ethereum 2.0 via Bribery-enabled Delayed Block Production [9.5]
We introduced Bride Arbitrager, a novel tool designed for 2.0 which leverageing Bribery-driven attack to Delay block production and increase arbitrage gains。主な考え方は、悪意のあるプロポーザがバリデータやプロポーザを盗むことによって生産をブロックし、仲裁の機会を識別する時間を増やすことである。結果として、ブリデ・アービタラガーは、投票権の限られた1/4の割合を敵が制御し、収賄によってブロック生産を遅らせ、より多くの利益を仲裁することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:26:31 GMT)
Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets with Unbalanced Modalities [9.5]
本研究では,データサンプルの不均一性だけでなく,機関間のデータモダリティの固有不均一性と不均一性を両立する新しいFLアーキテクチャを提案する。マルチモーダルFLに適した分散勾配ブレンディングと近接対応クライアント重み付け戦略を考案した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:12:22 GMT)
Modulating Relaxation Time in Boundary-Dissipative Systems via Bond Dissipation [9.4]
本研究では, 結合散逸が境界散逸系の緩和時間に及ぼす影響について検討した。我々の研究は、オープンシステムでは、ある種類の消散が、別の種類の消散によって生じる影響を規制するために使用できることを明らかにしている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:48:18 GMT)
Latent Dataset Distillation with Diffusion Models [9.4]
本稿では,拡散モデルを用いた潜在データセット蒸留(LD3M)を提案する。我々の新しい拡散過程は, この課題に適しており, 蒸留の勾配流を著しく改善する。 LD3Mは、クラスごとに1つの画像に対して最大4.8 p.p.と4.2 p.p.を一貫して上回っている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:10:10 GMT)
Concise Plane Arrangements for Low-Poly Surface and Volume Modelling [9.3]
複雑な物体とシーン全体に対する平面配置の構築を可能にする2つの重要なノベルティを紹介する。提案手法は,様々なデータセットの学習ベースおよび従来のアプローチと比較することにより,最先端の結果につながることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:47:31 GMT)
SALSA: Swift Adaptive Lightweight Self-Attention for Enhanced LiDAR Place Recognition [9.2]
本稿では,LiDAR位置認識のための新しい,軽量で効率的なフレームワークであるSALSAを提案する。 Sphereformerのバックボーンで構成されており、半径方向の窓の注意を使って、疎い離れた地点の情報を集約することができる。リアルタイムに動作しながら、検索とメートル法の両方のローカライゼーションの観点から、様々なLiDAR位置認識データセット上の既存の手法より優れている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:00:19 GMT)
Automata-based constraints for language model decoding [9.1]
LMは、いくつかの形式言語で文字列を生成することがしばしば期待されている。チューニングにはかなりのリソースが必要で、一般的でない、あるいはタスク固有のフォーマットでは実用的ではない。我々はこれらの問題をオートマトン理論を適用して解決する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:25:01 GMT)
RTMW: Real-Time Multi-Person 2D and 3D Whole-body Pose Estimation [9.1]
全体ポーズ推定は、人体のきめ細かいポーズ情報を予測することを目的としている。本稿では,RTMW (Real-Time Multi-person Whole-body pose Estimation model) について述べる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:15:47 GMT)
Real-Time Summarization of Twitter [9.0]
我々は、リアルタイムプッシュ通知のシナリオに焦点を当て、システムはサンプルツイートのストリームを監視し、特定の興味のあるプロフィールに関連するつぶやきを返す必要がある。ツイートが特定の関心プロファイルに関連するかどうかを分類するために、Dirichletスコアと、非常にスムーズな(ベースライン)で採用しています。また、プッシュキューから冗長なツイートを削除することも望まれる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:56:31 GMT)
DSCENet: Dynamic Screening and Clinical-Enhanced Multimodal Fusion for MPNs Subtype Classification [9.0]
スライド画像全体(WSI)と臨床情報のマルチモーダル融合に基づくMPNのサブタイプ分類のための動的スクリーニング・臨床拡張ネットワーク(DSCENet)を提案する。 AUCは7.91%,精度は16.89%向上した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:13:58 GMT)
Deep Image Fingerprint: Towards Low Budget Synthetic Image Detection and Model Lineage Analysis [8.8]
本研究では,実際の画像と区別できない画像の新たな検出方法を提案する。本手法は、既知の生成モデルから画像を検出し、微調整された生成モデル間の関係を確立することができる。本手法は,Stable Diffusion とMidversa が生成した画像に対して,最先端の事前学習検出手法に匹敵する性能を実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:24:11 GMT)
Evaluating Nuanced Bias in Large Language Model Free Response Answers [8.8]
複数の選択テストでは識別できない自由テキストにおける数種類のニュアンスバイアスを同定する。本稿では, 偏見を検知する半自動パイプラインについて, 解答を非偏見として自動的に分類する手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:58:13 GMT)
StixelNExT: Toward Monocular Low-Weight Perception for Object Segmentation and Free Space Detection [8.7]
本研究では、Stixel-Worldの概念を活用して、その周囲の中程度の表現を認識する。我々のネットワークは2次元の多層Stixel-Worldを直接予測し、画像内の複数の重畳されたオブジェクトを認識することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:25:51 GMT)
Trainable Highly-expressive Activation Functions [8.7]
トレーニング可能な高表現能アクティベーション機能であるDiTACを紹介する。 DiTACはモデル表現性と性能を高め、しばしば大幅な改善をもたらす。また、セマンティックセグメンテーション、画像生成、回帰問題、画像分類といったタスクにおいて、既存のアクティベーション関数(後者が固定可能かトレーニング可能かに関わらず)を上回っている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:47:05 GMT)
CAV-AHDV-CAV: Mitigating Traffic Oscillations for CAVs through a Novel Car-Following Structure and Reinforcement Learning [8.6]
Connected and Automated Vehicles (CAVs)は、CAVとHuman-Driven Vehicles (HDVs)の混合交通の課題に対して、有望な解決策を提供する。 HDVは限られた情報に依存しているが、CAVは意思決定を改善するために他のCAVのデータを利用することができる。本稿では2つのCAV間のHDVのシーケンスを1つのエンティティとして扱う「CAV-AHDV-CAV」カーフォローフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:27:50 GMT)
Position: Measure Dataset Diversity, Don't Just Claim It [8.6]
データセットキュレーターは、データセットを特徴付けるために、多様性、バイアス、品質といった、価値に富んだ用語を頻繁に使用します。それらの流行にもかかわらず、これらの用語には明確な定義と検証が欠けている。本研究は,135の画像データセットとテキストデータセットにまたがる「多様性」を分析し,この問題の意義を考察する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:13:27 GMT)
DMM: Disparity-guided Multispectral Mamba for Oriented Object Detection in Remote Sensing [8.5]
マルチスペクトル指向物体検出は、モーダル間およびモーダル内両方の相違により、課題に直面している。本稿では,DMM(Disparity-guided Multispectral Mamba),DCFM(Disparity-guided Cross-modal Fusion Mamba)モジュール,MTA(Multiscale Target-aware Attention)モジュール,TPA(Target-Prior Aware)補助タスクからなるフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:09:59 GMT)
MapLocNet: Coarse-to-Fine Feature Registration for Visual Re-Localization in Navigation Maps [8.4]
伝統的なローカライゼーションアプローチは、正確に注釈付けされたランドマークからなる高定義(HD)マップに依存している。本稿では,画像登録にインスパイアされたトランスフォーマーを用いたニューラルリローカライズ手法を提案する。提案手法は, nuScenes と Argoverse の両方のデータセット上で, 現在最先端の OrienterNet を著しく上回っている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:51:18 GMT)
Generalizable Physics-informed Learning for Stochastic Safety-critical Systems [8.3]
十分なリスク事象を伴わない短期サンプルを用いて,長期的リスク確率とその勾配を評価するための効率的な手法を提案する。提案手法は, サンプル効率を向上し, 未確認領域を一般化し, システムパラメータの変化に適応できることをシミュレーションで示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:10:03 GMT)
A Comprehensive Survey on Human Video Generation: Challenges, Methods, and Insights [8.2]
ヒューマンビデオ生成は、テキスト、オーディオ、ポーズなどの制御条件が与えられた生成モデルを用いて、2次元の人体ビデオシーケンスを合成することを目的としている。近年の世代モデルの発展は、この分野への関心の高まりに確かな基盤を築き上げている。著しい進歩にもかかわらず、キャラクターの整合性、人間の動きの複雑さ、環境との関わりの難しさなど、人間の映像生成の課題は依然として困難なままである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:09:05 GMT)
SoK: What don't we know? Understanding Security Vulnerabilities in SNARKs [8.2]
ゼロ知識証明(ZKP)は、プライバシと検証可能性を提供する理論概念から、実用的な実世界の実装まで進化してきた。 SNARK(Succinct Non-Interactive Argument of Knowledge)は、最も重要なイノベーションのひとつ。本稿では,実生活SNARK実装のエンドツーエンドセキュリティ特性の評価に焦点をあてる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:11:14 GMT)
A Closer Look at Logical Reasoning with LLMs: The Choice of Tool Matters [8.2]
論理的推論へのアプローチの性能のばらつきが、採用法や特定の記号解法に起因しているかどうかは不明である。 Z3,Pyke,Prover9の3つの帰納的推論ベンチマークとLarge Language Modelsを併用した実験を行った。異なるLLMによって生成される記号翻訳のツール実行速度は、ほぼ50%の性能変化を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:06:25 GMT)
Specialist vision-language models for clinical ophthalmology [8.2]
視覚言語モデル(VLM)は、画像を自動的に解釈し、その結果をテキストとして要約する。年齢関連黄斑変性症(AMD)患者のケアに欠かせない専門的課題について,眼科医を実践することに比べ,基礎的VLMは明らかに不適合であることが示唆された。我々のカリキュラムベースのアプローチは、現実の臨床的タスクを扱うための総合的基礎医療用VLMを専門化する青写真を提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:31:48 GMT)
Foundation Model Engineering: Engineering Foundation Models Just as Engineering Software [8.1]
Foundation Models (FM) は、データとモデルをソースコードとして扱うことで、新しいタイプのソフトウェアになる。我々は、期待されるFM危機に対する戦略的対応であるファンデーションモデル(FM)エンジニアリングを導入するというビジョンを概説する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:40:02 GMT)
Tuning Vision-Language Models with Candidate Labels by Prompt Alignment [8.0]
視覚言語モデル(VLM)は、画像テキストペアの大規模なトレーニングデータセットから高品質な表現を学習することができる。プロンプト学習は、下流タスクに適応するためにVLMを微調整する一般的なアプローチである。本稿では,学習過程を候補ラベルでガイドする枠組みを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:46:24 GMT)
SuperFedNAS: Cost-Efficient Federated Neural Architecture Search for On-Device Inference [7.9]
フェデレートラーニング(FL)のためのニューラルアーキテクチャサーチ(NAS)は新興分野である。プライバシ、通信コスト、規制制限のためにデータが集中できない場合、Deep Neural Networks(DNN)の設計とトレーニングを自動化する。最近のフェデレーションNAS法は、手作業の労力を減らすだけでなく、FedAvgのような従来のFL法よりも高い精度を達成するのに役立つ。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:53:21 GMT)
Infinite Motion: Extended Motion Generation via Long Text Instructions [7.7]
『無限運動』は、長文を長文から拡張運動生成に活用する新しいアプローチである。我々のモデルの主な革新は、任意の長さのテキストを入力として受け入れることである。テキストのタイムスタンプ設計を取り入れ、生成されたシーケンス内のローカルセグメントの正確な編集を可能にする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:33:56 GMT)
PID Accelerated Temporal Difference Algorithms [7.6]
価値反復(Value Iteration)や時間差分(TD)学習(TD)学習(TD)のようなアルゴリズムは、収束速度が遅く、これらのタスクでは非効率になる。 PID VIは、制御理論のアイデアを用いた価値反復の収束を加速するために最近導入された。本稿では,環境からのサンプルのみを利用できるRL設定のためのPID TD LearningとPID Q-Learningアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:23:46 GMT)
Resilience of Entropy Model in Distributed Neural Networks [7.6]
エントロピー符号化は、通信オーバーヘッドをさらに減らすために導入された。本稿では,エントロピーモデルの意図的干渉と意図的干渉に対するレジリエンスについて検討する。本研究では,攻撃入力の送信オーバーヘッドを約9%削減できる新しい防御機構を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:51:56 GMT)
Industrial Anomaly Detection and Localization Using Weakly-Supervised Residual Transformers [7.5]
弱教師付きResidual Transformer」は、広範囲なアノテーションの必要性を最小限に抑えつつ、高いAD精度を実現することを目的としている。我々は「PosFAR(Positional Fast Anomaly Residuals)」と呼ばれる残留型トランスモデルを設計する。ベンチマークデータセットMVTec-ADでは、提案したWeakRESTフレームワークが83.0%の驚くべき平均精度(AP)を達成した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:17:34 GMT)
Continually Learn to Map Visual Concepts to Large Language Models in Resource-constrained Environments [7.5]
連続ビジュアルマッピング(Continuous Visual Mapping, CVM)は、固定言語モデルから抽出された知識空間に視覚表現を連続的に基礎付けるアプローチである。 CVMは5つのベンチマークで最先端の継続的学習手法を克服する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:28:40 GMT)
Predicting Heart Failure with Attention Learning Techniques Utilizing Cardiovascular Data [7.5]
心臓血管疾患では、心臓不全は死の主な原因の1つであり、また世界中の患者の長期的苦痛でもある。本研究では,EHR(Electronic Health Record)心血管データ(射出率,血清クレアチニン)に注意学習に基づく心不全予測手法を提案する。提案手法は,LSTMアプローチのような既存の最先端技術と比較して,心不全の予測に極めて効果的である。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:33:42 GMT)
Clap: a Semantic-Preserving Optimizing eDSL for Plonkish Proof Systems [7.5]
Plonkishはゼロ知識証明システムを開発するための一般的な回路フォーマットである。証明系回路フォーマットを備えた最初のRust e非依存のClapを提示する。クラップは、意味保存のコンパイル問題として、プロンキッシュシステムとその証人生成装置を製造するという問題を提起している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:21:25 GMT)
Magnon squeezing via reservoir-engineered optomagnomechanics [7.5]
我々は、オポマノメカニカルシステムにおいて、マグノニック圧縮状態の調製方法を示す。マグノメカニカルカップリングが線形か分散的かによっては2つのシナリオについて論じる。提案したマグノン圧縮状態は、マグノンを用いた量子情報処理と量子センシングに有望な応用を見出す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:08:51 GMT)
Automatic Outlier Rectification via Optimal Transport [7.4]
コンケーブコスト関数を用いた最適輸送を用いた外乱検出のための新しい概念的枠組みを提案する。コンケーブコスト関数を用いて最適な輸送距離を利用するための第一歩を踏み出し、修正セットを構築する。次に、推定タスクを実行するための修正セット内での最適分布を選択する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:22:42 GMT)
From Real to Cloned Singer Identification [7.4]
歌手レベルのコントラスト学習方式を用いて学習した3つの埋め込みモデルを提案する。 3つのモデルがすべて、本物の歌手を識別できることを実証する。しかし, 評価セットにおいて, 歌手のクローンバージョンを分類すると, 性能は低下する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:25:21 GMT)
How to beat a Bayesian adversary [7.0]
本研究では,ベイズ統計による攻撃を最大化ではなく,統計的アプローチを用いて決定する敵について検討する。ベイズ対数問題は通常のミンマックス問題の緩和である。我々は、Abramがマッキーン・ブラソフ過程を近似し、Abramの使用を正当化することを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:12:42 GMT)
Quantized area of the Schwarzschild black hole: A non-hermitian perspective [7.0]
我々は、シュワルツシルト質量の項で直接表現される制約のない還元ハミルトニアンを考える。対応するホーキング温度とブラックホールエントロピーに関する新しい表現を導出する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:10:10 GMT)
Mining Issue Trackers: Concepts and Techniques [7.0]
内外の利害関係者は「問題」を報告し、管理し、議論する課題追跡ツールは、組織がユーザと対話し、ソフトウェア開発ライフサイクルのさまざまな側面を管理するために使用するソフトウェアツールである。この章では、問題データをアルゴリズムで分析する4つの主要なユースケースについて論じる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:30:02 GMT)
Subgroup-Specific Risk-Controlled Dose Estimation in Radiotherapy [7.0]
がんは依然として死の主な原因であり、効果的な放射線療法(RT)の重要性を強調している磁気共鳴誘導線形加速器(MR-Linacs)はRT中のイメージングを可能にし、インターフレクションやおそらくはインターフレクションも可能である。モンテカルロシミュレーションは正確性を提供するが、それらは計算集約的である。ディープラーニングフレームワークは将来性を示しているが、RTのようなハイリスクアプリケーションには不確実な定量化が不可欠ではない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:12:55 GMT)
Provably Good Solutions to the Knapsack Problem via Neural Networks of Bounded Size [7.0]
古典的なNP-hard Knapsack問題(NP-hard Knapsack problem)の例として,ニューラルネットワークの表現力について検討する。最適クナプサック解を求めるには、最適クナプサック解の利益に依存する深さ4と幅のRNNが十分である。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:39:30 GMT)
Latent Conditional Diffusion-based Data Augmentation for Continuous-Time Dynamic Graph Mode [6.9]
連続時間動的グラフ(CTDG)は、現実世界の関係を正確にモデル化する。既存のCTDGモデルは、ノイズと限られた歴史的データから生じる課題に直面する。我々はCTDGに適した遅延拡散に基づくグラフデータ拡張法であるCondaを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:35:22 GMT)
Approximate Unitary $k$-Designs from Shallow, Low-Communication Circuits [6.8]
近似ユニタリ$k$-デザインは、平均が最初の$k$モーメントまでのハールランダムアンサンブルに近いようなユニタリと測度のアンサンブルである。我々はサブシステム間の通信がシステムサイズで$O(1)$である乗法誤り近似単位の$k$-designアンサンブルを構築する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:56:53 GMT)
EchoMimic: Lifelike Audio-Driven Portrait Animations through Editable Landmark Conditions [6.8]
オーディオのみによって駆動される手法は、時には不安定である。顔のキーポイントのみによって駆動される方法は、より安定した運転ではあるものの、不自然な結果をもたらす。私たちはEchoMimicという新しいアプローチを導入しました。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:26:51 GMT)
Quantifying the Cross-sectoral Intersecting Discrepancies within Multiple Groups Using Latent Class Analysis Towards Fairness [6.7]
本研究は,クロスセクタ間差分を定量化するための革新的アプローチを導入する。プロプライエタリなデータセットとパブリックなデータセットの両方を使用して、私たちのアプローチを検証する。我々の発見は、少数民族間の大きな相違が明らかとなり、現実世界のAIアプリケーションにおいて標的となる介入の必要性が浮かび上がっている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:19:11 GMT)
Explainability of Sub-Field Level Crop Yield Prediction using Remote Sensing [6.7]
本研究では,アルゼンチン,ウルグアイ,ドイツにおけるダイズ,小麦,ラピセド作物の収量予測の課題に焦点をあてる。我々の目標は、衛星画像の大規模なデータセット、追加のデータモダリティ、収量マップを用いて、これらの作物の予測モデルを開発し、説明することである。モデル説明可能性について,入力特徴量の定量化,重要な成長段階の同定,フィールドレベルでの収量変動の解析,精度の低い予測を行う。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:23:46 GMT)
A Text-to-Game Engine for UGC-Based Role-Playing Games [6.6]
本稿では,単純なテキスト入力を複雑でインタラクティブなRPG体験に変換する基礎モデルを用いたテキスト・ツー・ゲームエンジンの新しいフレームワークを提案する。エンジンは、ゲームストーリーをマルチモーダル形式で動的にレンダリングし、プレイヤアクションに応じて、ゲームキャラクタ、環境、メカニックをリアルタイムで調整する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:33:19 GMT)
How Deep is your Guess? A Fresh Perspective on Deep Learning for Medical Time-Series Imputation [6.5]
深層学習を用いた時系列計算のための新しい分類フレームワークを提案する。文献における概念的ギャップと既存のレビューを識別することにより、ニューラル・インパテーション・フレームワークの帰納的バイアスに基づく分類法を考案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:33:28 GMT)
A Hybrid Spiking-Convolutional Neural Network Approach for Advancing Machine Learning Models [6.5]
本稿では,新しいハイブリッド・スパイキング・畳み込みニューラルネットワーク(SC-NN)モデルを提案する。我々のアプローチは、イベントベースの計算や時間処理などのSNNのユニークな機能と、CNNの強力な表現学習能力を利用する。モデルは、マスクを使用して欠落したリージョンを生成するイメージインペイント用に特別に設計されたカスタムデータセットに基づいてトレーニングされる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:50:33 GMT)
Optimal Sharding for Scalable Blockchains with Deconstructed SMR [6.4]
Areteは、サイズセキュリティのジレンマを解決するために設計された、最適にスケーラブルなブロックチェーンシャーディングプロトコルである。 Areteの重要なアイデアは、ブロックチェーンのState Machine Replication(SMR)プロセス自体を分割することで、シャードのセキュリティレジリエンス/閾値を改善することだ。私たちはAreteを実装し、地理的に分散したAWS環境で評価し、Areteが最先端のシャーディングプロトコルより優れていることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:46:43 GMT)
CAR-MFL: Cross-Modal Augmentation by Retrieval for Multimodal Federated Learning with Missing Modalities [6.3]
モーダルを欠くマルチモーダル・フェデレート学習のための新しい手法を提案する。私たちの貢献は、検索による新しいクロスモーダルなデータ拡張であり、小さな公開データセットを活用しています。本手法は,パラメータをフェデレートした方法で学習し,プライバシ保護の確保と性能向上を図る。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:26:08 GMT)
Predictive representations: building blocks of intelligence [6.3]
本稿では、強化学習の理論と認知と神経科学の研究を統合する。我々は、後継表現(SR)とその一般化に特に注意を払う。この収束は、特定の種類の予測表現が多目的な知性の構成要素として機能することを示唆している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:02:37 GMT)
Parallelizing Autoregressive Generation with Variational State Space Models [6.3]
本稿では,エンコーダとデコーダの両方がSSMである可変オートエンコーダ(VAE)を提案する。潜伏変数をサンプリングしてSSMで復号化できるので、トレーニングと生成の両方を並列に行うことができる。デコーダの繰り返しにより、シーケンス全体を再処理することなく生成を再開することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:41:29 GMT)
Scenario-Based Field Testing of Drone Missions [6.2]
本稿では,ドローン飛行の現場試験の要件を明らかにする。適応的フィールドテストガイダンスのためのFiTS(Field Testing Scenario Management)アプローチを導入している。 FiTSは、構造化された再利用可能なテストシナリオを定義するために、シナリオベースの要件エンジニアリングと振る舞い駆動開発の概念を活用します。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:12:13 GMT)
Leveraging LLMs to Predict Affective States via Smartphone Sensor Features [6.2]
デジタル表現型は、行動やメンタルヘルスを推測するために、パーソナルデジタルデバイスからデータを収集して分析する。大型言語モデル(LLM)の出現は、スマートフォンのセンシングデータを理解するための新しいアプローチを提供する。本研究は, 大学生のスマートフォンセンシングデータに基づいて, LLMを用いて影響を予測し, このギャップを埋めることを目的とする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:37:52 GMT)
Automatic Generation of Web Censorship Probe Lists [6.1]
それまでのドメインプローブリストの生成作業は,大部分が手作業あるいはクラウドソースによるものだった。本稿では,Web検閲計測における包括的かつ最新のプローブリストの自動生成手法について検討する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:04:52 GMT)
Model-agnostic clean-label backdoor mitigation in cybersecurity environments [6.0]
近年の研究では、セキュリティ分類タスク用に設計されたモデルにバックドアを注入する、一連の悪質な訓練時間攻撃が表面化している。我々は、サイバーセキュリティ脅威モデルの洞察を活用して、これらのクリーンラベル中毒攻撃を効果的に軽減する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:25:40 GMT)
Anatomy-aware and acquisition-agnostic joint registration with SynthMorph [6.0]
アフィン画像登録は、医用画像解析の基盤となっている。ディープラーニング(DL)メソッドは、画像対を出力変換にマッピングする関数を学ぶ。ほとんどのアフィン法は、ユーザが調整したい解剖学に依存しない。つまり、アルゴリズムが画像のすべての構造を考慮すれば、登録は不正確なものになる。われわれはこれらの欠点をSynthMorphで解決する。これは高速で対称で、微分型で使い易いDLツールで、任意の脳画像の関節アフィン変形性登録を行う。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:59:50 GMT)
A Comprehensive Study of Disaster Support Mobile Apps [6.0]
45の災害アプリと28,161のレビューを詳細に分析した。これらのアプリの重要な機能13点を特定し,災害ライフサイクルの4段階に分類した。分析の結果、アプリの警告機能、アプリの満足度、マップの利用について、最も議論の多かった22のトピックが明らかになった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:58:12 GMT)
Metasurface-based Snapshot Shortwave-Infrared Hyperspectral Image Reconstruction with Inter and Intra Prior Learning Network [6.0]
本稿では, 準曲面フィルタとそれに対応するフィルタ選択法に基づくSWIRハイパースペクトルイメージングシステムを提案する。高品質なSWIRハイパースペクトル画像再構成を実現するために,新しい先進的および先進的学習展開フレームワークを提案する。実験の結果,提案手法は既存の手法よりも高速かつ優れた性能でHSIを再構築可能であることが示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:49:39 GMT)
Live Fitness Coaching as a Testbed for Situated Interaction [6.0]
QEVDベンチマークとデータセットは、フィットネスコーチングの挑戦的かつ制御されながら現実的な領域における人間とAIの相互作用を探索する。複雑な人間の行動を認識し、それらの行動に根ざした誤りを特定し、適切なフィードバックを提供するために補助的な視覚言語モデルを必要とする最初のベンチマークである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:10:45 GMT)
Differentially Private Multiway and $k$-Cut [5.9]
我々は,最小$k$カットおよびマルチウェイカット問題に対して,ほぼ最適な性能を実現する,エッジ微分プライベートアルゴリズムを導入する。最小$k$-cut問題に対して、我々のアルゴリズムは、近似$k$-cutの個数に対する既知のバウンダリを活用し、固定プライバシーパラメータに対して最適な加算誤差$O(klog n)$のプライベートアルゴリズムを実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:44:40 GMT)
Mind the Gap! Bridging Explainable Artificial Intelligence and Human Understanding with Luhmann's Functional Theory of Communication [5.7]
我々は、説明可能な人工知能の課題を強調するために、社会システム理論を適用した。我々は,インタラクティブかつ反復的な説明者の方向性で技術研究を再活性化することを目的としている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:13:04 GMT)
Delocalization of skin steady states [5.7]
逆皮膚局在を有する2つの鎖からなる直感的なリンドブラディアンを提案する。シングルボディのシナリオでは、それはリウヴィリアのギャップのスケーリングのシフトに対応する。多体シナリオでは, 定常的絡み合いのスケーリング挙動が領域法則から対数法則に変化することが明らかとなった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:03:54 GMT)
On the (In)Security of LLM App Stores [5.7]
本研究では,LLMアプリの潜在的なセキュリティリスクを特定するための3層懸念フレームワークを提案する。本研究は,静的および動的解析,大規模有毒単語辞書の開発,自動監視ツールを統合した。 15,146のアプリが誤解を招く説明をし、1,366件の個人情報をプライバシーポリシーに対して収集し、15,996件の有害なコンテンツを生成した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:03:32 GMT)
TLDR: Unsupervised Goal-Conditioned RL via Temporal Distance-Aware Representations [5.6]
教師なしの目標条件強化学習は、外部の監督なしに多様なロボットスキルを開発する上で有望なパラダイムである。本研究では,TemporaL Distance-Aware Representations(TLDR)を利用した新しい教師なしGCRL法を提案する。 TLDRは、探索を開始するために遠くの目標を選択し、時間的距離に基づいて固有の探索報酬と目標獲得報酬を計算する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:01:18 GMT)
15M Multimodal Facial Image-Text Dataset [5.6]
FaceCaption-15Mは、1500万対以上の顔画像と、それに対応する顔の特徴の自然言語記述で構成されている。画像品質, テキストの自然性, テキストの複雑さ, テキスト画像の関連性を総合的に分析し, FaceCaption-15Mの優位性を実証した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:00:14 GMT)
SparseRadNet: Sparse Perception Neural Network on Subsampled Radar Data [5.3]
レーダー生データは、しばしば過剰なノイズを含むが、レーダー点雲は限られた情報しか保持しない。本稿では,適応的なサブサンプリング手法と,空間パターンを利用したネットワークアーキテクチャを提案する。 RADIalデータセットの実験により,SparseRadNetはオブジェクト検出における最先端(SOTA)性能を超え,自由空間セグメンテーションにおけるSOTA精度に近づいた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:43:36 GMT)
Harnessing quantum light for microscopic biomechanical imaging of cells and tissues [5.1]
本稿では,生物医学研究における光損傷の軽減を目的とした転換的アプローチを紹介する。量子光励起ブリルアン散乱(SBS)イメージングコントラストを利用して、信号対雑音比を著しく高める。この方法論の具体的な影響は、標本の生存可能性の顕著な3倍の増大によって証明されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:25:51 GMT)
HITA: An Architecture for System-level Testing of Healthcare IoT Applications [5.1]
本稿では,医療用IoTアプリケーション用に設計された実世界のテストインフラストラクチャソフトウェアアーキテクチャ(HITA)を提案する。モデルベースおよび機械学習(ML)アプローチを用いて実装したHITAのディジタルツイン(DT)生成コンポーネントを評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:06:49 GMT)
A Novel Framework for Automated Warehouse Layout Generation [5.1]
自動倉庫レイアウト生成のためのAI駆動フレームワークを提案する。このフレームワークは、制約されたビームサーチを用いて、与えられた空間パラメータ内の最適なレイアウトを導出する。本手法は, 各種倉庫の寸法や形状に対して, 実現可能な最適レイアウトを作成できることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:15:09 GMT)
Preventing Radio Fingerprinting through Friendly Jamming [5.1]
無線周波数指紋認証により、受動受信機は暗号ツールを必要とせずに送信機を認識し認証することができる。悪意ある人物によるフィールド内の無線機器の不正な追跡を容易にする無線周波数指紋認証の敵対的利用について検討する。通信路上の機器の匿名性を改善するために,ジャマーを用いて指紋の送信信号を消毒する方法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:01:46 GMT)
OPIMA: Optical Processing-In-Memory for Convolutional Neural Network Acceleration [5.0]
我々は,処理インメモリ(PIM)ベースの機械学習アクセラレータであるOPIMAを紹介する。 PIMは、内部データ移動のボトルネックのため、高いスループットとエネルギー効率を達成するのに苦労している。我々は,OPIMAのスループットが2.98倍,エネルギー効率が137倍であることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:12:04 GMT)
NeuroIDBench: An Open-Source Benchmark Framework for the Standardization of Methodology in Brainwave-based Authentication Research [4.9]
脳活動に基づく生体認証システムは、パスワードに代わるものや、現在の認証技術を補完するものとして提案されている。 NeuroIDBenchは、脳波ベースの認証モデルをベンチマークするための柔軟なオープンソースツールである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:18:17 GMT)
WayveScenes101: A Dataset and Benchmark for Novel View Synthesis in Autonomous Driving [4.9]
WayveScenes101は、新しいビュー合成において、コミュニティが技術の状態を前進させるのを助けるために設計されたデータセットである。データセットは、幅広い環境条件と運転シナリオにわたる101の運転シーンで構成されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:29:45 GMT)
Modality Agnostic Heterogeneous Face Recognition with Switch Style Modulators [4.9]
推論中に複数のモーダルを扱えるモーダリティ非依存HFR法を訓練するための新しいフレームワークを提案する。 Switch Style Modulation Blocks (SSMB) と呼ばれる,計算効率のよい自動ルーティング機構を実装することで実現した。提案したSSMBは、エンドツーエンドにトレーニングでき、事前訓練された顔認識モデルにシームレスに統合され、モダリティに依存しないHFRモデルに変換される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:21:48 GMT)
ARCO:Adaptive Multi-Agent Reinforcement Learning-Based Hardware/Software Co-Optimization Compiler for Improved Performance in DNN Accelerator Design [4.8]
ARCOは適応型マルチエージェント強化学習(MARL)ベースの協調最適化コンパイルフレームワークである。このフレームワークには、MARL内に3つのアクター批判エージェントが含まれており、それぞれがコンパイル/最適化の異なる側面に特化している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:22:04 GMT)
CAD-Prompted Generative Models: A Pathway to Feasible and Novel Engineering Designs [4.8]
本稿では,実現可能なCAD画像の生成を促すことによって,設計の実現可能性を向上させる手法を提案する。その結果、CAD画像のプロンプトは、Stable Diffusion 2.1のようなテキストから画像への変換に有効であることが示されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:07:32 GMT)
MiDe22: An Annotated Multi-Event Tweet Dataset for Misinformation Detection [4.8]
MiDe22は5,284件の英語と5,064件のトルコ語ツイートに誤報ラベルを付けたものだ。データセットには、いいね!、リプライ、リツイート、引用などの観点から、ツイートとのユーザエンゲージメントが含まれている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:13:14 GMT)
MMA-UNet: A Multi-Modal Asymmetric UNet Architecture for Infrared and Visible Image Fusion [4.8]
MMIF(Multi-modal Image fusion)は、様々なモダリティから有用な情報を同じ表現空間にマッピングする。既存の融合アルゴリズムは、対称的にマルチモーダル画像を融合する傾向があり、浅い情報や偏りが単一モーダルに対して失われる。本研究では,異なるモードにおける情報の空間分布の差異を解析し,同一ネットワーク内の符号化特徴が同時に深層特徴空間アライメントを実現するには困難であることを証明した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:32:21 GMT)
A Human-in-the-Middle Attack against Object Detection Systems [4.8]
本稿では,暗号におけるman-in-the-Middle攻撃に触発された新たなハードウェア攻撃を提案する。この攻撃はUAP(Universal Adversarial Perturbations)を生成し、USBカメラと検出システムとの間の摂動を注入する。これらの知見は、自律運転のような安全クリティカルなシステムにおけるディープラーニングモデルの適用に対する深刻な懸念を提起する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:07:03 GMT)
XAI-Guided Enhancement of Vegetation Indices for Crop Mapping [4.7]
植生指標は、植生の成長と農業活動の効率的な監視を可能にする。しかし、新しい世代のマルチスペクトル衛星とハイパースペクトル衛星は追加のバンドを捉えることができるが、まだ効率的に利用されていない。本稿では,適切な植生指標を選択し,設計するための説明可能なAIベースの手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:44:43 GMT)
Floquet Schrieffer-Wolff transform based on Sylvester equations [4.6]
非駆動多体系の固有状態の知識のないシルヴェスター方程式の解法を示す。高い駆動周波数の限界において、これらの解はよく知られたフロケ・マグナス展開の高周波限界に還元される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:19:01 GMT)
Impact Measures for Gradual Argumentation Semantics [4.5]
影響尺度は、各引数に対して、そのスコアに対する他の引数の影響を評価する。本稿では,Delobelle と Villata の既存の影響尺度を改良し,Shapley の値に根ざした新しい影響尺度を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:47:44 GMT)
A Review of Nine Physics Engines for Reinforcement Learning Research [4.4]
Reviewは、強化学習(RL)のためのシミュレートされた物理環境を作成するためのツールの選択を研究者に指導することを目的とする。人気、機能範囲、品質、ユーザビリティ、RL機能に基づいて9つのフレームワークを評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:13:28 GMT)
Robust Generalization of Graph Neural Networks for Carrier Scheduling [4.3]
本稿では,1000ノードまでのネットワークへの一般化(再学習なしで)を改善するGNNベースのスケジューラであるRobustGANTTを紹介する。我々の研究は、大規模バックスキャッターネットワークにおける資源利用を改善するだけでなく、学習ベースのスケジューリングに関する貴重な洞察も提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:13:24 GMT)
Masked Particle Modeling on Sets: Towards Self-Supervised High Energy Physics Foundation Models [4.3]
Masked Particle Modeling (MPM) は、無秩序な入力集合上の汎用的、転送可能、再利用可能な表現を学習するための自己教師付き手法である。本研究では,コライダー物理実験における高エネルギージェットの試料中の方法の有効性について検討した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:55:25 GMT)
CADC: Encoding User-Item Interactions for Compressing Recommendation Model Training Data [4.2]
ディープラーニングレコメンデーションモデル(DLRM)は、現在のeコマース産業の中心にある。トレーニングデータセットを減らす1つのアプローチは、ユーザとイテムのインタラクションを削除することだ。本論文は,ユーザとユーザ間のインタラクション履歴をキャプチャしてユーザとアイテムの埋め込みを豊かにすることができれば,モデル精度を損なうことなく,インタラクション履歴を圧縮できることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:54:56 GMT)
United We Stand: Decentralized Multi-Agent Planning With Attrition [4.2]
分散計画は情報収集タスクのための協調型マルチエージェントシステムの鍵となる要素である。本稿では,アクティブエージェントの集合の変化に時間的かつ効率的に適応できる分散アルゴリズムであるAttritable MCTSを提案する。 A-MCTSは高故障率でも効率よく適応できることを理論的および実験的に示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:55:50 GMT)
Scalable microwave-to-optical transducers at single photon level with spins [4.1]
単一光子のマイクロ波から光への変換は、将来の超伝導量子デバイス間の相互接続において重要な役割を果たす。我々はレアアースイオン(REI)ドープ結晶を用いたオンチップマイクロ波-光変換器を実装した。我々は、原子遷移の絶対周波数によって実現された2つの同時に動作するトランスデューサに由来する光子の干渉を実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:43:02 GMT)
Enhancing Performance and User Engagement in Everyday Stress Monitoring: A Context-Aware Active Reinforcement Learning Approach [4.1]
本稿では,スマートウォッチとスマートフォンのコンテキストデータを用いたストレス検出のための,新しい文脈認識型アクティブラーニング(RL)アルゴリズムを提案する。提案手法では,EMAの展開に最適な時刻を動的に選択し,ユーザの即時コンテキストを利用してラベルの精度を最大化し,侵入性を最小化する。この研究は、パーソナライズされたコンテキスト駆動のリアルタイムストレスモニタリング手法への大きな動きを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:33:11 GMT)
Several questions of visual generation in 2024 [4.1]
本稿では,新しいアルゴリズムは提案しないが,著者の個人的理解に基づく視覚生成の諸問題について概説する。これらの問題の核心は、視覚信号を分解する方法にあり、他のすべての問題は、この中心的な問題と密接に関連しており、信号分解に対する不適切なアプローチから起因している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:49:13 GMT)
FALFormer: Feature-aware Landmarks self-attention for Whole-slide Image Classification [4.1]
全スライド画像(WSI)のスライドレベル分類は、デジタルおよび計算病理学において重要な問題として広く認識されている。本稿では,WSI全体を処理可能な効率的なスライドレベル分類モデルFALFormerを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:36:49 GMT)
The Brain Tumor Segmentation in Pediatrics (BraTS-PEDs) Challenge: Focus on Pediatrics (CBTN-CONNECT-DIPGR-ASNR-MICCAI BraTS-PEDs) [4.0]
CBTN--DIPGR-ASNR-MICCAI BraTS-PEDs : 小児脳腫瘍を中心に小児の高次グリオーマの生存率は20%未満である。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:29:03 GMT)
Sample selection with noise rate estimation in noise learning of medical image analysis [4.0]
本稿では,ノイズの多いデータセットでトレーニングされた場合のニューラルネットワークの性能を向上させる新しいサンプル選択手法を提案する。本手法では,線形回帰を用いて損失値の分布を解析することにより,データセットの雑音率を推定する。モデルのノイズ堅牢性をさらに高めるために,スパース正規化を採用している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:36:43 GMT)
Shedding More Light on Robust Classifiers under the lens of Energy-based Models [4.0]
我々は、敵対的訓練(AT)のダイナミクスについて、新しい視点を提供する。 ATにおけるエネルギー環境の分析により、標的外攻撃は、モデルの観点からの本来のデータよりも、より分散した(低エネルギー)敵画像を生成することが明らかとなった。厳格なエビデンスを動機とした重エネルギー教育(WEAT)の提案
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:11:03 GMT)
Generative Inverse Design of Metamaterials with Functional Responses by Interpretable Learning [3.9]
本稿では, オンデマンド機能的振る舞いを持つメタマテリアル設計の高速な生成を実現するために, ランダムフォレストに基づく解釈可能生成逆設計(RIGID)手法を提案する。トレーニングされたフォワードモデルから得られた目標満足度の可能性に基づいて、マルコフ連鎖モンテカルロ法を用いて設計ソリューションをサンプリングすることができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:27:35 GMT)
ERD: Exponential Retinex decomposition based on weak space and hybrid nonconvex regularization and its denoising application [3.9]
Retinex理論は、画像を照明とノイズ成分のセグメンテーションとしてモデル化する。画像復調のための指数分解アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:34:37 GMT)
Multi-scale gridded Gabor attention for cirrus segmentation [3.8]
本稿では,大容量画像に大域汚染物質を分画することの課題について論じる。本稿では,この制限に対処するグリッド型アテンション機構を提案し,効率を大幅に向上させる。本稿では,大規模な汚染塵雲の分節化作業を行う天文画像の新たなデータセットについて報告する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:27:30 GMT)
Surpassing Cosine Similarity for Multidimensional Comparisons: Dimension Insensitive Euclidean Metric (DIEM) [3.8]
ユークリッド距離から導かれる次元非感性ユークリッド距離(DIEM)を紹介する。 DIEMは一貫性のある変数を維持し、従来のメトリクスで観測されるバイアスを排除します。この新しい計量はコサイン類似性を置き換える可能性があり、多次元データを分析するためのより正確で洞察に富んだ方法を提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:00:22 GMT)
Graph Expansions of Deep Neural Networks and their Universal Scaling Limits [3.8]
ニューラルネットワークのスケーリング限界を得るための統一的なアプローチを提案する。ランダム行列理論の属拡大手法を用いる。我々はジャコビアンの極限特異値分布のモーメントの公式を求める。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:58:07 GMT)
Generalized Low-Rank Matrix Completion Model with Overlapping Group Error Representation [3.7]
低ランク行列補完(LRMC)技術は低レベル視覚タスクにおいて顕著な成果を上げている。 LRMCでは実世界の行列データが低ランクであるという前提がある。実行列データは厳密な低ランク特性を満たさないが, 上記の行列回復法には深刻な課題があることは間違いない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:01:57 GMT)
Non-convergence of Adam and other adaptive stochastic gradient descent optimization methods for non-vanishing learning rates [3.6]
ディープラーニングアルゴリズムは多くの人工知能(AI)システムにおいて重要な要素である。ディープラーニングアルゴリズムは通常、勾配降下(SGD)最適化法によって訓練されたディープニューラルネットワークのクラスで構成されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:10:35 GMT)
How Do Developers Structure Unit Test Cases? An Empirical Study from the "AAA" Perspective [3.4]
本研究では,4つのオープンソースプロジェクトからランダムに選択された実生活単体テストケース435について実験的検討を行った。全体として、テストケースの大多数(71.5%)はAAAの構造に従っている。 AAAの構造から逸脱する3つのアンチパターンと,Aブロック内に存在する可能性のある4つの設計上の欠陥を観察した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:33:02 GMT)
MCSD: An Efficient Language Model with Diverse Fusion [3.4]
MCSDモデルは線形スケーリングと高速推論速度を備えた効率的な言語モデルである。推論過程を反復表現に定式化し、空間複雑性を$O(1)$に、時間複雑性を$O(N)$に分割する。実験の結果, MCSDはトランスフォーマーに比べてスループットが高く, メモリ消費も低いことがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:29:19 GMT)
DEVIAS: Learning Disentangled Video Representations of Action and Scene for Holistic Video Understanding [3.3]
本稿では,Distangled VIdeo representations of Action and Scene (DEVIAS) を提案する。提案手法は,ベースラインと比較して,異なるデータセット間で良好な性能を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:32:32 GMT)
Predict. Optimize. Revise. On Forecast and Policy Stability in Energy Management Systems [3.3]
本研究は,エネルギー管理システムにおける予測と最適化の統合という課題に対処する。スイッチングコストを用いてオンライン最適化問題を解析し,決定論的および確率的予測によって実現するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:58:47 GMT)
Map It Anywhere (MIA): Empowering Bird's Eye View Mapping using Large-scale Public Data [3.2]
トップダウンのBird's Eye View (BEV)マップは、下流タスクの豊かさと柔軟性のために、地上ロボットナビゲーションの一般的な表現である。最近の手法では、ファーストパーソンビュー(FPV)画像からBEVマップを予測できることが示されている。 2つの大規模クラウドソースマッピングプラットフォームを利用することで,よりスケーラブルなマップ予測手法が実現可能であることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:57:22 GMT)
Using deep neural networks to detect non-analytically defined expert event labels in canoe sprint force sensor signals [3.1]
本稿では、パドルストロークイベントを自動的に予測する能力の観点から、畳み込みニューラルネットワーク(CNN)と繰り返しニューラルネットワーク(RNN)について検討する。以上の結果から,双方向ゲート再帰単位(BGRU)に基づくRNNがパドルストローク検出に最も適したモデルであることが判明した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:59:11 GMT)
Lower $T$-count with faster algorithms [3.1]
低実行時間で効率的な$T$-countを提案することで、$T$-count削減問題に寄与する。様々な量子回路において,現在最高のT$カウント還元アルゴリズムであるTODDの複雑さを大幅に改善する。我々は,さらに複雑さの低い別のアルゴリズムを提案し,評価されたほとんどの量子回路の最先端技術よりも高いあるいは等しいT$カウントを実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:31:20 GMT)
Dynamically assisted pair production enhancement by combined multiple potentials [3.0]
そこで本研究では, 深部低速変動と浅部低速変動ポテンシャルからなる複数電位を持つ新しいソーター型場モデルを提案する。ペア生成に対するソーター=シュウィンガー効果は、量子場理論を用いて動的に支援される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:07:12 GMT)
The Upper Bound of Information Diffusion in Code Review [2.9]
我々は,大規模な(Microsoft),中規模の(Spotify),および通信ネットワークとしてモデル化された小さなコードレビューシステム内での人工情報拡散をシミュレートする。参加者間のトポロジカルおよび時間的距離を最小に計測し、コードレビューにおいてどの程度の速さで情報を拡散できるかを定量化する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:40:57 GMT)
Progressive Growing of Patch Size: Resource-Efficient Curriculum Learning for Dense Prediction Tasks [2.9]
本稿では資源効率の高い暗黙的なカリキュラム学習手法であるPatch Sizeのプログレッシブグロース(Progressive Growing of Patch)を紹介する。我々のカリキュラムのアプローチは、モデルトレーニング中にパッチサイズを拡大することで定義され、タスクの難しさが徐々に増大する。提案手法により,ネットワークトレーニングのランタイム,計算コスト,CO2排出量を大幅に削減できる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:35:26 GMT)
Sensor-Aware Classifiers for Energy-Efficient Time Series Applications on IoT Devices [2.7]
時系列データ処理は、健康モニタリング、環境モニタリング、デジタル農業など、多くの実世界のアプリケーションにおいて重要なコンポーネントである。機械学習(ML)モデルは、分類の一般化能力のため、時系列アプリケーションに採用されている。精度を維持しつつエネルギー消費を最小限に抑えるため,部分センサウィンドウを備えた早期出口分類器を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:50:31 GMT)
Adjustment Identification Distance: A gadjid for Causal Structure Learning [2.7]
グラフ間の因果距離を開発するための枠組みを開発する。このフレームワークを用いて、改良された調整ベース距離と、部分的に有向な非巡回グラフと因果順序の拡張を開発する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:45:33 GMT)
Synthetic Electroretinogram Signal Generation Using Conditional Generative Adversarial Network for Enhancing Classification of Autism Spectrum Disorder [2.7]
本研究では, ASD 児の合成ERG 信号を生成できるジェネレーティブ・アドバイサル・ネットワークについて述べる。このアプローチは、ERGが障害の分類に役立つ可能性のある関連する精神疾患の分類モデルをサポートするかもしれない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:11:52 GMT)
QC-Forest: a Classical-Quantum Algorithm to Provably Speedup Retraining of Random Forest [2.6]
ランダムフォレスト(Random Forest, RF)は、教師あり学習法として人気があり、使いやすさと柔軟性で評価されている。オンラインRFモデルは、モデルの精度を維持するために、新しいトレーニングデータを考慮する必要がある。ストリーミング環境でのRFモデルの時間効率向上を目的とした古典量子アルゴリズムQC-Forestを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:32:59 GMT)
Adversarial-MidiBERT: Symbolic Music Understanding Model Based on Unbias Pre-training and Mask Fine-tuning [2.6]
変換器によるバイバーサ表現に基づく記号的音楽理解モデルAdrial-MidiBERTを提案する。逆学習に基づく非バイアス付き事前学習手法を導入し、トレーニング中にバイアスにつながるトークンの参加を最小限に抑えるとともに、事前学習と微調整のデータギャップを狭めるマスクファインチューニング手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:54:38 GMT)
Early Explorations of Lightweight Models for Wound Segmentation on Mobile Devices [2.5]
高齢化は、高齢者の慢性的な傷の増加など、医療に多くの課題をもたらす。セラピストによる創傷評価への現在のアプローチは主観的であり、スマートフォン写真からコンピュータ支援による創傷認識の必要性を強調している。スマートフォンをベースとした創傷セグメンテーションに適した3つの軽量アーキテクチャについて,初期研究を行った。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:01:58 GMT)
VR-GPT: Visual Language Model for Intelligent Virtual Reality Applications [2.5]
本研究では,VR環境における視覚言語モデルを用いたユーザインタラクションとタスク効率向上のための先駆的アプローチを提案する。本システムは,視覚的テキスト命令に頼ることなく,自然言語処理によるリアルタイム・直感的なユーザインタラクションを支援する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:46:14 GMT)
Real-Time Coupled Cluster Theory with Approximate Triples [2.5]
実時間結合クラスタシングル,ダブルスおよび近似三重奏法(CC3)の実装を導入し,高い励起レベルのポテンシャルを探索する。導出と実装は、周波数依存特性の計算への応用に続いて初めて実証される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:10:26 GMT)
The trade-off between diagonal and off-diagonal elements in the eigenstate thermalization hypothesis [2.5]
まず、この測度の対角的および対角的要素に対する普遍的なトレードオフ関係を証明します。次に、固有状態の典型性と平均可観測性に関する議論に拡張する。一次元のイジングスピン鎖を数値計算することにより、いくつかのトレードオフ関係と強いETHと弱いETHを調べる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:44:25 GMT)
FAR-Trans: An Investment Dataset for Financial Asset Recommendation [2.5]
金融資産レコメンデーション(FAR)は、レコメンデーションシステムのサブドメインである。我々はFARのための最初の公開データセットであるFAR-Transを紹介し、価格情報と小売投資家取引を含む。また、将来のベースラインとして使用するデータに対して、11個のFARアルゴリズムのベンチマーキング比較を提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:30:04 GMT)
AdaGlimpse: Active Visual Exploration with Arbitrary Glimpse Position and Scale [2.5]
Active Visual Exploration (AVE)は、観察(グランプ)を動的に選択するタスクである。光ズーム機能を備えた既存のモバイルプラットフォームは、任意の位置とスケールを垣間見ることができる。 AdaGlimpseは、探索作業に適した強化学習アルゴリズムであるSoft Actor-Criticを使って、任意の位置と規模を垣間見る。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:00:05 GMT)
With Great Power Comes Great Responsibility: The Role of Software Engineers [2.5]
ソフトウェアエンジニアリングの展望は、デジタルトランスフォーメーションとAIの上昇の中で急速に進化している。このビジョンペーパーは、進化する専門職に固有の複雑さと倫理的考察をナビゲートする、新しい世代のソフトウェアエンジニアを育成することを目的としている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:12:52 GMT)
Faster Preparation of Multi-qubit Entanglement with Higher Success Rates [2.4]
2量子量子絡み合いの準備は、非エルミート系の例外点(EP)やスペクトルの合体付近で著しく加速することができる。量子EPベースのデバイスにとって重要な障害は、高い絡み合った状態を生成する際の成功率の制限である。本研究は,真のパリティ時間(mathcalPT$)対称システムを利用することで,この制限を効果的に克服できることを実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:14:37 GMT)
Incorporating Large Language Models into Production Systems for Enhanced Task Automation and Flexibility [2.4]
本稿では,大規模言語モデル(LLM)エージェントを自動生産システムに統合するための新しいアプローチを提案する。自動化ピラミッドに基づいた階層的なフレームワーク内での運用運用の組織化。これにより、プロダクションプロセスのオーケストレーションのためのスケーラブルでフレキシブルな基盤が実現できます。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:34:43 GMT)
Differentially Private Neural Network Training under Hidden State Assumption [2.3]
隠れ状態前提下でのプライバシー保証を保証可能なニューラルネットワークに対する差分プライベートニューラルネットワーク座標降下(DP-SBCD)と呼ばれる新しいアプローチを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:14:40 GMT)
Faster Machine Unlearning via Natural Gradient Descent [2.3]
経験的リスク最小化(Empirical Risk Minimization:ERM)を用いて機械学習モデルからデータを効率的に削除するという課題に対処する。そこで本研究では,Natural Gradient Descent (D)アルゴリズムを応用した新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:19:28 GMT)
Multi-step Inference over Unstructured Data [2.2]
医療、法律、金融などの分野における高い意思決定タスクは、精度、包括性、論理的一貫性のレベルを必要とする。これらの問題に対処するための,ニューロシンボリックAIプラットフォームを開発した。このプラットフォームは、知識抽出とアライメントのための微調整LDMと、堅牢なシンボリック推論エンジンを統合している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 22:55:40 GMT)
Investigating Public Fine-Tuning Datasets: A Complex Review of Current Practices from a Construction Perspective [2.1]
本稿では、データ構築の観点から、現在の公開微調整データセットをレビューする。このレビューでは、進化と分類の2つの側面から、パブリックな微調整データセットの概要を述べる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:11:16 GMT)
A Clinical Benchmark of Public Self-Supervised Pathology Foundation Models [2.1]
本研究は, がん診断を含む臨床関連エンドポイントと, 2つの医療センターからの標準病院手術中に発生する各種バイオマーカーとを関連づけた臨床スライドを含む病理データセットの収集について述べる。これらのデータセットを利用して、公共病理基盤モデルの性能を体系的に評価し、新しい基礎モデルをトレーニングし、適切な事前学習モデルを選択するためのベストプラクティスに関する洞察を提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:16:37 GMT)
STAL: Spike Threshold Adaptive Learning Encoder for Classification of Pain-Related Biosignal Data [2.1]
本稿では,EmoPainデータセットを用いた慢性腰痛 (CLBP) 分類のためのスパイキングニューラルネットワーク (SNN) の最初の応用について述べる。本稿では,連続生体信号をスパイク列車に変換する訓練可能なエンコーダであるSpike Threshold Adaptive Learning (STAL)を紹介する。また,SEMG と IMU データのマルチストリーム処理のためのスパイキングリカレントニューラルネットワーク (SRNN) 分類器のアンサンブルを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:15:52 GMT)
Uncovering Semantics and Topics Utilized by Threat Actors to Deliver Malicious Attachments and URLs [2.1]
本研究は、メールに埋め込まれた共通意味やテーマを特定するためにBERTopicの教師なしトピックモデリングを利用する。我々は,BGE-M3のような多言語埋め込みモデルを用いて,内容の抽出と衛生化を行い,電子メールを前処理する。我々の研究は、トピック量、コヒーレンス、多様性のメトリクスについて、異なるクラスタリングアルゴリズムを評価し比較する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:04:16 GMT)
Accurate Cooperative Localization Utilizing LiDAR-equipped Roadside Infrastructure for Autonomous Driving [2.0]
LiDARは、センチメートルレベルの精度で車両のローカライズを容易にする。これらの高精度な手法は、識別可能なマップ機能を持たない環境での信頼性上の課題に直面することが多い。本稿では,道路側ユニット(RSU)と車両間通信(V2I)を併用して車両の自己位置決定を支援する手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:44:42 GMT)
Privacy-Preserving Data Deduplication for Enhancing Federated Learning of Language Models [2.0]
先駆的プロトコル, 効率的なプライバシ保護多人数重複(EP-MPD)を導入する。 EP-MPDはデータのプライバシを損なうことなく、複数のクライアントのデータセットからの重複を効率的に除去する。パープレキシティを最大19.61%改善し、ランニングタイムを最大27.95%削減する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:10:27 GMT)
A Cantor-Kantorovich Metric Between Markov Decision Processes with Application to Transfer Learning [2.0]
我々は(Banse et al., 2023)によって導入されたマルコフ鎖間のカントール・カントロヴィチ距離の概念を拡張する。提案した計量はよく定義されており、有限の地平線から効率的に近似することができる。特に,転送学習アルゴリズムの性能予測に有効であることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:13:11 GMT)
Analyzing the Runtime of the Gene-pool Optimal Mixing Evolutionary Algorithm (GOMEA) on the Concatenated Trap Function [2.0]
GOMEAは、リンク学習を利用して問題構造を効率的に活用する進化的アルゴリズムである。 GOMEAは確率の高い$O(m32k)$で解くことができ、$m$はサブファンクションの数、$k$はサブファンクションの長さである。これは (1+1) 進化的 EA と比較して大きなスピードアップであり、これは$O(ln(m)(mk)k)$期待される評価を必要とする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:37:21 GMT)
NinjaLLM: Fast, Scalable and Cost-effective RAG using Amazon SageMaker and AWS Trainium and Inferentia2 [2.0]
本稿では,従来のRAG技術の改良について述べる。私たちは、SageMakerを介してAWS TrainiumとInferentia2 AIチップに微調整され、ホストされる、大規模言語モデル(LLM)に焦点を当てています。我々はRAGシステムの性能をNatural QuestionsとHotPotQAデータセットでベンチマークし、それぞれ62%と59%の精度を達成した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:04:44 GMT)
Are Paralinguistic Representations all that is needed for Speech Emotion Recognition? [2.0]
パラ言語的PTM表現は、音声感情認識(SER)のための最先端(SOTA)性能を示す。これらの表現は英語以外の言語環境では評価されていない。これにより、複数の言語におけるSERに対するパラ言語的PTM表現の有効性へのアクセスが困難になる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:50:11 GMT)
Kibble-Zurek Behavior in the Boundary-obstructed Phase Transitions [1.9]
本研究では,2次元トポロジカル絶縁体の非断熱的ダイナミクスについて検討する。その結果, クエンチ後の励起数は, クエンチ速度によるゆるいスケーリング挙動を示すことがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:39:41 GMT)
Mon CHÈRI <3 Adapting Capability Hardware Enhanced RISC with Conditional Capabilities [1.9]
CやC++のような言語におけるメモリセーフティの脆弱性の最大10%は、und変数に由来する。この研究は、メモリ問題とメモリ問題に対する適切なソフトウェア緩和の頻度と欠如に対処する。我々は、CHERI機能モデルを拡張して、以前の操作に基づいたメモリアクセスポリシーを可能にする「条件付き機能」を含むようにします。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:51:36 GMT)
Deep Inverse Design for High-Level Synthesis [1.9]
我々は,グラフニューラルネットワークと生成モデルを統合する新しいアプローチとして,HLSのためのDeep Inverse Design(DID4HLS)を提案する。 DID4HLSは、HLS後のデータから設計特徴の条件分布を学習することにより、計算集約アルゴリズムを目的としたハードウェア設計を反復的に最適化する。提案手法は,4つの最先端DSEベースラインと比較して,基準セットまでの平均距離で平均42.5%向上した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:13:38 GMT)
System Report for CCL24-Eval Task 7: Multi-Error Modeling and Fluency-Targeted Pre-training for Chinese Essay Evaluation [1.9]
我々は,中国語学習者4Wコーパス上で,二分分類モデルと訓練された粗粒度モデルを用いて,細粒度エラーの予測を最適化した。トラック2では、文毎に複数のエラー型を持つ擬似データセットを構築することにより、性能を向上した。 1位となったトラック3では,事前学習のための逆翻訳によって流速評価の擬似データを生成し,NSPベースの戦略を用いた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:17:08 GMT)
Estimation of Distribution Algorithms with Matrix Transpose in Bayesian Learning [1.8]
ベイズ構造学習に特化して設計された新しい突然変異演算子,行列変換について述べる。その結果, トランスポーション変異を持つEDAは従来のEDAよりも著しく優れた性能を示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:57:35 GMT)
Inductive Predicate Synthesis Modulo Programs (Extended) [1.7]
プログラム解析のトレンドは、入力プログラムの言語内で検証条件を符号化することである。 Inductive Predicate Synthesis Modulo Programs (IPS-MP) を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:51:08 GMT)
Segmentation-guided Attention for Visual Question Answering from Remote Sensing Images [1.7]
Visual Question Answering for Remote Sensing (RSVQA)は、リモートセンシング画像の内容に関する自然言語の質問に答えることを目的としたタスクである。セグメンテーションによって導かれるアテンションメカニズムをRSVQAパイプラインに埋め込むことを提案する。 16のセグメンテーションクラスと問合せ/問合せペアでアノテートされた非常に高解像度のRGB写真を利用する新しいVQAデータセットを提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:59:32 GMT)
Point Intervention: Improving ACVP Test Vector Generation Through Human Assisted Fuzzing [1.7]
本稿では,暗号ライブラリのACVPフォーマットで良好なテストを生成するための方法とツールを提供する。本システムは,暗号プリミティブをファジリングするためのハイブリッドアプローチを用いて,既存のファジリング手法よりも優れたカバレッジを実現する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:21:48 GMT)
Feasibility of Neural Radiance Fields for Crime Scene Video Reconstruction [1.6]
我々は,多目的合成,変形可能な合成,照明という,犯罪現場の再構築に関して,NeRFの3つの主要なイノベーションに注目している。本稿では,現場の入力映像から犯罪現場を再構築するために,NeRFモデルのバリエーションを利用することの可能性について検討し,その可能性を検討することを目的とする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:13:12 GMT)
CoGS: Causality Constrained Counterfactual Explanations using goal-directed ASP [1.6]
本稿では,ルールベース機械学習モデルから対物生成を行うCoGS(Counterfactual Generation with s(CASP))フレームワークを提案する。 CoGSは、それらの間の因果依存性を考慮した属性値に対する現実的かつ因果一貫性のある変更を計算します。望ましくない結果から、偽物を使用する望ましい結果への道を見つける。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:50:51 GMT)
Towards Semantically Enriched Embeddings for Knowledge Graph Completion [1.5]
本稿では,KG埋め込み生成のバリエーションに基づいて,既存のKG完了アルゴリズムについて論じる。その後、KG、LLM内の型情報を利用したアルゴリズムに移行し、最後に、異なる記述論理公理で表されるセマンティクスをキャプチャするアルゴリズムに移行する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:18:29 GMT)
HiLight: Technical Report on the Motern AI Video Language Model [1.5]
本報告では,ビデオテキストアライメントのための最先端ビデオエンコーダと,HiLightと呼ばれるビデオ会話フレームワークの実装について述べる。我々のゴールはビリヤードの文脈におけるビデオ理解の課題に対処することである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:44:28 GMT)
A Two-Stage Machine Learning-Aided Approach for Quench Identification at the European XFEL [1.5]
本稿では,欧州X線自由電子レーザーにおけるクエンチ識別のケーススタディに適用した機械学習支援型故障検出分離手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:21:41 GMT)
The XYZ ruby code: Making a case for a three-colored graphical calculus for quantum error correction in spacetime [1.5]
パウリ測定による任意のクリフォード回路の論理的動作と誤り訂正能力を捉えるためのテンソルネットワークに基づくフォーマリズムを提案する。 2+1d色符号と同じ位相位相の動的符号の族に本手法を適用した。我々は、メモリと安定性の両方の実験を行うことで、トーラス上のXYZ rubyコードのパフォーマンスをベンチマークする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:56:26 GMT)
Enrich the content of the image Using Context-Aware Copy Paste [1.5]
本稿では,By Latent Information Propagation (BLIP) を組み込んだコンテキスト認識手法を提案する。抽出したコンテンツ情報とカテゴリ情報とをマッチングすることにより,Segment Anything Model (SAM) と You Only Look Once (YOLO) を用いて対象物の密結合性を確保する。各種データセットを対象とした実験により,データ多様性の向上と高品質な擬似画像の生成において,本手法の有効性が示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:07:28 GMT)
Explainable Time Series Anomaly Detection using Masked Latent Generative Modeling [1.4]
本稿では,新しい時系列異常検出法であるTimeVQVAE-ADを提案する。 TimeVQVAE-ADは、優れた説明性を提供しながら、優れた検出精度を実現する。私たちはGitHubに実装を提供しています。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:45:41 GMT)
A Survey on the Application of Generative Adversarial Networks in Cybersecurity: Prospective, Direction and Open Research Scopes [1.4]
GAN(Generative Adversarial Networks)は、常に変化するセキュリティ問題に対処する強力なソリューションとして登場した。本研究は, サイバーセキュリティの防衛強化において, GANを的確に捉えた深層学習モデルの重要性について検討した。焦点は、これらのドメインにおけるサイバーセキュリティの防御を強化するために、GANがいかに影響力のあるツールになり得るかを調べることである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:51:48 GMT)
stEnTrans: Transformer-based deep learning for spatial transcriptomics enhancement [1.3]
本研究では,トランスフォーマーアーキテクチャに基づくディープラーニング手法であるstEnTransを提案する。 stEnTransを6つのデータセット上で評価した結果, スポット分解能の向上と未測定領域での遺伝子発現の予測において, 優れた性能を示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:50:34 GMT)
Large-Scale Dataset Pruning in Adversarial Training through Data Importance Extrapolation [1.3]
本稿では,少数のデータ集合からより大きなデータ集合へのデータ重要度スコアの補間に基づく新たなデータ抽出戦略を提案する。実験的な評価では,外挿型プルーニングは頑健性を維持しつつ,データセットサイズを効率的に削減できることを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:10:24 GMT)
SwishReLU: A Unified Approach to Activation Functions for Enhanced Deep Neural Networks Performance [1.3]
ディープニューラルネットワークでよく使われるアクティベーション関数であるReLUは、"Dying ReLU"の問題に傾向がある。 ELU、SeLU、Swishなどいくつかの改良版が導入されており、一般的には使われていないと考えられている。本稿では,ReLUとSwishの要素を組み合わせた新しいアクティベーション機能であるSwishReLUを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:14:34 GMT)
Vision language models are blind [1.2]
視覚機能を備えた大規模言語モデル(VLM)は、数え切れないほどの画像テキストアプリケーションを動かしている。 BlindTestは、人間の目で見やすい7つの視覚タスクのスイートです。 4つの最先端のVLMは平均してベンチマークで56.20%しか正確ではなく、ニューソネットが最も正確である(73.77%)。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:33:10 GMT)
Mitigating Group Bias in Federated Learning for Heterogeneous Devices [1.2]
フェデレートラーニング(Federated Learning)は、分散エッジアプリケーションにおけるプライバシ保護モデルトレーニングアプローチとして登場している。本研究は,プライバシを維持しながら,資源利用のオーバーヘッドを伴わずにグループバイアスを最小限に抑えるグループフェアFLフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:25:51 GMT)
Inside the Black Box: Detecting and Mitigating Algorithmic Bias across Racialized Groups in College Student-Success Prediction [1.1]
大学生の成功予測の精度が人種集団によってどのように異なるのかを,アルゴリズムバイアスのシグナルとして検討した。人種的にマイノリティのある学生の成功を予測する際に、大学学生の成功を予測するためによく使われる機能を組み込んだモデルが、いかに正確でないかを実証する。アルゴリズムバイアスを緩和するための一般的なアプローチは、一般的に、予測結果の相違や人種化されたグループ間の正確性を排除するのに効果がない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:19:31 GMT)
Improve Load Forecasting in Energy Communities through Transfer Learning using Open-Access Synthetic Profiles [1.1]
10GWエネルギーユーティリティの予測エラーを1%削減すれば、年間最大1.6億ドルの節約が可能になる。本稿では,移動学習手法を用いて,オープンアクセス型合成負荷プロファイルを用いた負荷予測モデルの事前学習を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:17:31 GMT)
Toto: Time Series Optimized Transformer for Observability [1.1]
TotoはDatadogが開発した時系列予測のためのアートファウンデーションモデルの新たな状態である。 Totoは、観測可能性測定のために特別に調整された、初めての汎用時系列予測基盤モデルである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:18:40 GMT)
A Distributed ADMM-based Deep Learning Approach for Thermal Control in Multi-Zone Buildings under Demand Response Events [1.1]
本研究では,ADMMを用いた分散最適化と深層学習モデルを組み合わせて室内温度設定点を効果的に計画する。上層に中央建物コーディネータ、熱ゾーン層にローカルコントローラを備えた2層階層構造を用いる。提案するアルゴリズムはDistributed Planning Networksと呼ばれ、様々なタイプの建物に適応可能かつスケーラブルに設計されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:43:38 GMT)
Local Clustering for Lung Cancer Image Classification via Sparse Solution Technique [1.1]
重み付きグラフの頂点としてのイメージと,グラフのエッジとしてのイメージの対の類似性について検討する。私たちのアプローチは、他の最先端のアプローチと比較して、はるかに効率的で、好ましくないか、等しく効果的です。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:18:32 GMT)
Cybersecurity Defenses: Exploration of CVE Types through Attack Descriptions [1.0]
VULDATは、文変換器MPNETを使用して、攻撃記述からシステムの脆弱性を識別する分類ツールである。また,ATT&CKレポジトリから100件,CVEレポジトリから685件のアタック手法を適用した。以上の結果より,F1スコア0.85,精度0.86,リコール0.83,F1スコア0.83,F1スコア0.85,F1スコア0.86,F1スコア0.83,F1スコア0。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:28:51 GMT)
Maximal intrinsic randomness of a quantum state [1.0]
量子情報科学は、過去10年間に固有の、または秘密の量子ランダム性の研究で大きく進歩してきた。この問題は、条件最小エントロピー、条件フォン・ノイマンエントロピー、条件最大エントロピーの3つの異なるランダム性定量化器に答える。条件付きフォン・ノイマンエントロピーの場合、最大値は$H*= log_2d-S(rho)$, with $S(rho)$ フォン・ノイマンエントロピーは$rho$、条件付き最大エントロピーでは$となる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:16:35 GMT)
Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets [1.0]
カービ線形オブジェクトセグメンテーションは、様々なアプリケーションにおいて重要な役割を果たすが、この領域のデータセットは、しばしば小さなスケールに悩まされる。本稿では,カービリニアオブジェクトセグメンテーションデータセットを拡張するための新しいアプローチを提案する。本手法は,複数のテキスト特徴量からカービリニアオブジェクトを生成することによって,合成データの情報性が向上する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:25:26 GMT)
SALT: Introducing a Framework for Hierarchical Segmentations in Medical Imaging using Softmax for Arbitrary Label Trees [1.0]
本研究は, 解剖学的ランドマークの階層構造を地図化するために条件付き確率を利用するCT画像の新しいセグメンテーション手法を提案する。 The Cancer Imaging Archive (TCIA)のSAROSデータセットを用いて、893人の患者から900の身体領域を分離したモデルを開発した。 SAROS, CT-ORG, FLARE22, LCTSC, LUNA16, WORDなど,各種データセットのDiceスコアを用いて評価を行った。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:33:08 GMT)
Beyond Benchmarks: Evaluating Embedding Model Similarity for Retrieval Augmented Generation Systems [1.0]
RAGシステムのコンテキストにおける埋め込みモデルの類似性を評価する。 5つのデータセットで、プロプライエタリなモデルを含む埋め込みモデルのさまざまなファミリを比較します。プロプライエタリなモデルに対するオープンソース代替案を特定でき、MistralはOpenAIモデルに最もよく似ている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:24:16 GMT)
Digital twins to alleviate the need for real field data in vision-based vehicle speed detection systems [1.0]
正確な視覚に基づく速度推定は、レーダーやLiDARに基づく従来の手法よりもコスト効率が高い。ディープラーニングのアプローチは、利用可能なデータがないため、このコンテキストでは極めて限定的です。本研究では,CARLAシミュレータを用いたデジタルツインを用いて,特定の実世界のカメラの大規模なデータセットを生成することを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:41:20 GMT)
Asynchronous measurement-device-independent quantum digital signatures [1.0]
量子デジタルシグネチャ(QDS)は、量子状態をキー生成プロトコルによって分散し、測定し、古典的なデータ処理を通じてメッセージに署名する。本稿では,非同期2光子干渉戦略とワンタイムユニバーサルハッシュ法を備えた,非同期計測デバイス非依存(MDI)QDSプロトコルを提案する。本研究は,量子ネットワークにおける非再検討による大規模データ処理を実現するための,効率的かつ実用的なMDI-QDS方式を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:09:55 GMT)
Modeling and Suppressing Unwanted Parasitic Interactions in Superconducting Circuits [0.9]
超伝導量子ビットは、量子コンピュータ構築の最も有望な候補の一つである。この論文は、2ビットと3ビットの回路における結合量子ビット間の寄生相互作用に対処する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:07:45 GMT)
Angular Momentum Flows without anything carrying it [0.9]
2つの遠隔領域間で保存された量の移動は、一般的には比較的簡単なプロセスであると仮定される。我々は、ある領域から別の領域への角運動量の流れを、任意の粒子(または場)が存在するという驚くほど小さい確率で示している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:16:53 GMT)
Characterizing Translation-Invariant Bell Inequalities using Tropical Algebra and Graph Polytopes [0.9]
一次元幾何学における有限範囲相関器による変換不変(TI)ベルの不等式を特徴づける。驚いたことに、TI Bell のポリトープには、システムサイズに関して一様上界にできる極端点が多数存在する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:00:06 GMT)
Unveiling Disparities in Maternity Care: A Topic Modelling Approach to Analysing Maternity Incident Investigation Reports [0.9]
本研究は,母子関係調査報告の分析に自然言語処理技術を適用した。報告書には事前処理、セーフティ・インテリジェンス・リサーチの分類を用いた注釈、一般的なトピックを明らかにするためのトピックモデリングが実施された。この分析は、黒人、アジア、白人のイギリス民族に焦点を絞った異なる民族集団間のケアの格差を明らかにした。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:26:05 GMT)
Intelligent Multi-Document Summarisation for Extracting Insights on Racial Inequalities from Maternity Incident Investigation Reports [0.9]
医療では、毎年何千もの安全事故が発生するが、これらの事故から学ぶことは効果的に集約されない。本稿では,安全事故報告の集約と分析を容易にするためのフレームワークであるI-SIRch:CSを提案する。このフレームワークは、セーフティ・インテリジェンス・リサーチ(SIRch)の分類学を用いた概念アノテーションと、クラスタリング、要約、分析機能を統合する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:11:20 GMT)
Neural Networks Meet Elliptic Curve Cryptography: A Novel Approach to Secure Communication [0.8]
提案手法では,ニューラルネットワークフレームワークにおける非対称暗号の適用について検討する。盗聴の試みに対する通信セキュリティの有効性と堅牢性を調べるために、5つの異なる暗号鍵を用いている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:34:16 GMT)
Authenticity and exclusion: social media recommendation algorithms and the dynamics of belonging in professional networks [0.8]
ホモフィーは社会的相互作用に深く影響を与え、関連性、情報開示、社会交流のダイナミクスに影響を及ぼす。異なる会話コンテキストが頻繁に崩壊するソーシャルメディアプラットフォームの性質と設計は、これらのダイナミクスにどのように影響するのか? マイノリティグループによるプロ向けコンテンツの可視性の低下が示唆され,推奨アルゴリズムによって時間とともに悪化する傾向がみられた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:36:58 GMT)
Robust CATE Estimation Using Novel Ensemble Methods [0.8]
臨床治験における条件平均治療効果(CATE)の評価は治療効果の不均一性の理解に不可欠である。本研究は,多種多様なシナリオにまたがって,因果林や多種多様なメタラーナーなどの共通手法の性能を評価する。予測安定性と性能を向上させるために,複数の推定器を統合する2つの新しいアンサンブル手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:28:04 GMT)
Quantum-Train Long Short-Term Memory: Application on Flood Prediction Problem [0.8]
本研究は、量子機械学習(QML)により訓練された予測長短期記憶(LSTM)モデルに量子トレイン(QT)技術を適用した。 QTテクニックは、QHack 2024のA Matter of Tasteチャレンジで最初に成功したもので、トレーニング可能なパラメータの数を古典的ニューラルネットワーク(NN)のパラメータ数の多対数関数に還元するためにQMLを活用する。提案手法は,量子埋め込みを必要とせずに従来のデータを直接処理し,学習後の量子コンピューティングリソースとは独立に動作させる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:56:00 GMT)
Adaptive Smooth Non-Stationary Bandits [0.8]
我々は、報酬がスムーズに変化する、$Kの非定常バンディットモデルについて研究する。一般に、すべての$K,beta,lambda$に対してminimax動的後悔率を確立します。また,非定常帯域におけるギャップ依存的後悔率の高速化についても検討した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:37:15 GMT)
Helios: An extremely low power event-based gesture recognition for always-on smart eyewear [0.8]
本報告では,スマートアイウェアの日中使用を目的とした,非常に低消費電力でリアルタイムなイベントベースの手ジェスチャー認識システムであるHeliosを紹介する。 Heliosは微妙なマイクロジェスチャーやピンチなど7種類のジェスチャーを91%の精度で認識できる。また、60ミリ秒という極めて低いレイテンシで、20ユーザにわたるリアルタイムパフォーマンスを実演しています。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:33:53 GMT)
SciQu: Accelerating Materials Properties Prediction with Automated Literature Mining for Self-Driving Laboratories [0.8]
特定の属性を予測するために異なる材料特性を評価することは、材料科学に基づく応用の基本的な要件である。本研究は,機械学習を利用して材料特性を高精度かつ効率的に解析することにより,これらの課題に対処する。データ抽出を自動化し、抽出した情報を用いて機械学習モデルを訓練することにより、開発したSciQuは材料特性を最適化する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:12:46 GMT)
GPT-4 is judged more human than humans in displaced and inverted Turing tests [0.7]
毎日のAI検出は、オンライン会話における人とAIの差別化を必要とする。我々は、Turingテストの2つの修正版(反転と置換)を使って、人や大きな言語モデルがいかに差別化できるかを測定した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:28:24 GMT)
The Origin and Evolution of Information Handling [0.7]
本稿では、情報制御の開始過程と、生命の原始的な制御機構がいかに進化し、ますます洗練されていくかを説明する。化学計算における原始遷移を正確に記述することにより、上記のギャップを説明することができる。自由エネルギーの原理と互換性があるので、生命の起源から高レベルの認知までを記述できる計算エアクティビスト理論の枠組みを開発した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:49:50 GMT)
How Well Can a Long Sequence Model Model Long Sequences? Comparing Architechtural Inductive Biases on Long-Context Abilities [0.7]
システム工学の最近の進歩により、拡張コンテキスト長をサポートするために用意されたモデルのスケールアップが可能になった。このような主張は理論的に聞こえるかもしれないが、実証的に観察される大きな実践的ギャップが残っている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:08:39 GMT)
Missile detection and destruction robot using detection algorithm [0.7]
この研究は、バングラデシュでシステムを実装するための費用対効果の高いソリューションを見つけるために、世界の現在のミサイル検出技術とこれらの技術の分析に基づいている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 04:18:17 GMT)
Asynchronous Quantum Repeater using Multiple Quantum Memory [0.6]
本格的な量子ネットワークは、量子リピータの助けを借りて、遠隔地間の絡み合ったリンクの形成に依存している。単一光子干渉プロトコルと同じ効率を保った後マッチングの考え方を用いた量子リピータプロトコルを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:37:47 GMT)
Gated Ensemble of Spatio-temporal Mixture of Experts for Multi-task Learning in Ride-hailing System [0.6]
本研究では,畳み込みニューラルネットワーク (CNN) と畳み込みニューラルネットワーク (RNN) を併用したアンサンブルエキスパートネットワーク (GESME-Net) を開発し,タスクを同時に予測する。 i)北京の需要と需給を同時に予測し、(ii)成都と西安の需要を同時に予測する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:18:12 GMT)
RoboMorph: Evolving Robot Morphology using Large Language Models [0.6]
本稿では,モジュール型ロボットの設計を自動生成・最適化するRoboMorphを紹介する。自動プロンプト設計と強化学習に基づく制御アルゴリズムを統合することで、RoboMorphはフィードバックループを通じてロボット設計を反復的に改善する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:05:56 GMT)
Unveiling the Potential of BERTopic for Multilingual Fake News Analysis -- Use Case: Covid-19 [0.6]
BERTopicは文の埋め込み、次元の縮小、クラスタリング、トピック抽出で構成されている。本稿では,BERTopicの技術応用を実際に分析することを目的とする。また、実世界のデータに対するトピックモデリングの結果をユースケースとして分析することを目的とする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:47:43 GMT)
Data-driven Model Reduction for Soft Robots via Lagrangian Operator Inference [0.6]
この研究はモデル方程式のラグランジアンの性質を利用して、ラグランジアン作用素推論(英語版)を通して構造保存された線形減階モデルを導出する。ケーススタディでは、基礎となるラグランジアン構造を保存することは、予測精度が高く、未知の入力に対する堅牢性を持つ学習モデルをもたらすことが示されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:55:21 GMT)
Length independent generalization bounds for deep SSM architectures [0.6]
長距離シーケンスでトレーニングされた多くの最先端モデルは、状態空間モデル(SSM)とニューラルネットワークを組み合わせたシーケンシャルブロックで構成されている。我々は、安定したSSMブロックを持つこの種のアーキテクチャを保持でき、入力シーケンスの長さに依存しないPACバウンダリを提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:55:14 GMT)
PowerYOLO: Mixed Precision Model for Hardware Efficient Object Detection with Event Data [0.5]
PowerYOLOは、高メモリと計算複雑性のアルゴリズムを小さな低消費電力デバイスに適合させる問題に対して、混合精度のソリューションである。まず,低消費電力のセンサであるダイナミック・ビジョン・センサ(DVS)をベースとしたシステムを提案する。次に、4ビット幅のPowers-of-Two(PoT)量子化を提案する。第3に、そのような解のハードウェアアクセラレーションの効率を高めるために、乗算をビットシフトに置き換える。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:17:35 GMT)
Unified theory for joint covariance properties under geometric image transformations for spatio-temporal receptive fields according to the generalized Gaussian derivative model for visual receptive fields [0.5]
本研究では,時間的イメージ関係下での受容場からの出力と一致させるために,受容場のパラメータをどのように変換する必要があるかを示す。導出結合共分散特性が受容場応答を関連づけたり一致させたりすることができるかを示す幾何学的解析で結論付ける。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:19:52 GMT)
Confidence-based Estimators for Predictive Performance in Model Monitoring [0.5]
マシンラーニングモデルが本番環境にデプロイされた後、その予測パフォーマンスを監視する必要がある。近年,地中真実が得られない場合の予測性能を推定する新たな手法が開発されている。一般的な仮定では、平均信頼度(AC)法はモデル精度の偏りのない一貫した推定器であることが示される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:28:31 GMT)
Adaptive Deep Iris Feature Extractor at Arbitrary Resolutions [0.5]
分解能劣化は、高解像度画像で訓練されたディープラーニングモデルの認識性能を低下させる。我々のフレームワークには、異なる分解能劣化に特化した分解能専門家モジュールが含まれています。低解像度の専門家は、両方の専門家が共通のアイデンティティの特徴を抽出できるように、高解像度の専門家からの知識蒸留によって訓練される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:44:40 GMT)
SPOCKMIP: Segmentation of Vessels in MRAs with Enhanced Continuity using Maximum Intensity Projection as Loss [0.5]
本研究は,MIP(Maximum Intensity Projection)を付加的な損失基準として用いたセグメンテーション品質の向上に焦点をあてる。ラベルセグメンテーションのMIPを1つの(z軸)と3次元体積の複数の知覚可能な軸に組み込むことで2つの手法を提案する。提案手法は血管の連続性を改善したセグメンテーションを生成し,ROIの視覚的検査で明らかである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:39:24 GMT)
Brain Tumor Segmentation in MRI Images with 3D U-Net and Contextual Transformer [0.5]
本研究では,3D-UNetモデルとコンテキストトランスフォーマ(CoT)を併用したMRIにおける脳腫瘍の正確なセグメンテーションのための改良手法を提案する。提案モデルでは,CoTから腫瘍の質量特性を同期させ,特徴抽出を相互に強化し,詳細な腫瘍の質量構造を正確に把握する。いくつかの実験結果から,提案手法の優れたセグメンテーション性能が得られた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:04:20 GMT)
Towards Efficient Deployment of Hybrid SNNs on Neuromorphic and Edge AI Hardware [0.5]
本稿では,ニューロモルフィックとエッジコンピューティングの相乗的ポテンシャルを考察し,動的視覚センサが捉えたデータ処理に適した多目的機械学習(ML)システムを構築する。我々は、PyTorchとLavaフレームワークを使用して、スパイキングニューラルネットワーク(SNN)と人工ニューラルネットワーク(ANN)を混合してハイブリッドモデルを構築し、訓練する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:40:39 GMT)
Calibrating dimension reduction hyperparameters in the presence of noise [0.4]
t-SNE と UMAP は、性能を評価する際に信号とノイズの組み合わせとしてデータを認識できない。パープレキシティに対する事前の推奨値を示し、n_neighborsは小さすぎてノイズが過度に収まることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:27:19 GMT)
Ethics of Generating Synthetic MRI Vocal Tract Views from the Face [0.4]
本稿では,外部-内部相関モデル(E2ICM)の倫理的意義について考察する。 E2ICMは顔の動きを使って内部構成を推測し、MRIの費用対効果を支える技術を提供する。我々は、Pix2PixGANを用いて、外部の調音データから擬似MRIビューを生成し、このアプローチの有効性を実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:12:48 GMT)
QAOA Performance in Noisy Devices: The Effect of Classical Optimizers and Ansatz Depth [0.3]
量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、Near-term Intermediate-Scale Quantum Computer (NISQ)のための変分量子アルゴリズムである。本稿では,古典的ベクトルに対する現実的な騒音の影響について検討する。その結果,Adam と AMSGrads はショットノイズの存在下で最高の性能を示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:22:37 GMT)
A Comparison of Vulnerability Feature Extraction Methods from Textual Attack Patterns [0.2]
本稿では,サイバーセキュリティ研究者や実践者が攻撃抽出方法を選択するのを支援することを目的とする。 TF-IDF(Term Frequency-Inverse Document Frequency)は、他の4つの手法を75%、F1スコアが64%で上回る。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:31:15 GMT)
Ultra-dispersive resonator readout of a quantum-dot qubit using longitudinal coupling [0.2]
超伝導共振器に結合した量子ドットハイブリッド量子ビットのパラメトリック長手相互作用機構による読み出しを行う。本実験では, 量子力学の「超分散的」な状態において, 縦結合により半導体量子ビットの動作を促進できることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:11:12 GMT)
Natural Language Interaction with a Household Electricity Knowledge-based Digital Twin [0.2]
ドメイン固有のデジタルツインは、スマートグリッドの様々なセグメントのデジタルレプリカを表すもので、各セグメントをモデル化、シミュレート、制御することができる。本稿では,RAG (Retrieval Augmented Generation) 質問応答の可能性を初めて評価し,報告する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:05:37 GMT)
Proving that Cryptic Crossword Clue Answers are Correct [0.2]
「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:13:16 GMT)
On the attribution of confidence to large language models [0.1]
クレデンスは命題の信頼度に対応する精神状態である。信条の帰属に関する理論的根拠は不明である。 LLMがクリーデンスを持つとしても、クレデンス属性は一般的に偽である可能性は明らかである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:51:06 GMT)
Large Models of What? Mistaking Engineering Achievements for Human Linguistic Agency [0.1]
我々は,Large Language Models(LLM)の言語能力に関する主張は,少なくとも2つの根拠のない仮定に基づいていると主張している。言語完全性は、自然言語のような明瞭で完全なものが存在すると仮定する。データ完全性の仮定は、言語がデータによって定量化され、完全にキャプチャされるという信念に依存している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:06:01 GMT)
Latent Spaces Enable Transformer-Based Dose Prediction in Complex Radiotherapy Plans [0.1]
マルチレジオン肺SABRプランは複雑で、作成にかなりのリソースを必要とする。肺SABR計画の線量予測のための新しい2段階潜伏変圧器フレームワーク(LDFormer)を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:28:44 GMT)
Quantum gravity signatures in gravitational wave detectors placed inside a harmonic trap potential [0.1]
本研究は,高調波トラップ内にのみ設置された偏光と,入ってくる重力波と相互作用する重力波の一般重力波検出器について考察する。本モデルでは, 半古典的アナルージュに完全に欠落した単一重力子の自然放出を観測した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:02:54 GMT)
Toward accessible comics for blind and low vision readers [0.1]
我々は,既存のコンピュータビジョンと光学的文字認識技術を用いて,漫画のストリップ画像コンテンツから接地コンテキストを構築することを提案する。我々は,文字の出現,姿勢,気分,対話など,文脈対応のパネル記述による漫画の脚本を生成する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:50:25 GMT)
Transformer Circuit Faithfulness Metrics are not Robust [0.0]
回路の「忠実さ」を、モデルの計算の一部を損なうことによって測定する。既存の回路忠実度スコアは、研究者の方法論的選択と回路の実際の構成要素の両方を反映していると結論付けている。機械的解釈可能性の研究の最終的な目標は、ニューラルネットワークを理解することです。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:59:00 GMT)
eyeballvul: a future-proof benchmark for vulnerability detection in the wild [0.0]
eyeballvulは、大規模に言語モデルの脆弱性検出機能をテストするために設計されたベンチマークである。オープンソースのリポジトリで公開された脆弱性のストリームから、毎週、オープンソースとして公開され、更新されている。 eyeballvulには6,000以上のリビジョンと5,000以上のリポジトリに24,000以上の脆弱性があり、約55GBのサイズである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:46:21 GMT)
eUDEVS: Executable UML with DEVS Theory of Modeling and Simulation [0.0]
システム設計とプロトタイピングのためのモデリングとシミュレーション(M&S)は、今日では産業と学術の両方で行われている。本稿では,eUDEVSを用いた相互変換とDEVSの相互変換に対する統合的なアプローチを提案する。また、提案されたeUDEVSを、DEVS Unified Processと呼ばれるより大きな統一フレームワークに組み込んだ。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:29:46 GMT)
WineGraph: A Graph Representation For Food-Wine Pairing [0.0]
WineGraphはワインデータをその構造に組み込んだ異種グラフである。この統合により、味覚とソムリエ定義規則に基づく食品とワインのペアリングが可能になる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:12:48 GMT)
What should be observed for optimal reward in POMDPs? [0.0]
POMDP M が与えられた場合、固定予算内で M の観測能力をどう変えるべきか。位置戦略のみを考慮すると、一般には決定不可能であり、決定不可能であることを示す。まず,Mのマルコフ決定過程の最適戦略と,SMTを用いたパラメータ合成に基づく2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:48:48 GMT)
What Do People Think about Sentient AI? [0.0]
先進的AIの話題に関する全国的に代表的な調査データを提示する。 2021年のAIの幸福に対する心の認識と道徳的関心は、予想以上に高かった。我々は、AIが賢明になるかどうかに関わらず、議論そのものが人間とコンピュータのインタラクションをオーバーホールするかもしれないと論じる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:04:39 GMT)
Verificarlo CI: continuous integration for numerical optimization and debugging [0.0]
私たちはVerificarlo CIを紹介します。これは、開発過程でコードの数値最適化とデバッグのための継続的インテグレーションワークフローです。 Verificarlo CIが2つのテストケースアプリケーションに適用可能であることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:01:08 GMT)
Training toward significance with the decorrelated event classifier transformer neural network [0.0]
自然言語処理では、主要なニューラルネットワークアーキテクチャの1つがトランスフォーマーである。この訓練されたネットワークは、強化された決定木やフィードフォワードネットワークよりも優れた性能を発揮することが判明した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:50:17 GMT)
Towards Explainable Evolution Strategies with Large Language Models [0.0]
本稿では,自己適応的進化戦略(ES)と大規模言語モデル(LLM)を統合するアプローチを提案する。我々は、フィットネスの進化、ステップサイズの調整、停滞によるイベントの再スタートなど、最適化の旅の詳細なログを収集する。 LLMを使用してこれらのログを処理し、簡潔でユーザフレンドリーな要約を生成する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:28:27 GMT)
Toward a physically motivated notion of Gaussian complexity geometry [0.0]
ガウス状態に対する回路複雑性の幾何学的概念を構築する。複雑性の尺度における時間反転対称性の破れについて説明する。これにより、量的、幾何学的な複雑性の概念を構築するための第一歩が確立される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 22:32:01 GMT)
Theory of quasiparticle-induced errors in driven-dissipative Schrödinger cat qubits [0.0]
そこで我々は,Schr"odinger cat qubitsにおけるボゴリボフ準粒子の残留効果について検討した。 Schr"odinger cat qubits は非平衡条件下で操作される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:26:16 GMT)
Tamil Language Computing: the Present and the Future [0.0]
言語コンピューティングは言語学、コンピュータ科学、認知心理学を統合し、有意義な人間とコンピュータの相互作用を作り出す。近年のディープラーニングの進歩により、コンピュータはよりアクセスしやすくなり、独立した学習と適応が可能になった。この論文は、日常的なコミュニケーションニーズに対応するために、Tamilのような言語のための実用的なアプリケーションを構築することの重要性を強調している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:56:02 GMT)
Survey on Fundamental Deep Learning 3D Reconstruction Techniques [0.0]
本調査は,写真リアルな3Dモデルとシーンを生成する基礎的深層学習(DL)に基づく3D再構成技術について検討することを目的とする。我々は、基礎となるアルゴリズムを識別し、その強みとトレードオフを評価し、この急速に発展する分野における将来の研究軌道を計画する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:30:05 GMT)
Spine Vision X-Ray Image based GUI Planning of Pedicle Screws Using Enhanced YOLOv5 for Vertebrae Segmentation [0.0]
椎骨切開による脊椎スクリューの正確な配置のための術前計画と術中指導の改善を目的とした革新的なGUIを提案する。 Spine-Visionは、同期AP-LP計画、脊椎セグメンテーションによる正確なスクリュー位置決め、効果的なスクリュー可視化、動的位置調整などの革新的な機能を備えた包括的なソリューションを提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:59:43 GMT)
Sensitivity of Photovoltaic Cells Efficiency to Initial Conditions in Various Aggregation Designs [0.0]
バンドギャップ工学のアグリゲーション誘起特性と量子効果のキャラクタリゼーションにより、電力の増強は35.87%まで増加する。この奨励的な傾向は、自然を模倣する太陽光発電装置の設計に有望な新しい側面を示唆している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:57:25 GMT)
Semi-Supervised Multi-Task Learning Based Framework for Power System Security Assessment [0.0]
本稿では,Semi-Supervised Multi-Task Learning (SS-MTL) を用いた,電力系統の動的セキュリティ評価のための新しい機械学習フレームワークを開発する。提案フレームワークの基盤となる学習アルゴリズムは条件付きマスク付きエンコーダを統合し,マルチタスク学習を用いて特徴表現を分類する。 IEEE 68-busシステムに関する様々な実験を行い,提案手法の有効性を検証した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 22:42:53 GMT)
Self-training Language Models for Arithmetic Reasoning [0.0]
新たなデータを必要としない言語モデルの能力向上の可能性を探る。モデルは単一ラウンド(オフライン)とオンラインの自己学習の両方で大幅に改善できることがわかった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:06:05 GMT)
Rule-Based, Neural and LLM Back-Translation: Comparative Insights from a Variant of Ladin [0.0]
本稿では,Ladin の機械翻訳,特に Val Badia 変種に対する逆翻訳アプローチの違いが与える影響について検討する。この言語で利用可能な並列データ(18k Ladin-Italian文ペアのみ)が限られていることを考慮し、ラディン-Italian向けに微調整された多言語ニューラルマシン翻訳モデルの性能について検討する。実験により、この低リソースシナリオにおいて、全てのアプローチが同等の翻訳品質を実現するが、ラウンドトリップ変換はモデル性能の違いを浮き彫りにすることを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:05:43 GMT)
Robotic Control via Embodied Chain-of-Thought Reasoning [0.0]
学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:31:01 GMT)
Reductive Quantum Phase Estimation [0.0]
量子ビット数が少ない任意の位相の集合と、ユニタリな応用を区別する回路を示す。測定精度と位相差のトレードオフを示し、回路を特定の用途に最適に調整できるようにする。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:31:49 GMT)
Reducing the Resources Required by ADAPT-VQE Using Coupled Exchange Operators and Improved Subroutines [0.0]
ハードウェア上でのADAPT-VQEを計測回数と回路深度で動作させるコストについて述べる。また、最先端のCEOであるADAPT-VQEは、最も広く知られている静的VQEアンサッツであるUCCSDより優れています。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:31:30 GMT)
RAGAR, Your Falsehood Radar: RAG-Augmented Reasoning for Political Fact-Checking using Multimodal Large Language Models [0.0]
我々は、RAGの連鎖(CoRAG)とRAGの木(ToRAG)の2つの新しい推論手法を紹介する。彼らは、テキストコンテンツと画像コンテンツの両方を抽出し、外部情報を取得し、その後の質問を事前の証拠に基づいて推論することで、マルチモーダルクレームを事実チェックする。人間の評価は、生成した事実確認説明の大部分は、金標準データから得られるすべての情報を含んでいることを確認します。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:16:09 GMT)
Quantum many-body thermal machines enabled by atom-atom correlations [0.0]
超低温原子ガス中の2次原子-原子相関により直接動作可能な量子多体熱機械のクラスについて検討する。熱機関, 冷凍機, 熱加速器, ヒーターなど, これらの熱機械を意図した状態に作動させることは, 原子と原子の相関がなければ不可能であることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:49:01 GMT)
Quantum Thermodynamic Integrability for Foundations of Statistical Physics [0.0]
第二法則のカラスエオディ原理を、マクロ変数に依存するエネルギー準位を持つ量子熱力学に拡張する。この拡張は量子熱力学積分(QTI)の概念を導入し、統計力学の代替基盤を提供する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:50:39 GMT)
Quantum Curriculum Learning [0.0]
本稿では,量子データのための量子カリキュラム学習(Q-CurL)というフレームワークを提案する。 Q-CurLは、より難しいタスクに進む前に、学習モデルに単純なタスクやデータを導入します。実証的な証拠は、Q-CurLが一元学習タスクの訓練収束と一般化を著しく促進することを示している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:42:23 GMT)
Protein intrinsic disorder prediction using Attention U-Net and ProtTrans protein language model [0.0]
この論文は、意図的U-Net畳み込みニューラルネットワークに基づく、新しいタンパク質内在性障害予測器であるDunctionUnetLMを前文として紹介する。これは、MSAを用いたflDPnnおよびIDP-CRF予測器と、同じProtTransモデルの特徴を用いたSETH予測器との直接比較において、上位結果を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:41:51 GMT)
Probing spontaneously symmetry-broken phases with spin-charge separation through noise correlation measurements [0.0]
自発的に対称性を破る相は局所的に秩序づけられた物質の状態である。本稿では,原子雲の弾道膨張後の雑音の統計的相関に基づく代替手法を提案する。数値解析により,これらのSSB相の存在を正確に把握できることが示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:19:10 GMT)
Predicting properties of quantum systems by regression on a quantum computer [0.0]
本稿では,量子特性の予測にデータに依存しない手法を提案する。我々は、(i)パラメータ化チャネルの出力状態、(ii)2ビット状態の絡み合い、(iii)パラメータ化ハミルトン状態のパラメータを基底状態とする学習において、我々のアプローチを数値的に検証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:06:08 GMT)
Performance Evaluation of Hashing Algorithms on Commodity Hardware [0.0]
本稿では,一般的なハッシュアルゴリズムBlake3,SHA-256,SHA-512の性能評価を行う。これらのハッシュアルゴリズムは、デジタル署名、メッセージ認証、パスワードストレージなど、様々なアプリケーションで広く使われている。評価の結果、Blake3はスループットとレイテンシの点でSHA-256とSHA-512の両方を上回っている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:31:02 GMT)
Paving the way toward foundation models for irregular and unaligned Satellite Image Time Series [0.0]
ALIgned Sits (ALISE) を提案する。 SITSで現在利用可能なSSLモデルとは異なり、ALISEはSITSを共通の学習された時間的プロジェクション空間に投影するための柔軟なクエリメカニズムを組み込んでいる。 PASTIS, 土地被覆区分 (MultiSenGE) , 新たな作物変化検出データセットの3つの下流課題を通じて, 生産された表現の質を評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:42:10 GMT)
Particle Swarm Optimization based on Novelty Search [0.0]
そこで本研究では,N yetty Searchと組み合わせたParticle Swarm Optimizationアルゴリズムを提案する。この方法は、客観的な自由であるノベルティサーチによって制御されるため、ローカルオプティマではブロックされない。一連の実験により、複素最適化テスト関数に対する現在のアルゴリズムの堅牢性と有効性が証明された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:00:01 GMT)
On Kirkwood--Dirac quasiprobabilities and unravelings of quantum channel assigned to a tight frame [0.0]
与えられた強フレームのベクトルを使って主クラウス作用素を構築すると、興味深い性質を持つ準確率が生成される。固有値の位置を特徴付けるための新しい不等式が導出される。提示された不等式の効用は、次元2における対称的な情報的完備な測定で例示される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 06:25:49 GMT)
Nonlocal Locking of Observable Quantities: A Faithful Signature of Nonclassical Correlations [0.0]
本稿では,多部量子状態における非古典的相関を解析するための一般的な枠組みを提案する。我々は、観測可能な量の非局所ロックと呼ばれる興味深い現象を明らかにし、観測可能な量の値は非古典的な状態の相関でロックされる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:38:51 GMT)
Non-maximal entanglement of photons from positron-electron annihilation demonstrated using a novel plastic PET scanner [0.0]
現在のPETシステムは、陽電子放出放射性同位元素を標識した分子を、消滅から2つの光子の伝播方向を検出することによって追跡している。ここでは, プラスチックシンチレータを用いた新しいJ-PETスキャナについて述べる。多孔質高分子では、光子偏光相関は最大エンタングルド光子よりも弱いが、分離可能な光子よりも強いことが示される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:01:31 GMT)
Network quantum steering enables randomness certification without seed randomness [0.0]
複数のソースを持つ量子ネットワークは、入力なしで量子非局所性の観測を可能にする。古典的に相関する可能性のある2つのソースを持つ2つのパーティでさえ、量子非局所性の形式を見ることができることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:45:37 GMT)
Mirror-induced effects in cavity polaritonics: influence on edge states [0.0]
チェーンに横切る方向の鏡は効果的な欠陥として作用し,Tamエッジ状態の出現につながる可能性が示唆された。トポロジカル連鎖を考えると、このような横ミラーは強い光-物質結合の影響からエッジ状態を保護できることを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:08:20 GMT)
Manipulating a Tetris-Inspired 3D Video Representation [0.0]
ビデオアルゴリズムは、ビデオ内の活動を保存する方法でビデオ圧縮を実行する技術である。異なるアプリケーションに適した異なるオブジェクト時間データ表現について論じる。本稿では,ビデオ合成の問題を解決するために,パッキングアルゴリズムの適用について検討する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 22:41:14 GMT)
Majorana Tensor Decomposition: A unifying framework for decompositions of fermionic Hamiltonians to Linear Combination of Unitaries [0.0]
量子コンピュータ上で演算子を符号化する主要なツールの1つとして、LCU(Linear combination of Unitary)分解が出現している。特に、LCUアプローチは、電子構造ハミルトニアンから量子回路に情報を符号化する方法を示す。ここでは、既存のLCUを統一し、新しい分解方法を提供するフレームワークであるMajorana Decomposition(MTD)を紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:37:45 GMT)
Leveraging GPT for the Generation of Multi-Platform Social Media Datasets for Research [0.0]
ソーシャルメディアデータセットは、偽情報、影響操作、ソーシャルセンシング、ヘイトスピーチ検出、サイバーいじめ、その他の重要なトピックの研究に不可欠である。これらのデータセットへのアクセスは、コストとプラットフォーム規制のために制限されることが多い。本稿では,複数のプラットフォームにまたがって,語彙的および意味論的に関連するソーシャルメディアデータセットを作成するための,大規模言語モデルの可能性について検討する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:12:39 GMT)
Learning a quantum channel from its steady-state [0.0]
本研究では,その定常状態である単一状態上で測定された局所的な期待値を用いて,局所的な量子チャネルを学習するスケーラブルな方法を提案する。成功するためには、定常状態は非自明でなければならないので、チャネルは非単体である必要がある。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:14:38 GMT)
Learning Localization of Body and Finger Animation Skeleton Joints on Three-Dimensional Models of Human Bodies [0.0]
本研究は,人体の3次元モデル内での人体と指のアニメーションの骨格関節の位置決め問題に対する,そのような解決法を提案する。提案手法を最先端技術と比較することにより,より単純なアーキテクチャで極めて優れた結果が得られることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:16:02 GMT)
Korean Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0]
韓国のレストランレビューに対するアスペクトベース感性分析(ABSA)の調査は特に欠落している。韓国語などの低リソース言語におけるABSAの直感的で効果的なフレームワークを提案する。英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:08:36 GMT)
Knowledge distillation to effectively attain both region-of-interest and global semantics from an image where multiple objects appear [0.0]
オブジェクト検出タスクでは、食品のほとんど無限のカテゴリを正確にローカライズし、分類するのは難しい。我々は、ROI、外ROI、統合モジュールからなる新しいタイプの複合アーキテクチャRveRNetを紹介します。 RveRNetのF1スコアは、曖昧な食品画像の分類において、他の個々のモデルよりも10%良かった。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 07:57:33 GMT)
Investigating the evolution of quantum entanglement of a qubit-qubit system with Dzyaloshinskii-Moriya interaction in the presence of magnetic fields [0.0]
本稿では、等方性XXXハイゼンベルクおよび異方性XYZモデルにおける量子量子量子ビット化合物系の量子エンタングルメントダイナミクスについて検討する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:00:42 GMT)
Intrinsic mixed-state SPT from modulated symmetries and hierarchical structure of anomaly [0.0]
開量子系における固有対称性を保護した位相混合状態のクラスを導入する。 mSPT相は熱平衡下でのギャップを持つハミルトンの基底状態として実現できない。純状態と混合状態の両方における境界異常の階層構造を詳細に比較する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:01:37 GMT)
Interventions Against Machine-Assisted Statistical Discrimination [0.0]
信念が検証可能であれば、統計的差別に対する介入は、肯定的な行動のような信念のないデザインを超えることができる。信念の介入設計に関する私の理論は、機械学習を規制する影響力のある方法に光を当てている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:01:41 GMT)
Interpolating Parametrized Quantum Circuits using Blackbox Queries [0.0]
本稿では、(三角法)を用いたパラメタライズド量子回路のための古典的サロゲートの開発に焦点をあてる。このようなサロゲートを構築するための2つのアルゴリズムを開発し、性能保証を証明する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:16:25 GMT)
Inflationary Flows: Calibrated Bayesian Inference with Diffusion-Based Models [0.0]
本稿では,拡散モデルを用いてベイズ推定を行う方法を示す。本稿では,新しいノイズスケジュールを用いて,標準的なDBMトレーニングを通じてそのようなマップを学習する方法を示す。その結果は、低次元の潜在空間上で一意に定義される非常に表現性の高い生成モデルのクラスである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:58:19 GMT)
Improving Dental Diagnostics: Enhanced Convolution with Spatial Attention Mechanism [0.0]
本稿では,SimAMアテンションモジュールと統合されたResNet50アーキテクチャを改良し,歯科画像における限られたコントラストの課題に対処する。本モデルでは,F1スコアの0.676を達成し,様々な特徴抽出技術に対して優れた性能を示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 01:12:30 GMT)
Hyperfine-to-rotational energy transfer in ultracold atom-molecule collisions [0.0]
原子-分子衝突における異なる機械的自由度間のエネルギー移動は、広く研究され、広く理解されている。ここでは,原子超微粒子から分子回転へのエネルギー移動を直接観察した。観測により、スピンが短距離での機械的回転と結合していることが確認され、将来の理論研究のためのベンチマークが確立される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 23:20:14 GMT)
How more data can hurt: Instability and regularization in next-generation reservoir computing [0.0]
我々は、この現象のより極端なバージョンが、力学系のデータ駆動モデルに現れることを示した。トレーニングデータの多いフローマップの表現がより良くなったにもかかわらず、NGRCは不条件の積分器を採用でき、安定性を損なうことが判明した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:22:13 GMT)
How does Burrows' Delta work on medieval Chinese poetic texts? [0.0]
Burrows' Deltaは2002年に導入され、著者帰属のための効果的なツールであることが証明されている。デルタ法が中国語のテキストに与える影響を分析する研究は、ヨーロッパ語のテキストよりも少ない。唐代の詩人はデルタで正しく識別され、ヨーロッパ標準語で書かれた著者の実証的なパターンが再び確認されている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:07:14 GMT)
Hilbert space fragmentation imposed real spectrum of non-Hermitian systems [0.0]
我々は、強いヒルベルト空間の断片化とある種の大域対称性の存在によって課される制約が、非エルミート量子系の固有スペクトルの現実を確実にすることを示した。相互作用する2つの有限鎖、すなわちフェルミオン型ネルソン-ハターノとSu-シュリーファー-ヘーガー模型に対するこの洞察を実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:43:59 GMT)
Hilbert space fragmentation from lattice geometry [0.0]
ヒルベルト空間の断片化は、領域壁の数を保存するスピン-1/2モデルの格子幾何学から生じる可能性があることを示す。また,第2世代ヘキサフレークフラクタル格子と修正2次元格子の断面に,ヒルベルト空間のフラグメンテーションに類似したシグネチャが現れることを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:29:16 GMT)
Highway Networks for Improved Surface Reconstruction: The Role of Residuals and Weight Updates [0.0]
我々は,多層パーセプトロンの文脈内で,Square-Highway(SqrHw)と呼ばれるハイウェイネットワーク(Hw)の新たな変種を導入する。我々は、SqrHwが欠落したデータよりも表面を予測できる能力を実証する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 02:15:21 GMT)
High-fidelity detection of large-scale atom arrays in an optical lattice [0.0]
我々は, サイフス冷却によるストロンチウム原子の高密度イメージングを実演した。我々は、最大399ドルのツイーザーを持つ大規模ツイーザーアレイの原子のピンニング電位として光学格子を用いる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:10:18 GMT)
High-Precision, Fair University Course Scheduling During a Pandemic [0.0]
本稿では、コース配信モードの拡張分類法を提案し、整数プログラムを示し、コーススケジューリングアルゴリズムを開発する。我々のアプローチは、教室で各コースセクションの特定の一部が実行されることを保証することで公平である。フェアネスと同時出席の原理に基づくアルゴリズムは、パンデミック時と通常時の大学コーススケジュールを大幅に改善することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:56:00 GMT)
Hawking radiation and the Landauer Principle [0.0]
ホーキングブラックホールの蒸発がランダウアーの熱力学の原理を飽和させることを示す。以上の結果から,ホーキング蒸発時にブラックホールが経験した情報損失は可能な限り効率的に発生することが示唆された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:00:02 GMT)
Have We Reached AGI? Comparing ChatGPT, Claude, and Gemini to Human Literacy and Education Benchmarks [0.0]
AIの最近の進歩、特に大規模言語モデル(LLM)では、人工知能(AGI)に近づいたことについて疑問が持ち上がっている。この研究は、米国国勢調査局と技術レポートのデータを用いて、教育ベンチマークにおけるLCMのパフォーマンスとアメリカの平均的な教育成績と識字率を比較した。その結果、LLMは、学部生の知識や高度な読書理解といったタスクにおいて、人間のベンチマークを著しく上回り、AGIへのかなりの進歩を示していることがわかった。この研究はAI開発、教育、社会への影響を強調し、継続的な研究と倫理的考察の必要性を強調している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:38:40 GMT)
Hamiltonian simulation in Zeno subspaces [0.0]
ハミルトンシミュレーションのための量子アルゴリズムの設計と解析の枠組みとして量子ゼノ効果について検討する。本研究では, アシラ量子ビットレジスタの頻繁なプロジェクティブ測定により, ターゲット量子ビットレジスタ上の量子力学を, ランダム化アプローチと類似した回路複雑度でシミュレートできることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:30:06 GMT)
Graph convolutional network for predicting abnormal grain growth in Monte Carlo simulations of microstructural evolution [0.0]
我々は異常粒成長のモンテカルロシミュレーションの大規模なデータセットを生成する。簡単なグラフ畳み込みネットワークをトレーニングし、どの初期構造が異常な粒成長を示すかを予測する。グラフニューラルネットワークはコンピュータビジョン法より優れており、予測精度は73%、偽陽性は少ない。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:45:01 GMT)
Gaussian process interpolation with conformal prediction: methods and comparative analysis [0.0]
本稿では、ガウス過程(GP)における共形予測法(CP)の活用を提唱する。 CP法は予測間隔を調整でき、不確実性が向上し、基礎となるGPモデルの精度が維持される。数値実験により、CP法が精度を損なうことなくキャリブレーションを改善する効果が示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:15:57 GMT)
GUI-based Pedicle Screw Planning on Fluoroscopic Images Utilizing Vertebral Segmentation [0.0]
提案した研究は、主に術中ペダルスクリュー計画のために設計された新しいGUI(Graphical User Interface)フレームワークを確立する。 GUIフロントエンドには、外科医や医療従事者がAP画像やLP画像上でペダルスクリューを効率的に選択、設定、動的に操作できる機能が含まれている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:55:42 GMT)
Full quantum tomography of top quark decays [0.0]
高エネルギー物理過程における量子トモグラフィは通常、スピン自由度に制限されている。ここでは、軌道角運動量(L$)と$W$と$b$のスピンが54次元の$LWb$の密度演算子に絡み合うような、トップクォーク崩壊が$tからWb$の場合に対処する。 L$と$W$または$b$のスピンの間の絡み合いは大きいので、ラン2のデータを持つ大型ハドロン衝突型加速器で生成された1つのトップクォークの崩壊について決定することができる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:09:59 GMT)
Flex-TPU: A Flexible TPU with Runtime Reconfigurable Dataflow Architecture [0.0]
この作業はFlex-TPUと呼ばれる再構成可能なデータフローTPUの開発で構成されており、実行時に層ごとのデータフローを動的に変更することができる。その結果,Flex-TPUの設計は従来のTPUに比べて2.75倍の大幅な性能向上を実現している。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 17:33:38 GMT)
Fine-Tuning Stable Diffusion XL for Stylistic Icon Generation: A Comparison of Caption Size [0.0]
安定拡散XLの微調整法について述べる。また、“高品質”が何であるかを適切に定義することがいかに重要であるかも示します。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:55:20 GMT)
Finding Quantum Codes via Riemannian Optimization [0.0]
本稿では、既知の量子ノイズチャネルに対して最適に修正可能な部分空間符号を求めるための新しい最適化を提案する。各候補部分空間コードに対して、コードが完全に修正可能であるかのように、まずユニバーサルリカバリマップを関連付けます。完全修正可能な符号が見つからないとき、第二の最適化ルーチンが回復クラス写像上で実行され、また適切なスティーフェル多様体でパラメータ化される。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:03:41 GMT)
Fault Diagnosis in Power Grids with Large Language Model [0.0]
本稿では,Large Language Models (LLMs) を利用して,故障診断精度と説明可能性を向上させる手法を提案する。我々は、複雑なデータの解釈においてLLMを導くために、包括的でコンテキスト対応のプロンプトを設計した。実験により,診断精度,説明可能性品質,応答コヒーレンス,文脈理解の大幅な改善が示された。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:44:18 GMT)
Event-based vision on FPGAs -- a survey [0.0]
フィールドプログラマブルゲートアレイ(FPGA)は、高速なデータ処理(リアルタイムでも)とエネルギー効率を実現している。本稿では、FPGAがイベントデータを処理するために様々な文脈で使われている、最も重要な研究の概要について述べる。フィルタリング、ステレオビジョン、光学フロー、オブジェクト分類のためのAIベースのアルゴリズムの加速、検出と追跡、ロボット工学および検査システムにおける応用などである。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:07:44 GMT)
Evaluating Large Language Models with Grid-Based Game Competitions: An Extensible LLM Benchmark and Leaderboard [0.0]
我々は,Tic-Tac-Toe,Connect Four,Gomokuなどのグリッドベースのゲームを通じて,大規模言語モデル(LLM)の新たなベンチマークを導入する。 GitHubで利用可能なオープンソースのゲームシミュレーションコードにより、LSMは、詳細なデータファイルと競合し、生成することができる。本稿では,Orthropic の Claude 3.5 Sonnet と Claude 3 Sonnet,Google の Gemini 1.5 Pro と Gemini Flash,OpenAI の GPT-4 Turbo と GPT-4o,Meta の Llama3-70B などの主要な LLM のゲーム結果を紹介する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 03:46:35 GMT)
Estimation of spatio-temporal extremes via generative neural networks [0.0]
利用可能なデータが少ない空間的極端を解析するための統一的なアプローチを提供する。生成ニューラルネットワークの最近の発展を活用して、完全なサンプルベースの分布を予測する。提案手法は,複数のシミュレーションされた最大安定過程を適合させて検証し,高精度なアプローチを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:57:17 GMT)
Entropic distinguishability of quantum fields in phase space [0.0]
位相空間における量子場配置のエントロピー不確かさを定量化する手法を提案する。提案手法は関数型 Husimi $Q$-distribution と好適に選択された相対エントロピーに基づく。量子相転移における不確実性原理の役割を定量的に解釈する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 16:59:58 GMT)
Efficient characterization of qudit logical gates with gate set tomography using an error-free Virtual-Z-gate model [0.0]
クアディットに対してより効率的な GST アプローチを提案し、キュディット・アダマールと仮想Zゲートを用いてフィデューシャルを構築する。提案手法は,評価結果の計算コストを削減し,GSTの大規模化を図る。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:40:53 GMT)
Effects of stickiness on the quantum states of strongly chaotic open systems [0.0]
キックされたローターの標準写像を考察し、閉じた古典写像の強いカオス状態において、粘着性の領域が生き残ることを検証する。系の位相空間を漏れで走査することにより、量子系の状態の局所化の程度に粘性がどのように影響するかを分析する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:00:03 GMT)
Dynamics of Gender Bias within Computer Science [0.0]
ACM SIGは1970年から2000年にかけて拡大し、それぞれが女性作家を増やした。いくつかのSIGには10%未満の女性作家がおり、SIGUCCSは40%を超えた。 3つのSIGは女性作家の成長を加速させ、ACMを含むほとんどが成長を加速させた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:14:21 GMT)
Dynamically corrected gates in silicon singlet-triplet spin qubits [0.0]
我々はSi/SiGe二重量子ドットで実現されたシングルトリップキュービットにおける超微細ノイズを軽減するために設計された補正ゲートを実験的に実装した。修正されたゲートは不忠実度を約3倍に減らし、その結果、アイデンティティとアダマールゲートの両方で0.99以上となる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:52:07 GMT)
Dunkl-Schrödinger equation with time-dependent harmonic oscillator potential [0.0]
時間依存質量と周波数を持つ1次元および3次元高調波発振器の波動関数の明示的な形式を決定する。不変式と補助方程式のパリティ依存式を導出する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 14:18:24 GMT)
Direct Measurement of Microwave Loss in Nb Films for Superconducting Qubits [0.0]
ニオブ膜は現代の2次元超伝導量子ビットの重要な構成要素である。我々は,HiPIMS法により作製したニオブ薄膜のマイクロ波消散が,バルクニオブSRFキャビティの高内在的品質因子に類似していることを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 20:43:45 GMT)
Differentiating between human-written and AI-generated texts using linguistic features automatically extracted from an online computational tool [0.0]
本研究の目的は,AIが人間の文章をエミュレートする能力を評価することにある。人間の発話を模倣したAI生成テキストが現れるにもかかわらず、結果は複数の言語的特徴に有意な差が認められた。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:56:01 GMT)
Description of the hydrogen atom and the He+ ion in an optical cavity using the Pauli-Fierz Hamiltonian [0.0]
光キャビティ内のクーロン電位における1つの電子の系は、テンソル生成光マターベースを用いて解決される。キャビティサイズがエネルギーレベルおよび高調波発生スペクトルに及ぼす影響について検討した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 15:56:54 GMT)
Deep Learning for Network Anomaly Detection under Data Contamination: Evaluating Robustness and Mitigating Performance Degradation [0.0]
ディープラーニング(DL)は、サイバーセキュリティのためのネットワーク異常検出(NAD)において重要なツールとして登場した。異常検出のためのDLモデルはデータから特徴や学習パターンを抽出するのに優れているが、データ汚染には弱い。本研究では,データ汚染に対する6つの教師なしDLアルゴリズムのロバスト性を評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:47:37 GMT)
Cyber Attacks on Maritime Assets and their Impacts on Health and Safety Aboard: A Holistic View [0.0]
この研究は、より総合的な視点からこれらの攻撃がもたらす可能性を探究する。オフショア油田、オフショア風力発電所、自律型船舶などのリスクの高い資産に重点を置いている。攻撃シナリオ、攻撃ベクトル、およびそれらの物理的結果について議論した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:20:36 GMT)
Chunking: Continual Learning is not just about Distribution Shift [0.0]
チャンキングはCLの重要な部分であり、オフライン学習によるパフォーマンス低下の約半分を占めています。現在のCLアルゴリズムはチャンキングサブプロブレムに対処せず、データ分布に変化がない場合にのみ、通常のSGDトレーニングを実行する。チャンキングサブプロブレムの性能は向上し,本性能は全CL設定に遷移することを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:13:38 GMT)
Challenges in Mechanistically Interpreting Model Representations [0.0]
機械的解釈可能性(MI)は、ニューラルネットワークが学習する正確なアルゴリズムをリバースエンジニアリングすることで、AIモデルを理解することを目的としている。これまでのMIにおけるほとんどの研究は、自明でトークンに整合した振る舞いと能力を研究してきた。我々は特徴と行動の表現を形式化し、その重要性と評価を強調し、Mistral-7B-Instruct-v0.1における不完全表現の探索的研究を行う。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:21:59 GMT)
CXR-Agent: Vision-language models for chest X-ray interpretation with uncertainty aware radiology reporting [0.0]
胸部X線解釈のための基礎的視覚言語モデルとして, 一般に公開されている技術の現状を評価した。視覚言語モデルは、しばしば自信のある言語と幻覚し、臨床解釈を遅くする。我々は,CheXagentの線形プローブとBioViL-Tのフレーズグラウンドティングツールを用いて,エージェントベースの視覚言語によるレポート生成手法を開発した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:39:19 GMT)
Brief state of the art in social information mining: Practical application in analysis of trends in French legislative 2024 [0.0]
本稿では、ソーシャルメディアマイニングにおける最先端技術の概要と、2024年のフランス議会選挙におけるトレンド分析の実践的応用について述べる。我々は、自然言語処理(NLP)ツールを利用して、AgoraVoxプラットフォームからコメントや反応を抽出し分析することで、世論を測る。研究によると、マリネ・ル・ペン率いる国民ラリー党はソーシャルメディアに高いレベルの関与を保ち、伝統的政党を上回っている。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:22:58 GMT)
Bi-reachability in Petri nets with data [0.0]
トークンが無限のデータ領域から値を運ぶ平らなペトリネットの拡張であるデータを用いてペトリネットを調査する。それぞれの構成が他方から到達可能かどうかを問う。これは決定可能性の境界線を推し進める。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 11:52:23 GMT)
Benchmarking quantum computers [0.0]
優れたベンチマークによって、科学者、エンジニア、プログラマ、ユーザは、コンピュータシステムのパワーを理解することができます。悪いベンチマークは研究を誤って誘導し、進歩を阻害する。ベンチマークとベンチマークの役割と、優れたベンチマークがいかに進歩を駆動し、測定できるかについて論じる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 19:25:30 GMT)
Arrival Times Versus Detection Times [0.0]
検出時間の確率分布を計算する方法は、長い間議論されてきた問題である。 Das と D"urr がスピンの場合の検出時間の分布として提示した特定の分布が、実際にボヘミア力学が予測するものではない理由を説明する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 13:20:42 GMT)
Are Large Language Models Really Bias-Free? Jailbreak Prompts for Assessing Adversarial Robustness to Bias Elicitation [0.0]
大規模言語モデル(LLM)は人工知能に革命をもたらし、卓越した計算能力と言語能力を示している。これらのモデルは本質的に、トレーニングデータから生じる様々なバイアスに起因している。本研究は,近年のLCMの応答におけるこれらのバイアスの存在について検討し,その公正さと信頼性への影響を分析した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 12:30:19 GMT)
Approximating G(t)/GI/1 queues with deep learning [0.0]
待ち行列理論の問題を解くために教師付き機械学習手法を適用する。 G(t)/GI/1 の系における数の過渡分布を推定する。我々はこれらの分布を高速かつ正確に予測するニューラルネットワーク機構を開発する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 05:25:45 GMT)
An Attempt to Devise a Pairwise Ising-Type Maximum Entropy Model Integrated Cost Function for Optimizing SNN Deployment [0.0]
スパイキングニューラルネットワーク(SNN)デプロイメントプロセスでは、ニューラルネットワークをニューロモルフィックハードウェア内の処理ユニットに分割することが多い。最適配置方式を見つけることはNPハード問題である。これらの目的には、ニューロンの活動パターンによって形成されるネットワークダイナミクスを考慮する必要がある。本手法は,ハードウェアに依存しないネットワークダイナミクスに着目し,特定のハードウェア構成とは独立してモデル化できる。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:15:32 GMT)
Advanced Meta-Ensemble Machine Learning Models for Early and Accurate Sepsis Prediction to Improve Patient Outcomes [0.0]
本報告では, 全身性炎症性反応症候群, 早期警戒スコア, クイックシークエンシャル臓器不全評価など, 従来の敗血症スクリーニングツールの限界について検討する。本稿では,機械学習技術 - ランダムフォレスト, エクストリームグラディエントブースティング, 決定木モデル - を用いて, セプシスの発症を予測することを提案する。本研究は,これらのモデルについて,精度,精度,リコール,F1スコア,受信器動作特性曲線の下での領域といった重要な指標を用いて,個別かつ組み合わせたメタアンサンブルアプローチで評価する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 00:51:32 GMT)
AbstractBeam: Enhancing Bottom-Up Program Synthesis using Library Learning [0.0]
AbstractBeamは、ライブラリ学習を利用してプログラムの繰り返しを識別する、プログラム合成フレームワークである。我々の実験は、AbstractBeamがLambdaBeam整数リスト操作ドメインにおけるLambdaBeamのパフォーマンスを著しく改善することを示した。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:29:29 GMT)
A thermodynamically consistent approach to the energy costs of quantum measurements [0.0]
熱浴に結合した量子プローブからなる量子計測装置の一般的な顕微鏡モデルを示す。熱浴の特性を利用して測定結果を冗長に記録し,その自由度を推定する。本研究では, 熱力学的に可逆な測定が可能であり, 最小限の工数に到達できることを示す。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 08:02:08 GMT)
A multidimensional approach to quantum state tomography of photoelectron wavepackets [0.0]
本稿では,光電子の連続的変動密度行列を単一時間遅延スキャンで再構成できる新しい,より効率的なプロトコルを提案する。時間で走査されるブロードバンド赤外線プローブと、XUVパルスに時間的に固定される狭帯域IR参照を用いて、XUVパルスの光電子吸収のコヒーレンスを測定する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 18:35:05 GMT)
A class of stable nonlinear non-Hermitian skin modes [0.0]
非エルミート皮膚効果(英: non-Hermitian skin effect, NHSE)は、オープントポロジカルシステムにおいてよく知られている現象である。 NHSEは多くの固有状態が境界で局所化される。本稿では, 非線形有限格子における安定な局所化状態を実現する手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 21:55:01 GMT)
A Quantum Computing Approach for Multi-robot Coverage Path Planning [0.0]
本稿では,探索・救助・環境モニタリングなどのアプリケーションに不可欠な多車種被覆経路計画問題に取り組む。本稿では,量子交換演算子Ansatzと簡単に統合できる2次元グリッドの探索手法を提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 10:11:23 GMT)
A Machine Learning Approach to Detecting Albedo Anomalies on the Lunar Surface [0.0]
本研究では、月面のアルベド異常を探索・予測するために機械学習(ML)技術を用いたデータ駆動アプローチを提案する。主な目的は、化学元素とアルベドの関係を識別し、惑星表面の理解を深めることである。本稿では,予測誤差を可視化し,その空間的および化学的特性を記述するための対話型解析ツールを提案する。
論文参考訳（メタデータ） (Thu, 11 Jul 2024 09:10:09 GMT)