Using Natural Language Explanations to Rescale Human Judgments [81.7] 大規模言語モデル(LLM)を用いて順序付けアノテーションと説明を再スケールする手法を提案する。
我々は、アノテータのLikert評価とそれに対応する説明をLLMに入力し、スコア付けルーリックに固定された数値スコアを生成する。
提案手法は,合意に影響を及ぼさずに生の判断を再スケールし,そのスコアを同一のスコア付けルーリックに接する人間の判断に近づける。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:47:00 GMT)
Still-Moving: Customized Video Generation without Customized Video Data [81.1] テキスト・トゥ・ビデオ(T2V)モデルをカスタマイズするための新しいフレームワークであるStill-Movingを紹介する。
このフレームワークは、ビデオモデルをテキスト・トゥ・イメージ(T2I)モデル上に構築する、著名なT2V設計に適用される。
私たちは、注入されたT2I層によって生成された機能を調整する軽量な$textitSpatial Adapters$をトレーニングします。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:06:53 GMT)
AIR-Bench 2024: A Safety Benchmark Based on Risk Categories from Regulations and Policies [80.9] AIR-Bench 2024は、新しい政府の規制や企業のポリシーに適合する最初のAI安全ベンチマークである。
8つの政府規制と16の企業政策を4階層の安全分類に分解し、最も低い階層に粒度の細かいリスクカテゴリを分類する。
AIR-Bench 2024上での言語モデルの評価を行い,その安全性に関する知見を明らかにした。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:16:48 GMT)
WildGaussians: 3D Gaussian Splatting in the Wild [80.5] 3DGSによる閉塞や外見の変化に対処する新しいアプローチであるWildGaussiansを紹介した。
我々はWildGaussianが3DGSとNeRFのベースラインを越えながら3DGSのリアルタイムレンダリング速度と一致していることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:41:32 GMT)
Loss Shaping Constraints for Long-Term Time Series Forecasting [79.4] 本稿では,長期時系列予測のための制約付き学習手法を提案する。
提案手法は, 予測ウィンドウ上でエラーを発生させながら, 時系列ベンチマークにおける競合平均性能を示すことを示すための, 実用的なプリマル・デュアルアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 23:43:18 GMT)
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Cross-Regularization [78.6] 本稿では,事前学習した重量を効率的に更新する直交微調整法を提案する。
また、VLMのゼロショット一般化の観点から安定性を維持するために、クロスレギュラー化戦略を利用する。
下流タスクのサンプルの多様性を強化するために、我々はまず、効率的な微調整を促進するためにカットアウトデータ拡張を探索する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:35:53 GMT)
MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model [78.1] MOFA-Videoは、様々な制御可能な信号を用いて、所定の画像から映像を生成する高度な制御可能な画像アニメーション手法である。
ビデオ生成パイプラインの動作を制御するために,複数のドメイン対応モーションフィールドアダプタを設計する。
トレーニングの後、異なるドメインのMOFA-Adaptersは、より制御可能なビデオ生成のために協力することもできる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:26:03 GMT)
Quality-Aware Translation Models: Efficient Generation and Quality Estimation in a Single Model [77.2] そこで我々は,ニューラルネットワーク翻訳(NMT)モデルを用いて,その品質を学習し,その品質を推定する手法を提案する。
我々は、単一パスの復号化の効率性よりも、品質向上や品質改善のアプローチよりも優れた品質向上を得る。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:25:06 GMT)
Single-Image Shadow Removal Using Deep Learning: A Comprehensive Survey [77.2] 影のパターンは任意で変化しており、しばしば非常に複雑な痕跡構造を持つ。
影による劣化は空間的に不均一であり、照度と影と非陰影領域間の色に矛盾が生じている。
この分野での最近の開発は、主にディープラーニングベースのソリューションによって進められている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:58:38 GMT)
MAGNET: Improving the Multilingual Fairness of Language Models with Adaptive Gradient-Based Tokenization [75.3] マルチ言語設定では、非ラテン語スクリプトと低リソース言語は通常、言語モデルの実用性、効率、コストの点で不利である。
適応的勾配に基づくサブワードトークン化による過分割を低減するために,多言語適応型勾配ベーストークン化を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:59:21 GMT)
Controlling the Fidelity and Diversity of Deep Generative Models via Pseudo Density [70.1] 本稿では, GAN や拡散モデルなどのバイアス深層生成モデルへのアプローチを導入し, 忠実度の向上や多様性の向上を図ったデータ生成手法を提案する。
提案手法では, 擬似密度という, 個人サンプルの新たな測定基準を用いて, トレーニングとデータ生成の分布を操作する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:46:04 GMT)
Evaluating and Analyzing Relationship Hallucinations in LVLMs [69.8] 視覚関係の幻覚を評価するための新しいベンチマークであるR-Benchを紹介する。
R-Benchは、関係の存在に焦点を当てたイメージレベルの質問と、局所的な視覚的理解を評価するインスタンスレベルの質問を特徴としている。
我々は,関係関連性,主観関連性,関係対象性という,幻覚につながる3つの関係共起関係を同定する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:48:39 GMT)
Photonic implementation of the quantum Morra game [69.7] 本研究は,古典ゲームを特殊なケースとして含めることにより,従来の研究を基盤とした2プレーヤ量子モラゲームの忠実な翻訳について研究する。
本稿では、アリスが古典ゲームのバランスを崩し、勝利の優位性を持つ量子状態におけるゲームの自然な変形を提案する。
量子情報と通信の研究における量子モラゲームの可能性について論じる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:35:38 GMT)
FedMedICL: Towards Holistic Evaluation of Distribution Shifts in Federated Medical Imaging [68.7] FedMedICLは統合されたフレームワークであり、フェデレートされた医療画像の課題を全体評価するためのベンチマークである。
6種類の医用画像データセットについて,いくつかの一般的な手法を総合的に評価した。
単純なバッチ分散手法はFedMedICL実験全体の平均性能において,高度な手法を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:12:23 GMT)
Extracting Training Data from Document-Based VQA Models [67.1] VLM(Vision-Language Models)は、文書ベースの視覚質問回答において顕著な進歩を遂げている(つまり、画像として提供される入力文書の内容に関する問い合わせに応答する)。
これらのモデルでは、関連する視覚情報が削除された場合でも、トレーニングサンプルに対する応答を記憶し、それらをリグルジタイズすることができる。
これには、トレーニングセットで繰り返し繰り返されるパーソナライズ可能な情報が含まれており、これらのモデルが機密情報を漏らし、したがってプライバシーリスクを引き起こす可能性があることを示している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:44:41 GMT)
SEED-Story: Multimodal Long Story Generation with Large Language Model [66.4] SEED-Storyは、MLLM(Multimodal Large Language Model)を利用して拡張マルチモーダルストーリーを生成する新しい手法である。
マルチモーダルアテンションシンク機構を提案し,最大25個のストーリー(トレーニング用10個)を高い効率で自動回帰的に生成する。
本稿では,大規模かつ高解像度なStoryStreamというデータセットを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:21:03 GMT)
A Dialogue Game for Eliciting Balanced Collaboration [64.6] 本稿では、プレイヤーがゴール状態自体を交渉しなければならない2Dオブジェクト配置ゲームを提案する。
我々は,人間プレイヤーが様々な役割を担っていることを実証的に示し,バランスの取れた協調によってタスクのパフォーマンスが向上することを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:51:34 GMT)
Live2Diff: Live Stream Translation via Uni-directional Attention in Video Diffusion Models [64.2] 大規模言語モデルは、テキストやオーディオなどのストリーミングデータの生成において顕著な効果を示している。
本稿では,一方向の時間的注意を向けたビデオ拡散モデルを設計するための最初の試みであるLive2Diffを紹介する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:34:51 GMT)
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs [63.8] FunAudioLLMは、人間と大規模言語モデル(LLM)の間の自然な音声相互作用を強化するために設計されたモデルファミリーである
中心となる2つの革新的なモデルとして、多言語音声認識、感情認識、音声イベント検出を処理するSenseVoiceと、複数の言語、音色、話し方、話者識別を制御した自然言語生成を容易にするCosyVoiceがある。
SenseVoiceとCosyVoiceに関連するモデルは、GitHubでリリースされたトレーニング、推論、微調整コードとともに、ModelscopeとHuggingfaceでオープンソース化されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:08:35 GMT)
Model Surgery: Modulating LLM's Behavior Via Simple Parameter Editing [63.2] 大言語モデル(LLM)は、ジェネラリストアシスタントとして大きな可能性を示している。
これらのモデルは、非毒性や脱獄の試みに対するレジリエンスなど、望ましい行動特性を示すことが重要である。
本稿では,パラメータの小さなサブセットを直接編集することで,LLMの特定の振る舞いを効果的に調節できることを観察する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:52:03 GMT)
Adaptive Selection for Homogeneous Tools: An Instantiation in the RAG Scenario [62.6] ツール学習に関する現在の研究は、主に様々な選択肢から最も効果的なツールを選択することに焦点を当てており、しばしば費用対効果を見落としている。
本稿では,タスクの達成に必要な性能と関連するコストの両方を予測し,同種ツールの選択に対処する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:37:47 GMT)
One Model to Rule them All: Towards Universal Segmentation for Medical Images with Text Prompts [62.6] 我々は、SATと呼ばれるテキストプロンプトによって駆動される放射線学的スキャンにおいて、任意のセグメンテーションを可能にするモデルを構築することを目指している。
トレーニングのために、最大かつ最も包括的なセグメンテーションデータセットを構築します。
我々はSAT-Nano(110Mパラメータ)とSAT-Pro(447Mパラメータ)をトレーニングし、データセット/サブセット毎にトレーニングされた72の専門家nnU-Netに匹敵する性能を示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:09:39 GMT)
Label-anticipated Event Disentanglement for Audio-Visual Video Parsing [61.1] 我々は新しいデコードパラダイムであるアンダーライン・サンダーライン・エンダーライン・アンダーライン・インダーライン・プロジェクション(LEAP)を導入する。
LEAPは、音声/視覚セグメントの符号化された潜在機能を意味的に独立したラベル埋め込みに反復的に投影する。
LEAPパラダイムを促進するために,新しい音声・視覚的類似性損失関数を含むセマンティック・アウェア・最適化戦略を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:57:08 GMT)
Uncertainty Estimation of Large Language Models in Medical Question Answering [60.7] 大規模言語モデル(LLM)は、医療における自然言語生成の約束を示すが、事実的に誤った情報を幻覚させるリスクがある。
医学的問合せデータセットのモデルサイズが異なる人気不確実性推定(UE)手法をベンチマークする。
以上の結果から,本領域における現在のアプローチは,医療応用におけるUEの課題を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:51:33 GMT)
Bridging the Gap between Human Motion and Action Semantics via Kinematic Phrases [59.3] 動作理解は、動作意味論と行動意味論の信頼性の高いマッピングを確立することを目的としている。
本研究では,人間の動作の客観的な運動事実を適切な抽象化,解釈可能性,一般性で捉えたキネマティック・フェース(KP)を提案する。
KPに基づいて、動作知識ベースを統一し、動作理解システムを構築することができる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:39:02 GMT)
BlendFilter: Advancing Retrieval-Augmented Large Language Models via Query Generation Blending and Knowledge Filtering [58.4] BlendFilterは、知識フィルタリングと組み合わせたクエリ生成を統合することで、検索強化された大規模言語モデルを高める新しいアプローチである。
我々は3つのオープンドメイン質問応答ベンチマークで広範な実験を行い、我々の革新的なBlendFilterが最先端のベースラインをはるかに上回っていることを明らかにした。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:26:15 GMT)
A Matter of Annotation: An Empirical Study on In Situ and Self-Recall Activity Annotations from Wearable Sensors [56.6] In-the-wildデータ収集に焦点をあてたユーザスタディにおいて,一般的な4つのアノテーション手法の評価と対比を行う実験的検討を行った。
実際の記録プロセス中に参加者がアノテートするユーザ主導のin situアノテーションと、各日の終わりに参加者が振り返ってアノテートするリコールメソッドの両方に対して、参加者は自身のアクティビティクラスと対応するラベルを選択できる柔軟性を持っていた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:23:32 GMT)
Improving Molecular Modeling with Geometric GNNs: an Empirical Study [56.5] 本稿では,異なる標準化手法,(2)グラフ作成戦略,(3)補助的なタスクが性能,拡張性,対称性の強制に与える影響に焦点をあてる。
本研究の目的は,分子モデリングタスクに最適なモデリングコンポーネントの選択を研究者に案内することである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:04:12 GMT)
EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.8] EvoAgentは進化的アルゴリズムによって専門家エージェントをマルチエージェントシステムに自動的に拡張する汎用的な手法である。
EvoAgentは複数の専門家エージェントを自動生成し,LLMエージェントのタスク解決能力を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:18:35 GMT)
Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On [55.4] 一般的な7B言語モデル上での教師付き微調整(SFT)であるSkywork-Mathモデルシリーズを紹介する。
Skywork-Math 7Bは競争レベルのMATHベンチマークで51.2%の精度を達成した。
我々は,LLMの数学推論能力を高めるために,研究用と産業用の両方で,いくつかの実践的なテイクアウトを提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:56:51 GMT)
Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [54.2] コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:00:53 GMT)
Virtual Context: Enhancing Jailbreak Attacks with Special Token Injection [54.1] 本稿では、以前LLMセキュリティで見過ごされていた特別なトークンを活用して、ジェイルブレイク攻撃を改善する仮想コンテキストを提案する。
総合的な評価によると、仮想コンテキストによるジェイルブレイク攻撃は、4つの広く使われているジェイルブレイク手法の成功率を約40%向上させることができる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:21:31 GMT)
The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective [53.5] モデルとデータの開発は2つの別々のパスではなく、むしろ相互接続であることがわかった。
一方,MLLMの性能向上には,大規模かつ高品質なデータが寄与する一方,MLLMはデータの開発を促進することができる。
MLLMコミュニティにおけるデータモデル共同開発を促進するために,データモデル共同開発の観点からMLLMに関連する既存の研究を体系的にレビューする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:08:11 GMT)
MetaUrban: A Simulation Platform for Embodied AI in Urban Spaces [52.1] 最近のロボティクスとエンボディードAIの進歩により、公共の都市空間はもはや人間専用ではない。
フードデリバリーロボットと電動車椅子は歩道を歩行者と共有し始めている。
都市空間の混雑する街路を走行する際には,これらのモバイル機器の汎用性と安全性の確保が不可欠である。
本稿では,都市空間におけるEmbodied AI研究のための合成シミュレーションプラットフォームMetaUrbanを紹介する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:56:49 GMT)
Generalizable Implicit Motion Modeling for Video Frame Interpolation [52.0] フローベースビデオフレーム補間(VFI)における動きの重要性
General Implicit Motion Modeling (IMM)は、モーションモデリングVFIの新規かつ効果的なアプローチである。
我々のGIMMは、既存のフローベースのVFIワークとスムーズに統合できます。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:13:15 GMT)
HAF-RM: A Hybrid Alignment Framework for Reward Model Training [51.6] 報酬モデルトレーニングのためのハイブリッドアライメントフレームワークHaF-RMを提案する。
報酬モデルのパフォーマンスとアライメントを高めるための、原則的で効果的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:35:06 GMT)
SoupLM: Model Integration in Large Language and Multi-Modal Models [51.1] 大規模言語モデル(LLM)の訓練には、かなりの計算資源が必要である。
既存の公開LLMは通常、さまざまなタスクにまたがる、多種多様なプライベートにキュレートされたデータセットで事前トレーニングされる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:38:15 GMT)
Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.0] 我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:28:34 GMT)
Visible and Clear: Finding Tiny Objects in Difference Map [50.5] 本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:07:06 GMT)
Step-Back Profiling: Distilling User History for Personalized Scientific Writing [50.5] 大きな言語モデル(LLM)は、さまざまな自然言語処理タスクに優れていますが、個人向けにパーソナライズされたコンテンツを生成するのに苦労しています。
ユーザ履歴を簡潔なプロファイルに抽出することで,LSMをパーソナライズするためのSTEP-BACK ProFIlingを導入する。
本手法は,一般パーソナライゼーションベンチマークにおいて,ベースラインを最大3.6ポイント向上させる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:29:12 GMT)
BeTAIL: Behavior Transformer Adversarial Imitation Learning from Human Racing Gameplay [48.8] 模倣学習は、手作りの報酬関数を必要とせずに、デモンストレーションからポリシーを学ぶ。
本稿では,BeTAIL: Behavior Transformer Adversarial Imitation Learningを提案する。
我々は,Gran Turismo Sportにおけるリアルヒューマンゲームプレイのエキスパートレベルのデモンストレーションで,BeTAILを3つの課題でテストした。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:50:08 GMT)
Unifying 3D Representation and Control of Diverse Robots with a Single Camera [48.3] 我々は,ロボットを視覚のみからモデル化し,制御することを自律的に学習するアーキテクチャであるNeural Jacobian Fieldsを紹介する。
提案手法は,正確なクローズドループ制御を実現し,各ロボットの因果動的構造を復元する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:55:49 GMT)
Mask-Enhanced Segment Anything Model for Tumor Lesion Semantic Segmentation [48.1] Mask-Enhanced SAM (M-SAM) は, 腫瘍の3次元セグメント化に適した革新的なアーキテクチャである。
本稿では,M-SAM内におけるMask-Enhanced Adapter (MEA) を提案する。
我々のM-SAMは高いセグメンテーション精度を達成し、またロバストな一般化を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:58:51 GMT)
Data Mixing Made Efficient: A Bivariate Scaling Law for Language Model Pretraining [47.8] 本研究は、データ混合物の低コストプロキシに基づく戦略を検証することによって、制限に対処する。
我々は、データ量と混合比率の両方を正確にモデル化する、$textbfBiMix$と呼ばれる統一スケーリング法を提案する。
この結果から,エントロピー駆動のトレーニングフリーなデータ混合は,資源集約的な手法よりも同等あるいはそれ以上の性能を達成できることがわかった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:44:45 GMT)
Benchmarking GPT-4 on Algorithmic Problems: A Systematic Evaluation of Prompting Strategies [47.1] 大規模言語モデル(LLM)は自然言語処理の分野に革命をもたらした。
LLMは体系的な一般化を欠き、学習された統計正則をトレーニング分布の外へ外挿することができる。
本稿では,最も先進的なLCMの1つであるGPT-4の系統的なベンチマークを行う。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:54:45 GMT)
Learning Neural Volumetric Pose Features for Camera Localization [47.1] 本稿では,PoseMapと呼ばれるニューラルボリュームポーズ機能を導入し,カメラのローカライゼーションを強化した。
我々のフレームワークは、拡張されたNeRFモジュールとともにAPR(Absolute Pose Regression)アーキテクチャを活用している。
室内および屋外のベンチマークシーンで平均14.28%, 20.51%の性能向上が得られた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:09:29 GMT)
TAKT: Target-Aware Knowledge Transfer for Whole Slide Image Classification [46.8] 本稿では,教師-学生パラダイムを取り入れた目標認識型知識伝達フレームワークを提案する。
我々のフレームワークは、教師モデルがソースとターゲットドメインから共通知識を学習することを可能にする。
本手法は,各種データセット上での知識伝達手法の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:52:14 GMT)
Is Your Model Really A Good Math Reasoner? Evaluating Mathematical Reasoning with Checklist [46.7] 大規模言語モデル(LLM)の数学的能力を包括的に定義し評価する方法が重要な問題となっている。
タスクの一般化とロバスト性の推論のためのよく設計されたチェックリストであるMATHCHECKを紹介する。
我々はMATHCHECK-GSMとMATHCHECK-GEOを採用し、20 LLMと11 MLLMの総合的な数学的推論能力を評価した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:58:58 GMT)
Video Diffusion Alignment via Reward Gradients [46.6] 本研究では,映像拡散モデルに適応するために,強力な視覚識別モデル上での嗜好によって学習される事前学習報酬モデルを利用する。
様々な報酬モデルとビデオ拡散モデルにまたがって結果を示し、報奨クエリや計算の点で、我々のアプローチがより効率的に学習できることを実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:59:45 GMT)
A Comprehensive Study of Multimodal Large Language Models for Image Quality Assessment [46.6] MLLM(Multimodal Large Language Models)は、視覚的理解と推論において大きな進歩を経験している。
画像品質評価(IQA)のための強力でフレキシブル、解釈可能、およびテキスト駆動モデルとして機能する可能性については、まだ明らかにされていない。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:11:53 GMT)
Leveraging Large Language Models for Scalable Vector Graphics-Driven Image Understanding [46.0] 大規模言語モデル(LLM)は、自然言語理解において大きな進歩を遂げた。
本研究は,LLMが画像の理解も可能かどうかを考察する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:59:53 GMT)
Vox Populi, Vox AI? Using Language Models to Estimate German Public Opinion [45.8] 我々は,2017年ドイツ縦断選挙研究の回答者の個人特性と一致するペルソナの合成サンプルを生成した。
我々は,LSM GPT-3.5に対して,各回答者の投票選択を予測し,これらの予測を調査に基づく推定と比較する。
GPT-3.5は市民の投票選択を正確に予測せず、緑の党と左派に偏見を呈している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:52:18 GMT)
$β$-DPO: Direct Preference Optimization with Dynamic $β$ [45.6] 直接選好最適化(DPO)は、人間の嗜好に従うために大規模言語モデル(LLM)を訓練するための魅力的なアプローチとして登場した。
我々は、$beta$とデータ品質がDPOに与える影響を分析し、最適な$beta$値がペアデータの情報性によって異なることを明らかにする。
バッチレベルで$beta$を動的に校正する新しいフレームワークを導入し、データ品質を考慮に入れます。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:21:18 GMT)
BraTS-PEDs: Results of the Multi-Consortium International Pediatric Brain Tumor Segmentation Challenge 2023 [44.8] 小児脳腫瘍に焦点を当てた第1回BraTS-PEDs 2023チャレンジの結果を報告する。
BraTS-PEDs 2023は、磁気共鳴画像による小児脳グリオーマの体積分割アルゴリズムの評価を目的とした。
小児腫瘍分析におけるトップパフォーマンスのAIアプローチには、nnU-NetとSwin UNETR、Auto3DSeg、あるいはnnU-Netの自己組織化フレームワークによるアンサンブルが含まれていた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:35:32 GMT)
SeaEval for Multilingual Foundation Models: From Cross-Lingual Alignment to Cultural Reasoning [44.5] SeaEvalは多言語基盤モデルのベンチマークである。
これらのモデルがどのように理解し、自然言語で推論するかを特徴付ける。
また、文化の実践やニュアンス、価値観をいかに理解したかについても検討する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:01:41 GMT)
On Leakage of Code Generation Evaluation Datasets [44.5] コード生成テストセットによる汚染について考察する。
我々の発見の鍵は161のプロンプトと関連するピソン溶液のデータセットである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:37:20 GMT)
SR-Mamba: Effective Surgical Phase Recognition with State Space Model [42.8] SR-マンバ(SR-Mamba)は、外科的位相認識の課題を満たすために特別に設計された、新しい無注意モデルである。
SR-Mambaでは、双方向のMambaデコーダを用いて、時間的コンテキストをオーバーロングシーケンスで効果的にモデル化する。
SR-Mambaは、Colec80とCATARACTS Challengeデータセットで最先端のパフォーマンスを示すことによって、外科的ビデオ分析の新たなベンチマークを確立する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:34:31 GMT)
LLMs in Biomedicine: A study on clinical Named Entity Recognition [42.7] 大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な汎用性を示す。
本稿では,NERタスクの性能向上戦略について検討する。
提案手法であるDiRAGは,バイオメディカルNERにおけるLDMのゼロショットF1スコアを高めることができる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:09:30 GMT)
Enhancing ADHD Diagnosis with EEG: The Critical Role of Preprocessing and Key Features [41.9] 本研究は,ADHDと診断された小児および典型的には(TD)児の脳波データセットを用いた。
4つの前処理技術が適用された。前処理(Raw)、有限インパルス応答(FIR)フィルタリング、アーティファクト部分空間再構成(ASR)、独立成分分析(ICA)である。
プリプロセッシングの欠如は, ノイズによる人為的に高い分類精度をもたらすが, 対照的に, ASRおよびICAプリプロセッシング技術は, 結果の信頼性を著しく向上させた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:07:22 GMT)
GLBench: A Comprehensive Benchmark for Graph with Large Language Models [41.9] GLBenchは、教師付きシナリオとゼロショットシナリオの両方でGraphLLMメソッドを評価するための最初の包括的なベンチマークである。
GLBenchはグラフニューラルネットワークのような従来のベースラインとともに、GraphLLMメソッドのさまざまなカテゴリを公平かつ徹底的に評価する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:06:33 GMT)
DG-PIC: Domain Generalized Point-In-Context Learning for Point Cloud Understanding [41.5] 本稿では,ドメイン一般化ポイントクラウド理解のための統一モデルにおいて,複数のドメインと複数のタスクを扱う,新しい,実用的なマルチドメインマルチタスク設定を提案する。
我々のDG-PICは、テスト中にモデル更新を一切必要とせず、見えないドメインと複数のタスク、例えば、ポイントクラウドの再構築、デノナイズ、登録を1つの統一モデルで処理できる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:21:40 GMT)
MeshAvatar: Learning High-quality Triangular Human Avatars from Multi-view Videos [41.5] 多視点ビデオから高品質な三角アバターを学習するための新しいパイプラインを提案する。
本手法は暗黙のSDFフィールドから抽出した三角メッシュでアバターを表現する。
我々は、幾何学とテクスチャを正確に分解するために物理ベースのレンダリングを取り入れた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:37:51 GMT)
Quantum Generative Diffusion Model: A Fully Quantum-Mechanical Model for Generating Quantum State Ensemble [40.1] 本稿では,量子生成拡散モデル (QGDM) を単純かつエレガントな量子モデルとして紹介する。
QGDMはQGAN(Quantum Generative Adversarial Network)よりも高速な収束を示す
混合状態発生ではQGANよりも53.02%高い忠実性が得られる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:46:04 GMT)
Purifying quantum-dot light in a coherent frequency interface [39.6] 量子ネットワークは、光ファイバーの低損失伝送を利用するために、テレコム波長で動作する。
明暗の量子ドット(QDs)は、InGaAs QDsのような光の非常に区別できない量子状態を放出し、近赤外線で光子を放出する。
本稿では, 周期的に偏極した窒化リチウム導波路において, 単一光子のQD源からCバンドへのスペクトル浄化と周波数シフトを同時に実施する方法について報告する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:02:43 GMT)
Production and stabilization of a spin mixture of ultracold dipolar Bose gases [39.6] 本研究では, ゼーマン状態が162ドルDy原子の2つの最下層からなる混合物について実験を行った。
干渉現象のため、そのような非弾性過程の速度はウィグナーしきい値法則により劇的に減少する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:37:01 GMT)
Natural language is not enough: Benchmarking multi-modal generative AI for Verilog generation [37.3] 視覚言語入力からのVerilog合成に適したマルチモーダル生成モデルのオープンソースベンチマークを提案する。
また、オープンソースのビジュアルで自然言語のVerilogクエリ言語フレームワークについても紹介する。
本結果は,自然言語のみに基づくクエリと比較して,マルチモーダル生成のVerilogが大幅に向上したことを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:10:09 GMT)
Characterizing Prompt Compression Methods for Long Context Inference [37.0] 長期のコンテキスト推論は、計算とメモリの要求が増大するにつれて、システムレベルでの課題を提示します。
コンテクスト長を削減するためにプロンプトを圧縮するいくつかの方法が提案されている。
我々は、異なるプロンプト圧縮法を包括的に評価し、評価する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 23:34:32 GMT)
SubspaceNet: Deep Learning-Aided Subspace Methods for DoA Estimation [36.6] SubspaceNetは、観測を区別可能な部分空間に分割する方法を学ぶデータ駆動型DoA推定器である。
SubspaceNetは、コヒーレントソース、広帯域信号、低いSNR、配列ミスマッチ、限られたスナップショットに対処する様々なDoA推定アルゴリズムを実現する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:16:41 GMT)
Looks can be Deceptive: Distinguishing Repetition Disfluency from Reduplication [36.6] 本稿では,計算言語学を用いた音声における重複と繰り返しの大規模研究について述べる。
我々は,Hindi,Telugu,Marathiテキストを含む新しい公開データセットであるIndicRedRepを紹介した。
我々は,2つの現象を区別するためにReparandum-Interregnum-Repair構造を用いて,マルチクラス複製と繰り返しトークン分類のためのトランスフォーマーモデルの評価を行った。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:00:14 GMT)
Pistis-RAG: A Scalable Cascading Framework Towards Trustworthy Retrieval-Augmented Generation [36.5] Pistis-RAGは、大規模検索拡張生成(RAG)システムの課題に対処するために設計されたスケーラブルなマルチステージフレームワークである。
私たちのフレームワークは、マッチング、序列、ランク付け、推論、集約という、異なるステージで構成されています。
我々の新しいランキングステージは、情報検索の原則を取り入れたRAGシステムに特化して設計されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:28:34 GMT)
$R^3$: "This is My SQL, Are You With Me?" A Consensus-Based Multi-Agent System for Text-to-SQL Tasks [36.2] Review-Rebuttal-Revisionは、テキスト対タスクのためのコンセンサスベースのマルチエージェントシステムである。
Llama-3-8Bでは、$R3$はチェーン・オブ・シークレットを20%以上上回り、スパイダーの開発セットではGPT-3.5を上回ります。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:14:54 GMT)
Tri$^{2}$-plane: Thinking Head Avatar via Feature Pyramid [35.7] 本稿では,モノクラーフォトリアリスティックな頭部アバター再構成のための新しいアプローチTri$2$-planeを提案する。
提案されたTri$2$-planeは、細部の改善のために特徴ピラミッドと3つの上下方向接続の原理を利用している。
顔の詳細を複数のスケールで分析してレンダリングし、顔全体から特定の地域へ移行し、さらに洗練されたサブリージョンへと移行する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:03:27 GMT)
fairBERTs: Erasing Sensitive Information Through Semantic and Fairness-aware Perturbations [35.6] フェアチューニングされたBERT系列モデルを学習するためのフレームワークである FairBERT を提示する。
モデルユーティリティを維持しながら不公平を緩和する上で, フェアバーティの優れた優位性を実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:13:38 GMT)
The Career Interests of Large Language Models [35.2] 本研究は,Large Language Models (LLMs) に Occupation Network's Interest Profiler ショートフォームを適用することで,キャリアの関心事の側面に焦点を当てる。
LLMでは,特に社会的・芸術的領域において,キャリアへの関心が顕著であった。
心理測定器と高度統計ツールをLCM上で使用するこの新しいアプローチは、彼らの専門的な環境への統合について、新たな視点を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:54:46 GMT)
Beyond Aesthetics: Cultural Competence in Text-to-Image Models [35.0] CUBEは、テキスト・ツー・イメージ・モデルの文化的能力を評価するための最初のベンチマークである。
CUBEは、異なる地理的文化圏の8か国に関連する文化的アーティファクトをカバーしている。
CUBE-CSpaceは、文化的多様性を評価する基盤となる文化的アーティファクトのより大きなデータセットである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:57:37 GMT)
Data Adaptive Traceback for Vision-Language Foundation Models in Image Classification [34.4] 我々はData Adaptive Tracebackと呼ばれる新しい適応フレームワークを提案する。
具体的には、ゼロショット法を用いて、事前学習データの最もダウンストリームなタスク関連サブセットを抽出する。
我々は、擬似ラベルに基づく半教師付き手法を採用し、事前学習画像の再利用と、半教師付き学習における確証バイアス問題に対処するための視覚言語コントラスト学習手法を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:01:58 GMT)
DebSDF: Delving into the Details and Bias of Neural Indoor Scene Reconstruction [34.1] 本稿では,単分子先行における不確実性の利用とSDFに基づくボリュームレンダリングにおけるバイアスに着目した。
本稿では,より大規模な不確実性とモノラルな先行誤差を関連付ける不確実性モデリング手法を提案する。
その後、バイアスを防ぐために、高い不確実性事前を最適化から除外する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:19:11 GMT)
Unsupervised Object Localization in the Era of Self-Supervised ViTs: A Survey [33.7] 近年の研究では、自己教師付き事前訓練機能を利用することで、クラスに依存しない非教師付きオブジェクトローカライゼーションが可能であることが示されている。
本稿では、手動のアノテーションを必要とせず、画像中のオブジェクトを検出する教師なしオブジェクトローカライズ手法について調査する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:46:20 GMT)
PAS: Data-Efficient Plug-and-Play Prompt Augmentation System [32.7] 大型言語モデル(LLM)は、プラグアンドプレイAIシステムへの需要を増大させた。
LLMベースのプラグアンドプレイ自動プロンプトエンジニアリング(APE)システムであるPASを提案する。
PAS は従来の APE モデルと比較して、平均 6.09 ポイントの改善を達成している。
PASは人間の評価に優れており、ユーザのためのプラグインとしての適合性を強調している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:30:01 GMT)
GTA: A Benchmark for General Tool Agents [32.4] 229個の実世界のタスクと実行可能なツールチェーンを設計し、主要な大言語モデル(LLM)を評価する。
GPT-4 はタスクの 50% 以下であり,ほとんどの LLM は 25% 以下である。
この評価は、現実シナリオにおける現在のLLMのツール利用能力のボトルネックを明らかにし、汎用ツールエージェントを前進させるための今後の方向性を提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:50:09 GMT)
Is It Really Long Context if All You Need Is Retrieval? Towards Genuinely Difficult Long Context NLP [32.2] 異なるタスクをコンテキスト長で膨らませることは、生産的ではないと我々は主張する。
我々は、長い文脈でそれらがより困難になる特性に基づいて、長い文脈の分類を解き放つことを提案する。
必要な情報が非常に長く、入力内で非常に拡散している、最も困難で興味深い設定は、非常に過度に探索されている、と結論付けている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:17:09 GMT)
A Comprehensive Survey on Retrieval Methods in Recommender Systems [32.2] 本調査では,レコメンデータシステムの重要かつ見落とされがちな検索段階について検討する。
高精度かつ効率的なパーソナライズされた検索を実現するために,既存の作業を3つの重要な領域にまとめる。
特定の企業における検索実践のケーススタディを通じて、現在の産業応用を取り上げる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:09:59 GMT)
WildRefer: 3D Object Localization in Large-scale Dynamic Scenes with Multi-modal Visual Data and Natural Language [31.7] 本稿では,自然言語記述とオンラインキャプチャによるマルチモーダル視覚データに基づく大規模動的シーンにおける3次元視覚接地作業について紹介する。
本研究では,画像中のリッチな外観情報,位置,および点雲中の幾何学的手がかりをフル活用して,WildReferという新しい手法を提案する。
われわれのデータセットは、野生の3Dビジュアルグラウンドの研究にとって重要なものであり、自動運転とサービスロボットの開発を促進する大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:20:31 GMT)
Neural Poisson Solver: A Universal and Continuous Framework for Natural Signal Blending [31.5] Inlicit Neural Representation (INR) は視覚信号の表現法として人気がある。
InRによって表現される視覚信号を混合するプラグイン・アンド・プレイフレームワークであるNeural Poisson Solverを紹介する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:54:21 GMT)
Strategy Synthesis for Zero-Sum Neuro-Symbolic Concurrent Stochastic Games [31.5] ニューロシンボリック・コンカレントゲーム(NS-CSG)と呼ばれる新しいモデリング形式を提案する。
本稿では,ボレル状態空間を持つNS-CSGのクラスに着目し,ゼロサム割引累積報酬に対する値関数の存在と可測性を証明する。
我々は,この連続状態CSGの新たなサブクラスを解くために,実用的価値反復(VI)とポリシー反復(PI)アルゴリズムを初めて提示する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:40:13 GMT)
BANF: Band-limited Neural Fields for Levels of Detail Reconstruction [29.0] 簡単な修正により、低域通過フィルタのニューラルネットワークが得られることを示すとともに、これをどのように利用して信号全体の周波数分解を得ることができるかを示す。
本研究では,提案手法の妥当性について検討し,粗い表現を効果的に計算する方法を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:29:47 GMT)
BiEquiFormer: Bi-Equivariant Representations for Global Point Cloud Registration [28.8] 最先端の深層学習手法は、任意の点の雲を空間に配置した場合、大きな性能劣化に悩まされることを示す。
We design BiEquiformer a novel and scalable textitbi-equivariant pipeline。
これにより,高品質なスーパーポイント対応を抽出し,ロバストなポイントクラウド登録を行うことができる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:58:10 GMT)
GAURA: Generalizable Approach for Unified Restoration and Rendering of Arbitrary Views [28.5] 本稿では,いくつかの劣化条件下で高忠実性新規ビュー合成が可能な一般化可能なニューラルレンダリング手法を提案する。
我々の手法であるGAURAは学習ベースであり、テスト時間シーン固有の最適化を必要としない。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:44:37 GMT)
On the Universal Truthfulness Hyperplane Inside LLMs [27.0] モデル内の事実的正確かつ誤った出力を区別する普遍真性超平面が存在するかどうかを考察する。
その結果,トレーニングデータセットの多様性の向上が,すべてのシナリオのパフォーマンスを著しく向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:07:26 GMT)
Spectral State Space Models [26.7] 本稿では,長距離依存型予測タスクのシーケンスモデリングについて検討する。
スペクトルフィルタリングアルゴリズムを用いて線形力学系の学習に基づく状態空間モデルの新しい定式化を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:35:23 GMT)
NormAd: A Benchmark for Measuring the Cultural Adaptability of Large Language Models [26.6] 我々は75カ国の社会的・文化的規範を表す2.6kストーリーを含む新しいデータセットであるNormAdを紹介した。
我々の研究は、LLMがあらゆる文脈の粒度にわたる文化的推論に苦慮していることを明らかにした。
NormAdの評価によると、LLMは文化全体にわたるギフトギフトを含むストーリーに適応するのに苦労している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:05:59 GMT)
Beyond Instruction Following: Evaluating Rule Following of Large Language Models [26.2] 大規模言語モデル(LLM)は、強力な命令追従能力を示す。
本稿では,ルールフォローの概念を明確にし,ルールフォロー能力の多様性を評価するためのベンチマークであるルールベンチをキュレートする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:26:55 GMT)
Hypergraph Multi-modal Large Language Model: Exploiting EEG and Eye-tracking Modalities to Evaluate Heterogeneous Responses for Video Understanding [25.5] ビデオの創造性と内容の理解はしばしば個人によって異なり、年齢、経験、性別によって焦点や認知レベルが異なる。
実世界のアプリケーションとのギャップを埋めるために、textbfSubjective textbfResponse textbfIndicators for textbf— textbfVideos dataset, すなわちSRI-ADVを導入する。
映像コンテンツの認知的理解度を分析・評価するタスクとプロトコルを開発した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:00:26 GMT)
BenthicNet: A global compilation of seafloor images for deep learning applications [25.5] BenthicNetは海底画像のグローバルコンパイルである。
最初の114万枚以上の画像が収集され、海底環境の多様性を表すためにキュレーションされた。
このコンパイルに基づいて大規模なディープラーニングモデルをトレーニングし,その予備的な結果から,大規模かつ小規模の画像解析タスクの自動化に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:24:52 GMT)
DACAD: Domain Adaptation Contrastive Learning for Anomaly Detection in Multivariate Time Series [25.4] 時系列異常検出では、ラベル付きデータの不足が正確なモデルの開発に困難をもたらす。
時系列における異常検出のための新しいドメインコントラスト学習モデル(DACAD)を提案する。
本モデルでは,ソース領域に対する教師付きコントラスト損失と,ターゲット領域に対する自己監督型コントラスト型3重項損失を用いる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:04:13 GMT)
Reading Subtext: Evaluating Large Language Models on Short Story Summarization with Writers [25.3] 我々は,最近のLarge Language Models (LLMs) について,短いストーリーを要約する難しい課題について評価する。
私たちは著者と直接協力して、ストーリーがオンラインで共有されていないことを保証しています(従ってモデルによって見つからないのです)。
GPT-4、Claude-2.1、LLama-2-70Bを比較し、全3モデルが50%以上の要約で忠実さの誤りを犯していることを発見した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:46:52 GMT)
FairDomain: Achieving Fairness in Cross-Domain Medical Image Segmentation and Classification [25.0] 本稿では,ドメインシフト下での公平性に関する先駆的なシステム研究について述べる。
我々は医学的セグメンテーションと分類作業の両方に最先端領域適応(DA)と一般化(DG)アルゴリズムを用いる。
また,様々なDAアルゴリズムやDGアルゴリズムに適応して,自己注意を用いて人口統計特性を調整し,公平性を向上する,新規なプラグイン・アンド・プレイ・アイデンティティ・フェアアテンション(FIA)モジュールも導入する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:52:32 GMT)
AVCap: Leveraging Audio-Visual Features as Text Tokens for Captioning [24.6] AVCap(Audio-Visual Captioning framework)を提案する。
AVCapは音声視覚機能をテキストトークンとして利用する。
提案手法は,既存の音声・視覚のキャプション手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:38:14 GMT)
Fairness in Ranking under Disparate Uncertainty [24.4] 我々は、基礎となる関連モデルの不確実性がオプション群間で異なる場合、ランク付けは不公平をもたらす可能性があると論じる。
ランク付けのための新しい公正基準として平等ランク付け(EOR)を提案する。
異なる不確実性が存在する場合でも、EORは関連する選択肢の中でグループワイドフェア・宝くじに対応していることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:35:37 GMT)
Prediction Exposes Your Face: Black-box Model Inversion via Prediction Alignment [24.0] モデル反転(MI)攻撃は、その出力から対象モデルのプライベートトレーニングデータを再構成する。
ブラックボックスMI攻撃のための予測画像P2I手法を提案する。
本手法は,攻撃精度を8.5%向上し,データセットCelebAのクエリ数を99%削減する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:58:35 GMT)
I-MedSAM: Implicit Medical Image Segmentation with Segment Anything [24.0] 提案するI-MedSAMは、連続表現とSAMの両方の利点を利用して、クロスドメイン能力と正確な境界線を求める。
トレーニング可能なパラメータが1.6Mしかない提案手法は、離散的および暗黙的を含む既存の手法よりも優れている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:36:35 GMT)
FedLog: Personalized Federated Classification with Less Communication and More Flexibility [24.0] FedAvgが提案するフェデレートラーニング(FL)では、クライアントがローカルモデルをプライベートデータでトレーニングし、モデルパラメータを中央集約のために共有する。
クライアントはモデルパラメータとローカルデータサマリーを共有せず、共有コストを削減できることを提案する。
我々は,局所データの十分な統計しか共有しないベイズ推定を用いた新しいアルゴリズムであるFedLogを開発した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:40:29 GMT)
Resampled Datasets Are Not Enough: Mitigating Societal Bias Beyond Single Attributes [23.8] 我々は、保護されたグループと画像属性の急激な相関を取り除き、画像テキストデータセットの社会的バイアスに取り組む。
テキスト誘導インペイントモデルを用いることで、すべての属性から保護されたグループ独立を保証し、データフィルタリングによるインペイントバイアスを軽減する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:38:01 GMT)
InstructLayout: Instruction-Driven 2D and 3D Layout Synthesis with Semantic Graph Prior [23.5] 自然言語命令を補完することは、2Dおよび3Dレイアウト合成システムにとって魅力的な特性である。
既存の手法は、オブジェクトの関節分布を暗黙的にモデル化し、オブジェクトの関係を表現し、生成物の可制御性合成システムを妨げる。
Instructは、セマンティックグラフとレイアウトデコーダを統合した、新しい生成フレームワークである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:19:08 GMT)
RPBG: Towards Robust Neural Point-based Graphics in the Wild [23.5] 我々は、ポイントベースグラフィックス(RPBG)と呼ばれる新しい点ベースニューラルリレンダリング手法を提案する。
RPBGは安定してベースラインを大きなマージンで上回り、最先端のNeRFベースの変種に対して大きな堅牢性を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:17:28 GMT)
Generalized Face Anti-spoofing via Finer Domain Partition and Disentangling Liveness-irrelevant Factors [23.3] データセットではなくアイデンティティに基づいてドメインを再定義し、生きた属性とアイデンティティ属性をアンタングルすることを目的としています。
提案手法は,クロスデータセットおよび限られたソースデータセットシナリオ下での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:39:58 GMT)
RATT: A Thought Structure for Coherent and Correct LLM Reasoning [23.3] 本稿では,思考過程の各段階における論理的健全性と事実的正当性の両方を考慮した新しい思考構造であるRetrieval Augmented Thought Tree(RATT)を紹介する。
様々な種類のタスクに関する実験では、RATT構造が既存の手法を事実的正当性と論理的整合性で著しく上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:07:19 GMT)
Threats and Defenses in Federated Learning Life Cycle: A Comprehensive Survey and Challenges [22.8] Federated Learning (FL)は、プライバシ保護協調機械学習(ML)のための革新的なソリューションを提供する
その有望な可能性にもかかわらず、FLは分散した性質のため、様々な攻撃に対して脆弱である。
本稿では、FLサービスライフサイクル全体を通じて最も代表的で最先端の脅威および防衛フレームワークについてレビューする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:50:03 GMT)
Investigating LLMs as Voting Assistants via Contextual Augmentation: A Case Study on the European Parliament Elections 2024 [22.5] 最近の研究は、大規模言語モデルにおける政治的偏見と政治的推論能力を探究している。
2024年の欧州議会議員選挙では、LLMsがVoting Advice Applications (VAA)として利用できるかどうかを調査している。
我々は、MISTRALとMIXTRALモデルを評価し、最新の「EUとI」投票支援アンケートに基づいて、政党の姿勢を予測する際の精度を評価した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:29:28 GMT)
Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.3] 教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。
RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。
本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:58:49 GMT)
Haar Nuclear Norms with Applications to Remote Sensing Imagery Restoration [22.3] 本稿では,Har Nuclear norm (HNN) という,高効率かつ効率的なリモートセンシング画像復元のための新しい低ランク正規化用語を提案する。
2次元前方スライス-ワイド・ハール離散ウェーブレット変換から導出されるウェーブレット係数の低ランク特性を利用する。
ハイパースペクトル像の着色, マルチテンポラル画像雲の除去, ハイパースペクトル像の脱色実験により, HNNの可能性が明らかとなった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:46:47 GMT)
Lynx: An Open Source Hallucination Evaluation Model [22.0] LYNXは幻覚検出LLMであり、現実の幻覚に挑戦するシナリオについて高度な推論を行うことができる。
HaluBenchは、さまざまな現実世界のドメインから得られた15kサンプルからなる、包括的な幻覚評価ベンチマークである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:22:17 GMT)
Model Tells You Where to Merge: Adaptive KV Cache Merging for LLMs on Long-Context Tasks [21.8] KVMergerと呼ばれる新しいKVキャッシュマージ手法を提案し、長文タスクに対して適応的なKVキャッシュ圧縮を実現する。
我々のアプローチは、キー状態が1つのシーケンス内のトークンレベルで高い類似性を示すという興味深い観察にインスパイアされている。
我々は,制約メモリ予算下での長時間コンテキストタスクに対するKVMergerの有効性を示すため,広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:50:42 GMT)
SpikeGPT: Generative Pre-trained Language Model with Spiking Neural Networks [21.6] スパイキングニューラルネットワーク(SNN)はスパースとイベント駆動のアクティベーションを活用して、モデル推論に関連する計算オーバーヘッドを削減する。
イベント駆動型スパイクアクティベーションユニットを用いた生成言語モデルを実装した。
SpikeGPTは、これまでで最大のバックプロパゲーション訓練SNNモデルであり、自然言語の生成と理解の両方に適している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:16:12 GMT)
Scalar Function Topology Divergence: Comparing Topology of 3D Objects [21.5] コンピュータビジョンのための新しいトポロジツール - Scalar Function Topology Divergence (SFTD) を提案する。
SFTDは、共通領域を持つ2つの函数の下位レベル集合の間の多重スケール位相の相似性を測定する。
提案ツールは,関数が位相的相似性を持つ領域を視覚化する有用なツールである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:18:54 GMT)
AoA-Based Physical Layer Authentication in Analog Arrays under Impersonation Attacks [21.4] 本稿では、アナログアレイ多重出力多重出力(MIMO)システムにおける認証手段として、到着角(AoA)の使用について議論する。
アナログアレイを備えた基地局は、認証されたパイロット送信から推定されるAoAに基づいてユーザを認証し、アクティブアタッカーは送信された信号を操作して偽装攻撃をマウントする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:30:04 GMT)
GeNet: A Multimodal LLM-Based Co-Pilot for Network Topology and Configuration [21.2] GeNetは、大規模言語モデル(LLM)を利用してネットワーク設計を合理化するための新しいフレームワークである。
視覚的およびテキスト的モダリティを使用して、ネットワークトポロジとデバイス構成をユーザ意図に基づいて解釈し、更新する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:51:57 GMT)
Boosting Adversarial Transferability for Skeleton-based Action Recognition via Exploring the Model Posterior Space [20.9] ヒト活動認識(HAR)における骨格運動の役割
以前の攻撃はすべて、未知のS-HARモデル間の転送に苦労した。
本稿では,サロゲートの集合に対するモデル後部空間を効果的に探索できるDual Bayesian戦略を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:59:31 GMT)
Deep Understanding of Soccer Match Videos [20.8] サッカーは世界中で最も人気のあるスポーツの1つであり、主要な試合で頻繁に放送される。
本システムでは, サッカーボール, 選手, 審判などの重要な物体を検知できる。
また、プレイヤーとボールの動きを追跡し、プレイヤーの番号を認識し、シーンを分類し、ゴールキックのようなハイライトを識別する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:54:13 GMT)
BiasPruner: Debiased Continual Learning for Medical Image Classification [20.6] BiasPrunerは、学習のショートカットにつながる可能性のあるトレーニングデータの素早い相関を意図的に忘れるCLフレームワークである。
推論中、BiasPrunerは、予測に最適なバイアス付きサブネットワークを選択するために、単純なタスクに依存しないアプローチを採用している。
皮膚病変分類と胸部X線分類の3つの医学データセットについて実験を行い,BiasPrunerがSOTA CL法を常に上回っていることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:45:57 GMT)
On the Foundations of Shortcut Learning [20.5] 予測と可用性が形状モデルの特徴的利用とどのように相互作用するかを考察する。
線形モデルは比較的偏りがないが、ReLUやTanhの単位を持つ単一の隠蔽層を導入するとバイアスが生じる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 23:03:09 GMT)
Large Pre-trained time series models for cross-domain Time series analysis tasks [20.2] 本稿では,事前学習中に最適なデータセット固有のセグメンテーション戦略を自動的に識別する,テクスタイディショナルセグメンテーションの新たな手法を提案する。
これにより、異なるダウンストリーム時系列分析タスクに微調整され、ゼロショット設定下では、LPTMはドメイン固有の最先端モデルと同等かそれ以上の性能を発揮する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:32:12 GMT)
Operationalizing the Blueprint for an AI Bill of Rights: Recommendations for Practitioners, Researchers, and Policy Makers [20.2] 世界の様々な国でいくつかの規制の枠組みが導入されている。
これらのフレームワークの多くは、AIツールの監査と信頼性向上の必要性を強調している。
これらの規制の枠組みは実施の必要性を強調しているが、実践者はしばしば実施に関する詳細なガイダンスを欠いている。
我々は、最先端の文献の分かりやすい要約を提供し、規制ガイドラインと既存のAI研究の間に存在する様々なギャップを強調します。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:28:07 GMT)
DINO-Tracker: Taming DINO for Self-Supervised Point Tracking in a Single Video [20.1] DINO-Trackerは、ビデオの長時間の密集追跡のための新しいフレームワークだ。
単一のビデオ上でのテスト時間トレーニングと、事前トレーニングされたDINO-ViTモデルによって学習された強力なローカライズされたセマンティック機能を組み合わせる。
DINOトラッカーは自己管理手法よりも優れ、最先端のトラッカーと競合する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:47:26 GMT)
From Supervised to Generative: A Novel Paradigm for Tabular Deep Learning with Large Language Models [18.2] GTL(Generative Tabular Learning)は、大規模言語モデル(LLM)の高度な機能を統合する新しいフレームワークである。
我々の実証的研究は、GTLのスケーリングの振る舞いを厳格に分析し、384の公開データセットにまたがる。
GTL-LLaMA-2モデルは、多くの分類および回帰タスクにまたがる優れたゼロショットおよびインコンテキスト学習能力を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:09:19 GMT)
OmniNOCS: A unified NOCS dataset and model for 3D lifting of 2D objects [18.1] OmniNOCSは3次元正規化オブジェクト座標空間(NOCS)マップ,オブジェクトマスク,および3次元バウンディングボックスアノテーションを備えた大規模モノクラーデータセットである。
我々はOmniNOCSを用いて、新しい変圧器ベースの単分子NOCS予測モデル(NOCSformer)を訓練する。
これは、2Dボックスで誘導される場合に幅広いクラスに一般化できる最初のNOCSモデルである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:49:05 GMT)
Tactics, Techniques, and Procedures (TTPs) in Interpreted Malware: A Zero-Shot Generation with Large Language Models [18.0] OSSマルウェアはソフトウェアサプライチェーン攻撃において重要な役割を果たす。
我々は,解釈されたマルウェアパッケージのTTPを抽出するゼロショットアプローチであるGENTTPを提案する。
GENTTPは高い精度と効率でTPを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:18:41 GMT)
Enhancing context models for point cloud geometry compression with context feature residuals and multi-loss [17.9] 点雲幾何学的圧縮では、コンテキストモデルは通常、ノード占有率の1ホット符号化をラベルとして使用する。
コンテキスト間の差異を増幅するために、コンテキストモデルにコンテキスト特徴残差を導入する。
また、出力とノード占有率の平均2乗誤差を損失関数として用いた多層知覚分岐も追加する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:08:37 GMT)
CoReS: Orchestrating the Dance of Reasoning and Segmentation [17.8] セグメンテーションを推論する行為は、人間の視覚探索の認知段階を反映すべきである。
本稿では,Reasoning and Segmenting (CoReS) の連鎖を紹介する。
実験では、ReasonSegデータセットで最先端の手法を6.5%上回るCoReSの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:25:06 GMT)
SpecTra: Enhancing the Code Translation Ability of Language Models by Generating Multi-Modal Specifications [17.6] 大規模言語モデル(LLM)は、コード翻訳の自動化作業にますます利用されている。
本稿では,新しい自己整合性フィルタを用いて,まず高品質な仕様を生成するマルチステージアプローチであるSpecTraを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:27:56 GMT)
The ODE Method for Stochastic Approximation and Reinforcement Learning with Markovian Noise [17.5] 近似アルゴリズムを解析する根本的な課題は、その安定性を確立することである。
本稿では,マルティンゲール差分雑音設定からマルコフ雑音設定へ有界な安定に対するボルカー・メイン定理を拡張する。
我々の分析の中心は、少数の関数の変化の減少率であり、これは多量の強い法則の形式とよく用いられるV4 Lynovドリフト条件の両方によって示唆される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:51:39 GMT)
SummaryMixing: A Linear-Complexity Alternative to Self-Attention for Speech Recognition and Understanding [17.4] 本稿では,自己注意に対する線形時間的代替案を提案する。
すべての時間ステップの平均オーバーベクターとの発話を要約する。
この単一の要約は、時間固有の情報と結合される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:20:23 GMT)
Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models? [17.0] 大規模言語モデル、特に多言語モデルは設計され、主張され、様々な言語の母語話者に適応することが期待されている。
これらのモデルを微調整し評価する現在の実践は、翻訳に大きく依存しているため、この目的と完全に一致しない可能性があると仮定する。
命令データの性質がモデル出力に影響を及ぼすかどうかは不明であるが、逆に、翻訳されたテストセットがそのようなニュアンスを捕捉できるかどうかは疑問である。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:37:24 GMT)
Slice-100K: A Multimodal Dataset for Extrusion-based 3D Printing [16.9] Gコード(Geometric code)またはRS-274は、最も広く使われているコンピュータ数値制御(CNC)および3Dプリンティング言語である。
現在、加法製造用のGコードファイルとともに、キュレートされたCADモデルの大規模なリポジトリは存在しない。
本稿では,10000以上のGコードファイルからなる最初期のデータセットであるSLICE-100KとCADモデルについて述べる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:23:35 GMT)
Enhancing Thermal Infrared Tracking with Natural Language Modeling and Coordinate Sequence Generation [16.9] 本研究では,座標情報と時間情報の利用性を高めるNLMTrackという新しいモデルを提案する。
実験により、NLMTrackは複数のベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:06:31 GMT)
Mitigating Catastrophic Forgetting in Language Transfer via Model Merging [16.8] ブランチ・アンド・マージ(BaM)は複数のモデルを反復的にマージする手法である。
BaMは、これが低等級であるがより高い品質の重量変化をもたらすという知見に基づいている。
ブルガリア語とドイツ語の実証研究において、BaMは、マッチングやターゲットドメインの性能の向上を伴いながら、忘れを著しく低減できることを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:32:40 GMT)
Learning to Break: Knowledge-Enhanced Reasoning in Multi-Agent Debate System [16.8] マルチエージェント討論システム(MAD)は、真理を追求する人間の議論の過程を模倣する。
様々なエージェントが、限られた知識の背景から、適切に、高度に一貫した認知をさせることは困難である。
本稿では,Underline Knowledge-underlineEnhanced frameworkを用いたUnderlineMulti-underlineAgent UnderlineDebateを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:28:56 GMT)
VLind-Bench: Measuring Language Priors in Large Vision-Language Models [16.7] LVLM(Large Vision-Language Models)は、様々なマルチモーダルタスクにおいて優れた性能を示す。
それらは、画像情報を無視しながら、テキストパターンのみに基づいて応答が生成される、言語事前(Language prior)と呼ばれる問題に悩まされる。
我々は,LVLMの言語先行性を測定するために設計された最初のベンチマークであるVLind-Benchという新しいベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:32:48 GMT)
AI-Enhanced Virtual Reality in Medicine: A Comprehensive Survey [16.7] 本稿では、医療・サービスにおけるAIによるVR応用の急成長分野を包括的に検討する。
系統分類を導入することで、関連する技術と応用を慎重に3つの明確に定義されたカテゴリに分類する。
この分類は、医療領域でAIによって駆動されるVRが果たす様々な役割を構造化された探索を可能にする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:50:50 GMT)
Semantic GUI Scene Learning and Video Alignment for Detecting Duplicate Video-based Bug Reports [16.5] ビデオベースのバグレポートは、グラフィカルユーザインタフェース(GUI)を中心としたプログラムのバグの文書化にますます利用されている。
我々は、視覚変換器のシーン学習機能に適応して、アプリUI画面に現れる微妙な視覚的およびテキスト的パターンをキャプチャする、JANUSと呼ばれる新しいアプローチを導入する。
Janus氏はまた、ビデオフレームの適応重み付けが可能なビデオアライメント技術を使用して、典型的なバグ発生パターンを考慮している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:48:36 GMT)
Venomancer: Towards Imperceptible and Target-on-Demand Backdoor Attacks in Federated Learning [16.0] 本稿では,効果的なバックドア攻撃であるVenomancerを提案する。
この方法は、Norm Clipping、Wak DP、Krum、Multi-Krum、RLR、FedRAD、Deepsight、RFLBATといった最先端の防御に対して堅牢である。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:29:06 GMT)
Do Zombies Understand? A Choose-Your-Own-Adventure Exploration of Machine Cognition [16.0] 我々は、この議論の反対者は理解のために異なる定義を持ち、特に意識の役割に対する彼らの見解が異なると論じる。
我々は、Z$が理解できるかどうかを問うとともに、初歩的なAI研究における異なる思考の流派が、この疑問に異なる形で答えていることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:39:31 GMT)
ZeroI2V: Zero-Cost Adaptation of Pre-trained Transformers from Image to Video [16.0] ビデオ領域に画像モデルを適用することは、ビデオ認識タスクを解くための効率的なパラダイムとして現れている。
最近の研究は、パラメータ効率のよい画像から映像への適応に焦点を移している。
画像変換器をビデオ認識タスクに転送する新たな適応パラダイム(ZeroI2V)を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:53:59 GMT)
Synchronous Diffusion for Unsupervised Smooth Non-Rigid 3D Shape Matching [15.8] 非剛性3次元形状整合問題において,正則化として用いる同期拡散過程を提案する。
我々の新しい規則化は、特にトポロジカルノイズの存在下で、形状整合の最先端性を大幅に向上させることができることを実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:45:06 GMT)
Characterizing Large Language Model Geometry Helps Solve Toxicity Detection and Generation [15.8] 大規模言語モデル(LLM)は、現在のAIのブレークスルーを促進する。
我々は幾何学のレンズを通してLLMの内部機構に光を当てた。
我々は,任意の(事前学習された)LLMから抽出できる解釈可能な幾何学的特徴を導出する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:32:19 GMT)
An Improved Traditional Chinese Evaluation Suite for Foundation Model [15.7] 従来の中国語理解のための新しいベンチマークTMMLU+を提案する。
小学校から専門職まで66名の被験者を対象とする多票質問回答データセットである。
我々はまた、1.8Bから72Bまでのパラメータのクローズドソースモデルと26のオープンウェイト中国語大言語モデル(LLM)をベンチマークした。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:41:14 GMT)
Multimodal Sentiment Analysis with Missing Modality: A Knowledge-Transfer Approach [15.5] マルチモーダル感情分析は、視覚的、言語的、音響的手がかりを通じて、個人が表現する感情を特定することを目的としている。
既存の研究努力の多くは、すべてのモダリティがトレーニングとテストの両方で利用可能であり、そのアルゴリズムが欠落したモダリティシナリオに影響を受けやすいと仮定している。
本稿では,欠落した音声のモダリティを再構築するために,異なるモダリティ間の翻訳を行う新しいナレッジ・トランスファーネットワークを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:34:37 GMT)
ElasticAST: An Audio Spectrogram Transformer for All Length and Resolutions [15.5] オーディオスペクトログラム変換器(AST)のようなトランスフォーマーベースのモデルは、CNNから固定サイズの入力パラダイムを継承する。
本稿では,ASTモデルを用いた可変長音声入力を,学習と推論の両方で利用するためのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:29:56 GMT)
HO-FMN: Hyperparameter Optimization for Fast Minimum-Norm Attacks [14.6] 本稿では,よく知られた高速最小ノルム攻撃アルゴリズムのパラメトリック変種を提案する。
我々は12のロバストモデルを再評価し、追加のチューニングを必要とせずに敵の摂動が小さくなることを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:30:01 GMT)
FlashAttention-3: Fast and Accurate Attention with Asynchrony and Low-precision [14.4] 注意は、大きな言語モデルと長いコンテキストアプリケーションのボトルネックです。
我々はGPUに注意を向ける3つの主要な技術を開発した。
提案手法であるFlashAttention-3は,FP16が最大740 TFLOPs/s(75%利用)に達し,FP8が1.2 PFLOPs/sに到達して,H100 GPU上で1.5-2.0$timesの高速化を実現していることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:44:48 GMT)
SliceMamba for Medical Image Segmentation [14.4] SliceMambaは、ローカルに機密性の高い純粋なMamba医療画像セグメンテーションモデルである。
提案されているSliceMambaには、効率的な双方向スライススキャンモジュール(BSS)が含まれている。
これにより、空間的に隣接した特徴が走査シーケンスの近接性を維持することができ、セグメンテーション性能が向上する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:13:31 GMT)
RAIFLE: Reconstruction Attacks on Interaction-based Federated Learning with Adversarial Data Manipulation [14.4] 利用者は、中央サーバでプライベートなインタラクションを再構築するリスクが高くなる。
我々は、新しい最適化ベースの攻撃フレームワークであるRAIFLEを紹介する。
本実験は, RAIFLEが既存の再建攻撃よりもはるかに強力であることを示すものである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:04:27 GMT)
Unraveling overoptimism and publication bias in ML-driven science [14.4] 最近の研究では、機械学習モデルのパフォーマンスが過度に最適化されていることが示唆されている。
本稿では,パラメトリック学習曲線と前述のバイアスを統合することで,観測精度の新たなモデルを提案する。
神経学的条件の分類のメタ分析にモデルを適用し、各領域におけるMLに基づく予測の固有の限界を推定する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:40:20 GMT)
Improving Visual Place Recognition Based Robot Navigation Through Verification of Localization Estimates [14.4] 本研究では,視覚的位置認識のためのMLP(Multi-Layer Perceptron)整合性モニタを提案する。
従来の最先端のSVMアプローチよりもパフォーマンスと一般化性が改善されている。
提案手法を実世界の広範囲な実験で検証し、2つの実時間完全性に基づくVPR検証手法を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:47:14 GMT)
Constraining Ultralight Dark Matter through an Accelerated Resonant Search [14.2] 核磁気共鳴モードで動作する磁気センサを用いて,超軽量軸索ダークマターの核子結合について検討した。
超高感度の0.73 fT/Hz$1/2$を約5Hzで達成し、約1.5$times 10-23,rmeV/Hz1/2$のエネルギー分解能に対応する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:36:08 GMT)
Towards Building Specialized Generalist AI with System 1 and System 2 Fusion [14.1] 特殊汎用人工知能(SGAI、SGI)は、人工知能(AGI)にとって重要なマイルストーンである。
我々は,SGIを専門的スキルと一般性パフォーマンスのレベルに基づいて3つの段階に分類する。
本稿では,システム1と2の認知処理の強みを統合したSGI開発のための概念的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:23:16 GMT)
Three-layer deep learning network random trees for fault detection in chemical production process [14.0] 3層深層学習ネットワークランダムツリー(TDLN-trees)と呼ばれる新しい断層検出モデルを提案する。
まず、ディープラーニングコンポーネントは、産業データから時間的特徴を抽出し、それらを組み合わせて高レベルのデータ表現に変換する。
次に、機械学習コンポーネントは、最初のステップで抽出された特徴を処理し、分類する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:03:49 GMT)
Portrait4D-v2: Pseudo Multi-View Data Creates Better 4D Head Synthesizer [14.0] フィードフォワードワンショット4Dヘッドアバター合成のための新しい学習手法を提案する。
データ駆動方式で4Dヘッドシンセサイザーを学習するために擬似多視点ビデオを用いる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:59:02 GMT)
Rethinking the Threat and Accessibility of Adversarial Attacks against Face Recognition Systems [13.8] 顔認識パイプラインは、信頼、公平、責任あるAIアプリケーションにおいてミッションクリティカルなシステムに広くデプロイされている。
敵の攻撃の出現は、認識パイプライン全体のセキュリティを脅かしている。
我々は,ブラックボックスの顔認識パイプラインに対して,AdvColorという,効果的かつ容易に起動可能な物理的敵攻撃を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:58:09 GMT)
DALL-M: Context-Aware Clinical Data Augmentation with LLMs [13.8] 臨床データを用いた拡張技術により臨床コンテキストを向上する新しい手法を提案する。
本稿では,大言語モデル(LLM)を用いて患者コンテキスト合成データを生成する臨床データ拡張の先駆的アプローチを提案する。
この方法論は、医療におけるより堅牢なディープラーニングモデルのトレーニングに不可欠です。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:01:50 GMT)
Joint Optimization of Age of Information and Energy Consumption in NR-V2X System based on Deep Reinforcement Learning [13.6] 5Gニューラジオ(NR)技術に基づくV2X仕様。
モード2サイドリンク(SL)通信はLTE-V2Xのモード4に似ており、車両間の直接通信を可能にする。
この影響を緩和するために 干渉キャンセル法が使われています。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:54:38 GMT)
Deep Polarization Cues for Single-shot Shape and Subsurface Scattering Estimation [13.6] 半透明物体の形状と地下散乱(SSS)パラメータを共同で推定する新しい学習手法を提案する。
観測の結果,SSSは光強度だけでなく偏光信号にも影響を及ぼすことがわかった。
偏光半透明物体の大規模合成データセットを導入し,モデルの学習を行った。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:00:24 GMT)
Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models [13.5] 利用可能な最大規模でトレーニングされた最先端モデルの機能と推論能力の劇的な破壊を実演する。
モデルは、問題の解決に影響を与えない、微妙な問題バリエーションでさえも強い変動を示すため、その分解は劇的である。
これらの初期観測は、現在世代の大言語モデルが主張する能力の再評価を急激に促すものである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:17:36 GMT)
DeepCodeProbe: Towards Understanding What Models Trained on Code Learn [13.1] 本稿では,MLモデルの構文と表現学習能力を調べるための探索手法であるDeepCodeProbeを紹介する。
コードクローン検出,コード要約,コメント生成の最先端モデルにDeepCodeProbeを適用した。
発見によると、小さなモデルは抽象構文表現をキャプチャするが、プログラミング言語の構文を完全に把握する能力は限られている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 23:16:44 GMT)
Long-range Turbulence Mitigation: A Large-scale Dataset and A Coarse-to-fine Framework [12.9] 大規模実時間長距離大気乱流データセット(RLR-AT)を構築した。
このデータセットは、1Kmから13Kmまでの距離に1500の乱流配列を含む。
本研究では, 動的乱流と静的背景に協調して, 強歪みの処理を行う粗大なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:38:02 GMT)
A Taxonomy for Data Contamination in Large Language Models [12.6] 増大する懸念は、事前学習コーパスに評価データセットを含めることができるデータ汚染である。
このようなデータを検知し、除去するプロセスである汚染除去は、潜在的な解決策である。
下流タスクにおける言語モデルの性能に異なる種類の汚染がどのような影響を及ぼすかは、完全には理解されていない。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:50:34 GMT)
ProxyGPT: Enabling Anonymous Queries in AI Chatbots with (Un)Trustworthy Browser Proxies [12.6] 本稿では,人気チャットボットプラットフォームにおける匿名クエリを可能にするプライバシ強化システムであるProxyGPTを提案する。
このシステムはTLSが支援するデータ証明、エンドツーエンドの暗号化、匿名支払いといった重要なセキュリティ特性をサポートするように設計されている。
人間の評価によると、従来のAIチャットボットと比べて、ProxyGPTはユーザーのプライバシーの感覚を高める。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:08:04 GMT)
Spatially-Variant Degradation Model for Dataset-free Super-resolution [12.3] 本稿では,データセットのないBlind Image Super-Resolution (BISR)に焦点を当てる。
我々は,各画素に対して空間変動分解モデルを明示的に設計した最初の人物である。
提案手法は,従来のBISR法に比べて1dB(2x)の平均的な改善を実現している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:54:43 GMT)
A Graph-Based Approach for Category-Agnostic Pose Estimation [12.3] 任意のオブジェクトカテゴリに対するキーポイントのローカライズを可能にするために、カテゴリに依存しないポーズ推定(CAPE)を導入した。
本稿では、入力ポーズデータをグラフとして扱うことにより、キーポイントを独立したエンティティとして扱う従来のCAPE技術との大きな違いを示す。
提案手法は1ショット設定で0.98%向上し,CAPEの新たな最先端を実現する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:00:04 GMT)
Cloud Atlas: Efficient Fault Localization for Cloud Systems using Language Models and Causal Insight [12.3] 我々は、クラウドシステムのための因果グラフを自動的に合成する新しいアプローチであるAtlasを提示する。
我々はAtlasをさまざまな障害局所化シナリオで評価し、Atlasがスケーラブルで一般化可能な方法で因果グラフを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:31:12 GMT)
Federated Learning and AI Regulation in the European Union: Who is liable? An Interdisciplinary Analysis [12.1] 欧州連合人工知能法は、機械学習アプリケーションの開発とデプロイにおいて、明確な利害関係者の責任を委任する。
Federated Learningは、データサイロを越えた生成AIモデルのトレーニングを可能にし、データセキュリティを改善しながら、モデルパラメータのみを共有する。
私たちの仕事は、双方の役割を明確にすることに貢献し、責任をサーバオペレータにシフトするための戦略を説明し、オープンな技術的課題を指摘します。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:41:16 GMT)
Fish-bone diagram of research issue: Gain a bird's-eye view on a specific research topic [11.6] 本研究の目的は、因果関係を含む魚骨図を提供することによって、初心者研究者を支援することである。
それは、関連性および論理的要因に基づいて、研究分野の幅広い、高度に一般化された視点を提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:18:54 GMT)
Task-Driven Uncertainty Quantification in Inverse Problems via Conformal Prediction [11.4] 逆問題の画像化では、画像が欠落/破損した測定結果から回復しようとする。
検索した画像が下流タスクに使用されるアプリケーションによって動機付けられ,不確実性定量化のためのタスク中心のアプローチを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:53:34 GMT)
HAFormer: Unleashing the Power of Hierarchy-Aware Features for Lightweight Semantic Segmentation [11.3] 本稿では,CNNの階層的特徴抽出能力とTransformerのグローバル依存性モデリング機能を組み合わせたモデルであるHAFormerを紹介する。
HAFormerは計算オーバーヘッドを最小限に抑え、コンパクトなモデルサイズで高性能を実現する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:19:44 GMT)
Evaluating Deep Neural Networks in Deployment (A Comparative and Replicability Study) [11.2] ディープニューラルネットワーク(DNN)は、安全クリティカルなアプリケーションでますます利用されている。
デプロイにおけるDNNの信頼性を評価するために提案されている最近のアプローチについて検討する。
複製パッケージ上でこれらのアプローチの結果を実行して再現することは困難であり、それ自身以外のアーティファクト上でも実行することがさらに困難であることに気付きました。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:58:12 GMT)
Hardware Neural Control of CartPole and F1TENTH Race Car [11.1] この研究は、教師付き学習でNMPCを模倣するように訓練されたハードウェアFPGAニューラルネットワークコントローラの使用を実証する。
我々は、安価な組み込みFPGAハードウェアに実装されたこれらのニューラルコントローラを用いて、物理カートポールとF1TENTHレースカーの高周波制御を行う。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:14:19 GMT)
Potential Societal Biases of ChatGPT in Higher Education: A Scoping Review [10.8] 生成人工知能(GAI)モデル(ChatGPTなど)は、広範なデータセットのトレーニングによって社会的バイアスを継承または増幅することができる。
高等教育機関(HEIs)における学生、教員、職員のGAI利用の増加に伴い、これらの技術に関連する倫理的問題や潜在的なバイアスについて検討することが急務である。
このスコーピングレビューは,近年の学術出版物において,GAIに関連するバイアスがどのように研究され,議論されているかを明らかにすることを目的としている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:25:36 GMT)
Gap Completion in Point Cloud Scene occluded by Vehicles using SGC-Net [10.7] 本研究では,都市景観のギャップを埋めることのできるモデルを学ぶために,深層ニューラルネットワークを活用する新しい手法を提案する。
我々は、空隙のないシーンにおける道路境界に沿って仮想車両モデルを配置し、レイキャストアルゴリズムを用いて、空隙のある新しいシーンを作成する革新的な手法を開発した。
実験の結果、満点の97.66%が、高密度の地上真理点雲のシーンと比較して5cmの範囲内にあることが明らかとなった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:36:40 GMT)
Three-dimensional Microstructural Image Synthesis from 2D Backscattered Electron Image of Cement Paste [10.6] フレームワーク(CEM3DMG)は、2D後方散乱電子(BSE)画像から微細構造情報を学習することにより3D画像を合成するように設計されている。
視覚的な観察により、生成された3D画像は細孔や粒子形態を含む2D画像と類似した微細構造を示すことが確認された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:49:21 GMT)
Visual Multi-Object Tracking with Re-Identification and Occlusion Handling using Labeled Random Finite Sets [10.6] 本稿では、オブジェクトの出現と隠蔽を解消するオンライン視覚多目的追跡(MOT)アルゴリズムを提案する。
我々の解は、ラベル付きランダム有限集合 (LRFS) フィルタリングアプローチに基づいている。
本稿では,トラックの重なり合う部分とそのサイズを考慮したファジィ検出モデルを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:15:21 GMT)
Explicit_NeRF_QA: A Quality Assessment Database for Explicit NeRF Model Compression [10.5] 我々は、NeRF圧縮研究の課題に対処するため、Explicit_NeRF_QAと呼ばれる新しいデータセットを構築した。
4つの典型的なNeRFモデルをトレーニングするために,22個の3Dオブジェクトを多様なジオメトリ,テクスチャ,材料複雑度で使用しています。
実験室環境における主観的な実験を行い、21人の視聴者から主観的なスコアを収集する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:02:05 GMT)
UICrit: Enhancing Automated Design Evaluation with a UICritique Dataset [10.4] 983のモバイルUIに対して,設計批判と品質評価をターゲットとしたデータセットを提示する。
LLM生成UIフィードバックにおける55%のパフォーマンス向上を実現するために,このデータセットを適用した。
生成UI技術に対する報酬モデルのトレーニングを含む,このデータセットの今後の応用について論じる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:18:19 GMT)
Uncovering Emergent Spacetime Supersymmetry with Rydberg Atom Arrays [10.3] 我々は、Rydberg原子配列を用いた三臨界イジング遷移を実現することを提案する。
このような系では、時空 SUSY はボソニックモードとそのフェルミオンパートナーの相関関数に自身を表わす。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:32:24 GMT)
Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression [10.2] DLRMは最先端のレコメンデーションシステムモデルであり、様々な業界アプリケーションで広く採用されている。
このプロセスの重大なボトルネックは、すべてのデバイスから埋め込みデータを集めるのに必要な全通信に時間を要することだ。
本稿では,通信データサイズを削減し,DLRMトレーニングを高速化するために,エラーバウンドの損失圧縮を利用する手法を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:31:53 GMT)
A Two-Stage Adverse Weather Semantic Segmentation Method for WeatherProof Challenge CVPR 2024 Workshop UG2+ [10.1] We propose a two-stage Deep Learning framework for the WeatherProof dataset Challenge。
この課題では,mIoU(Mean Intersection over Union)測定値で0.43の競争スコアを達成し,上位4位を確保した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:48:22 GMT)
Causal inference through multi-stage learning and doubly robust deep neural networks [10.0] ディープニューラルネットワーク(DNN)は、大規模教師付き学習問題において顕著な経験的性能を示した。
本研究は、複雑な因果推論タスクの幅広い範囲にわたるDNNの適用について検討する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:47:44 GMT)
Beyond Text: Leveraging Multi-Task Learning and Cognitive Appraisal Theory for Post-Purchase Intention Analysis [10.0] 本研究では,ユーザの行動を予測するための認知評価理論に基づくマルチタスク学習フレームワークを評価する。
実験の結果, ユーザの言語や特徴は, テキストのみから予測するモデル以上の予測を改善することがわかった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:57:52 GMT)
Urban Waterlogging Detection: A Challenging Benchmark and Large-Small Model Co-Adapter [10.0] 都市防水は公共の安全とインフラに大きなリスクをもたらす。
近年の進歩では、監視カメラ画像とディープラーニングによる検出が採用されているが、データ不足と環境条件の悪化に苦戦している。
我々は,現実の応用を進めるために,多様な有害な条件下で,挑戦的な都市水質評価ベンチマーク(UW-Bench)を構築した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:03:02 GMT)
Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.8] データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。
従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。
我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:14:22 GMT)
Generating Contextually-Relevant Navigation Instructions for Blind and Low Vision People [9.5] 不慣れな環境をナビゲートすることは、盲目と低視(BLV)の個人にとって大きな課題となる。
キッチンを探索したり、屋外でナビゲートしたりするなど、さまざまなシナリオで画像と目標のデータセットを構築します。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:40:36 GMT)
BriDe Arbitrager: Enhancing Arbitrage in Ethereum 2.0 via Bribery-enabled Delayed Block Production [9.5] We introduced Bride Arbitrager, a novel tool designed for 2.0 which leverageing Bribery-driven attack to Delay block production and increase arbitrage gains。
主な考え方は、悪意のあるプロポーザがバリデータやプロポーザを盗むことによって生産をブロックし、仲裁の機会を識別する時間を増やすことである。
結果として、ブリデ・アービタラガーは、投票権の限られた1/4の割合を敵が制御し、収賄によってブロック生産を遅らせ、より多くの利益を仲裁することができる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:26:31 GMT)
Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets with Unbalanced Modalities [9.5] 本研究では,データサンプルの不均一性だけでなく,機関間のデータモダリティの固有不均一性と不均一性を両立する新しいFLアーキテクチャを提案する。
マルチモーダルFLに適した分散勾配ブレンディングと近接対応クライアント重み付け戦略を考案した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:12:22 GMT)
Modulating Relaxation Time in Boundary-Dissipative Systems via Bond Dissipation [9.4] 本研究では, 結合散逸が境界散逸系の緩和時間に及ぼす影響について検討した。
我々の研究は、オープンシステムでは、ある種類の消散が、別の種類の消散によって生じる影響を規制するために使用できることを明らかにしている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:48:18 GMT)
Generalizable Physics-informed Learning for Stochastic Safety-critical Systems [8.3] 十分なリスク事象を伴わない短期サンプルを用いて,長期的リスク確率とその勾配を評価するための効率的な手法を提案する。
提案手法は, サンプル効率を向上し, 未確認領域を一般化し, システムパラメータの変化に適応できることをシミュレーションで示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:10:03 GMT)
A Comprehensive Survey on Human Video Generation: Challenges, Methods, and Insights [8.2] ヒューマンビデオ生成は、テキスト、オーディオ、ポーズなどの制御条件が与えられた生成モデルを用いて、2次元の人体ビデオシーケンスを合成することを目的としている。
近年の世代モデルの発展は、この分野への関心の高まりに確かな基盤を築き上げている。
著しい進歩にもかかわらず、キャラクターの整合性、人間の動きの複雑さ、環境との関わりの難しさなど、人間の映像生成の課題は依然として困難なままである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:09:05 GMT)
SoK: What don't we know? Understanding Security Vulnerabilities in SNARKs [8.2] ゼロ知識証明(ZKP)は、プライバシと検証可能性を提供する理論概念から、実用的な実世界の実装まで進化してきた。
SNARK(Succinct Non-Interactive Argument of Knowledge)は、最も重要なイノベーションのひとつ。
本稿では,実生活SNARK実装のエンドツーエンドセキュリティ特性の評価に焦点をあてる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:11:14 GMT)
A Closer Look at Logical Reasoning with LLMs: The Choice of Tool Matters [8.2] 論理的推論へのアプローチの性能のばらつきが、採用法や特定の記号解法に起因しているかどうかは不明である。
Z3,Pyke,Prover9の3つの帰納的推論ベンチマークとLarge Language Modelsを併用した実験を行った。
異なるLLMによって生成される記号翻訳のツール実行速度は、ほぼ50%の性能変化を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:06:25 GMT)
Foundation Model Engineering: Engineering Foundation Models Just as Engineering Software [8.1] Foundation Models (FM) は、データとモデルをソースコードとして扱うことで、新しいタイプのソフトウェアになる。
我々は、期待されるFM危機に対する戦略的対応であるファンデーションモデル(FM)エンジニアリングを導入するというビジョンを概説する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:40:02 GMT)
Tuning Vision-Language Models with Candidate Labels by Prompt Alignment [8.0] 視覚言語モデル(VLM)は、画像テキストペアの大規模なトレーニングデータセットから高品質な表現を学習することができる。
プロンプト学習は、下流タスクに適応するためにVLMを微調整する一般的なアプローチである。
本稿では,学習過程を候補ラベルでガイドする枠組みを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:46:24 GMT)
Automatic Outlier Rectification via Optimal Transport [7.4] コンケーブコスト関数を用いた最適輸送を用いた外乱検出のための新しい概念的枠組みを提案する。
コンケーブコスト関数を用いて最適な輸送距離を利用するための第一歩を踏み出し、修正セットを構築する。
次に、推定タスクを実行するための修正セット内での最適分布を選択する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:22:42 GMT)
From Real to Cloned Singer Identification [7.4] 歌手レベルのコントラスト学習方式を用いて学習した3つの埋め込みモデルを提案する。
3つのモデルがすべて、本物の歌手を識別できることを実証する。
しかし, 評価セットにおいて, 歌手のクローンバージョンを分類すると, 性能は低下する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:25:21 GMT)
How to beat a Bayesian adversary [7.0] 本研究では,ベイズ統計による攻撃を最大化ではなく,統計的アプローチを用いて決定する敵について検討する。
ベイズ対数問題は通常のミンマックス問題の緩和である。
我々は、Abramがマッキーン・ブラソフ過程を近似し、Abramの使用を正当化することを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:12:42 GMT)
Quantized area of the Schwarzschild black hole: A non-hermitian perspective [7.0] 我々は、シュワルツシルト質量の項で直接表現される制約のない還元ハミルトニアンを考える。
対応するホーキング温度とブラックホールエントロピーに関する新しい表現を導出する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:10:10 GMT)
Provably Good Solutions to the Knapsack Problem via Neural Networks of Bounded Size [7.0] 古典的なNP-hard Knapsack問題(NP-hard Knapsack problem)の例として,ニューラルネットワークの表現力について検討する。
最適クナプサック解を求めるには、最適クナプサック解の利益に依存する深さ4と幅のRNNが十分である。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:39:30 GMT)
Quantifying the Cross-sectoral Intersecting Discrepancies within Multiple Groups Using Latent Class Analysis Towards Fairness [6.7] 本研究は,クロスセクタ間差分を定量化するための革新的アプローチを導入する。
プロプライエタリなデータセットとパブリックなデータセットの両方を使用して、私たちのアプローチを検証する。
我々の発見は、少数民族間の大きな相違が明らかとなり、現実世界のAIアプリケーションにおいて標的となる介入の必要性が浮かび上がっている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:19:11 GMT)
A Text-to-Game Engine for UGC-Based Role-Playing Games [6.6] 本稿では,単純なテキスト入力を複雑でインタラクティブなRPG体験に変換する基礎モデルを用いたテキスト・ツー・ゲームエンジンの新しいフレームワークを提案する。
エンジンは、ゲームストーリーをマルチモーダル形式で動的にレンダリングし、プレイヤアクションに応じて、ゲームキャラクタ、環境、メカニックをリアルタイムで調整する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:33:19 GMT)
How Deep is your Guess? A Fresh Perspective on Deep Learning for Medical Time-Series Imputation [6.5] 深層学習を用いた時系列計算のための新しい分類フレームワークを提案する。
文献における概念的ギャップと既存のレビューを識別することにより、ニューラル・インパテーション・フレームワークの帰納的バイアスに基づく分類法を考案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:33:28 GMT)
Anatomy-aware and acquisition-agnostic joint registration with SynthMorph [6.0] アフィン画像登録は、医用画像解析の基盤となっている。
ディープラーニング(DL)メソッドは、画像対を出力変換にマッピングする関数を学ぶ。
ほとんどのアフィン法は、ユーザが調整したい解剖学に依存しない。つまり、アルゴリズムが画像のすべての構造を考慮すれば、登録は不正確なものになる。
われわれはこれらの欠点をSynthMorphで解決する。これは高速で対称で、微分型で使い易いDLツールで、任意の脳画像の関節アフィン変形性登録を行う。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:59:50 GMT)
A Comprehensive Study of Disaster Support Mobile Apps [6.0] 45の災害アプリと28,161のレビューを詳細に分析した。
これらのアプリの重要な機能13点を特定し,災害ライフサイクルの4段階に分類した。
分析の結果、アプリの警告機能、アプリの満足度、マップの利用について、最も議論の多かった22のトピックが明らかになった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:58:12 GMT)
Metasurface-based Snapshot Shortwave-Infrared Hyperspectral Image Reconstruction with Inter and Intra Prior Learning Network [6.0] 本稿では, 準曲面フィルタとそれに対応するフィルタ選択法に基づくSWIRハイパースペクトルイメージングシステムを提案する。
高品質なSWIRハイパースペクトル画像再構成を実現するために,新しい先進的および先進的学習展開フレームワークを提案する。
実験の結果,提案手法は既存の手法よりも高速かつ優れた性能でHSIを再構築可能であることが示された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:49:39 GMT)
Live Fitness Coaching as a Testbed for Situated Interaction [6.0] QEVDベンチマークとデータセットは、フィットネスコーチングの挑戦的かつ制御されながら現実的な領域における人間とAIの相互作用を探索する。
複雑な人間の行動を認識し、それらの行動に根ざした誤りを特定し、適切なフィードバックを提供するために補助的な視覚言語モデルを必要とする最初のベンチマークである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:10:45 GMT)
Mind the Gap! Bridging Explainable Artificial Intelligence and Human Understanding with Luhmann's Functional Theory of Communication [5.7] 我々は、説明可能な人工知能の課題を強調するために、社会システム理論を適用した。
我々は,インタラクティブかつ反復的な説明者の方向性で技術研究を再活性化することを目的としている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:13:04 GMT)
Delocalization of skin steady states [5.7] 逆皮膚局在を有する2つの鎖からなる直感的なリンドブラディアンを提案する。
シングルボディのシナリオでは、それはリウヴィリアのギャップのスケーリングのシフトに対応する。
多体シナリオでは, 定常的絡み合いのスケーリング挙動が領域法則から対数法則に変化することが明らかとなった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:03:54 GMT)
On the (In)Security of LLM App Stores [5.7] 本研究では,LLMアプリの潜在的なセキュリティリスクを特定するための3層懸念フレームワークを提案する。
本研究は,静的および動的解析,大規模有毒単語辞書の開発,自動監視ツールを統合した。
15,146のアプリが誤解を招く説明をし、1,366件の個人情報をプライバシーポリシーに対して収集し、15,996件の有害なコンテンツを生成した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:03:32 GMT)
NeuroIDBench: An Open-Source Benchmark Framework for the Standardization of Methodology in Brainwave-based Authentication Research [4.9] 脳活動に基づく生体認証システムは、パスワードに代わるものや、現在の認証技術を補完するものとして提案されている。
NeuroIDBenchは、脳波ベースの認証モデルをベンチマークするための柔軟なオープンソースツールである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:18:17 GMT)
WayveScenes101: A Dataset and Benchmark for Novel View Synthesis in Autonomous Driving [4.9] WayveScenes101は、新しいビュー合成において、コミュニティが技術の状態を前進させるのを助けるために設計されたデータセットである。
データセットは、幅広い環境条件と運転シナリオにわたる101の運転シーンで構成されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:29:45 GMT)
A Review of Nine Physics Engines for Reinforcement Learning Research [4.4] Reviewは、強化学習(RL)のためのシミュレートされた物理環境を作成するためのツールの選択を研究者に指導することを目的とする。
人気、機能範囲、品質、ユーザビリティ、RL機能に基づいて9つのフレームワークを評価する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:13:28 GMT)
Robust Generalization of Graph Neural Networks for Carrier Scheduling [4.3] 本稿では,1000ノードまでのネットワークへの一般化(再学習なしで)を改善するGNNベースのスケジューラであるRobustGANTTを紹介する。
我々の研究は、大規模バックスキャッターネットワークにおける資源利用を改善するだけでなく、学習ベースのスケジューリングに関する貴重な洞察も提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:13:24 GMT)
Masked Particle Modeling on Sets: Towards Self-Supervised High Energy Physics Foundation Models [4.3] Masked Particle Modeling (MPM) は、無秩序な入力集合上の汎用的、転送可能、再利用可能な表現を学習するための自己教師付き手法である。
本研究では,コライダー物理実験における高エネルギージェットの試料中の方法の有効性について検討した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:55:25 GMT)
CADC: Encoding User-Item Interactions for Compressing Recommendation Model Training Data [4.2] ディープラーニングレコメンデーションモデル(DLRM)は、現在のeコマース産業の中心にある。
トレーニングデータセットを減らす1つのアプローチは、ユーザとイテムのインタラクションを削除することだ。
本論文は,ユーザとユーザ間のインタラクション履歴をキャプチャしてユーザとアイテムの埋め込みを豊かにすることができれば,モデル精度を損なうことなく,インタラクション履歴を圧縮できることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:54:56 GMT)
United We Stand: Decentralized Multi-Agent Planning With Attrition [4.2] 分散計画は情報収集タスクのための協調型マルチエージェントシステムの鍵となる要素である。
本稿では,アクティブエージェントの集合の変化に時間的かつ効率的に適応できる分散アルゴリズムであるAttritable MCTSを提案する。
A-MCTSは高故障率でも効率よく適応できることを理論的および実験的に示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:55:50 GMT)
Scalable microwave-to-optical transducers at single photon level with spins [4.1] 単一光子のマイクロ波から光への変換は、将来の超伝導量子デバイス間の相互接続において重要な役割を果たす。
我々はレアアースイオン(REI)ドープ結晶を用いたオンチップマイクロ波-光変換器を実装した。
我々は、原子遷移の絶対周波数によって実現された2つの同時に動作するトランスデューサに由来する光子の干渉を実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:43:02 GMT)
Enhancing Performance and User Engagement in Everyday Stress Monitoring: A Context-Aware Active Reinforcement Learning Approach [4.1] 本稿では,スマートウォッチとスマートフォンのコンテキストデータを用いたストレス検出のための,新しい文脈認識型アクティブラーニング(RL)アルゴリズムを提案する。
提案手法では,EMAの展開に最適な時刻を動的に選択し,ユーザの即時コンテキストを利用してラベルの精度を最大化し,侵入性を最小化する。
この研究は、パーソナライズされたコンテキスト駆動のリアルタイムストレスモニタリング手法への大きな動きを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:33:11 GMT)
Several questions of visual generation in 2024 [4.1] 本稿では,新しいアルゴリズムは提案しないが,著者の個人的理解に基づく視覚生成の諸問題について概説する。
これらの問題の核心は、視覚信号を分解する方法にあり、他のすべての問題は、この中心的な問題と密接に関連しており、信号分解に対する不適切なアプローチから起因している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:49:13 GMT)
The Brain Tumor Segmentation in Pediatrics (BraTS-PEDs) Challenge: Focus on Pediatrics (CBTN-CONNECT-DIPGR-ASNR-MICCAI BraTS-PEDs) [4.0] CBTN--DIPGR-ASNR-MICCAI BraTS-PEDs : 小児脳腫瘍を中心に
小児の高次グリオーマの生存率は20%未満である。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:29:03 GMT)
Sample selection with noise rate estimation in noise learning of medical image analysis [4.0] 本稿では,ノイズの多いデータセットでトレーニングされた場合のニューラルネットワークの性能を向上させる新しいサンプル選択手法を提案する。
本手法では,線形回帰を用いて損失値の分布を解析することにより,データセットの雑音率を推定する。
モデルのノイズ堅牢性をさらに高めるために,スパース正規化を採用している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:36:43 GMT)
Shedding More Light on Robust Classifiers under the lens of Energy-based Models [4.0] 我々は、敵対的訓練(AT)のダイナミクスについて、新しい視点を提供する。
ATにおけるエネルギー環境の分析により、標的外攻撃は、モデルの観点からの本来のデータよりも、より分散した(低エネルギー)敵画像を生成することが明らかとなった。
厳格なエビデンスを動機とした重エネルギー教育(WEAT)の提案
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:11:03 GMT)
Generative Inverse Design of Metamaterials with Functional Responses by Interpretable Learning [3.9] 本稿では, オンデマンド機能的振る舞いを持つメタマテリアル設計の高速な生成を実現するために, ランダムフォレストに基づく解釈可能生成逆設計(RIGID)手法を提案する。
トレーニングされたフォワードモデルから得られた目標満足度の可能性に基づいて、マルコフ連鎖モンテカルロ法を用いて設計ソリューションをサンプリングすることができる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:27:35 GMT)
ERD: Exponential Retinex decomposition based on weak space and hybrid nonconvex regularization and its denoising application [3.9] Retinex理論は、画像を照明とノイズ成分のセグメンテーションとしてモデル化する。
画像復調のための指数分解アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:34:37 GMT)
Graph Expansions of Deep Neural Networks and their Universal Scaling Limits [3.8] ニューラルネットワークのスケーリング限界を得るための統一的なアプローチを提案する。
ランダム行列理論の属拡大手法を用いる。
我々はジャコビアンの極限特異値分布のモーメントの公式を求める。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:58:07 GMT)
Generalized Low-Rank Matrix Completion Model with Overlapping Group Error Representation [3.7] 低ランク行列補完(LRMC)技術は低レベル視覚タスクにおいて顕著な成果を上げている。
LRMCでは実世界の行列データが低ランクであるという前提がある。
実行列データは厳密な低ランク特性を満たさないが, 上記の行列回復法には深刻な課題があることは間違いない。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:01:57 GMT)
Non-convergence of Adam and other adaptive stochastic gradient descent optimization methods for non-vanishing learning rates [3.6] ディープラーニングアルゴリズムは多くの人工知能(AI)システムにおいて重要な要素である。
ディープラーニングアルゴリズムは通常、勾配降下(SGD)最適化法によって訓練されたディープニューラルネットワークのクラスで構成されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:10:35 GMT)
How Do Developers Structure Unit Test Cases? An Empirical Study from the "AAA" Perspective [3.4] 本研究では,4つのオープンソースプロジェクトからランダムに選択された実生活単体テストケース435について実験的検討を行った。
全体として、テストケースの大多数(71.5%)はAAAの構造に従っている。
AAAの構造から逸脱する3つのアンチパターンと,Aブロック内に存在する可能性のある4つの設計上の欠陥を観察した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:33:02 GMT)
MCSD: An Efficient Language Model with Diverse Fusion [3.4] MCSDモデルは線形スケーリングと高速推論速度を備えた効率的な言語モデルである。
推論過程を反復表現に定式化し、空間複雑性を$O(1)$に、時間複雑性を$O(N)$に分割する。
実験の結果, MCSDはトランスフォーマーに比べてスループットが高く, メモリ消費も低いことがわかった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:29:19 GMT)
DEVIAS: Learning Disentangled Video Representations of Action and Scene for Holistic Video Understanding [3.3] 本稿では,Distangled VIdeo representations of Action and Scene (DEVIAS) を提案する。
提案手法は,ベースラインと比較して,異なるデータセット間で良好な性能を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:32:32 GMT)
Predict. Optimize. Revise. On Forecast and Policy Stability in Energy Management Systems [3.3] 本研究は,エネルギー管理システムにおける予測と最適化の統合という課題に対処する。
スイッチングコストを用いてオンライン最適化問題を解析し,決定論的および確率的予測によって実現するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:58:47 GMT)
Map It Anywhere (MIA): Empowering Bird's Eye View Mapping using Large-scale Public Data [3.2] トップダウンのBird's Eye View (BEV)マップは、下流タスクの豊かさと柔軟性のために、地上ロボットナビゲーションの一般的な表現である。
最近の手法では、ファーストパーソンビュー(FPV)画像からBEVマップを予測できることが示されている。
2つの大規模クラウドソースマッピングプラットフォームを利用することで,よりスケーラブルなマップ予測手法が実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:57:22 GMT)
Using deep neural networks to detect non-analytically defined expert event labels in canoe sprint force sensor signals [3.1] 本稿では、パドルストロークイベントを自動的に予測する能力の観点から、畳み込みニューラルネットワーク(CNN)と繰り返しニューラルネットワーク(RNN)について検討する。
以上の結果から,双方向ゲート再帰単位(BGRU)に基づくRNNがパドルストローク検出に最も適したモデルであることが判明した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:59:11 GMT)
Dynamically assisted pair production enhancement by combined multiple potentials [3.0] そこで本研究では, 深部低速変動と浅部低速変動ポテンシャルからなる複数電位を持つ新しいソーター型場モデルを提案する。
ペア生成に対するソーター=シュウィンガー効果は、量子場理論を用いて動的に支援される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:07:12 GMT)
The Upper Bound of Information Diffusion in Code Review [2.9] 我々は,大規模な(Microsoft),中規模の(Spotify),および通信ネットワークとしてモデル化された小さなコードレビューシステム内での人工情報拡散をシミュレートする。
参加者間のトポロジカルおよび時間的距離を最小に計測し、コードレビューにおいてどの程度の速さで情報を拡散できるかを定量化する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:40:57 GMT)
Progressive Growing of Patch Size: Resource-Efficient Curriculum Learning for Dense Prediction Tasks [2.9] 本稿では資源効率の高い暗黙的なカリキュラム学習手法であるPatch Sizeのプログレッシブグロース(Progressive Growing of Patch)を紹介する。
我々のカリキュラムのアプローチは、モデルトレーニング中にパッチサイズを拡大することで定義され、タスクの難しさが徐々に増大する。
提案手法により,ネットワークトレーニングのランタイム,計算コスト,CO2排出量を大幅に削減できる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:35:26 GMT)
Sensor-Aware Classifiers for Energy-Efficient Time Series Applications on IoT Devices [2.7] 時系列データ処理は、健康モニタリング、環境モニタリング、デジタル農業など、多くの実世界のアプリケーションにおいて重要なコンポーネントである。
機械学習(ML)モデルは、分類の一般化能力のため、時系列アプリケーションに採用されている。
精度を維持しつつエネルギー消費を最小限に抑えるため,部分センサウィンドウを備えた早期出口分類器を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:50:31 GMT)
Adjustment Identification Distance: A gadjid for Causal Structure Learning [2.7] グラフ間の因果距離を開発するための枠組みを開発する。
このフレームワークを用いて、改良された調整ベース距離と、部分的に有向な非巡回グラフと因果順序の拡張を開発する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:45:33 GMT)
Synthetic Electroretinogram Signal Generation Using Conditional Generative Adversarial Network for Enhancing Classification of Autism Spectrum Disorder [2.7] 本研究では, ASD 児の合成ERG 信号を生成できるジェネレーティブ・アドバイサル・ネットワークについて述べる。
このアプローチは、ERGが障害の分類に役立つ可能性のある関連する精神疾患の分類モデルをサポートするかもしれない。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:11:52 GMT)
QC-Forest: a Classical-Quantum Algorithm to Provably Speedup Retraining of Random Forest [2.6] ランダムフォレスト(Random Forest, RF)は、教師あり学習法として人気があり、使いやすさと柔軟性で評価されている。
オンラインRFモデルは、モデルの精度を維持するために、新しいトレーニングデータを考慮する必要がある。
ストリーミング環境でのRFモデルの時間効率向上を目的とした古典量子アルゴリズムQC-Forestを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:32:59 GMT)
Adversarial-MidiBERT: Symbolic Music Understanding Model Based on Unbias Pre-training and Mask Fine-tuning [2.6] 変換器によるバイバーサ表現に基づく記号的音楽理解モデルAdrial-MidiBERTを提案する。
逆学習に基づく非バイアス付き事前学習手法を導入し、トレーニング中にバイアスにつながるトークンの参加を最小限に抑えるとともに、事前学習と微調整のデータギャップを狭めるマスクファインチューニング手法を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:54:38 GMT)
Early Explorations of Lightweight Models for Wound Segmentation on Mobile Devices [2.5] 高齢化は、高齢者の慢性的な傷の増加など、医療に多くの課題をもたらす。
セラピストによる創傷評価への現在のアプローチは主観的であり、スマートフォン写真からコンピュータ支援による創傷認識の必要性を強調している。
スマートフォンをベースとした創傷セグメンテーションに適した3つの軽量アーキテクチャについて,初期研究を行った。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:01:58 GMT)
VR-GPT: Visual Language Model for Intelligent Virtual Reality Applications [2.5] 本研究では,VR環境における視覚言語モデルを用いたユーザインタラクションとタスク効率向上のための先駆的アプローチを提案する。
本システムは,視覚的テキスト命令に頼ることなく,自然言語処理によるリアルタイム・直感的なユーザインタラクションを支援する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:46:14 GMT)
Real-Time Coupled Cluster Theory with Approximate Triples [2.5] 実時間結合クラスタシングル,ダブルスおよび近似三重奏法(CC3)の実装を導入し,高い励起レベルのポテンシャルを探索する。
導出と実装は、周波数依存特性の計算への応用に続いて初めて実証される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:10:26 GMT)
The trade-off between diagonal and off-diagonal elements in the eigenstate thermalization hypothesis [2.5] まず、この測度の対角的および対角的要素に対する普遍的なトレードオフ関係を証明します。
次に、固有状態の典型性と平均可観測性に関する議論に拡張する。
一次元のイジングスピン鎖を数値計算することにより、いくつかのトレードオフ関係と強いETHと弱いETHを調べる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:44:25 GMT)
FAR-Trans: An Investment Dataset for Financial Asset Recommendation [2.5] 金融資産レコメンデーション(FAR)は、レコメンデーションシステムのサブドメインである。
我々はFARのための最初の公開データセットであるFAR-Transを紹介し、価格情報と小売投資家取引を含む。
また、将来のベースラインとして使用するデータに対して、11個のFARアルゴリズムのベンチマーキング比較を提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:30:04 GMT)
AdaGlimpse: Active Visual Exploration with Arbitrary Glimpse Position and Scale [2.5] Active Visual Exploration (AVE)は、観察(グランプ)を動的に選択するタスクである。
光ズーム機能を備えた既存のモバイルプラットフォームは、任意の位置とスケールを垣間見ることができる。
AdaGlimpseは、探索作業に適した強化学習アルゴリズムであるSoft Actor-Criticを使って、任意の位置と規模を垣間見る。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:00:05 GMT)
With Great Power Comes Great Responsibility: The Role of Software Engineers [2.5] ソフトウェアエンジニアリングの展望は、デジタルトランスフォーメーションとAIの上昇の中で急速に進化している。
このビジョンペーパーは、進化する専門職に固有の複雑さと倫理的考察をナビゲートする、新しい世代のソフトウェアエンジニアを育成することを目的としている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:12:52 GMT)
Faster Preparation of Multi-qubit Entanglement with Higher Success Rates [2.4] 2量子量子絡み合いの準備は、非エルミート系の例外点(EP)やスペクトルの合体付近で著しく加速することができる。
量子EPベースのデバイスにとって重要な障害は、高い絡み合った状態を生成する際の成功率の制限である。
本研究は,真のパリティ時間(mathcalPT$)対称システムを利用することで,この制限を効果的に克服できることを実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:14:37 GMT)
Incorporating Large Language Models into Production Systems for Enhanced Task Automation and Flexibility [2.4] 本稿では,大規模言語モデル(LLM)エージェントを自動生産システムに統合するための新しいアプローチを提案する。
自動化ピラミッドに基づいた階層的なフレームワーク内での運用運用の組織化。
これにより、プロダクションプロセスのオーケストレーションのためのスケーラブルでフレキシブルな基盤が実現できます。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:34:43 GMT)
Differentially Private Neural Network Training under Hidden State Assumption [2.3] 隠れ状態前提下でのプライバシー保証を保証可能なニューラルネットワークに対する差分プライベートニューラルネットワーク座標降下(DP-SBCD)と呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:14:40 GMT)
Multi-step Inference over Unstructured Data [2.2] 医療、法律、金融などの分野における高い意思決定タスクは、精度、包括性、論理的一貫性のレベルを必要とする。
これらの問題に対処するための,ニューロシンボリックAIプラットフォームを開発した。
このプラットフォームは、知識抽出とアライメントのための微調整LDMと、堅牢なシンボリック推論エンジンを統合している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 22:55:40 GMT)
Investigating Public Fine-Tuning Datasets: A Complex Review of Current Practices from a Construction Perspective [2.1] 本稿では、データ構築の観点から、現在の公開微調整データセットをレビューする。
このレビューでは、進化と分類の2つの側面から、パブリックな微調整データセットの概要を述べる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:11:16 GMT)
A Clinical Benchmark of Public Self-Supervised Pathology Foundation Models [2.1] 本研究は, がん診断を含む臨床関連エンドポイントと, 2つの医療センターからの標準病院手術中に発生する各種バイオマーカーとを関連づけた臨床スライドを含む病理データセットの収集について述べる。
これらのデータセットを利用して、公共病理基盤モデルの性能を体系的に評価し、新しい基礎モデルをトレーニングし、適切な事前学習モデルを選択するためのベストプラクティスに関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:16:37 GMT)
Privacy-Preserving Data Deduplication for Enhancing Federated Learning of Language Models [2.0] 先駆的プロトコル, 効率的なプライバシ保護多人数重複(EP-MPD)を導入する。
EP-MPDはデータのプライバシを損なうことなく、複数のクライアントのデータセットからの重複を効率的に除去する。
パープレキシティを最大19.61%改善し、ランニングタイムを最大27.95%削減する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:10:27 GMT)
A Cantor-Kantorovich Metric Between Markov Decision Processes with Application to Transfer Learning [2.0] 我々は(Banse et al., 2023)によって導入されたマルコフ鎖間のカントール・カントロヴィチ距離の概念を拡張する。
提案した計量はよく定義されており、有限の地平線から効率的に近似することができる。
特に,転送学習アルゴリズムの性能予測に有効であることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:13:11 GMT)
Analyzing the Runtime of the Gene-pool Optimal Mixing Evolutionary Algorithm (GOMEA) on the Concatenated Trap Function [2.0] GOMEAは、リンク学習を利用して問題構造を効率的に活用する進化的アルゴリズムである。
GOMEAは確率の高い$O(m32k)$で解くことができ、$m$はサブファンクションの数、$k$はサブファンクションの長さである。
これは (1+1) 進化的 EA と比較して大きなスピードアップであり、これは$O(ln(m)(mk)k)$期待される評価を必要とする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:37:21 GMT)
NinjaLLM: Fast, Scalable and Cost-effective RAG using Amazon SageMaker and AWS Trainium and Inferentia2 [2.0] 本稿では,従来のRAG技術の改良について述べる。
私たちは、SageMakerを介してAWS TrainiumとInferentia2 AIチップに微調整され、ホストされる、大規模言語モデル(LLM)に焦点を当てています。
我々はRAGシステムの性能をNatural QuestionsとHotPotQAデータセットでベンチマークし、それぞれ62%と59%の精度を達成した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:04:44 GMT)
Are Paralinguistic Representations all that is needed for Speech Emotion Recognition? [2.0] パラ言語的PTM表現は、音声感情認識(SER)のための最先端(SOTA)性能を示す。
これらの表現は英語以外の言語環境では評価されていない。
これにより、複数の言語におけるSERに対するパラ言語的PTM表現の有効性へのアクセスが困難になる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:50:11 GMT)
Kibble-Zurek Behavior in the Boundary-obstructed Phase Transitions [1.9] 本研究では,2次元トポロジカル絶縁体の非断熱的ダイナミクスについて検討する。
その結果, クエンチ後の励起数は, クエンチ速度によるゆるいスケーリング挙動を示すことがわかった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:39:41 GMT)
Segmentation-guided Attention for Visual Question Answering from Remote Sensing Images [1.7] Visual Question Answering for Remote Sensing (RSVQA)は、リモートセンシング画像の内容に関する自然言語の質問に答えることを目的としたタスクである。
セグメンテーションによって導かれるアテンションメカニズムをRSVQAパイプラインに埋め込むことを提案する。
16のセグメンテーションクラスと問合せ/問合せペアでアノテートされた非常に高解像度のRGB写真を利用する新しいVQAデータセットを提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:59:32 GMT)
Point Intervention: Improving ACVP Test Vector Generation Through Human Assisted Fuzzing [1.7] 本稿では,暗号ライブラリのACVPフォーマットで良好なテストを生成するための方法とツールを提供する。
本システムは,暗号プリミティブをファジリングするためのハイブリッドアプローチを用いて,既存のファジリング手法よりも優れたカバレッジを実現する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:21:48 GMT)
Feasibility of Neural Radiance Fields for Crime Scene Video Reconstruction [1.6] 我々は,多目的合成,変形可能な合成,照明という,犯罪現場の再構築に関して,NeRFの3つの主要なイノベーションに注目している。
本稿では,現場の入力映像から犯罪現場を再構築するために,NeRFモデルのバリエーションを利用することの可能性について検討し,その可能性を検討することを目的とする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:13:12 GMT)
CoGS: Causality Constrained Counterfactual Explanations using goal-directed ASP [1.6] 本稿では,ルールベース機械学習モデルから対物生成を行うCoGS(Counterfactual Generation with s(CASP))フレームワークを提案する。
CoGSは、それらの間の因果依存性を考慮した属性値に対する現実的かつ因果一貫性のある変更を計算します。
望ましくない結果から、偽物を使用する望ましい結果への道を見つける。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:50:51 GMT)
Towards Semantically Enriched Embeddings for Knowledge Graph Completion [1.5] 本稿では,KG埋め込み生成のバリエーションに基づいて,既存のKG完了アルゴリズムについて論じる。
その後、KG、LLM内の型情報を利用したアルゴリズムに移行し、最後に、異なる記述論理公理で表されるセマンティクスをキャプチャするアルゴリズムに移行する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:18:29 GMT)
HiLight: Technical Report on the Motern AI Video Language Model [1.5] 本報告では,ビデオテキストアライメントのための最先端ビデオエンコーダと,HiLightと呼ばれるビデオ会話フレームワークの実装について述べる。
我々のゴールはビリヤードの文脈におけるビデオ理解の課題に対処することである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:44:28 GMT)
A Two-Stage Machine Learning-Aided Approach for Quench Identification at the European XFEL [1.5] 本稿では,欧州X線自由電子レーザーにおけるクエンチ識別のケーススタディに適用した機械学習支援型故障検出分離手法を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:21:41 GMT)
The XYZ ruby code: Making a case for a three-colored graphical calculus for quantum error correction in spacetime [1.5] パウリ測定による任意のクリフォード回路の論理的動作と誤り訂正能力を捉えるためのテンソルネットワークに基づくフォーマリズムを提案する。
2+1d色符号と同じ位相位相の動的符号の族に本手法を適用した。
我々は、メモリと安定性の両方の実験を行うことで、トーラス上のXYZ rubyコードのパフォーマンスをベンチマークする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:56:26 GMT)
Enrich the content of the image Using Context-Aware Copy Paste [1.5] 本稿では,By Latent Information Propagation (BLIP) を組み込んだコンテキスト認識手法を提案する。
抽出したコンテンツ情報とカテゴリ情報とをマッチングすることにより,Segment Anything Model (SAM) と You Only Look Once (YOLO) を用いて対象物の密結合性を確保する。
各種データセットを対象とした実験により,データ多様性の向上と高品質な擬似画像の生成において,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:07:28 GMT)
Explainable Time Series Anomaly Detection using Masked Latent Generative Modeling [1.4] 本稿では,新しい時系列異常検出法であるTimeVQVAE-ADを提案する。
TimeVQVAE-ADは、優れた説明性を提供しながら、優れた検出精度を実現する。
私たちはGitHubに実装を提供しています。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:45:41 GMT)
A Survey on the Application of Generative Adversarial Networks in Cybersecurity: Prospective, Direction and Open Research Scopes [1.4] GAN(Generative Adversarial Networks)は、常に変化するセキュリティ問題に対処する強力なソリューションとして登場した。
本研究は, サイバーセキュリティの防衛強化において, GANを的確に捉えた深層学習モデルの重要性について検討した。
焦点は、これらのドメインにおけるサイバーセキュリティの防御を強化するために、GANがいかに影響力のあるツールになり得るかを調べることである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:51:48 GMT)
stEnTrans: Transformer-based deep learning for spatial transcriptomics enhancement [1.3] 本研究では,トランスフォーマーアーキテクチャに基づくディープラーニング手法であるstEnTransを提案する。
stEnTransを6つのデータセット上で評価した結果, スポット分解能の向上と未測定領域での遺伝子発現の予測において, 優れた性能を示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:50:34 GMT)
Large-Scale Dataset Pruning in Adversarial Training through Data Importance Extrapolation [1.3] 本稿では,少数のデータ集合からより大きなデータ集合へのデータ重要度スコアの補間に基づく新たなデータ抽出戦略を提案する。
実験的な評価では,外挿型プルーニングは頑健性を維持しつつ,データセットサイズを効率的に削減できることを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:10:24 GMT)
SwishReLU: A Unified Approach to Activation Functions for Enhanced Deep Neural Networks Performance [1.3] ディープニューラルネットワークでよく使われるアクティベーション関数であるReLUは、"Dying ReLU"の問題に傾向がある。
ELU、SeLU、Swishなどいくつかの改良版が導入されており、一般的には使われていないと考えられている。
本稿では,ReLUとSwishの要素を組み合わせた新しいアクティベーション機能であるSwishReLUを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:14:34 GMT)
Vision language models are blind [1.2] 視覚機能を備えた大規模言語モデル(VLM)は、数え切れないほどの画像テキストアプリケーションを動かしている。
BlindTestは、人間の目で見やすい7つの視覚タスクのスイートです。
4つの最先端のVLMは平均してベンチマークで56.20%しか正確ではなく、ニューソネットが最も正確である(73.77%)。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:33:10 GMT)
Mitigating Group Bias in Federated Learning for Heterogeneous Devices [1.2] フェデレートラーニング(Federated Learning)は、分散エッジアプリケーションにおけるプライバシ保護モデルトレーニングアプローチとして登場している。
本研究は,プライバシを維持しながら,資源利用のオーバーヘッドを伴わずにグループバイアスを最小限に抑えるグループフェアFLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:25:51 GMT)
Inside the Black Box: Detecting and Mitigating Algorithmic Bias across Racialized Groups in College Student-Success Prediction [1.1] 大学生の成功予測の精度が人種集団によってどのように異なるのかを,アルゴリズムバイアスのシグナルとして検討した。
人種的にマイノリティのある学生の成功を予測する際に、大学学生の成功を予測するためによく使われる機能を組み込んだモデルが、いかに正確でないかを実証する。
アルゴリズムバイアスを緩和するための一般的なアプローチは、一般的に、予測結果の相違や人種化されたグループ間の正確性を排除するのに効果がない。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:19:31 GMT)
Improve Load Forecasting in Energy Communities through Transfer Learning using Open-Access Synthetic Profiles [1.1] 10GWエネルギーユーティリティの予測エラーを1%削減すれば、年間最大1.6億ドルの節約が可能になる。
本稿では,移動学習手法を用いて,オープンアクセス型合成負荷プロファイルを用いた負荷予測モデルの事前学習を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:17:31 GMT)
Toto: Time Series Optimized Transformer for Observability [1.1] TotoはDatadogが開発した時系列予測のためのアートファウンデーションモデルの新たな状態である。
Totoは、観測可能性測定のために特別に調整された、初めての汎用時系列予測基盤モデルである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:18:40 GMT)
A Distributed ADMM-based Deep Learning Approach for Thermal Control in Multi-Zone Buildings under Demand Response Events [1.1] 本研究では,ADMMを用いた分散最適化と深層学習モデルを組み合わせて室内温度設定点を効果的に計画する。
上層に中央建物コーディネータ、熱ゾーン層にローカルコントローラを備えた2層階層構造を用いる。
提案するアルゴリズムはDistributed Planning Networksと呼ばれ、様々なタイプの建物に適応可能かつスケーラブルに設計されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:43:38 GMT)
Local Clustering for Lung Cancer Image Classification via Sparse Solution Technique [1.1] 重み付きグラフの頂点としてのイメージと,グラフのエッジとしてのイメージの対の類似性について検討する。
私たちのアプローチは、他の最先端のアプローチと比較して、はるかに効率的で、好ましくないか、等しく効果的です。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:18:32 GMT)
Cybersecurity Defenses: Exploration of CVE Types through Attack Descriptions [1.0] VULDATは、文変換器MPNETを使用して、攻撃記述からシステムの脆弱性を識別する分類ツールである。
また,ATT&CKレポジトリから100件,CVEレポジトリから685件のアタック手法を適用した。
以上の結果より,F1スコア0.85,精度0.86,リコール0.83,F1スコア0.83,F1スコア0.85,F1スコア0.86,F1スコア0.83,F1スコア0。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:28:51 GMT)
Maximal intrinsic randomness of a quantum state [1.0] 量子情報科学は、過去10年間に固有の、または秘密の量子ランダム性の研究で大きく進歩してきた。
この問題は、条件最小エントロピー、条件フォン・ノイマンエントロピー、条件最大エントロピーの3つの異なるランダム性定量化器に答える。
条件付きフォン・ノイマンエントロピーの場合、最大値は$H*= log_2d-S(rho)$, with $S(rho)$ フォン・ノイマンエントロピーは$rho$、条件付き最大エントロピーでは$となる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:16:35 GMT)
Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets [1.0] カービ線形オブジェクトセグメンテーションは、様々なアプリケーションにおいて重要な役割を果たすが、この領域のデータセットは、しばしば小さなスケールに悩まされる。
本稿では,カービリニアオブジェクトセグメンテーションデータセットを拡張するための新しいアプローチを提案する。
本手法は,複数のテキスト特徴量からカービリニアオブジェクトを生成することによって,合成データの情報性が向上する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:25:26 GMT)
SALT: Introducing a Framework for Hierarchical Segmentations in Medical Imaging using Softmax for Arbitrary Label Trees [1.0] 本研究は, 解剖学的ランドマークの階層構造を地図化するために条件付き確率を利用するCT画像の新しいセグメンテーション手法を提案する。
The Cancer Imaging Archive (TCIA)のSAROSデータセットを用いて、893人の患者から900の身体領域を分離したモデルを開発した。
SAROS, CT-ORG, FLARE22, LCTSC, LUNA16, WORDなど,各種データセットのDiceスコアを用いて評価を行った。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:33:08 GMT)
Beyond Benchmarks: Evaluating Embedding Model Similarity for Retrieval Augmented Generation Systems [1.0] RAGシステムのコンテキストにおける埋め込みモデルの類似性を評価する。
5つのデータセットで、プロプライエタリなモデルを含む埋め込みモデルのさまざまなファミリを比較します。
プロプライエタリなモデルに対するオープンソース代替案を特定でき、MistralはOpenAIモデルに最もよく似ている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:24:16 GMT)
Digital twins to alleviate the need for real field data in vision-based vehicle speed detection systems [1.0] 正確な視覚に基づく速度推定は、レーダーやLiDARに基づく従来の手法よりもコスト効率が高い。
ディープラーニングのアプローチは、利用可能なデータがないため、このコンテキストでは極めて限定的です。
本研究では,CARLAシミュレータを用いたデジタルツインを用いて,特定の実世界のカメラの大規模なデータセットを生成することを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:41:20 GMT)
Modeling and Suppressing Unwanted Parasitic Interactions in Superconducting Circuits [0.9] 超伝導量子ビットは、量子コンピュータ構築の最も有望な候補の一つである。
この論文は、2ビットと3ビットの回路における結合量子ビット間の寄生相互作用に対処する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:07:45 GMT)
Angular Momentum Flows without anything carrying it [0.9] 2つの遠隔領域間で保存された量の移動は、一般的には比較的簡単なプロセスであると仮定される。
我々は、ある領域から別の領域への角運動量の流れを、任意の粒子(または場)が存在するという驚くほど小さい確率で示している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:16:53 GMT)
Characterizing Translation-Invariant Bell Inequalities using Tropical Algebra and Graph Polytopes [0.9] 一次元幾何学における有限範囲相関器による変換不変(TI)ベルの不等式を特徴づける。
驚いたことに、TI Bell のポリトープには、システムサイズに関して一様上界にできる極端点が多数存在する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:00:06 GMT)
Unveiling Disparities in Maternity Care: A Topic Modelling Approach to Analysing Maternity Incident Investigation Reports [0.9] 本研究は,母子関係調査報告の分析に自然言語処理技術を適用した。
報告書には事前処理、セーフティ・インテリジェンス・リサーチの分類を用いた注釈、一般的なトピックを明らかにするためのトピックモデリングが実施された。
この分析は、黒人、アジア、白人のイギリス民族に焦点を絞った異なる民族集団間のケアの格差を明らかにした。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:26:05 GMT)
Intelligent Multi-Document Summarisation for Extracting Insights on Racial Inequalities from Maternity Incident Investigation Reports [0.9] 医療では、毎年何千もの安全事故が発生するが、これらの事故から学ぶことは効果的に集約されない。
本稿では,安全事故報告の集約と分析を容易にするためのフレームワークであるI-SIRch:CSを提案する。
このフレームワークは、セーフティ・インテリジェンス・リサーチ(SIRch)の分類学を用いた概念アノテーションと、クラスタリング、要約、分析機能を統合する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:11:20 GMT)
Neural Networks Meet Elliptic Curve Cryptography: A Novel Approach to Secure Communication [0.8] 提案手法では,ニューラルネットワークフレームワークにおける非対称暗号の適用について検討する。
盗聴の試みに対する通信セキュリティの有効性と堅牢性を調べるために、5つの異なる暗号鍵を用いている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:34:16 GMT)
Authenticity and exclusion: social media recommendation algorithms and the dynamics of belonging in professional networks [0.8] ホモフィーは社会的相互作用に深く影響を与え、関連性、情報開示、社会交流のダイナミクスに影響を及ぼす。
異なる会話コンテキストが頻繁に崩壊するソーシャルメディアプラットフォームの性質と設計は、これらのダイナミクスにどのように影響するのか?
マイノリティグループによるプロ向けコンテンツの可視性の低下が示唆され,推奨アルゴリズムによって時間とともに悪化する傾向がみられた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:36:58 GMT)
Helios: An extremely low power event-based gesture recognition for always-on smart eyewear [0.8] 本報告では,スマートアイウェアの日中使用を目的とした,非常に低消費電力でリアルタイムなイベントベースの手ジェスチャー認識システムであるHeliosを紹介する。
Heliosは微妙なマイクロジェスチャーやピンチなど7種類のジェスチャーを91%の精度で認識できる。
また、60ミリ秒という極めて低いレイテンシで、20ユーザにわたるリアルタイムパフォーマンスを実演しています。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:33:53 GMT)
SciQu: Accelerating Materials Properties Prediction with Automated Literature Mining for Self-Driving Laboratories [0.8] 特定の属性を予測するために異なる材料特性を評価することは、材料科学に基づく応用の基本的な要件である。
本研究は,機械学習を利用して材料特性を高精度かつ効率的に解析することにより,これらの課題に対処する。
データ抽出を自動化し、抽出した情報を用いて機械学習モデルを訓練することにより、開発したSciQuは材料特性を最適化する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:12:46 GMT)
GPT-4 is judged more human than humans in displaced and inverted Turing tests [0.7] 毎日のAI検出は、オンライン会話における人とAIの差別化を必要とする。
我々は、Turingテストの2つの修正版(反転と置換)を使って、人や大きな言語モデルがいかに差別化できるかを測定した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:28:24 GMT)
The Origin and Evolution of Information Handling [0.7] 本稿では、情報制御の開始過程と、生命の原始的な制御機構がいかに進化し、ますます洗練されていくかを説明する。
化学計算における原始遷移を正確に記述することにより、上記のギャップを説明することができる。
自由エネルギーの原理と互換性があるので、生命の起源から高レベルの認知までを記述できる計算エアクティビスト理論の枠組みを開発した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:49:50 GMT)
How Well Can a Long Sequence Model Model Long Sequences? Comparing Architechtural Inductive Biases on Long-Context Abilities [0.7] システム工学の最近の進歩により、拡張コンテキスト長をサポートするために用意されたモデルのスケールアップが可能になった。
このような主張は理論的に聞こえるかもしれないが、実証的に観察される大きな実践的ギャップが残っている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:08:39 GMT)
Missile detection and destruction robot using detection algorithm [0.7] この研究は、バングラデシュでシステムを実装するための費用対効果の高いソリューションを見つけるために、世界の現在のミサイル検出技術とこれらの技術の分析に基づいている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 04:18:17 GMT)
Gated Ensemble of Spatio-temporal Mixture of Experts for Multi-task Learning in Ride-hailing System [0.6] 本研究では,畳み込みニューラルネットワーク (CNN) と畳み込みニューラルネットワーク (RNN) を併用したアンサンブルエキスパートネットワーク (GESME-Net) を開発し,タスクを同時に予測する。
i)北京の需要と需給を同時に予測し、(ii)成都と西安の需要を同時に予測する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:18:12 GMT)
RoboMorph: Evolving Robot Morphology using Large Language Models [0.6] 本稿では,モジュール型ロボットの設計を自動生成・最適化するRoboMorphを紹介する。
自動プロンプト設計と強化学習に基づく制御アルゴリズムを統合することで、RoboMorphはフィードバックループを通じてロボット設計を反復的に改善する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:05:56 GMT)
Unveiling the Potential of BERTopic for Multilingual Fake News Analysis -- Use Case: Covid-19 [0.6] BERTopicは文の埋め込み、次元の縮小、クラスタリング、トピック抽出で構成されている。
本稿では,BERTopicの技術応用を実際に分析することを目的とする。
また、実世界のデータに対するトピックモデリングの結果をユースケースとして分析することを目的とする。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:47:43 GMT)
Data-driven Model Reduction for Soft Robots via Lagrangian Operator Inference [0.6] この研究はモデル方程式のラグランジアンの性質を利用して、ラグランジアン作用素推論(英語版)を通して構造保存された線形減階モデルを導出する。
ケーススタディでは、基礎となるラグランジアン構造を保存することは、予測精度が高く、未知の入力に対する堅牢性を持つ学習モデルをもたらすことが示されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:55:21 GMT)
Length independent generalization bounds for deep SSM architectures [0.6] 長距離シーケンスでトレーニングされた多くの最先端モデルは、状態空間モデル(SSM)とニューラルネットワークを組み合わせたシーケンシャルブロックで構成されている。
我々は、安定したSSMブロックを持つこの種のアーキテクチャを保持でき、入力シーケンスの長さに依存しないPACバウンダリを提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:55:14 GMT)
PowerYOLO: Mixed Precision Model for Hardware Efficient Object Detection with Event Data [0.5] PowerYOLOは、高メモリと計算複雑性のアルゴリズムを小さな低消費電力デバイスに適合させる問題に対して、混合精度のソリューションである。
まず,低消費電力のセンサであるダイナミック・ビジョン・センサ(DVS)をベースとしたシステムを提案する。
次に、4ビット幅のPowers-of-Two(PoT)量子化を提案する。
第3に、そのような解のハードウェアアクセラレーションの効率を高めるために、乗算をビットシフトに置き換える。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:17:35 GMT)
Unified theory for joint covariance properties under geometric image transformations for spatio-temporal receptive fields according to the generalized Gaussian derivative model for visual receptive fields [0.5] 本研究では,時間的イメージ関係下での受容場からの出力と一致させるために,受容場のパラメータをどのように変換する必要があるかを示す。
導出結合共分散特性が受容場応答を関連づけたり一致させたりすることができるかを示す幾何学的解析で結論付ける。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:19:52 GMT)
Confidence-based Estimators for Predictive Performance in Model Monitoring [0.5] マシンラーニングモデルが本番環境にデプロイされた後、その予測パフォーマンスを監視する必要がある。
近年,地中真実が得られない場合の予測性能を推定する新たな手法が開発されている。
一般的な仮定では、平均信頼度(AC)法はモデル精度の偏りのない一貫した推定器であることが示される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:28:31 GMT)
Adaptive Deep Iris Feature Extractor at Arbitrary Resolutions [0.5] 分解能劣化は、高解像度画像で訓練されたディープラーニングモデルの認識性能を低下させる。
我々のフレームワークには、異なる分解能劣化に特化した分解能専門家モジュールが含まれています。
低解像度の専門家は、両方の専門家が共通のアイデンティティの特徴を抽出できるように、高解像度の専門家からの知識蒸留によって訓練される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:44:40 GMT)
SPOCKMIP: Segmentation of Vessels in MRAs with Enhanced Continuity using Maximum Intensity Projection as Loss [0.5] 本研究は,MIP(Maximum Intensity Projection)を付加的な損失基準として用いたセグメンテーション品質の向上に焦点をあてる。
ラベルセグメンテーションのMIPを1つの(z軸)と3次元体積の複数の知覚可能な軸に組み込むことで2つの手法を提案する。
提案手法は血管の連続性を改善したセグメンテーションを生成し,ROIの視覚的検査で明らかである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:39:24 GMT)
Brain Tumor Segmentation in MRI Images with 3D U-Net and Contextual Transformer [0.5] 本研究では,3D-UNetモデルとコンテキストトランスフォーマ(CoT)を併用したMRIにおける脳腫瘍の正確なセグメンテーションのための改良手法を提案する。
提案モデルでは,CoTから腫瘍の質量特性を同期させ,特徴抽出を相互に強化し,詳細な腫瘍の質量構造を正確に把握する。
いくつかの実験結果から,提案手法の優れたセグメンテーション性能が得られた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:04:20 GMT)
Towards Efficient Deployment of Hybrid SNNs on Neuromorphic and Edge AI Hardware [0.5] 本稿では,ニューロモルフィックとエッジコンピューティングの相乗的ポテンシャルを考察し,動的視覚センサが捉えたデータ処理に適した多目的機械学習(ML)システムを構築する。
我々は、PyTorchとLavaフレームワークを使用して、スパイキングニューラルネットワーク(SNN)と人工ニューラルネットワーク(ANN)を混合してハイブリッドモデルを構築し、訓練する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:40:39 GMT)
Calibrating dimension reduction hyperparameters in the presence of noise [0.4] t-SNE と UMAP は、性能を評価する際に信号とノイズの組み合わせとしてデータを認識できない。
パープレキシティに対する事前の推奨値を示し、n_neighborsは小さすぎてノイズが過度に収まることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:27:19 GMT)
Ethics of Generating Synthetic MRI Vocal Tract Views from the Face [0.4] 本稿では,外部-内部相関モデル(E2ICM)の倫理的意義について考察する。
E2ICMは顔の動きを使って内部構成を推測し、MRIの費用対効果を支える技術を提供する。
我々は、Pix2PixGANを用いて、外部の調音データから擬似MRIビューを生成し、このアプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:12:48 GMT)
QAOA Performance in Noisy Devices: The Effect of Classical Optimizers and Ansatz Depth [0.3] 量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、Near-term Intermediate-Scale Quantum Computer (NISQ)のための変分量子アルゴリズムである。
本稿では,古典的ベクトルに対する現実的な騒音の影響について検討する。
その結果,Adam と AMSGrads はショットノイズの存在下で最高の性能を示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:22:37 GMT)
A Comparison of Vulnerability Feature Extraction Methods from Textual Attack Patterns [0.2] 本稿では,サイバーセキュリティ研究者や実践者が攻撃抽出方法を選択するのを支援することを目的とする。
TF-IDF(Term Frequency-Inverse Document Frequency)は、他の4つの手法を75%、F1スコアが64%で上回る。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:31:15 GMT)
Ultra-dispersive resonator readout of a quantum-dot qubit using longitudinal coupling [0.2] 超伝導共振器に結合した量子ドットハイブリッド量子ビットのパラメトリック長手相互作用機構による読み出しを行う。
本実験では, 量子力学の「超分散的」な状態において, 縦結合により半導体量子ビットの動作を促進できることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:11:12 GMT)
Natural Language Interaction with a Household Electricity Knowledge-based Digital Twin [0.2] ドメイン固有のデジタルツインは、スマートグリッドの様々なセグメントのデジタルレプリカを表すもので、各セグメントをモデル化、シミュレート、制御することができる。
本稿では,RAG (Retrieval Augmented Generation) 質問応答の可能性を初めて評価し,報告する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:05:37 GMT)
Proving that Cryptic Crossword Clue Answers are Correct [0.2] 「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
「正しい解答とほぼ正しい解答を、その語句が機能するかどうかに基づいて区別することが可能である。」
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:13:16 GMT)
On the attribution of confidence to large language models [0.1] クレデンスは命題の信頼度に対応する精神状態である。
信条の帰属に関する理論的根拠は不明である。
LLMがクリーデンスを持つとしても、クレデンス属性は一般的に偽である可能性は明らかである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:51:06 GMT)
Large Models of What? Mistaking Engineering Achievements for Human Linguistic Agency [0.1] 我々は,Large Language Models(LLM)の言語能力に関する主張は,少なくとも2つの根拠のない仮定に基づいていると主張している。
言語完全性は、自然言語のような明瞭で完全なものが存在すると仮定する。
データ完全性の仮定は、言語がデータによって定量化され、完全にキャプチャされるという信念に依存している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:06:01 GMT)
Toward accessible comics for blind and low vision readers [0.1] 我々は,既存のコンピュータビジョンと光学的文字認識技術を用いて,漫画のストリップ画像コンテンツから接地コンテキストを構築することを提案する。
我々は,文字の出現,姿勢,気分,対話など,文脈対応のパネル記述による漫画の脚本を生成する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:50:25 GMT)
Transformer Circuit Faithfulness Metrics are not Robust [0.0] 回路の「忠実さ」を、モデルの計算の一部を損なうことによって測定する。
既存の回路忠実度スコアは、研究者の方法論的選択と回路の実際の構成要素の両方を反映していると結論付けている。
機械的解釈可能性の研究の最終的な目標は、ニューラルネットワークを理解することです。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:59:00 GMT)
eyeballvul: a future-proof benchmark for vulnerability detection in the wild [0.0] eyeballvulは、大規模に言語モデルの脆弱性検出機能をテストするために設計されたベンチマークである。
オープンソースのリポジトリで公開された脆弱性のストリームから、毎週、オープンソースとして公開され、更新されている。
eyeballvulには6,000以上のリビジョンと5,000以上のリポジトリに24,000以上の脆弱性があり、約55GBのサイズである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:46:21 GMT)
eUDEVS: Executable UML with DEVS Theory of Modeling and Simulation [0.0] システム設計とプロトタイピングのためのモデリングとシミュレーション(M&S)は、今日では産業と学術の両方で行われている。
本稿では,eUDEVSを用いた相互変換とDEVSの相互変換に対する統合的なアプローチを提案する。
また、提案されたeUDEVSを、DEVS Unified Processと呼ばれるより大きな統一フレームワークに組み込んだ。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:29:46 GMT)
WineGraph: A Graph Representation For Food-Wine Pairing [0.0] WineGraphはワインデータをその構造に組み込んだ異種グラフである。
この統合により、味覚とソムリエ定義規則に基づく食品とワインのペアリングが可能になる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:12:48 GMT)
What should be observed for optimal reward in POMDPs? [0.0] POMDP M が与えられた場合、固定予算内で M の観測能力をどう変えるべきか。
位置戦略のみを考慮すると、一般には決定不可能であり、決定不可能であることを示す。
まず,Mのマルコフ決定過程の最適戦略と,SMTを用いたパラメータ合成に基づく2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:48:48 GMT)
What Do People Think about Sentient AI? [0.0] 先進的AIの話題に関する全国的に代表的な調査データを提示する。
2021年のAIの幸福に対する心の認識と道徳的関心は、予想以上に高かった。
我々は、AIが賢明になるかどうかに関わらず、議論そのものが人間とコンピュータのインタラクションをオーバーホールするかもしれないと論じる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:04:39 GMT)
Training toward significance with the decorrelated event classifier transformer neural network [0.0] 自然言語処理では、主要なニューラルネットワークアーキテクチャの1つがトランスフォーマーである。
この訓練されたネットワークは、強化された決定木やフィードフォワードネットワークよりも優れた性能を発揮することが判明した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 01:50:17 GMT)
Towards Explainable Evolution Strategies with Large Language Models [0.0] 本稿では,自己適応的進化戦略(ES)と大規模言語モデル(LLM)を統合するアプローチを提案する。
我々は、フィットネスの進化、ステップサイズの調整、停滞によるイベントの再スタートなど、最適化の旅の詳細なログを収集する。
LLMを使用してこれらのログを処理し、簡潔でユーザフレンドリーな要約を生成する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:28:27 GMT)
Toward a physically motivated notion of Gaussian complexity geometry [0.0] ガウス状態に対する回路複雑性の幾何学的概念を構築する。
複雑性の尺度における時間反転対称性の破れについて説明する。
これにより、量的、幾何学的な複雑性の概念を構築するための第一歩が確立される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 22:32:01 GMT)
Theory of quasiparticle-induced errors in driven-dissipative Schrödinger cat qubits [0.0] そこで我々は,Schr"odinger cat qubitsにおけるボゴリボフ準粒子の残留効果について検討した。
Schr"odinger cat qubits は非平衡条件下で操作される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 14:26:16 GMT)
Tamil Language Computing: the Present and the Future [0.0] 言語コンピューティングは言語学、コンピュータ科学、認知心理学を統合し、有意義な人間とコンピュータの相互作用を作り出す。
近年のディープラーニングの進歩により、コンピュータはよりアクセスしやすくなり、独立した学習と適応が可能になった。
この論文は、日常的なコミュニケーションニーズに対応するために、Tamilのような言語のための実用的なアプリケーションを構築することの重要性を強調している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:56:02 GMT)
Survey on Fundamental Deep Learning 3D Reconstruction Techniques [0.0] 本調査は,写真リアルな3Dモデルとシーンを生成する基礎的深層学習(DL)に基づく3D再構成技術について検討することを目的とする。
我々は、基礎となるアルゴリズムを識別し、その強みとトレードオフを評価し、この急速に発展する分野における将来の研究軌道を計画する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:30:05 GMT)
Spine Vision X-Ray Image based GUI Planning of Pedicle Screws Using Enhanced YOLOv5 for Vertebrae Segmentation [0.0] 椎骨切開による脊椎スクリューの正確な配置のための術前計画と術中指導の改善を目的とした革新的なGUIを提案する。
Spine-Visionは、同期AP-LP計画、脊椎セグメンテーションによる正確なスクリュー位置決め、効果的なスクリュー可視化、動的位置調整などの革新的な機能を備えた包括的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:59:43 GMT)
Sensitivity of Photovoltaic Cells Efficiency to Initial Conditions in Various Aggregation Designs [0.0] バンドギャップ工学のアグリゲーション誘起特性と量子効果のキャラクタリゼーションにより、電力の増強は35.87%まで増加する。
この奨励的な傾向は、自然を模倣する太陽光発電装置の設計に有望な新しい側面を示唆している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:57:25 GMT)
Semi-Supervised Multi-Task Learning Based Framework for Power System Security Assessment [0.0] 本稿では,Semi-Supervised Multi-Task Learning (SS-MTL) を用いた,電力系統の動的セキュリティ評価のための新しい機械学習フレームワークを開発する。
提案フレームワークの基盤となる学習アルゴリズムは条件付きマスク付きエンコーダを統合し,マルチタスク学習を用いて特徴表現を分類する。
IEEE 68-busシステムに関する様々な実験を行い,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 22:42:53 GMT)
Self-training Language Models for Arithmetic Reasoning [0.0] 新たなデータを必要としない言語モデルの能力向上の可能性を探る。
モデルは単一ラウンド(オフライン)とオンラインの自己学習の両方で大幅に改善できることがわかった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:06:05 GMT)
Rule-Based, Neural and LLM Back-Translation: Comparative Insights from a Variant of Ladin [0.0] 本稿では,Ladin の機械翻訳,特に Val Badia 変種に対する逆翻訳アプローチの違いが与える影響について検討する。
この言語で利用可能な並列データ(18k Ladin-Italian文ペアのみ)が限られていることを考慮し、ラディン-Italian向けに微調整された多言語ニューラルマシン翻訳モデルの性能について検討する。
実験により、この低リソースシナリオにおいて、全てのアプローチが同等の翻訳品質を実現するが、ラウンドトリップ変換はモデル性能の違いを浮き彫りにすることを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:05:43 GMT)
Robotic Control via Embodied Chain-of-Thought Reasoning [0.0] 学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。
視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。
ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:31:01 GMT)
Reducing the Resources Required by ADAPT-VQE Using Coupled Exchange Operators and Improved Subroutines [0.0] ハードウェア上でのADAPT-VQEを計測回数と回路深度で動作させるコストについて述べる。
また、最先端のCEOであるADAPT-VQEは、最も広く知られている静的VQEアンサッツであるUCCSDより優れています。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:31:30 GMT)
RAGAR, Your Falsehood Radar: RAG-Augmented Reasoning for Political Fact-Checking using Multimodal Large Language Models [0.0] 我々は、RAGの連鎖(CoRAG)とRAGの木(ToRAG)の2つの新しい推論手法を紹介する。
彼らは、テキストコンテンツと画像コンテンツの両方を抽出し、外部情報を取得し、その後の質問を事前の証拠に基づいて推論することで、マルチモーダルクレームを事実チェックする。
人間の評価は、生成した事実確認説明の大部分は、金標準データから得られるすべての情報を含んでいることを確認します。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:16:09 GMT)
Protein intrinsic disorder prediction using Attention U-Net and ProtTrans protein language model [0.0] この論文は、意図的U-Net畳み込みニューラルネットワークに基づく、新しいタンパク質内在性障害予測器であるDunctionUnetLMを前文として紹介する。
これは、MSAを用いたflDPnnおよびIDP-CRF予測器と、同じProtTransモデルの特徴を用いたSETH予測器との直接比較において、上位結果を示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:41:51 GMT)
Predicting properties of quantum systems by regression on a quantum computer [0.0] 本稿では,量子特性の予測にデータに依存しない手法を提案する。
我々は、(i)パラメータ化チャネルの出力状態、(ii)2ビット状態の絡み合い、(iii)パラメータ化ハミルトン状態のパラメータを基底状態とする学習において、我々のアプローチを数値的に検証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:06:08 GMT)
Performance Evaluation of Hashing Algorithms on Commodity Hardware [0.0] 本稿では,一般的なハッシュアルゴリズムBlake3,SHA-256,SHA-512の性能評価を行う。
これらのハッシュアルゴリズムは、デジタル署名、メッセージ認証、パスワードストレージなど、様々なアプリケーションで広く使われている。
評価の結果、Blake3はスループットとレイテンシの点でSHA-256とSHA-512の両方を上回っている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:31:02 GMT)
Paving the way toward foundation models for irregular and unaligned Satellite Image Time Series [0.0] ALIgned Sits (ALISE) を提案する。
SITSで現在利用可能なSSLモデルとは異なり、ALISEはSITSを共通の学習された時間的プロジェクション空間に投影するための柔軟なクエリメカニズムを組み込んでいる。
PASTIS, 土地被覆区分 (MultiSenGE) , 新たな作物変化検出データセットの3つの下流課題を通じて, 生産された表現の質を評価する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:42:10 GMT)
On Kirkwood--Dirac quasiprobabilities and unravelings of quantum channel assigned to a tight frame [0.0] 与えられた強フレームのベクトルを使って主クラウス作用素を構築すると、興味深い性質を持つ準確率が生成される。
固有値の位置を特徴付けるための新しい不等式が導出される。
提示された不等式の効用は、次元2における対称的な情報的完備な測定で例示される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 06:25:49 GMT)
Nonlocal Locking of Observable Quantities: A Faithful Signature of Nonclassical Correlations [0.0] 本稿では,多部量子状態における非古典的相関を解析するための一般的な枠組みを提案する。
我々は、観測可能な量の非局所ロックと呼ばれる興味深い現象を明らかにし、観測可能な量の値は非古典的な状態の相関でロックされる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:38:51 GMT)
Non-maximal entanglement of photons from positron-electron annihilation demonstrated using a novel plastic PET scanner [0.0] 現在のPETシステムは、陽電子放出放射性同位元素を標識した分子を、消滅から2つの光子の伝播方向を検出することによって追跡している。
ここでは, プラスチックシンチレータを用いた新しいJ-PETスキャナについて述べる。
多孔質高分子では、光子偏光相関は最大エンタングルド光子よりも弱いが、分離可能な光子よりも強いことが示される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:01:31 GMT)
Mirror-induced effects in cavity polaritonics: influence on edge states [0.0] チェーンに横切る方向の鏡は効果的な欠陥として作用し,Tamエッジ状態の出現につながる可能性が示唆された。
トポロジカル連鎖を考えると、このような横ミラーは強い光-物質結合の影響からエッジ状態を保護できることを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:08:20 GMT)
Manipulating a Tetris-Inspired 3D Video Representation [0.0] ビデオアルゴリズムは、ビデオ内の活動を保存する方法でビデオ圧縮を実行する技術である。
異なるアプリケーションに適した異なるオブジェクト時間データ表現について論じる。
本稿では,ビデオ合成の問題を解決するために,パッキングアルゴリズムの適用について検討する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 22:41:14 GMT)
Majorana Tensor Decomposition: A unifying framework for decompositions of fermionic Hamiltonians to Linear Combination of Unitaries [0.0] 量子コンピュータ上で演算子を符号化する主要なツールの1つとして、LCU(Linear combination of Unitary)分解が出現している。
特に、LCUアプローチは、電子構造ハミルトニアンから量子回路に情報を符号化する方法を示す。
ここでは、既存のLCUを統一し、新しい分解方法を提供するフレームワークであるMajorana Decomposition(MTD)を紹介する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:37:45 GMT)
Leveraging GPT for the Generation of Multi-Platform Social Media Datasets for Research [0.0] ソーシャルメディアデータセットは、偽情報、影響操作、ソーシャルセンシング、ヘイトスピーチ検出、サイバーいじめ、その他の重要なトピックの研究に不可欠である。
これらのデータセットへのアクセスは、コストとプラットフォーム規制のために制限されることが多い。
本稿では,複数のプラットフォームにまたがって,語彙的および意味論的に関連するソーシャルメディアデータセットを作成するための,大規模言語モデルの可能性について検討する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:12:39 GMT)
Learning a quantum channel from its steady-state [0.0] 本研究では,その定常状態である単一状態上で測定された局所的な期待値を用いて,局所的な量子チャネルを学習するスケーラブルな方法を提案する。
成功するためには、定常状態は非自明でなければならないので、チャネルは非単体である必要がある。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:14:38 GMT)
Learning Localization of Body and Finger Animation Skeleton Joints on Three-Dimensional Models of Human Bodies [0.0] 本研究は,人体の3次元モデル内での人体と指のアニメーションの骨格関節の位置決め問題に対する,そのような解決法を提案する。
提案手法を最先端技術と比較することにより,より単純なアーキテクチャで極めて優れた結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:16:02 GMT)
Korean Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0] 韓国のレストランレビューに対するアスペクトベース感性分析(ABSA)の調査は特に欠落している。
韓国語などの低リソース言語におけるABSAの直感的で効果的なフレームワークを提案する。
英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:08:36 GMT)
Knowledge distillation to effectively attain both region-of-interest and global semantics from an image where multiple objects appear [0.0] オブジェクト検出タスクでは、食品のほとんど無限のカテゴリを正確にローカライズし、分類するのは難しい。
我々は、ROI、外ROI、統合モジュールからなる新しいタイプの複合アーキテクチャRveRNetを紹介します。
RveRNetのF1スコアは、曖昧な食品画像の分類において、他の個々のモデルよりも10%良かった。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 07:57:33 GMT)
Investigating the evolution of quantum entanglement of a qubit-qubit system with Dzyaloshinskii-Moriya interaction in the presence of magnetic fields [0.0] 本稿では、等方性XXXハイゼンベルクおよび異方性XYZモデルにおける量子量子量子ビット化合物系の量子エンタングルメントダイナミクスについて検討する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:00:42 GMT)
Intrinsic mixed-state SPT from modulated symmetries and hierarchical structure of anomaly [0.0] 開量子系における固有対称性を保護した位相混合状態のクラスを導入する。
mSPT相は熱平衡下でのギャップを持つハミルトンの基底状態として実現できない。
純状態と混合状態の両方における境界異常の階層構造を詳細に比較する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:01:37 GMT)
Hyperfine-to-rotational energy transfer in ultracold atom-molecule collisions [0.0] 原子-分子衝突における異なる機械的自由度間のエネルギー移動は、広く研究され、広く理解されている。
ここでは,原子超微粒子から分子回転へのエネルギー移動を直接観察した。
観測により、スピンが短距離での機械的回転と結合していることが確認され、将来の理論研究のためのベンチマークが確立される。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 23:20:14 GMT)
How more data can hurt: Instability and regularization in next-generation reservoir computing [0.0] 我々は、この現象のより極端なバージョンが、力学系のデータ駆動モデルに現れることを示した。
トレーニングデータの多いフローマップの表現がより良くなったにもかかわらず、NGRCは不条件の積分器を採用でき、安定性を損なうことが判明した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:22:13 GMT)
How does Burrows' Delta work on medieval Chinese poetic texts? [0.0] Burrows' Deltaは2002年に導入され、著者帰属のための効果的なツールであることが証明されている。
デルタ法が中国語のテキストに与える影響を分析する研究は、ヨーロッパ語のテキストよりも少ない。
唐代の詩人はデルタで正しく識別され、ヨーロッパ標準語で書かれた著者の実証的なパターンが再び確認されている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:07:14 GMT)
Hilbert space fragmentation imposed real spectrum of non-Hermitian systems [0.0] 我々は、強いヒルベルト空間の断片化とある種の大域対称性の存在によって課される制約が、非エルミート量子系の固有スペクトルの現実を確実にすることを示した。
相互作用する2つの有限鎖、すなわちフェルミオン型ネルソン-ハターノとSu-シュリーファー-ヘーガー模型に対するこの洞察を実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:43:59 GMT)
Hilbert space fragmentation from lattice geometry [0.0] ヒルベルト空間の断片化は、領域壁の数を保存するスピン-1/2モデルの格子幾何学から生じる可能性があることを示す。
また,第2世代ヘキサフレークフラクタル格子と修正2次元格子の断面に,ヒルベルト空間のフラグメンテーションに類似したシグネチャが現れることを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:29:16 GMT)
Highway Networks for Improved Surface Reconstruction: The Role of Residuals and Weight Updates [0.0] 我々は,多層パーセプトロンの文脈内で,Square-Highway(SqrHw)と呼ばれるハイウェイネットワーク(Hw)の新たな変種を導入する。
我々は、SqrHwが欠落したデータよりも表面を予測できる能力を実証する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 02:15:21 GMT)
High-fidelity detection of large-scale atom arrays in an optical lattice [0.0] 我々は, サイフス冷却によるストロンチウム原子の高密度イメージングを実演した。
我々は、最大399ドルのツイーザーを持つ大規模ツイーザーアレイの原子のピンニング電位として光学格子を用いる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:10:18 GMT)
High-Precision, Fair University Course Scheduling During a Pandemic [0.0] 本稿では、コース配信モードの拡張分類法を提案し、整数プログラムを示し、コーススケジューリングアルゴリズムを開発する。
我々のアプローチは、教室で各コースセクションの特定の一部が実行されることを保証することで公平である。
フェアネスと同時出席の原理に基づくアルゴリズムは、パンデミック時と通常時の大学コーススケジュールを大幅に改善することができる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 17:56:00 GMT)
Hawking radiation and the Landauer Principle [0.0] ホーキングブラックホールの蒸発がランダウアーの熱力学の原理を飽和させることを示す。
以上の結果から,ホーキング蒸発時にブラックホールが経験した情報損失は可能な限り効率的に発生することが示唆された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:00:02 GMT)
Have We Reached AGI? Comparing ChatGPT, Claude, and Gemini to Human Literacy and Education Benchmarks [0.0] AIの最近の進歩、特に大規模言語モデル(LLM)では、人工知能(AGI)に近づいたことについて疑問が持ち上がっている。
この研究は、米国国勢調査局と技術レポートのデータを用いて、教育ベンチマークにおけるLCMのパフォーマンスとアメリカの平均的な教育成績と識字率を比較した。
その結果、LLMは、学部生の知識や高度な読書理解といったタスクにおいて、人間のベンチマークを著しく上回り、AGIへのかなりの進歩を示していることがわかった。
この研究はAI開発、教育、社会への影響を強調し、継続的な研究と倫理的考察の必要性を強調している。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:38:40 GMT)
Fault Diagnosis in Power Grids with Large Language Model [0.0] 本稿では,Large Language Models (LLMs) を利用して,故障診断精度と説明可能性を向上させる手法を提案する。
我々は、複雑なデータの解釈においてLLMを導くために、包括的でコンテキスト対応のプロンプトを設計した。
実験により,診断精度,説明可能性品質,応答コヒーレンス,文脈理解の大幅な改善が示された。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:44:18 GMT)
Event-based vision on FPGAs -- a survey [0.0] フィールドプログラマブルゲートアレイ(FPGA)は、高速なデータ処理(リアルタイムでも)とエネルギー効率を実現している。
本稿では、FPGAがイベントデータを処理するために様々な文脈で使われている、最も重要な研究の概要について述べる。
フィルタリング、ステレオビジョン、光学フロー、オブジェクト分類のためのAIベースのアルゴリズムの加速、検出と追跡、ロボット工学および検査システムにおける応用などである。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:07:44 GMT)
Evaluating Large Language Models with Grid-Based Game Competitions: An Extensible LLM Benchmark and Leaderboard [0.0] 我々は,Tic-Tac-Toe,Connect Four,Gomokuなどのグリッドベースのゲームを通じて,大規模言語モデル(LLM)の新たなベンチマークを導入する。
GitHubで利用可能なオープンソースのゲームシミュレーションコードにより、LSMは、詳細なデータファイルと競合し、生成することができる。
本稿では,Orthropic の Claude 3.5 Sonnet と Claude 3 Sonnet,Google の Gemini 1.5 Pro と Gemini Flash,OpenAI の GPT-4 Turbo と GPT-4o,Meta の Llama3-70B などの主要な LLM のゲーム結果を紹介する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 03:46:35 GMT)
Estimation of spatio-temporal extremes via generative neural networks [0.0] 利用可能なデータが少ない空間的極端を解析するための統一的なアプローチを提供する。
生成ニューラルネットワークの最近の発展を活用して、完全なサンプルベースの分布を予測する。
提案手法は,複数のシミュレーションされた最大安定過程を適合させて検証し,高精度なアプローチを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:57:17 GMT)
Entropic distinguishability of quantum fields in phase space [0.0] 位相空間における量子場配置のエントロピー不確かさを定量化する手法を提案する。
提案手法は関数型 Husimi $Q$-distribution と好適に選択された相対エントロピーに基づく。
量子相転移における不確実性原理の役割を定量的に解釈する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 16:59:58 GMT)
Efficient characterization of qudit logical gates with gate set tomography using an error-free Virtual-Z-gate model [0.0] クアディットに対してより効率的な GST アプローチを提案し、キュディット・アダマールと仮想Zゲートを用いてフィデューシャルを構築する。
提案手法は,評価結果の計算コストを削減し,GSTの大規模化を図る。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:40:53 GMT)
Effects of stickiness on the quantum states of strongly chaotic open systems [0.0] キックされたローターの標準写像を考察し、閉じた古典写像の強いカオス状態において、粘着性の領域が生き残ることを検証する。
系の位相空間を漏れで走査することにより、量子系の状態の局所化の程度に粘性がどのように影響するかを分析する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:00:03 GMT)
Dynamics of Gender Bias within Computer Science [0.0] ACM SIGは1970年から2000年にかけて拡大し、それぞれが女性作家を増やした。
いくつかのSIGには10%未満の女性作家がおり、SIGUCCSは40%を超えた。
3つのSIGは女性作家の成長を加速させ、ACMを含むほとんどが成長を加速させた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:14:21 GMT)
Direct Measurement of Microwave Loss in Nb Films for Superconducting Qubits [0.0] ニオブ膜は現代の2次元超伝導量子ビットの重要な構成要素である。
我々は,HiPIMS法により作製したニオブ薄膜のマイクロ波消散が,バルクニオブSRFキャビティの高内在的品質因子に類似していることを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 20:43:45 GMT)
Differentiating between human-written and AI-generated texts using linguistic features automatically extracted from an online computational tool [0.0] 本研究の目的は,AIが人間の文章をエミュレートする能力を評価することにある。
人間の発話を模倣したAI生成テキストが現れるにもかかわらず、結果は複数の言語的特徴に有意な差が認められた。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:56:01 GMT)
Description of the hydrogen atom and the He+ ion in an optical cavity using the Pauli-Fierz Hamiltonian [0.0] 光キャビティ内のクーロン電位における1つの電子の系は、テンソル生成光マターベースを用いて解決される。
キャビティサイズがエネルギーレベルおよび高調波発生スペクトルに及ぼす影響について検討した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 15:56:54 GMT)
Deep Learning for Network Anomaly Detection under Data Contamination: Evaluating Robustness and Mitigating Performance Degradation [0.0] ディープラーニング(DL)は、サイバーセキュリティのためのネットワーク異常検出(NAD)において重要なツールとして登場した。
異常検出のためのDLモデルはデータから特徴や学習パターンを抽出するのに優れているが、データ汚染には弱い。
本研究では,データ汚染に対する6つの教師なしDLアルゴリズムのロバスト性を評価する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 19:47:37 GMT)
Cyber Attacks on Maritime Assets and their Impacts on Health and Safety Aboard: A Holistic View [0.0] この研究は、より総合的な視点からこれらの攻撃がもたらす可能性を探究する。
オフショア油田、オフショア風力発電所、自律型船舶などのリスクの高い資産に重点を置いている。
攻撃シナリオ、攻撃ベクトル、およびそれらの物理的結果について議論した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:20:36 GMT)
Chunking: Continual Learning is not just about Distribution Shift [0.0] チャンキングはCLの重要な部分であり、オフライン学習によるパフォーマンス低下の約半分を占めています。
現在のCLアルゴリズムはチャンキングサブプロブレムに対処せず、データ分布に変化がない場合にのみ、通常のSGDトレーニングを実行する。
チャンキングサブプロブレムの性能は向上し,本性能は全CL設定に遷移することを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:13:38 GMT)
Challenges in Mechanistically Interpreting Model Representations [0.0] 機械的解釈可能性(MI)は、ニューラルネットワークが学習する正確なアルゴリズムをリバースエンジニアリングすることで、AIモデルを理解することを目的としている。
これまでのMIにおけるほとんどの研究は、自明でトークンに整合した振る舞いと能力を研究してきた。
我々は特徴と行動の表現を形式化し、その重要性と評価を強調し、Mistral-7B-Instruct-v0.1における不完全表現の探索的研究を行う。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:21:59 GMT)
Brief state of the art in social information mining: Practical application in analysis of trends in French legislative 2024 [0.0] 本稿では、ソーシャルメディアマイニングにおける最先端技術の概要と、2024年のフランス議会選挙におけるトレンド分析の実践的応用について述べる。
我々は、自然言語処理(NLP)ツールを利用して、AgoraVoxプラットフォームからコメントや反応を抽出し分析することで、世論を測る。
研究によると、マリネ・ル・ペン率いる国民ラリー党はソーシャルメディアに高いレベルの関与を保ち、伝統的政党を上回っている。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:22:58 GMT)
Bi-reachability in Petri nets with data [0.0] トークンが無限のデータ領域から値を運ぶ平らなペトリネットの拡張であるデータを用いてペトリネットを調査する。
それぞれの構成が他方から到達可能かどうかを問う。
これは決定可能性の境界線を推し進める。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 11:52:23 GMT)
Arrival Times Versus Detection Times [0.0] 検出時間の確率分布を計算する方法は、長い間議論されてきた問題である。
Das と D"urr がスピンの場合の検出時間の分布として提示した特定の分布が、実際にボヘミア力学が予測するものではない理由を説明する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 13:20:42 GMT)
Are Large Language Models Really Bias-Free? Jailbreak Prompts for Assessing Adversarial Robustness to Bias Elicitation [0.0] 大規模言語モデル(LLM)は人工知能に革命をもたらし、卓越した計算能力と言語能力を示している。
これらのモデルは本質的に、トレーニングデータから生じる様々なバイアスに起因している。
本研究は,近年のLCMの応答におけるこれらのバイアスの存在について検討し,その公正さと信頼性への影響を分析した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 12:30:19 GMT)
Approximating G(t)/GI/1 queues with deep learning [0.0] 待ち行列理論の問題を解くために教師付き機械学習手法を適用する。
G(t)/GI/1 の系における数の過渡分布を推定する。
我々はこれらの分布を高速かつ正確に予測するニューラルネットワーク機構を開発する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 05:25:45 GMT)
An Attempt to Devise a Pairwise Ising-Type Maximum Entropy Model Integrated Cost Function for Optimizing SNN Deployment [0.0] スパイキングニューラルネットワーク(SNN)デプロイメントプロセスでは、ニューラルネットワークをニューロモルフィックハードウェア内の処理ユニットに分割することが多い。
最適配置方式を見つけることはNPハード問題である。
これらの目的には、ニューロンの活動パターンによって形成されるネットワークダイナミクスを考慮する必要がある。
本手法は,ハードウェアに依存しないネットワークダイナミクスに着目し,特定のハードウェア構成とは独立してモデル化できる。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:15:32 GMT)
Advanced Meta-Ensemble Machine Learning Models for Early and Accurate Sepsis Prediction to Improve Patient Outcomes [0.0] 本報告では, 全身性炎症性反応症候群, 早期警戒スコア, クイックシークエンシャル臓器不全評価など, 従来の敗血症スクリーニングツールの限界について検討する。
本稿では,機械学習技術 - ランダムフォレスト, エクストリームグラディエントブースティング, 決定木モデル - を用いて, セプシスの発症を予測することを提案する。
本研究は,これらのモデルについて,精度,精度,リコール,F1スコア,受信器動作特性曲線の下での領域といった重要な指標を用いて,個別かつ組み合わせたメタアンサンブルアプローチで評価する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 00:51:32 GMT)
AbstractBeam: Enhancing Bottom-Up Program Synthesis using Library Learning [0.0] AbstractBeamは、ライブラリ学習を利用してプログラムの繰り返しを識別する、プログラム合成フレームワークである。
我々の実験は、AbstractBeamがLambdaBeam整数リスト操作ドメインにおけるLambdaBeamのパフォーマンスを著しく改善することを示した。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:29:29 GMT)
A thermodynamically consistent approach to the energy costs of quantum measurements [0.0] 熱浴に結合した量子プローブからなる量子計測装置の一般的な顕微鏡モデルを示す。
熱浴の特性を利用して測定結果を冗長に記録し,その自由度を推定する。
本研究では, 熱力学的に可逆な測定が可能であり, 最小限の工数に到達できることを示す。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 08:02:08 GMT)
A multidimensional approach to quantum state tomography of photoelectron wavepackets [0.0] 本稿では,光電子の連続的変動密度行列を単一時間遅延スキャンで再構成できる新しい,より効率的なプロトコルを提案する。
時間で走査されるブロードバンド赤外線プローブと、XUVパルスに時間的に固定される狭帯域IR参照を用いて、XUVパルスの光電子吸収のコヒーレンスを測定する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 18:35:05 GMT)
A class of stable nonlinear non-Hermitian skin modes [0.0] 非エルミート皮膚効果(英: non-Hermitian skin effect, NHSE)は、オープントポロジカルシステムにおいてよく知られている現象である。
NHSEは多くの固有状態が境界で局所化される。
本稿では, 非線形有限格子における安定な局所化状態を実現する手法を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 21:55:01 GMT)
A Quantum Computing Approach for Multi-robot Coverage Path Planning [0.0] 本稿では,探索・救助・環境モニタリングなどのアプリケーションに不可欠な多車種被覆経路計画問題に取り組む。
本稿では,量子交換演算子Ansatzと簡単に統合できる2次元グリッドの探索手法を提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 10:11:23 GMT)
A Machine Learning Approach to Detecting Albedo Anomalies on the Lunar Surface [0.0] 本研究では、月面のアルベド異常を探索・予測するために機械学習(ML)技術を用いたデータ駆動アプローチを提案する。
主な目的は、化学元素とアルベドの関係を識別し、惑星表面の理解を深めることである。
本稿では,予測誤差を可視化し,その空間的および化学的特性を記述するための対話型解析ツールを提案する。
論文参考訳(メタデータ) (Thu, 11 Jul 2024 09:10:09 GMT)