PartCraft: Crafting Creative Objects by Parts [128.3] 本稿では、ユーザが「選択」できることによって、生成的視覚AIにおける創造的制御を促進する。
私たちは初めて、創造的な努力のために、視覚的概念をパーツごとに選択できるようにしました。
選択された視覚概念を正確にキャプチャするきめ細かい生成。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:53:04 GMT)
Regulating Model Reliance on Non-Robust Features by Smoothing Input Marginal Density [93.3] 信頼できる機械学習は、非ロバストな特徴に依存するモデルの厳密な規制を必要とする。
本稿では,モデル予測を入力に関連付けることによって,そのような特徴を記述・規制するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:16:56 GMT)
FUTURE-AI: International consensus guideline for trustworthy and deployable artificial intelligence in healthcare [74.0] 医療AIに関連する技術的、臨床的、倫理的、法的リスクに関する懸念が高まっている。
この研究は、Future-AIガイドラインを、医療における信頼できるAIツールの開発とデプロイを導くための最初の国際コンセンサスフレームワークとして説明している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:28:25 GMT)
Representation Surgery: Theory and Practice of Affine Steering [72.6] 言語モデルは、しばしば好ましくない振る舞いを示す。
モデルが望ましくない振る舞いを示すのを防ぐための自然な(そして一般的な)アプローチの1つは、モデルの表現を操ることである。
本稿では, ステアリング機能の形式的および経験的特性について検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:14:29 GMT)
AnyMaker: Zero-shot General Object Customization via Decoupled Dual-Level ID Injection [72.4] 我々は,高ID忠実度とフレキシブルテキスト編集性を備えた汎用オブジェクトを生成するフレームワークであるAnyMakerを紹介する。
AnyMakerの有効性は、新しい一般ID抽出、二重レベルID注入、およびID認識デカップリングに起因している。
我々のアプローチを検証し、汎用オブジェクトのカスタマイズの研究を促進するため、我々は最初の大規模汎用IDデータセットを作成します。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:10:51 GMT)
Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.2] 我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。
Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:25:04 GMT)
Learning to (Learn at Test Time): RNNs with Expressive Hidden States [69.8] 本稿では,線形複雑度と表現的隠蔽状態を有する新しいシーケンスモデリング層を提案する。
隠れた状態はテストシーケンスでもトレーニングによって更新されるので、私たちのレイヤはテスト時間トレーニング層と呼ばれます。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:23:20 GMT)
On scalable oversight with weak LLMs judging strong LLMs [67.9] 我々は、2つのAIが1人の裁判官を納得させようとする議論、すなわち1人のAIが1人の裁判官を説得し、質問をする。
大規模言語モデル(LLM)をAIエージェントと人間の判断のためのスタンドインの両方として使用し、判断モデルがエージェントモデルよりも弱いと判断する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:29:15 GMT)
360 in the Wild: Dataset for Depth Prediction and View Synthesis [66.6] 大規模な360$circ$ビデオデータセットを野放しに導入する。
このデータセットはインターネットから慎重に取り除かれ、世界中で様々な場所から収集されている。
データセットを構成する25K画像のそれぞれに、それぞれのカメラのポーズと深さマップが提供される。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 02:56:10 GMT)
Understanding the Gains from Repeated Self-Distillation [65.5] 自己蒸留は、学生モデルが教師モデルと同じアーキテクチャを持つ知識蒸留の一種である。
多段階の自己蒸留によって達成される余剰リスクは、単段階の自己蒸留において著しく改善できることを示す。
UCIレポジトリの回帰タスクに関する実証的な結果は、学習モデルのリスク(MSE)を最大47%削減することを示している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:48:34 GMT)
ANAH-v2: Scaling Analytical Hallucination Annotation of Large Language Models [65.1] 大規模言語モデル (LLM) は、様々な領域や広範囲のアプリケーションにまたがる、長い形式の質問応答タスクにおいて幻覚を示す。
現在の幻覚検出と緩和データセットはドメインやサイズによって制限されている。
本稿では,幻覚アノテーションデータセットを同時に,段階的にスケールアップする反復的自己学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:56:38 GMT)
Towards Stable 3D Object Detection [64.5] 安定度指数(SI)は3次元検出器の安定性を信頼度、ボックスの定位、範囲、方向で総合的に評価できる新しい指標である。
モデルの安定性向上を支援するため,予測一貫性学習(PCL)と呼ばれる,汎用的で効果的なトレーニング戦略を導入する。
PCLは本質的に、異なるタイムスタンプと拡張の下で同じオブジェクトの予測一貫性を促進し、検出安定性を向上させる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:17:58 GMT)
SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages [64.1] SEACrowdは3つのモダリティにまたがる1000近い言語で標準化されたコーパスを統合する共同イニシアチブである。
私たちは、13のタスクにわたる36のネイティブ言語上のAIモデルの品質を評価し、SEAの現在のAI状況に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:28:20 GMT)
LoCo: Low-Bit Communication Adaptor for Large-scale Model Training [63.0] 低ビット通信は、しばしば圧縮情報損失によってトレーニング品質が低下する。
本稿では,ローカルGPUノードを補償するLoCo(Lo-bit Communication Adaptor)を提案する。
実験結果から,Megatron-LMやPyTorchs FSDPといった大規模トレーニングモデルフレームワークの移動により,LoCoは圧縮通信効率を大幅に向上することがわかった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:01:36 GMT)
Discovering symbolic expressions with parallelized tree search [59.9] 記号回帰は、データから簡潔で解釈可能な数学的表現を発見する能力のおかげで、科学研究において重要な役割を果たす。
既存のアルゴリズムは、複雑性の問題に対処する際の精度と効率の重要なボトルネックに直面してきた。
本稿では,限定データから汎用数学的表現を効率的に抽出する並列木探索(PTS)モデルを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:41:15 GMT)
MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation? [59.8] MJ-Benchは、マルチモーダル・ジャッジを評価するために、包括的な選好データセットを組み込んだ新しいベンチマークである。
具体的には、より小型のCLIPベースのスコアリングモデル、オープンソースのVLM、オープンソースのVLMなど、様々なマルチモーダル・ジャッジを評価する。
実験の結果、オープンソースのVLMは一般的にフィードバックが良く、GPT-4oは他の審査員を平均上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:03:16 GMT)
Training Guarantees of Neural Network Classification Two-Sample Tests by Kernel Analysis [58.4] 2つのデータセットが同じ分布から来たかどうかを判断するために、ニューラルネットワークの2サンプルテストを構築し、分析する。
NTK2サンプルテストがデータセット間の偏差レベルを検出するのに必要となる、理論的に最小限のトレーニング時間を導出する。
ニューラルネットワークのトレーニングサンプルとテスト評価サンプルが無限に近づくにつれて、ニューラルネットワークの2サンプルテストに関連する統計的パワーは1になる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:41:16 GMT)
mPLM-Sim: Better Cross-Lingual Similarity and Transfer in Multilingual Pretrained Language Models [57.2] マルチ並列コーパスを用いてmPLMから言語間の類似性を誘導する言語類似度尺度mPLMSimを提案する。
本研究は,mPLM-Simが,レキシコ,系譜系,地理的スプラックバンドなどの言語類似性尺度と適度に高い相関を示すことを示す。
さらに,mPLMSimが低レベル構文タスクと高レベル意味タスクの両方で実験を行うことで,ゼロショットの言語間移動に有効であるかどうかについても検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:19:52 GMT)
Are Large Language Models Strategic Decision Makers? A Study of Performance and Bias in Two-Player Non-Zero-Sum Games [56.7] 大規模言語モデル(LLM)は、現実世界での利用が増えているが、その戦略能力はほとんど解明されていない。
戦略ゲーム,Stag Hunt と Prisoner Dilemma における LLM の動作について検討し,異なる設定とプロンプト下での性能変動を分析した。
以上の結果から,(1)位置バイアス,(2)支払いバイアス,(3)行動バイアスの少なくとも1つが評価された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:30:02 GMT)
Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.0] STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:16:22 GMT)
Enhancing learning in artificial neural networks through cellular heterogeneity and neuromodulatory signaling [52.1] 人工ニューラルネットワーク(ANN)の強化のための生物学的インフォームドフレームワークを提案する。
提案したデュアルフレームアプローチは、多様なスパイキング動作をエミュレートするためのスパイキングニューラルネットワーク(SNN)の可能性を強調している。
提案手法は脳にインスパイアされたコンパートメントモデルとタスク駆動型SNN, バイオインスピレーション, 複雑性を統合している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:11:28 GMT)
GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction [52.0] 単一視点からの3次元オブジェクト再構成のためのガウススプティング表現に基づく拡散モデル手法を提案する。
モデルはGS楕円体の集合で表される3Dオブジェクトを生成することを学習する。
最終的な再構成されたオブジェクトは、高品質な3D構造とテクスチャを持ち、任意のビューで効率的にレンダリングできる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:43:08 GMT)
MuseBarControl: Enhancing Fine-Grained Control in Symbolic Music Generation through Pre-Training and Counterfactual Loss [51.9] 制御信号と対応する音楽トークンを直接リンクする事前学習タスクを導入する。
次に、生成した音楽と制御プロンプトとの整合性を向上する新たな対実的損失を実現する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:08:22 GMT)
DELL: Generating Reactions and Explanations for LLM-Based Misinformation Detection [50.8] 大規模な言語モデルは、事実性や幻覚の難しさによって制限され、ニュース記事の正確さを判断するために、棚外で直接使用される。
我々は,LLMをパイプラインの一部として組み込む誤情報検出の3つの重要な段階を同定するDellを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 00:59:45 GMT)
GPT vs RETRO: Exploring the Intersection of Retrieval and Parameter-Efficient Fine-Tuning [48.7] PEFT法を改良型Retrieval-Enhanced Transformer (RETRO) およびベースラインGPTモデルに適用する。
本稿では、RETROモデルが、独自の事前学習プロセスにより、ゼロショット設定でGPTモデルより優れていることを示す。
本研究は, GPTモデルとRETROモデルの両方に適用された各種PEFT法をRAGと統合した最初の包括的比較である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:16:47 GMT)
Leveraging Large Language Models for Integrated Satellite-Aerial-Terrestrial Networks: Recent Advances and Future Directions [47.8] 統合衛星、航空、地上ネットワーク(ISATN)は多様な通信技術の洗練された収束を表現している。
本稿では,Large Language Models (LLM) を ISATN に統合するトランスフォーメーションの可能性について検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:23:43 GMT)
We Need Variations in Speech Synthesis: Sub-center Modelling for Speaker Embeddings [47.3] 音声合成においては、人間の声に含まれる豊かな感情と韻律変化のモデリングが自然音声の合成に不可欠である。
本稿では,従来の組込み方式として単一クラス中心ではなく,複数クラス中心を用いた話者分類訓練を行う新しい組込みネットワークを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:54:24 GMT)
MUSES: The Multi-Sensor Semantic Perception Dataset for Driving under Uncertainty [46.4] MUSES(MUlti-Sensor Semantic 知覚データセット)を導入する。
データセットはフレームカメラ、ライダー、レーダー、イベントカメラ、IMU/GNSSセンサーを統合する。
MUSESは、様々な視覚条件下でモデルを評価するのに、トレーニングと挑戦の両方に効果的であることを証明している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:00:37 GMT)
Artificial Intelligence in Industry 4.0: A Review of Integration Challenges for Industrial Systems [45.3] サイバー物理システム(CPS)は、予測保守や生産計画を含むアプリケーションに人工知能(AI)が活用できる膨大なデータセットを生成する。
AIの可能性を実証しているにもかかわらず、製造業のような分野に広く採用されていることは依然として限られている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:02:59 GMT)
Systematic Evaluation of Online Speaker Diarization Systems Regarding their Latency [45.0] 遅延とは、音声入力から対応する話者ラベルの出力までの時間である。
DIART-pipeline では、埋め込みモデルである pyannote/embedding で最低レイテンシを実現する。
FS-EENDシステムも同様に優れたレイテンシを示している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:54:27 GMT)
Re-Tuning: Overcoming the Compositionality Limits of Large Language Models with Recursive Tuning [44.9] 本稿では,大規模言語モデルを用いた合成課題の解法を提案する。
我々の手法であるRe-Tuningは、問題をサブプロブレムに分解し、それらのサブプロブレムを解き、結果を組み合わせるためにモデルを調整する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:02:28 GMT)
VRSD: Rethinking Similarity and Diversity for Retrieval in Large Language Models [43.5] 本稿では,検索過程における類似性と多様性の制約を特徴付ける新しい手法を提案する。
本稿では,アルゴリズムのベクトル検索と類似性と多様性(VRSD)について述べる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:08:44 GMT)
Memory Sharing for Large Language Model based Agents [43.5] 本稿では,リアルタイムメモリフィルタ,ストレージ,検索を統合し,In-Context学習プロセスを強化するためのフレームワークであるMemory Sharingを紹介する。
実験の結果,MSフレームワークはオープンな質問に対処する際のエージェントの性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:22:58 GMT)
SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking [43.3] 数十億のパラメータを持つ最近の大規模言語モデル(LLM)は、様々な現実世界のアプリケーションにまたがってパフォーマンスを高めている。
人間の脳は、同様の数のパラメータを持つLSMに比べて、エネルギー効率が著しく高い。
本稿では,SpykeLLM と呼ばれる最近の LLM として,最初のスパイク大言語モデルを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:37:17 GMT)
Robust Sparse Mean Estimation via Sum of Squares [42.5] 本研究では,高次元スパース平均推定の問題点を,逆数外乱の$epsilon$-fractionの存在下で検討する。
我々のアルゴリズムは、サム・オブ・スクエア(Sum-of-Squares)ベースのアルゴリズムアプローチに従う。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:40:00 GMT)
Variational and Explanatory Neural Networks for Encoding Cancer Profiles and Predicting Drug Responses [40.8] 既存のAIモデルは、転写学データのノイズと生物学的解釈性の欠如により、課題に直面している。
ノイズ効果を軽減するために変動成分を組み込んだ新しいニューラルネットワークフレームワークVETEを紹介する。
VETEは、AIによる予測と、がん研究における生物学的に意味のある洞察のギャップを埋める。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:13:02 GMT)
AWT: Transferring Vision-Language Models via Augmentation, Weighting, and Transportation [40.2] 我々は新しい適応フレームワークAWT(Augment, Weight, then Transport)を紹介する。
AWTは3つの重要なコンポーネントで構成されている。
AWTは様々な視覚言語モデルにシームレスに統合できる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:52:23 GMT)
Transformer Wave Function for Quantum Long-Range models [39.6] 我々は、ビジョントランスフォーマー(ViT)アーキテクチャに基づくニューラルネットワークアーキテクチャを用いて、量子長距離モデルの基底状態を検出する。
強磁性および反強磁性の両方の場合において、モデルの全位相図と臨界特性を計算する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:00:01 GMT)
Shedding the Bits: Pushing the Boundaries of Quantization with Minifloats on FPGAs [39.4] 後トレーニング量子化(PTQ)はモデル圧縮の強力な技術であり、追加のトレーニングオーバーヘッドなしにニューラルネットワークの数値精度を低下させる。
近年,モデル推論におけるPTQの文脈における8ビット浮動小数点形式(FP8)の適用について検討している。
本稿では,モデルのメモリフットプリント,レイテンシ,エネルギーコストをさらに削減できる,精度の低い浮動小数点形状のミニフロートを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:26:45 GMT)
Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model Training [33.5] Iterative Prompt Relabeling (IPR) は、反復的な画像サンプリングとプロンプトレバリングによって画像とテキストをアライメントする新しいアルゴリズムである。
我々はSDv2とSDXLについて徹底的な実験を行い、空間関係の指示に従う能力をテストする。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:59:24 GMT)
Identification of Novel Modes in Generative Models via Fourier-based Differential Clustering [33.2] 本稿では,Fourier-based Identification of Novel Clusters (FINC) という手法を提案する。
FINCの大規模コンピュータビジョンデータセットおよび生成モデルフレームワークへの応用を実証する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:11:17 GMT)
RAM: Towards an Ever-Improving Memory System by Learning from Communications [32.9] 本稿では,RAMと呼ばれるメモリを改良した革新的なRAGベースのフレームワークを提案する。
シミュレーションと実ユーザの両方による実験は、従来のRAG法や自己知識法よりも大幅に改善されている。
RAMは、様々なフィードバックと検索方法への有望な適応性を示し、動的知識獲得と生涯学習におけるAI能力の進歩の可能性を示している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:57:54 GMT)
Language-Guided World Models: A Model-Based Approach to AI Control [31.9] 本稿では,LWM(Language-Guided World Models)の概念を紹介する。
LWMは、テキストを読むことで環境をシミュレートできる確率モデルである。
構成言語記述を一般化できる堅牢なLWMを開発するための最初のステップを採る。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 02:49:47 GMT)
Unified Interpretation of Smoothing Methods for Negative Sampling Loss Functions in Knowledge Graph Embedding [31.3] 本稿では、知識グラフ(KG)における負サンプリング(NS)損失の平滑化に関する理論的解釈を提供する。
新しいNS損失であるトリプルト適応負サンプリング(Triplet Adaptive Negative Smpling, TANS)を誘導し、従来の平滑化法の特徴をカバーする。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:38:17 GMT)
Dude: Dual Distribution-Aware Context Prompt Learning For Large Vision-Language Model [27.6] ドメイン共有コンテキストとクラス固有コンテキストの両方の2つのコンテキストに基づいた新しいフレームワークを導入する。
このような二重プロンプト手法は、大規模言語モデルで符号化された暗黙的および明示的な要素を結合することによって、モデルの特徴表現を強化する。
また、構築されたプロンプトと視覚トークンの関係を定量化するために、不均衡最適輸送(UOT)理論を定式化する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:15:29 GMT)
Structural Constraint Integration in Generative Model for Discovery of Quantum Material Candidates [27.4] 遺伝子モデル(SCIGEN)における構造制約の統合について紹介する。
プロトタイプの制約としてアルキメデス格子を用いて800万の化合物を生成し, 10%以上の安定性が維持されている。
量子材料の性質は幾何学的パターンと密接に関連しているため、SCIGENは量子材料候補を生成するための一般的な枠組みを提供することを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:42:54 GMT)
VCoME: Verbal Video Composition with Multimodal Editing Effects [26.3] 編集効果を考慮した音声合成の新しい課題について紹介する。
本課題は,マルチモーダル編集効果を統合することで,コヒーレントで視覚的に魅力的なビデオを生成することである。
ビデオ合成のための編集効果を生成するために,大規模なマルチモーダルモデルを用いたVCoMEを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:59:02 GMT)
A Question-centric Multi-experts Contrastive Learning Framework for Improving the Accuracy and Interpretability of Deep Sequential Knowledge Tracing Models [26.3] 知識追跡は,学生の今後の業績を予測する上で重要な役割を担っている。
ディープニューラルネットワーク(DNN)は、KT問題を解決する大きな可能性を示している。
しかし、KTプロセスのモデル化にディープラーニング技術を適用する際には、いくつかの重要な課題がある。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:11:43 GMT)
Ads Recommendation in a Collapsed and Entangled World [26.0] この作業は、Tencentの広告レコメンデーションチームの過去10年間の継続的な取り組みに基づいている。
一般的な設計原則を要約し、利用可能なソリューションと分析ツールのシリーズを提示する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:20:15 GMT)
Multi-Task Domain Adaptation for Language Grounding with 3D Objects [26.0] 本稿では,3次元オブジェクトを用いたDA4LG(Domain Adaptation for Language Grounding)という新しい手法を提案する。
具体的には、DA4LGは、視覚言語アライメントを実現するために、マルチタスク学習を備えたビジュアルアダプタモジュールで構成されている。
実験の結果,DA4LGは視覚的および非視覚的言語記述間で競合的に機能することが示された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:10:49 GMT)
Let the Expert Stick to His Last: Expert-Specialized Fine-Tuning for Sparse Architectural Large Language Models [24.9] エキスパート特化ファインチューニング(Expert-Specialized Fine-Tuning、ESFT)は、他の専門家やモジュールを凍結しながら、下流のタスクに最も関係のある専門家をチューニングする。
よりきめ細かい専門家によるMoEモデルは、下流タスクに最も関係のある専門家の組み合わせを選択する上でより有利である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:23:59 GMT)
Towards Audio Codec-based Speech Separation [24.8] 音声分離は波形マスキングタスクである。
そこで我々は,NAC の埋め込み空間内で SS を行う,Audio Codec ベースの SS の新たなタスクを提案する。
推論では、CodecformerはMACの52倍の削減を実現し、Sepformerのクラウドデプロイメントに匹敵する分離性能を実現している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:50:06 GMT)
PoPreRo: A New Dataset for Popularity Prediction of Romanian Reddit Posts [23.0] PoPreRoは、Redditから収集されたルーマニアの投稿の人気予測のための最初のデータセットである。
PoPreRoデータセットには、ルーマニアの5つの異なるサブレディットからのポストサンプルの様々なコンパイルが含まれており、合計28,107のデータサンプルが含まれている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:28:12 GMT)
Deep Reinforcement Learning with Dynamic Graphs for Adaptive Informative Path Planning [22.5] ロボットデータ取得における重要な課題は、当初未知の環境を抜けて観測を収集する計画経路である。
そこで本研究では,未知の3D環境において,ロボット経路を適応的に計画し,対象をマップする深層強化学習手法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:07:43 GMT)
VCD-Texture: Variance Alignment based 3D-2D Co-Denoising for Text-Guided Texturing [22.4] 本研究では,2次元拡散モデルと3次元拡散モデルの間のモーダルギャップに対処する分散テクスチャ合成を提案する。
我々は、競合する領域との詳細な関係を改善するために、塗装モジュールを提示する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:11:33 GMT)
Jailbreak Attacks and Defenses Against Large Language Models: A Survey [22.4] 大規模言語モデル(LLM)は、様々なテキスト生成タスクにおいて例外的に機能している。
ジェイルブレイク」は、利用方針や社会に対する悪意ある反応をモデルに誘導する。
本稿では,ジェイルブレイク攻撃と防衛方法の包括的かつ詳細な分類法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:57:30 GMT)
Identifying the Source of Generation for Large Language Models [21.9] LLM(Large Language Model)は、複数の文書ソースからのテキストを記憶する言語である。
LLMは生成されたコンテンツに関する文書情報を提供できない。
この研究は、デコードステップでトークンレベルのソース識別を導入する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:52:15 GMT)
An Interactive Multi-modal Query Answering System with Retrieval-Augmented Large Language Models [21.9] 本稿では,新たに開発したマルチモーダル検索フレームワークとナビゲーショングラフインデックスを用いて,対話型マルチモーダルクエリ・アンサーリング(MQA)システムを提案する。
MQAの特筆すべき点は、異なるモダリティの重要性を評価するために、コントラスト学習を利用することである。
本システムは,計算プルーニング技術を用いて改良した,先進的なナビゲーショングラフインデックスによる効率的な検索を実現する。
論文参考訳(メタデータ) (Fri, 05 Jul 2024 02:01:49 GMT)
Speculative Speech Recognition by Audio-Prefixed Low-Rank Adaptation of Language Models [21.9] 投機的音声認識(SSR)
本稿では、RNN-Transducer-based ASRシステムと音声処理言語モデル(LM)を組み合わせたSSRモデルを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:52:55 GMT)
Towards Multimodal Sentiment Analysis Debiasing via Bias Purification [21.2] マルチモーダル・センティメント・アナリティクス(MSA)は、多様なモダリティから感情に関連する手がかりを統合することで、人間の意図を理解することを目的としている。
MSAタスクは、計画されていないデータセットバイアス、特にマルチモーダル発話レベルのラベルバイアスと単語レベルのコンテキストバイアスに悩まされる。
本稿では,従来の可能性ではなく因果関係に基づくマルチモーダル・カウンターファクト・インジェクチャ・インセプティメント分析フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:10:06 GMT)
On Evaluating The Performance of Watermarked Machine-Generated Texts Under Adversarial Attacks [21.0] まず、メインストリームのウォーターマーキングスキームと、機械生成テキストに対する削除攻撃を組み合わせます。
8つの透かし(5つのプレテキスト、3つのポストテキスト)と12のアタック(2つのプレテキスト、10のポストテキスト)を87のシナリオで評価した。
その結果、KGWとExponentialの透かしは高いテキスト品質と透かしの保持を提供するが、ほとんどの攻撃に対して脆弱であることが示唆された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:09:06 GMT)
Sampling from the Mean-Field Stationary Distribution [21.0] 平均場SDEの定常分布からのサンプリングの複雑さについて検討する。
我々のアプローチは概念的にシンプルであり、その柔軟性はアルゴリズムと理論の両方に最先端の技術を取り入れることができる。
重要な技術的貢献は、平均場ランゲヴィン力学の定常分布に対する新しい均一-$N$log-Sobolev不等式を確立することである。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:15:36 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6] 我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。
以上の結果から,最高性能のLPMであるGPT-4oでもゲーム全体の8%しか解けないことがわかった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:18:00 GMT)
Where have you been? A Study of Privacy Risk for Point-of-Interest Recommendation [20.5] モビリティデータは、ロケーションベースサービス(LBS)のための機械学習(ML)モデルを構築するために使用できる。
しかし、この種のデータには、自宅や職場など、ユーザの身元に関する機密情報が含まれている可能性があるため、プライバシー漏洩のリスクが伴う。
我々は,POI(point-of-interest)レコメンデーションモデルに適したデータ抽出とメンバシップ推論攻撃を含むプライバシ攻撃スイートを設計する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:17:38 GMT)
Testing learning hypotheses using neural networks by manipulating learning data [20.5] ニューラルネットワーク言語モデルでは、人間が表示するものと類似した受動的制約を学習できることが示される。
動詞が受動的に現れる頻度は受動性に大きな影響を及ぼすが、動詞の意味論は影響しない。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:41:30 GMT)
Maximizing utility in multi-agent environments by anticipating the behavior of other learners [17.7] マルチエージェント設定では、各エージェントの決定がユーティリティや他のエージェントに影響を与える可能性がある。
本稿では,2種類のエージェントを含む2人プレイヤゲームについて検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 23:16:18 GMT)
Minimalist and High-Quality Panoramic Imaging with PSF-aware Transformers [17.7] 360degの視野(FoV)を持つ高画質パノラマ画像は、現代のパノラマコンピュータビジョンタスクに不可欠である。
従来のイメージングシステムは、高度なレンズデザインと重い光学部品を備えている。
パノラマイメージングエンジン(PCIE)を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 00:03:05 GMT)
FuXi-ENS: A machine learning model for medium-range ensemble weather forecasting [17.6] 我々は,最大15日間のグローバルアンサンブル天気予報を実現するために設計された,高度なMLモデルであるFuXi-ENSを紹介する。
FuXi-ENS は空間分解能が 0.25 度大きく向上し、13の圧力レベルで5つの大気変数と13の表面変数が組み込まれている。
その結果,FXi-ENSは360変数の98.1%のCRPSと予測リードタイムの組み合わせで,世界有数のNWPモデルであるECMWFのアンサンブル予測よりも優れていた。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:48:50 GMT)
Romanization Encoding For Multilingual ASR [17.3] 我々は,多言語およびコードスイッチング自動音声認識システムの最適化のために,スクリプト重言語に対するロマネライズ符号化を導入する。
Roman2Charモジュールを備えたFastConformer-RNNTフレームワークにおいて,バランスの取れたトークンライザとともにローマン化符号化を採用することにより,語彙や出力次元を大幅に削減する。
本手法は,音響モデルと言語モデリングを分離し,システムの柔軟性と適応性を向上する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:13:24 GMT)
When LLMs Play the Telephone Game: Cumulative Changes and Attractors in Iterated Cultural Transmissions [17.1] 大規模言語モデル(LLM)は相互に相互作用し、オンラインで大量のテキストを生成する。
単一の出力レベルで無視される小さなバイアスは、反復的なインタラクションで増幅されるリスクである。
テキスト毒性, 肯定性, 難易度, および伝達鎖間の長さの進化を追跡することにより, バイアスやアトラクタの存在を明らかにする。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:44:09 GMT)
CanonicalFusion: Generating Drivable 3D Human Avatars from Multiple Images [17.1] カノニカルフュージョン(CanonicalFusion)と呼ばれる複数の画像からアニマタブルなヒトアバターを再構成するための新しい枠組みを提案する。
まず,LBS(Linear Blend Skinning)重みマップと深度マップを共有エンコーダ・デュアルデコーダネットワークを用いて予測し,予測深度マップから3次元メッシュの直接正準化を可能にする。
また,複数画像から再構成した結果をマージするために,前方スキンベースの異なるレンダリング方式を導入する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:36:26 GMT)
Efficient Detection of Long Consistent Cycles and its Application to Distributed Synchronization [16.0] グループ同期は、SfM(Structure from Motion)のグローバルパイプラインにおいて重要な役割を果たす
サイクル同期はこれらの課題に対処するのに有効である。
3から6までの長さの周期からの情報を活用するグループ同期アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:19:53 GMT)
YourMT3+: Multi-instrument Music Transcription with Enhanced Transformer Architectures and Cross-dataset Stem Augmentation [16.0] マルチストラクチャメント音楽の書き起こしは、ポリフォニック音楽の録音を各楽器に割り当てられた楽譜に変換することを目的としている。
YourMT3+は、MT3の最近の言語トークンデコードアプローチに基づいた、マルチストラクチャメント音楽の書き起こし強化のためのモデルのセットである。
実験では,音声分離前処理装置の不要さを排除し,直接音声書き起こし機能を示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 19:18:33 GMT)
Optimizing the image correction pipeline for pedestrian detection in the thermal-infrared domain [16.0] 赤外線画像は、霧や低照度シナリオのような低視認性状況に役立ちます。
熱雑音の傾向があり、さらなる処理と修正が必要である。
本研究では,異なる赤外線処理パイプラインが都市環境における歩行者検出性能に与える影響について検討した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:07:40 GMT)
Lazarus: Resilient and Elastic Training of Mixture-of-Experts Models with Adaptive Expert Placement [15.9] 大規模言語モデル(LLM)の弾力性と弾力性を備えたトレーニングシステムであるLazarusについて述べる。
Lazarusはエキスパートのレプリカを適応的に割り当てて、専門家のワークロードとスピードアップトレーニングの固有の不均衡に対処する。
フェール時の回復確率を最大化するために、証明可能な最適専門家配置アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:13:41 GMT)
Read Between the Layers: Leveraging Multi-Layer Representations for Rehearsal-Free Continual Learning with Pre-Trained Models [15.8] 本研究では,非定常分布から連続的なタスク列を学習しなければならない連続学習問題に対処する。
プレトレーニングネットワークの複数の中間層からの2次特徴統計量を利用する,CL に対する新しいプロトタイプベースのアプローチである LayUP を提案する。
その結果、CLにおける事前学習モデルの表現能力を完全に消耗させることは、最終的な埋め込みをはるかに超えることを示した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:43:41 GMT)
Amazing Things Come From Having Many Good Models [15.8] 羅生門効果は、同じデータセットに対して等しく良い予測モデルが存在するという現象を記述している。
このパースペクティブは、機械学習に対する考え方を変えることを提案する。
私たちのゴールは、Rashomon効果が社会の複雑な問題に対する機械学習の利用に大きな影響を与えるかを説明することです。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:14:36 GMT)
Langevin Dynamics: A Unified Perspective on Optimization via Lyapunov Potentials [15.7] 我々は、リアプノフポテンシャルと最適化に基づいて、グラディエント・ランゲヴィン・ダイナミクス(SGLD)のグローバル・ミニマへの収束を分析する。
2) SGLD に対する最初の有限勾配複雑性、3) 連続時間ランゲヴィンダイナミクスが最適化に成功するなら、次に離散時間 SGLD が穏やかな正則性仮定の下で成功することを証明する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:34:10 GMT)
Unsupervised Learning of Category-Level 3D Pose from Object-Centric Videos [15.5] カテゴリーレベルの3Dポーズ推定は、コンピュータビジョンとロボット工学において基本的に重要な問題である。
カテゴリーレベルの3Dポーズを,カジュアルに撮られた対象中心の動画からのみ推定する学習の課題に取り組む。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:43:05 GMT)
Transformer-Lite: High-efficiency Deployment of Large Language Models on Mobile Phone GPUs [15.3] 大規模言語モデル(LLM)は、インテリジェントアシスタント、テキスト要約、翻訳、携帯電話でのマルチモダリティといったタスクに広く使われている。
デバイスGPU上でのLLMの高効率展開を容易にするため,我々は4つの最適化手法を提案する。
モバイル推論エンジンであるTransformer-LiteはQualcommおよびMTKプロセッサと互換性がある。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:18:42 GMT)
What can we learn from quantum convolutional neural networks? [15.2] 量子データを扱うことは、隠れた特徴マップを通して物理系のパラメータを埋め込んだものと見なすことができる。
また, 適切に選択された基底状態埋め込みを持つQCNNが流体力学問題に利用できることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:18:30 GMT)
Annotation of Sleep Depth Index with Scalable Deep Learning Yields Novel Digital Biomarkers for Sleep Health [15.2] 伝統的な睡眠ステージは、睡眠と覚醒を5つの粗いクラスに分類し、各ステージの微妙な変化を見越す。
既存の睡眠ステージリングラベルを用いた睡眠深度指標の自動的かつスケーラブルなアノテーションのディープラーニング手法を提案する。
本手法は4つの大規模コホートにまたがる1万以上の録音からポリソムノグラフィーを用いて検証した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:42:49 GMT)
Age Aware Scheduling for Differentially-Private Federated Learning [14.8] 本稿では,DP制約のないモデルと集約モデルとの損失差を最小化しつつ,DP要件を満たす最適化問題を提案する。
スケジューリングの利点を生かして、年齢依存的な損失上限を導入し、年齢認識型スケジューリング設計の開発に繋がる。
本研究は,フェデレートラーニングにおける年齢,正確性,DPの相互作用に関する知見を,スケジューリング戦略の実践的意義として貢献する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:01:11 GMT)
HeartBeat: Towards Controllable Echocardiography Video Synthesis with Multimodal Conditions-Guided Diffusion Models [14.3] 本稿では、制御可能で高忠実なECHOビデオ合成のためのHeartBeatという新しいフレームワークを提案する。
HeartBeatは、マルチモーダル条件を同時に認識し、制御可能な生成をガイドする統合フレームワークとして機能する。
このように、ユーザはマルチモーダル制御信号を組み合わせることで、心的イメージに適合するECHOビデオを合成することができる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:56:29 GMT)
Machine Learning for Complex Systems with Abnormal Pattern by Exception Maximization Outlier Detection Method [14.3] EMODMは2状態ガウス混合モデルに基づいており、異常検出において強い性能を示す。
我々は3相インバータの電流および電圧出力により,EMODMを用いた回路系の短絡パターンを検出した。
この2つの実生活データセットに対するEMODMの適用により,アルゴリズムの有効性と精度が示された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:30:41 GMT)
Deep Copula-Based Survival Analysis for Dependent Censoring with Identifiability Guarantees [14.3] センシングは生存分析における中心的な問題であり、各サンプルに対して時間対イベント(例えば、死亡)または時間対センサー(英語版)が観察される。
そこで本研究では,依存検閲を同時に適用可能なフレキシブル・ディープ・ラーニング・ベース・サバイバル分析手法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:06:33 GMT)
Large Language Models for Cuffless Blood Pressure Measurement From Wearable Biosignals [14.2] 大規模言語モデル(LLM)を用いてウェアラブルバイオシグナーを分析し,カフレス血圧(BP)測定を行った。
本稿では,ウェアラブルバイオシグナーを用いたカフレスBP推定のためのLCMのキャパシティを初めて検討する。
提案手法を評価するために,1,272人のウェアラブルバイオシグナーの包括的公開データセットを用いて,10種類の高度なLCMの評価を行った。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:25:13 GMT)
Revitalizing Multivariate Time Series Forecasting: Learnable Decomposition with Inter-Series Dependencies and Intra-Series Variations Modeling [14.2] 動的傾向情報をより合理的に捉えるための学習可能な分解戦略を導入する。
また、シリーズ間の依存関係とシリーズ間のバリエーションを同時にキャプチャする2つのアテンションモジュールを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:04:25 GMT)
A Lightweight Video Anomaly Detection Model with Weak Supervision and Adaptive Instance Selection [14.1] 本稿では,弱教師付きビデオ異常検出に焦点をあてる。
我々は,軽量なビデオ異常検出モデルを開発した。
我々のモデルは、最先端の手法と比較して、AUCのスコアに匹敵するか、さらに優れていることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:50:10 GMT)
FuXi-S2S: A machine learning model that outperforms conventional global subseasonal forecast models [13.9] FuXi Subseasonal-to-Seasonal (FuXi-S2S)は、グローバルな日平均予測を最大42日間提供する機械学習モデルである。
ECMWF ERA5の再分析データから72年間の日次統計をトレーニングしたFuXi-S2Sは、ECMWFの最先端のサブシーズン・ツー・シーソンモデルを上回っている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:23:00 GMT)
FlowMur: A Stealthy and Practical Audio Backdoor Attack with Limited Knowledge [13.4] FlowMurはステルスで実用的なオーディオバックドア攻撃で、限られた知識で起動できる。
2つのデータセットで実施された実験は、FlowMurがデジタルと物理の両方で高い攻撃性能を達成することを示した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:47:54 GMT)
Better by Default: Strong Pre-Tuned MLPs and Boosted Trees on Tabular Data [13.4] 我々は,改良された多層パーセプトロン(MLP)であるRealMLPを導入し,GBDTとRealMLPのデフォルトパラメータを改善した。
ベンチマークの結果、RealMLPは他のニューラルネットよりも優れた時間精度のトレードオフを提供し、GBDTと競合することが示された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:29:30 GMT)
Graph Neural Networks as an Enabler of Terahertz-based Flow-guided Nanoscale Localization over Highly Erroneous Raw Data [13.2] 本稿では,フロー誘導型ローカライゼーションのための生データの解析モデルを提案する。
また,グラフニューラルネットワーク(GNN)をフロー誘導型ローカライゼーションパラダイムに統合する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:42:40 GMT)
Accelerating Communication in Deep Learning Recommendation Model Training with Dual-Level Adaptive Lossy Compression [12.1] DLRMは最先端のレコメンデーションシステムモデルであり、様々な業界アプリケーションで広く採用されている。
このプロセスの重大なボトルネックは、すべてのデバイスから埋め込みデータを集めるのに必要な全通信に時間を要することだ。
本稿では,通信データサイズを削減し,DLRMトレーニングを高速化するために,エラーバウンドの損失圧縮を利用する手法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:55:18 GMT)
Leveraging Graph Structures to Detect Hallucinations in Large Language Models [11.6] 本稿では,潜在空間の構造から幻覚を検出する手法を提案する。
埋め込み空間に近くにある世代を接続するグラフ構造を作成します。
近隣ノードからの情報を集約するためにメッセージパッシングを利用するグラフアテンションネットワークを採用している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:08:58 GMT)
EasyAnimate: A High-Performance Long Video Generation Method based on Transformer Architecture [11.6] EasyAnimateは、高性能な結果を得るためにトランスフォーマーアーキテクチャのパワーを利用する、ビデオ生成の先進的な方法である。
動作モジュールブロックを組み込んで,3次元映像生成の複雑さに対応するために,当初2次元画像合成用に設計されたDiTフレームワークを拡張した。
我々は、データ前処理、VAEトレーニング、DiTモデルトレーニング、エンドツーエンドのビデオ推論といった側面を含む、DiTに基づくビデオ制作のための総合的なエコシステムを提供する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:01:07 GMT)
Crafting Large Language Models for Enhanced Interpretability [11.5] Concept Bottleneck Large Language Model (CB-LLM)は、本質的に解釈可能なLarge Language Model(LLM)を作成するための先駆的なアプローチである。
CB-LLMは、その解釈可能性、スケーラビリティ、明確で正確な説明を提供する能力を備えた新しい標準を定めている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:22:44 GMT)
Deep-Learning-Based Channel Estimation for Distributed MIMO with 1-bit Radio-Over-Fiber Fronthaul [11.4] 分散マルチインプット・マルチアウトプット(MIMO)アーキテクチャにおけるパイロット支援・アップリンクチャネル推定の問題点を考察する。
我々は最近Nguyenらによって提案されたディープラーニングに基づくチャネル推定アルゴリズムを適用した。
提案手法は,Bussgang線形最小二乗誤差チャネル推定器よりも有意に優れていることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:51:16 GMT)
Which Neurons Matter in IR? Applying Integrated Gradients-based Methods to Understand Cross-Encoders [11.2] 本稿では、個々のニューロンの役割を特定するために、情報検索コンテキストにおいて、統合的グラディエントに基づく手法を適用する可能性について検討する。
我々は、私たちが「関連性」ニューロンと呼ぶものの役割と、それらが目に見えないデータを扱う方法についての新しい洞察を提供する。
論文参考訳(メタデータ) (Fri, 05 Jul 2024 15:48:55 GMT)
Elevating All Zero-Shot Sketch-Based Image Retrieval Through Multimodal Prompt Learning [11.0] 凍結したCLIPバックボーンで動作するための新しいマルチモーダル・プロンプト学習手法を開発した。
埋め込み空間をさらに洗練するための2つの革新的な戦略を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:30:42 GMT)
Performance Analysis of Speech Encoders for Low-Resource SLU and ASR in Tunisian Dialect [11.0] 自己教師付き学習(SSL)によって事前訓練された音声エンコーダは、様々な下流タスクにおいて顕著な性能を示した。
本稿では,低音源のチュニジア・アラビア方言の文脈におけるSSLアプローチの有効性を比較することで貢献する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:21:36 GMT)
Leveraging Data Mining, Active Learning, and Domain Adaptation in a Multi-Stage, Machine Learning-Driven Approach for the Efficient Discovery of Advanced Acidic Oxygen Evolution Electrocatalysts [10.8] 本研究では, 複雑な多金属触媒の発見と最適化を効率化する, 新たな多段階機械学習手法を提案する。
本手法は,材料発見プロセスを通じて,データマイニング,アクティブラーニング,ドメイン適応を統合している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 22:14:55 GMT)
An autoencoder for compressing angle-resolved photoemission spectroscopy data [10.5] 本稿では, ARPESデータセットを効率よく要約し圧縮する汎用オートエンコーダネットワークである ARPESNet を紹介する。
我々は、標準的な3次元ARPESデータセットを$mathbfk$でランダムな方向に沿って切断して抽出した2次元ARPESデータの大規模で多様なデータセットに基づいてARPESNetを訓練する。
ARPESNetのデータ表現能力をテストするために、ARPESNetで圧縮されたデータと離散コサイン変換で圧縮されたデータと、異なるノイズレベルで生データを比較した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:41:49 GMT)
Research, Applications and Prospects of Event-Based Pedestrian Detection: A Survey [10.5] 生物学的網膜にインスパイアされたイベントベースのカメラは、最小限の電力要求、無視できるレイテンシ、時間分解能、拡張可能なダイナミックレンジによって区別される最先端のセンサーへと進化してきた。
イベントベースのカメラは、高速撮像のシナリオにおいて、外部データ伝送を誘発し、動きのぼやけをなくすことによって制限に対処する。
本稿では,特に自律運転における研究と応用について概観する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:17:00 GMT)
Game Elements to Engage Students Learning the Open Source Software Contribution Process [10.5] 本研究では,ゲーミフィケーション要素に対する学生の認識を調査し,ゲーミフィケーション学習環境の設計について報告する。
その結果、Quest、Point、Stats、Badgeが好まれる要素であり、競合や圧力関連の要素があまり好まれないことが判明した。
これらの結果は、OSSコントリビューションプロセスに焦点を当てた効果的なゲーミフィケーション学習環境の設計において、ツールビルダーを導くことができる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:32:42 GMT)
Multi-Modal Video Dialog State Tracking in the Wild [10.5] MST-MIXERは、汎用的なマルチモーダル状態追跡スキーム上で動作する新しいビデオダイアログモデルである。
新たなマルチモーダルグラフ構造学習法を用いて,各入力モードの選択した構成成分の不足する基盤構造を予測する。
5つの挑戦的なベンチマークで、最先端の新たな結果を達成する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:55:00 GMT)
OpenDebateEvidence: A Massive-Scale Argument Mining and Summarization Dataset [10.4] OpenDebateEvidenceは、American Debate Competitiveコミュニティから派生した、議論のマイニングと要約のための包括的なデータセットである。
このデータセットには、350万以上のドキュメントと豊富なメタデータが含まれており、議論を巻き起こした最も広範な証拠の1つである。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:51:15 GMT)
LayerShuffle: Enhancing Robustness in Vision Transformers by Randomizing Layer Execution Order [10.4] 視覚変換器はテスト時に任意の層の実行順序に適応可能であることを示す。
また、トレーニングされたモデル同士をランダムにマージすることで、機能的な「フランケンシュタイン」モデルが得られることもわかりました。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:54:15 GMT)
ZARRIO @ Ego4D Short Term Object Interaction Anticipation Challenge: Leveraging Affordances and Attention-based models for STA [10.1] STA(Short-Term Object-Interaction Precipation)は、次のアクティブなオブジェクトの位置、対話の名詞と動詞のカテゴリ、および自我中心のビデオの観察から接触する時間を検出することで構成される。
STAformerは、フレーム誘導時間プーリング、デュアルイメージビデオアテンション、マルチスケール機能融合を統合し、画像入力ビデオペアからのSTA予測をサポートする新しいアテンションベースアーキテクチャである。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:16:30 GMT)
Written Term Detection Improves Spoken Term Detection [10.0] 本稿では、インデックスや検索を複雑にすることなく、未完成のテキストをE2E KWSに統合できるマルチタスク学習目標を提案する。
音声文書からテキストクエリを検索するためのE2E KWSモデルのトレーニングに加えて,マスクした文書からテキストクエリを検索するための共同トレーニングを行う。
提案手法は, 多様な言語を対象とした検索性能を大幅に向上させるとともに, KWS の未実装テキストを効果的に活用できることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:50:47 GMT)
GoSurf: Identifying Software Supply Chain Attack Vectors in Go [9.9] 本稿では,Go言語に適した12個の異なる攻撃ベクトルの分類法とそのパッケージライフサイクルを提案する。
私たちの研究は、Goエコシステム内のオープンソースのソフトウェアサプライチェーンを確保するための予備的な洞察を提供します。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:52:27 GMT)
Second Place Solution of WSDM2023 Toloka Visual Question Answering Challenge [9.9] We present our solution for the WSDM2023 Toloka Visual Question Answering Challenge。
マルチモーダル事前学習モデルの適用に触発されて,我々は3段階のソリューションを設計した。
我々のチームは最終予選で76.342点を獲得し、ランキング2位となった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:56:05 GMT)
Success or Failure? Analyzing Segmentation Refinement with Few-Shot Segmentation [9.9] 本稿では,FSSモデルを用いたセグメント化改良手法であるJSSを提案する。
JFSはSEPLの最良のケースと最悪のケースで評価され、その有効性を検証する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:04:25 GMT)
Planning with Logical Graph-based Language Model for Instruction Generation [9.7] 本稿では,論理を言語モデルに注入するグラフベースの言語モデルであるLogical-GLMを提案する。
言語モデルトレーニングのガイドとして論理スケルトンを生成し,言語モデルにドメイン知識を注入する。
我々のアプローチは、内部化されたドメイン知識により、より正確な論理で命令文を生成することができる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:24:03 GMT)
Agnostic Private Density Estimation via Stable List Decoding [9.6] 分布のクラスが安定なリストデオード可能であれば、非依存的な設定でプライベートに学習できることが示される。
筆者らのフレームワークの主用途として, 私的密度推定のサンプル複雑性に関する最初の上限を証明した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:00:22 GMT)
Accelerated Algorithms for Constrained Nonconvex-Nonconcave Min-Max Optimization and Comonotone Inclusion [9.6] 非コンケーブなmin-max最適化問題の構造化クラスであるコモノトンmin-max最適化について検討する。
最初のコントリビューションでは、extra Anchored Gradient (EAG)アルゴリズムを制約付きコモノトン min-max 最適化に拡張する。
第2のコントリビューションでは、FEG(Fast Extra Gradient)アルゴリズムを制約のないmin-max最適化に拡張する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:11:50 GMT)
Continuous Predictive Modeling of Clinical Notes and ICD Codes in Patient Health Records [9.4] 本研究は, 患者全員の滞在時間におけるICDコード予測の可能性について検討した。
早期に診断と治療を予測する手法の開発は、予測医学の機会を開く可能性がある。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:14:48 GMT)
Explorative Imitation Learning: A Path Signature Approach for Continuous Environments [9.4] CILO(Continuous Imitation Learning from Observation)は、模倣学習を2つの重要な特徴で強化する新しい方法である。
CILO探索は、より多様な状態遷移を可能にし、専門家のトラジェクトリを少なくし、トレーニングのイテレーションを少なくする。
すべての環境において、すべての模倣学習手法の全体的なパフォーマンスが最も優れており、2つの環境において専門家よりも優れています。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:25:39 GMT)
Understanding the Role of Invariance in Transfer Learning [9.2] トランスファーラーニングは、異なるタスク間で知識を共有するための強力なテクニックである。
近年の研究では、逆入力摂動のような特定の不変性を持つモデルの表現が、下流タスクにおいてより高い性能を達成することが判明している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:53:52 GMT)
A Review of Symbolic, Subsymbolic and Hybrid Methods for Sequential Decision Making [9.2] 本稿では、逐次決定過程(SDP)を解くためのAP、RLおよびハイブリッド手法について概説する。
知識表現(シンボリック、サブシンボリック、または組み合わせ)に焦点を当てている。
ニューロシンボリックAIは、APとRLをハイブリッドな知識表現と組み合わせることで、SDMに有望なアプローチをもたらすと結論付けている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:10:02 GMT)
Lost in Translation: The Algorithmic Gap Between LMs and the Brain [8.8] 言語モデル(LM)は、様々な言語課題において印象的な性能を達成しているが、脳内の人間の言語処理との関係は未だ不明である。
本稿では、異なるレベルの分析において、LMと脳のギャップと重複について検討する。
神経科学からの洞察(空間性、モジュール性、内部状態、インタラクティブ学習など)が、より生物学的に妥当な言語モデルの開発にどのように役立つかについて議論する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:43:16 GMT)
Pathfinder: Exploring Path Diversity for Assessing Internet Censorship Inconsistency [8.6] 我々は、国内における多様な検閲の展開を精査し、異なる観点からインターネット検閲を調査した。
国内における異なる経路経路によって引き起こされるインターネット検閲の多様性が顕著であることを明らかにする。
我々は、異なるホスティングプラットフォームが、ある国のISPと異なるピアリング関係により、一貫性のない検閲活動をもたらすことも確認した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:48:31 GMT)
How to Stay Curious while Avoiding Noisy TVs using Aleatoric Uncertainty Estimation [8.6] 少ない報奨のある環境を探索するためのアレータリックマッピングエージェント(AMA)を提案する。
AMAは、これらのダイナミクスがエージェントの作用によって引き起こされるかどうかにかかわらず、環境のどのダイナミクスが予測不可能であるかを明確に確認する。
AMAは、従来の好奇心誘導剤を固定する行動依存トラップを効果的に回避できることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:51:54 GMT)
Fine-grained Context and Multi-modal Alignment for Freehand 3D Ultrasound Reconstruction [8.6] 状態空間モデル(SSM)の長距離依存性管理機能を利用する新しい手法を提案する。
まず,マルチ時間SSMによるマルチスケール空間情報のマイニングを行うReMambaを提案する。
次に,複数の慣性計測単位を時間的補助情報として導入する適応型融合戦略を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:09:30 GMT)
Embracing Massive Medical Data [8.5] 大規模医療データからAIを訓練するオンライン学習手法を提案する。
提案手法は,データの特異性と予測の不確実性に基づいて,現在のAIモデルの最も重要なサンプルを同定する。
一般的なトレーニングパラダイムと比較して,本手法は連続的なデータストリームのトレーニングを可能にすることにより,データ効率を向上させるだけでなく,破滅的な忘れを緩和する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:50:30 GMT)
How Similar Are Elected Politicians and Their Constituents? Quantitative Evidence From Online Social Networks [8.4] 選出された政治家とその構成員のオンライン談話を比較する。
政治家は、選挙区が右派または左派の政治家を選出するかどうかにかかわらず、内容やスタイルの観点からも、その構成員と等しく似ている傾向にある。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:45:19 GMT)
Graph Neural Networks for Text Classification: A Survey [8.4] グラフニューラルネットワークベースのモデルは、複雑な構造化テキストデータに対処し、グローバル情報を利用することができる。
コーパスレベルと文書レベルのグラフニューラルネットワークを含む、メソッドのカバレッジを2023年までに提供します。
技術調査に加えて,グラフニューラルネットワークを用いたテキスト分類における課題と今後の方向性についても検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:06:26 GMT)
When Representations Align: Universality in Representation Learning Dynamics [8.2] 我々は、入力から隠れ表現への符号化マップと、表現から出力への復号マップが任意の滑らかな関数であるという仮定の下で、表現学習の効果的な理論を導出する。
実験により,活性化関数とアーキテクチャの異なる深層ネットワークにおける表現学習力学の側面を効果的に記述することを示した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:42:01 GMT)
RPN: Reconciled Polynomial Network Towards Unifying PGMs, Kernel SVMs, MLP and KAN [8.2] 深層関数学習のためのReconciled Polynomial Network (RPN) という新しいディープモデルを導入する。
RPNは非常に一般的なアーキテクチャを持ち、様々な複雑さ、能力、完全性のレベルを持つモデルを構築するのに使用できる。
RPNは、異なるベースモデルをひとつの標準表現に統一するバックボーンとしても機能する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 19:00:18 GMT)
Probabilistic Rank and Reward: A Scalable Model for Slate Recommendation [7.8] Probabilistic Rank and Reward (PRR)は、パーソナライズされたスレートレコメンデーションのためのスケーラブルな確率モデルである。
得られた報酬を組み合わせることで,スレートが成功する確率を効率的に学習できることが示される。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:05:41 GMT)
Improved algorithms for learning quantum Hamiltonians, via flat polynomials [7.7] 任意の温度で成功できるギブス状態のコピーを量子ハミルトニアンに学習するための改良されたアルゴリズムを提供する。
具体的には,Bakshi,Liu,Moitra,Tang(BLMT24)の作業の複雑さを低減し,サンプルの指数関数的依存性を改善する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:25:22 GMT)
Hybrid Primal Sketch: Combining Analogy, Qualitative Representations, and Computer Vision for Scene Understanding [7.7] われわれはMarrのPrimal Sketchにインスパイアされた新しいフレームワークを開発した。
Hybrid Primal Sketchは、コンピュータビジョンコンポーネントをアンサンブルに結合してスケッチのようなエンティティを生成する。
本稿では、我々の理論的枠組みを概説し、いくつかの実験を要約し、図理解に関する新たな実験の概要を述べる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:44:35 GMT)
Efficient GANs for Document Image Binarization Based on DWT and Normalization [7.6] GAN(Generative Adversarial Network)は、影やノイズを効果的に除去した画像を生成し、テキスト情報の抽出を可能にする。
本研究では、離散ウェーブレット変換と正規化を組み込んだ3段階ネットワークアーキテクチャに基づく効率的なGAN手法を提案する。
実験の結果,提案手法はSOTA法と比較してトレーニング時間を10%削減し,推論時間を26%短縮することがわかった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:19:32 GMT)
Silver Linings in the Shadows: Harnessing Membership Inference for Machine Unlearning [7.6] ニューラルネットワークから特定のデータサンプルの影響を除去する新しい学習機構を提案する。
この目的を達成するために、我々は、ターゲットモデルの重みやアクティベーション値からプライバシーに敏感な情報を排除するための、新しい損失関数を構築した。
本研究の結果は,未学習の有効性とレイテンシ,および主課題の忠実度の観点から,我々のアプローチの優れた性能を示すものである。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:01:16 GMT)
PDiscoFormer: Relaxing Part Discovery Constraints with Vision Transformers [7.5] 自己教師型DINOv2 ViTのような事前学習型トランスフォーマーベース視覚モデルにより制約緩和が可能となることを示す。
特に、任意の大きさの複数の接続されたコンポーネントを利用できる全変動(TV)が、以前の作業よりも大幅に優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:24:37 GMT)
A Defeasible Deontic Calculus for Resolving Norm Conflicts [7.5] 我々は、標準の矛盾を解決することを証明するためにデオン計算を使用する。
また、レッドハーリングとして共通の解決戦略を明らかにします。
そこで本論文は,標準衝突検出と分解の理論的に正当化された公理化に寄与する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:16:16 GMT)
Do Physicians Know How to Prompt? The Need for Automatic Prompt Optimization Help in Clinical Note Generation [7.4] 本稿では,医療専門家,非医療専門家,APO強化GPT3.5およびGPT4のアウトプットを比較し,初期プロンプトを洗練するための自動プロンプト最適化フレームワークを提案する。
その結果, GPT4 APO は, 臨床検査項目間での即時品質の標準化に優れていた。
Human-in-the-loopアプローチは、専門家が自身の修正を好みながら、APO以降のコンテンツ品質を維持することを示している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:14:11 GMT)
ASY-VRNet: Waterway Panoptic Driving Perception Model based on Asymmetric Fair Fusion of Vision and 4D mmWave Radar [7.3] 非対称フェアフュージョン(AFF)モジュールは、視覚とレーダーの両方から独立した特徴と効率的に相互作用するように設計されている。
ASY-VRNetモデルは不規則な超画素点集合に基づいて画像とレーダの特徴を処理する。
他の軽量モデルと比較して、ASY-VRNetはオブジェクト検出、セマンティックセグメンテーション、乾燥可能な領域セグメンテーションにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:37:27 GMT)
Exploration of Class Center for Fine-Grained Visual Classification [7.1] きめ細かい視覚分類は、クラス内差と微妙なクラス間差のために難しい課題である。
本稿では,複数のクラス中心制約とクラス中心ラベル生成からなるクラス中心探索という損失関数を提案する。
本手法は,損失関数として既存の細粒度視覚分類手法と容易に統合でき,トレーニングコストをわずかに抑えることで,さらに優れた性能を向上することができる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:11:09 GMT)
Non-Cooperative Backdoor Attacks in Federated Learning: A New Threat Landscape [7.0] プライバシ保護モデルトレーニングのためのフェデレートラーニング(FL)は、バックドア攻撃の影響を受けやすいままである。
本研究は,発展途上のFL景観におけるバックドア攻撃に対する堅牢な防御の必要性を強調した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 22:03:13 GMT)
MARS: Paying more attention to visual attributes for text-based person search [6.4] 本稿ではMARS(Mae-Attribute-Relation-Sensitive)という新しいTBPSアーキテクチャを提案する。
ビジュアルレコンストラクションロスと属性ロスという2つの重要なコンポーネントを導入することで、現在の最先端モデルを強化する。
CUHK-PEDES、ICFG-PEDES、RSTPReidの3つの一般的なデータセットの実験では、パフォーマンス改善が報告されている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:44:43 GMT)
Understanding and Mitigating Tokenization Bias in Language Models [6.4] State-of-the-art言語モデルは自己回帰型であり、トークンとして知られるサブワード単位で動作する。
一般的な符号化方式は、より多くのトレーニングやデータで緩和できないサンプリングバイアスを引き起こすことを示す。
トークン化データに基づいて訓練された任意の言語モデルからバイアスのない推定値を得るための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:49:08 GMT)
Research on target detection method of distracted driving behavior based on improved YOLOv8 [6.4] 本研究では,BOTNetモジュール,GAMアテンション機構,EIoU損失関数を統合することで,従来のYOLOv8モデルに基づく改良されたYOLOv8検出手法を提案する。
実験の結果, 精度は99.4%であり, 検出速度, 精度ともに良好であった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:17:48 GMT)
Low-Resource Crop Classification from Multi-Spectral Time Series Using Lossless Compressors [6.4] 深層学習は多スペクトル時間データを用いた作物分類の精度を大幅に向上させた。
ラベル付きサンプルが少ない低リソース環境では、深層学習モデルは不十分なデータのために性能が悪い。
本稿では,これらの状況に対処するために,ディープラーニングモデルに代わる非学習的代替案を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:23:58 GMT)
Entanglement distribution based on quantum walk in arbitrary quantum networks [6.4] 我々は、複数のコインまたは単一コインを用いた量子ウォークにより、高次元の絡み合った状態を生成するための一連のスキームを開発した。
また、上述の理論的枠組みに従って、任意の量子ネットワーク上での絡み合い分布スキームを提案する。
我々の研究は、より大規模で複雑な量子ネットワークを構築するためのビルディングブロックとして機能する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:26:41 GMT)
Smell and Emotion: Recognising emotions in smell-related artworks [6.0] 嗅覚関連アートワークから感情を認識することは技術的には実現可能であるが、改善の余地があることが示される。
パフォーマンスの小さな向上を実現し、将来の拡張のためのフィールドを開きます。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:40:39 GMT)
PROUD: PaRetO-gUided Diffusion Model for Multi-objective Generation [5.9] 本稿では,PaRetO-gUided Diffusion Model (PROUD)を導入する。
画像生成タスクとタンパク質生成タスクに対する評価は, ProUDが常に優れた生成品質を維持していることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:32:06 GMT)
Cavity QED in a High NA Resonator [5.8] 新しい数値開口型レンズベース共振器は、その基本的限界に近いラウンドトリップ当たりの単原子単光子吸収確率を推し進める。
この共振器は、光が10回しか循環しないキャビティにおいて強い光と物質を結合させる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:00:24 GMT)
A Unified Learn-to-Distort-Data Framework for Privacy-Utility Trade-off in Trustworthy Federated Learning [5.6] プライバシとユーティリティの均衡をナビゲートするための原則的アプローチを提供するTextitLearn-to-Distort-Dataフレームワークを提案する。
データ歪みに基づく様々なプライバシー保護機構への我々のフレームワークの適用性を実証する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:15:09 GMT)
Unsupervised Video Summarization via Reinforcement Learning and a Trained Evaluator [5.5] 本稿では,強化学習を用いた教師なし映像要約のための新しい手法を提案する。
それは、敵のジェネレータ-識別器アーキテクチャの不安定なトレーニングを含む、現在の教師なし手法の既存の制限に対処することを目的としている。
実験の結果, TVSum と SumMe のデータセットでそれぞれ62.3 と 54.5 のFスコアが得られた。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:08:06 GMT)
Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models [5.3] 個々の実体の観測値分布の非均一性は、最先端モデルにおける非常に偏りのある予測をもたらすことを示す。
我々は、Eccentricity-Area Under the Curve(EAUC)を、すべての研究されたモデルとデータセットで定量化できる新しい指標として紹介する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:19:36 GMT)
Drop it All or Pick it Up? How Developers Responded to the Log4JShell Vulnerability [5.2] われわれはLog4JShellの多種多様でおそらくその1つを探っている。
私たちの調査では、開発者は5日から6日間の迅速なレスポンスを示しています。
すべてを廃止する代わりに、驚くほど開発者の活動は、待ち望まれているすべての問題やPRに対して増加する傾向があります。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:33:10 GMT)
Generative Adversarial Networks for Spatio-Spectral Compression of Hyperspectral Images [5.1] ハイパースペクトル画像(HSI)の圧縮のためのディープラーニングモデル
圧縮HSIにおける3DSSC(HiFiC_3D$)を用いたHiFiCブロックとHiFiCブロック(HiFi_CSE$)の2つの新しいモデルを導入する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:03:27 GMT)
Computer Vision for Clinical Gait Analysis: A Gait Abnormality Video Dataset [5.0] 本稿では,歩行分析に適した視覚ベースの手法とデータセットとともに,CGAの現在の発展の基礎を定めている。
本稿では,現在150以上の歩行関連コンピュータビジョンデータセットのレビューに対して,映像データセットにおける歩行異常 (GAVD) について紹介する。
GAVDは、1874年の正常な、異常な、および病理的な歩行のシーケンスからなる、最大のビデオ歩行データセットとして際立っている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 00:18:40 GMT)
Generalists vs. Specialists: Evaluating Large Language Models for Urdu [4.9] 我々は, GPT-4-Turbo と Llama-3-8b-Instruct の汎用事前学習モデルと, 特定のタスクを微調整した特別目的モデルとの比較を行った。
我々は、これらのモデルの性能をウルドゥー語で評価するために、7つの分類と6つの世代タスクに焦点を当てる。
特殊目的モデルは、様々なタスクにおいて汎用モデルより一貫して優れていることが判明した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:09:40 GMT)
Proximal Point Method for Online Saddle Point Problem [4.8] 本稿では,2プレイヤの時間変動コンベックス・コンベレーブゲームの連続を含むオンラインサドル点問題に焦点を当てる。
環境の非定常性を考えると、アルゴリズム設計のパフォーマンス指標として双対性ギャップと動的ナッシュ均衡の後悔を採用する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:40:15 GMT)
Distributed Black-box Attack: Do Not Overestimate Black-box Attacks [4.8] ブラックボックスの敵攻撃は、モデル構造や重みへのアクセスを必要とせずに、画像分類器を誤分類する可能性がある。
最近の研究によると、攻撃の成功率は95%以上で、クエリは1000未満である。
本稿では,ローカルモデルではなく,クラウドAPIに直接ブラックボックス攻撃を適用する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:18:18 GMT)
MobileFlow: A Multimodal LLM For Mobile GUI Agent [4.8] 本稿では,モバイルGUIエージェント用のマルチモーダルな大規模言語モデルであるMobileFlowを紹介する。
MobileFlowは約21億のパラメータを含み、新しいハイブリッドビジュアルエンコーダを備えている。
画像データを完全に解釈し、GUIインタラクションタスクのユーザ命令を理解する能力がある。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:37:10 GMT)
Evaluating Language Models for Generating and Judging Programming Feedback [4.7] 大規模言語モデル(LLM)は、幅広い分野の研究と実践を変革してきた。
我々は,オープンソースのLCMのプログラミング課題に対する高品質なフィードバック生成における効率性を評価する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:44:11 GMT)
Generation of quantum phases of matter and finding maximum-weight independent set of unit-disk graphs using Rydberg atoms [4.6] 単位ディスクグラフの最大重み付き独立集合(MWIS)の問題を考える。
グラフのエッジは単位ディスク基準に従って描画することができる。
相互作用する原子の量子系を非線形準断熱プロファイルを用いて多体基底状態に駆動することを検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:05:25 GMT)
Data-Driven Tissue- and Subject-Specific Elastic Regularization for Medical Image Registration [4.6] 弾性正則化器の組織依存弾性パラメータを学習するための新しいデータ駆動手法を提案する。
本手法は,3種類の3Dおよび3D肺CTおよび心MRデータセットを用いて検討した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:50:55 GMT)
Brain Age Estimation with a Greedy Dual-Stream Model for Limited Datasets [4.5] 脳年齢の推定には、脳画像から個人の生物学的年齢を予測することが含まれる。
医療画像分析のために大規模なデータセットを実行することは、困難で時間を要する作業である。
本稿では,脳年齢推定のための新しいスライス方式であるGDSMを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:44:57 GMT)
Unified continuous-time q-learning for mean-field game and mean-field control problems [4.4] 分離型(非結合型Iq-関数)で統合されたq-関数を導入し、値関数とともにそのマーチンゲール特性を確立する。
我々は,平均場ゲーム(MFG)と平均場制御(MFC)の両問題に対して,一貫したQ-ラーニングアルゴリズムを考案した。
ジャンプ拡散設定におけるいくつかの例では、LQ フレームワーク内外において、分離した Iq-函数と値関数の正確なパラメータ化が得られる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:06:59 GMT)
TokenVerse: Unifying Speech and NLP Tasks via Transducer-based ASR [4.4] TokenVerseは、複数のタスクを処理するように設計された単一のTransducerベースのモデルである。
ASRモデルトレーニング中にタスク固有のトークンを参照テキストに統合することで実現される。
実験の結果,提案手法は相対的なWERにおいて最大7.7%向上することがわかった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:54:38 GMT)
Every Pixel Has its Moments: Ultra-High-Resolution Unpaired Image-to-Image Translation via Dense Normalization [4.3] 画素レベルの統計モーメントを推定するために設計されたDense Normalization層を導入する。
このアプローチは、局所色と色調のコントラストを同時に保存しながら、ティリングアーティファクトを効果的に減少させる。
我々の研究は、未ペア画像から画像への翻訳の範囲内で任意の解像度の画像を扱うための将来の探索の道を開く。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:14:50 GMT)
Learning to Generate All Feasible Actions [4.3] アクションマッピングは、学習プロセスを2つのステップに分割する新しいアプローチである。
本稿では、実現可能性モデルの自己教師型クエリにより、実現可能なすべてのアクションを生成することを学ぶことで、実現可能性部分に焦点を当てる。
エージェントが接続不能な実行可能なアクションセット間でアクションを生成する能力を示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:57:34 GMT)
MT-HCCAR: Multi-Task Deep Learning with Hierarchical Classification and Attention-based Regression for Cloud Property Retrieval [4.2] 本稿では,マルチタスク学習を用いたエンドツーエンドディープラーニングモデルMT-HCCARを紹介し,クラウドマスキング,クラウドフェーズ検索,COT予測について述べる。
MT-HCCARは階層型分類ネットワーク(HC)と分類支援型注意ベース回帰ネットワーク(CAR)を統合し、クラウドラベリングとCOT予測の精度と堅牢性を高める。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:32:01 GMT)
Unraveling Radiomics Complexity: Strategies for Optimal Simplicity in Predictive Modeling [4.1] 放射線的特徴セットの高次元性、放射線的特徴タイプの変動性、そして潜在的に高い計算要求は、全て、与えられた臨床問題に対する最小の予測的特徴セットを特定する効果的な方法の必要性を浮き彫りにしている。
我々は,最小限の放射線学的特徴を識別し,説明するための方法論とツールを開発する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 23:14:46 GMT)
FakET: Simulating Cryo-Electron Tomograms with Neural Style Transfer [4.1] 低温透過電子顕微鏡のフォワード演算子をシミュレートできるFakETを導入する。
高品質なシミュレートされたマイクログラフや傾きシリーズを生成する基準データに従って、合成トレーニングデータセットを適応するために使用できる。
特筆すべきは、我々の技術は性能にマッチし、データ生成速度を750倍にし、メモリを33倍削減し、典型的な透過型電子顕微鏡検出器サイズによくスケールすることです。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:43:02 GMT)
Segmenting Medical Images: From UNet to Res-UNet and nnUNet [4.1] 本研究では、UNet、Res-UNet、Attention Res-UNet、nnUNetを含むディープラーニングモデルの比較分析を行う。
この分析は、その臨床応用性を評価するために、精度、精度、リコール、Dice similarity Coefficient(DSC)、Intersection over Union(IoU)に焦点を当てている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:46:39 GMT)
From Representational Harms to Quality-of-Service Harms: A Case Study on Llama 2 Safety Safeguards [4.1] 我々は、既に緩和されたバイアスのモデルを評価することにより、安全対策の有効性を検討する。
非有毒なプロンプトのセットを作成し、それをLlamaモデルの評価に用いる。
安全と健康のトレードオフは、サービス品質の害につながる可能性のある特定の人口集団にとってより顕著である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:40:13 GMT)
Resource-Efficient Speech Quality Prediction through Quantization Aware Training and Binary Activation Maps [4.0] DNSMOSに基づく畳み込みアーキテクチャにおける音声品質予測のためのバイナリアクティベーションマップ(BAM)について検討する。
本稿では,量子化を意識した2値アクティベーションモデルとベースラインモデルの予測性能が一致することを示す。
提案手法は,ほぼすべてのドット積を和で置き換えつつ,推論中に25倍のメモリ削減を実現する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:15:00 GMT)
Adaptive proximal gradient methods are universal without approximation [4.0] 凸問題に対する適応的近位勾配法は従来のリプシッツ的仮定に限らないことを示す。
解析の結果,直線探索を含まない手法のクラスは,ただの局所H'older勾配連続性の下でまだ収束していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:03:40 GMT)
Black Box Differential Privacy Auditing Using Total Variation Distance [3.8] 本稿では,機械学習モデルにおける差分プライバシ保証を,小さなホールドアウトデータセットを用いて評価する実践的手法を提案する。
本手法は,トレーニングデータのサブセットとホールドアウトデータセットを用いて得られたスコア間の総変動(TV)距離を推定する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:38:38 GMT)
Learning Geometric Invariant Features for Classification of Vector Polygons with Graph Message-passing Neural Network [3.8] 本稿では,ポリゴンの形状分類のための幾何学的不変特徴を学習するために,新しいグラフメッセージパッシングニューラルネットワーク(PolyMP)を提案する。
提案したグラフベースPolyMPネットワークは,ポリゴンの幾何変換に不変な表現幾何学的特徴の学習を可能にする。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:19:36 GMT)
Multi-Branch Auxiliary Fusion YOLO with Re-parameterization Heterogeneous Convolutional for accurate object detection [3.8] 本稿では,MAF-YOLOという新しいモデルを提案する。
Multi-Branch Auxiliary FPN (MAFPN) という名前の汎用ネックを持つ新しいオブジェクト検出フレームワークである。
例えばMAF-YOLOのナノバージョンを使用すれば、3.76Mの学習可能なパラメータと10.51GのFLOPでCOCO上の42.4%のAPを達成でき、YOLOv8nを約5.1%上回る。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:35:30 GMT)
LMSeg: A deep graph message-passing network for efficient and accurate semantic segmentation of large-scale 3D landscape meshes [3.5] 本稿では,大規模3次元ランドスケープメッシュ上でのセマンティックセマンティックセグメンテーションを効率的かつ正確に行うために,エンドツーエンドのディープグラフメッセージパッシングネットワークであるLMSegを提案する。
偏心グラフの階層的および局所的なプーリングは、効果的な幾何集約モジュールとともに、小さく不規則なメッシュオブジェクトの高速な推論と正確なセグメンテーションを可能にする。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:55:06 GMT)
Planetary Causal Inference: Implications for the Geography of Poverty [3.4] まず,衛星画像とEOデータを用いた因果解析への関心の高まりについて述べる。
次に、空間統計学と機械学習手法の関係を辿り、因果機械学習パイプラインでEOデータが使われている4つの方法について議論する。
今後、研究者がEOデータを因果ML分析に組み込むためのステップバイステップのワークフローを提供する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:37:15 GMT)
Revealing the Utilized Rank of Subspaces of Learning in Neural Networks [3.4] ニューラルネットワークの学習重量が、利用可能な空間をどのように活用するかを研究する。
ほとんどの学習された重みはフルランクのように見えるため、低ランクの分解には耐えられない。
データと重みが相互作用する部分空間に重みを投影する単純なデータ駆動変換を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:14:39 GMT)
3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition [3.4] 3D Adaptive Structure Convolution Network (3D-ASCN)は、3Dポイントクラウド認識のための最先端フレームワークである。
3次元畳み込みカーネル、構造木構造、および効果的な幾何学的特徴抽出のための適応近傍サンプリングを組み合わせる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 19:38:10 GMT)
Evaluating Quality of Answers for Retrieval-Augmented Generation: A Strong LLM Is All You Need [3.4] 本稿では,vRAG-Evalを用いた検索・拡張生成(RAG)アプリケーションにおける回答品質評価の総合的研究について述べる。
品質面の階調をバイナリスコアにマッピングし、受け入れまたは拒否の決定を示す。
このアプローチは、明確な意思決定の意見が不可欠である現実的なビジネス設定に適合します。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:46:33 GMT)
Predicting the duration of traffic incidents for Sydney greater metropolitan area using machine learning methods [3.3] 本研究は,交通事故の期間を予測し,短期・長期に分類するための包括的アプローチを提案する。
我々は、Gradient Boosted Decision Trees (GBDT)、Random Forest、LightGBM、XGBoostなどの先進的な機械学習モデルをトレーニングし、評価する。
XGBoostとLightGBMは従来のモデルよりも優れており、XGBoostはインシデント期間を予測するための最低RMSEが33.7で、最高分類F1スコアが30分間の閾値で0.62である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:03:45 GMT)
Health Misinformation Detection in Web Content via Web2Vec: A Structural-, Content-based, and Context-aware Approach based on Web2Vec [3.3] 我々は、Webページの信頼性を評価するために、構造、コンテンツ、コンテキストベースの機能を研究するための研究の余地がまだあるWebページコンテンツに焦点を当てている。
本研究の目的は, フィッシングWebページ検出(Web2Vec)の文脈で最近提案されたWebページの埋め込み表現から始まる, 深層学習モデルに関連する機能の有効性を検討することである。
論文参考訳(メタデータ) (Fri, 05 Jul 2024 10:33:15 GMT)
SPINEX: Similarity-based Predictions with Explainable Neighbors Exploration for Anomaly and Outlier Detection [3.2] 本稿ではSPINEXファミリーの異常・異常検出アルゴリズムを提案する。
複数の部分空間にまたがる類似性や高次相互作用の概念を活用して、外接点を同定する。
SPINEXの性能を評価するための総合的な実験を行った。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:42:09 GMT)
SAM Fewshot Finetuning for Anatomical Segmentation in Medical Images [3.2] 医用画像の解剖学的セグメンテーションタスクにSAM(Seegment Anything)を適用するための戦略を提案する。
画像埋め込みで取得した解剖学的クエリーオブジェクトのプロンプトとして,ラベル付き画像の限られたセットから得られる少数ショット埋め込みを利用する。
本手法は,キャッシング機構を用いてマスクデコーダのみをトレーニングすることにより,微調整プロセスの効率化を優先する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:07:25 GMT)
SSP-GNN: Learning to Track via Bilevel Optimization [3.2] マルチオブジェクトトラッキング(MOT)のためのグラフベースのトラッキング形式を提案する。
本手法は,一組のフレーム上で定義された追跡グラフに対して,逐次最短経路 (SSP) アルゴリズムを適用した。
この追跡グラフのエッジコストは、グラフニューラルネットワーク(GNN)の変種であるメッセージパスネットワークを介して計算される。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:23:51 GMT)
TimeLDM: Latent Diffusion Model for Unconditional Time Series Generation [3.2] 高品質な時系列生成のための新しい遅延拡散モデルであるTimeLDMを提案する。
TimeLDMは、時系列を情報的でスムーズな潜在コンテンツにエンコードする変分オートエンコーダで構成されている。
シミュレーションおよび現実的なデータセットを用いた合成時系列生成機能の評価を行い、既存の最先端手法と比較して性能をベンチマークする。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 01:47:20 GMT)
Controlling Whisper: Universal Acoustic Adversarial Attacks to Control Speech Foundation Models [3.2] 音声可能な基礎モデルは、適切なプロンプトを用いて自動音声認識以外のタスクを実行することができる。
音声プロンプト付き大規模言語モデルの開発により、さらに大きな制御オプションが生まれる可能性がある。
この柔軟性により、システムはモデル制御の敵攻撃の影響を受けやすいことが実証された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:04:31 GMT)
Using Petri Nets as an Integrated Constraint Mechanism for Reinforcement Learning Tasks [3.1] アルゴリズムへの信頼の欠如は、現実世界のドメインで制御するために強化学習(RL)エージェントを使用する場合の課題である。
本稿では,典型的なRLアプローチに対して3つの利点を持つペトリネット(PN)を用いたアプローチを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:04:06 GMT)
BiosERC: Integrating Biography Speakers Supported by LLMs for ERC Tasks [3.0] 本研究は,会話における話者特性を調査するBiosERCという新しいフレームワークを紹介する。
本研究では,Large Language Models (LLMs) を用いて,会話中の話者の「生体情報」を抽出する。
提案手法は,3つの有名なベンチマークデータセットを用いて,最先端のSOTA(State-of-the-art)結果を得た。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 06:25:34 GMT)
Explainable Metric Learning for Deflating Data Bias [3.0] 本稿では,画像の階層的なセマンティックセマンティックセマンティクスを構築し,解釈性を向上させるための説明可能なメトリクス学習フレームワークを提案する。
提案手法により,2つの画像間のセマンティックセグメントに基づくより人間的に理解可能な類似度測定が可能となる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:07:27 GMT)
Enhancing Safety for Autonomous Agents in Partly Concealed Urban Traffic Environments Through Representation-Based Shielding [3.0] 本稿では,自律型エージェントが知覚できる情報を中心に,強化学習エージェント(RL)のための新しい状態表現を提案する。
我々の発見は、より堅牢で信頼性の高い自律ナビゲーション戦略の道を開いた。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:34:49 GMT)
When the Machine Chimes the Bell: Entanglement and Bell Inequalities with Boosted $t\bar{t}$ [2.9] 2量子ビットの系を表すトップクォーク対生成の量子相関について検討する。
2つの因果的に切断されたトップクォークの空間的な分離要件は、相対論的に互いに離れて飛行する必要がある。
絡み合いは、既存のデータで既に5sigma$以上のレベルで観測できる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:34:34 GMT)
Detecting LLM-Assisted Writing in Scientific Communication: Are We There Yet? [2.9] 大規模言語モデル(LLM)は、特に筆記支援の領域において、テキスト生成を著しく変えた。
LLM支援文字の正確な認識を促進するための潜在的な手段は、自動検出器の使用である。
近縁なLCM生成テキスト検出器を4つ評価した結果, 簡易なアドホック検出器と比較して, その最適性能が示された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:19:36 GMT)
Fair Federated Data Clustering through Personalization: Bridging the Gap between Diverse Data Distributions [2.8] フェデレーションクラスタリングにおけるパーソナライズの概念を導入し、より低いクラスタリングコストとクライアント間の均一なコストのバランスを達成することを目的とする。
サーバとクライアント間の1ラウンドの通信でこれらの目標に対処するp-FClusを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:10:26 GMT)
UpStory: the Uppsala Storytelling dataset [2.8] UpStoryは、小学生間の自然主義的なダイアド相互作用のデータセットである。
データセットには35対のデータが含まれており、合計で3時間40mのオーディオとビデオが記録される。
データセットの匿名化バージョンが公開されており、フレーム単位のヘッドポーズ、ボディポーズ、顔の特徴が含まれている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:46:16 GMT)
Autoverse: An Evolvable Game Langugage for Learning Robust Embodied Agents [2.6] シングルプレイヤ2Dグリッドベースのゲームのための,進化可能なドメイン固有言語であるAutoverseを紹介する。
オープンエンデッドラーニング(OEL)アルゴリズムのスケーラブルなトレーニンググラウンドとしての利用を実証する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 02:18:02 GMT)
Exploiting the equivalence between quantum neural networks and perceptrons [2.6] パラメタライズド量子回路に基づく量子機械学習モデルは、量子デバイスへの応用において最も有望な候補であると考えられている。
我々はQNNの表現率と帰納バイアスを$x$から$xotimes x$に作用する古典的パーセプトロンへの入力を含むQNNからの正確なマッピングを利用して検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:19:58 GMT)
Looking into Black Box Code Language Models [2.5] 私たちは、最先端の2つのコードLM、Codegen-MonoとPloycoderを使用し、Java、Go、Pythonの3つの広く使われているプログラミング言語を使用します。
CodeLMの性能を損なうことなく、フィードフォワード層内で興味ある概念を編集できることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:13:41 GMT)
Engression: Extrapolation through the Lens of Distributional Regression [2.5] 我々は、エングレースと呼ばれるニューラルネットワークに基づく分布回帰手法を提案する。
エングレスモデル(engression model)は、適合した条件分布からサンプリングできるという意味で生成され、高次元結果にも適している。
一方、最小二乗法や量子回帰法のような従来の回帰手法は、同じ仮定の下では不十分である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:06:23 GMT)
Towards Context-aware Support for Color Vision Deficiency: An Approach Integrating LLM and AR [2.5] 色覚障害を持つ人は、しばしば赤や緑のような色を区別する際の課題に直面します。
現在のサポートツールは、主にiPhoneのアクセシビリティ設定にある色覚モードなど、プレゼンテーションベースの支援に焦点を当てている。
本稿では,文脈支援と自律支援を提供するアプリケーションを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:03:52 GMT)
Error mitigation with stabilized noise in superconducting quantum processors [2.3] 我々は,量子ビット-TLS相互作用のチューニングが雑音不安定を低減し,より信頼性の高い誤り軽減性能を実現することを実験的に実証した。
ここで導入された機能は、非自明なスケールのソリッドステートプロセッサ上での量子アプリケーションの探索に不可欠であると期待する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 04:53:53 GMT)
Mapping Cardinality-based Feature Models to Weighted Automata over Featured Multiset Semirings (Extended Version) [2.3] カーディナリティベースの機能モデルは、同じ機能の複数のコピーを選択することができる。
本稿では,基本性に基づく特徴モデルに対する行動変数モデリングの形式化を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:40:25 GMT)
Neural varifolds: an aggregate representation for quantifying the geometry of point clouds [2.2] 本稿では,新しい表面形状特徴化,すなわち点雲のニューラルバリアフォールド表現を提案する。
変数表現は、多様体に基づく判別を通じて点雲の表面幾何学を定量化する。
提案したニューラルバリアフォールドは, 形状マッチング, 少数ショット形状分類, 形状再構成の3つの異なるタスクで評価される。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:08:16 GMT)
Batch Transformer: Look for Attention in Batch [2.2] 上記の提案と組み合わせたバッチトランスネットワーク(BTN)を提案する。
さまざまなFERベンチマークデータセットの実験結果から,提案したBTNはFERデータセットの最先端性よりも一貫して優れていた。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 02:13:47 GMT)
Aligning Model Evaluations with Human Preferences: Mitigating Token Count Bias in Language Model Assessments [2.1] 本稿では,大規模言語モデルと人的評価を協調させる手法について検討する。
我々はこのバイアスを定量化するためにベイズ統計とt検定を用い、GPTScorerを調整するための再校正手順を開発した。
以上の結果から,再校正したLCM評価器と,複数のユースケースにおけるヒト評価との整合性は有意に改善した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:26:40 GMT)
Interpretable Representation Learning of Cardiac MRI via Attribute Regularization [2.0] 臨床医が人工知能モデルの理解と信頼を確実にするためには、医療画像の解釈可能性が不可欠である。
本稿では,逆向きに訓練された変分オートエンコーダのフレームワーク内で,潜在空間の属性正規化を組み合わせた分散正規化ソフトイントロスペクティブ変分オートエンコーダを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:29:27 GMT)
SH17: A Dataset for Human Safety and Personal Protective Equipment Detection in Manufacturing Industry [2.0] 本研究では,多様な産業環境から収集した17クラスの75,994個のインスタンスを含む8,099個の注釈付き画像からなるSH17データセットを提案する。
ベンチマークのために最先端のODモデルをトレーニングし、最初の結果は、You Only Look Once (YOLO)v9-eモデル変種がPPE検出の70.9%を超える有望な精度を示した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:40:11 GMT)
Learn one size to infer all: Exploiting translational symmetries in delay-dynamical and spatio-temporal systems using scalable neural networks [2.0] 力学系における翻訳対称性に適応したニューラルネットワーク。
我々はこれらのネットワークをトレーニングし、単一のサイズで遅延と動的時空システムのダイナミクスを予測する。
ネットワークのサイズをスケールすることで、より大きく、より小さなシステムサイズで複雑なダイナミクスを予測できることを実証します。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 08:51:37 GMT)
Rethinking Image Compression on the Web with Generative AI [1.9] 本稿では、生成AIを用いて、エッジやクライアント側で画像の再構成を行う新しいアプローチについて検討する。
テキストプロンプトを活用し,Cannyエッジやカラーパレットなどの条件入力をテキスト・ツー・イメージモデルに付加するフレームワークを開発した。
本手法は従来の圧縮法よりも画像の意味と構造を効果的に保存する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:29:12 GMT)
Is plantar thermography a valid digital biomarker for characterising diabetic foot ulceration risk? [1.9] 糖尿病性足潰瘍 (DFU) に関する予報的データがない場合, 原因因子と断面積的関連性を用いて, DFUの危険層化に対する植物温熱画像の妥当性を確かめることができた。
内在型サーモグラフィークラスタとDFUリスクファクターの関連について,教師なしのディープラーニングフレームワークを用いて検討した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:39:03 GMT)
Should We Fine-Tune or RAG? Evaluating Different Techniques to Adapt LLMs for Dialogue [1.9] 本研究では,人間と機械の対話における応答生成作業におけるLarge Language Models (LLMs) の限界について検討する。
我々は,異なる対話型に適用する場合に,異なるLLM適応手法を広範囲に分析する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:47:31 GMT)
Second Maximum of a Gaussian Random Field and Exact (t-)Spacing test [1.8] リーマン部分多様体上のガウス確率場の第二極大の概念を導入する。
副次的なカクライス式を利用して,最大分布の明示的な形式を導出する。
このアプローチは、これらの最大値間の間隔の評価に基づいて、正確なテストを行う。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:59:57 GMT)
GOALPlace: Begin with the End in Mind [1.7] GOALPlaceは、細胞密度を制御することで、配置の混雑を改善するための新しい学習ベースのアプローチである。
提案手法は,EDAツールのポストルート最適化結果から効率よく学習し,実験的なベイズ手法を用いて,この目標/目標を特定のプレースラーの解に適用する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:16:25 GMT)
Emergent Continuous Time Crystal in Dissipative Quantum Spin System without Driving [1.6] 時間結晶は、自発対称性を時間次元に分割する非平衡現象であり、量子多体物理学において基本的な重要性を持っている。
スピンダイナミクスを解析することにより、新しい非定常振動状態の出現を数値的に同定する。
本研究は、散逸誘起スピン下降と異方性相互作用誘起スピン沈降またはスピン揺らぎとの複雑な相互作用に関する多くの知見を提供する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:52:48 GMT)
Robust double Bragg diffraction via detuning control [1.6] 二重ブラッグ回折(DBD)の新しい理論モデルと数値最適化を提案する。
いわゆる「準ブラッグ政権」におけるマグナス展開に基づく効果的な2レベルハミルトニアンを導出する。
我々は、偏極誤差とドップラー効果の両方に対して頑健性を示す人工知能支援の最適デチューニング制御プロトコルを開発した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:21:31 GMT)
Understanding the Landscape of Leveraging IoT for Sustainable Growth in Saudi Arabia [1.5] 農業におけるモノのインターネット(IoT)技術の統合は、特にサウジアラビア王国(KSA)における農業実践の変革を約束する。
本研究は,KSA農家におけるスマート農業の実践について考察した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:59:26 GMT)
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models [1.5] 深層強化学習(DRL)は、ビデオゲーム、ロボティクス、近年の大規模言語モデルなど、様々な領域で顕著な成功を収めている。
しかし、DRLモデルの計算コストとメモリ要求はリソース制約された環境への展開を制限することが多い。
本研究では,DRLモデルに対する量子化とプルーニングという2つの顕著な圧縮手法の影響について検討した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:21:17 GMT)
Late Breaking Results: Fortifying Neural Networks: Safeguarding Against Adversarial Attacks with Stochastic Computing [1.5] ニューラルネットワーク(NN)セキュリティでは、モデル整合性と敵攻撃に対するレジリエンスの保護が最重要になっている。
本研究では,NNモデルを構築するための新しいメカニズムとして,コンピューティング(SC)の適用について検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:49:32 GMT)
The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement [1.5] Google 2021 Natureの論文で、シリコンチップの物理的設計のための強化学習は、文書化されていない主張のために論争を巻き起こした。
Google RLは、(i)人間デザイナー、(ii)よく知られたアルゴリズム(Simulated Annealing)、(iii)一般的に利用可能な商用ソフトウェアを遅くして遅れていることを示す。
クロスチェックデータによると、Nature論文の完全性は、行動、分析、報告の誤りによって著しく損なわれている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:35:54 GMT)
Remember This Event That Year? Assessing Temporal Information and Reasoning in Large Language Models [1.5] 大規模言語モデル(LLM)はますます普及しているが、時間的情報を保持する能力と推論能力は依然として限られている。
本研究は,紀元前1万年から2100年の間,新しい数値時間データセットである textbfTempUN に関する12の最先端モデルを用いて実験を行った。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:26:51 GMT)
Utilizing classical programming principles in the Intel Quantum SDK: implementation of quantum lattice Boltzmann method [1.4] 本稿では,Intel Quantum SDKにおける量子格子ボルツマン法の実装における古典的プログラミング手法の利用について検討する。
この研究の新規性は、量子アルゴリズムの実装に古典的なテクニックを活用することである。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:30:25 GMT)
Graph Reinforcement Learning in Power Grids: A Survey [1.3] ディープラーニングのアプローチは、電力グリッドのユースケースにおける従来のメソッドの柔軟性の欠如を克服する。
GNNの応用は、電力グリッドに存在するグラフ構造化データから学ぶことができるため、特に有望である。
本稿では,電力グリッド固有のグラフ構造を抽出し,電力グリッドの異なるユースケースにおける表現学習と意思決定を改善するGRLの能力について論じる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:07:15 GMT)
The diameter of a stochastic matrix: A new measure for sensitivity analysis in Bayesian networks [1.3] 我々は、慣れ親しんだ全変動距離に基づくロバストネス法は、不特定性に対するロバストネスに、よりシンプルで価値のある境界をもたらすと論じる。
このような境界を導出するために、直径と呼ばれる条件付き確率表への依存の新たな尺度を導入する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:22:12 GMT)
Challenges for Real-Time Toxicity Detection in Online Games [1.2] 有害な行為や悪意のあるプレイヤーは経験を台無しにし、プレイヤーベースを減らし、ゲームやスタジオの成功を損なう可能性がある。
本稿では,テキスト,音声および画像処理問題,行動毒性の観点から,有害なコンテンツ検出に直面する課題について概説する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:38:58 GMT)
Mixed Noise and Posterior Estimation with Conditional DeepGEM [1.2] 逆問題における後部パラメータと雑音パラメータを同時推定する新しいアルゴリズムを開発した。
我々のモデルは,従来のアプローチとは異なり,多くの測定値から情報を組み込むことができることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:04:10 GMT)
From 'Showgirls' to 'Performers': Fine-tuning with Gender-inclusive Language for Bias Reduction in LLMs [1.1] 我々は、ジェンダー・インクリシティを促進するために、大規模言語モデル内の言語構造に適応する。
私たちの作品の焦点は英語の「In'show-Girl'」や「man-cave」のような男女排他的な接尾辞である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:31:30 GMT)
Teaching and Learning Ethnography for Software Engineering Contexts [1.1] この章では、ソフトウェア工学の大学院生にエスノグラフィーを教えるための教育と学習について紹介する。
本章の内容は、新生児からエスノグラフィーへの研究手法としての基本的な知識であると考えるものに焦点を当てている。
この章は、経験的ソフトウェアエンジニアリングのコースの一部をサポートするように設計されており、さらに読むためのポインタと文献を提供している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:43:02 GMT)
Advanced Smart City Monitoring: Real-Time Identification of Indian Citizen Attributes [1.1] このプロジェクトは、人々の属性をリアルタイムで識別し分析できる、インドの都市のためのスマート監視システムの構築に焦点を当てている。
人工知能や機械学習などの高度な技術を使って、システムは上半身の色、身に着けているもの、装着しているアクセサリー、ヘッドギアなどの属性を認識できる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:54:59 GMT)
Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0] 教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:44:53 GMT)
Towards Automated Functional Equation Proving: A Benchmark Dataset and A Domain-Specific In-Context Agent [1.0] ATP(Automated Theorem Proving)はその複雑さと計算上の要求のため、課題に直面している。
近年, 大規模言語モデル (LLM) を用いてATPの作用選択を行っているが, これらの手法は資源集約性が高い。
この研究は、リーン内のCOPRAインコンテキスト学習フレームワークを強化するエージェントであるFEASを紹介します。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:59:16 GMT)
EventChat: Implementation and user-centric evaluation of a large language model-driven conversational recommender system for exploring leisure events in an SME context [1.0] 大規模言語モデル(LLM)は、対話レコメンデーションシステム(CRS)の戦略的ポテンシャルにおいて大きな進化をもたらす。
しかし、研究は主に、エンドユーザー評価や企業への戦略的影響ではなく、LCM主導のCRSを実装するための技術フレームワークに焦点を当てている。
目的システムメトリクスと主観的ユーザ評価の両方を用いて,LCM駆動型CRSを中小企業環境で設計し,それに続く性能について詳述する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:42:31 GMT)
Remembering Everything Makes You Vulnerable: A Limelight on Machine Unlearning for Personalized Healthcare Sector [0.9] この論文は、特にECGモニタリングの文脈において、パーソナライズされた医療モデルの脆弱性に対処することを目的としている。
本稿では,機械学習モデルに対する露出データポイントの影響を軽減するために,"Machine Unlearning" というアプローチを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:38:36 GMT)
Turbulence Scaling from Deep Learning Diffusion Generative Models [0.8] 拡散モデルを用いて乱流渦分布の分布を学習する。
圧縮不能なNavier-Stokes方程式に対する乱流解のスナップショットを生成する。
学習したスケーリング指数はすべて、期待されるKolmogorovスケーリングと一致している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:28:33 GMT)
Introducing 'Inside' Out of Distribution [0.8] 本研究は、OODを内外ケースに分割できることを示すことによって、OODに関する新しい視点を紹介する。
分析の結果,OODの内面プロファイルの違いは,MLモデルの性能低下につながることがわかった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:22:13 GMT)
Blockchain-based PKI within a Corporate Organization: Advantages and Challenges [0.8] 本研究は,セキュリティやパフォーマンス,プラットフォームといった要因に基づいて,ブロックチェーンPKIのさまざまな実装について検討する。
その結果、ブロックチェーンベースのPKIは、トラストアンカーの分散化によって従来のPKIの制限を克服し、セキュリティを高めることが可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:24:10 GMT)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.7] ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:48:27 GMT)
Entropy Computing: A Paradigm for Optimization in an Open Quantum System [0.7] 量子貯水池を条件付けして動作する新しい計算パラダイムであるエントロピー計算を導入する。
提案したエントロピー・コンピューティング・パラダイムは、幅広いNPハード最適化問題に対処するためのスケーラブルで多用途なプラットフォームとして機能することができる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:54:04 GMT)
Improving Performance of Quantum Heat Engines using modified Otto cycle [0.7] サイクルのユニタリストロークの1つを、ある特定のハミルトニアンと共に一度までシステムを自由に進化させることによって修正する。
これにより、熱湯から吸収される熱の大きさを増大させ、エンジンの出力と効率を高めることができる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:15:17 GMT)
Challenges and Considerations in Annotating Legal Data: A Comprehensive Overview [0.6] 本稿では,法的なデータアノテーションプロジェクトに従事する研究者や専門家に対して,基礎的な理解とガイダンスを提供することを目的とする。
法律文書は、しばしば複雑な構造、脚注、参照、ユニークな用語を持っている。
作成した、微調整されたデータセットと言語モデルへのリンクを提供します。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:56:28 GMT)
Entity Decomposition with Filtering: A Zero-Shot Clinical Named Entity Recognition Framework [0.6] 臨床名付きエンティティ認識(NER)は、臨床物語の中の重要なエンティティを検索することを目的としている。
近年の研究では,大規模言語モデル (LLM) がこの課題において高い性能を達成できることが示されている。
本稿では,フィルタによるエンティティ分解という新しい枠組みにより,それらの改善を図っている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:38:23 GMT)
Action Research with Industrial Software Engineering -- An Educational Perspective [0.5] アクションリサーチは、産業環境でのソフトウェアエンジニアリング手法の有用性とユーザビリティを探求する機会を提供する。
ソフトウェア開発組織と異なる種類のインタラクションが必要です。
本章は、行動研究の学習と指導を支援することを目的としている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:05:06 GMT)
Experiences in Using the V-Model as a Framework for Applied Doctoral Research [0.5] 私たちは、ソフトウェア工学における応用研究の実践方法を教えるためのフレームワークとして、Vモデルを使用します。
カイザースラウテルン大学で行った20年近くにわたって、このフレームワークがどのようにインスタンス化されてきたかを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:53:58 GMT)
Parameter Efficient Fine-tuning of Self-supervised ViTs without Catastrophic Forgetting [0.5] 新しいタスクの事前訓練と微調整は、モデルの本来の汎用能力を著しく低下させる可能性がある。
この安定性-塑性ジレンマを克服することは、ViTsが継続的に学習し、新しいドメインに適応するために重要である。
実験の結果,自己学習型VTではブロック拡張あるいはLORAが,新しいドメインの完全な微調整型VTを上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:28:16 GMT)
Multi-strategy Based Quantum Cost Reduction of Quantum Boolean Circuits [0.5] 量子コンピュータの構築は、低コストの量子回路の合成に基づいている。
本稿では,正極性リード・ミューラーのPPRM$展開で表されるブール関数の量子回路を構築するための2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 19:25:46 GMT)
Path Analysis for Effective Fault Localization in Deep Neural Networks [0.5] ディープニューラルネットワーク(DNN)の信頼性は、その複雑さとデータ依存のため、いまだに深刻な懸念である。
本稿では,重要な神経経路を同定し,検証するためのNP-SBFL法を提案する。
NP-SBFL-MGA(NP-SBFL-MGA)の有効性を検討した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:36:59 GMT)
XQSV: A Structurally Variable Network to Imitate Human Play in Xiangqi [0.4] 我々はXiangqi Structurely Variable (XQSV)と呼ばれる革新的なディープラーニングアーキテクチャを導入する。
XQSVは、Xiangqi(中国チェス)における人間のプレイヤーの行動パターンをエミュレートするように設計されている。
予測精度は約40%に達し、その性能は訓練されたエロ範囲内でピークに達する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 17:43:05 GMT)
Efficient simulation of quantum chemistry problems in an enlarged basis set [0.4] 本稿では,量子化学問題の力学をシミュレートする量子アルゴリズムを提案する。
各トロッターステップに新しいキュービットを追加し、拡張されたシステムにおけるダイナミクスのよりシンプルな実装を可能にする。
アプローチの鍵となる要素は、拡張系における単純で対角的なハミルトニアンを元のハミルトニアンに写像する等距離である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:27:09 GMT)
The impact of data set similarity and diversity on transfer learning success in time series forecasting [0.3] 本研究では,ソースターゲットの類似性とソースの多様性が精度,バイアス,不確実性評価といった予測結果に与える影響について検討する。
トレーニング済みのニューラルネットワークを5つのオープンソースデータセットにわたって使用し、実世界の包括的データを含む5つのターゲットデータセットの予測に使用しています。
特徴に基づく類似度と多様性の2つの尺度を同定し、ソースターゲットの類似度が予測バイアスを減少させるのに対し、ソースの多様性は予測精度と不確実性の推定を改善するが、バイアスを増大させる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:34:41 GMT)
Function Smoothing Regularization for Precision Factorization Machine Annealing in Continuous Variable Optimization Problems [0.3] この研究は、実数が二変数の組合せで表されるような一般的な場合において、因子化機械(FM)によって得られるハミルトニアン函数曲面は非常にうるさい。
ノイズの発生源を同定し,その発生を防止するための簡易な一般化手法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:05:35 GMT)
Bounds to electron spin qubit variability for scalable CMOS architectures [0.3] 我々は、Si/SiO$$インタフェースの不可避な原子スケール粗さによるスピン量子ビットの変動をグラフ化し、12デバイスで実験をコンパイルし、理論ツールを開発する。
我々は, 粗さがクビット位置, 変形, 谷分割, 谷相, スピン軌道結合, 交換結合における変動性と相関することを示した。
これらの変数は、堅牢な制御方法が組み込まれている限り、量子コンピューティングのスケーラブルなアーキテクチャの許容範囲内にあることが判明した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:30:18 GMT)
Statistical investigations into the geometry and homology of random programs [0.2] 本稿では,チャットGPTから生成したランダムなPythonプログラム間の関係を幾何学的・トポロジ的に記述する方法について述べる。
本稿では,ChatGPT-4とTinyLlamaを画像処理に関する簡単な問題で比較する。
将来、我々のアプローチはプログラミング言語の構造に新たな洞察を与えるかもしれないと推測する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:25:02 GMT)
The relative entropy of coherence quantifies performance in Bayesian metrology [0.2] 我々は、コヒーレンス尺度が状態のアンサンブルにどのように適用できるかを示す。
次に,パラメータ推定において,コヒーレンスのアンサンブル相対エントロピーは得られた情報と最適なホレボ情報との差に等しいことを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 02:40:20 GMT)
Differentiating and Integrating ZX Diagrams with Applications to Quantum Machine Learning [0.1] 我々は、ZX-計算の枠組み内での微分と積分を実現することにより、ZXを解析的視点に高める。
本稿では,バレンプラトーの解析に量子機械学習を応用し,ZX計算の新しい解析フレームワークを具体的に解説する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:47:13 GMT)
Conformal duality of the nonlinear Schrödinger equation: Theory and applications to parameter estimation [0.1] 非線形シュリンガー方程式(NLSE)の統一理論について述べる。
局所一次元立方晶NLSEの定常解はすべて、クロス比と呼ばれる1つの数に分類することができる。
同じ交叉比を持つ任意の2つの解は、共形変換を用いて互いに変換することができる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:51:52 GMT)
p-Adic Quantum Mechanics, the Dirac Equation, and the violation of Einstein causality [0.0] 本稿では、量子力学におけるプランク長におけるローレンツ対称性の破れについて研究する。
位置変数として3次元の p-進ベクトルを用いるが、時間は実数のままである。
我々は、粒子や反粒子の存在を予測し、標準粒子のように電荷を充電する新しいp進ディラック方程式を導入する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:45:22 GMT)
Which algorithm to select in sports timetabling? [0.0] 最近の国際タイムタブリングコンペティションでは、一般的なアルゴリズムを開発できるが、各アルゴリズムの性能は問題インスタンスによって大きく異なることが示されている。
本稿では,8つの最先端アルゴリズムの長所と短所に関する強力な洞察を与える。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:51:29 GMT)
Vector Atom Accelerometry in an Optical Lattice [0.0] 印加慣性力の大きさと方向を計測できる2つの原子干渉計を実験的に実証した。
これらの干渉計は従来の原子センサーのユビキタス光パルスに依存しない。
デバイスの性能は、原子の干渉計サイズと量子検出効率の量子限界に近くなる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 21:52:28 GMT)
Using LLMs to label medical papers according to the CIViC evidence model [0.0] 医学NLP分野におけるシーケンス分類問題CIViCエビデンスについて紹介する。
CIViCエビデンスデータセット上でBERTとRoBERTaの事前学習チェックポイントを微調整する。
上記のBERTライクなモデルとOpenAIのGPT-4を数ショットで比較する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:30:01 GMT)
Unitary death of Schrödinger's cat [0.0] わずかにパリティが破れたモデルでは振動子の対称なシュリンガー・キャット状態が生成され、これは測定誘起波動関数の崩壊と同様の自発的なユニタリ過程で突然発生することを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:57:30 GMT)
Unique continuation for many-body Schrödinger operators and the Hohenberg-Kohn theorem. II. The Pauli Hamiltonian [0.0] 外部ポテンシャル、相互作用ポテンシャル、磁場を持つ多体パウリ作用素に対して強い一意的な連続性を証明する。
この目的のために、分数ラプラシア作用素を含む特異カルマン推定を証明した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:16:58 GMT)
Third-order Pertubative OTOC of Harmonic Oscillator with Quartic Interaction and Quantum Chaos [0.0] 単純な高調波発振器の3次時間外相関器(OTOC)を計算した。
我々は,C_T$の早期特性を解析し,カオスを診断する指数的成長が3次摂動で示されることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:43:18 GMT)
The Quantum Coherence in Terms of Phase-Sensitive Nonadiabatic Dressed States [0.0] 量子コヒーレンス(quantum coherence)は、位相感受性の非断熱的な状態にあると考えられている。
位相相関は,実数と仮想成分の位相相関と,それらの状態の異なる仮想成分の定常位相相関の2種類がある。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:36:07 GMT)
Symmetry-informed transferability of optimal parameters in the Quantum Approximate Optimization Algorithm [0.0] 変分量子アルゴリズムの主な限界の1つは、高次元の非重み付き変分パラメータランドスケープの最適化である。
この探索空間を単純化するために、問題対称性と典型的な最適パラメータを初期点とする探索空間を縮小することができる。
最適パラメータの任意の集合を対称性を用いて適切な領域に変換する方法を示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:37:53 GMT)
Super-diffusive transport in two-dimensional Fermionic wires [0.0] パワー・ローの挙動は、エネルギーカットオフ以下の局所化長を分散させるエネルギー固有状態の存在に起因する。
導電性は障害の期待値とワイヤのパラメータの符号に応じて拡散的または異なるサブ拡散的パワーローでスケールすることを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:47:50 GMT)
Speed-accuracy trade-off for the diffusion models: Wisdom from nonequlibrium thermodynamics and optimal transport [0.0] 拡散モデルと呼ばれる生成モデルとフォッカー・プランク方程式の非平衡熱力学の関連について論じる。
拡散モデルにおけるデータ生成の速度と精度のトレードオフ関係である拡散モデルの速度-精度トレードオフを導出する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:35:14 GMT)
Simulation of Spin Chains with off-diagonal Coupling Using Inchworm Method [0.0] 本研究では, 閉量子スピン鎖と近接結合の動的シミュレーションを行い, チェーン内の各スピンとハーモニックバスの関連性について検討した。
長期シミュレーションにおける計算コストとメモリコストを削減するため,スピン鎖の密度行列を効率的に表現するためにテンソルトレイン表現を適用した。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:07:39 GMT)
Secure Rewind and Discard on ARM Morello [0.0] CやC++のようなメモリアンセーフなプログラミング言語は、システムプログラミング、組み込みシステム、パフォーマンスクリティカルなアプリケーションにとって好まれる言語である。
以前のアプローチでは、x86アーキテクチャのランタイムアタックをターゲットとしたソフトウェアのレジリエンスを高める方法として、分離ドメインのセキュアドメイン再巻き戻し(SDRaD)が提案されていた。
SDRaD は、より軽量で高性能な Capability Hardware Enhanced RISC Instructions (CHERI) アーキテクチャで動作するように適応されている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:41:59 GMT)
Rethinking Data Input for Point Cloud Upsampling [0.0] ポイントクラウドモデルフルインプットとパッチベースのインプットの違いと原則について議論する研究はない。
本稿では,PU-GCNのトレーニング中に形状整合性を確保するために,全点クラウドモデルを分割する新たなデータ入力手法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:53:34 GMT)
Restrictions imposed by quantum mechanics on the results of measuring the momentum of a particle in three-dimensional configuration space [0.0] 三次元の場合を考え、運動エネルギー作用素の場の定義に異なるアプローチをとる。
このアプローチで生じる量子力学的ポテンシャルはボヘミアのものと異なり、構成空間における粒子運動量の値場は常に実数である。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:24:33 GMT)
Relational objectivity in presence of finite quantum resources [0.0] ベル・コッシェンとスペクターは、実験的な文脈の概念が根本的に分離できないことを暗示するものではないと解釈できる。
我々は、ペンローズのスピンネットワークの提案は、教科書の枠組みを超えた量子論の形式化の可能性であると主張している。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:02:44 GMT)
Real Time Emotion Analysis Using Deep Learning for Education, Entertainment, and Beyond [0.0] プロジェクトは2つのコンポーネントから構成される。
我々は、洗練された画像処理技術とニューラルネットワークを用いて、表情を正確に分類できるディープラーニングモデルを構築する。
アプリは洗練されたモデルを利用して、表情を素早く分析し、対応する絵文字を素早く表示する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:48:19 GMT)
Qudit Dynamical Decoupling on a Superconducting Quantum Processor [0.0] We developed protocol for dynamical decoupling of qudit systems based on the Heisenberg-Weyl group。
システムバスによるデコヒーレンスからクォートとクォートを分離する単一クォートDD配列を実証する。
また、結合されたキューディット間の有害な相互Kerr結合を抑制するために、2量子DDシーケンスを導入する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 23:37:29 GMT)
Quantized circular dichroism on the edge of quantum Hall systems: The many-body Chern number as seen from the edge [0.0] 量子ホール状態は位相不変量、多体チャーン数によって特徴づけられる。
このトポロジカルな性質は、系を円形の駆動に従属させることで、散逸応答を通じてアクセスすることもできる。
適切に単離された場合、量子ホール液滴の端から生じる円二色反応は量子化されなければならない。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:51:36 GMT)
Quantal phase of extreme nonstatic light waves: Step-phase evolution and its effects [0.0] 光波が非定常になると、幾何学的位相と呼ばれる追加の位相が進化する。
波の非定常化が進むにつれて、電磁波の位相係数は長方形に変化する。
この場合の電磁場は、定常波の電磁場と非常によく似ている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:32:19 GMT)
Prediction techniques for dynamic imaging with online primal-dual methods [0.0] 我々は、予測的オンライン原始双対法に関する過去の研究を改善した。
画像安定化と動的ポジトロン放射トモグラフィーにおける効果を数値的に示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:27:35 GMT)
Polariton Fluids as Quantum Field Theory Simulators on Tailored Curved Spacetimes [0.0] 湾曲した時空の量子場は、ブラックホールからのホーキング放射のような豊富な効果を示す。
実験では、亜音速から超音速までの流体は、音場に対して効果的に湾曲した時空を作り出す。
地平線曲率の制御と両側のスペクトルへのアクセスは、場の理論の研究のために光の量子流体のポテンシャルを示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:37:39 GMT)
Parametric Curve Segment Extraction by Support Regions [0.0] ガウスフィルタのラプラシアン(Laplacian of Gaussian, LoG)を用いた画像からパラメトリック形状の曲線セグメントを抽出する手法を提案する。
我々のセグメンテーションは凸曲線と凹曲線を与える。
そのため、閾値フィルタ応答の画素をグループ化することで、曲線支持領域を形成する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 05:38:20 GMT)
Optimal estimators of cross-partial derivatives and surrogates of functions [0.0] 本稿では、これらの関数をランダム化点$N$で評価することにより、関数のすべての部分的微分のサロゲートを導入する。
NL$モデルランに基づく関連する推定器は、収束の最適な速度に達する。
このような結果は、i)感度指標の主および上界を計算し、i)微分に基づくANOVAシミュレーションにより、シミュレータのエミュレータや関数のサロゲートを導出する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:39:06 GMT)
On-Demand Mobility Services for Infrastructure and Community Resilience: A Review toward Synergistic Disaster Response Systems [0.0] モビリティ・オン・デマンド(MOD)サービスは、ディスラプティブイベントの結果として、都市システムの適応性と回復を著しく改善する可能性がある。
本論では, レジリエントなMODサービス, インフラとコミュニティのレジリエンス向上のための新しいMODサービスの利用, 経験的影響評価, テクノロジーの実現, 拡張という4つの分野において, ここ数年で顕著な増加が示唆されている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:59:19 GMT)
On Hamiltonian formulations of the Dirac system [0.0] 古典的ディラック場をスピノリアル変数として論じ、適切に定義されたモータと適切な修正された係数順序ポアソンブラケットを導入する。
一般化されたディラックブラケットの3つのバージョンすべてに対する正準第二量子化法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:38:55 GMT)
Object recognition in primates: What can early visual areas contribute? [0.0] 本研究では,初期視覚処理領域で搬送される信号が周囲の物体認識にどのように利用されるかを検討した。
V1の単純なセルや複雑なセルのモデルは、非常に信頼できる情報を提供することができ、現実的なシナリオでは80%以上の性能が向上する。
我々は,物体認識を並列プロセスと見なすべきであり,低精度かつ高速なモジュールと並列に動作し,視野をまたいで動作可能であることを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:57:09 GMT)
Non-classical correlations between a quantum probe and complex quantum systems in presence of noise [0.0] 大規模でマクロなシステムと相互作用する量子プローブシステム内で発生する非古典的相関は、後者における量子的特徴の存在を示唆することができる。
このようなシステムに対するノイズを含む詳細なモデルを考えると、小さな量子プローブが大きなシステムと相互作用し、結合強度や雑音レベルに関して規則を規定する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:32:16 GMT)
Multi-Attention Integrated Deep Learning Frameworks for Enhanced Breast Cancer Segmentation and Identification [0.0] 超音波画像を用いた乳腺腫瘍の正確な診断・分類は医学的課題である。
本研究は,乳がん腫瘍の超音波画像からの分類と分類を目的とした多目的ディープラーニング(DL)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:37:15 GMT)
ISQuant: apply squant to the real deployment [0.0] 量子化と復号化の組み合わせがモデルトレーニングに使われている理由を分析する。
8ビットモデルをデプロイするためのソリューションとしてISQuantを提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 15:10:05 GMT)
Hyperspectral Dataset and Deep Learning methods for Waste from Electric and Electronic Equipment Identification (WEEE) [0.0] ハイパースペクトル画像分割のための多種多様なディープラーニングアーキテクチャの性能を評価する。
その結果,空間情報をスペクトルデータと組み合わせることで,セグメンテーション結果が改善された。
我々は、Tecnalia WEEE Hyperspectralデータセットのクリーニングと公開によって、この分野に貢献する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 13:45:11 GMT)
Hybrid Machine Learning Approach For Real-Time Malicious Url Detection Using Som-Rmo And Rbfn With Tabu Search Optimization [0.0] 悪意のあるURLの拡散は、インターネットのセキュリティにとって重大な脅威となっている。
従来の検出方法は、これらの脅威の進化する性質とペースを維持するのに苦労する。
本稿では,効率的な特徴抽出と正確な分類を組み合わせたハイブリッド機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:24:49 GMT)
How to Drill Into Silos: Creating a Free-to-Use Dataset of Data Subject Access Packages [0.0] 欧州連合(EU)の一般データ保護規則は、個人データへのアクセス権を強化した。
コントローラが提供する被写体アクセス要求パッケージ(SARP)を実際に使用する可能性は非常に制限されている。
このデータセットは一般に提供され、将来、SARPの実用化に向けた新しいアプローチの研究および比較の出発点として機能する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:39:51 GMT)
Graph Theory and GNNs to Unravel the Topographical Organization of Brain Lesions in Variants of Alzheimer's Disease Progression [0.0] 我々は,アルツハイマー病(AD)神経病理の変動を評価するためのグラフベースの枠組みを提案し,評価した。
我々のフレームワークは、古典的(cAD)および急激な(rpAD)進行形式に焦点を当てている。
結果は,各AD変異体に特有の神経病理学的ネットワーク構造が示唆された。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:48:52 GMT)
Generalized cluster states from Hopf algebras: non-invertible symmetry and Hopf tensor network representation [0.0] クラスター状態は測定ベースの量子計算(MBQC)にとって重要な資源である
ホップ代数に基づくクラスター状態の構成について述べる。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 07:15:21 GMT)
Generalized Uncertainty Principle for Entangled States of Two Identical Particles [0.0] 一般化不確実性原理(GUP)は通常、最小長の存在と関連付けられる。
我々は、主要なGUP(KMM、ADV、Pedram、Nouicer)に焦点を当て、修正GUPによって誘導される位置の最小不確実性を決定する。
このパラドックスを克服するためには、絡み合った系が2つの粒子で構成されており、最小長に関する有効パラメータを使わなければならないことに気付く。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:58:05 GMT)
Controlling Fano resonance and slow/fast light in a magnomechanical system with an optical parametric amplifier [0.0] マグノメカニカルシステムによって誘導される低速光効果と多透過性について検討した。
空洞内のフォノン、マグノン、光の相互作用は、マグノメカニカル・インダストリアル・透過(MMIT)とマグノン・インダストリアル・透過(MIT)という2つの現象を引き起こす。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:20:16 GMT)
Connecting the Hamiltonian structure to the QAOA performance and energy landscape [0.0] 量子交互演算子 Ansatz (QAOA) は2次非制約二項最適化問題の解法に有効である。
本研究は,短期量子デバイスにおけるアルゴリズムの堅牢性と最適化タスクの可能性を強調する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 11:32:46 GMT)
Complexification of Quantum Signal Processing and its Ramifications [0.0] 単一周期でフロケ作用素を定義する回路と、リー代数 sl$(2,mathbbC)$ に対する時空双対定義 QSP 列との関係を示す。
また、このQSP列のユニタリ表現は無限次元であり、ハイゼンベルク図形のボゾン作用素に対して定義される。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:00:04 GMT)
Broadband Entangled-Photon Pair Generation with Integrated Photonics: Guidelines and A Materials Comparison [0.0] 関連する光子対光源は、量子コンピューティング、ネットワーク、およびセンシングアプリケーションの主要なコンポーネントである。
集積フォトニクスは非線形プロセスを用いてチップスケールの光源を可能にし、テレコム波長で100マイクロワット以下の電力で高速な絡み合いを発生させた。
本研究では, 非線形集積フォトニック材料における自発4波混合によるブロードバンドの絡み合い生成について検討する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 18:08:28 GMT)
Breaking and trapping Cooper pairs by Rydberg-molecule spectroscopy in atomic Fermi superfluids [0.0] ライドバーグ不純物と相互作用する原子フェルミ超流動層におけるクーパー対の破壊と局在の分光プローブを提案する。
これは、ボース・アインシュタイン凝縮(BEC)を横切る超流動層における二原子および三原子超長距離分子種の形成をモニタリングすることによって達成される。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 10:37:28 GMT)
An AI Architecture with the Capability to Classify and Explain Hardware Trojans [0.0] 既存のハードウェアトロイの木馬検出機能に基づいて、説明可能な方法論とアーキテクチャを導入する。
トラストハブトロイの木馬ベンチマークを用いて、ネットリスト内のデジタルハードウェアトロイの木馬を説明する結果が提供される。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 14:36:19 GMT)
Achieving quantum metrological performance and exact Heisenberg limit precision through superposition of $s$-spin coherent states [0.0] この研究は、$s$-spinコヒーレント状態重畳を用いた量子位相推定に発展する。
スピン猫状態の最終的な測定精度がハイゼンベルク極限に近づくことを解析的に示す。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 20:12:42 GMT)
A systematic review on expert systems for improving energy efficiency in the manufacturing industry [0.0] 本稿では,産業におけるエネルギー効率向上を目的としたエキスパートシステムの現状を体系的にレビューする。
文献検索の結果は1692で、そのうち1987年から2023年の間に発行された54の論文が詳細に分析されている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 09:28:31 GMT)
A proposal to demonstrate non-abelian anyons on a NISQ device [0.0] そこで本研究では,電子回路の操作と測定を劇的に単純化する手法を提案する。
モデルの全モジュラーデータを実験的に測定することは可能であると結論付けている。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 12:05:51 GMT)
A Two-Step Minimax Q-learning Algorithm for Two-Player Zero-Sum Markov Games [0.0] ゼロサムマルコフゲームを解くために,2段階のQ-ラーニングアルゴリズムを提案する。
提案アルゴリズムは,モデル情報が不明な場合に,ゲーム理論の最適値と確率1に収束する。
数値シミュレーションは,提案アルゴリズムが有効で実装が容易であることを認証する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 03:56:40 GMT)
A Didactic Journey from Statistical Physics to Thermodynamics [0.0] 本稿では,エントロピーの基本的性質から熱力学の公理まで,歩行者ガイドを提供する。
また、ラグランジュ乗数に物理的意味を割り当てるなど、欠陥のある概念を分解する。
論文参考訳(メタデータ) (Fri, 5 Jul 2024 16:43:14 GMT)