Fugu-MT: arxivの論文翻訳(概要)

Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition [110.8]
生成音声の書き起こし誤り訂正(GenSEC)の課題について紹介する。この課題は、(i)ASR後の転写補正、(ii)話者タグ付け、(iii)感情認識という、3つのASR後の言語モデリングタスクを含む。本稿では,ベースライン評価から得られた知見と,今後の評価設計における教訓について論じる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:32:04 GMT)
LPT++: Efficient Training on Mixture of Long-tailed Experts [107.8]
++は3つのコアコンポーネントを統合することで、凍結されたビジョントランスフォーマー(ViT)を強化する。 1つ目は、長い尾のプロンプトと視覚的アダプタを集約して、トレーニング済みのモデルを対象のドメインに適応させる、普遍的な長い尾の適応モジュールである。 2つ目は、長い尾を持つエキスパートフレームワークと、より正確な予測を生成するために、視覚のみと視覚言語(VL)の両方のモデルエキスパートからの信頼度スコアに対する再重み付け係数を適応的に計算するMoEスコアラーの混合である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:19:11 GMT)
P-RAG: Progressive Retrieval Augmented Generation For Planning on Embodied Everyday Task [94.1]
Embodied Everyday Taskは、インボディードAIコミュニティで人気のあるタスクである。自然言語命令は明示的なタスクプランニングを欠くことが多い。タスク環境に関する知識をモデルに組み込むには、広範囲なトレーニングが必要である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:29:34 GMT)
CoCA: Regaining Safety-awareness of Multimodal Large Language Models with Constitutional Calibration [90.4]
マルチモーダルな大言語モデル (MLLM) は、視覚的な入力を含む会話への関与において顕著な成功を収めている。視覚的モダリティの統合は、MLLMが悪意のある視覚的入力に影響を受けやすいという、ユニークな脆弱性を導入している。本稿では,出力分布を校正することでMLLMの安全性を向上するCoCA技術を紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:14:41 GMT)
SLAck: Semantic, Location, and Appearance Aware Open-Vocabulary Tracking [89.4]
Open-vocabulary Multiple Object Tracking (MOT)は、トレーニングセットにはない新しいカテゴリにトラッカーを一般化することを目的としている。我々は,連合の初期段階において,意味論,位置,出現の先行を共同で検討する統一的な枠組みを提案する。提案手法は,異なるキューを融合するための複雑な後処理を排除し,大規模オープン語彙追跡のための関連性能を大幅に向上させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:36:58 GMT)
Transferable and Principled Efficiency for Open-Vocabulary Segmentation [82.7]
事前学習された基礎視覚言語計算モデルの最近の成功は、Open-Vocabulary (OVS)を可能にする。このアプローチでは,1) 背骨のモデルサイズが大きいこと,2) 微調整時にコストがかかること,の2つの課題に対して,計算上のオーバーヘッドが発生する。本稿では,大規模な視覚言語基盤モデルに基づいて,従来のOVSに匹敵する,あるいはさらに優れた性能を実現することを目的とする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:21:01 GMT)
GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting [82.3]
入力画像4枚だけで高画質化が可能な3Dオブジェクトをガウススプラッティングで表現・描画するフレームワークを提案する。 GustafObjectは、MipNeRF360、OmniObject3D、OpenIlluminationなど、いくつかの困難なデータセットで評価されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:46:03 GMT)
Diversifying the Expert Knowledge for Task-Agnostic Pruning in Sparse Mixture-of-Experts [75.9]
本稿では,モデルのパラメータ効率を向上させるために,類似の専門家をグループ化し,グループ化する方法を提案する。提案手法の有効性を3つの最先端MoEアーキテクチャを用いて検証する。評価の結果,本手法は自然言語タスクにおいて,他のモデルプルーニング手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:48:50 GMT)
ROOT-SGD: Sharp Nonasymptotics and Near-Optimal Asymptotics in a Single Algorithm [71.1]
第一次アルゴリズムを用いて,厳密な凸と滑らかな非制約最適化問題の解法について検討する。我々は,過去の勾配を平均化し,実装が容易な小説「Recursive One-Over-T SGD」を考案した。有限サンプル, 漸近感覚, 感覚の両面において, 最先端の性能を同時に達成できることを実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:46:02 GMT)
UniMODE: Unified Monocular 3D Object Detection [70.3]
我々は,鳥眼視(BEV)検出パラダイムに基づく検出器を構築した。本稿では,この課題に起因する収束不安定性に対応するために,不均一なBEVグリッド設計を提案する。統一検出器UniMODEが導出され、挑戦的なOmni3Dデータセットの先行技術を上回る。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:00:21 GMT)
Fine-grained LLM Agent: Pinpointing and Refining Large Language Models via Fine-Grained Actionable Feedback [65.8]
LLMエージェントは、大規模言語モデルの出力を洗練するための推論手法である。中心となる考え方は、学習したきめ細かいフィードバックモデルを使用して欠陥を特定し、LCMを反復的に洗練させることです。機械翻訳、長文質問応答(QA)、話題要約を含む3つのテキスト生成タスクについて実験を行った。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:33:49 GMT)
LC-Protonets: Multi-label Few-shot learning for world music audio tagging [65.7]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。 LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:13:07 GMT)
Score Forgetting Distillation: A Swift, Data-Free Method for Machine Unlearning in Diffusion Models [63.4]
マシン・アンラーニング(MU)は安全でセキュアで信頼性の高いGenAIモデルを開発する上で重要な基盤である。従来のMUメソッドは、しばしば厳密な仮定に依存し、実際のデータへのアクセスを必要とする。本稿では,拡散モデルにおいて望ましくない情報を忘れることを促進する革新的なMUアプローチであるScore Forgetting Distillation (SFD)を紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:12:50 GMT)
Sparkles: Unlocking Chats Across Multiple Images for Multimodal Instruction-Following Models [60.8]
マルチモーダル命令追従モデルは、テキストと画像を統合することで機能を拡張する。 MiniGPT-4やLLaVAのような既存のモデルは、複数の画像を含むシナリオにおける対話コヒーレンスを維持する上で課題に直面している。本稿では,単語レベルのインターリーブ・マルチイメージとテキストインタラクションに適した,最初の機械生成対話データセットであるSparklesDialogueを紹介する。次に、複数の画像にまたがるオープンエンド対話のためのマルチモーダル命令追従モデルSparklesChatを紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:46:07 GMT)
Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.8]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:37:14 GMT)
NVLM: Open Frontier-Class Multimodal LLMs [59.6]
NVLM 1.0は、フロンティアクラスのマルチモーダル言語モデル(LLM)のファミリーである。トレーニング効率とマルチモーダル推論能力を両立させる新しいアーキテクチャを提案する。我々は、NVLM-1.0モデルのための生産級マルチモーダリティを開発し、視覚言語タスクに優れる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:59:06 GMT)
TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.5]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:35:00 GMT)
Phidias: A Generative Model for Creating 3D Content from Text, Image, and 3D Conditions with Reference-Augmented Diffusion [59.0]
3Dモデリングでは、デザイナはしばしば既存の3Dモデルを使って新しいものを作成する。このプラクティスは、参照付加3D生成に拡散を利用する新しい生成モデルであるPhidiasの開発にインスピレーションを与えている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:59:33 GMT)
Exploring Concept Depth: How Large Language Models Acquire Knowledge at Different Layers? [57.0]
大規模言語モデル(LLM)は、幅広いタスクで顕著なパフォーマンスを示している。しかし、これらのモデルが様々な複雑さのタスクを符号化するメカニズムは、いまだに理解されていない。我々は、より複雑な概念が一般的により深い層で取得されることを示すために、概念深さの概念を紹介します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:37:18 GMT)
A Survey of Machine Unlearning [56.0]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。 MLモデルは古いデータをよく記憶します。機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:55:58 GMT)
Contrastive Learning in Memristor-based Neuromorphic Systems [55.1]
スパイクニューラルネットワークは、現代のバックプロパゲーションによって訓練されたディープネットワークに直面する重要な制約の多くを横取りする、ニューロンベースのモデルの重要なファミリーとなっている。本研究では,前向き・後向き学習のニューロモルフィック形式であるコントラッシブ・シグナル依存型塑性(CSDP)の概念実証を設計し,検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:48:45 GMT)
Promptriever: Instruction-Trained Retrievers Can Be Prompted Like Language Models [54.3]
本稿では,LMのように誘導できる最初の検索モデルであるPromptrieverを紹介する。 Promptrieverは、標準的な検索タスクで高いパフォーマンスを達成し、命令に従う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:42:55 GMT)
Towards Effective User Attribution for Latent Diffusion Models via Watermark-Informed Blending [54.3]
我々は、ウォーターマークインフォームドブレンディング(TEAWIB)による潜伏拡散モデルに対する効果的なユーザ属性に向けた新しいフレームワークを提案する。 TEAWIBは、ユーザ固有の透かしを生成モデルにシームレスに統合する、ユニークな準備可能な構成アプローチを取り入れている。 TEAWIBの有効性を検証し、知覚的品質と帰属精度で最先端の性能を示す実験を行った。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:52:09 GMT)
Relative Representations: Topological and Geometric Perspectives [53.9]
相対表現はゼロショットモデルの縫合に対する確立されたアプローチである。相対変換において正規化手順を導入し、非等方的再スケーリングや置換に不変となる。第二に、クラス内のクラスタリングを促進するトポロジカル正規化損失である、微調整された相対表現におけるトポロジカルデシフィケーションの展開を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:09:22 GMT)
The Sample Complexity of Smooth Boosting and the Tightness of the Hardcore Theorem [53.4]
スムースブースターは任意の例にあまり重みを付けない分布を生成する。もともとは耐雑音性のために導入されたが、そのようなブースターは微分プライバシー、軽度、量子学習理論にも応用されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:09:25 GMT)
Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation [53.3]
本稿では,公正ランキングと統合されたRAGシステムの最初の体系的評価について述べる。本稿では,RAGシステムで活用されるランキングにおいて,各項目の公正な露出を測定することに焦点を当てる。以上の結果から,RAGシステムは高い世代品質を維持でき,多くの場合,従来のRAGシステムよりも優れていたことが示唆された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:10:04 GMT)
Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think [53.3]
認識された非効率性は、これまで気付かれなかった推論パイプラインの欠陥によって引き起こされたことを示している。タスク固有の損失を伴う単一ステップモデル上でエンドツーエンドの微調整を行い、他の拡散に基づく深さモデルや正規推定モデルよりも優れた決定論的モデルを得る。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:58:52 GMT)
Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.6]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。 STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:02:12 GMT)
Laugh Now Cry Later: Controlling Time-Varying Emotional States of Flow-Matching-Based Zero-Shot Text-to-Speech [51.5]
EmoCtrl-TTSは感情制御可能なゼロショットTSであり、あらゆる話者に対してNVで高い感情的な音声を生成することができる。高品質な感情音声生成を実現するために、EmoCtrl-TTSは擬似ラベルに基づく27,000時間以上の表現データを用いて訓練される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:40:11 GMT)
MURRE: Multi-Hop Table Retrieval with Removal for Open-Domain Text-to-SQL [51.5]
MURRE (Multi-hop table search with removal) は、未検索のテーブルへ誘導するために、質問から以前検索した情報を削除する。 2つのオープンドメインのテキスト・ツー・レトリバーデータセットの実験は、以前の最先端結果よりも平均5.7%改善したことを示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:25:27 GMT)
S$^3$Attention: Improving Long Sequence Attention with Smoothed Skeleton Sketching [51.4]
本稿ではスムースなスケルトンスケッチに基づくアテンション構造S$3$Attentionを提案する。 S$3$Attentionは、線形複雑性をシーケンス長に保ちながら、ノイズの影響を効果的に最小化する2つのメカニズムを持つ。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:30:46 GMT)
SIFToM: Robust Spoken Instruction Following through Theory of Mind [51.3]
本稿では,認知にインスパイアされた音声指導モデルであるSIFToMを提案し,多様な音声条件下でロボットが人間の指示を実践的に追従できるようにする。結果から,SIFToMモデルは現状の音声モデルや言語モデルよりも優れており,課題に追従する音声命令に対する人間レベルの精度に近づいていることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:36:10 GMT)
AI-Assisted Human Evaluation of Machine Translation [51.1]
我々は、リコール指向の自動品質推定でエラーアノテーションをプリフィルすることでアノテータを支援する。このAIアシストにより、アノテーションごとの時間を半分に減らしながら、同じ品質レベルでアノテーションを得ることができます。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:18:11 GMT)
fMRI-3D: A Comprehensive Dataset for Enhancing fMRI-based 3D Reconstruction [50.5]
我々は15人の参加者のデータを含むfMRI-3Dデータセットを提示し、合計4768個の3Dオブジェクトを展示する。我々は,fMRI信号から3次元視覚情報を復号化するための新しいフレームワークMinD-3Dを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:13:59 GMT)
Manipulating and Mitigating Generative Model Biases without Retraining [49.6]
モデル再学習を伴わないリッチ言語埋め込み空間を利用して,T2Iモデルバイアスの動的かつ効率的な操作を提案する。基礎ベクトル代数を利用することで、T2Iモデルの出力をシフトさせる言語モデルの埋め込みを便利に制御できることを示す。副産物として、この制御は正確なプロンプト工学の一形態として機能し、通常のテキストプロンプトを使って一般的には理解できない画像を生成する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:07:58 GMT)
Normalization in Proportional Feature Spaces [49.5]
データ表現、特徴付け、可視化、分析、比較、分類、モデリングにおいて、正規化は重要な中心的な役割を果たす。適切な正規化手法の選択は、関連する特徴の種類と特徴を考慮する必要がある。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:46:27 GMT)
Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection [49.3]
音声感情認識(SER)は、人間とコンピュータの自然な相互作用が可能な汎用AIエージェントを開発する上で重要な要素である。英語や中国語以外の言語でラベル付きデータが不足しているため、堅牢な多言語SERシステムの構築は依然として困難である。本稿では,低SERリソース言語におけるSERの性能向上のための手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:36:45 GMT)
MonoKAN: Certified Monotonic Kolmogorov-Arnold Network [48.6]
特定のアプリケーションでは、モデル予測は専門家が提案した要件と一致し、時には部分的な単調性制約によって例示されなければならない。我々は,kanアーキテクチャに基づく新しいANNアーキテクチャMonoKANを導入し,解釈性を高めつつ,認証された部分的単調性を実現する。実験の結果,MonoKANは解釈可能性を高めるだけでなく,ほとんどのベンチマークにおける予測性能も向上し,最先端のモノトニックアプローチよりも優れていた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:10:59 GMT)
Depth-based Privileged Information for Boosting 3D Human Pose Estimation on RGB [48.3]
ヒートマップに基づく3Dポーズ推定器は、推定時に与えられるRGBフレームから深度情報を幻覚することができる。深度情報は、RGBベースの幻覚ネットワークを強制して、深度データのみに基づいて事前訓練されたバックボーンに類似した特徴を学習することによって、トレーニング中にのみ使用される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:59:34 GMT)
Annealed Winner-Takes-All for Motion Forecasting [48.2]
本稿では,AWTAの損失を最先端のモーション予測モデルと統合して性能を向上させる方法を示す。我々の手法は、WTAを用いて訓練された任意の軌道予測モデルに容易に組み込むことができる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:26:17 GMT)
Dated Data: Tracing Knowledge Cutoffs in Large Language Models [48.0]
LLMの資源レベルの時間的アライメントに有効なカットオフを推定するための簡単な手法を提案する。効果的なカットオフは、報告されたカットオフとしばしば異なります。提案手法は,(1)非自明なデータ量によるCommonCrawlデータの時間的偏りと,(2)意味的重複と語彙的近接重複を含むLLM重複の重複という2つの原因を明らかにした。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:25:40 GMT)
FedNE: Surrogate-Assisted Federated Neighbor Embedding for Dimensionality Reduction [47.3]
textscFedNEは、textscFedAvgフレームワークと対照的なNEテクニックを統合する新しいアプローチである。我々は、合成データセットと実世界のデータセットの両方について包括的な実験を行う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:23:24 GMT)
Adaptive Large Language Models By Layerwise Attention Shortcuts [46.8]
LLMライクなセットアップにより、最終レイヤはアテンションメカニズムを通じて適合すると考えられるすべての中間レイヤに出席することができる。音響トークン,自然言語,シンボリック音楽の4つの異なるデータセットを紹介し,GPTアーキテクチャの優れた性能を実現する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:46:01 GMT)
Music auto-tagging in the long tail: A few-shot approach [45.9]
マルチラベル音楽の自動タグ付けに少数ショット学習手法を統合することを提案する。実験により,事前学習した特徴を持つ簡易モデルにより,最先端モデルに近い性能が得られることを示した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:48:38 GMT)
Jäger: Automated Telephone Call Traceback [45.7]
分散セキュアなコールトレースバックシステムであるJ"agerを紹介します。 J"agerは、部分的なデプロイであっても、数秒で呼び出しをトレースできる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:51:43 GMT)
Machine Learning and Theory Ladenness -- A Phenomenological Account [45.0]
両者の立場は単純すぎるし、MLメソッドとドメイン理論間の相互作用の理解を前進させるものではない、と我々は主張する。分析の結果、モデルの構築はドメイン理論とは比較的独立しているが、特定のドメイン内でのモデルの実装と解釈は、基本的な理論的仮定と背景知識に依存していることが明らかとなった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:29:14 GMT)
ImageFlowNet: Forecasting Multiscale Image-Level Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images [44.1]
ImageFlowNetは、空間的詳細を保存しながら、初期画像から疾患軌跡を予測するために設計された新しいモデルである。我々は、ODEの定式化を支援し、高レベルの視覚的特徴を含む正規化を動機付ける理論的洞察を提供する。私たちのコントリビューションには、ImageFlowNetの開発、実世界のデータセットに関する理論的および実証的な検証が含まれています。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:19:19 GMT)
A Dynamical System View of Langevin-Based Non-Convex Sampling [44.0]
非サンプリングは機械学習における重要な課題であり、ディープラーニングにおける非レート最適化の中心であり、その重要性を近似する。既存の保証は通常、より望ましい最終段階の反復よりも平均距離のみを保持する。我々は、理論システムからいくつかのツールを活用することにより、上記の問題を解消する新しいフレームワークを開発する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:03:42 GMT)
PDMX: A Large-Scale Public Domain MusicXML Dataset for Symbolic Music Processing [43.6]
PDMX: スコア共有フォーラムMuseScoreから収集した250万以上のパブリックドメイン MusicXML スコアからなる大規模なオープンソースデータセット。このデータセットは、私たちの知識にとって最大の著作権のないシンボリック音楽データセットです。我々は、PDMXの異なる代表部分集合が下流モデルにおける異なる挙動にどのように寄与するかを評価するマルチトラック音楽生成実験を行う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:48:42 GMT)
Obfuscation Based Privacy Preserving Representations are Recoverable Using Neighborhood Information [43.1]
プライバシ保護ローカライゼーションの研究は、クエリ画像キーポイントとシーンマップの3Dポイントに対する逆攻撃を防ぐことに重点を置いている。これらの難読化の共通の弱点を指摘し、既知の近傍の仮定の下で元の点位置の近似を復元できるようにする。以上の結果から,プライバシ保護を主張されているにもかかわらず,これらのスキームはプライバシ保護とはみなしてはならないことが示唆された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:13:54 GMT)
Transferable-guided Attention Is All You Need for Video Domain Adaptation [42.6]
ビデオにおける教師なし適応(UDA)は、画像ベースのUDA技術に比べ、まだ十分に検討されていない課題である。我々のキーとなる考え方は、トランスフォーマー層を特徴エンコーダとして使用し、空間的および時間的伝達可能性の関係をアテンション機構に組み込むことである。 Transferable-Guided Attention (TransferAttn)フレームワークが開発され、トランスフォーマーの能力を利用してドメイン間の知識を適応する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:35:46 GMT)
Deep Learning Based 3D Segmentation: A Survey [42.4]
3Dセグメンテーションは、自律運転とロボット工学の応用でコンピュータビジョンの根幹的で難しい問題である。近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。本稿では,ディープラーニングに基づく3Dセグメンテーション技術の最近の進歩を包括的に調査する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:48:38 GMT)
Task Arithmetic for Language Expansion in Speech Translation [41.7]
我々は,新しい言語ペアと既存のモデルで訓練されたモデルを組み合わせることで,新しい言語ペアを拡張することを提案する。また,STに対するタスク演算の直接適用により,マージされたモデルが命令に従わないことが判明した。言語を混乱させないために,追加の言語制御モデルとマージする拡張タスク演算法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:25:11 GMT)
Context-Dependent Interactable Graphical User Interface Element Detection for VR Applications [41.6]
仮想現実感アプリのための最初のゼロショットcOntext-sensitive inteRactable GUI ElemeNT dEtectionフレームワークOrienterを提案する。人間の振る舞いを模倣することで、OrienterはまずVRアプリのシーンの意味的コンテキストを観察し、理解し、次に検出を実行する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:58:00 GMT)
EIA: Environmental Injection Attack on Generalist Web Agents for Privacy Leakage [40.8]
本稿では,敵の標的,制約,攻撃シナリオについて議論する脅威モデルを提案する。ユーザ固有の個人識別情報(PII)を盗むか,あるいはユーザ要求全体を盗む。これらの目的を達成するために,環境注入攻撃(EIA)と呼ばれる新しい攻撃手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:49:44 GMT)
LoRa Communication for Agriculture 4.0: Opportunities, Challenges, and Future Directions [40.1]
スマート農業の新興分野は、IoT(Internet of Things)を活用して農業プラクティスに革命をもたらす。本稿では,農業用IoTシステムにおける長距離無線通信の鍵となるLong Range(LoRa)技術の転換可能性について検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:55:44 GMT)
Advanced Model Consistency Restoration with Higher-Order Short-Cut Rules [39.6]
我々は、同期中に、より複雑なSC規則をオンザフライで計算する手法を開発した。これらの高階のSCルールは、複数の変更を1ステップで処理しなければならない場合に、より複雑なシナリオに対処することができます。評価により、高次SCルールのオンザフライでの計算のオーバーヘッドは許容可能であり、時には全体的な性能も向上することが示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:27:38 GMT)
Learning Spatially-Aware Language and Audio Embedding [38.3]
マルチモーダルコントラスト学習を用いて学習した空間認識音声およびテキスト埋め込みモデルを提案する。 ELSAは音声の空間的・意味的要素を記述する非空間的音声、空間的音声、オープン語彙の字幕をサポートする。特に、ELSAはベースライン上のオーディオ・トゥ・テキストとテキスト・トゥ・オーディオのR@1を+2.8%、ベースライン上の3Dソースのローカライゼーションにおいて-11.6degの平均・絶対エラーを上回ります。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:17:25 GMT)
CREAM: Comparison-Based Reference-Free ELO-Ranked Automatic Evaluation for Meeting Summarization [37.4]
CREAM (Comparison-Based Reference-Free Elo-Ranked Automatic Evaluation for Meeting Summarization) は、ミーティングサマリーを評価する際の課題に対処する新しいフレームワークである。 ELOランキングシステムを利用することで、異なるモデルの品質や迅速な構成を比較するための堅牢なメカニズムを提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:39:20 GMT)
Watch Your Steps: Observable and Modular Chains of Thought [36.8]
プログラムトレースプロンプティング(Program Trace Prompting)と呼ばれる,思考の連鎖(CoT)の変種を提案する。 CoTのパワー、一般性、柔軟性を保ちながら、より観察可能な説明をする。 Program Trace Promptingは多くのタスクに適用でき、BIG-Bench Hardベンチマークの23種類のタスクに対して強力な結果が得られる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:47:20 GMT)
A Systematic Review of Generalization Research in Medical Image Classification [36.3]
本稿では,Deep Learning(DL)に基づく分類モデルのための既存の領域一般化手法について検討する。それは彼らが解決しようとしているシフトタイプに基づいた分類法を提案する。本研究の結果から,両タイプの学習手法が出現していることが示唆された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:27:07 GMT)
StuGPTViz: A Visual Analytics Approach to Understand Student-ChatGPT Interactions [35.9]
本稿では、学生のプロンプトの時間パターンとChatGPTの応答の質を複数のスケールで追跡・比較する視覚分析システム、StuGPTVizを提案する。その結果、StuGPTVizがChatGPTの教育的価値に対する教育者の洞察を高める能力があることが確認された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:32:02 GMT)
Multi-modal Generative Models in Recommendation System [34.5]
多くのレコメンデーションシステムは、ユーザ入力をテキスト文字列やクリックや購入などの行動信号に制限する。生成AIの出現により、ユーザーはより豊富なレベルのインタラクションを期待するようになった。今後のレコメンデーションシステムは、製品に対するマルチモーダルな理解の恩恵を受けるだろう、と我々は主張する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:55:50 GMT)
Progressive Entropic Optimal Transport Solvers [33.8]
本稿では,計画図と輸送地図の両方を推定できる新しいEOT解法(ProgOT)を提案する。我々は,ProgOTが標準解法よりも高速で堅牢な代替手段であることを示す実験的な証拠を提供する。また、最適な輸送地図を推定するためのアプローチの統計的整合性も証明する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:49:24 GMT)
Chain-of-Thought Prompting for Speech Translation [33.8]
大規模言語モデル(LLM)は言語理解と生成において顕著な進歩を見せている。近年の研究では、これらのモデルを音声埋め込みに応用し、高い性能を示す音声-LLMモデルを実現している。本稿では,エンコーダ-デコーダテキスト LLM 上に構築された音声-LLM において,AST のプロンプトとして ASR 転写を利用する新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:16:43 GMT)
Fair Anomaly Detection For Imbalanced Groups [33.6]
不均衡シナリオを対象としたフェアネスを考慮した異常検出手法であるFairADを提案する。フェアネスを意識したコントラスト学習モジュールと、フェアネスを確保し、不均衡なデータ問題に対処するリバランシングオートエンコーダモジュールで構成されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:38:45 GMT)
MM2Latent: Text-to-facial image generation and editing in GANs with multimodal assistance [32.7]
マルチモーダル画像生成と編集のための実践的なフレームワークMM2Latentを提案する。画像生成にはStyleGAN2を使用し,テキスト符号化にはFaRLを使用し,マスクやスケッチ,3DMMなどの空間変調のためのオートエンコーダを訓練する。提案手法は,近年のGAN法や拡散法を超越したマルチモーダル画像生成において,優れた性能を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:21:07 GMT)
ES-GNN: Generalizing Graph Neural Networks Beyond Homophily with Edge Splitting [32.7]
本稿では,学習タスクに関係のないグラフエッジを適応的に識別する新しいエッジ分割GNN(ES-GNN)フレームワークを提案する。本稿では,ES-GNNを非交叉グラフ記述問題の解とみなすことができることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:51:55 GMT)
Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis [32.5]
大規模言語モデルのアンラーニングは、セキュリティとプライバシの懸念に対処する可能性から、注目を集めている。この研究の多くは、機密コンテンツを含む事前定義されたインスタンスの削除を対象とする、インスタンスレベルの未学習に集中している。本稿では,対象モデルからエンティティ関連知識を完全に消去することを目的とした,エンティティレベルのアンラーニングという新しいタスクを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:00:10 GMT)
HLTCOE JHU Submission to the Voice Privacy Challenge 2024 [31.9]
音声プライバシチャレンジのためのシステムをいくつか紹介する。音声変換システムは感情的コンテンツをよりよく保存するが、半ホワイトボックス攻撃のシナリオでは話者の身元を隠すのに苦労している。本稿では,2種類のシステムの強みと弱みのバランスをとるために,ランダムな混合システムを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:39:44 GMT)
Self-Translate-Train: Enhancing Cross-Lingual Transfer of Large Language Models via Inherent Capability [31.0]
自己翻訳-トレイン(Self-Translate-Train)は、大規模言語モデルがトレーニングデータをターゲット言語に翻訳し、自身の生成されたデータに基づいてモデルを微調整する手法である。自己翻訳-トレインがゼロショット転送より優れていることを示すことによって、LLMの言語間機能を引き出すためのより良い手法のさらなる探索を奨励する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:04:22 GMT)
Enhancing Multilingual Speech Generation and Recognition Abilities in LLMs with Constructed Code-switched Data [31.0]
本論文では,MutltiLingual MultiTask (MLMT)モデルを提案する。我々は,異なる言語からの単語を分割し,CSデータに頼ることなくCS能力を備えた合成を行う,効果的なデータ構築手法を開発した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:11:07 GMT)
Temporal As a Plugin: Unsupervised Video Denoising with Pre-Trained Image Denoisers [31.0]
本稿では,TAP (Temporal As aTAP) という,教師なしのビデオデノベーションフレームワークを提案する。時間的加群を組み込むことで、ノイズの多いフレームをまたがる時間的情報を活用することができ、空間的 denoising のパワーを補完することができる。他の教師なしビデオ復号化手法と比較して,本フレームワークは,SRGBと生ビデオ復号化データセットの両方において優れた性能を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:05:33 GMT)
A Dataset and Benchmark for Shape Completion of Fruits for Agricultural Robotics [30.5]
本稿では,農業用視覚システムのための3次元形状補完データセットを提案する。果実の3次元形状を推定するためのRGB-Dデータセットを提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:16:57 GMT)
Gradient-free Post-hoc Explainability Using Distillation Aided Learnable Approach [30.3]
本稿では, モデル勾配自由アプリケーションにおいて, 塩分濃度に基づく説明を生成しようとする, 蒸留支援説明可能性 (DAX) の枠組みを提案する。 DAXアプローチは、マスク生成ネットワークと蒸留ネットワークを備えた学習可能な環境における説明の問題を引き起こす。様々なモード(画像と音声)のDAXを、多様な評価セットを用いて分類設定で広範囲に評価する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:21:11 GMT)
OSV: One Step is Enough for High-Quality Image to Video Generation [29.8]
一貫性蒸留とGANトレーニングを効果的に組み合わせた2段階トレーニングフレームワークを提案する。また,ビデオラテントを復号化する必要のない新しいビデオ識別器の設計を提案する。本モデルでは,高画質映像を1ステップで生成可能であり,多段精細化の柔軟性が期待できる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:16:37 GMT)
Linguistic Bias in ChatGPT: Language Models Reinforce Dialect Discrimination [29.2]
ChatGPTは、英語の10の方言(Standard American English、Standard British English、および世界中で広く話されている8つの非標準品種)をカバーしている。 GPT-3.5 Turbo と GPT-4 を各品種の母語話者のテキストで誘導し,言語的特徴アノテーションと母語話者評価を用いて応答を解析した。 GPT-3.5 Turbo と GPT-4 は,非標準型話者に対する言語識別を永続的に行うことができる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:29:50 GMT)
GenQ: Quantization in Low Data Regimes with Generative Synthetic Data [28.8]
我々は、高度な生成AIモデルを用いて高分解能合成データを生成する新しいアプローチであるGenQを紹介する。データの可用性が限られている場合、実際のデータは合成データ生成プロセスのガイドに使用される。厳密な実験を通じて、GenQはデータフリーおよびデータスカース量子化の新しいベンチマークを確立する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:49:21 GMT)
TTT-Unet: Enhancing U-Net with Test-Time Training Layers for biomedical image segmentation [28.2]
TTT-Unetは、テストタイムトレーニング層をバイオメディカルイメージセグメンテーションのための従来のU-Netアーキテクチャに統合する新しいフレームワークである。 TTT-Unetは,CTおよびMR画像における3次元腹部臓器の分画,内視鏡画像における計器の分画,顕微鏡画像における細胞分画など,複数の医用画像データセット上で評価される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:52:40 GMT)
Scalable Private Search with Wally [27.4]
Wallyは、大規模なデータベースに対する効率的なセマンティック検索とキーワード検索クエリをサポートするプライベート検索システムである。従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。それぞれのクライアントにいくつかの偽のクエリを追加し、匿名ネットワーク経由でサーバに送信することで、これらの結果が得られます。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:25:42 GMT)
Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse [27.3]
RAGフレームワークにおけるLCMの信頼性を総合的に評価する新たな指標であるTrust-Scoreを導入する。本研究では,LLMをRAGタスクに効果的に適応させるには,文脈内学習などの様々なプロンプト手法が不十分であることを示す。我々は,LLMをより高い信頼スコアに整合させるフレームワークであるTrust-Alignを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:47:33 GMT)
Mind the Uncertainty in Human Disagreement: Evaluating Discrepancies between Model Predictions and Human Responses in VQA [27.0]
本研究は,視覚質問応答(VQA)タスクに焦点をあてる。視覚言語モデルが人間の反応の分布とどのように相関するかを評価する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:44:25 GMT)
OmniGen: Unified Image Generation [26.4]
我々は統合画像生成のための新しい拡散モデルであるOmniGenを紹介する。一般的な拡散モデル(例えば、安定拡散)とは異なり、OmniGen は ControlNet IP-Adapter のような追加モジュールを必要としない。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:42:46 GMT)
SpMis: An Investigation of Synthetic Spoken Misinformation Detection [26.2]
我々は,オープンソースのデータセットであるSpMisを導入して,合成音声誤情報検出の初期研究を行う。 SpMisには、5つの共通トピックにわたる1,000人以上の話者から合成された音声が含まれており、最先端のテキスト音声システムを利用している。以上の結果から,有望な検出能力を示すとともに,実装上の課題も明らかにした。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:05:09 GMT)
AMEGO: Active Memory from long EGOcentric videos [26.0]
非常に長いエゴセントリックなビデオの理解を深めるための新しいアプローチであるAMEGOを紹介する。 AMEGOは、人間が単一の視聴から情報を維持する能力に触発され、一つの自我中心のビデオから自己完結した表現を構築することに焦点を当てる。この表現はセマンティックフリーであり、視覚的コンテンツ全体を再処理することなく、複数のクエリを容易にする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:18:47 GMT)
Larger Language Models Don't Care How You Think: Why Chain-of-Thought Prompting Fails in Subjective Tasks [25.6]
In-Context Learning (ICL) in Large Language Models (LLM) が自然言語処理の主流の手法として登場した。 ICLはタスク先行の検索に大きく依存しており、タスクを実行するための"学習"は少なくなっている。驚くべきことに、CoT(Chain-of-Thought)は、大きな言語モデルではICLと同じ後方崩壊に悩まされている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:42:26 GMT)
ULOC: Learning to Localize in Complex Large-Scale Environments with Ultra-Wideband Ranges [25.2]
我々はUWB(Ultra-Wideband)に基づくローカライゼーションのためのULOCという学習ベースのフレームワークを提案する。まず、アンカーは実際の位置を知ることなく環境に展開される。そこで我々は,複雑な大規模環境下でUWBの帯域幅パターンを学習するMAMBAに基づくネットワークを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:20:46 GMT)
EmoBack: Backdoor Attacks Against Speaker Identification Using Emotional Prosody [25.1]
話者識別(SI)は、話者の発話に基づいて話者の身元を決定する。これまでの研究は、SIディープニューラルネットワーク(DNN)がバックドア攻撃に対して脆弱であることを示している。これは、SI DNNのバックドア攻撃に対する脆弱性を、話者の感情的韻律を用いて探求する最初の作品である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:29:05 GMT)
KALE: An Artwork Image Captioning System Augmented with Heterogeneous Graph [24.6]
本稿では,アートワーク開発のための知識付加型視覚言語モデルを提案する。 KALEはメタデータを2つの方法で組み込む: 第一に直接テキスト入力、第二にマルチモーダルなヘテロジニアス知識グラフである。実験結果から,KALEは複数のアートデータセットにまたがる既存の最先端の作業に対して高い性能を発揮することが示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:39:18 GMT)
High-Resolution Speech Restoration with Latent Diffusion Model [24.4]
複数の歪みを扱う生成モデルは、電話の再構成や高周波高調波にしばしば苦労する。複数の歪みを除去し、音声記録をスタジオ品質に復元する潜在拡散に基づく新しい生成モデルであるHi-ResLDMを提案する。我々は、GANとCFM(Conditional Flow Matching)コンポーネントを活用する最先端手法に対してHi-ResLDMをベンチマークし、高周波帯域の詳細を再生する際の優れた性能を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:55:23 GMT)
Few-Shot Domain Adaptation for Learned Image Compression [24.4]
学習された画像圧縮(lic)は、最先端の速度歪み性能を達成した。 licモデルは通常、トレーニング外領域のイメージに適用した場合、大幅なパフォーマンス劣化に悩まされる。プレトレーニングモデルにプラグイン・アンド・プレイアダプタを組み込むことにより, lic の領域適応手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:05:29 GMT)
Leveraging Symmetry to Accelerate Learning of Trajectory Tracking Controllers for Free-Flying Robotic Systems [24.4]
トラッキングコントローラにより、ロボットシステムは計画された基準軌道を正確に追従することができる。本研究では,フローティングベースを持つロボットシステムの固有リー群対称性を活用して,トラッキングコントローラの学習における課題を軽減する。その結果,対称性を意識したアプローチはトレーニングを加速し,同一のトレーニングステップの後に追跡誤差を減少させることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:39:24 GMT)
SplatFields: Neural Gaussian Splats for Sparse 3D and 4D Reconstruction [24.3]
3Dガウススティング(3DGS)は実用的でスケーラブルな再構築手法として登場した。暗黙的ニューラルネットワークの出力としてモデル化することで,スプレート特徴を効果的に正規化する最適化手法を提案する。当社のアプローチは,異なるセットアップやシーンの複雑さをまたいだ広範なテストによって実証されるような,静的および動的ケースを効果的に処理する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:04:20 GMT)
Next-token prediction capacity: general upper bounds and a lower bound for transformers [24.3]
本稿では,デコーダのみの変換器がコンテキストシーケンスに対して次トーケン分布を補間可能であることを示す。暗記のための最小限のパラメータは、エントロピー下界へのモデルを訓練するのに十分であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:13:09 GMT)
Evaluating language models as risk scores [23.8]
言語モデルを用いてリスクスコアを生成するソフトウェアパッケージであるフォークテキストを紹介する。フレキシブルなAPIは、異なるプロンプトスキーム、ローカルまたはWebホストモデル、多様な国勢調査コラムの使用を可能にする。複数選択質問応答によるゼロショットリスクスコアは高い予測信号を持つが、広く誤校正されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:03:18 GMT)
Dynamical topological phase transition in cold Rydberg quantum gases [23.4]
マイクロ波駆動下での低温リドバーグ原子ガス中の動的トポロジカル相転移の実験的観察を報告する。曲がり角が反転する遷移状態において、これらの軌道の位相はより非自明な構造へと進化する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:59:36 GMT)
Learning by Self-Explaining [23.4]
我々は、自己説明による学習(LSX)と呼ばれる画像分類の文脈において、新しいワークフローを導入する。 LSXは、自己修復型AIと人間誘導型説明機械学習の側面を利用する。本結果は,自己説明による学習による改善を,いくつかのレベルで示すものである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:24:49 GMT)
Multi-Document Grounded Multi-Turn Synthetic Dialog Generation [22.7]
本稿では,3つの主要なアイデアを取り入れたマルチドキュメント・グラウンド・マルチターン合成ダイアログ生成手法を提案する。我々は,Chain-of-Thoughtプロンプトによって生成される分類に基づくユーザクエリを用いて,ダイアログ全体のフローを制御する。我々は,複数文書の接地ダイアログの生成を支援する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:02:39 GMT)
Unleashing the Potential of Mamba: Boosting a LiDAR 3D Sparse Detector by Using Cross-Model Knowledge Distillation [22.7]
FASDと呼ばれる高速LiDAR3Dオブジェクト検出フレームワークを提案する。高速シーケンスモデリングのための変換器のキャパシティをFLOPの低いMambaモデルに蒸留し,知識伝達による精度の向上を実現することを目的とする。我々は,データセットとnuScenesのフレームワークを評価し,リソース消費の4倍の削減と,現在のSoTA手法よりも1-2%の性能向上を実現した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:30:43 GMT)
Towards flexible perception with visual memory [22.6]
ニューラルネットワークのトレーニングはモノリシックな取り組みであり、知識を石に彫ることに似ている。我々は、ディープニューラルネットワークの表現力とデータベースの柔軟性を組み合わせることで、シンプルで魅力的な代替手段を探究する。私たちは、以下の重要な機能を持つシンプルで柔軟なビジュアルメモリを構築します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:35:04 GMT)
Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey [22.5]
優先度調整は、深層生成モデルと人間の嗜好を整合させる重要なプロセスである。この調査は、最近の嗜好調整の進歩と人間のフィードバックの統合を概観するものである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:28:51 GMT)
AraDiCE: Benchmarks for Dialectal and Cultural Capabilities in LLMs [22.1]
本稿ではアラビア方言と文化評価のベンチマークであるAraDiCEを紹介する。湾岸地域、エジプト地域、レバント地域の文化意識を評価するために設計された最初のきめ細かいベンチマーク。本研究で検証した方言翻訳モデルとベンチマークをリリースする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:59:25 GMT)
Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling [22.1]
オープンな回答を持つテキスト生成のための幻覚検出はより困難である。外部資源のない長いテキストにおける幻覚の検出に関する最近の研究は、一貫性の比較を行っている。テキスト生成のためのグラフベースの文脈認識(GCA)幻覚検出を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:38:36 GMT)
PSFHS Challenge Report: Pubic Symphysis and Fetal Head Segmentation from Intrapartum Ultrasound Images [21.0]
第26回医用画像コンピューティング・コンピュータ支援介入国際会議(MICCAI 2023)に先立ち、公衆衛生・胎児頭に関するグランドチャレンジ(PSFHS)が開催された。この課題は、国際規模での自動セグメンテーションアルゴリズムの開発を強化することを目的としており、5,101個のパルタ内超音波画像でこれまでで最大のデータセットを提供する。このアルゴリズムは、パルタ内超音波画像から自動PSFHSの最先端性を向上した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:24:34 GMT)
GenCRF: Generative Clustering and Reformulation Framework for Enhanced Intent-Driven Information Retrieval [20.8]
我々は,多種多様な意図を適応的に捉えるための生成クラスタリング・改革フレームワークGenCRFを提案する。我々はGenCRFが,nDCG@10で従来のクエリ修正SOTAを最大12%上回り,最先端のパフォーマンスを実現していることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:59:32 GMT)
RING#: PR-by-PE Global Localization with Roto-translation Equivariant Gram Learning [20.7]
GPS信号が信頼できない場合、グローバルなローカライゼーションは自動運転やロボティクスの応用において不可欠である。ほとんどのアプローチは、逐次位置認識(PR)とポーズ推定(PE)により、グローバルなローカライゼーションを実現する。ポーズ推定から直接導出することで、別の場所認識の必要性を回避できる新しいパラダイムであるPR-by-PEローカライゼーションを導入する。本稿では,鳥眼視(BEV)空間で動作する終端PR-by-PEローカライゼーションネットワークであるRING#を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:26:49 GMT)
Recycling Scraps: Improving Private Learning by Leveraging Intermediate Checkpoints [20.5]
本研究では,DP ML 手法の精度を高めるために,中間チェックポイントの集約を用いた一般的なフレームワークを設計する。我々は,StackOverflow,CIFAR10,CIFAR100データセットの既存の最先端データに対して,集約によるトレーニングによって予測精度が大幅に向上できることを実証した。本手法は,プロプライエタリなpCVRタスクにおいて,実用性および分散性の観点から0.54%と62.6%の相対的な改善を実現する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:19:09 GMT)
Learning Source Disentanglement in Neural Audio Codec [20.3]
我々は、音源符号化と音源分離を組み合わせた新しいアプローチである、ソース分散ニューラルオーディオコーデック(SD-Codec)を紹介する。 SD-Codecは、音声の合成と分離を共同で学習することで、異なるドメインからの音声信号を異なるコードブック(離散表現の集合)に明示的に割り当てる。実験結果から,SD-Codecは競合的再合成品質を維持するだけでなく,分離結果に支えられ,潜伏空間における異なるソースの絡み合いが成功したことが示唆された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:21:02 GMT)
GS-Net: Generalizable Plug-and-Play 3D Gaussian Splatting Module [20.0]
粗いSfM点雲からガウス楕円体を密度化する3DGSモジュールであるGS-Netを提案する。実験により、GS-Netを3DGSに適用すると、従来の視点では2.08dB、新しい視点では1.86dBのPSNR改善が得られることが示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:03:19 GMT)
Leveraging vision-language models for fair facial attribute classification [19.9]
汎用視覚言語モデル(英: General-purpose Vision-Language Model, VLM)は、共通感性属性のための豊富な知識源である。我々は,VLM予測値と人間定義属性分布の対応関係を解析した。複数のベンチマークの顔属性分類データセットの実験は、既存の教師なしベースラインよりもモデルの公平性の向上を示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:02:16 GMT)
Flash STU: Fast Spectral Transform Units [19.9]
本稿では、スペクトル変換ユニットの効率的でオープンソースのPyTorch実装について述べる。本研究では,言語,ロボット工学,シミュレートされた力学系を含むいくつかのモードにおけるシーケンス予測タスクについて検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:01:14 GMT)
RenderWorld: World Model with Self-Supervised 3D Label [19.9]
視覚のみのエンドツーエンド自動運転フレームワークであるRenderWorldを提案する。自己監督型ガウス型Img2Occモジュールを用いて3次元占有ラベルを生成する。 AM-VAEによってラベルを符号化し、予測と計画に世界モデルを使用する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:00:52 GMT)
Remote Keylogging Attacks in Multi-user VR Applications [19.8]
この研究は、マルチユーザーVRアプリケーションにおいて重大なセキュリティ上の脅威を浮き彫りにしている。本稿では,敵のゲームクライアントから収集したアバターレンダリング情報を利用してユーザ型秘密を抽出するリモートアタックを提案する。我々は攻撃の有効性を検証するためにユーザスタディを行い、攻撃は97.62%のキーストロークを推測した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:33:56 GMT)
SeFlow: A Self-Supervised Scene Flow Method in Autonomous Driving [18.9]
連続したLiDARスキャンで各点における3次元運動を予測する。現在の最先端の手法は、シーンフローネットワークをトレーニングするために注釈付きデータを必要とする。本研究では,効率的な動的分類を学習に基づくシーンフローパイプラインに統合するSeFlowを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:47:53 GMT)
Semformer: Transformer Language Models with Semantic Planning [18.8]
次世代の予測は、現在のニューラルネットワークモデルの主要なコンポーネントである。本稿では,応答のセマンティックプランニングを明示的にモデル化したトランスフォーマー言語モデルのトレーニング手法であるSemformerを紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:54:34 GMT)
Generalized Few-Shot Semantic Segmentation in Remote Sensing: Challenge and Benchmark [18.6]
ほとんどショットのセマンティックセグメンテーションは、訓練中に見られない新しいクラスのラベル付き例から学ぶことをディープラーニングモデルに促す。一般化された数ショットセグメンテーション設定では、モデルが新しいクラスに適応するだけでなく、トレーニングベースクラスで強力なパフォーマンスを維持することを奨励する追加の課題がある。一般化された数ショット評価設定のためにラベル付けされた追加クラスを備えたOpenEarthMapの拡張データセットをリリースする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:20:47 GMT)
Partially Observable Contextual Bandits with Linear Payoffs [18.6]
我々は、部分的に観測可能で相関したコンテキストと線形ペイオフを持つ新しい帯域設定を考える。本稿では,EMKF-Banditというアルゴリズムパイプラインを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:47:04 GMT)
Quantum Machine Learning for Semiconductor Fabrication: Modeling GaN HEMT Contact Process [18.4]
本稿では,GaN高電子移動トランジスタ(HEMT)におけるOhmic接触過程のモデリングにおける量子機械学習(QML)の利用の先駆者となる。 2レベルZZ-Feature Mapを用いた量子カーネルベースの回帰器(QKR)を開発した。従来の6つの機械学習モデル(CML)と比較して、我々のQKRは一貫して最低平均絶対誤差(MAE)、平均二乗誤差(MSE)、ルート平均二乗誤差(RMSE)を示した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:44:49 GMT)
Diversity-grounded Channel Prototypical Learning for Out-of-Distribution Intent Detection [18.3]
本研究では,大規模言語モデル(LLM)のための新しい微調整フレームワークを提案する。ダイバーシティグラウンドのプロンプトチューニング手法を用いて,各IDクラスのセマンティックプロトタイプを構築した。徹底的な評価のために,本手法を一般的な微調整手法と比較した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:07:17 GMT)
Towards No-Code Programming of Cobots: Experiments with Code Synthesis by Large Code Models for Conversational Programming [18.3]
LLM(Large Language Models)は、対話型コード生成のためのコンテキスト内学習を行うように設計されている。本研究は,テキスト中の実例から,このようなコードを合成するための最先端のLLMの性能を評価する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:04:50 GMT)
Surveying the MLLM Landscape: A Meta-Review of Current Surveys [17.4]
MLLM(Multimodal Large Language Models)は、人工知能分野における変革の原動力となっている。本研究の目的は,MLLMのベンチマークテストと評価方法の体系的レビューを提供することである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:35:38 GMT)
AACessTalk: Fostering Communication between Minimally Verbal Autistic Children and Parents with Contextual Guidance and Card Recommendation [17.3]
タブレットベースのAI通信システムであるAACessTalkについて述べる。 MVAの子供と親との有意義な交換を促進する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:16:16 GMT)
Counterfactual contrastive learning: robust representations via causal image synthesis [17.3]
CF-SimCLRは、正のペア生成に近似した反現実的推論を利用する対実的コントラスト学習手法である。 CF-SimCLRは, 配当データと配当データの両方において, 下流性能を向上し, 買収シフトを大幅に改善することを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:25:18 GMT)
Clustering with Non-adaptive Subset Queries [16.7]
クエリ $S の部分集合 U$, $|S|=2$ が与えられたとき、オラクルは、ポイントが同じクラスタにあり、そうでなければ、イエスを返す。ペアワイズクエリを用いた適応アルゴリズムでは、必要なクエリの数は$Theta(nk)$であることが知られている。非適応スキームは$Omega(n2)$クエリを必要とするが、これは全ての点を問合せすることで得られる自明な$O(n2)$上限と一致する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:56:07 GMT)
Linear Recency Bias During Training Improves Transformers' Fit to Reading Times [16.6]
本稿では,アテンションスコアに付加される電流バイアスであるALiBiを用いたTransformerモデルの変更について検討する。 ALiBiのスロープの混合 -- 各アテンションヘッドのメモリ減衰率を決定する -- は、ALiBiのモデルがさまざまな言語的依存関係を追跡するのを助ける役割を果たす可能性がある。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:57:51 GMT)
Beyond Relevance: Improving User Engagement by Personalization for Short-Video Search [16.5]
我々は,ショートビデオ検索をパーソナライズするための新鮮で包括的なソリューションである$textPR2$を紹介した。具体的には、$textPR2$はクエリ関連コラボレーティブフィルタリングとパーソナライズされた高密度検索を利用する。私たちは近年,ユーザエンゲージメントの改善を最も目覚ましいものにしています。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:37:51 GMT)
An Overview of Machine Learning-Enabled Optimization for Reconfigurable Intelligent Surfaces-Aided 6G Networks: From Reinforcement Learning to Large Language Models [16.4]
RIS支援6Gネットワークに対する機械学習(ML)対応最適化の概要について述べる。既存の研究と異なり、大規模言語モデル(LLM)がRLとどのように組み合わせてネットワーク最適化問題に対処できるかをさらに議論する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:57:36 GMT)
Versatile Incremental Learning: Towards Class and Domain-Agnostic Incremental Learning [16.3]
インクリメンタルラーニング(IL)は、逐次入力タスクから知識を蓄積することを目的としている。私たちはVersatile Incremental Learning (VIL) という,より挑戦的で現実的で,未探索のILシナリオを考えています。 Incremental with Shift cONtrol (ICON) という,シンプルで効果的なILフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:44:28 GMT)
AI Suggestions Homogenize Writing Toward Western Styles and Diminish Cultural Nuances [16.3]
本稿では,西洋中心のAIモデルが,異なる文化的背景を持つユーザに対して提案書を提示した場合に何が起こるかを検討する。インドと米国からの参加者118名を対象に、異文化間制御実験を行った。分析の結果、AIはインド人に比べて、アメリカ人の効率が向上したことがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:07:30 GMT)
Identifying Influential nodes in Brain Networks via Self-Supervised Graph-Transformer [16.3]
本稿では,グラフ変換器(SSGR-GT)をベースとした自己教師付きグラフ再構成フレームワークを提案する。得られたI-nodeは, 上前頭葉, 側頭頂葉, 後頭葉などの重要な部位に分布し, 合計56。これらのIノードは、他の領域よりも多くの脳ネットワークに関与し、繊維接続が長く、構造接続においてより中心的な位置を占める。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:31:28 GMT)
Robust Multimodal Learning with Missing Modalities via Parameter-Efficient Adaptation [16.2]
本稿では,事前学習型マルチモーダルネットワークに対するシンプルでパラメータ効率の良い適応手法を提案する。このような適応は、モダリティの欠如による性能低下を部分的に補うことができることを示す。提案手法は,様々なタスクやデータセットにまたがる汎用性を実証し,モダリティの欠如による頑健なマルチモーダル学習法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:16:42 GMT)
ExploreSelf: Fostering User-driven Exploration and Reflection on Personal Challenges with Adaptive Guidance by Large Language Models [15.9]
We present ExploreSelf, a LLM-driven application designed to empower users to control their reflective journey。以上の結果から,参加者は指導的支援と行動の自由のバランスに重きを置いていることがわかった。本研究は, ユーザエンパワーメントを効果的に促進するLCM駆動型ツールの設計の意義を考察する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:44:34 GMT)
MHS-STMA: Multimodal Hate Speech Detection via Scalable Transformer-Based Multilevel Attention Framework [15.6]
本稿では,変換器を用いたマルチレベルアテンション(STMA)と呼ばれるマルチモーダルヘイトコンテンツ検出のためのスケーラブルアーキテクチャを提案する。それは、注意に基づく深層学習機構、視覚的注意機構エンコーダ、キャプション的注意機構エンコーダの3つの主要な部分で構成されている。 Hateful memes、MultiOff、MMHS150Kといった3つのヘイトスピーチデータセットに対する複数の評価基準を用いて、提案されたアーキテクチャの有効性を検証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:50:45 GMT)
The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection [15.5]
本稿では,高齢者の幸福感向上を目的としたスマートホームアプリケーションのための音声イベント検出研究を支援する住宅用オーディオデータセットを提案する。このデータセットは、55～80歳の家庭で7日間の音声記録システムを構築して構築される。事前訓練された音声ニューラルネットワークを用いて、音声を含むセグメントを検出し、除去する新しい音声除去パイプラインを開発した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:10:36 GMT)
CUNSB-RFIE: Context-aware Unpaired Neural Schr"{o}dinger Bridge in Retinal Fundus Image Enhancement [15.4]
網膜画像強調のための画像から画像への変換パイプラインを提案する。眼底画像強調フレームワークCUNSB-RFIE (Context-aware Unpaired Neural Schr"odinger Bridge) を命名した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:07:29 GMT)
Contrasformer: A Brain Network Contrastive Transformer for Neurodegenerative Condition Identification [15.2]
本稿では,新しいコントラスト型脳ネットワークトランスであるContrasformerを提案する。サブポピュレーション間の分布シフトに対処するために、事前知識付きコントラストグラフを生成する。コントラストフォーマーは、最大10.8%の精度向上によって、脳ネットワークの最先端の手法より優れている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:26:02 GMT)
NCT-CRC-HE: Not All Histopathological Datasets Are Equally Useful [15.1]
本稿では,NCT-CRC-HE-100Kの大腸癌データセットの解析を行った。このデータセットと得られた結果の両方が、データ固有のバイアスの影響を受けている可能性がある。画像あたりの3つの特徴しか使用していない最も単純なモデルでさえ、この9クラスデータセットで50%以上の精度を示すことができる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:36:03 GMT)
Can Many-Shot In-Context Learning Help LLMs as Evaluators? A Preliminary Empirical Study [14.9]
大規模言語モデル(LLM)における潜在的なバイアスを軽減するために,評価者を支援するため,多発性ICLプロンプトを2つ検討した。設計したプロンプトに基づいて,テキスト内サンプルのスケーリングが評価結果の一貫性と品質に与える影響について検討する。 GPT-4oのような高度なLCMは、ゼロショット方式よりも多ショット方式の方が優れていることを示す実験結果が得られた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:04:27 GMT)
COBIAS: Contextual Reliability in Bias Assessment [14.6]
大規模言語モデル(LLM)は、トレーニング対象のWebデータからバイアスを受け取り、ステレオタイプや偏見を含むことが多い。これらのバイアスを評価し緩和するための現在の手法はバイアスベンチマークデータセットに依存している。本稿では,モデルが現れる可能性のあるさまざまなコンテキストを考慮し,モデルロバスト性を偏りのある文に評価するコンテキスト信頼性フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:24:42 GMT)
Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMs [14.5]
MLLMの効率向上を目的とした新しい手法であるTRIM(CLIP Metric)を導入する。視覚質問応答(VQA)タスクにおける人間の注意パターンにインスパイアされたTRIMは、画像トークンの選択と縮小について、新たな視点を示す。その結果,一貫した性能を維持しながら計算オーバーヘッドを著しく低減した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:56:27 GMT)
Integrating Reinforcement Learning and Model Predictive Control with Applications to Microgrids [14.4]
本研究では,強化学習とモデル予測制御(MPC)を統合し,混合力学系における最適制御問題の解法を提案する。提案手法は, MPC手法のオンライン計算時間を著しく短縮し, 最適性ギャップが小さく, 実現可能性が高いポリシーを生成する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:17:16 GMT)
ShapeAug++: More Realistic Shape Augmentation for Event Data [14.2]
ランダムに生成された多角形と曲面運動を含むShapeAugの拡張版を提案する。複数のDVS分類データセットにおいて,提案手法の優位性を示し,トップ1の精度を最大3.7%向上させた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:05:53 GMT)
BoViLA: Bootstrapping Video-Language Alignment via LLM-Based Self-Questioning and Answering [14.2]
自己調査と回答を通じて,学習中の質問サンプルを増強する自己学習フレームワークであるBoViLAを提案する。我々は,不確実性を推定し,自己生成質問の品質を評価するために,Evidential Deep Learning (EDL)を導入した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:17:37 GMT)
Retinal Vessel Segmentation with Deep Graph and Capsule Reasoning [14.2]
本稿では,CNNにカプセル畳み込みをマージして局所的特徴とグローバル的特徴の両方をキャプチャするGraph Capsule Convolution Network (GCC-UNet)を提案する。我々のアプローチは広く使われている公開データセットの実験を通じて厳格に検証され、アブレーション研究は各コンポーネントの有効性を確認している。特に、この研究は、医療画像セグメンテーションの領域におけるバニラ、グラフ、カプセル畳み込み技術の最初の統合である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:22:29 GMT)
Efficient and Personalized Mobile Health Event Prediction via Small Language Models [14.0]
SLM(Small Language Models)は、プライバシーと計算の問題を解決するための候補である。本稿では、ステップ、カロリー、睡眠時間、その他の重要な統計データなどの健康データを正確に分析する能力について検討する。以上の結果から,SLMはウェアラブルやモバイルデバイス上でリアルタイムの健康モニタリングに活用できる可能性が示唆された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:57:57 GMT)
OATH: Efficient and Flexible Zero-Knowledge Proofs of End-to-End ML Fairness [14.0]
Zero-Knowledge Proofs of Fairnessは、サービスプロバイダが彼らのモデルが多様な人口動態を公平に提供できることを検証することによって、フェアネスの非準拠に対処する。 OATHはクライアント対面通信とオフライン監査フェーズを効果的にデプロイできるフレームワークである。 OATHは、ニューラルネットワークZKPoFの以前の作業よりも、ランタイムを1343倍改善し、はるかに大きなモデルにスケールアップする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:00:35 GMT)
Investigating Context-Faithfulness in Large Language Models: The Roles of Memory Strength and Evidence Style [14.0]
記憶力とエビデンス提示が外的エビデンスに対するLarge Language Modelsの受容性に及ぼす影響について検討する。メモリの強度が高い問題では、特に GPT-4 のようなより大きな LLM では LLM は内部メモリに依存しやすい。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:44:06 GMT)
Enhancing Low-Resource Language and Instruction Following Capabilities of Audio Language Models [13.9]
本稿では,タイ語を用いた未保存言語における既存の音声言語モデルの性能について検討する。多言語バックボーン上に構築されているにもかかわらず、音声言語モデルは言語間の創発能力を示すものではない。本稿では,音声理解と音声指示追従機能を単一統一モデルに統合する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:04:03 GMT)
Entity-Level Sentiment: More than the Sum of Its Parts [13.8]
文レベルでの感情の算術的アグリゲーションとは,エンティティに対する読者の知覚的感情がしばしば異なることを示す。我々のデータセットは、長いテキストでエンティティ固有の感情の複雑さを明らかにします。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:07:01 GMT)
Watt For What: Rethinking Deep Learning's Energy-Performance Relationship [13.5]
深層学習モデルのモデル精度と消費電力のトレードオフについて検討する。使用電力単位当たりの精度を評価することにより、より小型でエネルギー効率の高いモデルが研究を著しく高速化できることを示す。この研究は、より公平な研究環境に寄与し、より小さなエンティティはより大きなエンティティと効果的に競合できる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:30:04 GMT)
Fuse4Seg: Image-Level Fusion Based Multi-Modality Medical Image Segmentation [13.5]
現在の機能レベルの融合戦略は、セマンティックな不整合やミスアライメントを引き起こす傾向がある、と我々は主張する。画像レベルでの融合に基づく新しい医用画像分割法Fuse4Segを提案する。得られた融合画像は、すべてのモダリティからの情報を正確にアマルガメートするコヒーレントな表現である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:35:24 GMT)
Reasoning Graph Enhanced Exemplars Retrieval for In-Context Learning [13.4]
RGER(Reasoning Graph-enhanced Exemplar Retrieval) RGERはグラフカーネルを使用して、意味的および構造的類似性のある例を選択する。数学およびロジット推論タスクにおけるRGERの有効性は、最先端の検索に基づくアプローチよりも優れていることを示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:58:29 GMT)
Can Graph Reordering Speed Up Graph Neural Network Training? An Experimental Study [13.4]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習することができる。グラフのばらつきは、最適以下のメモリアクセスパターンと長いトレーニング時間をもたらす。グラフの並べ替えは、CPUおよびGPUベースのトレーニングのトレーニング時間を削減するのに有効であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:28:02 GMT)
STCMOT: Spatio-Temporal Cohesion Learning for UAV-Based Multiple Object Tracking [13.3]
無人航空機(UAV)ビデオにおける複数物体追跡(MOT)は、コンピュータビジョンにおける多様な用途において重要である。時空間結合型多目的追跡フレームワーク(STCMOT)を提案する。歴史的埋め込み機能を用いて,ReIDの表現と検出機能を逐次的にモデル化する。我々のフレームワークはMOTAとIDF1メトリクスで新しい最先端のパフォーマンスを設定します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:34:18 GMT)
An Empirical Study of Sensitive Information in Logs [13.0]
ソフトウェアログにおける機密情報の存在は、重大なプライバシー上の懸念を生じさせる。この研究は、複数の観点からソフトウェアログのプライバシーを包括的に分析する。当社の調査結果は、ログのプライバシーに関するさまざまな視点に光を当て、業界の課題を明らかにしました。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:12:23 GMT)
Multi-frequency Electrical Impedance Tomography Reconstruction with Multi-Branch Attention Image Prior [12.8]
多周波電気インピーダンストモグラフィ(mfEIT)は有望なバイオメディカルイメージング技術である。現在の最先端(SOTA)アルゴリズムは、教師付き学習と多元計測ベクトル(MMV)に依存しており、広範なトレーニングデータを必要とする。我々は,mfEIT再構成のためのマルチブランチ注意画像優先(MAIP)に基づく新しい教師なし学習手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:06:03 GMT)
RoadRunner M&M -- Learning Multi-range Multi-resolution Traversability Maps for Autonomous Off-road Navigation [12.8]
RoadRunner (M&M) はエンドツーエンドの学習ベースのフレームワークで、さまざまな範囲のトレーバービリティと標高マップを直接予測する。 RoadRunner M&Mは、標高マッピングで最大50%の大幅な改善と、RoadRunner上でのトラバーサビリティ推定で30%の大幅な改善を実現している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:21:03 GMT)
SpatialBot: Precise Spatial Understanding with Vision Language Models [12.7]
視覚言語モデル (VLM) は2次元画像理解において優れた性能を発揮している。彼らはまだ、Embodied AIの基盤である空間的理解に苦戦している。本稿では,RGB画像と深度画像の両方をフィードすることで,空間的理解を向上させるためのSpatialBotを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:13:24 GMT)
MED-VT++: Unifying Multimodal Learning with a Multiscale Encoder-Decoder Video Transformer [12.5]
本稿では,ビデオ中の高密度な予測タスクに着目した,エンドツーエンドのトレーニング可能なマルチスケールエンコーダ・デコーダ変換器を提案する。提示されたMED-VT(Multiscale-Decoder Video)は、ビデオ全体にわたってマルチスケール表現を使用し、ビデオ以外の任意の入力を使用する。本稿では,時間的に一貫したビデオ予測を提供するため,多対多のラベル伝搬によるトランスダクティブ学習方式を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:10:16 GMT)
GlobalMapNet: An Online Framework for Vectorized Global HD Map Construction [12.5]
高精細(HD)マップは自律運転システムに不可欠である。伝統的に、HDマップを構築するために高価で労働集約的なパイプラインが実装されている。我々はベクトル化されたグローバルマップを直接生成するための新しい手法、すなわちグローバルマップ構築を提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:46:21 GMT)
Augmenting Automatic Speech Recognition Models with Disfluency Detection [12.5]
音声の拡散は、会話や自発的な発話でよく起こる。現在の研究は、主に、音声の正確な位置と持続時間を見越して、書き起こし中の不一致を検出することに焦点を当てている。我々は,任意のASRモデルを拡張し,開集合不一致を検出するための推論のみのアプローチを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:30:03 GMT)
SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness Calibration [12.1]
SAGED(-Bias)はこれらの問題に対処する最初の総合的なベンチマークパイプラインである。私たちは、Gemma2、Llama3.1、Mistral、Qwen2など、人気のある8bレベルのモデルでG20諸国でSAGEDを使用しています。感情分析により、MistralとQwen2はGemma2やLlama3.1よりも最大差とバイアス濃度が低いが、すべてのモデルがロシアや(Qwen2を除く)中国に偏っていることが判明した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:03:12 GMT)
Mamba Fusion: Learning Actions Through Questioning [12.1]
ビデオ言語モデル(VLM)は、多様なタスクを一般化し、学習を強化するために言語キューを使用するために不可欠である。本稿では,長距離依存関係を効率的にキャプチャし,視覚と言語データの共同表現を学習する新しいモデルであるMambaVLを紹介する。 MambaVLは、Epic-Kitchens-100データセット上でのアクション認識における最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:36:37 GMT)
A Comprehensive Evaluation of Quantized Instruction-Tuned Large Language Models: An Experimental Analysis up to 405B [11.8]
本稿では、7Bから405Bのモデルにおける命令調整型LLMの性能を評価する。我々は6つのタスクタイプ(常識Q&A、知識と言語理解、指示追従、幻覚検出、数学、対話)のパフォーマンスを評価する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:31:37 GMT)
CORE-Bench: Fostering the Credibility of Published Research Through a Computational Reproducibility Agent Benchmark [11.8]
CORE-Benchは3つの分野(コンピュータ科学、社会科学、医学)にわたる90の科学論文に基づく270のタスクからなるベンチマークである。エージェントの精度を高速かつ並列に測定する評価システムを提案する。最高のエージェントは、最も難しいタスクにおいて21%の精度を達成した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:13:19 GMT)
An Anti-disguise Authentication System Using the First Impression of Avatar in Metaverse [11.8]
本稿では,古い友人を認識するために,物理世界から最初の印象のアイデアを導出するアンチディグライズ認証手法を提案する。具体的には、メタバースの最初のミーティングシナリオを格納し、アバター間の認証を支援するためにリコールする。提案した署名暗号化機構は、セキュリティ要件だけでなく、公衆の検証可能性にも適合する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:37:44 GMT)
Information That Matters: Exploring Information Needs of People Affected by Algorithmic Decisions [11.4]
XAInovice Question Bankは、AI初心者に必要な情報カタログを含むXAI Question Bankの拡張である。「XAInovice Question Bank」には、雇用予測と健康モニタリングの2つのユースケースにおいて、AI初心者に必要な情報のカタログが含まれている。我々の研究は、情報ニーズ、目標、課題を強調することで、説明可能性へのAI初心者の関与を支援することを目的としています。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:08:00 GMT)
Trends, Advancements and Challenges in Intelligent Optimization in Satellite Communication [11.4]
本稿では、衛星通信のインテリジェントな最適化分野における現在の研究の概要について述べる。テキストマイニングに基づく文献レビューを行い,本論文を数学的にクラスタ化し分析した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:01:11 GMT)
Chess Rating Estimation from Moves and Clock Times Using a CNN-LSTM [11.3]
現在の格付けシステムは段階的に格付けを更新し、常にプレイヤーの真の強さを正確に反映するとは限らない。これを解決するために,ゲームの動きや時計時間から直接プレイヤーの格付けを推定する方法を探索する。このモデルは、手作りの機能を使わずにチェスのレーティングを推定し、また、各動きのレーティング予測を出力した最初のモデルである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:19:16 GMT)
Charting the Landscape of Nefarious Uses of Generative Artificial Intelligence for Online Election Interference [11.3]
本稿では,GenAIの悪用を探求し,民主的プロセスの破壊の可能性を明らかにする。悪質な俳優はこれらの技術を利用して有権者の行動に影響を与え、偽情報を広め、選挙制度に対する大衆の信頼を損なう。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:00:36 GMT)
Backdoor Attacks in Peer-to-Peer Federated Learning [11.2]
Peer-to-Peer Federated Learning (P2PFL)は、プライバシと信頼性の両面でアドバンテージを提供する。本稿では,P2PFLに対する新たなバックドア攻撃を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:47:30 GMT)
Leveraging Reviewer Experience in Code Review Comment Generation [11.2]
私たちは、自然言語のコードレビューを提供する際に、人間のレビュアーを模倣するためにディープラーニングモデルを訓練します。生成したレビューの品質は、モデルトレーニングで使用されるオープンソースのコードレビューデータの品質のため、まだ最適化されていない。本稿では,レビュー品質の指標として,過去のレビュアのオーサリングとレビューを活かした経験学習手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:52:50 GMT)
Towards Secure and Usable 3D Assets: A Novel Framework for Automatic Visible Watermarking [11.2]
3Dモデル(特にAI生成モデル)は、エンターテイメントなどさまざまな業界で最近急増している。我々は、透かしの品質と資産性という2つの競合する側面から、3D視覚的な透かしを自動化するための新しいタスクを厳格に定義する。そこで本稿では,任意の3D資産上に配置する適切な位置,向き,個数を自動的に決定する透かしを埋め込む手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:26:09 GMT)
Multi-Microphone and Multi-Modal Emotion Recognition in Reverberant Environment [11.1]
本稿では,難聴時の感情認識精度を高めるために,マルチモーダル感情認識(MER)システムを提案する。提案手法は,マルチチャンネル音声処理のための階層型音声変換器(HTS-AT)とビデオ解析のためのR(2+1)D畳み込みニューラルネットワーク(CNN)モデルを組み合わせたものである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:08:56 GMT)
CountChain: A Decentralized Oracle Network for Counting Systems [11.0]
システムカウントのための分散型オラクルネットワークであるCountChainを提案する。 CountChainでは、データはすべてのオラクルノードから受信され、任意のノードが命題要求を送信できる。 Trueの結果による提案は、スマートコントラクトでカウンタをインクリメントする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:52:44 GMT)
Towards Semantic Versioning of Open Pre-trained Language Model Releases on Hugging Face [11.0]
モデルレジストリプラットフォームにおけるPTLMの現在のリリースプラクティスは、さまざまな不整合に悩まされています。本研究は,52,227個のPTLMを,最もよく知られたモデルレジストリHF上でリリースするための混合手法を用いて解析する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:58:36 GMT)
Exploring ChatGPT-based Augmentation Strategies for Contrastive Aspect-based Sentiment Analysis [10.7]
アスペクトベースの感情分析(ABSA)は、文中の特定の側面の言葉に対する感情を識別する。本稿では,ChatGPTを用いたデータ拡張の可能性を探究し,アスペクトの観点からの感情分類性能を向上する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:12:08 GMT)
Chiral Bell-state transfer via dissipative Liouvillian dynamics [10.7]
例外点近傍の閉ループに沿ったキラル状態移動は、非エルミート物理学における多くの反直観的な観測の1つである。完全量子リウィリア動力学による一重項と三重項ベル状態のキラル状態変換を実証する。ポストセレクションによる量子ジャンプの除去は、当初分離可能な状態からベル状態にほぼ完全であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:46:16 GMT)
SOAP: Improving and Stabilizing Shampoo using Adam [10.6]
この研究はシャンプーとアダファクトの間の公式な関係を確立している。 AdafactorはAdamのメモリ効率の近似である。シャンプーのプレコンディショナーの固有ベイズにおいて,シャンプーがAdafactorを実行することと等価であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:18:05 GMT)
D2Vformer: A Flexible Time Series Prediction Model Based on Time Position Embedding [10.5]
時間位置埋め込みは時間ステップの位置情報をキャプチャし、しばしば時系列モデルの予測能力を高める補助的な入力として機能する。本稿では,予測シーケンスが入力シーケンスに隣接しないシナリオを扱うために,D2Vformerと呼ばれる新しいモデルを提案する。 D2Vformerは、固定長および可変長の予測タスクにおいて最先端のメソッドを超越する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:39:37 GMT)
Edge-based Denoising Image Compression [10.5]
深層学習に基づく画像圧縮は、研究の重要な領域として現れている。本稿では,拡散モデルを用いた新しい圧縮モデルを提案する。我々のモデルは画像の品質と圧縮効率の点で、優れた結果または同等の結果が得られる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:20:26 GMT)
Open-Set Semantic Uncertainty Aware Metric-Semantic Graph Matching [10.4]
オープンセットオブジェクト検出のためのセマンティック不確実性のメトリクスを計算し、オブジェクトレベルの不確実性追跡フレームワークに組み込む。提案手法は,頑健でオープンセット,マルチオブジェクト,セマンティック不確実性を考慮したループクロージャ検出のために,海洋環境におけるリアルタイムな使用を可能にする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:53:47 GMT)
A Joint Spectro-Temporal Relational Thinking Based Acoustic Modeling Framework [10.4]
リレーショナル思考は人間の音声理解において重要な役割を担っているが、人工音声認識システムではまだ活用されていない。本稿では,スペクトル時間的関係思考に基づく音響モデリングフレームワークを提案する。このフレームワーク上に構築されたモデルは、TIMITデータセットよりも7.82%の音素認識タスクを改善した最先端システムを上回っている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:45:33 GMT)
Towards Optimal Branching of Linear and Semidefinite Relaxations for Neural Network Robustness Certification [10.3]
本研究では,ReLUニューラルネットワークの逆入力摂動に対する堅牢性を検証する。入力不確実性集合を分割し,各部分の緩和を個別に解くために,分岐とバウンドのアプローチをとる。提案手法は緩和誤差を低減し,ReLUアクティベーションの性質を活かしたパーティションを用いてLP緩和を行うことによって完全に誤差を除去することを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:15:57 GMT)
Learning-Augmented Frequency Estimation in Sliding Windows [10.3]
我々は、スライディングウインドウアルゴリズムを改善するために機械学習アプローチを利用する方法を示す。我々の研究は、予測器が難易度の高いスライディングウインドウ設定に有用であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:38:48 GMT)
AutoSpec: Automated Generation of Neural Network Specifications [10.2]
学習強化システムにおけるニューラルネットワークの包括的かつ正確な仕様を自動的に生成する最初のフレームワークであるAutoSpecを紹介する。評価の結果,AutoSpecは人間の定義した仕様よりも優れており,本研究で導入された2つのベースラインアプローチが優れていることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:26:17 GMT)
Augment, Drop & Swap: Improving Diversity in LLM Captions for Efficient Music-Text Representation Learning [10.2]
本研究では,鍵となる設計選択が音声-テキストコントラストモデルを用いて学習した音楽-テキスト表現の品質に与える影響について検討する。データキュレーションは、リソース制約のあるシナリオにおいて、音楽テキストのコントラストトレーニングにおいて最も重要な要素である。トレーニングで見られるテキスト入力の多様性と記述性を向上する,Augmented View Dropout と TextSwap という2つの新しい手法を導入する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:00:21 GMT)
EmPO: Emotion Grounding for Empathetic Response Generation through Preference Optimization [9.9]
共感反応生成は会話エージェントの望ましい側面である。感情接地に基づく理論駆動の嗜好データセットを構築する新しい手法を提案する。本研究では,LLMを一般性能を維持しつつ,好みの最適化により共感応答生成に適応させることができることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:24:47 GMT)
GoSurf: Identifying Software Supply Chain Attack Vectors in Go [9.9]
本稿では,Go言語に適した12個の異なる攻撃ベクトルの分類法とそのパッケージライフサイクルを提案する。私たちの研究は、Goエコシステム内のオープンソースのソフトウェアサプライチェーンを確保するための予備的な洞察を提供します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:18:14 GMT)
Vision Mamba for Classification of Breast Ultrasound Images [9.9]
MambaベースのモデルであるVMambaとVimは、最近のビジョンエンコーダのファミリーであり、多くのコンピュータビジョンタスクで有望なパフォーマンス改善を提供する。本稿では,乳房超音波BUSIデータセットと乳房超音波Bデータセットを用いて,マンバモデルと従来の畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)を比較した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:37:16 GMT)
Concentration of Contractive Stochastic Approximation: Additive and Multiplicative Noise [9.8]
我々は,契約演算子の下で近似(SA)によって生成される反復体に対して最大濃度境界を確立する。本稿では,有界乗法雑音を持つ SA と準ガウス加法雑音を持つ SA の2つの条件について考察する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:23:33 GMT)
Online Combinatorial Allocations and Auctions with Few Samples [9.7]
本稿では,O(1)競合アルゴリズムの実現可能性について,基礎となる入札者分布から限られた数のサンプルにしかアクセスできないという現実的な制約の下で検討する。最初の主な貢献は, サブモジュール/XOS評価のためのO(1)競合アルゴリズムを得るのに, 各入札者分布からのサンプルだけで十分であることを示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:43:55 GMT)
When Cars meet Drones: Hyperbolic Federated Learning for Source-Free Domain Adaptation in Adverse Weather [9.7]
フェデレートラーニング(FL)では、複数のクライアントがプライベートデータを共有せずにグローバルモデルを共同でトレーニングする。我々は、車とドローンの両方のクライアントが共存し協力する、新しいフェデレーションセマンティックセマンティックセグメンテーション・セグメンテーション・セグメンテーション・セッティングを導入する。具体的には、バッチノーム気象対応戦略を利用して、異なる気象条件にモデルを動的に適応させる新しい手法を提案する。最後に,航空車両の悪天候データを用いた最初のセマンティックセグメンテーションデータセットであるFLYAWAREを紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:18:50 GMT)
Self-Evolutionary Large Language Models through Uncertainty-Enhanced Preference Optimization [9.6]
反復的選好最適化は、最近、大規模言語モデル(LLM)のデファクトトレーニングパラダイムの1つになっている。我々は、信頼性の高いフィードバックでLLMを自己進化させる不確実性のあるtextbfPreference textbfOptimizationフレームワークを提案する。筆者らのフレームワークは,ノイズ問題を大幅に軽減し,反復的選好最適化の性能を向上させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:05:58 GMT)
Preventing Representational Rank Collapse in MPNNs by Splitting the Computational Graph [9.5]
複数の有向非巡回グラフ上での操作が常に我々の条件を満たすことを示し、ノードの厳密な部分順序付けを定義することによってそれらを得る提案をする。我々は、より情報的なノード表現を実現するために、マルチリレーショナルグラフ上での操作の利点を確認する包括的な実験を行う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:16:03 GMT)
Schrodinger's Memory: Large Language Models [9.5]
記憶はすべての人間の活動の基礎である。 LLM(Large Language Models)の開発に伴い、言語能力は人間に匹敵するものになりつつある。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:10:49 GMT)
CoT Rerailer: Enhancing the Reliability of Large Language Models in Complex Reasoning Tasks through Error Detection and Correction [9.4]
CoT(Chain-of-Thought)により、LLM(Large Language Models)の複雑な推論能力が向上する。我々は,これらの課題に対処するために,自己整合性とマルチエージェントの議論システムを用いたCoTリレーラを提案する。様々な知識領域における多様な質問応答データセットにまたがるアプローチの有効性を実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:19:17 GMT)
Improving LLM Reasoning with Multi-Agent Tree-of-Thought Validator Agent [9.4]
Tree of Thoughts (ToT) 法は複雑な質問応答タスクの推論を改善する可能性を示している。マルチエージェント推論における重要な制限は、'Reasoner'エージェントによる推論経路の浅い探索である。 ToTをベースとしたReasonerエージェントとThought Validatorエージェントを組み合わせた新しいアプローチを提案する。提案手法は,GSM8Kデータセットを用いた場合,既存の手法と比較して優れた性能を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:54:37 GMT)
Attacking Slicing Network via Side-channel Reinforcement Learning Attack [9.4]
本稿では,ネットワークスライシング環境に特化して設計された,強化学習に基づくサイドチャネルキャッシュ攻撃フレームワークを提案する。本フレームワークは,認証キーやユーザ登録データなどの機密情報を格納したキャッシュ位置を動的に識別し,活用する。実験の結果, 約95%から98%の成功率を達成し, アプローチの優位性を示した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:07:05 GMT)
Geometry Aware Meta-Learning Neural Network for Joint Phase and Precoder Optimization in RIS [9.2]
マルチユーザ複数入力単一出力システムにおける重み付け総和率を最大化する,複雑で幾何を考慮したメタラーニングニューラルネットワークを提案する。我々は、位相シフトに複雑な値のニューラルネットワークを使用し、Eulerにインスパイアされたプレコーダネットワークのアップデートを行った。我々のアプローチは、既存のニューラルネットワークベースのアルゴリズムよりも優れており、より重み付けされた総和率、消費電力の低減、およびはるかに高速な収束を提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:20:23 GMT)
Adaptive Anomaly Detection in Network Flows with Low-Rank Tensor Decompositions and Deep Unrolling [9.2]
異常検出(AD)は、将来の通信システムのレジリエンスを確保するための重要な要素として、ますます認識されている。この研究は、不完全測定を用いたネットワークフローにおけるADについて考察する。本稿では,正規化モデル適合性に基づくブロック帰属凸近似アルゴリズムを提案する。ベイズ的アプローチに触発されて、我々はモデルアーキテクチャを拡張し、フローごとのオンライン適応とステップごとの統計処理を行う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:59:57 GMT)
FSL-HDnn: A 5.7 TOPS/W End-to-end Few-shot Learning Classifier Accelerator with Feature Extraction and Hyperdimensional Computing [8.8]
FSL-HDnnは、特徴抽出、分類、チップ上の数発学習のエンドツーエンドパイプラインを実装するエネルギー効率の高いアクセラレータである。軽量クラスタリング機能抽出器と超次元コンピューティングの2つの低消費電力モジュールを統合している。特徴1抽出には5.7TOPS/W、分類と学習には0.78TOPS/Wのエネルギー効率を達成している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:23:12 GMT)
Hyper-STTN: Social Group-aware Spatial-Temporal Transformer Network for Human Trajectory Prediction with Hypergraph Reasoning [8.8]
本稿では,ハイパーグラフを用いた時空間変圧器ネットワークHyper-STTNを紹介する。グループワイズ相関は、グループサイズが異なるマルチスケールハイパーグラフの集合を用いて構成される。空間時間変換器は、歩行者の空間時間次元における対方向の潜時相互作用をキャプチャするために適応される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:31:09 GMT)
AIR-HLoc: Adaptive Retrieved Images Selection for Efficient Visual Localisation [8.8]
最先端の階層的ローカライゼーションパイプライン(HLOC)は2D-3D対応を確立するために画像検索(IR)を使用している。本稿では,グローバルディスクリプタとローカルディスクリプタの関係について検討する。本稿では,クエリのグローバルな記述子とデータベース内の記述子との類似性に基づいて$k$を調整する適応型戦略を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:09:15 GMT)
Navigating High-Degree Heterogeneity: Federated Learning in Aerial and Space Networks [8.8]
フェデレーション学習は、空と宇宙のネットワークにおけるネットワークとデータプライバシの課題に対して、魅力的なソリューションを提供する。本稿では,ASNsに基づくフェデレーション学習の性能を低下させるクラス不均衡に対する不均一性の影響について検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:14:33 GMT)
Quantum optical coherence theory based on Feynman's path integral [8.7]
本稿では、ファインマンの経路積分に基づく量子光コヒーレンス理論を紹介し、レビューする。 2つの独立した光の過渡的な1次干渉の結果から、熱光の電界の古典的モデルが正確でない可能性があると予測されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:04:12 GMT)
Super-dephasing in Collective Atom-Atom Interactions Mediated by Near-Field Electromagnetic Fluctuations [8.6]
材料近傍のフォトニック環境で発生するナノ・EMスーパーデフォーカス現象について紹介する。オフ共鳴・低周波EMゆらぎの長距離相関は、多体交絡状態における集合的加速(super-)または抑制(sub-)減退(sub-)を誘導する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:44:51 GMT)
Image Hijacks: Adversarial Images can Control Generative Models at Runtime [8.6]
推論時に視覚言語モデルの振る舞いを制御する画像ハイジャック, 逆画像を検出する。 Prompt Matching法を考案し、任意のユーザ定義テキストプロンプトの動作にマッチしたハイジャックをトレーニングする。我々は、Behaviour Matchingを使って、4種類の攻撃に対してハイジャックを作らせ、VLMは敵の選択の出力を生成し、コンテキストウィンドウから情報をリークし、安全トレーニングをオーバーライドし、偽の声明を信じるように強制する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:56:09 GMT)
Towards Gaussian Process for operator learning: an uncertainty aware resolution independent operator learning algorithm for computational mechanics [8.5]
本稿では、パラメトリック微分方程式を解くための新しいガウス過程(GP)に基づくニューラル演算子を提案する。ニューラル演算子を用いて学習した潜在空間でGPカーネルを定式化するニューラル演算子埋め込みカーネル'を提案する。本研究は, 不確実性評価におけるロバスト性を維持しつつ, 複雑なPDEを解く上で, この枠組みの有効性を強調した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:12:38 GMT)
Diversify and Conquer: Diversity-Centric Data Selection with Iterative Refinement [8.5]
命令データ上での大規模言語モデルの微調整は、事前訓練された知識の強化と命令追従能力の向上に不可欠である。この作業は問題に対処する: 効果的なトレーニングのために、データの最適なサブセットをどうやって決定できるのか? 提案手法では,k平均クラスタリングを用いて,選択したサブセットが全データセットを効果的に表現できるようにする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:25:31 GMT)
JARViS: Detecting Actions in Video Using Unified Actor-Scene Context Relation Modeling [8.5]
2段階ビデオローカライゼーション(英語: Two-stage Video Localization, VAD)は、ビデオクリップの空間的および時間的次元内のアクションの局所化と分類を含む、強迫的なタスクである。 JARViS(Joint Actor-scene context Relation Modeling)と呼ばれる2段階のVADフレームワークを提案する。 JARViSは、トランスフォーマーアテンションを用いて、空間的および時間的次元にわたって世界中に分布するクロスモーダルアクションセマンティクスを集約する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:25:38 GMT)
Prompt Obfuscation for Large Language Models [8.4]
本研究では,従来のシステムプロンプトの代替案を提案する。システムプロンプトの抽出を防止するために,プロンプト難読化を導入する。提案手法は,知的財産権の保護に有効な手法でありながら,本来のシステムプロンプトと同じ実用性を維持しつつも有効であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:43:29 GMT)
Discrete Unit based Masking for Improving Disentanglement in Voice Conversion [8.3]
話者符号化前の入力に新しいマスキング機構を導入し,音素クラスと高い対応性を持つ特定の個別音声単位をマスキングする。提案手法は,複数のVC手法間の絡み合いと変換性能を44%向上させ,客観的インテリジェンスを相対的に向上させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:17:59 GMT)
One-Shot Imitation under Mismatched Execution [8.3]
プロンプトとしての人間のデモは、ロボットに長距離操作のタスクをプログラムするための強力な方法だ。これらのデモをロボット実行可能なアクションに変換することは、運動スタイルや身体能力のミスマッチの実行による重大な課題を呈する。 RHyMEは、最適な輸送コストを用いてロボットとデモレータのタスク実行を自動的に調整するフレームワークである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:33:45 GMT)
Learning a Terrain- and Robot-Aware Dynamics Model for Autonomous Mobile Robot Navigation [8.3]
本稿では,確率的,地形的,ロボット対応のフォワードダイナミクスモデル(TRADYN)を学習するための新しいアプローチを提案する。本研究では, 空間的に異なる摩擦係数を持つ地形特性を持つ一サイクル動的ロボットの2次元ナビゲーションシミュレーションにおいて, 提案手法の評価を行った。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:46:39 GMT)
VGG-Tex: A Vivid Geometry-Guided Facial Texture Estimation Model for High Fidelity Monocular 3D Face Reconstruction [8.2]
VGG-Texは、高忠実度モノクロ3D顔再構成用に設計された新しいモデルである。このアプローチの核心は、二次元紫外線テクスチャ推定の結果を高めるために、3Dパラメトリック先行値を活用することである。本手法はテクスチャ再構築性能を既存の最先端手法と比較して大幅に向上させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:00:50 GMT)
Golden Ratio Search: A Low-Power Adversarial Attack for Deep Learning based Modulation Classification [8.2]
深層学習に基づく自動変調分類(AMC)のための最小パワー・ホワイトボックス対向攻撃を提案する。提案手法の有効性を,既存の攻撃手法との比較により評価した。実験の結果、提案した攻撃は強力で、最小限の電力を必要とし、より少ない時間で発生可能であることが示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:17:54 GMT)
Several families of entanglement criteria for multipartite quantum systems based on generalized Wigner-Yanase skew information and variance [7.9]
本稿では,多部量子状態や高次元量子状態における絡み合いを検出するための絡み合い基準のいくつかのファミリを提案する。絡み合い基準の組み合わせは、より強力な検出能力を有することを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:24:48 GMT)
Quantifying nonclassical correlation via the generalized Wigner-Yanase skew information [7.9]
我々は、重要な特性を持つ情報の族、すなわち一般化されたウィグナー・ヤネーゼスキュー情報の概念を導入する。両部量子状態の非古典的相関を定量化するための2つの異なる指標形式を提案する。これらの2種類の指標は、両分極純状態の絡み合いを減少させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:54:20 GMT)
SEDMamba: Enhancing Selective State Space Modelling with Bottleneck Mechanism and Fine-to-Coarse Temporal Fusion for Efficient Error Detection in Robot-Assisted Surgery [7.9]
選択的状態空間モデル(SSM)を外科的誤り検出に組み込んだSEDMambaという新しい階層モデルを提案する。 SEDMambaは、長期ビデオにおける外科的エラーの検出と時間的局所化のために、ボトルネック機構と微細から粗い時間的融合(FCTF)を備えた選択的SSMを強化する。我々の研究は、実際の手術症例におけるエラー検出を支援するために、第一種、フレームレベル、生存中の外科的エラーデータセットにも貢献する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:32:57 GMT)
RoMath: A Mathematical Reasoning Benchmark in Romanian [7.8]
本稿では、3つのデータセットからなるルーマニアの数学的推論ベンチマークスイートであるRoMathを紹介する。独特な言語特徴を持つ低リソース言語であるルーマニア語に焦点を当てることで、RoMathはアングロ中心モデルの限界に対処する。いくつかのオープンウェイト言語モデルをベンチマークし、表現不足言語のためのリソースを作成することの重要性を強調した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:03:46 GMT)
GEIC: Universal and Multilingual Named Entity Recognition with Large Language Models [7.7]
ジェネレーションベース抽出とテキスト内分類(GEIC)の課題について紹介する。次に,多言語GEICフレームワークであるCascadeNERを提案する。我々はまた、Large Language Models(LLMs)用に特別に設計された最初のNERデータセットであるAnythingNERを紹介します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:32:12 GMT)
GINTRIP: Interpretable Temporal Graph Regression using Information bottleneck and Prototype-based method [7.6]
本稿では,時間グラフ回帰モデルの解釈可能性を高める新しい手法を提案する。 IB原則の適用性をグラフ回帰タスクに拡張する、相互情報(MI)に基づく新たな理論的境界を導出する。本モデルは実世界のトラフィックデータセットに基づいて評価され,予測精度と解釈可能性関連指標の両方において既存手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:58:40 GMT)
Fairness Under Demographic Scarce Regime [7.5]
フェアネスと精度のトレードオフを改善する属性分類器を構築するためのフレームワークを提案する。不確実な感度特性を持つ試料に公正性制約を課すことは、公正性-正確性トレードオフに悪影響を及ぼす可能性があることを示す。我々のフレームワークは、ほとんどのベンチマークで真に敏感な属性に対する公平性制約で訓練されたモデルより優れている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:37:35 GMT)
Federated Learning with Integrated Sensing, Communication, and Computation: Frameworks and Performance Analysis [7.5]
FL-I SCCフレームワークについて検討し,FedAVG-I SCCとFedSGD-I SCCの両方を実装した。 I SCCフレームワークがFLの遅延とエネルギー消費を減少させる可能性について実験的に実証した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:42:49 GMT)
SDP: Spiking Diffusion Policy for Robotic Manipulation with Learnable Channel-Wise Membrane Thresholds [7.4]
本稿では,ロボット操作のためのスパイキング拡散ポリシー(SDP)学習手法を提案する。 SDPは、Spyking NeuronsとLearnerable Channel-wise membrane Thresholds (LCMT)を拡散ポリシーモデルに統合する。我々は、ベースラインSNN法よりも高速な収束速度とともに、ANN法に匹敵する結果を得る。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:53:36 GMT)
SynthSOD: Developing an Heterogeneous Dataset for Orchestra Music Source Separation [7.4]
そこで本研究では,シミュレーション手法を用いて現実的なトレーニングセットを作成する,SynthSODと呼ばれる新しいマルチトラックデータセットを提案する。合成データセットw.r.tをトレーニングしたベースライン音楽分離モデルのよく知られたEnsembleSetへの適用を実演する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:58:33 GMT)
Implicit Reasoning in Deep Time Series Forecasting [7.4]
この研究は、ディープ時系列予測モデルの推論能力を評価するための最初の一歩を踏み出した。系統的に編成されたアウト・オブ・ディストリビューションシナリオにおいて,ある線形なパッチベーストランスフォーマーモデルが効果的に一般化できることが判明した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:11:19 GMT)
Ultrasound Image Enhancement with the Variance of Diffusion Models [7.4]
超音波画像の強調にはコントラスト、解像度、スペックル保存の微妙なバランスが必要である。本稿では,適応ビームフォーミングと拡散型分散イメージングを併用した新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:29:33 GMT)
Computational Electromagnetics Meets Spin Qubits: Controlling Noise Effects in Quantum Sensing and Computing [7.3]
低周波磁気ゆらぎノイズを制御するための量子計算電磁界フレームワークを提案する。我々のフレームワークは、スピン量子ビット量子デバイスへの計算電磁法の応用を拡張している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:11:21 GMT)
A Deep Learning Approach for User-Centric Clustering in Cell-Free Massive MIMO Systems [7.2]
ユーザクラスタリング問題を解決するために,ディープラーニングに基づくソリューションを提案する。提案手法は,ユーザ数に応じて効果的に拡張可能であり,長期のメモリセルを再トレーニングを必要とせずに動作させることができる。その結果,パイロット汚染による不完全なチャネル状態情報が存在する場合でも,提案手法の有効性が示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:12:54 GMT)
Integrating Knowledge Retrieval and Large Language Models for Clinical Report Correction [7.1]
本研究では,大規模言語モデル (LLM) と検索拡張生成技術 (RAG) を利用した放射線学報告における誤り訂正手法を提案する。提案フレームワークは,新たな内外的検索機構を用いて,関心事報告と外部知識ソースから関連する医療機関と関係を抽出する。アプローチの有効性は、ドメインの専門家がガイドした現実的なエラーで実世界の放射線学レポートを破損させたベンチマークデータセットを用いて評価される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:57:49 GMT)
Detecting and Mitigating System-Level Anomalies of Vision-Based Controllers [7.1]
ビジョンベースのコントローラは、新規またはアウト・オブ・ディストリビューションの入力に直面したとき、誤った予測を行うことができる。本研究では,そのような閉ループ,システムレベルの障害を検知・緩和する実行時異常モニタを提案する。本提案手法は, 視覚に基づくタクシー制御システムを用いた自律型航空機タクシーシステムにおいて, 提案手法の有効性を検証したものである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:27:52 GMT)
Machine Learning on Dynamic Functional Connectivity: Promise, Pitfalls, and Interpretations [7.0]
機能神経画像の深部モデル設計のための実証的ガイドラインの確立を目指す。 fMRIを用いた認知的タスク認識と疾患診断におけるSOTA(State-of-the-arts)のパフォーマンスはどのようなものか? 以上の課題に対処するため,様々な場面で総合的な評価と統計的分析を行った。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:24:17 GMT)
Balancing Optimality and Diversity: Human-Centered Decision Making through Generative Curation [7.0]
本稿では,量的・質的両面を統合することにより,決定オプションの真の望ましさを最適化する生成キュレーションという新しい枠組みを導入する。提案手法は,多種多様な準最適動作を効率的にサンプリングするための分配$pi$を生成する生成ニューラルネットワークアーキテクチャと,反復的に解を生成する逐次最適化手法である。提案手法を広範囲なデータセットで検証し,複雑な環境にまたがる意思決定プロセスの強化の有効性を実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:13:32 GMT)
Optimizing TinyML: The Impact of Reduced Data Acquisition Rates for Time Series Classification on Microcontrollers [7.0]
本稿では,時系列分類におけるデータ取得率の低減がTinyMLモデルに与える影響について検討する。データサンプリング頻度を下げることで、RAM使用量、エネルギー消費、レイテンシ、MAC操作を約4倍に削減することを目指している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:21:49 GMT)
Unveiling the Flaws: A Critical Analysis of Initialization Effect on Time Series Anomaly Detection [6.9]
時系列異常検出(TSAD)のための深層学習は,過去10年間で大きな注目を集めている。近年の研究はこれらのモデルに疑問を呈し、その成果は欠陥評価技術に寄与している。本稿では,TSADモデルの性能に対する影響を批判的に分析する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:14:40 GMT)
KVPruner: Structural Pruning for Faster and Memory-Efficient Large Language Models [6.9]
性能を維持しながらモデル効率を向上させるため,KVPrunerを提案する。オリジナルのモデルと比較して、KVPrunerはランタイムメモリ使用量を50%削減し、スループットを35%以上向上させた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:35:30 GMT)
Learning Label Refinement and Threshold Adjustment for Imbalanced Semi-Supervised Learning [6.9]
半教師付き学習アルゴリズムは、不均衡なトレーニングデータに晒された場合、うまく機能しない。 Validation Data(SEVAL)に基づく擬似ラベル最適化によるセミ教師あり学習について紹介する。 SEVALは、擬似ラベルの精度を改善して特定のタスクに適応し、クラスごとに擬似ラベルの正確性を保証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:49:31 GMT)
A Diffusion Approach to Radiance Field Relighting using Multi-Illumination Synthesis [6.9]
単一照度データを用いた照度場作成手法を提案する。光方向条件付き多照度データセット上で,まず2次元拡散モデルを微調整する。単一照明下での合成および実マルチビューデータについて結果を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:16:31 GMT)
Single-stage TTS with Masked Audio Token Modeling and Semantic Knowledge Distillation [6.8]
単一段階における高品質な音声生成を可能にする意味知識蒸留法を提案する。提案モデルでは, 音声品質, 聞きやすさ, 話者類似性を, 単段ベースラインと比較して改善する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:08:43 GMT)
Multi-modal Atmospheric Sensing to Augment Wearable IMU-Based Hand Washing Detection [6.8]
我々は、湿度、温度、気圧センサーを付加した、オープンソースの新しいプロトタイプ装置を提案する。視覚検査により、特に湿度センサは、手洗い活動中に相対湿度が強く上昇していることが分かる。機械学習によるデータの解析から、このような相対湿度パターンから恩恵を受ける特徴がまだ特定されていないことが分かる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:04:56 GMT)
jina-embeddings-v3: Multilingual Embeddings With Task LoRA [6.7]
jina-embeddings-v3は5億7000万のパラメータを持つ新しいテキスト埋め込みモデルである。多言語データと長文検索タスクで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:42:20 GMT)
AutoCRAT: Automatic Cumulative Reconstruction of Alert Trees [6.7]
AutoCRATはネットワーク露出による脅威の幅と深刻度を定量化するシステムである。実世界のデータセットを用いてAutoCRATの有用性を検証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:41:45 GMT)
Single-Layer Learnable Activation for Implicit Neural Representation (SL$^{2}$A-INR) [6.6]
ニューラルネットワークを利用して、座標入力を対応する属性に変換するインプシット表現(INR)は、視覚関連領域において大きな進歩をもたらした。 SL$2$A-INR を単層学習可能なアクティベーション関数として提案し,従来の ReLU ベースの有効性を推し進める。提案手法は,画像表現,3次元形状再構成,単一画像超解像,CT再構成,新しいビューなど,多様なタスクに優れる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:02:15 GMT)
Machine Learning Applications of Quantum Computing: A Review [6.6]
このレビューでは、高度なデータ処理とアプリケーションに焦点を当てた、量子コンピューティングと機械学習の相互作用について論じている。主にサイバーセキュリティにおける量子コンピューティングの重要性の増大に焦点を当てている。このレビューは、量子化された機械学習アルゴリズムの進歩とサイバーセキュリティなどの分野における潜在的な応用を強調している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:04:45 GMT)
An Asymptotically Optimal Coordinate Descent Algorithm for Learning Bayesian Networks from Gaussian Models [6.5]
線形ガウス構造方程式モデルに基づいて連続観測データからネットワークを学習する問題について検討する。本稿では,$ell$penalized max chanceの最適目標値に収束する新しい座標降下アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:14:39 GMT)
Decentralized Biometric Authentication based on Fuzzy Commitments and Blockchain [6.5]
本稿では,ブロックチェーンベースのバイオメトリック認証プロトコルを提案する。プライバシや個人情報,特にユーザの生体特性を保護しながら,分散化とレジリエンスを実現する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:58:06 GMT)
Survey of Data-driven Newsvendor: Unified Analysis and Spectrum of Achievable Regrets [6.4]
Newsvendor の問題では、ある分布から引き出される数を推測することが目的である。データ駆動バージョンでは、分散は未知であり、分散からのサンプルを扱う必要がある。本稿では、これらの変種の組み合わせをすべて研究し、文献の多くのギャップを埋め、多くの証明を単純化する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:31:04 GMT)
Jailbreaking Large Language Models with Symbolic Mathematics [6.3]
AI安全性の最近の進歩は、安全でないコンテンツ生成を緩和するために、大規模な言語モデル(LLM)のトレーニングと再チームの強化につながっている。本稿では, シンボル数学におけるLLMの高度な能力を利用して, 安全機構を回避した新しいジェイルブレイク手法であるMathPromptを紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:39:45 GMT)
Generating Synthetic Free-text Medical Records with Low Re-identification Risk using Masked Language Modeling [6.2]
Masked Language Modeling (MLM) を用いた合成自由テキスト医療記録を生成するシステムを提案する。本システムは,重要な多様性を導入し,再識別リスクを最小限に抑えつつ,記録の重要な情報を保存するように設計されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:18:37 GMT)
Benchmarking Multimodal Variational Autoencoders: CdSprites+ Dataset and Toolkit [6.2]
本稿では,系統的マルチモーダルVAEトレーニングと比較のためのツールキットを提案する。本稿では,共同生成能力とクロスジェネレーション能力の包括的評価を目的とした,アンタングル型バイモーダルデータセットを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:35:26 GMT)
On the generalization ability of coarse-grained molecular dynamics models for non-equilibrium processes [6.2]
非平衡過程に対するある種の一般化能力を保ったCGMDモデルを構築するためのデータ駆動型アプローチを提案する。予備選択されたCG変数に基づく従来のCGモデルとは異なり、現在のCGモデルは補助的なCG変数の集合を求める。これにより、広い範囲の非平衡条件下での未解決変数の分布が、平衡条件下での変数に近づくことが保証される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:42:50 GMT)
Latent mixed-effect models for high-dimensional longitudinal data [6.1]
LMM-VAEは,長手データに対するスケーラブルで解釈可能で識別可能なモデルである。我々は,GPに基づく手法と理論的な関係を強調し,この手法の統一的な枠組みを提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:16:38 GMT)
Accelerating Point Cloud Ground Segmentation: From Mechanical to Solid-State Lidars [6.1]
まず、点ベース、グリッドベース、範囲画像ベースグラウンドセグメンテーションアルゴリズムをベンチマークする。以上の結果から,レンジ画像に基づく手法は優れた性能とロバスト性をもたらすことが示唆された。提案したアルゴリズムをFPGA上で実装することにより,処理速度と資源使用量のスケーラビリティが大幅に向上したことを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:23:16 GMT)
Improving the Efficiency of Visually Augmented Language Models [5.9]
本稿では,LMを視覚的に拡張するために明示的な画像は必要ないことを示す。代わりに、よく知られたCLIPマルチモーダルシステムから得られる視覚的なテキスト表現を使用する。 BLIND-VALMは、VALM for Visual Language Understanding (VLU)、Natural Language Understanding (NLU)、Language Modelingタスクと同等に動作することを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:02:19 GMT)
Compact Implicit Neural Representations for Plane Wave Images [5.9]
平面波(PW)イメージングは、音化角度によって異なる人工物や影を生成する。 Inlicit Neural Representation (INR) を用いて,複数平面列をコンパクトに符号化する手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:18:57 GMT)
Enriching Datasets with Demographics through Large Language Models: What's in a Name? [5.9]
LLM(Large Language Models)は、特殊なデータに基づいてトレーニングされた振る舞いモデルだけでなく、パフォーマンスも向上する。香港の認可された金融専門家の実際のデータセットを含む、さまざまなデータセットにこれらのLCMを適用します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:40:49 GMT)
Neural Fields for Adaptive Photoacoustic Computed Tomography [5.6]
従来のPACT画像再構成アルゴリズムは、組織内の異種音速(SOS)による波面歪みに悩まされる。 NF-APACTは、ニューラルネットワークを利用した効率的な自己教師型フレームワークであり、正確で堅牢なマルチチャネルデコンボリューションを実現するためのSOSを推定する。本手法は,SOSの収差を既存手法よりも高速かつ高精度に除去する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:11:20 GMT)
Large Language Models are Good Multi-lingual Learners : When LLMs Meet Cross-lingual Prompts [5.5]
本稿では,MLプロンプトという新しいプロンプト戦略を提案する。 MLPromptは、LLMが他の言語に追従するのに苦労するエラーを起こしやすいルールを翻訳する。本稿では,MLPromptを構造化データ生成の自動チェック機構に統合するフレームワークと,テキストからMIPインスタンスへの特定のケーススタディを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:33:27 GMT)
State Machine Mutation-based Testing Framework for Wireless Communication Protocols [5.5]
本稿では,プロトコルステートマシンであるProteusを提案する。 Proteusは、有意義なだけでなく、望ましい性質に違反する確率の高いテストケースを生成することで、その予算意識を維持している。影響を受けたベンダーは、5つのCVEを通じて14の脆弱性を認めている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:12:03 GMT)
Estimating the history of a random recursive tree [5.4]
ヨルダン中心度尺度に基づく順序推定器を提案する。提案した推定器が次数ベースおよびスペクトル順序付け法より優れていることを数値的に示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:47:27 GMT)
Unsupervised Hybrid framework for ANomaly Detection (HAND) -- applied to Screening Mammogram [5.4]
マンモグラムスクリーニングに使用されるAIモデルの一般化を促進するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。我々は,大規模デジタル検診マンモグラムからOODを検出する新しいバックボーン,HANDを開発した。 Hand Pipelineは、外部スクリーニングマンモグラムにおけるドメイン固有の品質チェックのための、自動化された効率的な計算ソリューションを提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:12:50 GMT)
Down-Sampling Inter-Layer Adapter for Parameter and Computation Efficient Ultra-Fine-Grained Image Recognition [5.3]
パラメータ効率のよい設定でダウンサンプリング層間アダプタを用いる新しい手法を提案する。ダブルブランチのダウンサンプリングを統合することで,パラメータ数や浮動小数点演算を著しく削減する。本手法は,パラメータ効率設定における他の手法と比較して,平均精度を少なくとも6.8%向上させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:17:34 GMT)
Learning variant product relationship and variation attributes from e-commerce website structures [5.3]
我々は,電子商取引カタログにおける変種商品のペアを特定するために,変種関係マッチング戦略であるVARMを導入する。我々はRAG誘導生成LDMを用いて変異産物群間の変異と共通属性を抽出する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:24:27 GMT)
PREVENT: An Unsupervised Approach to Predict Software Failures in Production [5.2]
PreVENTは、教師なしのテクニックを組み合わせることで、分散エンタープライズアプリケーションの障害を予測し、ローカライズするためのアプローチである。その結果、PreVENTは、長く、しばしば失敗を伴う非現実的なトレーニングを必要とせず、教師付き学習アプローチよりも早い段階で、より安定的で信頼性の高い予測を提供することがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:02:28 GMT)
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models [5.2]
TSELMは、離散トークンと言語モデルを活用する新しいターゲット話者抽出ネットワークである。我々は,TSELMが音声品質の優れた結果と,音声の可聴性に匹敵する結果が得られることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:41:32 GMT)
MonoCoder: Domain-Specific Code Language Model for HPC Codes and Tasks [5.1]
ソフトウェア開発におけるAIのトレンドは、様々なプログラミングタスクに対処する大規模言語モデル(LLM)を開発することである。ハイパフォーマンスコンピューティング(HPC)領域のタスクに適用されるLLMでさえ、巨大なサイズであり、トレーニングに高価な計算リソースを必要とする。これは、HPCタスク用のLLMが、いくつかの自然および/またはプログラミング言語をサポートする既存のLLMを微調整することによって得られるためである。既存のLMよりも桁違いに小さいが,非HPCおよびHPCコードでは性能が向上するMonoCoderという,HPC固有のLMを構築している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:29:03 GMT)
Motion-Guided Dual-Camera Tracker for Endoscope Tracking and Motion Analysis in a Mechanical Gastric Simulator [5.1]
運動誘導型デュアルカメラ・ビジョン・トラッカーは内視鏡先端の3次元位置の頑健かつ正確な追跡を実現するために提案される。提案したトラッカーは、最先端のビジョントラッカーに対して優れた性能を示し、平均誤差と最大誤差において、第2ベット法に対して42%と72%の改善を達成している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:53:42 GMT)
Synthetic data augmentation for robotic mobility aids to support blind and low vision people [5.0]
視覚障害者のためのロボットモビリティ支援(BLV)は、深層学習に基づく視覚モデルに大きく依存している。これらのモデルの性能は、実世界のデータセットの可用性と多様性によって制約されることが多い。本研究では,Unreal Engine 4を用いて生成した合成データの有効性について検討した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:17:28 GMT)
VALO: A Versatile Anytime Framework for LiDAR-based Object Detection Deep Neural Networks [5.0]
本研究は,LDARオブジェクト検出ディープニューラルネットワーク(DNN)における動的期限条件の適用という課題に対処する。 VALO(Versatile Anytime Algorithm for LiDAR Object Detection)は3次元LiDARオブジェクト検出DNNの任意の時間計算を可能にする新しいデータ中心のアプローチである。本研究では,最先端の3次元LiDARオブジェクト検出ネットワーク,すなわちCenterPointとVoxelNextにVALOを実装し,その動的適応性を広範囲の時間制約に適用できることを実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:30:35 GMT)
BAD: Bidirectional Auto-regressive Diffusion for Text-to-Motion Generation [4.9]
双方向自己回帰拡散(BAD)は、自己回帰モデルとマスクベースの生成モデルの強みを統一する新しいアプローチである。 BADは、因果依存性を強制しながら自然配列構造を保存する、置換に基づく汚職技術を利用する。総合的な実験により、BADはテキスト・ツー・モーション生成において自己回帰モデルやマスクベースのモデルよりも優れていることが示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:28:19 GMT)
Guess What I Think: Streamlined EEG-to-Image Generation with Latent Diffusion Models [4.9]
EEGは低コストで非侵襲的でポータブルなニューロイメージング技術である。 EEGは、空間分解能が低く、ノイズやアーティファクトへの感受性が低いため、固有の課題を提示している。脳波信号による潜伏拡散モデルの条件付けのための制御ネットアダプタに基づくフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:07:13 GMT)
High-Order Evolving Graphs for Enhanced Representation of Traffic Dynamics [4.9]
本稿では,自律運転における表現性の向上を目的とした,高次進化グラフを用いた交通動態解析のための革新的なフレームワークを提案する。提案手法は,交通シーン内の複雑な相互作用をリアルタイムにモデル化する双方向の時間的二部グラフを構築する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:00:58 GMT)
Optimal Potential Shaping on SE(3) via Neural ODEs on Lie Groups [4.6]
ニューラル常微分方程式 (neural ODEs) として力学系を言い換える数値的に最適化に取り組むために勾配降下最適化アルゴリズムを提案する。広範な例では、剛体制御のための最適電位エネルギー整形が扱われる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:46:55 GMT)
HGSLoc: 3DGS-based Heuristic Camera Pose Refinement [4.6]
視覚的ローカライゼーションは、既知のシーン表現内のカメラのポーズと方向を決定するプロセスを指す。本稿では,3次元再構成と改良戦略を統合したHGSLocを提案する。提案手法は,NeRFベースのニューラルレンダリング手法と比較して,高速なレンダリング速度とローカライズ精度を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:48:48 GMT)
A Unified Framework to Classify Business Activities into International Standard Industrial Classification through Large Language Models for Circular Economy [4.5]
本稿では,Large Language Models(LLMs)を利用して,経済活動に関するテキストデータを国際標準産業分類(ISIC)に分類する。提案手法は, GPT-2モデルを微調整した182ラベルテストデータセットに対して95%の精度で達成する。この研究は、持続可能な循環経済の実践を促進するグローバルな取り組みに寄与する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:30:08 GMT)
Wave-U-Mamba: An End-To-End Framework For High-Quality And Efficient Speech Super Resolution [4.5]
SSR(Speech Super-Resolution)は、高周波数成分の欠如を回復させることにより低分解能音声信号を強化するタスクである。従来の手法では、通常、対数メルの特徴を再構成し、次いで波形領域で高分解能な音声を生成するボコーダが続く。本稿では,SSRを時間領域で直接実行するWave-U-Mambaという手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:33:57 GMT)
Enhancing Worldwide Image Geolocation by Ensembling Satellite-Based Ground-Level Attribute Predictors [4.4]
本稿では,GPSなどの位置情報が存在しない場合の地上画像の位置を推定することの課題について検討する。本稿では,推定位置分布の精度を計測する新しい指標であるリコール対エリア(Recall vs Area)を紹介する。次に,複数の情報源からの情報を組み込んだグローバルな画像位置決め手法について検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:17:54 GMT)
Perceptions of Edinburgh: Capturing Neighbourhood Characteristics by Clustering Geoparsed Local News [4.4]
地域ニュース記事を用いて近隣住民を特徴付ける手法を提案する。具体的には、NLP(Natural Language Processing)を用いて、近隣地域に関するさらなる情報をアンロックする方法を示す。私たちの仕事は、地域に合わせて調整された街路レベルのジオパーシングと、完全なニュース記事のクラスタリングを組み合わせることで、新しくなっています。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:17:57 GMT)
Towards Goal-oriented Prompt Engineering for Large Language Models: A Survey [4.4]
大規模言語モデル(LLM)は、様々な下流タスクで顕著なパフォーマンスを示している。本稿では,人為的仮定に基づく設計プロンプトの限界を明らかにすることを目的とする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:56:03 GMT)
Unsupervised End-to-End Training with a Self-Defined Target [4.3]
本稿では,エンドツーエンドの教師あり学習用に設計されたネットワークやハードウェアが,高性能な教師なし学習を実現する方法を提案する。我々はこの手法を半教師付き学習に拡張し、データ型に基づいて目標を調整し、600のラベル付きMNISTサンプルを多層パーセプトロンで96.6%の精度で検出する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:44:32 GMT)
Attention-Seeker: Dynamic Self-Attention Scoring for Unsupervised Keyphrase Extraction [4.3]
Attention-Seekerは教師なしキーフレーズ抽出法である。大規模言語モデルからの自己注意マップを使用して、候補句の重要性を推定する。公開データセットを4つ評価した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:54:25 GMT)
The Invalsi Benchmarks: measuring Linguistic and Mathematical understanding of Large Language Models in Italian [4.3]
Invalsi MATE to evaluate model performance on mathematical understanding in Italian, Invalsi ITA to evaluate language understanding in Italian and Olimpiadi MATE for more complex mathematical understanding。 Invasli MATEでは,Llama 3.1 70bインストラクションで,Invalsi ITAでは88%の精度で,10の強力な言語モデルを評価した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:27:07 GMT)
Uncertainty and Prediction Quality Estimation for Semantic Segmentation via Graph Neural Networks [4.3]
グラフニューラルネットワーク(GNN)を用いて、あるセグメントの品質との関係を、あるセグメントのメトリクスの関数としてモデル化する。異なるGNNアーキテクチャを比較し、顕著なパフォーマンス改善を実現しています。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:20:21 GMT)
CodePori: Large-Scale System for Autonomous Software Development Using Multi-Agent Technology [4.3]
大規模言語モデル(LLM)とGPT(Generative Pre-trained Transformer)は、ソフトウェア工学の分野を変えました。我々は,大規模かつ複雑なソフトウェアプロジェクトのコード生成を自動化するように設計された,新しいシステムであるCodePoriを紹介する。結果: CodePoriは、典型的なソフトウェア開発プロセスに合わせて、大規模プロジェクトの実行コードを生成することができる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:57:06 GMT)
Calibrated Multivariate Regression with Localized PIT Mappings [4.3]
本稿では,多変量キャリブレーションに対処するポストホックリカレーション手法を提案する。このアプローチの2つのバージョンを示す: 1つはK-アネレスト近傍を使い、もう1つは正規化フローを使用する。本研究では,インドにおける小児栄養失調の回帰モデルの改善と,深層ニューラルネットワークの通貨為替レート予測の緩和という,2つの実データ応用に対するアプローチの有効性を実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:41:03 GMT)
Directional emission of a readout resonator for qubit measurement [4.3]
我々は、全パス共振器を用いた超伝導量子ビットの伝送方式による分散読み出しを提案する。これは、リードアウト信号が出力に向かって優先的に減衰するように、フィードラインを一方の端で意図的にミスマッチする典型的な読み出し方式とは対照的である。我々は,600 nsで平均98.1%のシングルショット忠実度を持つ量子ビット読み出しを実証し,より大きな分散シフトの効果を評価するために,シェルビングプロトコルを実装し,300 nsで99.0%の忠実度を達成する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:10:36 GMT)
CANDID DAC: Leveraging Coupled Action Dimensions with Importance Differences in DAC [4.2]
アクション次元間の相互依存と異なる重要性は、DAC問題の鍵となる特徴である。我々は、CANDIDの特性をシミュレートする新しいホワイトボックスベンチマークをDACBenchスイートに導入する。我々は,CANDID行動空間における因子化政策の独立学習において,シーケンシャルポリシーが顕著に優れていることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:32:15 GMT)
Synchronizable hybrid subsystem codes [4.1]
我々は、量子シンクロナイズ可能な符号、サブシステム符号、および古典的巡回符号の対から構築されたハイブリッド符号間の接続を確立する。また、パウリと同期の誤りを訂正できる同期可能なハイブリッドサブシステムコードを構築する方法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:11:30 GMT)
Multimodal Datasets and Benchmarks for Reasoning about Dynamic Spatio-Temporality in Everyday Environments [4.0]
我々のデータセットは、ロボットがホームセッティングにおける人間の行動や環境をどの程度理解できるかを測定する。予備実験は、私たちのデータセットがAIの日常生活の理解を測定するのに役立つことを示唆している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:30:36 GMT)
Reducing Catastrophic Forgetting in Online Class Incremental Learning Using Self-Distillation [3.9]
連続学習では、モデルが新しいタスクを学ぶと、以前の知識は忘れられる。本稿では, 自己蒸留による伝達可能な知識の獲得により, この問題の解決を試みた。提案手法は,CIFAR10,CIFAR100,MinimageNetデータセットを用いた実験により従来の手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:26:33 GMT)
Genetic Information Analysis of Age-Related Macular Degeneration Fellow Eye Using Multi-Modal Selective ViT [3.8]
老化関連黄斑変性(AMD)の発症は遺伝子多型と関連していると考えられている。本稿では,オプティカルコヒーレンス・トモグラフィー(OCT)画像と医療記録を用いて,AMDに対する複数の感受性遺伝子の存在を予測する手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:27:45 GMT)
HS3-Bench: A Benchmark and Strong Baseline for Hyperspectral Semantic Segmentation in Driving Scenarios [3.7]
駆動シナリオにおけるセマンティックセグメンテーションの進捗を測定するための標準ベンチマークはない。本稿では,HyperSpectral Semanticベンチマーク(HS3-Bench)を提案する。 3つの駆動シナリオデータセットからの注釈付きハイパースペクトル画像を組み合わせて、標準化されたメトリクス、実装、評価プロトコルを提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:00:49 GMT)
Decomposing Gaussians with Unknown Covariance [3.7]
本稿では,ガウスデータに対する従来の分解手法をすべて包含する一般アルゴリズムを提案する。これは$n>1$の場合にサンプル分割に代わる、より柔軟でフレキシブルな代替となる。これらの分解を、代替戦略が利用できない設定において、モデル選択と選択後推論のタスクに適用する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:56:08 GMT)
WER We Stand: Benchmarking Urdu ASR Models [3.7]
本稿では,Urdu Automatic Speech Recognition(ASR)モデルの総合評価を行う。単語誤り率(WER)を用いた3種類のASRモデル(Whisper, MMS, Seamless-M4T)の性能解析を行った。読み上げ音声データセットでは、スムーズな広さが他のASRモデルより優れているのに対し、ささやきの広さは会話音声データセットでは最高であることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:00:31 GMT)
Bridging Social Media and Search Engines: Dredge Words and the Detection of Unreliable Domains [3.7]
我々はWebグラフとソーシャルメディアのコンテキストを統合したWebサイト信頼性分類・発見システムを開発した。本稿では,信頼できないドメインが検索エンジン上で高いランクを付けるような単語,用語,フレーズの概念を紹介する。私たちは、ソーシャルメディアとオンラインコマースプラットフォームとの強いつながりを強調した、ドレッジワードの新たなデータセットをリリースしました。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:20:53 GMT)
Shaking the Fake: Detecting Deepfake Videos in Real Time via Active Probes [3.6]
生成AIの一種であるリアルタイムディープフェイク(Real-time Deepfake)は、ビデオ内の既存のコンテンツ(例えば、顔を別のものと交換する)を「生成する」ことができる。金融詐欺や政治的誤報など、悪意ある目的のためにディープフェイクビデオを作るのに誤用されている。本研究では,物理干渉に適応できないディープフェイクモデルを利用した新しいリアルタイムディープフェイク検出手法であるSFakeを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:58:30 GMT)
TopoMaskV2: Enhanced Instance-Mask-Based Formulation for the Road Topology Problem [3.6]
TopoMaskは、センターライン予測を強化する新しいアプローチである。本稿では,フロー情報を用いたマスクインスタンスの強化を目的とした,クワッド指向ラベル表現を提案する。 TopoMaskはOpenLane-V2データセットで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:22:38 GMT)
Rank Collapse Causes Over-Smoothing and Over-Correlation in Graph Neural Networks [3.6]
深さが大きくなると、ノード表現はアグリゲーション関数に依存するが特徴変換には依存しない低次元部分空間に支配されることが示される。すべてのアグリゲーション関数について、ノード表現のランクは崩壊し、特定のアグリゲーション関数に対して過度に滑らかになる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:19:17 GMT)
Control-flow Reconstruction Attacks on Business Process Models [3.6]
この研究は、プロセスモデルに基づいて、このような再構築の試みを経験的に調査した最初のものである。本稿では,プロセスツリーからの制御フローを再構築する様々なプレイアウト戦略を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:42:55 GMT)
Challenging Fairness: A Comprehensive Exploration of Bias in LLM-Based Recommendations [3.5]
大言語モデル(LLM)ベースのレコメンデーションシステムは、従来のシステムよりも包括的なレコメンデーションを提供する。これらのシステムは、しばしばバイアスを示し、主流のコンテンツを好む一方で、歪んだトレーニングデータのために非伝統的な選択肢を疎外する。本研究では,LLMに基づくレコメンデーションシステムとバイアスの関係について検討した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:37:57 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.5]
本稿では,ジェネレーティブ・人工知能(GenAI)を利用した子ども向けのストーリーテリングを支援する教育ツールのコンセプトを紹介する。このシステムは、GenAIによる物語の共創、テキストから音声への変換、およびテキストからビデオへの生成を組み合わせることで、学習者にとって魅力的な体験を生み出す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:10:23 GMT)
Do Language Models Exhibit Human-like Structural Priming Effects? [3.4]
本稿では,言語モデル予測に影響を与える言語要因について検討する。我々は、構造的プライミングのパラダイムを利用し、最近の構造への露出は、同じ構造の処理を容易にする。これらの効果は、人間のプライミングで知られている逆周波数効果によって説明でき、プライミング効果はプライミング効果を増大させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:17:36 GMT)
Testing GPT-4 with Wolfram Alpha and Code Interpreter plug-ins on math and science problems [3.4]
GPT-4は、高校と大学レベルで、科学と数学の105のオリジナルの問題でテストされた。以上の結果から,プラグインはGPTの問題解決能力を大幅に向上させる可能性が示唆された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:04:51 GMT)
An Examination of the Alleged Privacy Threats of Confidence-Ranked Reconstruction of Census Microdata [3.2]
提案手法は, 著者が主張する情報開示に有効でないことを示す。提案するランキングが再確認や情報開示攻撃を導くことができないことを示す実証的な結果が報告される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:49:19 GMT)
Norm of Mean Contextualized Embeddings Determines their Variance [3.2]
コンテキスト化された埋め込みは、同じトークンであってもコンテキストによって異なり、埋め込み空間内の分布を形成する。トランスフォーマーモデルの層が深まるにつれて、埋め込みは原点から遠く離れていることが示される。これらの結果は、層間の埋め込み空間の異方性に関する既存の研究と一致している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:02:23 GMT)
Uncertainty Estimation of Transformers' Predictions via Topological Analysis of the Attention Matrices [3.1]
トランスフォーマーベースの言語モデルは、幅広いNLPタスクに新しいベンチマークを設定している。予測の不確実性を確実に見積もるのは重要な課題ですモデル信頼度を評価するために,複数の頭部・層にまたがるアテンションマップの幾何学的特徴を活用することで,これらの制約に対処する。提案手法は,アクセプタビリティ判定と人工テキスト検出のためのベンチマークにおいて,既存の不確実性推定手法を著しく上回っている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:44:27 GMT)
Multi-Cohort Framework with Cohort-Aware Attention and Adversarial Mutual-Information Minimization for Whole Slide Image Classification [3.1]
本稿では,腫瘍の多様性を生かしたマルチコホートWSI解析手法を提案する。我々はCohort-Aware Attentionモジュールを導入し、共有および腫瘍特異的な病理パターンのキャプチャを可能にした。また,コホート不均衡を緩和し,偏りのない学習を促進するために,階層的なサンプルバランス戦略を開発する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:18:00 GMT)
Self-Contrastive Forward-Forward Algorithm [3.1]
本稿では,自己指導型コントラスト学習に触発された自己コントラストフォワード(SCFF)手法を提案する。 SCFFは、さまざまなデータセットに適用可能な正および負の例を生成する。これは、リカレントニューラルネットワークのFFトレーニングを有効にし、より複雑なタスクへの扉を開く最初のものだ。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:58:20 GMT)
Applying an Evolutionary Algorithm to Minimize Teleportation Costs in Distributed Quantum Computing [3.1]
量子通信ネットワークは、古典的および量子チャネルを介して複数の量子コンピュータ(QC)を接続することによって形成することができる。分散量子コンピューティングでは、QCは集合的に量子計算を行う。本稿では,この問題に対する進化的アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:16:40 GMT)
Scale-Invariant Object Detection by Adaptive Convolution with Unified Global-Local Context [3.1]
本稿では,効率的なDetモデルに基づくSAC-Net(Switchable Atrous Convolutional Network)を用いたオブジェクト検出モデルを提案する。提案したSAC-Netは,マルチスケールオブジェクト検出タスクの性能向上を実現するために,低レベル機能と高レベル機能の両方の利点をカプセル化している。ベンチマークデータセットを用いた実験により,提案したSAC-Netは,精度の点で最先端モデルよりも優れた性能を示した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:08:37 GMT)
Fine-Grained Representation Learning via Multi-Level Contrastive Learning without Class Priors [3.1]
クラス事前に依存することなく表現を学習するフレームワークであるtextitContrastive Disentangling (CD) を提案する。 CDは多段階のコントラスト学習戦略を採用し、インスタンスレベルの損失と特徴レベルの損失を正規化エントロピーの損失と統合し、意味的にリッチできめ細かな表現を学習する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:29:58 GMT)
MEMO-QCD: Quantum Density Estimation through Memetic Optimisation for Quantum Circuit Design [3.0]
本稿では,密度推定のための効率的な量子回路設計手法を提案する。この戦略は、密度推定のための量子インスパイアされたアルゴリズムと、メメティックアルゴリズムに基づく回路最適化ルーチンに基づいている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:02:41 GMT)
UltimateDO: An Efficient Framework to Marry Occupancy Prediction with 3D Object Detection via Channel2height [3.0]
現代の自律運転システムでは、作業と3Dオブジェクト検出が標準的な2つのタスクである。高速な3次元物体検出と占有予測(UltimateDO)を実現する手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:14:13 GMT)
CROSS: A Contributor-Project Interaction Lifecycle Model for Open Source Software [3.0]
Cross Modelは、オープンソースソフトウェアのための新しいコントリビュータ/プロジェクトインタラクションライフサイクルモデルである。特にEoS/オフボードのシナリオにおいて、コントリビュータの関与に関するさまざまなアーキティパルケースを説明し、研究ギャップを強調します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:50:16 GMT)
Revisiting Cosine Similarity via Normalized ICA-transformed Embeddings [2.8]
コサイン類似度は、2つの埋め込みの類似度を測定するために広く用いられている。本稿では,コサイン類似性の新たな解釈を,軸上の意味的類似性の和として提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:47:14 GMT)
Strengthening Solidity Invariant Generation: From Post- to Pre-Deployment [2.8]
InvSolは、Solidityスマートコントラクトに特化した、事前デプロイ不変生成のための新しいフレームワークである。 InvSolはデプロイ前に不変性を識別し、ループを含むSolidity言語構成を包括的にカバーする。スマートコントラクトのベンチマークセットを使用して、InvSolを厳格に評価し、そのパフォーマンスを最先端のソリューションと比較する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:31:26 GMT)
HMF: A Hybrid Multi-Factor Framework for Dynamic Intraoperative Hypotension Prediction [2.8]
平均動脈圧(MAP)を用いた術中低血圧(IOH)予測は,術中患者の予後に重要な意味を持つ重要な研究領域である。既存のアプローチは主に、生理学的信号の動的な性質を無視する静的なモデリングパラダイムを使用している。血圧予測タスクとしてIOH予測を再構成するHMF(Hybrid Multi-Factor)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:46:41 GMT)
Pauli spin blockade at room temperature in S/Zn-codoped silicon tunnel field effect transistors [2.7]
パウリスピン遮断(英: Pauli spin blockade、PSB)は、量子ドット(QD)と量子ビットの読み出しにおけるスピンに関する基礎研究に用いられている。ここでは、電界効果トランジスタのチャネル内の1つの深いドーパントが室温QDとして機能することを確認する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:23:39 GMT)
Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification [2.5]
網膜疾患診断のための堅牢なディープラーニングモデルの開発には、トレーニングのためのかなりのデータセットが必要である。より小さなデータセットで効果的に一般化する能力は、依然として永続的な課題である。さまざまなデータソースを組み合わせて、パフォーマンスを改善し、新しいデータに一般化しています。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:22:35 GMT)
Unmasking the Imposters: How Censorship and Domain Adaptation Affect the Detection of Machine-Generated Tweets [2.4]
4つの著名な大規模言語モデル(LLM)の生成能力を調べるために,9つのTwitterデータセットを作成する手法を提案する。これらのデータセットは、3つのオープンソースLCMの7Bおよび8Bパラメータベースインストラクションモデルを含む、検閲されていない4つの5つのモデル構成を含んでいる。評価の結果,「アンセンソルド」モデルが自動検出手法の有効性を著しく損なうことが明らかとなった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:29:13 GMT)
How to Determine the Preferred Image Distribution of a Black-Box Vision-Language Model? [2.4]
本稿では,視覚言語モデル(VLM)に好適な画像分布を特定するための,新しい一般化可能な手法を提案する。これを異なる3次元オブジェクトのレンダリングタイプに適用することにより、複雑な構造の正確な解釈を必要とする様々な領域で有効性を示す。特殊なドメインにおけるベンチマークの欠如を解決するために,CAD関連視覚質問応答タスク上でVLMを評価するための新しいデータセットであるCAD-VQAを導入する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:25:27 GMT)
Does Biomedical Training Lead to Better Medical Performance? [2.4]
大規模言語モデル(LLM)は、患者のケア、診断、管理プロセスに大きく貢献することが期待されている。本研究では, バイオメディカルトレーニングが6つの実践的医療課題の文脈に及ぼす影響について検討した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:19:59 GMT)
MMLU-Pro+: Evaluating Higher-Order Reasoning and Shortcut Learning in LLMs [2.4]
大規模言語モデル(LLM)の既存のベンチマークは、パフォーマンスの高いモデル間の差別化にますます苦労している。本稿では,MMLU-Proをベースとした,ショートカット学習と高次推論のための拡張ベンチマークであるMMLU-Pro+を紹介する。以上の結果から,MMLU-Pro+はMMLU-Proの難易度を維持しつつ,より厳密なモデル判別試験を行っていることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:26:51 GMT)
GOSt-MT: A Knowledge Graph for Occupation-related Gender Biases in Machine Translation [2.3]
機械翻訳(MT)システムにおけるジェンダーバイアスは、しばしば有害なステレオタイプを補強する重大な課題を引き起こす。本稿では,GOSt-MTナレッジグラフの作成を通じて,職業関連性バイアスを研究する新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:44:20 GMT)
Development and Benchmarking of Multilingual Code Clone Detector [2.3]
多言語コードクローン検出器は、ターゲット言語のみの構文情報を提供することで、新しい言語のサポートを追加しやすくする。 ANTLR生成に基づく多言語コードブロック抽出法を提案し、多言語コードクローン検出器(MSCCD)を実装した。最先端の10の検出器と比較して、MSCCDは平均レベルで動作し、さらに多くの言語をサポートしている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:31:20 GMT)
Use the Force, Bot! -- Force-Aware ProDMP with Event-Based Replanning [2.3]
FA-ProDMPは,確率的運動プリミティブ(probabilistic Dynamic Movement Primitives, ProDMP)に力覚を取り入れた新しいアプローチである。 FA-ProDMPは、測定と所望の力を考慮に入れ、実行中に軌道に適応する。 FA-ProDMPを確実に評価するために、POEMPELと呼ばれるモジュール式3Dプリントタスクスイートを導入する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:54:41 GMT)
LLM-as-a-Judge & Reward Model: What They Can and Cannot Do [2.2]
自動評価器の総合的な分析を行い、非英語環境での行動に関する重要な知見を報告する。まず、英語による評価能力が言語特有の能力に大きく影響していることを発見し、英語で訓練された評価者が、そのスキルを他の言語に簡単に移行できるようにする。第2に,LLMが事実的不正確さ,文化的誤表現,不必要な言語の存在など,誤りを検出し,罰せられない重大な欠点を特定する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:40:02 GMT)
Can GPT-O1 Kill All Bugs? An Evaluation of GPT-Family LLMs on QuixBugs [2.2]
この作業は、最近のGPT-o1モデルの公開リリースにインスパイアされている。自動プログラム修復(APR)におけるGPTファミリーモデルの異なるバージョンの有効性の比較を行った。 O1の修復機能は、以前のGPTファミリーモデルよりも優れており、ベンチマークで40のバグを修正できた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:49:17 GMT)
Four-qubit photonic system for publicly verifiable quantum random numbers and generation of public and private key [2.2]
本研究では,4量子フォトニクスシステムを用いて,公に検証可能な量子乱数を生成する実験を行った。また、4量子状態からのサンプルビットの97.9%が絡み合い検証に合格している。このことは、量子セーフなアプリケーションのための小規模マルチキュービットフォトニクスシステムの実用性を実証している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:41:23 GMT)
Fast and Post-Quantum Authentication for Real-time Next Generation Networks with Bloom Filter [2.2]
従来の暗号システムは、ポスト量子(PQ)セキュアな暗号に置き換える必要がある。我々は、TVPD-HORS(Time Valid Probabilistic Data Structure HORS)と呼ばれる新しい署名を提案する。 TVPD-HORSの検証はHORSよりも2.7倍、5倍高速である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:13:26 GMT)
SMILe: Leveraging Submodular Mutual Information For Robust Few-Shot Object Detection [2.1]
Few-Shot Object Detection (FSOD) において、オブジェクトクラスの融合と忘れは重要な課題である。本稿では,相互情報機能を導入した新しいサブモジュール型相互情報学習フレームワークを提案する。提案手法は,バックボーンアーキテクチャに依存しないFSODの既存手法に一般化する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:52:12 GMT)
Autoregressive Image Diffusion: Generation of Image Sequence and Application in MRI [2.0]
生成モデルは画像分布を学習し、アンサンプされたk空間データから高品質な画像の再構成に使用できる。画像系列に対する自己回帰画像拡散(AID)モデルを提案し,それを後部MRI再構成のサンプリングに用いた。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:50:13 GMT)
Volvo Discovery Challenge at ECML-PKDD 2024 [2.0]
本稿では,ECML-PKDD 2024カンファレンスで開催されたVolvo Discovery Challengeの概要を紹介する。課題の目標は、新たに公開されたデータセットを使用して、Volvoトラックの匿名コンポーネントの障害リスクを予測することだった。本稿では,課題定義,課題設定,提出内容の統計について簡潔に述べる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:05:24 GMT)
Inside Alameda Research: A Multi-Token Network Analysis [1.9]
我々は、FTXの顧客ファンドの不正使用に関連する暗号通貨取引会社であるAlameda Researchに関連するアカウントに焦点を当てる。マルチトークンネットワーク表現を用いて、ノードの中央性とネットワークのバックボーンを調べ、クリティカルアカウント、トークン、アクティビティグループを識別する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:36:21 GMT)
Multimodal Attention-Enhanced Feature Fusion-based Weekly Supervised Anomaly Violence Detection [1.9]
このシステムは、RGBビデオ、光フロー、オーディオ信号の3つの特徴ストリームを使用し、それぞれのストリームが相補的な空間的特徴と時間的特徴を抽出する。このシステムは3つのデータセットの異常検出精度とロバスト性を大幅に改善する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:17:52 GMT)
Uncertainty Decomposition and Error Margin Detection of Homodyned-K Distribution in Quantitative Ultrasound [1.9]
定量的超音波(QUS)における均質K分布(HK分布)パラメータ推定をベイズニューラルネットワーク(BNN)を用いて最近検討した。 BNNは、精度と精度を損なうことなく、スペックル統計に基づくQUSの計算時間を著しく短縮することが示されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:16:49 GMT)
ReXErr: Synthesizing Clinically Meaningful Errors in Diagnostic Radiology Reports [1.9]
胸部X線レポート内の代表的エラーを生成するために,大規模言語モデルを活用する手法であるReXErrを紹介する。我々は、人間とAIが生成したレポートでよくある誤りを捉えるエラーカテゴリを開発した。本手法は, 臨床応用可能性を維持しつつ, 多様な誤差を注入する新しいサンプリング手法を用いている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:42:39 GMT)
Crosscap states and duality of Ising field theory in two dimensions [1.9]
2次元イジング場理論に対して、2つの異なるクロスキャップ状態を提案する。これらの2つのクロスキャップ状態は、反ポッド点におけるイジングスピンまたは双対スピンを同定し、クラマース・ワニエ双対変換を通して関連していることを示す。我々はマヨラナ自由場表現を導出し、ボゾン化法を拡張して、2次元イジング共形場理論の相関関数を計算する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:11:54 GMT)
Open-Source Web Service with Morphological Dictionary-Supplemented Deep Learning for Morphosyntactic Analysis of Czech [1.8]
チェコ語形態素解析のためのオープンソースのWebサービスを提案する。このシステムは、推論時の高精度な形態素辞書による深層学習モデルと再構成を組み合わせる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:58:03 GMT)
Anti-ESIA: Analyzing and Mitigating Impacts of Electromagnetic Signal Injection Attacks [1.7]
電磁信号注入攻撃(Electronic Signal Injection Attacks, ESIA)と呼ばれる脅威は、重要なインテリジェントシステムに重大なリスクをもたらす。 ESIAは、攻撃者がリモートでカメラが捉えた画像を操作でき、悪意のある行為や破滅的な結果をもたらす可能性がある。本稿では,2つの異なる点,すなわち画素損失とカラーストリップから電磁界Aを解析することにより,これらのギャップに対処することを目的とする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:42:24 GMT)
CAST: Cross-modal Alignment Similarity Test for Vision Language Models [1.7]
視覚言語モデル(VLM)は通常、視覚質問回答(VQA)タスクで評価される。本稿では,モダリティ間の自己整合性を求めるために,CAST(Cross-modal Alignment similarity Test)を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:14:45 GMT)
AgileFormer: Spatially Agile Transformer UNet for Medical Image Segmentation [1.7]
視覚変換器をベースとしたUNet(ViT-UNet)セグメンテーションモデルの現在の設計は、不均一な外観を効果的に扱えない。本稿では,空間動的成分をViT-UNetに導入するための構造化手法を提案する。この適応により、モデルは様々な外観のターゲットオブジェクトの特徴を効果的に捉えることができる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:48:54 GMT)
Outlier Detection with Cluster Catch Digraphs [1.6]
本稿では,クラスタ・キャッシュ・ダイグラフ(CCD)に基づく異常検出アルゴリズムを新たに導入する。そこで我々は,Uniformity-based CCD with Mutual Catch Graph (U-MCCD), The Uniformity- and Neighbor-based CCD with Mutual Catch Graph (UN-MCCD), and their shape-adaptive variants (SU-MCCD and SUN-MCCD)を提案する。以上の結果から,これらのアルゴリズムは,外乱検出の精度と適応性を大幅に向上させることが示唆された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:08:53 GMT)
Dynamic Range Reduction via Branch-and-Bound [1.5]
ハードウェアアクセラレーターを強化するための主要な戦略は、算術演算における精度の低下である。本稿ではQUBO問題における精度向上のための完全原理分岐境界アルゴリズムを提案する。実験は、実際の量子アニール上でのアルゴリズムの有効性を検証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:07:56 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.5]
LOLAは160以上の言語で訓練された多言語大言語モデルである。私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:23:08 GMT)
LLM-Powered Ensemble Learning for Paper Source Tracing: A GPU-Free Approach [1.4]
我々は,KDD CUP 2024紙ソース追跡コンテストに参加し,第3位を獲得した。このコンペティションは参加者に対して、与えられた学術論文の参考資料(ref-sources)を特定するよう指示した。トレーニング済みのニューラルネットワークモデルを微調整することでこの問題に対処しているほとんどのチームとは異なり、私たちの主要なアプローチはクローズドソースの大規模言語モデルを使用していました。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:35:25 GMT)
Advances in APPFL: A Comprehensive and Extensible Federated Learning Framework [1.4]
Federated Learning(FL)は、データプライバシを保持しながら協調的なモデルトレーニングを可能にする分散機械学習パラダイムである。本稿では,統合学習のためのフレームワークおよびベンチマークスイートであるAPPFLの開発における最近の進歩について述べる。本稿では, 通信効率, プライバシー保護, 計算性能, 資源利用など, FLの様々な側面を評価する広範な実験を通じて, APPFLの能力を実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:20:26 GMT)
Three Approaches to the Automation of Laser System Alignment and Their Resource Implications: A Case Study [1.4]
3つの異なる自動化アプローチを特定し,検討する。それらは、人工知能、手動アライメントのプラクティスを模倣するプラクティス主導、第一原理からモデリングするデザイン主導である。我々は、人的資源において異なる自動化アプローチが著しく異なることを示し、サンプリング予算を計測する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:41:33 GMT)
3DFacePolicy: Speech-Driven 3D Facial Animation with Diffusion Policy [1.3]
本稿では,3次元表情予測のための拡散ポリシーモデルである3DFacePolicyを提案する。方法は、変動的で現実的な人間の顔の動きを生成する。実験により,本手法は顔面運動の変動や動的動作に有効であることが確認された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:30:34 GMT)
Visual grounding for desktop graphical user interfaces [1.3]
グラフィカルユーザインタフェース(GUI)におけるオブジェクト識別のためのマルチモーダルソリューションIVGを提案する。 IVGは、命令が実行される画面上の要素の座標を特定する。最初の方法は3部構成のアーキテクチャで、LLM(Large Language Model)とオブジェクト検出モデルの組み合わせに依存している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:15:07 GMT)
The Tensor as an Informational Resource [1.3]
テンソル(英: tensor)は、データの保存、計算関係のエンコード、量子絡み合いの表現に使用できる数列である。テンソル上の情報理論的に構築された事前順序の族を提案し、テンソルを互いに比較し、それらの間の変換の存在を評価する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:56:57 GMT)
Robot Manipulation in Salient Vision through Referring Image Segmentation and Geometric Constraints [1.3]
言語表現からの微細粒界と構造セグメンテーションのための軽量参照画像セグメンテーションモデルを提案する。実世界におけるロボット制御を実現するために,視覚サーボシステムにモデルを配置する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:40:28 GMT)
Variance-reduced first-order methods for deterministically constrained stochastic nonconvex optimization with strong convergence guarantees [1.3]
決定論的に制約された最適化問題のクラスについて検討する。提案手法は,より強い$epsilon$-stochastic定常点を求めるために,$widetilde O(epsilon-max4, 2theta)$のサンプル複雑性と1次演算複雑性を実現する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:30:44 GMT)
CLIP Adaptation by Intra-modal Overlap Reduction [1.2]
画像空間におけるモーダル内重なりを埋め込み表現の観点から解析する。 Google Open Imagesデータセットからサンプルのジェネリックセットに軽量アダプタをトレーニングします。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:40:58 GMT)
Hierarchical Narrative Analysis: Unraveling Perceptions of Generative AI [1.2]
大規模言語モデル(LLM)を利用して,これらの構造を階層的な枠組みに抽出・整理する手法を提案する。我々は,日本の文化庁が収集した生成AIに関する世論を分析して,このアプローチを検証する。我々の分析は、生成的AIに対する多様な意見に影響を与える要因のより明確な可視化を提供し、合意と不一致の構造に関する深い洞察を提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:56:12 GMT)
Privacy-Preserving Billing for Local Energy Markets [1.2]
本稿では,地域エネルギー市場(PBP-LEM)に対するプライバシ保護請求プロトコルを提案する。 PBP-LEMにより、市場団体のグループは、正しさを犠牲にすることなく、分散的でプライバシー保護的な方法で参加者の請求書を共同で計算することができる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:42:43 GMT)
MSDNet: Multi-Scale Decoder for Few-Shot Semantic Segmentation via Transformer-Guided Prototyping [1.2]
少数の例だけで、クエリイメージ内のオブジェクトをセグメント化するという課題に、Semanticは対処している。本稿では,トランスアーキテクチャに基づく新しいFew-shot Semanticフレームワークを提案する。 150万のパラメータしか持たないモデルでは,既存の手法の限界を克服しつつ,競争性能を実証している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:14:03 GMT)
PIP-Loco: A Proprioceptive Infinite Horizon Planning Framework for Quadrupedal Robot Locomotion [1.1]
四足歩行におけるモデル予測制御(MPC)の強みは、制約を強制する能力である。自己受容型計画と強化学習(RL)を統合した枠組みを提案する。デプロイ中、Dreamerモジュールは無限水平MPC問題を解決する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:57:42 GMT)
Beyond LoRA: Exploring Efficient Fine-Tuning Techniques for Time Series Foundational Models [1.1]
本研究はChronos Tの複数の構成に対して,2つの選択的 (BitFit と LayerNorm Tuning) と2つの付加的 (VeRA と FourierFT) PEFT 手法を導入,評価した。これらのPEFT手法のいくつかは、セプシスパラメータ効率とドメイン適応の点でLoRAよりも優れており、SOTA(State-of-the-art)を確立することで、ICUの不可欠な予測タスクを実現している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:57:54 GMT)
Fault Detection for agents on power grid topology optimization: A Comprehensive analysis [1.0]
我々は,電力グリッドシミュレーションの故障に着目し,パターンを特定し,事前に検出する。クラスタ化によって、5つの異なるクラスタを検出し、一般的な障害タイプを特定します。故障を事前に検出し、5種類の予測モデルを評価するためのマルチクラス予測手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:54:29 GMT)
Testing for racial bias using inconsistent perceptions of race [1.0]
人種バイアス試験は、異なる人種の2人が異なる扱いを受けるかどうかを一般的に評価する。根本的な課題は、2人が様々な点で異なるため、人種以外の要因が治療の違いを説明する可能性があることである。そこで本研究では,異なる人種が認識されている場合に,同一人物が別々に扱われているかどうかを評価することによって,比較の難しさを回避できるバイアステストを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:18:46 GMT)
Small Language Models can Outperform Humans in Short Creative Writing: A Study Comparing SLMs with Humans and LLMs [1.0]
我々は、細調整された小言語モデル(SLM)、BART Largeの創作小説の執筆能力を評価し、その性能を人間と2つの大言語モデル(LLM)、GPT-3.5とGPT-4oと比較した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:40:02 GMT)
Improving threshold for fault-tolerant color code quantum computing by flagged weight optimization [0.9]
回路レベルのノイズの下での色符号の閾値は、その高重安定化器発生器のために比較的低い。フラグ量子ビットの測定結果に条件付き誤差確率を用いて,そのような誤差の影響を抑える手法を提案する。この方法は、他の重みベースのデコーダにも適用でき、QECの実験的な実装の候補として、より有望なカラーコードが得られる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:46:20 GMT)
Spontaneous Informal Speech Dataset for Punctuation Restoration [0.9]
SponSpeechは、非公式な音声ソースから派生した句読点復元データセットである。フィルタリングパイプラインは,音声と文字起こしの双方の品質について検討する。我々はまた、他の文法的に曖昧な句読点を予測するために、音声情報を活用するモデルの能力を評価することを目的とした、挑戦的なテストセットを慎重に構築する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:43:14 GMT)
The Bayan Algorithm: Detecting Communities in Networks Through Exact and Approximate Optimization of Modularity [0.8]
最適性と近似保証を提供するアルゴリズムを含む30のコミュニティ検出手法を比較した。提案手法は, 2つの標準ベンチマークにおいて, 最大モジュラリティ分割の精度と安定性を, 多くの代替品よりも高い速度で評価した。他の29のアルゴリズムのパーティションと比較すると、最大モジュラリティパーティションは、記述の長さ、カバレッジ、パフォーマンス、平均コンダクタンス、クラスタ度に最も適している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:51:45 GMT)
No Saved Kaleidosope: an 100% Jitted Neural Network Coding Language with Pythonic Syntax [0.8]
我々は,C++,LLVM,Cudaを用いてニューラルネットワークを学習するためのjittedコンパイラを開発した。オブジェクト指向の特徴、強い型付け、データ前処理のための並列ワーカー、式のためのピソニック構文、PyTorchのようなモデル宣言、自動微分などが特徴である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:15:39 GMT)
Hardware-Efficient Preparation of Graph States on Near-Term Quantum Computers [0.8]
高度に絡み合った量子状態のスケールと忠実度は、特殊なコンパイル法によって改善することができる。提案手法は,7ビットグラフを平均3.5倍の誤差で作成する際の誤差を低減する。以上の結果から,ゲートベース量子コンピューティングハードウェア上での高忠実度あるいは大規模グラフ状態の生成が可能となった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:51:22 GMT)
SC-Phi2: A Fine-tuned Small Language Model for StarCraft II Macromanagement Tasks [0.8]
本稿では,マクロ管理タスクのための小型言語モデルであるSC-Phi2を紹介する。 Phi2、Gemma、DistilBERTのような小さな言語モデルは、大きな言語モデル(LLM)の合理化バージョンであり、実行に必要な電力とメモリを少なくする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:50:32 GMT)
DiffESM: Conditional Emulation of Temperature and Precipitation in Earth System Models with 3D Diffusion Models [0.8]
地球系モデル(Earth System Models、ESM)は、人間の活動と地球の気候の間の相互作用を理解するために不可欠である。 ESMは、しばしば実行可能なシミュレーションの数を制限し、極端な気象イベントに関連するリスクのロバストな分析を妨げる。生成型ディープラーニングモデルのクラスである拡散モデルを用いて、毎月のESM出力を1日あたりの周波数に効果的にダウンスケールする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:20:05 GMT)
Automating proton PBS treatment planning for head and neck cancers using policy gradient-based deep reinforcement learning [0.8]
本稿では,PPOアルゴリズムと線量分布に基づく報酬関数を用いた自動治療計画モデルを提案する。実験的なルールのセットは、ターゲットのボリュームとリスクのある臓器から補助的な計画構造を作成するために使用される。 PPOを用いて訓練された意思決定ポリシーネットワークを開発し、連続的な行動空間において、関連する計画目標パラメータを反復的に調整する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:01:56 GMT)
On-policy Actor-Critic Reinforcement Learning for Multi-UAV Exploration [0.7]
無人航空機(UAV)は、精密農業、捜索救助、リモートセンシングなど、様々な分野で人気が高まっている。本研究は,複数のUAVを用いて2次元の関心領域を探索するために,政治強化学習(RL)とPPO(Pximal Policy Optimization)を活用することで,この問題に対処することを目的とする。提案手法は、深層畳み込みニューラルネットワーク(CNN)と長短期記憶(LSTM)を用いて、UAVと既にカバーされている領域を特定することを含む。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:36:46 GMT)
An Enhanced Online Certificate Status Protocol for Public Key Infrastructure with Smart Grid and Energy Storage System [0.7]
スマートグリッド環境におけるOCSPクエリコストを最適化するためのOCSPステープリング手法を提案する。実験の結果,OCSPステープリングにより効率とセキュリティが向上し,スマートグリッドのより堅牢なアーキテクチャが実現された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:57:17 GMT)
A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning [0.6]
ツールの使用、計画、フィードバック学習は、現在、LLM(Large Language Model)ベースのエージェントを開発するための3つの重要なパラダイムである。この調査では、これらのフレームワークを体系的にレビューし、議論するための統合された分類法を導入している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:02:29 GMT)
A Human-Centered Risk Evaluation of Biometric Systems Using Conjoint Analysis [0.6]
本稿では, コンジョイント分析を用いて, 監視カメラなどのリスク要因が攻撃者のモチベーションに与える影響を定量化するために, 新たな人間中心型リスク評価フレームワークを提案する。本フレームワークは、False Acceptance Rate(FAR)とアタック確率を組み込んだリスク値を算出し、ユースケース間の総合的な比較を可能にする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:18:21 GMT)
Time-Series Forecasting, Knowledge Distillation, and Refinement within a Multimodal PDE Foundation Model [0.6]
我々は,SymPyに基づく新しいトークンライブラリを提案し,時系列モデルに対する追加のモダリティとして差分予測方程式を符号化する。このアプローチは最小限のコストを発生させ、自動化され、タスクの予測に高い精度を維持する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:53:34 GMT)
Multi-Domain Data Aggregation for Axon and Myelin Segmentation in Histology Images [0.6]
組織像における軸索とミエリンの性質の定量化は、神経変性疾患による微細構造変化に関する有用な情報を提供することができる。ディープラーニングの進歩により、このタスクは最小限のオーバーヘッドで迅速かつ信頼性が高くなっていますが、ある研究グループによってトレーニングされたディープラーニングモデルは、他のグループによって利用されることがほとんどありません。研究者がワークフローを円滑に実行し、加速するためにAIを利用できるようにする必要があるが、公開モデルは不十分で、メンテナンスが不十分である。我々のアプローチは、複数の画像モダリティからのデータを集約して、アクソンとミエリンセグメンテーションのためのオープンソースで耐久性のあるツールを作成することである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:47:32 GMT)
Hackphyr: A Local Fine-Tuned LLM Agent for Network Security Environments [0.6]
大規模言語モデル(LLM)は、サイバーセキュリティなど、さまざまな分野において顕著な可能性を示している。我々は、ネットワークセキュリティ環境において、レッドチームエージェントとして使用されるローカルな微調整LDMであるHackphyrを紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:28:25 GMT)
SkinMamba: A Precision Skin Lesion Segmentation Architecture with Cross-Scale Global State Modeling and Frequency Boundary Guidance [0.6]
皮膚病変のセグメンテーションは早期皮膚癌を同定するための重要な方法である。我々は、SkinMambaと呼ばれるMambaとCNNをベースとしたハイブリッドアーキテクチャを提案する。強力な長距離依存性モデリングとローカル機能抽出機能を提供しながら、線形複雑性を維持している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:02:38 GMT)
Corner Charge Fluctuation as an Observable for Quantum Geometry and Entanglement in Two-dimensional Insulators [0.5]
相互作用粒子の一般格子系では、角電荷のゆらぎは量子幾何学に直接関係していることを示す。この効果を解析的に説明するために、コンパクトな閉塞原子絶縁体のモデルが導入された。チャーン絶縁体モデルの数値検証により、有限サイズの量子シミュレータにおけるコーナー電荷変動の実験的妥当性がさらに証明される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:34:10 GMT)
Order Parameter Discovery for Quantum Many-Body Systems [0.5]
我々は、様々な量子系の位相図を構築するために、RFSベクトル場(reduced fidelity susceptibility)を用いている。次に、確立されたモデルの位相図を既知の順序パラメータで再現する効果を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:20:48 GMT)
Improving the Performance of Digitized Counterdiabatic Quantum Optimization via Algorithm-Oriented Qubit Mapping [0.5]
本稿では,ディジタル化された反断熱量子最適化アルゴリズムの性能向上戦略を提案する。提案手法は,誤差軽減を伴わない平均4.49$times$の近似比を増大させる。本研究は,量子ビットマッピングとアルゴリズムパラメータの最適化に適したアルゴリズム実装の符号設計に関する貴重な知見を提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:31:56 GMT)
Scale generalisation properties of extended scale-covariant and scale-invariant Gaussian derivative networks on image datasets with spatial scaling variations [0.5]
本稿では,スケール共変およびスケール不変ガウス微分ネットワークのスケール一般化特性を詳細に解析する。ガンマデリバティブネットワークは、Fashion-MNISTとCIFAR-10データセットの新たな再スケールバージョンで評価される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:51:04 GMT)
Electrons herald non-classical light [0.4]
自由電子による光の非古典状態のコヒーレントパラメトリック生成を実証する。量子化された電子エネルギー損失は、誘電体導波路で発生する光子の数を示す。このアプローチは、より数の多いフォックやその他の光学量子状態の調整された準備を容易にする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:55:54 GMT)
Towards Time Series Reasoning with LLMs [0.4]
本稿では,ゼロショット性能の強い領域にまたがる一般化可能な情報を学習する,新しいマルチモーダル時系列LPM手法を提案する。提案モデルでは,特定の時系列特徴を反映した潜時表現を学習し,ゼロショット推論タスクのセットにおいてGPT-4oより優れることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:23:44 GMT)
Error correction of transversal CNOT gates for scalable surface code computation [0.4]
制御NOT(tCNOT)ゲートは、コードブロック間の相関エラーを導入する。本稿では,スケーラブルでフォールトトレラントな量子計算のためのtCのための3種類の復号法の性能を検証し,ベンチマークする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:23:53 GMT)
Adaptive Reinforcement Learning for Robot Control [0.3]
課題や環境条件に応じて動的にポリシーを適応する新しい適応エージェントを提案する。このエージェントはIsaacGym上に作られたカスタムで高度に並列化されたシミュレータを使って訓練されている。実世界において、さまざまな課題を解くために、飛行飛行のためにゼロショット転送を行う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:29:43 GMT)
Two Stage Segmentation of Cervical Tumors using PocketNet [0.3]
この研究は、新しいディープラーニングモデル(PocketNet)を用いて、T2w MRI上の頸部、血管、子宮、腫瘍を分割した。 PocketNetはDice-Sorensen類似度係数 (DSC) を70%以上, 臓器分節率 (80%) で達成した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:48:12 GMT)
Learning Generalized Hamiltonians using fully Symplectic Mappings [0.3]
ハミルトン系は、保守的であり、すなわちエネルギーは進化を通して保存されるという重要な性質を持っている。特にハミルトニアンニューラルネットワークは、構造的帰納バイアスをNNモデルに組み込むメカニズムとして登場した。共振器のスキームはノイズに対して頑健であり,ノイズ観測から状態変数がサンプリングされた場合のハミルトニアン系の近似が良好であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:45:49 GMT)
A Systematization of the Wagner Framework: Graph Theory Conjectures and Reinforcement Learning [0.3]
アダム・ゾルト・ワグナー(Adam Zsolt Wagner)はReinforcement Learning (RL) を用いたグラフ理論の予想を解き放つアプローチを提案した。様々なRLアルゴリズムを用いた4つの異なるシングルプレイヤーグラフ構築ゲームを提案する。また、任意の予想に対して最も適切なニューラルネットワークアーキテクチャを選択するための原則的アプローチを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:42:43 GMT)
Harnessing AI data-driven global weather models for climate attribution: An analysis of the 2017 Oroville Dam extreme atmospheric river [0.3]
この分析は、2017年2月、カリフォルニア州北部で起きたオロビルダムの流出事故に繋がった、極端に大気中の川のエピソードに基づいている。過去と将来のシミュレーションは、インダストリアル前と21世紀後半の気温変化信号で初期条件を摂動することで生成される。全体として、AIモデルは有望な結果を示し、現在のオロビルダムにおける統合水蒸気は、工業以前のものに比べて5-6%増加したと予測している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 23:34:39 GMT)
Learning from Complementary Features [0.3]
我々は、正確な情報によって定義される特徴を通常の特徴(OF)、補完的な情報によって定義される特徴を補完的特徴(CF)と呼ぶ。本稿では,理論上保証されたグラフに基づく推定法と,その実用的な近似法を提案し,CFに対応する値の推定を行う。実世界のデータを用いて数値実験を行った結果,提案手法はCFに対応する値を効果的に推定し,出力ラベルを予測する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:03:38 GMT)
Scoring Anomalous Vertices Through Quantum Walks [0.3]
ラベルなしデータの場合、グラフ上の異常検出は、どのデータポイントが他のほとんどのデータに存在する潜在特性に当てはまらないかを決定する方法である。グラフを全ノードの均一な開始位置で連続的にトラバースすることで,各ノードの異常スコアを計算するための第1の量子アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:50:39 GMT)
Quantum algorithms for optimizers [0.2]
この講義ノートは量子アルゴリズムのPh.D.レベルのコースのためのものである。応用数学者や技術者向けに開発されており、以前の量子力学の背景を必要としない。このコースの主なトピックは、厳密な計算モデルの導入に加えて、入出力モデル、量子探索、量子勾配アルゴリズム、行列演算アルゴリズムである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:59:41 GMT)
MARS: Mask Attention Refinement with Sequential Quadtree Nodes for Car Damage Instance Segmentation [0.2]
本稿では,自動車損傷事例分割のためのMARS(Mask Attention Refinement with Sequential quadtree node)を提案する。実験により、MARSは3つの人気のあるベンチマークにおいて、最先端(SOTA)インスタンスセグメンテーション法より優れていることが示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:29:04 GMT)
Cross-lingual transfer of multilingual models on low resource African Languages [0.2]
単一の言語で訓練されたモノリンガルモデルは、ターゲット言語のニュアンスをよりよく捉えることができる。 AfriBERTは微調整後に最高88.3%の言語間精度を達成した。 BiGRUは83.3%の精度で最高のパフォーマンスのニューラルモデルとして登場した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:05:40 GMT)
Super Resolution On Global Weather Forecasts [0.2]
グループは,グローバル気象予測の空間分解能を高めることにより,既存の深層学習に基づく予測手法の改善を目指している。具体的には、大域的精度を1度から0.5度に高めることにより、グラフCast温度予測における超解像(SR)の実行に関心がある。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:07:13 GMT)
Halving the Cost of Quantum Algorithms with Randomization [0.1]
量子信号処理(QSP)は、線形演算子の変換を実装するための体系的なフレームワークを提供する。近年の研究では、量子チャネルへのユニタリゲートを促進する技術であるランダム化コンパイルが開発されている。提案アルゴリズムは, 平均進化が対象関数に収束するように戦略的に選択されたランダム化の確率的混合を実装し, 誤差は等価個体よりも2次的に小さい。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:03:37 GMT)
Designing Observables for Measurements with Deep Learning [0.1]
機械学習を用いて,対象とする観測対象を設計することを提案する。ニューラルネットワーク出力の展開された微分断面は、関心のパラメータに関する最も多くの情報を含んでいる。深部散乱の包括的測定に2つの物理モデルを用いたシミュレーションでこのアイデアを実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:56:30 GMT)
TivNe-SLAM: Dynamic Mapping and Tracking via Time-Varying Neural Radiance Fields [0.1]
本稿では,動的シーンの追跡と再構成を行うための時間変化表現を提案する。トラッキングプロセスとマッピングプロセスという2つのプロセスは、当社のフレームワークで同時に管理されます。従来のNeRFベースの動的SLAMシステムと比較すると,提案手法はトラッキングとマッピングの両面で競合する結果が得られることが検証された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:35:19 GMT)
A Reinforcement Learning Environment for Automatic Code Optimization in the MLIR Compiler [0.1]
本稿では,MLIRコンパイラ研究の促進を目的とした,MLIRコンパイラの最初のRL環境について紹介する。また、より単純なアクション部分空間の積として作用空間の新たな定式化を提案し、より効率的かつ効率的な最適化を可能にした。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:49:45 GMT)
Initial Guessing Bias: How Untrained Networks Favor Some Classes [0.1]
深層ニューラルネットワーク(DNN)の構造は、トレーニング開始前であっても、全ての予測を同じクラスに割り当てるようにモデルを条件付けることができることを示す。この現象の存在は,データセット前処理手法を含むモデル選択の影響を受けていることを実証する。ノード置換対称性の分解や自己回避の違反など理論的な結果を強調した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:18:09 GMT)
OneEncoder: A Lightweight Framework for Progressive Alignment of Modalities [0.1]
クロスモーダルアライメント学習は、テキスト、画像、オーディオ、ビデオなどのさまざまなモダリティからの情報を統合して、統一されたモデルを作成する。現在のテクニックは、大規模なモダリティ固有のエンコーダに依存しており、広範囲に整列したデータセット上で、スクラッチから微調整やトレーニングを必要とする。 OneEncoderは4つのモダリティを徐々に表現し調整する軽量フレームワークである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:38:46 GMT)
Estimating the distribution of numerosity and non-numerical visual magnitudes in natural scenes using computer vision [0.1]
数値性は累積領域や凸殻など,多くの連続的な等級と強く相関していることを示す。これは、なぜ数奇心がこれらの非数奇心の影響をしばしば受けているのかを説明できるかもしれない。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:49:29 GMT)
Enhanced segmentation of femoral bone metastasis in CT scans of patients using synthetic data generation with 3D diffusion models [0.1]
本稿では,3次元拡散確率モデル(DDPM)を用いた自動データパイプラインを提案する。 5675巻を新たに作成し,実データと合成データに基づいて3次元U-Netセグメンテーションモデルを訓練し,セグメンテーション性能を比較した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:21:19 GMT)
Elsevier Arena: Human Evaluation of Chemistry/Biology/Health Foundational Large Language Models [0.0]
エルゼビアで行われた生物医学領域(健康・生物学・化学・薬学)に焦点を当てた人体評価実験について述べる。比較的小さな (135B トークン) データセットでトレーニングされたデコーダのみの基礎変換器は OpenAI の GPT-3.5-turbo と Meta の基本 7B パラメータ Llama 2 モデルと比較される。結果は、一般的にIRRスコアが低かったとしても、GPT-3.5-turboが好まれており、会話能力を持つモデルが好まれており、非常に大きなデータセットでトレーニングされていることを示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:41:28 GMT)
NSSR-DIL: Null-Shot Image Super-Resolution Using Deep Identity Learning [0.0]
ISRタスクを学習するために,画像データセットに依存しない新しいISRアルゴリズムを提案する。本稿では,劣化モデルと逆劣化モデルとの同一性を利用したDeep Identity Learningを紹介する。提案したNSSR-DILモデルは、少なくとも10のオーダーで計算資源を少なくし、ベンチマークISRデータセット上での競合性能を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:43:07 GMT)
WaterQualityNeT: Prediction of Seasonal Water Quality of Nepal Using Hybrid Deep Learning Models [0.0]
本稿では,ネパールの季節的な水質を予測するためのハイブリッド深層学習モデルを提案する。このモデルは、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)を統合し、データの時間的および空間的パターンを活用する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:26:59 GMT)
Violation of no-signaling on a public quantum computer [0.0]
我々は、IBM Quantumデバイスからの量子ビットのバイパーティライトシステムにおいて、非常に大きな統計量で符号付けをテストした。 IBM Quantumの時間と空間スケールは原則としてサブルミナル通信を除外することはできないが、信号伝達に繋がる明らかな物理的メカニズムは存在しない。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:51:52 GMT)
Validating Traces of Distributed Programs Against TLA+ Specifications [0.0]
本稿では,分散プログラムのトレースをTLA+で記述された高レベル仕様に関連付けるためのフレームワークを提案する。この問題は、TLCモデルチェッカーを用いて実現した制約付きモデルチェック問題に還元される。提案手法を複数の分散プログラムに適用し,すべてのケースにおいて仕様と実装の相違を検出する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:52:15 GMT)
Unsupervised state learning from pairs of states [0.0]
各キュービットの余分なコピーが供給された場合、すなわち、1つのキュービットではなく、同じ状態の2組のキュービットを受け取ることが示される。次に、量子ビット対の列の測定を数値的にシミュレートし、未知の状態とその発生確率を高精度に知ることができることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:19:56 GMT)
Unlocking NACE Classification Embeddings with OpenAI for Enhanced Analysis and Processing [0.0]
欧州共同体における経済活動統計分類(英: Statistical Classification of Economic Activity in the European Community, NACE)は、欧州連合内の経済活動と産業活動の分類の標準分類体系である。本稿では,NACE分類を低次元埋め込みに変換するための新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:49:46 GMT)
Training Datasets Generation for Machine Learning: Application to Vision Based Navigation [0.0]
視覚ベースのナビゲーションは、画像から情報を抽出した後、GNCの精密センサーとしてカメラを利用する。宇宙アプリケーションにおける機械学習の採用を可能にするために、利用可能なトレーニングデータセットがアルゴリズムの検証に適していることの実証が障害のひとつだ。本研究の目的は,機械学習アルゴリズムの学習に適した画像とメタデータのデータセットを作成することである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:34:24 GMT)
Towards Novel Malicious Packet Recognition: A Few-Shot Learning Approach [0.0]
Deep Packet Inspection (DPI)は、ネットワークセキュリティを強化する重要な技術として登場した。本研究では,大規模言語モデル(LLM)と少数ショット学習を活用する新しいアプローチを提案する。提案手法は,マルウェアの種類によって平均精度86.35%,F1スコア86.40%の有望な結果を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:02:32 GMT)
Towards Ethical Personal AI Applications: Practical Considerations for AI Assistants with Long-Term Memory [0.0]
パーソナルAIの仲間やアシスタントは、AIとの対話の仕方に大きな変化を約束する。本稿では、LTM機能を備えたパーソナルAIアプリケーションの構築とデプロイに関する、より広範な意味について考察する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:48:29 GMT)
Time Crystals from single-molecule magnet arrays [0.0]
時間結晶はユニークな非平衡量子現象であり、現在の量子技術に期待できる。ここでは、周期的に駆動される分子磁石アレイにおける離散時間結晶を理論的に予測する。驚いたことに、時間-結晶応答周波数は個々の磁石のエネルギーレベルと相関している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:21:14 GMT)
The Role of AI Safety Institutes in Contributing to International Standards for Frontier AI Safety [0.0]
我々は、AI安全研究所(AISI)が、AI安全のための国際標準設定プロセスに貢献するように適切に設定されていると論じる。我々は、ソウル宣言署名者、米国(およびその他のソウル宣言署名者)、中国、グローバル包括的3つのモデルを提案し、評価する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:12:54 GMT)
The Jaynes-Cummings model and its descendants [0.0]
Jaynes-Cummings(JC)モデルは、現在まで約60年間、量子光学の最前線にある。この本は、特定の物理系における幅広い応用を見据えて、その形式主義の基本的な一般化を提起する。この展示は、量子光学と凝縮物質物理学をインターレースする活気のある場を通して読者を導く。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:12:44 GMT)
Technical Upgrades to and Enhancements of a System Vulnerability Analysis Tool Based on the Blackboard Architecture [0.0]
このシステムでは、ブラックボードアーキテクチャのルールファクトパラダイムに基づく一般化ロジックが実装された。本稿は,マルチスレッディングの実装を含む今後の研究の道筋について論じる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:06:42 GMT)
THaMES: An End-to-End Tool for Hallucination Mitigation and Evaluation in Large Language Models [0.0]
事実的に誤ったコンテンツの生成である幻覚は、大規模言語モデルにおいてますます困難になっている。本稿では,このギャップに対処する統合フレームワークとライブラリであるTHaMESを紹介する。 THaMES は LLM における幻覚の評価と緩和のためのエンドツーエンドのソリューションを提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:55:25 GMT)
SuperCoder2.0: Technical Report on Exploring the feasibility of LLMs as Autonomous Programmer [0.0]
SuperCoder2.0は、人工知能によるソフトウェア開発を強化するために設計された高度な自律システムである。システムは、AIネイティブな開発アプローチとインテリジェントエージェントを組み合わせて、完全に自律的なコーディングを可能にする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:44:42 GMT)
Strategic Insights in Human and Large Language Model Tactics at Word Guessing Games [0.0]
2022年の初めには、単純な言い回しゲームが嵐で世界を席巻した。本稿では,2年以上に渡り発展してきた日常的なゲームプレイヤーの戦略を考察する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:06:05 GMT)
Statistical Jump Model for Mixed-Type Data with Missing Data Imputation [0.0]
混合型データに対する統計的ジャンプモデルを提案する。このフレームワークには、状態持続性、解釈可能性の向上、状態スイッチの頻度の削減が含まれている。本研究では, 広範囲なシミュレーション研究と, 空気質データへの実証的応用を通して, 本手法の有効性を検証した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:42:50 GMT)
Sparks of Artificial General Intelligence(AGI) in Semiconductor Material Science: Early Explorations into the Next Frontier of Generative AI-Assisted Electron Micrograph Analysis [0.0]
我々は、ジェネレーティブAIの最近の進歩を活用する、完全に自動化されたエンドツーエンドパイプラインを導入します。提案手法では,GPT-4V などの大規模マルチモーダルモデル (LMM) と DALLE-3 のようなテキスト・ツー・イメージモデルを用いる。我々は、GPT-4ガイド付き視覚質問応答法(VQA)を統合し、ナノマテリアル画像を分析し、DALLE-3を介して合成ナノマテリアル画像を生成し、GPT-4Vで数発のプロンプトによるインコンテキスト学習を用いて正確なナノマテリアル識別を行う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:25:27 GMT)
Solving the Hele-Shaw flow using the Harrow-Hassidim-Lloyd algorithm on superconducting devices: A study of efficiency and challenges [0.0]
実用的な流体流問題を扱う量子プロセッサの開発は、遠いが有望なフロンティアを表している。量子アルゴリズム、特に線形解法における最近の進歩は、古典的な流体解法に対する量子解への道のりを照らしている。本研究では,古典型QLSA,Harrow-Hassidim-Lloyd (HHL) アルゴリズムを用いて,理想化された流体流動問題を管理する線形方程式のシステムを正確に解く能力について検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:44:08 GMT)
Simple Diagonal Designs with Reconfigurable Real-Time Circuits [0.0]
実時間進化に基づく簡便で効率的な対角的状態設計を提案する。我々の回路は完全に再構成可能であり、デジタルプラットフォームとアナログプラットフォームの両方での短期的な実現に適している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:06:44 GMT)
Security Camera Movie and ERP Data Matching System to Prevent Theft [0.0]
日本では万引きの被害総額が450億円に達する。クラウドとデータ分析技術に基づいて,小店舗の防犯カメラとERPデータチェックの画像解析による万引き防止サービスを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:55:21 GMT)
Says Who? Effective Zero-Shot Annotation of Focalization [0.0]
物語が提示される視点であるフォカライゼーションは、幅広い語彙文法的特徴を通じて符号化される。本研究では,同時代のLarge Language Models (LLMs) が,文章のアノテート時にいかに機能するかを検証する実験を行う。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:50:15 GMT)
Sample Complexity Bounds for Linear System Identification from a Finite Set [0.0]
我々は、真のシステムを特定するために、最大可能性推定器を使用する。情報理論のツールを活用して、サンプルの複雑さを低くする。得られたサンプル複雑性境界を解析的および数値的に解析する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:52:16 GMT)
SIG: A Synthetic Identity Generation Pipeline for Generating Evaluation Datasets for Face Recognition [0.0]
我々は、顔認識評価のための倫理的バランスの取れたデータセットをターゲットとするSIG(Synthetic Identity Generation Pipeline)を導入する。我々のパイプラインは、人種、性別、年齢など、制御可能なポーズ、顔の特徴、人口特性を持つ合成アイデンティティの高品質な画像を生成する。また、人種、性別、年齢間でバランスのとれた3,336のユニークな合成アイデンティティの10,008の顔画像からなる、ControlFace10kというオープンソースの評価データセットもリリースしました。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:19:24 GMT)
SEDNet: Shallow Encoder-Decoder Network for Brain Tumor Segmentation [0.0]
本稿では,SEDNetと呼ばれる新しい浅層エンコーダとデコーダネットワークを含む腫瘍セグメンテーションフレームワークを提案する。 SEDNetのハイライトは、階層的畳み込みダウンサンプリングにおける十分さと、コスト効率が高く効果的な脳腫瘍セマンティックセグメンテーションのための選択的スキップメカニズムである。 SEDNet(X)は、約130万のパラメータと、最先端のSEDNet(X)と比較すると、リアルタイム臨床診断において計算的に効率的であることが示されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:23:16 GMT)
REG: Refined Generalized Focal Loss for Road Asset Detection on Thai Highways Using Vision-Based Detection and Segmentation Models [0.0]
本稿では,タイの高速道路における重要道路資産の検出・分断のための新しい枠組みを提案する。提案手法は,最先端の視覚に基づく検出・セグメンテーションモデルに統合され,クラス不均衡と,未表現の道路要素の局所化の課題に効果的に対処する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:30:22 GMT)
Quantum-limited optical lever measurement of a torsion oscillator [0.0]
トルク感度10-20,textN m/sqrttextHz$およびゼロ点スペクトル密度10-10,textrad/sqrttextHz$を有するSi$_3$N$_4$ナノリボンの光レバー計測について述べる。我々の研究は、新しいねじり量子光学のクラスの可能性を示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:56:02 GMT)
Quantum jumps in amplitude bistability: tracking a coherent and invertible state localization [0.0]
オープン駆動Jaynes-Cummingsモデルにおける光の巨視的準安定状態間の量子ジャンプについて検討する。その結果、[H. J. Carmichael, Phys. Rev. X 5, 031028] で考慮されたゼロ自然放出の限界において、高光子状態から真空状態へのジャンプには2つの段階があることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:08:48 GMT)
Quantum Machine Learning in the Cognitive Domain: Alzheimer's Disease Study [0.0]
アルツハイマー病(英語: Alzheimer's disease、AD)は、神経変性疾患の1つである。認知障害に影響されるタスクの1つは手書きである。古典的人工知能(AI)手法の最近の進歩は、手書き解析によるADの検出において有望であることを示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:03:28 GMT)
Quantum Approximate Optimization Algorithm with Cat Qubits [0.0]
猫の量子ビットを用いたQAOAを用いてMaxCut問題の解法を数値シミュレーションする。猫の量子ビットを用いたQAOAの実行は、2レベルシステムに符号化された量子ビットに対して、MaxCutのランダムなインスタンスに対する近似比を増大させることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:15:55 GMT)
Quantitative Evaluation of MILs' Reliability For WSIs Classification [0.0]
MILモデルの信頼性を3つの提案指標と比較し、3つのリージョンワイドアノテートデータセットを使用する。アーキテクチャ設計や計算効率は高いが,平均プールインスタンス(MEAN-POOL-INS)モデルは,他のネットワークよりも信頼性が高い。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:04:18 GMT)
QuADTool: Attack-Defense-Tree Synthesis, Analysis and Bridge to Verification [0.0]
攻撃防御木を簡易に合成・解析するツールを提供する。既存のモデルチェッカーや分析ツールにさまざまなインターフェースを提供する。ツールの一部として、標準解析手法を拡張して、PAC入力を処理し、最終的な結果の不正確さと不確実性に厳密な境界を与える。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:47:45 GMT)
Propulsion: Steering LLM with Tiny Fine-Tuning [0.0]
本稿では,タスク固有性能を最適化するために,新しいパラメータ最適化手法であるPropulsionを提案する。物理運動の制御調整の概念にインスパイアされた推進は、事前訓練されたモデルの特定の次元を選択的に再スケールする。我々の理論解析はニューラル・タンジェント・カーネル(NTK)理論によって支えられ、推進は訓練可能なパラメータがはるかに少ない完全な微調整の性能を近似することを示している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:51:59 GMT)
ProSLM : A Prolog Synergized Language Model for explainable Domain Specific Knowledge Based Question Answering [0.0]
ニューロシンボリックアプローチは説明可能なシンボル表現を取り入れることで、不透明な神経系に堅牢性を加えることができる。本稿では,大規模言語モデルの堅牢性と信頼性を向上させるために,ニューロシンボリックな新しいフレームワークであるシステム名を提案する。我々の研究は、ニューロシンボリックな生成AIテキスト検証とユーザパーソナライゼーションの新しい領域を開く。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:34:33 GMT)
Practical Aspects on Solving Differential Equations Using Deep Learning: A Primer [0.0]
このプライマーはDeep Galerkin法に関する技術的および実践的な洞察を提供することを目的としている。一次元の熱方程式を段階的に解く方法を示す。また、通常の微分方程式や積分方程式の系にディープ・ガレルキン法を適用する方法を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:25:51 GMT)
Polarization Entanglement with highly non-degenerate photon pairs enhanced by effective walk-off compensation method [0.0]
バルク偏極ニオブ酸リチウム(PPLN)結晶を用いた非縮退光子対の偏光絡みを実証した。両屈折性結晶ウェッジを用いた有効補償法を導入し,空間的および時間的歩行を同時に除去する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:50:56 GMT)
Photon Statistics from Non-Hermitian Floquet Theory: High Harmonic Generation and Above-Threshold Ionization Spectra Detected via IR Detectors [0.0]
統一されたメカニズムは、高調波発生スペクトル(HGS)、高閾値イオン化(ATI)、赤外線光子数分布の3つの異なる測定を制御している。 XUV検出器によって検出されたHGSとAITスペクトルは、赤外線吸収光子の変動を監視して得られる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:22:01 GMT)
Periodic classical trajectories and quantum scars in many-spin systems [0.0]
カオス多体系における例外的周期的古典軌道の安定性を数値的に検討する。我々は、これらの軌道と「量子多体傷」として知られる例外的な非熱量子固有状態との間の接続の可能性を探る。本研究は,スピン3/2以上の数値的にアクセス可能な有限鎖に対する量子多体傷の存在を明らかにする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:26:19 GMT)
Performance of Cross-Validated Targeted Maximum Likelihood Estimation [0.0]
CVTMLE と TMLE を比較し,様々な環境における CVTMLE の性能について検討した。 CVTMLEは、バイアスに悪影響を及ぼすことなく、信頼区間のカバレッジを大幅に改善する。 CVTMLEは超学習者ライブラリの選択にはるかに敏感であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:15:03 GMT)
PReLU: Yet Another Single-Layer Solution to the XOR Problem [0.0]
本稿では,Parametric Rectified Linear Unit (PReLU) を用いた単一層ニューラルネットワークが,XOR問題を解くことができることを示す。以上の結果から, 単層PRELUネットワークは, より広範な学習率で100%の成功率を達成することができることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:28:40 GMT)
Operational Wind Speed Forecasts for Chile's Electric Power Sector Using a Hybrid ML Model [0.0]
チリの火力発電所における風と太陽からの断続的な発電の増加の影響を定量化する。本稿では,チリの2つのカスタムMLモデルを組み合わせたハイブリッド風速予測手法を提案する。提案手法は,短期予測では4～21%,中期予測では5～23%,最も正確な運用決定システムより優れている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:25:49 GMT)
On the Similarity of Deep Learning Representations Across Didactic and Adversarial Examples [0.0]
野におけるアドリラルな例は、正確に予測モデリングを行う上で、必然的に有害であることを示すかもしれない。入力空間における逆例の頻度に応じて,表現的類似性と性能が変化することを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:01:42 GMT)
Non-Universality from Conserved Superoperators in Unitary Circuits [0.0]
量子制御理論における重要な結果は、2ドルの局所ユニタリゲートの「ユニバーサリティ」である。近年の研究では、普遍性は対称性の存在下で崩壊する可能性があることが示されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:59:42 GMT)
Neural Networks with LSTM and GRU in Modeling Active Fires in the Amazon [0.0]
本研究は,ブラジルのアマゾンにあるAQUA_M-T衛星によって検出された活動点の歴史的時系列をモデル化し,予測するための包括的方法論を提案する。このアプローチでは、Long Short-Term Memory(LSTM)とGated Recurrent Unit(GRU)アーキテクチャを組み合わせた混合リカレントニューラルネットワーク(RNN)モデルを採用して、毎日検出されたアクティブファイアスポットの月次蓄積を予測する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:12:11 GMT)
Neural Networks for Vehicle Routing Problem [0.0]
ルート最適化はニューラルネットワークの新たな課題と見なすことができる。機械学習の最近の進歩は、複雑な問題に対処するための新しいツールセットを提供する。ニューラルネットワークを応用する主な領域は、分類と回帰の領域である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:45:30 GMT)
Navigating Process Mining: A Case study using pm4py [0.0]
本稿では,Python の pm4py ライブラリを用いた道路交通管理プロセスの包括的解析を行う。フィルタリングと統計的解析により、プロセスの実行における重要なパターンとバリエーションを明らかにする。発見されたモデルを視覚化して、プロセス内のワークフロー構造と依存関係を理解します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:48:46 GMT)
Multiphoton interference in a single-spatial-mode quantum walk [0.0]
多光子干渉は多くのフォトニック量子技術にとって重要である。ここでは、最大24個の超高速時間ビンを備えた、高度に安定で低損失なマルチポート干渉計で量子ウォークを実装した。以上の結果から,超高速時間ビンは大規模多光子干渉を観測する上で有望なプラットフォームであることが示された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:14:54 GMT)
Multipartite entanglement vs nonlocality for two families of $N$-qubit states [0.0]
多重量子ビットの量子状態は、量子ビット間の絡み合いがあるときにベル型不等式に反し、相関の非局所的な振る舞いを示す。 Svetlichnyの不等式違反を特徴とする多部構造と真の多部構造非局所性の関係を,N-$qubit状態の2つのファミリに対して解析した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:51:41 GMT)
Modified Jarzynski equality in a microcanonical ensemble [0.0]
従来のジャジンスキーの等式はマイクロカノニカルアンサンブルで用意されたシステムには当てはまらないことを示す。マイクロカノニカルな作業のゆらぎとエントロピー生産を結合する修正等式を導出する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 00:56:51 GMT)
Modeling a frustrated Ising square lattice with the D-Wave Quantum Annealer [0.0]
より複雑なIsingモデルとして、D-Wave量子アニールの実装方法を示す。このシステムの力学はフラストレーションのため、単純なイジングモデルよりもリッチである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:07:34 GMT)
Mobility-GNN: a human mobility-based graph neural network for tracking and analyzing the spatial dynamics of the synthetic opioid crisis in the USA, 2013-2020 [0.0]
オピオイド(Opioids)は、アメリカ合衆国で最も一般的な薬物である。 2018年、薬物過剰摂取死の約70%がオピオイドであり、オピオイド関連死亡の67%が合成オピオイドである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 03:18:25 GMT)
Mesh-based Super-Resolution of Fluid Flows with Multiscale Graph Neural Networks [0.0]
メッシュベースの流体の3次元超解像を可能にするグラフニューラルネットワーク(GNN)アプローチが本研究で導入された。このフレームワークでは、GNNは一度に完全なメッシュベースのフィールドでではなく、要素(またはセル)の局所的なメッシュで動くように設計されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:05:17 GMT)
Measurement resolution enhanced coherence for lattice fermions [0.0]
本研究では, 1次元格子中の弱い非相互作用フェルミオンからなる最小多粒子モデルについて検討する。最大32箇所の系に対するこれらのBFSの特性を計算し、測定分解能が適度に低下しても、非自明な定常的絡み合いとコヒーレンスをもたらすことを発見した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:57:07 GMT)
Manipulating Two-Photon Absorption of Molecules through Efficient Optimization of Entangled Light [0.0]
ベイズ最適化に基づく新しい包括的最適化プロトコルが本研究で開発されている。チオフェンデンドリマーの絡み合った2光子吸収確率を最大20倍に向上させることができる。最適化に加えて、小さな絡み合い時間限界における2光子吸収の絡み合いについて検討した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:17:01 GMT)
Machine Learning for Public Good: Predicting Urban Crime Patterns to Enhance Community Safety [0.0]
本稿では,都市部における犯罪の空間的・時間的パターンを予測するML手法の有効性について検討する。研究目標は、呼び出しを優先度レベルに分類する際の高い精度を達成することである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:07:14 GMT)
Lite-FBCN: Lightweight Fast Bilinear Convolutional Network for Brain Disease Classification from MRI Image [0.0]
現在のディープラーニング手法は、精度と計算要求のバランスをとるのに苦労することが多い。軽量高速双線形畳み込みネットワークLite-FBCNを提案する。 Lite-FBCNはクロスバリデーションで98.10%、ホールドアウトデータで69.37%の精度を実現している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:40:06 GMT)
Leveraging Distillation Techniques for Document Understanding: A Case Study with FLAN-T5 [0.0]
本稿では,LLM ChatGPTから文書理解知識をFLAN-T5に抽出する手法を提案する。本研究は, 実世界のシナリオにおける高度言語モデルの展開を促進する蒸留技術の可能性を明らかにするものである。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:37:56 GMT)
Learning Unstable Continuous-Time Stochastic Linear Control Systems [0.0]
有限長状態軌跡に基づく連続時間力学におけるシステム同定の問題について検討する。適切なランダム化制御入力を用いて不安定なオープンループ行列を推定する手法を提案する。我々は,推定誤差が軌道長,励起率,信号対雑音比で減衰することを示す理論的性能保証を確立する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:24:51 GMT)
Large language models can replicate cross-cultural differences in personality [0.0]
我々は大規模な実験を行い、GPT-4がビッグファイブの異文化間差異を再現できるかどうかを検証した。私たちはアメリカと韓国を文化のペアとして使いました。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:47:51 GMT)
LYT-NET: Lightweight YUV Transformer-based Network for Low-light Image Enhancement [0.0]
LYT-Netは低照度画像強調(LLIE)のための新しい軽量トランスモデルである本手法では, 蛍光チャネルU, V, 発光チャネルYを別個のエンティティとして扱い, 照明調整や劣化復旧の精度向上に寄与する。確立されたLLIEデータセットに対する包括的評価は、その複雑さが低いにもかかわらず、我々のモデルは最近のLLIE法よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:24:44 GMT)
LLM-Agent-UMF: LLM-based Agent Unified Modeling Framework for Seamless Integration of Multi Active/Passive Core-Agents [0.0]
LLMベースのエージェントへのツールの統合は、スタンドアロンのLCMと従来のエージェントの限られた能力の難しさを克服する。本稿では,LLMを基盤としたエージェント開発のための基盤を,機能的・ソフトウェア的両面から確立した統一的なフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:54:17 GMT)
Knot invariants and indefinite causal order [0.0]
任意の有限個の事象に対する因果順序の不確定性の度合いと、重ね合わせにおける時空構成を測定するために、いくつかの新しい量化器を導入する。事象間の因果次数の図式的および結び目論的表現を構築することにより、因果次数の定性または最大不定性は位相不変であることが分かる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:36:25 GMT)
Insightful Railway Track Evaluation: Leveraging NARX Feature Interpretation [0.0]
本稿では,NARX手法とロジスティック回帰を融合した分類アルゴリズム,ロジスティック・NARX Multinomialを紹介する。さらに, 鉄道分野に適した革新的な手法を導入し, NARXモデルを用いて, 搭載センサから得られる特徴の多様さを解釈するツールを提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:40:45 GMT)
Inferno: An Extensible Framework for Spiking Neural Networks [0.0]
InfernoがCPUとGPUの両方でトレーニング可能な不均一遅延をどのようにサポートしているかを示す。 Infernoは、新しいモデルや技術のための"書き込み1回、適用至るところで"開発方法論を可能にするかを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:44:40 GMT)
In-situ measurements of light diffusion in an optically dense atomic ensemble [0.0]
本研究は, 低温原子の光学的に厚いアンサンブル内での光輸送をその場で調査するための新しい手法を提案する。大型原子雲の中心に光励起を生成する方法を示す。雲の大きさが輸送平均自由経路よりもかなり大きい場合、拡散状態が同定される。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 12:14:59 GMT)
Improve Machine Learning carbon footprint using Parquet dataset format and Mixed Precision training for regression algorithms [0.0]
この研究は私の修士論文の2番目だった。回帰MLモデルをトレーニングしながら、Comma-Separated-Values(CSV)とparquetデータセットフォーマットを使用した消費電力を、デフォルトの浮動小数点(32bit)とNvidiaの混合精度(16bitと32bit)と比較した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:53:03 GMT)
Image-to-Image Translation Based on Deep Generative Modeling for Radiotherapy Synthetic Dataset Creation [0.0]
本研究の目的は、深部生成モデルに基づく画像画像変換(I2I)による合成EPIDデータの改善である。この強化された合成データは、放射線治療における自動エラー検出とエラー分類のためのニューラルネットワークのトレーニングのような下流タスクを改善することが期待されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:51:41 GMT)
IBM Quantum Computers: Evolution, Performance, and Future Directions [0.0]
IBM Quantumはハードウェアとソフトウェアの両面で大きな進歩を遂げており、2016年からIBM Cloudを通じて量子ハードウェアへのアクセスを提供している。我々は、IBM Quantumのプロセッサの進化と進化を、1000キュービットの障壁を超えた最近のブレークスルーを含む世代にわたって要約する。この論文は、様々なハードウェアのパフォーマンス指標の詳細をレビューし、時間とともにその進化をトレースし、IBM Quantumがノイズの多い中間スケール量子(NISQ)コンピューティング時代からフォールトトレラントな量子コンピューティング能力へ移行したことを強調した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:50:50 GMT)
High School Summer Camps Help Democratize Coding, Data Science, and Deep Learning [0.0]
本研究は,高校生がコーディング,データサイエンス,深層学習に導入するサマーキャンプシリーズの影響について報告する。キャンプは没入的な大学経験を提供し、技術スキル、コラボレーション、インスピレーションを育んでいる。調査データによると、AIとデータサイエンスのキャリアへの関心が68.6%と、コーディングに対する自信が増している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:59:39 GMT)
Harvesting magic from the vacuum [0.0]
この手紙は、初期真空状態の量子場と相互作用する3レベルのUnruh-DeWitt検出器(量子ビット)によって魔法を収穫できることを示している。量子場理論(QFT)から資源を抽出するという考え方は、絡み合いの収穫から生まれたものであるが、この結果は、石英を非魔法の状態から魔法の状態へと進化させるためのプロトコルを拡張した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:02:20 GMT)
HEARTS: A Holistic Framework for Explainable, Sustainable and Robust Text Stereotype Detection [0.0]
HEARTS (Holistic Framework for Explainable, Sustainable, and Robust Text Stereotype Detection)は、モデル性能を高め、炭素フットプリントを最小化し、透過的で解釈可能な説明を提供するフレームワークである。我々は、LGBTQ+や地域ステレオタイプなど、6つのグループにわたる57,201のラベル付きテキストからなるEMGSD(Expanded Multi-Grain Stereotype dataset)を確立する。そして、SHAPを用いて微調整された炭素効率のALBERT-V2モデルを解析し、トークンレベルの重要度を生成し、人間の理解と整合性を確保し、SHAPとLIMEを比較して説明可能性の信頼性スコアを算出する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:06:46 GMT)
Good Grasps Only: A data engine for self-supervised fine-tuning of pose estimation using grasp poses for verification [0.0]
ビンピッキングのためのポーズ推定の自己教師型微調整法を提案する。本手法により,手動ラベリングを使わずにトレーニングデータを自動的に取得できる。私たちのパイプラインは、プロセス実行中にシステムを微調整し、学習フェーズの必要性を排除します。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:26:21 GMT)
Fundamentals of legislation for autonomous artificial intelligence systems [0.0]
本稿では、自律型コーポレートマネジメントシステムのための専用の運用コンテキストを構築する方法を提案する。運用のコンテキストの重要な部分は、企業が運営する規制と法的環境である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:50:23 GMT)
Fractional Naive Bayes (FNB): non-convex optimization for a parsimonious weighted selective naive Bayes classifier [0.0]
非常に多数の入力変数を持つデータセットの分類を監督した。本稿では,このモデルを用いたBalihoodの正規化を提案する。提案したアルゴリズムは最適化に基づく重み付けNa"iveesスキームをもたらす。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:54:14 GMT)
Flatbands in tight-binding lattices with anisotropic potentials [0.0]
ブラヴェス格子上の強結合モデルは、ある方向に沿って変化し、横方向に沿って一定である異方性オンサイトポテンシャルを持つ。反$mathcalPT$対称ハミルトニアンのフラットバンドに関するこれまでの研究に触発され、ホッピングとポテンシャルの形状を調整して反$mathcalPT$フラットバンドを構築する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:37:35 GMT)
Fault Detection and Identification via Monitoring Modules Based on Clusters of Interacting Measurements [0.0]
本研究は,対話的計測のクラスタからなるモジュールをベースとした,制御対応の分散プロセス監視手法を提案する。この手法は、モニタリングモジュールの完全な主成分分析(f-PCA)を使用して、テネシー・イーストマン・プロセスのベンチマークで検証されている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:17:56 GMT)
Fast characterization of multiplexed single-electron pumps with machine learning [0.0]
単一電子ポンプデバイスを現在の量子化方式にチューニングするための機械学習に基づく効率的な自動化フレームワークを提案する。 GaAs/AlGaAsマルチプレクサアレイに配列された28個のデバイスを特徴付けることで,フレームワークのロバスト性を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:06:31 GMT)
Fast Analysis of the OpenAI O1-Preview Model in Solving Random K-SAT Problem: Does the LLM Solve the Problem Itself or Call an External SAT Solver? [0.0]
私は、モデルが直接解決するのではなく、外部SATソルバを呼び出しインスタンスを解決できることを示します。我々は,OpenAI O1-previewモデルがインテリジェンスの火花を示すかどうかを定量化する分析法を提案し,提示する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:29:03 GMT)
Evaluation of pretrained language models on music understanding [0.0]
その結果, 言語モデル(LLM)は, 1) アクセシビリティ, 2) 否定をモデル化できないこと, 3) 特定の単語の存在に対する感受性に悩まされていることがわかった。我々はこれらの特性を三重項に基づく精度として定量化し、階層的オントロジーにおいてラベルの相対的類似性をモデル化する能力を評価した。比較的高い精度が報告されているにもかかわらず、6つのモデルすべてに矛盾があることは明らかであり、既製のLLMは使用前に音楽に適応する必要があることを示唆している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:44:49 GMT)
Evaluating the Impact of Compression Techniques on Task-Specific Performance of Large Language Models [0.0]
大規模言語モデル(LLM)は強力な能力を提供するが、かなりの計算コストがかかる。本研究では,LLaMA-2-7Bモデルに対する圧縮法の影響について検討した。 SparseGPTとWandaは50%の間隔でも難易度を保っているが,下流タスクでは著しく低下している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:34:11 GMT)
Evaluating Modifications to Classifiers for Identification of Higgs Bosons [0.0]
ヒッグス粒子は、2012年にATLASとCMSの実験によって大型ハドロン衝突型加速器(LHC)の衝突データによって発見された。本稿では、量子機械学習(QML)を用いて、この分類問題に取り組むことを目的とする。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:41:30 GMT)
Evaluating Investment Risks in LATAM AI Startups: Ranking of Investment Potential and Framework for Valuation [0.0]
この研究は、テクノロジースタートアップ投資の新興勢力のランキングの開発を通じて、この地域におけるAI主導のスタートアップの可能性と収益性を強調している。本稿は、スタートアップが直面する政治的、経済的、競争的なリスクについても検討し、投資リターンを最大化するためにこれらのリスクを軽減するための戦略的洞察を提供する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:31:46 GMT)
Estimating the Unobservable Components of Electricity Demand Response with Inverse Optimization [0.0]
価格に対する電力需要の反応を理解し予測することは、システムオペレーター、小売業者、規制当局にとって重要な活動である。ソーラー・プラス・ストレージ・システムや電気自動車といった柔軟な資産を持つアクティブ・コンシューマーの出現は、新たな課題をもたらす。我々は、需要の主成分であるベースロード、フレキシブル、セルフジェネレーションを定義し、それぞれが市場価格信号に対する非線形応答を持つ。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:17:31 GMT)
Entanglement-assisted classical capacities of some channels acting as radial multipliers on fermion algebras [0.0]
我々は$mathrmM_2k$上の新しい単位量子計算チャネルのクラスについて検討する。有限次元フェルミオン代数を持つ行列代数 $mathrmM_2k$ を同定する。我々の計算はフェルミオンオルンシュタイン-ウレンベック半群の作用素に適用できる正確な値を得る。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:39:57 GMT)
Enhancing Security Testing Software for Systems that Cannot be Subjected to the Risks of Penetration Testing Through the Incorporation of Multi-threading and and Other Capabilities [0.0]
SONARRは複雑なミッションクリティカルシステムのためのシステム脆弱性解析ツールである。本稿では,マルチスレッドSONARRアルゴリズムと他の拡張アルゴリズムの性能について述べる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:09:10 GMT)
Enhancing Mental Health Support through Human-AI Collaboration: Toward Secure and Empathetic AI-enabled chatbots [0.0]
本稿では、スケーラブルなソリューションとしてのAI対応チャットボットの可能性について検討する。メンタルヘルスの文脈で共感的で有意義な反応を提供する能力を評価する。本稿では,データプライバシを保証し,バイアスを低減し,臨床医による継続的検証を統合して応答品質を向上させるためのフェデレート学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:49:13 GMT)
Enhancing ICT Literacy and Sustainable Practices in the Hospitality Industry: Insights from Mnquma Municipality [0.0]
本研究は,南アフリカ共和国ケープ州東部農村部におけるICTリテラシーとICT導入の意義について考察した。 21人の小規模選手(BnBs、ゲストハウス、非サービス施設)のランダムなサンプルが選択された。データを記述統計とKruskal-Wallis H Testを用いて解析し,ICT使用率の差について検討した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:41:34 GMT)
Enhancement of efficiency in the Dicke model quantum heat engine [0.0]
我々は、全ディックモデルで記述された量子熱エンジンを解析する。量子相転移に関連する基底状態縮退と最大効率の関係について検討した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:05:51 GMT)
Egalitarian Language Representation in Language Models: It All Begins with Tokenizers [0.0]
すべてのトークンライザが、Tamil、Sinhala、Hindiといった複雑なスクリプト言語に対して公正な表現を提供するわけではないことを示す。本稿では,Grapheme Pair と呼ばれるグラフエムを組み込むことにより,Byte Pair アルゴリズムの改良を提案する。実験の結果, 文字抽出は複雑なスクリプトに対して, バイトレベルのトークン化器よりも優れていることがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:05:37 GMT)
Efficient Numerical Calibration of Water Delivery Network Using Short-Burst Hydrant Trials [0.0]
本研究は,WDNの圧力勾配を増大させる短時間水和剤試験を用いたキャリブレーション法を提案する。 WDNゾーンのユニークな実世界のケーススタディでは、日々の使用量に基づくキャリブレーションと比較して、我々の手法の統計的に有意な優位性を示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:49:26 GMT)
Effective Distance of Higher Dimensional HGPs and Weight-Reduced Quantum LDPC Codes [0.0]
重み付きqLDPC符号の有効距離を保った単一アンシラシンドローム抽出回路が存在することを示す。その結果, 単一アンシラシンドローム抽出回路を用いた場合, 高次元ハイパーグラフ製品コードには問題ないことがわかった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:35:40 GMT)
Early Detection of Coronary Heart Disease Using Hybrid Quantum Machine Learning Approach [0.0]
冠動脈疾患(CHD)は重症心疾患であり,早期診断が不可欠である。量子コンピューティングと機械学習(ML)技術の主流となる開発は、CHD診断の性能に実用的な改善をもたらす可能性がある。医療業界における量子的な飛躍は、処理能力を高め、複数のモデルを最適化する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 07:08:39 GMT)
Direct experimental observation of sub-poissonian photon statistics by means of multi-photon scattering on a two-level system [0.0]
半無限導波路に強く結合した2レベル超伝導人工原子のカスケードは、量子非線形光学において非自明な現象を観測するための有望なツールである。我々は、コヒーレントcw励起源からの非古典光とプローブに作用する他のコヒーレント波との波動混合を実験的に実証した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:15:48 GMT)
Digital Ecosystem for FAIR Time Series Data Management in Environmental System Science [0.0]
本稿では時系列データを管理する汎用的で転送可能なデジタルエコシステムを提案する。システムは高度に適応可能で、クラウド対応で、幅広い設定でデプロイするのに適しています。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:25:12 GMT)
Detecting and protecting entanglement through nonlocality, variational entanglement witness, and nonlocal measurements [0.0]
エンタングルメント(Entanglement)は、計算、通信などにおける量子力学における鍵となる概念である。我々は,Cluser-Horne-Shimony-Holtの不等式をエンタングルメント尺度として使用し,より完全な検出のための変分エンタングルメント証人を導入する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 02:38:58 GMT)
Deep Learning with CNNs: A Compact Holistic Tutorial with Focus on Supervised Regression (Preprint) [0.0]
このチュートリアルは、畳み込みニューラルネットワーク(CNN)と教師付き回帰に焦点を当てている。最も関連する概念を要約するだけでなく、それぞれを深く掘り下げて、完全なアジャイルのアイデアセットを提供する。本チュートリアルは,Deep Learningの基礎を理解することに関心のある学生,教授,研究者にとって最適な情報源となることを目的としている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:22:18 GMT)
Cyber Protection Applications of Quantum Computing: A Review [0.0]
スキャン検査は 815件の論文を検討して行われました。サイバー保護のための多くの量子コンピューティングアプリケーションと、データとプライバシを保護するための多くのテクニックが同定された。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:03:38 GMT)
Cost-informed dimensionality reduction for structural digital twin technologies [0.0]
本稿では,構造資産管理における次元削減に関する決定論的アプローチを定式化する。識別情報が失われる可能性があるため、誤分類コストを最小限に抑えることが目的である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:37:00 GMT)
Contextual Breach: Assessing the Robustness of Transformer-based QA Models [0.0]
文脈問合せモデルは、入力コンテキストに対する逆の摂動に影響を受けやすい。異なる7種類の対立雑音を文脈に組み込んだユニークなデータセットを導入する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:00:11 GMT)
Constructive Apraxia: An Unexpected Limit of Instructible Vision-Language Models and Analog for Human Cognitive Disorders [0.0]
本研究は、視覚言語モデル(VLM)と人間の認知障害、特に建設的失語症との予期せぬ平行関係を明らかにする。コンストラクティブ・アプラキシアの臨床的評価において,基本的空間推論を必要とするポンゾイリュージョンの画像を生成する能力について,25種類の最先端のVLMを検証した。注目すべきは、25モデル中24モデルが2本の水平線を視界の背景に対して正しくレンダリングできなかったことだ。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:46:57 GMT)
Complex-valued convolutional neural network classification of hand gesture from radar images [0.0]
本稿では,すべてのビルディングブロック,前方および後方操作,および複雑な領域における導関数を含む完全なCV-CNNを提案する。本稿では,2組のCVハンドジェスチャーレーダ画像の分類モデルについて,等価なRVモデルと比較検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:49:14 GMT)
Competing topological phases in a non-Hermitian time-reversal symmetry-broken Bernevig-Hughes-Zhang model [0.0]
スピン依存非エルミート平衡ゲイン/ロスポテンシャルの包含は、これらの第1次位相と第2次位相の競合を引き起こすことを示す。驚くべきことに、ナノリボンの再表面におけるそれまで休眠していた1次ヘリカルエッジ状態は、非エルミート効果が増大する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:02:32 GMT)
Clinical Validation of a Real-Time Machine Learning-based System for the Detection of Acute Myeloid Leukemia by Flow Cytometry [0.0]
フロー内の機械学習(ML)モデルは、エラー率を低減し、効率を向上し、臨床実験室の効率を向上する可能性がある。このようなモデルの臨床的展開についてはほとんど研究されていない。急性骨髄性白血病(AML)の検出のためのMLモデルと臨床実装を支えるインフラについて述べる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:53:47 GMT)
Challenging Excited States from Adaptive Quantum Eigensolvers: Subspace Expansions vs. State-Averaged Strategies [0.0]
ADAPT-VQEは分子の基底状態を得るための単一の参照手法である。 MORE-ADAPT-VQEは、避けられた交差と異なる対称性の状態間の交差の両方を正確に記述することができる。これらの改善は、難しい励起状態問題に対する量子コンピュータの使用に向けた有望な方向を示唆している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:03:27 GMT)
Capturing Differences in Character Representations Between Communities: An Initial Study with Fandom [0.0]
本研究は,物語物語界の不可欠な部分であるキャラクタの再解釈に焦点を当てる。オンラインファンダムをデータとして利用し、2つのコミュニティ間のキャラクター表現の変化を探索するために計算手法を適用した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 13:24:29 GMT)
Bypassing the Popularity Bias: Repurposing Models for Better Long-Tail Recommendation [0.0]
我々は,オンラインコンテンツプラットフォーム上で,パブリッシャー間でより公平な露出分布を実現することを目的としている。そこで本稿では,産業推薦システムの既存コンポーネントを再利用して,表現不足の出版社に価値ある露出を提供する手法を提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:40:55 GMT)
BoostDream: Efficient Refining for High-Quality Text-to-3D Generation from Multi-View Diffusion [0.0]
BoostDreamは、粗い3D資産を高品質に変換するために設計された、高効率なプラグアンドプレイ3D精製手法である。本研究では, フィードフォワード生成により得られた3次元アセットと異なる表現に適合する3次元モデル蒸留を導入する。新たな多視点SDS損失を設計し、多視点認識2次元拡散モデルを用いて3次元資産を洗練させる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:28:40 GMT)
Bio-Inspired Mamba: Temporal Locality and Bioplausible Learning in Selective State Space Models [0.0]
Bio-Inspired Mambaは、生物学習の原則とMambaアーキテクチャを統合する、選択的な状態空間モデルのための新しいオンライン学習フレームワークである。 BIMはリアルタイム・リカレント・ラーニング(RTRL)とSpike-Timing-Dependent Plasticity(STDP)のようなローカル・ラーニング・ルールを組み合わせることで、スパイキングニューラルネットワークのトレーニングにおける時間的局所性と生物学的妥当性の課題に対処する。言語モデリング,音声認識,バイオメディカル信号解析におけるBIMの評価を行い,生物学習の原則を順守しつつ,従来の手法と競合する性能を実証した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 15:11:39 GMT)
Beyond principlism: Practical strategies for ethical AI use in research practices [0.0]
生成的人工知能の急速な普及は、倫理的ガイドラインの開発を上回っている。既存のアプローチは、科学研究の実践においてAIの倫理的課題に取り組むための実践的なガイダンスをほとんど提供しない。本稿では,抽象的原則と日々の研究実践のギャップを埋めるために,ユーザ中心の現実主義に着想を得たアプローチを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:46:03 GMT)
Beyond Algorithmic Fairness: A Guide to Develop and Deploy Ethical AI-Enabled Decision-Support Tools [0.0]
人工知能(AI)と最適化の統合は、エンジニアリングシステムの効率性、信頼性、レジリエンスを向上させるための大きな約束を持っている。本稿では,AIと最適化の交差点にアルゴリズムを配置する際に必要となる倫理的考察を明らかにする。本論文は,ルールの規範的セットを提供するのではなく,研究者間のリフレクションと意識を高めることを目的としている。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 18:37:53 GMT)
Bagged Polynomial Regression and Neural Networks [0.0]
時系列とデータセットの回帰は、ニューラルネットワークと同じ関数クラスを近似することができる。 textitbagged regression (BPR)は、ニューラルネットワークの魅力的な代替品である。 BPRは、衛星データを用いた作物分類において、ニューラルネットワークと同様に機能する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 21:32:14 GMT)
AutoFlow: An Autoencoder-based Approach for IP Flow Record Compression with Minimal Impact on Traffic Classification [0.0]
本稿では,深層学習,特にオートエンコーダを用いたIPフローレコードの圧縮手法を提案する。本研究では,大規模な実世界のネットワークトラフィックデータセットを用いた大規模な実験を通じて,本手法の有効性を実証する。この作業の影響は、より効率的なネットワーク監視、リソース制約のある環境でのリアルタイム分析、スケーラブルなネットワーク管理ソリューションにまで及んでいる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 11:24:22 GMT)
Applications of Post-quantum Cryptography [0.0]
レビューでは、2022年から2023年までの期間に制限された、体系的なスクーピングのレビューが採用されている。このレビューでは、様々な分野における量子コンピューティングの適用について論じている。本論文は格子ベース,ハッシュベース,コードベース,等質暗号など,様々なPQCアルゴリズムを解析する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:02:30 GMT)
Analysis of Convolutional Neural Network-based Image Classifications: A Multi-Featured Application for Rice Leaf Disease Prediction and Recommendations for Farmers [0.0]
本研究では,8つの異なる畳み込みニューラルネットワーク(CNN)アルゴリズムを用いて,イネの病原性分類を改善する新しい方法を提案する。この最先端のアプリケーションの助けを借りて、農家はタイムリーでインフォームドな意思決定ができる。注目すべき結果は、ResNet-50の75%の精度、DenseNet121の90%の精度、VGG16の84%の精度、MobileNetV2の95.83%の精度、DenseNet169の91.61%の精度、InceptionV3の86%の精度である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 05:32:01 GMT)
American Sign Language to Text Translation using Transformer and Seq2Seq with LSTM [0.0]
アメリカ手話(American Sign Language)は、手話の一つ。ニューラルマシン翻訳技術の開発は手話翻訳に向けて進んでいる。 Transformerは自然言語処理の最先端となった。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 04:00:33 GMT)
Advancing Cyber Incident Timeline Analysis Through Rule Based AI and Large Language Models [0.0]
本稿では,ルールベース人工知能(R-BAI)アルゴリズムとLarge Language Models(LLM)を組み合わせた新しいフレームワークGenDFIRを紹介する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:16:14 GMT)
Active learning for energy-based antibody optimization and enhanced screening [0.0]
本研究では,特定の目標に対するエネルギー関数を学習するために,ディープラーニングモデルを効率的に訓練する能動的学習ワークフローを提案する。本手法はRDE-NetworkディープラーニングモデルとRosetaのエネルギー関数に基づくFlex ddGを統合し,Flex ddGに結合するミュータントを効率的に探索する。 HER2結合型Trastuzumab変異株を対象としたケーススタディでは,ランダム選択よりもスクリーニング性能が有意に向上した。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:01:58 GMT)
A short trajectory is all you need: A transformer-based model for long-time dissipative quantum dynamics [0.0]
深層人工知能ニューラルネットワークは、散逸環境に結合した量子システムの長時間の人口動態を予測することができることを示す。我々のモデルは、リカレントニューラルネットワークのような古典的な予測モデルよりも正確です。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 16:17:52 GMT)
A remark on quantum measuring systems and the holographic principle [0.0]
量子測定対象の連続性は、バルク空間の量子状態の古典化後のホログラフィック原理の基本的な結果であると主張する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:59:47 GMT)
A quantum protocol for applying arbitrary phase transformations [0.0]
我々は、$|psirangle=sumpsi(x),|xrangle$を$|psi'rangle=sumpsi(x),eialpha|phi(x)|2,|xrangle$に変換する量子プロトコルを提案する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 09:32:00 GMT)
A logical alarm for misaligned binary classifiers [0.0]
直感は二分分類タスクを実行したエージェントを評価するために形式化されています。これは、二項応答子のすべての評価によって普遍的に従わなければならない公理の集合を確立することによってなされる。このアプローチと形式的ソフトウェア検証の類似点と,近年の安全保証AIの課題に対する実用性について論じる。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 10:19:22 GMT)
A Simple Generative Network [0.0]
単純なアーキテクチャ(単一フィードフォワードニューラルネットワーク)と明確な最適化目標(Kullback_Leiblerの発散)は明らかに見落とされた。本稿では,そのようなモデル (SGN) が, 従来の技術手法と比較して, 視覚的, 定量的に競合するサンプルを生成できることを実証する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 14:06:29 GMT)
A Semantics for Counterfactuals in Quantum Causal Models [0.0]
本稿では,量子因果モデルの枠組みにおいて,逆ファクトクエリの評価のための形式的手法を提案する。我々はパールの「古典的構造因果モデル」の概念の適切な拡張を定義する。古典的(確率論的)構造因果モデルは全て、量子構造因果モデルに拡張可能であることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 17:02:06 GMT)
A Review of Mechanistic Models of Event Comprehension [0.0]
事象理解の理論的仮定と計算モデルについて考察する。イベント理解の計算モデルとして,REPRISE,Structured Event Memory,Luモデル,Gumbschモデル,Elman and McRaeモデルを挙げる。主要なテーマは、帰納的バイアスとしての階層構造の使用、理解における予測の重要性、作業イベントモデルのための多様な戦略である。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 22:10:05 GMT)
A Property Encoder for Graph Neural Networks [0.0]
本稿では,任意のグラフメトリックから表現的ノード埋め込みを構成する新しいエンコーダPropEncを紹介する。 PropEncは、次元と入力のタイプの両方の観点からフレキシブルなエンコーディングをサポートし、様々なアプリケーションでその効果を実証している。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 20:52:50 GMT)
A Physics Informed Neural Network (PINN) Methodology for Coupled Moving Boundary PDEs [0.0]
物理インフォームドニューラルネットワーク(PINN)は、微分方程式(DE)を用いてモデル化された物理問題を解くのに役立つ新しいマルチタスク学習フレームワークである本稿では、複数の制御パラメータ(エネルギーと種、および複数のインターフェースバランス方程式)を含む結合システムを解決するためのPINNベースのアプローチについて報告する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 06:00:18 GMT)
A Machine Learning-Driven Wireless System for Structural Health Monitoring [0.0]
本稿では,炭素繊維強化ポリマー(CFRP)構造体の構造健康モニタリング(SHM)のための機械学習(ML)モデルを統合した無線システムを提案する。このシステムは、CFRPクーポンに埋め込まれたカーボンナノチューブ(CNT)センサーを介してデータを収集し、これらのデータを中央サーバーにワイヤレスで送信して処理する。ディープニューラルネットワーク(DNN)モデルは、機械的特性を予測し、構造的障害を予測できるように拡張し、積極的にメンテナンスし、安全性を高める。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 08:08:38 GMT)
A Framework for Ranking Content Providers Using Prompt Engineering and Self-Attention Network [0.0]
本稿では,クリックやリアクションなどの明示的なユーザフィードバックと,書き込みスタイルやパブリッシュ頻度などのコンテンツベースの特徴を活用して,あるトピックのコンテンツプロバイダをランク付けするフレームワークを提案する。オンライン実験を用いて,本フレームワークの評価を行い,ユーザが推奨するコンテンツの質,信頼性,多様性を向上できることを示す。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 19:25:58 GMT)
A Comprehensive Survey of Threshold Signatures: NIST Standards, Post-Quantum Cryptography, Exotic Techniques, and Real-World Applications [0.0]
高度な特徴を持つしきい値と分散シグネチャを包括的かつ体系的に調査する。我々は、多数の署名ファミリーに対して、(セキュアなマルチパーティ計算による)汎用的およびカスタムなしきい値設定手法について検討する。
論文参考訳（メタデータ） (Tue, 17 Sep 2024 01:23:30 GMT)