VQ-CTAP: Cross-Modal Fine-Grained Sequence Representation Learning for Speech Processing [81.3] テキスト音声(TTS)、音声変換(VC)、自動音声認識(ASR)などのタスクでは、クロスモーダルな粒度(フレームレベル)シーケンス表現が望まれる。
本稿では,テキストと音声を共同空間に組み込むために,クロスモーダルシーケンストランスコーダを用いた量子コントラスト・トーケン・音響事前学習(VQ-CTAP)手法を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 12:24:23 GMT)
FADE: A Dataset for Detecting Falling Objects around Buildings in Video [75.5] 建物から落下する物体は、大きな衝撃力によって歩行者に重傷を負わせる可能性がある。
FADEには18のシーンから1,881本のビデオがあり、8つの落下物カテゴリー、4つの気象条件、4つのビデオ解像度がある。
動作情報を効果的に活用するFADE-Netと呼ばれる新しい物体検出手法を開発した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:43:56 GMT)
Risk and cross validation in ridge regression with correlated samples [72.6] 我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:50:59 GMT)
Learning to (Learn at Test Time): RNNs with Expressive Hidden States [69.8] 本稿では,線形複雑度と表現的隠蔽状態を有する新しいシーケンスモデリング層を提案する。
隠れた状態はテストシーケンスでもトレーニングによって更新されるので、私たちのレイヤはテスト時間トレーニング層と呼ばれます。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 00:42:18 GMT)
BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.4] 汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 20:03:12 GMT)
StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.3] StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 01:22:29 GMT)
Scaling Virtual World with Delta-Engine [62.2] 本稿では,この仮想世界を駆動する特別なエンジンであるemphDelta-Engineを提案する。
Delta$は、世界の進化とエンジンの拡張を関連付ける。
本稿ではデルタエンジンのフルスタック導入について述べる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:32:29 GMT)
Is Generative Communication between Embodied Agents Good for Zero-Shot ObjectNav? [60.8] Zero-Shot ObjectNavでは、エンボディされた接地エージェントが自然言語ラベルで指定されたターゲットオブジェクトにナビゲートされる。
司法探索のための2つの協調ナビゲーション方式を提案する。
我々は,この具体的設定に特有な「プリエンプティブ・幻覚」の特徴を識別する。そこでは,オーバヘッドエージェントが,まだ動作していないときに,地上エージェントが対話の中でアクションを実行したと仮定する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 21:26:41 GMT)
LEGENT: Open Platform for Embodied Agents [60.7] LEGENTはLarge Language Models (LLM) とLarge Multimodal Models (LMM) を用いたエンボディエージェントを開発するためのオープンでスケーラブルなプラットフォームである。
LEGENTはリッチでインタラクティブな3D環境を提供し、コミュニケーション可能でアクション可能なエージェントをユーザフレンドリーなインターフェースと組み合わせている。
実験では、EGENT生成データに基づいて訓練された胚性視覚言語モデルが、エンボディタスクにおいてGPT-4Vを超える。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:18:30 GMT)
Efficient Federated Learning Using Dynamic Update and Adaptive Pruning with Momentum on Shared Server Data [59.7] フェデレートラーニング(FL)は、低トレーニング効率と限られた計算資源の2つの重要な問題に遭遇する。
本稿では,サーバ上の共有不感データとエッジデバイスの分散データを活用するための新しいFLフレームワークであるFedDUMAPを提案する。
提案するFLモデルであるFedDUMAPは,従来の3つの手法を組み合わせることで,ベースラインアプローチと比較して性能が大幅に向上した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:59:11 GMT)
Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.8] 本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:46:00 GMT)
Residual Corrective Diffusion Modeling for Km-scale Atmospheric Downscaling [58.5] 気象・気候からの物理的危険予知技術の現状には、粗い解像度のグローバルな入力によって駆動される高価なkmスケールの数値シミュレーションが必要である。
ここでは、コスト効率のよい機械学習代替手段として、このようなグローバルな入力をkmスケールにダウンスケールするために、生成拡散アーキテクチャを探索する。
このモデルは、台湾上空の地域気象モデルから2kmのデータを予測するために訓練され、世界25kmの再解析に基づいている。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 21:36:46 GMT)
UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.2] 本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:24:22 GMT)
Decoder Pre-Training with only Text for Scene Text Recognition [54.9] シーンテキスト認識(STR)事前学習法は,主に合成データセットに依存し,顕著な進歩を遂げている。
STR(DPTR)用テキストのみを用いたDecoder Pre-trainingという新しい手法を提案する。
DPTRはCLIPテキストエンコーダが生成したテキスト埋め込みを擬似視覚埋め込みとして扱い、デコーダの事前訓練に使用する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 06:36:42 GMT)
A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.5] タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。
本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。
移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:57:57 GMT)
FedRSU: Federated Learning for Scene Flow Estimation on Roadside Units [50.9] ロードサイドユニット(RSU)は、V2X通信を通じて、自動運転車の安全性とロバスト性を大幅に向上させることができる。
現在、単一のRSUの使用は主にリアルタイム推論とV2Xコラボレーションに焦点を当てている。
多数のRSUから大量のデータを統合することで、モデルトレーニングのための豊富なデータソースを提供することができます。
我々は,自己監督型シーンフロー推定のための革新的なフェデレート学習フレームワークであるFedRSUを紹介する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:17:09 GMT)
Lifelong Personalized Low-Rank Adaptation of Large Language Models for Recommendation [50.8] 我々は、推奨のために大規模言語モデル(LLM)の分野に焦点を当てる。
ユーザ毎に独立したLoRAを管理するPersonalized LoRAモジュールを組み込んだRecLoRAを提案する。
また、Few2Many Learning Strategyを設計し、従来のレコメンデーションモデルをレンズとして使用して、小さなトレーニングスペースをフルスペースに拡大する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 09:08:59 GMT)
Graph Agent Network: Empowering Nodes with Decentralized Communications Capabilities for Adversarial Resilience [50.5] グラフニューラルネットワーク(GNN)の脆弱性に対処するグラフエージェントネットワーク(GAgN)を提案する。
GAgNはグラフ構造化エージェントネットワークであり、各ノードは1-hop-viewエージェントとして設計されている。
エージェントの限られたビューは、悪意のあるメッセージがGAgNでグローバルに伝播するのを防ぎ、グローバル最適化ベースのセカンダリアタックに抵抗する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 09:17:36 GMT)
A Decoding Acceleration Framework for Industrial Deployable LLM-based Recommender Systems [49.6] 本稿では,LLMベースのレコメンデーション(DARE)のためのデコード高速化フレームワークを提案し,検索効率を向上させるためのカスタマイズされた検索プールと,ドラフトトークンの受け入れ率を高めるための緩和検証を提案する。
DAREは大規模な商用環境でのオンライン広告シナリオにデプロイされ、ダウンストリームのパフォーマンスを維持しながら3.45倍のスピードアップを実現している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:31:13 GMT)
Leave No Patient Behind: Enhancing Medication Recommendation for Rare Disease Patients [47.7] 本稿では,レアな疾患の正確性を高めるために,ロバストとメディケーションのための高精度勧告(RAREMed)と呼ばれる新しいモデルを提案する。
入力シーケンスを統一したトランスフォーマーエンコーダを使用して、疾患と手続きコードの間の複雑な関係をキャプチャする。
稀な疾患と一般的な疾患の両方に対して正確な薬物セットを提供し、薬の推奨システムにおける不公平を緩和する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:32:14 GMT)
TalkCLIP: Talking Head Generation with Text-Guided Expressive Speaking Styles [45.7] 本研究では,自然言語で表現を指定した発話ヘッドを生成可能なフレームワークであるTalkCLIPを提案する。
テキストから表現へのマッピングをモデル化するために,まず,テキストとビデオのペアによる発話ヘッドデータセットを構築した。
自然言語による記述を表現表現に投影するCLIPベースのスタイルエンコーダを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 10:01:03 GMT)
Learning or Self-aligning? Rethinking Instruction Fine-tuning [45.6] 我々は、IFTの潜在的な要因を分離するための知識介入フレームワークを設計する。
実験の結果、IFTを通じて追加の世界知識を習得しようとする試みは、ポジティブな影響をもたらすのにしばしば苦労していることが明らかになった。
IFTの前後における内部知識の整合性を維持することは、IFTを成功させる上で重要な要素である。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:15:06 GMT)
PoisonedRAG: Knowledge Corruption Attacks to Retrieval-Augmented Generation of Large Language Models [45.4] 大規模言語モデル(LLM)は、その例外的な生成能力により、顕著な成功を収めた。
Retrieval-Augmented Generation (RAG)は、これらの制限を緩和するための最先端技術である。
RAGシステムにおける知識データベースは,新たな,実用的な攻撃面を導入している。
この攻撃面に基づいて,RAGに対する最初の知識汚職攻撃であるPoisonedRAGを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 21:46:29 GMT)
Towards the "puzzle" of Chromium dimer Cr$_2$: predicting the Born-Oppenheimer rovibrational spectrum [45.0] 本稿では、Cr$$$二量体の状態のポテンシャルエネルギー曲線をX1Sigma+$で計算する。
核間距離の全体に対して初めてR$が発見された。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 09:39:12 GMT)
Post-Training Sparse Attention with Double Sparsity [44.8] ダブルスパシティ」は、このボトルネックを緩和するために設計された、訓練後スパースアテンション技術である。
Double Sparsityは、自己アテンションを計算するための重要なトークンのみを活用するトークンのスペシャリティと、重要なトークンを識別するための重要な機能チャネルを使用するチャネルのスペシャリティを組み合わせたものだ。
オフローディングにより、16.3$times$のデコード速度を、256Kのシークエンス長の最先端のソリューションと比較して達成する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:40:36 GMT)
Egocentric Vision Language Planning [44.4] 我々は,大規模マルチモーダルモデル (LMM) とtext2image モデルを利用して,より一般的なエンボディエージェントを構築することを検討する。
本稿では,エゴ中心型視覚言語計画法(EgoPlan)を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:37:29 GMT)
Neural Architecture Search based Global-local Vision Mamba for Palm-Vein Recognition [44.3] 本稿では,画像の局所的相関と静脈特徴表現のためのトークン間のグローバル依存性を明示的に学習するための,GLVM(Global-local Vision Mamba)というハイブリッドネットワーク構造を提案する。
第3に,MHMambaブランチ(MHMamba),FIU(Feature Iteration Unit),CNN(Convolutional Neural Network)という3つのブランチからなるConvMambaブロックを提案する。
最後に,Global Local Alternate Neural Architecture Search (GLNAS)法を提案し,GLVMの最適アーキテクチャを進化的アルゴリズムと交互に探索する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 10:42:22 GMT)
LI-TTA: Language Informed Test-Time Adaptation for Automatic Speech Recognition [43.2] TTA(Test-Time Adaptation)は、ドメインシフト問題に対する重要な解決策として登場した。
言語インフォームドテスト時間適応(Language Informed Test-Time Adaptation, LI-TTA)を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:19:27 GMT)
Efficient Test-Time Prompt Tuning for Vision-Language Models [41.9] Self-TPTは、効率的なテストタイムプロンプトチューニングにセルフ教師付き学習を活用するフレームワークである。
本稿では,Self-TPTが推論コストを大幅に削減するだけでなく,最先端の性能も向上することを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:55:58 GMT)
MTSCI: A Conditional Diffusion Model for Multivariate Time Series Consistent Imputation [41.7] 主要な研究課題は、どのようにインパルスの整合性を確保するか、すなわち観測値とインパルス値の整合性を確保するかである。
従来の手法は、学習プロセスを導くために、計算対象の帰納的バイアスにのみ依存する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 10:24:53 GMT)
Supporting Software Maintenance with Dynamically Generated Document Hierarchies [41.4] HGENは、ソースコードを6つのステージで変換し、構造化された文書の階層構造に変換する、完全に自動化されたパイプラインである。
我々はHGENを定量的にも質的にも評価した。
その結果,HGENは手作業で構築したドキュメントに類似したアーティファクト階層を生成し,コアコンセプトをベースラインアプローチよりもはるかに高いカバレッジで実現していることがわかった。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:11:14 GMT)
On zero-shot learning in neural state estimation of power distribution systems [39.6] 本稿では,配電系統におけるニューラル状態推定の課題に対処する。
我々は、電力網の変化に対応するモデルが存在しないことにある、現在の技術の現状における研究のギャップを識別する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:33:23 GMT)
MacFormer: Semantic Segmentation with Fine Object Boundaries [38.4] 新しいセマンティックセグメンテーションアーキテクチャであるMacFormer'を導入する。
まず、学習可能なエージェントトークンを使用することで、Mutual Agent Cross-Attention(MACA)メカニズムは、エンコーダ層とデコーダ層をまたいだ機能の双方向統合を効果的に実現する。
第二に、デコーダ内の周波数拡張モジュール(FEM)は高周波および低周波成分を活用して周波数領域の特徴を高める。
MacFormerはさまざまなネットワークアーキテクチャと互換性があり、ADE20KベンチマークとCityscapesの精度と効率の両方で既存のメソッドより優れていることが示されている。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:36:10 GMT)
Digital Socrates: Evaluating LLMs through Explanation Critiques [37.3] Digital Socratesは、モデル説明のためのオープンソースの自動批評モデルである。
我々は,デジタルソクラテスが学生モデルについての洞察を明らかにするのにどのように役立つかを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:46:15 GMT)
Efficient and Versatile Robust Fine-Tuning of Zero-shot Models [34.3] 本稿では、下流タスクにゼロショットモデルを微調整する新しい手法であるRobust Adapter(R-Adapter)を紹介する。
本手法は, 軽量モジュールを事前学習モデルに統合し, OODロバスト性を高め, 保存コストを大幅に削減するために, 新たな自己アンサンブル技術を用いる。
実験により,R-Adapterは,CLIPエンコーダのパラメータの13%をチューニングし,タスクのさまざまなセットで最先端のパフォーマンスを実現することを確認した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:37:43 GMT)
The Bandit Whisperer: Communication Learning for Restless Bandits [33.3] 我々は、レスレスマルチアームバンド(RMAB)における最初のコミュニケーション学習手法を提案する。
我々の設定では、腕は同様の腕からQ関数パラメータを受信し、行動ポリシーを導出し、Q関数の更新を操縦する。
両腕をまたいだメッセージの合体性を考慮し,その合体ユーティリティを分解するQネットワークアーキテクチャを用いて通信戦略を学習する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 03:39:46 GMT)
Scalable and Adaptive Spectral Embedding for Attributed Graph Clustering [33.3] 本稿では,パラメータ学習を伴わない単純な属性グラフクラスタリング手法であるSASEを紹介する。
これらの設計により、SASEはグローバルクラスタ構造を効果的にキャプチャするだけでなく、グラフサイズに対して線形時間と空間の複雑さを示す。
例えば、169Kノードと1.17Mエッジを持つArXivデータセットでは、SASEはACCの6.9%の改善と、ランナアップであるS3GCと比較して5.87タイムのスピードアップを実現している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 12:57:50 GMT)
Prompt-prompted Adaptive Structured Pruning for Efficient LLM Generation [31.7] 本稿では,GRIFFINについて紹介する。GRIFFINはトレーニング不要かつ校正不要な手法で,シーケンスレベルで独自のFFエキスパートを選択して効率よく生成する。
GRIFFINは、様々な分類タスクと生成タスクをほとんどあるいは全く分解することなく、オリジナルのモデルの性能を維持している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:43:36 GMT)
An Empirical Study of ChatGPT-Related Projects and Their Issues on GitHub [31.0] キーワードChatGPTを使ってGitHubから71,244のプロジェクトを取り出しました。
また,ChatGPT関連プロジェクト,すなわちChatGPT実装・トレーニング,ChatGPTアプリケーション,ChatGPT改善・拡張の3つの主要なカテゴリを特定した。
3つのプロジェクトカテゴリにおいて、各課題トピックの人気、難易度、進化度を分析した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:29:26 GMT)
FastLGS: Speeding up Language Embedded Gaussians with Feature Grid Mapping [29.5] 我々は高解像度で3Dガウススプラッティング(3DGS)内でリアルタイムなオープン語彙クエリをサポートするアプローチであるFastLGSを提案する。
FastLGSはLERFより98倍、LangSplatより4倍速い。
実験により、FastLGSは3Dセグメンテーションや3Dオブジェクトのインペイントなど、多くの下流タスクに適応し、互換性があることが示されている。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:09:15 GMT)
Bot or Human? Detecting ChatGPT Imposters with A Single Question [29.2] 大規模言語モデル(LLM)は、最近、自然言語の理解と生成において印象的な能力を示した。
不正行為やサービス拒否攻撃など、悪意のある目的のために悪用される可能性があるという懸念がある。
単一問合せと応答による大規模言語モデル認証をオンラインで検出するFLAIRというフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:56:50 GMT)
Blockwise Self-Supervised Learning at Scale [28.0] 本稿では,各ブロックにおけるBarlow Twinsの損失関数によるResNet-50の4つのレイヤのトレーニングと,ImageNetのエンドツーエンドのバックプロパゲーションとを独立に行う方法を示す。
我々のブロックワイド事前訓練モデル上で訓練された線形プローブは、トップ-1の分類精度70.48%を得るが、これはエンドツーエンド事前訓練ネットワークの精度の1.1%以下である。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:59:30 GMT)
Posterior Sampling for Continuing Environments [26.6] 強化学習のための後部サンプリングの拡張(PSRL)を開発する。
我々は、統計的に妥当な環境モデルを維持し、予測される$gamma$-discounted returnをそのモデルで最大化するポリシーに従う。
私たちの研究は、ランダムな探索によって再サンプリングアプローチを形式化し、厳格に分析する最初のものです。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:46:31 GMT)
Towards Trustworthy Dataset Distillation [26.4] データセット蒸留(DD)は、大規模なデータセットを小さな合成データセットに蒸留することで、トレーニングコストを削減する。
我々はTrustDD(Trustworthy dataset Distillation)と呼ばれる新しいパラダイムを提案する。
InDサンプルと外れ値の両方を蒸留することにより、凝縮データセットは、InD分類とOOD検出の両方に適するモデルをトレーニングすることができる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:35:40 GMT)
SQLFixAgent: Towards Semantic-Accurate Text-to-SQL Parsing via Consistency-Enhanced Multi-Agent Collaboration [26.2] 本稿では,SQLの誤検出と修復を目的とした,新しい一貫性向上型マルチエージェント協調フレームワークを提案する。
提案したフレームワークを5つのテキスト・テキスト・ベンチマークで評価し,特にBirdベンチマークで3%以上の改善を実現した。
当社のフレームワークは,他の高度なメソッドと比較してトークン効率も高く,競争力も向上しています。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 16:30:44 GMT)
People over trust AI-generated medical responses and view them to be as valid as doctors, despite low accuracy [25.9] 合計300人の参加者が、オンラインヘルスケアプラットフォーム上で医師によって書かれた、あるいは大きな言語モデルによって生成された医療反応の評価を行った。
その結果、被験者はAI生成と医師の反応を効果的に区別できないことがわかった。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 23:41:28 GMT)
Stable Diffusion Exposed: Gender Bias from Prompt to Image [25.7] 本稿では,安定拡散画像における生成過程の各ステップにおける性別指標の影響を解析する評価プロトコルを提案する。
以上の結果から,特定の性別に合わせて調整された楽器や,全体のレイアウトの変化など,物体の描写の違いの存在が示唆された。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 08:10:32 GMT)
LLM Reasoners: New Evaluation, Library, and Analysis of Step-by-Step Reasoning with Large Language Models [25.5] 完全自動推論チェーン評価のためのAutoRaceを導入する。
既存の推論アルゴリズムと新しい推論アルゴリズムのモジュール実装を標準化するためのライブラリである LLM Reasoners も開発している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 22:20:19 GMT)
An End-to-End Model for Time Series Classification In the Presence of Missing Values [25.1] 時系列分析では,データ不足による時系列分類が問題となっている。
本研究では,データ計算と表現学習を単一のフレームワーク内で統一するエンドツーエンドニューラルネットワークを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:39:12 GMT)
A Training-Free Framework for Video License Plate Tracking and Recognition with Only One-Shot [25.0] OneShotLPは、ビデオベースのライセンスプレートの検出と認識のためのトレーニング不要のフレームワークである。
広範なトレーニングデータなしで効果的に機能する機能と、さまざまなライセンスプレートスタイルへの適応性を提供する。
これは、インテリジェントトランスポートシステムにおける多様な現実世界のアプリケーションに事前訓練されたモデルを活用する可能性を強調している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 08:42:02 GMT)
Moment&Cross: Next-Generation Real-Time Cross-Domain CTR Prediction for Live-Streaming Recommendation at Kuaishou [23.6] Kuaishouは、大規模なショートビデオおよびライブストリーミングプラットフォームの1つである。
ライブストリーミングのレコメンデーションは,(1)配信に一時的に対応し,(2)フィードバックの遅延で長時間監視し,(3)コンテンツが予測不能で,時間が経つにつれて変化するため,より複雑になる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:00:27 GMT)
GraphTransfer: A Generic Feature Fusion Framework for Collaborative Filtering [23.4] 我々は,GNNに基づく協調フィルタリングのための簡易かつ普遍的な機能融合フレームワークであるGraphTransferを提案する。
提案手法は,GNNを用いて,ユーザ-テム相互作用グラフからまずグラフ特徴と補助特徴を抽出することにより,異なるタイプの特徴を正確に融合する。
公開データセットに関する理論的分析と実験は、GraphTransferがCFタスクにおける他の機能融合メソッドよりも優れていることを示している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:47:34 GMT)
Task Success is not Enough: Investigating the Use of Video-Language Models as Behavior Critics for Catching Undesirable Agent Behaviors [22.7] 大規模生成モデルは意味のある候補解を抽出するのに有用であるが、それらはしばしばタスク制約やユーザの好みを見落としている。
具体的AIの文脈では、検証は多くの場合、命令で指定された目標条件が満たされたかどうかのみを評価する。
ロボットタスクのスコープを考えると、Goのような明示的な知識タスクに使用されるものに似たスクリプト検証を構築することは不可能である。
大きなビジョンと言語モデル(VLM)は、ビデオの中の望ましくないロボットの振る舞いを捉えるために、スケーラブルな行動批判として、ほぼ全能的なものですか?
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:13:50 GMT)
Causal Representation Learning from Multiple Distributions: A General Setting [21.7] 本稿では,複数の分布からの因果表現学習の一般的,完全に非パラメトリックな設定について述べる。
因果的影響に対する適切な変化条件と、潜伏変数上のグラフの空間的制約の下で、基礎となる有向非巡回グラフのモラル化グラフを復元できることが示される。
場合によっては、ほとんどの潜伏変数はコンポーネントワイド変換まで回収できる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:27:02 GMT)
HySparK: Hybrid Sparse Masking for Large Scale Medical Image Pre-Training [21.4] 本稿では,マスク画像モデリングに基づく生成前トレーニング戦略を提案し,医療画像の大規模事前トレーニングに応用する。
我々は,高密度なマルチスケール特徴再構成を実現するために,スキップ接続を備えた単純な階層型デコーダを用いる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 16:31:39 GMT)
PS-TTL: Prototype-based Soft-labels and Test-Time Learning for Few-shot Object Detection [21.4] Few-Shot Object Detection (FSOD) は注目され、大きな進歩を遂げた。
我々は,FSODの新しいフレームワーク,すなわちプロトタイプベースのソフトラベルとテスト時間学習(PS-TTL)を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:21:43 GMT)
PK-ICR: Persona-Knowledge Interactive Context Retrieval for Grounded Dialogue [21.3] ペルソナとナレッジ デュアルコンテキスト識別(ペルソナとナレッジ コンテクストの同定)は、与えられた対話において、ペルソナとナレッジを共同で識別するタスクである。
我々は,対話のすべての文脈を同時に活用する新しい接地検索手法を開発した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:14:28 GMT)
A Single Goal is All You Need: Skills and Exploration Emerge from Contrastive RL without Rewards, Demonstrations, or Subgoals [21.0] 簡単なRLアルゴリズムから得られた経験的スキル証明と方向探索について述べる。
操作タスクにおいて、エージェントは、目標状態の単一の観察を与えられ、まず、エンドエフェクタを移動させ、次にブロックを押して、最後にブロックを拾い、配置するためにスキルを学ぶ。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:49:00 GMT)
Improving Adversarial Transferability with Neighbourhood Gradient Information [20.6] ディープニューラルネットワーク(DNN)は、敵の例に影響を受けやすいため、パフォーマンスが著しく低下する。
本研究は、この性能ギャップを狭めるために、敵の例の転送可能性を高めることに焦点を当てる。
事例追跡と多重マスク戦略を取り入れたNGI-Attackを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 10:46:49 GMT)
Synchronous Multi-modal Semantic Communication System with Packet-level Coding [20.4] パケットレベル符号化を用いた同期型マルチモーダルセマンティック通信システム(SyncSC)を提案する。
意味的・時間的同期を実現するため、3Dモーフィブルモード(3DMM)係数とテキストを意味論として送信する。
消去チャネル下でのセマンティックパケットの保護を目的として,パケット損失率が高い場合でも一定の視覚的品質を維持できるパケットレベルフォワード誤り訂正法(PacSC)を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:37:42 GMT)
Online Matrix Completion: A Collaborative Approach with Hott Items [19.8] M$ユーザ,$N$アイテム,$T$ラウンド,未知のランク-$r$報酬行列$Rin mathbbRMtimes N$のオンライン設定における下位行列補完問題について検討する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:49:52 GMT)
Reference-free Hallucination Detection for Large Vision-Language Models [19.4] 大規模視覚言語モデル(LVLM)は近年大きな進歩を遂げている。
LVLMは、言語理解、質問応答、視覚入力の会話において優れた能力を示す。
彼らは幻覚を起こす傾向がある。
LVLMの幻覚を評価するためにいくつかの手法が提案されているが、そのほとんどは参照ベースであり、外部ツールに依存している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:17:14 GMT)
Deep Learning in Medical Image Registration: Magic or Mirage? [18.6] 我々は,画素ごとの強度とラベルの分布と,古典的登録法の性能を明示的に対応させる。
従来の手法では不可能な,教師の弱い学習ベースの手法は,高忠実度やラベル登録が可能であることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:20:08 GMT)
Unlocking the Power of Numbers: Log Compression via Numeric Token Parsing [18.4] 圧縮率と速度が高い単純な汎用ログ圧縮機であるDenumを提案する。
具体的には、DenumにはToken Parsingモジュールが含まれており、すべての数値トークンを抽出し、カスタマイズされた処理方法を適用する。
16のログデータセットで評価され、平均圧縮比が8.7%、平均圧縮速度が2.6倍速くなる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 12:30:41 GMT)
SPARSEFIT: Few-shot Prompting with Sparse Fine-tuning for Jointly Generating Predictions and Natural Language Explanations [18.0] 命令型学習と組み合わせた微調整事前学習言語モデル(PLM)は,近年,有望な結果を示している。
我々は、離散的なプロンプトを利用して予測とNLEを共同生成する数ショットの微調整戦略であるSparseFitを提案する。
モデルパラメータの6.8%のみを微調整することで,タスク性能と生成したNLEの品質の両面での競争結果が得られることがわかった。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:43:23 GMT)
Scoring Time Intervals using Non-Hierarchical Transformer For Automatic Piano Transcription [17.7] 本稿では, 変圧器の注目度に類似したスケール内積演算を用いて, 間隔を簡易に評価する方法を提案する。
理論的には、重複しない区間を符号化する特別な構造のため、内積演算は理想的なスコアリング行列を表すのに十分表現可能である。
次に,低分解能特徴写像のみで動作するエンコーダのみの構造化非階層トランスフォーマーバックボーンが,高精度かつ高精度にピアノ音符やペダルを転写可能であることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:58:46 GMT)
Continual Learning of Nonlinear Independent Representations [17.7] 分布数の増加に伴い,モデル識別可能性がサブスペースレベルからコンポーネントワイドレベルに向上することを示す。
本手法は,複数のオフライン分布に対して共同で学習した非線形ICA法に匹敵する性能を実現する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:33:37 GMT)
SMILES-Mamba: Chemical Mamba Foundation Models for Drug ADMET Prediction [16.2] 小分子の薬物の吸収、分布、代謝、排出、毒性を予測することは安全性と有効性を確保するために重要である。
本稿では,ラベル付きデータとラベル付きデータの両方を活用する2段階モデルを提案する。
その結果,SMILES-Mambaは22のADMETデータセットの競合性能を示し,14のタスクで最高スコアを達成した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:53:12 GMT)
Single Image Dehazing Using Scene Depth Ordering [15.9] 本研究では, 湿潤画像の深度秩序を利用して, 乾燥過程を導出する深度秩序誘導単写像デハージング法を提案する。
提案手法は、最先端の脱ハージング法よりも高い計算効率で、ポテンシャル構造と鮮明な色を復元することができる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 03:29:27 GMT)
SABER-6D: Shape Representation Based Implicit Object Pose Estimation [15.7] 埋め込み空間におけるオブジェクトの6次元ポーズを学習するために,SABERという新しいエンコーダデコーダアーキテクチャを提案する。
2次元画像に基づく物体の回転空間の学習を支援する補助タスクとして形状表現を行う。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 21:59:34 GMT)
Reinforcement Learning with Elastic Time Steps [14.8] Multi-Objective Soft Elastic Actor-Critic (MOSEAC) は、弾性時間ステップを用いて制御周波数を動的に調整する非政治アクター批判アルゴリズムである。
我々は,MOSEACが理論レベルで収束し,安定なポリシーを生成できることを示し,実時間3Dレースゲームにおける結果を検証する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:59:45 GMT)
Integrating Multi-scale Contextualized Information for Byte-based Neural Machine Translation [14.8] サブワードトークン化はニューラル機械翻訳(NMT)モデルにおける語彙構築の一般的な方法である。
隠れ状態次元の異なる様々なスケールの文脈情報を学習するマルチスケールコンテキスト化(MSC)手法を提案する。
実験により、MSCはサブワードベースおよび他のバイトベースの手法を多言語およびドメイン外のシナリオで大幅に上回っていることが示された。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 06:48:40 GMT)
Advancing Re-Ranking with Multimodal Fusion and Target-Oriented Auxiliary Tasks in E-Commerce Search [14.6] textbfAdvancing textbfRe-Ranking with textbfMultitextbfmodal Fusion and textbfTarget-Oriented Auxiliary Tasks (ARMMT)を提案する。
ARMMTは、注目に基づくマルチモーダルフュージョン技術と、アイテム表現の強化とターゲティング能力の向上のための補助的なランキングアラインメントタスクを統合している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:46:21 GMT)
Survey on Quality Assurance of Smart Contracts [14.3] スマートコントラクトの採用の増加に伴い、セキュリティの確保が重要な問題となっている。
スマートコントラクトの品質保証について,脆弱性,攻撃,防御,ツールサポートについて,系統的に概説する。
スマートコントラクトを効果的に保護するために、さまざまな脆弱性検出ツールを評価し、その有効性を比較するためにラベル付きデータセットを作成しました。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:18:56 GMT)
ElecBench: a Power Dispatch Evaluation Benchmark for Large Language Models [14.2] 大規模言語モデル(LLM)は、効率を改善し、電力セクターのインテリジェントな進歩を促進するための重要な技術となっている。
これらの可能性にもかかわらず、電力セクターにおけるLCMの性能評価ベンチマークが欠如していることは、これらの技術の有効利用を制限している。
ElecBenchは、セクター固有のシナリオを包括的にカバーすることで、既存の評価ベンチマークの欠点を克服することを目指している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:11:32 GMT)
Robust Domain Generalization for Multi-modal Object Recognition [14.1] マルチラベル分類において、機械学習は、トレーニングデータから異なる分布でタスクを処理する際に、ドメインの一般化の課題に直面する。
視覚言語プレトレーニングの最近の進歩は、広範囲にわたる視覚言語ペアの監視を活用し、多様なドメインでの学習を可能にしている。
本稿では、実際の損失を推定し、より大きな視覚言語バックボーンに対する評価を拡大し、Mixup-CLIPoodを導入することで解決策を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:13:21 GMT)
SAGA: A Participant-specific Examination of Story Alternatives and Goal Applicability for a Deeper Understanding of Complex Events [13.9] このような知識は参加者達成レンズを通じて引き出すことができると我々は主張する。
我々は,参加者の意図した成果に基づいて,物語の中の複雑な出来事を分析する。
データセットに微調整された小さなモデルでは、より大きなモデルを上回るパフォーマンスが得られることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:52:40 GMT)
CodexGraph: Bridging Large Language Models and Code Repositories via Code Graph Databases [13.7] 大きな言語モデル(LLM)は、HumanEvalやMBPPのようなスタンドアロンのコードタスクに優れていますが、コードリポジトリ全体の処理に苦労しています。
類似性に基づく検索は複雑なタスクではリコールが低いことが多いが、手動ツールやAPIは通常タスク固有であり、専門家の知識を必要とする。
我々は,LLMエージェントをコードリポジトリから抽出したグラフデータベースインターフェースと統合するシステムであるCodexGraphを紹介する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 16:23:57 GMT)
Toward Open Vocabulary Aerial Object Detection with CLIP-Activated Student-Teacher Learning [13.7] 本稿では,CLIP-activated students-Teacher Open-vocabulary Object DetectionフレームワークであるCastDetを提案する。
我々のアプローチは、新しいオブジェクトの提案だけでなく、分類も促進します。
実験の結果,CastDetはより優れた開語彙検出性能が得られた。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:59:42 GMT)
Fast and Scalable Semi-Supervised Learning for Multi-View Subspace Clustering [13.6] FSSMSCは、既存のアプローチで一般的に見られる高い計算複雑性に対する新しいソリューションである。
この手法は、各データポイントを選択されたランドマークの疎線型結合として表現し、すべてのビューにまたがるコンセンサスアンカーグラフを生成する。
FSSMSCの有効性と効率は、様々なスケールの複数のベンチマークデータセットに対する広範な実験を通して検証される。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 06:54:00 GMT)
Deep Learning with Data Privacy via Residual Perturbation [13.4] いくつかの著名なプライバシー概念が確立され、プライバシー保護ディープラーニング(DL)に利用されている。
本稿では,プライバシー保護のための微分方程式に基づく残差摂動法を提案する。
残差摂動は効率的であり、最先端の個人的降下よりも優れることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 08:26:43 GMT)
Enhancing Object Coherence in Layout-to-Image Synthesis [13.3] 本稿では,グローバル・セマンティック・フュージョン(GSF)と自己相似機能拡張モジュールを用いた新しい拡散モデルを提案する。
セマンティックコヒーレンスについては,イメージキャプションには画像内のオブジェクト内のセマンティックな関係を定義するための豊富な情報が含まれていると論じる。
物理コヒーレンスを改善するため,各画素の生成プロセスに局所的な物理的コヒーレンス関係を明示的に統合する自己相似コヒーレンスアテンション合成(SCA)モジュールを開発した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:17:12 GMT)
IoT in the Era of Generative AI: Vision and Challenges [13.2] IoT関連領域におけるジェネレーティブAIの最も重要な応用について論じる。
もっとも重要な課題をいくつか特定し、現在のギャップについて論じます。
この記事では、ジェネレーティブAIの時代におけるIoTに関する新たな研究を刺激できることを願っています。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:31:20 GMT)
High Fidelity Scene Text Synthesis [12.8] シーンテキスト合成では、指定されたテキストを任意の画像にレンダリングする。
現在の方法は、通常、このタスクをエンドツーエンドで定式化するが、トレーニング中に効果的なキャラクタレベルのガイダンスが欠如している。
本稿では,高忠実度シーンテキスト合成のためのDreamTextを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:31:23 GMT)
Sampling Foundational Transformer: A Theoretical Perspective [12.8] 本稿では,複数のデータモダリティを扱える基本サンプリング変換器(SFT)を提案する。
SFTは多くのベンチマークで競合する結果を得たが、他の非常に特殊なモデルに比べて推論が速い。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 16:53:09 GMT)
Do Large Language Models Have Compositional Ability? An Investigation into Limitations and Scalability [12.3] 大規模言語モデル(LLM)は多くのAI問題に対する強力なツールとして登場した。
また、ICL(In-context Learning)機能も備えている。
複合的なタスクにどのようにアプローチするかは、未解明の未解決の問題のままである。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:39:16 GMT)
Seg-CycleGAN : SAR-to-optical image translation guided by a downstream task [12.2] 本文は,GANに基づくSAR-to-optical image translation法であるSeeg-CycleGANを提案する。
本手法は,船の標的セマンティックセグメンテーションの下流タスクを利用して,画像翻訳ネットワークのトレーニングを指導する。
SAR-to-optical Translationタスクにおける基礎モデルアノテーション付きデータセットの可能性を明らかにする。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:01:21 GMT)
SSL: A Self-similarity Loss for Improving Generative Image Super-resolution [11.9] 生成逆数ネットワーク(GAN)と生成拡散モデル(DM)は、実世界の画像超解像(Real-ISR)で広く利用されている。
これらの生成モデルは、視覚的アーティファクトや偽画像構造を生成する傾向があり、不自然なリアルISRの結果をもたらす。
本稿では, 生成実ISRモデルの性能向上のために, 単純かつ効果的な自己相似性損失(SSL)を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:46:06 GMT)
Divide-and-Conquer Predictive Coding: a structured Bayesian inference algorithm [11.7] 我々は、分割・対数予測符号化(D CPC)と呼ばれる構造生成モデルのための新しい予測符号化アルゴリズムを導入する。
D CPCは、生物学的確率を犠牲にすることなく、モデルパラメーターの最大値更新を行う。
実証的には、DCPCは競合するアルゴリズムよりも優れた数値性能を達成し、これまで予測符号に対処していなかった多くの問題に対して正確な推論を提供する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:29:03 GMT)
ICSFuzz: Collision Detector Bug Discovery in Autonomous Driving Simulators [11.3] 本稿では,自律走行シミュレータの信頼性向上を目的として,無視衝突シナリオを系統的に発見することを目的とする。
我々は、無視された衝突シナリオを効率的に発見するためのブラックボックスファジリング手法であるICSFuzzを提案する。
我々はICSFuzzを、最先端のシミュレーションベースのADSテスト手法であるDriveFuzzと比較し、その託宣を我々の無視照合対応託宣に置き換えた。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:48:54 GMT)
Autoregressive Enzyme Function Prediction with Multi-scale Multi-modality Fusion [11.3] MAPredは、タンパク質のEC数を自動回帰予測するために設計された、新しいマルチモダリティおよびマルチスケールモデルである。
MAPredは、タンパク質の一次アミノ酸配列と3Dトークンの両方を統合し、包括的なタンパク質の特徴を捉えるために二重経路アプローチを用いる。
New-392、Price、New-815を含むベンチマークデータセットの評価は、我々の手法が既存のモデルより優れていることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 08:28:43 GMT)
Top Pass: Improve Code Generation by Pass@k-Maximized Code Ranking [11.1] Top Passは、多数の候補からの潜在的な正しいソリューションを特定する、コードランキングのアプローチである。
これにより、ユーザは可能な限り少ない試行で正しいソリューションを見つけることができる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:53:51 GMT)
LaWa: Using Latent Space for In-Generation Image Watermarking [11.1] 知覚不能な画像透かしはそのような問題に対する有効な解決策の1つである。
LaWaは、LCD向けに設計された次世代画像透かし方式である。
また,LaWaは一般的な画像透かしにも利用できることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 22:03:45 GMT)
Swarm-Net: Firmware Attestation in IoT Swarms using Graph Neural Networks and Volatile Memory [11.0] IoT(Internet of Things)は、数十億もの相互接続された、主にローエンドの組み込みデバイスからなるネットワークである。
大規模なデプロイメントにもかかわらず、研究はIoTネットワークにおける重要なセキュリティ上の懸念を強調している。
Swarm内のあるノードの悪意あるアクティビティは、より大きなネットワークセクションに伝播することができる。
Swarm-Netは、IoTネットワーク固有の、相互接続されたグラフのような構造を利用する、新しいSwarm attestationテクニックである。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 03:19:29 GMT)
Devlore: Extending Arm CCA to Integrated Devices A Journey Beyond Memory to Interrupt Isolation [10.2] Arm Confidential Computing Architectureは、Realmと呼ばれる抽象化でセンシティブな計算を実行する。
CCAは、プラットフォーム上の統合デバイスがレルムにアクセスすることを許可していない。
本稿では,Devloreについて述べる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:33:48 GMT)
Evaluating BM3D and NBNet: A Comprehensive Study of Image Denoising Across Multiple Datasets [10.2] 本稿では,ブロックマッチング3Dで表現される従来の非学習手法と,NBNetで例証した現代の学習手法との比較を行った。
これらのアプローチは、CURE-OR、CURE-TSR、Set-12、Chest-Xrayなど、さまざまなデータセットにわたって評価する。
BM3Dは曖昧な課題のようなシナリオに優れるが、NBNetは低露光や過剰露光のような複雑なノイズ環境においてより効果的である。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:54:52 GMT)
Tensor Decomposition Meets RKHS: Efficient Algorithms for Smooth and Misaligned Data [10.0] 多次元データアレイを有限次元ベクトルの外積の和に分解する。
無限次元モードを持つテンソルを準テンソルと呼ぶ。
テンソルを連続RKHSモードで分解するアプローチはCP-HiFiと呼ばれる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:58:28 GMT)
Leveraging Knowledge Graph-Based Human-Like Memory Systems to Solve Partially Observable Markov Decision Processes [10.0] 我々は、部分的に観察可能なマルコフ決定プロセス(POMDP)を開発し、迷路をナビゲートしながら、エージェントが質問に答えなければならない。
環境は完全に知識グラフ(KG)に基づいており、隠れた状態は動的KGである。
私たちは、エージェントを異なるメモリシステムで訓練し比較し、独自のメモリシステムを管理する上で、人間の脳がどのように機能するかを明らかにします。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 21:04:14 GMT)
Bidirectional Generative Pre-training for Improving Time Series Representation Learning [9.6] 我々は、BiTimely Generative Pre-trained Transformer (BiTimelyGPT) と呼ばれる新しいアーキテクチャを提案する。
BiTimelyGPTによる生体信号と経時的臨床記録の経時的変化予測
BiTimelyGPTは、生体信号と経時的臨床記録を用いて、神経機能、疾患診断、生理的兆候を予測する上で優れた性能を示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 21:45:58 GMT)
A Survey on Employing Large Language Models for Text-to-SQL Tasks [9.5] リレーショナルデータベースに格納されるデータの量の増加により、様々な分野において、このデータの効率的なクエリと利用の必要性が高まっている。
LLM(Large Language Models)の最近の発展を活かすため、様々な新しい手法が登場し、迅速なエンジニアリングと微調整に重点が置かれている。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:54:21 GMT)
Kernel Density Estimators in Large Dimensions [9.3] 我々は、帯域幅$h$に応じて、密度$hat rho_hmathcal D(x)=frac1n hdsum_i=1n Kleft(fracx-y_ihright)$をカーネルベースで推定する。
本稿では,Kullback-Leibler分散に基づく帯域幅の最適しきい値が,本論文で同定された新しい統計体系に含まれることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:56:44 GMT)
HateSieve: A Contrastive Learning Framework for Detecting and Segmenting Hateful Content in Multimodal Memes [9.0] textscHateSieveは、ミーム内の憎しみのある要素の検出とセグメンテーションを強化するために設計されたフレームワークである。
textscHateSieveは、セマンティックなペアのミームを生成するContrastive Meme Generatorを特徴としている。
Hateful Memeでの実証実験では、textscHateSieveはトレーニング可能なパラメータが少なく、既存のLMMを超えるだけでなく、ヘイトフルコンテンツを正確に識別し、分離するための堅牢なメカニズムを提供する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:56:06 GMT)
Hotfixing Large Language Models for Cod [8.2] コードのための大規模言語モデル(LLM4Code)は、コード補完や生成といったタスクを補助し、開発者の不可欠な部分となっている。
これらのモデルは、バグの多いコードを生成するなど、リリース後に望ましくない振る舞いを示す。
本稿では,LLM4Codeをホットフィックスすることで,バグの少ないコードとより固定的なコードを生成することに焦点を当てる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 08:34:43 GMT)
SRTFD: Scalable Real-Time Fault Diagnosis through Online Continual Learning [8.0] 現代の産業環境は、新しい断層タイプ、動的条件、大規模データを扱うことができ、最小限の事前情報でリアルタイムの応答を提供するFD手法を必要としている。
本稿では,3つの重要な手法を用いて,オンライン連続学習(OCL)を強化するスケーラブルなリアルタイム故障診断フレームワークSRTFDを提案する。
実世界のデータセットと2つの公開シミュレーションデータセットの実験は、SRTFDの有効性と、現代の産業システムにおいて高度でスケーラブルで正確な故障診断を提供する可能性を示している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 03:26:22 GMT)
FSL-Rectifier: Rectify Outliers in Few-Shot Learning via Test-Time Augmentation [7.5] FSL(Few-shot-learning)は通常、トレーニング中に目に見えないクラスに属する画像(クエリ)を識別するモデルを必要とする。
生成画像コンバインダを用いて、原サンプルと適切な列車クラスサンプルを組み合わせることで、追加のテストクラスサンプルを生成する。
我々は、平均化によってより典型的な表現をもたらす拡張子を介して平均化された特徴を得る。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 09:31:51 GMT)
denoiSplit: a method for joint microscopy image splitting and unsupervised denoising [7.4] denoiSplitは、共同セマンティックイメージ分割と教師なし denoising の課題に取り組む方法である。
画像分割は、イメージを識別可能なセマンティック構造に分割することを含む。
この課題に対する現在の最先端の手法は、画像ノイズの存在に苦慮していることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:36:17 GMT)
TC-KANRecon: High-Quality and Accelerated MRI Reconstruction via Adaptive KAN Mechanisms and Intelligent Feature Scaling [7.3] 本研究は,TC-KANReconと命名された,革新的な条件付き拡散モデルを提案する。
Multi-Free U-KAN (MF-UKAN) モジュールと動的クリッピング戦略が組み込まれている。
実験により,提案手法は定性評価と定量的評価の両方において,他のMRI再建法よりも優れていることが示された。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 06:31:56 GMT)
Pareto Front Shape-Agnostic Pareto Set Learning in Multi-Objective Optimization [6.8] 既存の方法は、目的空間における選好ベクトルを決定空間における最適解にマッピングすることに依存する。
提案手法は, 事前知識を必要とせずに, パレート前面の任意の形状を処理し, パレート集合を学習することができる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:09:40 GMT)
Context-Aware Indoor Point Cloud Object Generation through User Instructions [6.4] 本稿では,その周辺環境とシームレスに統合された点雲オブジェクトを生成することができる,新しいエンドツーエンドのマルチモーダルディープニューラルネットワークを提案する。
我々のモデルは、これまで見えなかったオブジェクトレイアウトで新しい環境を作成できるようにすることで、シーン修正に革命をもたらす。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:01:56 GMT)
DeepAir: A Multi-Agent Deep Reinforcement Learning Based Scheme for an Unknown User Location Problem [6.2] 無人航空機(UAV)の様々な環境への展開は、ネットワークパラダイムに対する様々な解決策と戦略を提供してきた。
既存の問題の1つは、インフラストラクチャレス環境における未知のユーザロケーションである。
本研究では,新しい深層強化学習手法であるDeepAirを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:28:35 GMT)
Defining Boundaries: A Spectrum of Task Feasibility for Large Language Models [6.0] 大規模言語モデル(LLM)は、様々なタスクにおいて顕著なパフォーマンスを示しているが、多くの場合、その知識や能力を超えるクエリを処理できない。
本稿では,LLMが能力を超えるために必要なスキルのために,実用不可能なタスクを認識し,拒否する必要性に対処する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 22:58:23 GMT)
Contrastive masked auto-encoders based self-supervised hashing for 2D image and 3D point cloud cross-modal retrieval [6.0] 2D画像と3Dポイントクラウドデータの相互ハッシュ化は、現実世界の検索システムにおいてますます懸念される。
画像とポイントクラウドデータ間の検索のために,コントラッシブマスク付きオートエンコーダを用いた自己教師型ハッシュ(CMAH)を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:03:21 GMT)
On the Robustness of Kernel Goodness-of-Fit Tests [6.0] 既存のカーネル良性テストは、ロバスト性という一般的な概念により堅牢ではないことを示す。
本稿では,このオープンな問題をカーネルStein離散性球を用いて解決する,最初の堅牢なカーネル善良性テストを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:54:50 GMT)
Disposable-key-based image encryption for collaborative learning of Vision Transformer [5.8] 本稿では,プライバシ保護フェデレーション学習と同様に,複数のクライアントから機密データを共有して視覚変換器(ViT)をセキュアに訓練する手法を提案する。
提案手法では,各クライアントが個別に,各クライアントが暗号化キーを作成できるように,トレーニングイメージを個別に暗号化し,これらの暗号化イメージを初めて使用することにより,ViTをトレーニングする。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 09:55:37 GMT)
Time Matters: Examine Temporal Effects on Biomedical Language Models [5.7] 本研究は,3つのバイオメディカルタスクにおける言語モデルの性能とデータシフトの関係を統計的に検証することによって,ギャップを埋めるものである。
生物医学的言語モデルにおける時間的影響を定量的に評価するための多様な指標、データドリフト計測のための距離法、統計的手法を配置する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:21:33 GMT)
Assessing AI Utility: The Random Guesser Test for Sequential Decision-Making Systems [5.6] 本稿では,人工知能(AI)システムのリスクと脆弱性を偏りのある決定に対して評価するための一般的なアプローチを提案する。
提案手法の導出原理は、任意のAIアルゴリズムがランダムな推測よりも優れていることである。
現代のリコメンデータシステムは、リスクの低い選択肢を優先する傾向が似たようなものである可能性があることを強調する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:56:58 GMT)
Approximate ADCs for In-Memory Computing [5.2] ディープラーニング(DL)アクセラレーターのためのメモリコンピューティング(IMC)アーキテクチャでは、エネルギー効率と高い並列行列ベクトル乗算(MVM)演算を利用する。
最近報告された設計では、MVMの結果を読み取るのに必要なADCが、計算能力の85%以上を消費し、またその領域を支配していることが明らかになっている。
本研究では,ICCコアの周辺認識設計を行い,そのオーバーヘッドを軽減する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:59:59 GMT)
U-DECN: End-to-End Underwater Object Detection ConvNet with Improved DeNoising Training [5.2] 水中物体検出は、特定の環境問題により、検出器の走行速度と展開効率の要求が高い。
新しい水中物体検出器は、ネットワークアーキテクチャや訓練の複雑化を防ぎ、水中車両プラットフォームへの応用と展開を妨げている。
水中カラーキャストノイズに対する問合せ型エンドツーエンドオブジェクト検出器(ConvNetエンコーダ・デコーダアーキテクチャ)であるDenoising Training (U-DECN)を改善した水中DECを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:11:45 GMT)
Unbridled Icarus: A Survey of the Potential Perils of Image Inputs in Multimodal Large Language Model Security [5.1] 強力なMLLMのような信頼性の高いAIシステムの追求は、現代研究の重要な領域として現れている。
本稿では,画像モダリティのMLLMへの導入に伴う多面的リスクの軽減に努める。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:39:54 GMT)
Boolean matrix logic programming for active learning of gene functions in genome-scale metabolic network models [4.8] 我々は、細胞工学の促進と生物学的発見を促進するために、論理ベースの機械学習技術を適用しようとしている。
我々は,情報的実験を導くことでゲノム仮説空間を効率的に探索する新しいシステム,BMLP_active$を導入する。
$BMLP_active$は、ランダムな実験よりもトレーニング例が少ない遺伝子ペア間の相互作用をうまく学べる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:54:22 GMT)
Large Language Model Tokenizer Bias: A Case Study and Solution on GPT-4o [4.7] GPT-4 と GPT-4o は英語のような豊富な資源を持つ言語では例外的な性能を示している。
これらのモデルは、中国語や韓国語などの未資源言語を処理する際の制限を示す。
本稿では,これらの相違点のルーツを,これらのモデル固有のトークン化プロセスに遡る。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 01:17:41 GMT)
Accelerating Distributed Optimization: A Primal-Dual Perspective on Local Steps [4.5] 分散機械学習では、異なるデータを持つ複数のエージェントにまたがる線形変数が大きな課題となる。
本稿では,原変数上のラグランジアン収束を実現するフレームワークは,エージェント間通信を必要としないことを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:10:43 GMT)
Bridging Information Gaps in Dialogues With Grounded Exchanges Using Knowledge Graphs [4.4] 対話的接地のための大規模言語モデルの可能性について検討する。
私たちのアプローチでは、5つの知識領域にまたがる人間の会話を注釈付けして、BridgeKGと呼ばれる対話コーパスを作成します。
本研究は,これらのモデルが会話ベースタスクや一般的な予測誤りに対して,コンテキスト内学習をどのように利用するかについての知見を提供する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:51:21 GMT)
Sustainable Quantum Computing: Opportunities and Challenges of Benchmarking Carbon in the Quantum Computing Lifecycl [4.2] 本稿では,基礎的方法論とオープンな研究課題を提供する炭素対応量子コンピューティングフレームワークを提案する。
私たちの活動への呼びかけは、持続可能な量子コンピューティングとして知られる新しい研究方向の確立です。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 03:02:19 GMT)
Predicting Chaotic System Behavior using Machine Learning Techniques [4.0] 機械学習技術、特にディープラーニングは、従来の時系列予測手法よりも優れた性能を示している。
本研究では,次世代貯水池コンピューティング(NG-RC) ii)貯水池コンピューティング(RC)iii)長期短期記憶(LSTM)のカオスシステムの挙動予測能力について検討する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:45:23 GMT)
HiLight: A Hierarchy-aware Light Global Model with Hierarchical Local ConTrastive Learning [3.9] 階層的テキスト分類(HTC)はマルチラベル分類(MLC)のサブタスクである
階層型局所コントラスト学習(HiLCL)と呼ばれる階層型情報を導入するための新しい学習課題を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:26:58 GMT)
Training an NLP Scholar at a Small Liberal Arts College: A Backwards Designed Course Proposal [3.7] NLPコースが学習したいかもしれない2種類の学生。
NLPエンジニア」は、NLPに新しい技術を柔軟に設計し、構築し、適用することができる。
NLPの「NLP学者」は、NLPにおける疑問を提起し、洗練し、答えることができる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 00:50:59 GMT)
The Cognitive Revolution in Interpretability: From Explaining Behavior to Interpreting Representations and Algorithms [3.4] 機械的解釈可能性(MI)は、大きな言語モデルのような基礎モデルによって学習された特徴と暗黙のアルゴリズムを研究する別の研究領域として登場した。
我々は、20世紀の心理学における「認知革命」を反映した深層学習解釈の移行を促進するために、現在の手法が熟していると論じる。
計算神経科学におけるキーパラレルを反映した分類法を提案し,MI研究の2つの幅広いカテゴリについて述べる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 20:50:16 GMT)
A Novel Momentum-Based Deep Learning Techniques for Medical Image Classification and Segmentation [3.3] 医療画像から臓器を正確に分割することは、コンピュータによる診断と介入計画にとって重要な前提条件である。
本研究は,CTおよびMRIスキャンから様々な臓器を抽出し,疾患を分類するための深層学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 04:12:35 GMT)
Utilizing Large Language Models to Optimize the Detection and Explainability of Phishing Websites [3.0] PhishLangはオープンソースの軽量なLarge Language Model(LLM)で、Webサイトのコンテキスト分析を通じてWebサイトの検出をフィッシングする。
3.5ヶ月にわたるテスト期間において、PhishLangはおよそ26KのフィッシングURLを特定したが、その多くが人気のアンチフィッシングブロックリストによって検出されなかった。
我々はPhishLangとGPT-3.5 Turboを統合して、Webサイトをフィッシングとマークしたさまざまな機能に関するコンテキスト情報を提供する、テキスト説明可能なブロッキング警告を作成する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 01:14:13 GMT)
Deformable Image Registration with Multi-scale Feature Fusion from Shared Encoder, Auxiliary and Pyramid Decoders [2.6] 教師なし画像登録のための新しい変形可能な畳み込みピラミッドネットワークを提案する。
提案するネットワークは、画像ペア用の共有補助デコーダを追加することにより、従来のピラミッドネットワークを強化する。
以上の結果から, 高い登録精度を達成し, 円滑かつ可塑性変形を維持しつつ, 複雑な変形を捉えることが可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 08:02:28 GMT)
A Universal Flexible Near-sensor Neuromorphic Tactile System with Multi-threshold strategy for Pressure Characteristic Detection [2.4] 完全フレキシブル・ニューロモルフィック・触覚認識システムについて報告する。
システム内の信号はパルスとして送信され、しきい値情報として処理される。
本システムは,シンボルパターンやモース符号の認識において,これらの信号の傾向を正確に出力することができ,精度が高い。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:05:31 GMT)
Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction [2.3] HiPMは階層的に誘導される分子表現学習フレームワークである。
私たちのフレームワークは、分子表現(MRE)とタスク認識プロンプタ(TAP)の2つのコアコンポーネントで構成されています。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 07:02:54 GMT)
Deep Learning Approach for Changepoint Detection: Penalty Parameter Optimization [2.1] 動的プログラミング変化点検出アルゴリズムは、シーケンス内の変化点の位置を特定するために使用される。
本研究では、ペナルティパラメータを予測するための新しい深層学習手法を導入し、大規模ベンチマークによるラベル付きデータセットにおける変更点検出精度を明らかに向上させた。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:54:17 GMT)
Separate Generation and Evaluation for Parallel Greedy Best-First Search [2.1] グレディベスト1次探索 (GBFS) の並列化は, 直接並列化が逐次GBFSと大きく異なる検索動作をもたらすため, 困難である。
近年の研究では、Bentch Transition System (BTS) 探索に探索を制約する並列GBFSアルゴリズムのクラスが提案されている。
本稿では、状態生成と状態評価を分離し、状態評価率を大幅に改善する並列探索の改善を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 03:29:17 GMT)
Random tensor networks with nontrivial links [1.9] ランダムテンソルネットワークの絡み合い特性の系統的研究を開始する。
我々は、自由確率、ランダム行列理論、ワンショット量子情報理論のツールを用いる。
我々は、分割転送プロトコル、ランダムテンソルネットワークにおける絡み合いネガティビティ、量子重力におけるユークリッド経路積分に関する以前の研究とのつながりを描いている。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 09:31:26 GMT)
FreqMamba: Viewing Mamba from a Frequency Perspective for Image Deraining [1.7] 雨害による画像の劣化は、知覚に欠かせない周波数情報を失うことが多く、画像の劣化はこの問題を解決することを目的としている。
近年の研究では、マンバのグローバルおよびローカル情報知覚の有効性と効率性が確認されている。
本稿では,マンバと周波数解析の相補性を利用して画像デライニングを行う,効率的かつ効率的なパラダイムであるFreqMambaを提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:32:55 GMT)
Advancing Multimodal Large Language Models in Chart Question Answering with Visualization-Referenced Instruction Tuning [1.7] マルチモーダル大言語モデル(MLLM)は、チャート質問応答(CQA)に大きな可能性を示す
近年の取り組みは、データ収集と合成によるデータセットのスケールアップに重点を置いている。
本稿では,トレーニングデータセットの強化とモデル開発を指導するための,可視化参照型指導チューニング手法を提案する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:30:05 GMT)
GPT-4 Emulates Average-Human Emotional Cognition from a Third-Person Perspective [1.6] まず最初に、脳神経活動のパターンを見つけるために設計された感情誘発刺激を慎重に構築する。
以上の結果から, GPT-4は特に精度が高いことが示唆された。
GPT-4の解釈は,自己評価よりも,他者の感情に対する人間の判断と密接に一致していることがわかった。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 01:22:09 GMT)
Neurosymbolic Methods for Rule Mining [1.4] 本章では,本質的な背景情報から,ルールマイニングの問題に対処する。
本稿では,帰納論理プログラミング,経路サンプリングと一般化,線形プログラミングの3つのグループに分類されるルールマイニング手法について検討する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:50:40 GMT)
Kov: Transferable and Naturalistic Black-Box LLM Attacks using Markov Decision Processes and Tree Search [1.2] 大規模言語モデル(LLM)から有害な振る舞いを緩和することは、モデルの適切なアライメントと安全性を確保するための重要なタスクである。
この研究は、マルコフ決定過程(MDP)として赤チームの問題を枠組み化し、モンテカルロ木探索を用いてブラックボックス、クローズドソース LLM の有害な挙動を発見する。
提案アルゴリズムであるKovは、敵の攻撃を最適化し、ブラックボックスのLSMからの応答を定期的に評価し、より有害なブラックボックス行動への探索を誘導する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 20:31:52 GMT)
Dynamics of Symmetry-Protected Topological Matter on a Quantum Computer [0.8] トポロジカルエッジモードの制御は、外部ノイズに対して弾力的に量子情報を符号化するのに望ましい。
この結果は、現在の量子プロセッサ上でのトポロジカル量子スピン系の安定な長期実装への道筋を提供する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 00:43:28 GMT)
Using Retriever Augmented Large Language Models for Attack Graph Generation [0.8] 本稿では,大規模言語モデル(LLM)を利用したアタックグラフの自動生成手法について検討する。
これは、Common Vulnerabilities and Exposures(CommonLLMs)を使用して、脅威レポートからアタックグラフを作成する方法を示している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:59:08 GMT)
Time Makes Space: Emergence of Place Fields in Networks Encoding Temporally Continuous Sensory Experiences [0.7] 時間的に連続した感覚エピソードを記憶するために訓練されたネットワークに位置細胞が出現することを示す。
プレースフィールドは海馬現象学の重要な側面を再現する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:17:11 GMT)
A Diamond Model Analysis on Twitter's Biggest Hack [0.7] 本稿では,ダイアモンドモデルを用いて,サイバー攻撃をハイジャックする2020年のTwitterアカウントの侵入分析ケーススタディを行う。
我々は、この標準化されたインシデント対応モデルに従い、敵、能力、インフラ、犠牲者をマッピングし、攻撃の包括的分析を行い、サイバーセキュリティ政策の観点からの攻撃による影響について分析する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 16:12:32 GMT)
SoK: Content Moderation Schemes in End-to-End Encrypted Systems [0.6] 本稿では,メッセージのスパッタリングや知覚ハッシュといったコンテンツモデレーション手法のユニークな特徴について検討する。
これにより、研究者たちは、エンドツーエンドの暗号化システムとコンテンツモデレーションを互換性を持たせるために、新しいセキュリティプリミティブを開発し、設計するに至った。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 16:17:08 GMT)
On the Solvability of the {XOR} Problem by Spiking Neural Networks [0.5] 線形分離不能なXOR問題とバイナリ論理ゲートを表す関連する問題を再考する。
この問題を例として,情報符号化などのハイパーパラメータの影響について検討する。
隠れた層に2つのニューロンしか持たない最小構成のスパース解を実現できることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:01:39 GMT)
Brain-grounding of semantic vectors improves neural decoding of visual stimuli [0.3] 本稿では,意味ベクトルの脳基底と呼ばれる表現学習フレームワークを提案する。
機能的磁気共鳴画像(fMRI)を150種類の視覚刺激カテゴリーで訓練した。
1)fMRI, 2)脳磁図(MEG), 3)脳磁図(ECoG)の視覚刺激の神経データを用いてゼロショット脳復号を行った。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:14:38 GMT)
Exploiting Formal Concept Analysis for Data Modeling in Data Lakes [0.3] 本稿では,形式的概念分析(FCA)に根ざした実用的なデータ可視化と分析手法を提案する。
データ構造をオブジェクトとして表現し、概念格子を分析し、これらの構造を統一し共通のスキーマを確立するための2つの戦略を提示します。
私たちは、34の異なるフィールド名しか持たない、80%のデータ構造を完全にカバーしています。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:58:31 GMT)
CURLing the Dream: Contrastive Representations for World Modeling in Reinforcement Learning [0.2] Curled-Dreamerは、コントラスト学習をDreamerV3フレームワークに統合する、新しい強化学習アルゴリズムである。
我々の実験では、Curled-Dreamerは最先端のアルゴリズムより一貫して優れています。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 14:13:22 GMT)
Moderate Exponential-time Quantum Dynamic Programming Across the Subsets for Scheduling Problems [0.2] 量子最小探索と動的プログラミングの組み合わせは、NPハード問題の複雑さを改善するのに特に効果的であることが証明されている。
本稿では,NP-ハード単一マシンスケジューリング問題に対して,そのような改善を実現する境界付きエラーハイブリッドアルゴリズムを提案する。
我々のアルゴリズムは、よく知られた古典的アルゴリズムと比較して指数関数的な部分の複雑さを減らし、時には擬似多項式因子のコストがかかる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 10:28:49 GMT)
Three statistical descriptions of classical systems and their extensions to hybrid quantum-classical systems [0.1] 古典粒子系の統計学的記述を3つ提示し、それらのハイブリッド量子古典系への拡張について考察する。
位相空間上のアンサンブルのアプローチと、新しいヒルベルト空間アプローチは、等価なハイブリッドモデルをもたらす。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 11:22:51 GMT)
Trade-offs between unitary and measurement induced spin squeezing in cavity QED [0.0] 測定に基づく絡み合い生成がユニタリプロトコルをオーバーパフォーマンスする条件を決定する基準を導出する。
我々の結論は、標準量子限界以下の動作を目指す最先端原子時計に関係している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:42:57 GMT)
Time-domain programmable beam-splitter operations for an optical phase-sensitive non-Gaussian state [0.0] 位相感受性非ガウス状態に対する時間領域プログラマブルビームスプリッタ(BS)演算を可能にするループベース光プロセッサを提案する。
ループ自体は高品質であり、ウィグナーの負性性と位相コヒーレンスを保ちながら、7回の往復で非ガウス状態の保存を可能にする。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:39:00 GMT)
The Traveling Mailman: Topological Optimization Methods for User-Centric Redistricting [0.0] 本研究では,US Postal Service ネットワークを用いた地域間接続性評価手法を提案する。
我々は、地域境界がコミュニティの整合性に与える影響を評価するために、トポロジカルデータ分析とマルコフ・チェイン・モンテカルロ法を組み合わせる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:06:12 GMT)
The Good, the Bad, and the Ugly: Predicting Highly Change-Prone Source Code Methods at Their Inception [0.0] 将来のメンテナンスの負担を軽減するための主要な戦略は、変更の起こりやすいコードコンポーネントの早期予測と識別である。
49の著名なオープンソースJavaプロジェクトから,74,051のソースコードメソッドを分析した。
その結果,約80%の変化が20%の手法に集中していることが判明した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 06:20:48 GMT)
Strong denoising of financial time-series [0.0] 本稿では,財務データにおける信号対雑音比を大幅に改善する手法を提案する。
このアプローチは、ターゲット変数と異なるコンテキスト変数を組み合わせることに依存し、自動エンコーダ(AE)を使用して、組み合わせた入力の再構成を学習する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 03:58:40 GMT)
Root Cause Attribution of Delivery Risks via Causal Discovery with Reinforcement Learning [0.0] 本稿では, 因果発見と強化学習を統合することで, サプライチェーンにおける納入リスクの根本原因を解明する手法を提案する。
提案手法を実世界のサプライチェーンデータセットに適用し,納期遅延の原因を明らかにする上での有効性を示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 20:52:51 GMT)
Real-Time Drowsiness Detection Using Eye Aspect Ratio and Facial Landmark Detection [0.0] 本研究は、視線量比(EAR)と顔のランドマーク検出技術を用いて、眠気を検出するために設計されたリアルタイムシステムを提案する。
EARのしきい値を確立することで、システムはいつ目を閉じているかを識別し、潜在的な眠気を示す。
実験の結果,システムは低計算要求を維持しながら,高い精度で眠気を確実に検出できることがわかった。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:34:24 GMT)
Quantum circuit compilation with quantum computers [0.0] 本稿では,量子コンピュータによる計算を行うための量子アルゴリズムのクラスを紹介する。
提案手法の有効性をQuantumとSimulated Annealingベースのコンパイルを用いて実証する。
変換不変回路の場合、コンパイルの結果、入力回路のサイズが広範囲に増大する忠実性ゲインが得られる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:55:58 GMT)
Polyadic Cantor potential of minimum lacunarity: Special case of super periodic generalized unified Cantor potential [0.0] 一般化統一カントールポテンシャル(GUCP)の概念を鍵パラメータ$N$で導入する。
このシステムの特徴は、合計$L$、ステージ$S$、スケーリングパラメータ$rho$、および2つの実数$mu$と$nu$である。
本稿では,従来の量子システムと異なり,GUCP系は鋭い伝送共鳴を示すことを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 02:19:36 GMT)
Photon Angular Momentum and Zero-Point Oscillations [0.0] 局所的に振動する電荷分布からの放射は、古典的な電磁力学では説明できない角運動量を持つ。
この角運動量は、双極子源の非励起状態における零点振動に起因することを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:59:03 GMT)
Phase Transition in the Quantum Capacity of Quantum Channels [0.0] 我々は、全ての量子チャネルの量子容量が、ホワイトノイズによって汚染されると、$xgeq frac12$でゼロに落ちることを証明している。
このチャネルで見つかるゼロ容量領域は、以前発見されたエンタングルメント結合領域よりもかなり大きい。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 09:49:52 GMT)
Personalized Federated Learning for improving radar based precipitation nowcasting on heterogeneous areas [0.0] この研究は、分散気象レーダ画像上でのAdapFLと呼ばれる、パーソナライズされた学習アーキテクチャの適用性に対処する。
アダプFLを用いて得られた結果は、各ゾーン、及び、前述した各分布領域の表面の中央部を覆う領域で解析される。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 12:46:55 GMT)
Performance Evaluation of YOLOv8 Model Configurations, for Instance Segmentation of Strawberry Fruit Development Stages in an Open Field Environment [0.0] 本研究では, オープンフィールド環境下でイチゴを熟成・未熟成段階に分割するためのYOLOv8モデル構成の性能評価を行った。
YOLOv8nモデルは、平均平均精度 (mAP) が80.9%と優れたセグメンテーション精度を示し、他のYOLOv8構成よりも優れていた。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 00:33:45 GMT)
PRECISe : Prototype-Reservation for Explainable Classification under Imbalanced and Scarce-Data Settings [0.0] PreCISeは,3つの課題すべてに対処するために,簡潔に構築された説明可能な設計モデルである。
PreCISeは、マイノリティクラスへのデータ効率的な一般化において、現在の最先端メソッドよりも優れています。
ケーススタディでは、モデルが容易に解釈可能な予測を生成する能力を強調している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 12:05:32 GMT)
Ownership in low-level intermediate representation [0.0] 高レベルの言語におけるオーナシップの概念は、プログラマとコンパイラの両方がメモリ操作の有効性を判断するのに役立ちます。
低レベル中間表現のようなLLVMのオーナシップセマンティクスを開発する。
LLVMのモデルチェッカーであるSEABMCでこれらのセマンティクスを実装している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:58:35 GMT)
On the Convergence of a Federated Expectation-Maximization Algorithm [0.0] 本稿では,Federated Mixture of $K$ Linear Regressionsモデルに対する期待最大化(EM)アルゴリズムの収束率について検討する。
驚くべきことに、結果はボトルネックではなく、データの異質性によってフェデレート学習アルゴリズムの収束が加速することを示している。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 16:46:42 GMT)
Observability and Predictability in Quantum and Post-Quantum Physics [0.0] 私は、多くの量子「パラドックス」が2つの領域についての曖昧な推論に依存していることを示します。
私は、量子不確実性が基本的なものであるかどうかという疑問を正式に定義し、解決する。
分岐量子系に対して予測的優位性の不可能性を示す部分的な証明を確立できると私は論じる。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 17:05:01 GMT)
Note on quantum discord [0.0] 本稿では,密度行列の部分的転置に基づく2量子系に対するゼロ・ディスコード基準を提案する。
密度行列の固有値ベクトルを用いた量子幾何学的不協和(GQD)の解析的下界を提供する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 23:54:17 GMT)
Non-linearity and chaos in the kicked top [0.0] 古典的極限においてカオス的な振る舞いを示す量子系を研究する。
我々の調査は、古典システムにおける非線形性とカオスの関係に光を当てている。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 22:05:50 GMT)
Multiview learning with twin parametric margin SVM [0.0] マルチビュー学習(MVL)は、相互補完するために多様な視点の利点を活用する。
マルチビュー・ツインパラメトリック・マージン支援ベクトルマシン(MvTPMSVM)を提案する。
MvTPMSVMは、両クラスに対応するパラメトリック・マージン・ハイパープレーンを構築し、異方性雑音構造の影響を規制し、管理することを目的としている。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:00:14 GMT)
Multitask Fine-Tuning and Generative Adversarial Learning for Improved Auxiliary Classification [0.0] 3つの下流タスクをマルチタスクで微調整するための新しいBERTアーキテクチャを実装した。
我々のモデルであるMultitask BERTは、レイヤ共有とトリプルトアーキテクチャ、カスタム文ペアトークン化、損失ペアリング、勾配手術を取り入れています。
また、BERTに生成逆学習を適用し、潜在空間から写像して偽の埋め込みを生成する条件付きジェネレータモデルを構築した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 20:05:54 GMT)
LLM-Based Robust Product Classification in Commerce and Compliance [0.0] 本研究では,産業分類の現実的な課題を探求し,現実的なデータシミュレーションを可能にするデータ摂動を提案する。
本研究は、文脈内学習を用いたLLMが、クリーンデータシナリオにおける教師ありアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 22:59:32 GMT)
Iterative Improvement of an Additively Regularized Topic Model [0.0] 本稿では,トピックモデルの反復的学習法を提案する。
いくつかの自然言語テキストの収集実験により、提案したITARモデルは、他の人気のあるトピックモデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 18:22:12 GMT)
Estimating Bethe roots with VQE [0.0] 本研究では,スピン-1/2 XXZ量子スピン鎖のBethe根を推定するための変分量子固有解法を提案する。
閉および開のXXZ鎖に対して、最大5つのダウンスピンを持つ基底状態と励起状態の両方に対応するBethe根の推定値を得る。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 00:57:38 GMT)
Enhancing phase sensitivity in Mach-Zehnder interferometer with various detection schemes using SU(1,1) coherent states [0.0] マッハ・ツェンダー干渉計(Mach-Zehnder Interferometer, MZI)は、この現象を解析するための多用途ツールである。
本稿では,異なる検出手法と入力状態を用いて,MZIの位相感度を種々のシナリオで解析する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 19:49:26 GMT)
Contrastive Learning and Abstract Concepts: The Case of Natural Numbers [0.0] 対照的な学習は、人間でも超人的範囲でも高い精度で、一目で数えられるように訓練できることを示す。
類似アーキテクチャのニューラルネットワークスキームを,一見教師付き学習(SL)のトレーニング・ツー・カウントの結果と比較した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 05:29:47 GMT)
Comparative Evaluation of Memory Technologies for Synaptic Crossbar Arrays- Part 2: Design Knobs and DNN Accuracy Trends [0.0] クロスバーメモリアレイは、ディープニューラルネットワーク(DNN)のインメモリコンピューティング(IMC)ベースのアクセラレーションの成果として評価されている。
本稿では,PWA (Partial Wordline Activation) などの回路設計ソリューションと,ハードウェアの非理想性を低減するカスタム参照レベルの効果について検討する。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 20:02:51 GMT)
Coherence, broken symmetry and nondissipative motion of a quantum oscillator [0.0] 動的コヒーレント状態と位相対称性の破れと非散逸運動の存在との関係を考察する。
相互作用する粒子の類似状態の多粒子系では、自分自身を超実用性と超伝導として表す。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 08:13:42 GMT)
An introduction to variational quantum algorithms for combinatorial optimization problems [0.0] このチュートリアルは変分量子アルゴリズムのクラスに関する数学的記述を提供する。
量子側および古典側におけるこれらのハイブリッドアルゴリズムの重要な側面を正確に紹介する。
我々はQAOAに特に注意を払って、そのアルゴリズムに関わる量子回路と、その可能な誘導関数によって満たされる特性を詳述した。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 10:45:08 GMT)
An analysis of HOI: using a training-free method with multimodal visual foundation models when only the test set is available, without the training set [0.0] デフォルト設定では、Human-Object Interaction(HOI)のパフォーマンスはほぼ飽和している。
本研究は、真理とランダムな任意の組み合わせの2つの実験的な設定を用いる。
マルチモーダル視覚基盤モデルのオープン語彙能力は,まだ完全には実現されていない。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 13:40:02 GMT)
A Comparative Study of Convolutional and Recurrent Neural Networks for Storm Surge Prediction in Tampa Bay [0.0] 本稿では,3つのディープラーニングアーキテクチャ,CNN-LSTM,LSTM,3D-CNNの性能を比較した。
CNN-LSTMモデルは他のアーキテクチャよりも優れており、テスト損失は0.010、R-squared(R2)スコアは0.84である。
3D-CNNモデルでは、テスト損失0.011とR2が0.82と妥当な性能を示したが、極端な条件下では不安定であった。
論文参考訳(メタデータ) (Sun, 11 Aug 2024 15:12:21 GMT)