A Survey on Large Language Model based Autonomous Agents [105.3] 大規模言語モデル(LLM)は、人間レベルの知性を達成する上で、顕著な可能性を示している。
本稿では,LLMに基づく自律エージェントの分野を総合的な観点から体系的に検討する。
本稿では、社会科学、自然科学、工学の分野におけるLLMベースの自律エージェントの多様な応用について概観する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:32:04 GMT)
Dynamics of magnetization at infinite temperature in a Heisenberg spin chain [105.1] 46個の超伝導量子ビットの鎖において, チェーンの中心に伝達される磁化の確率分布である$P(mathcalM)$について検討した。
P(mathcalM)$の最初の2つの瞬間は超拡散的挙動を示し、これはKPZの指標である。
第3モーメントと第4モーメントは、KPZ予想を除外し、他の理論を評価することができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:28:25 GMT)
Towards Automated Movie Trailer Generation [99.0] 本稿では,エンコーダ・デコーダアーキテクチャを利用したディープラーニングフレームワークTGTを紹介する。
自動回帰トレーラーデコーダは、次のトレーラーショットの特徴表現を予測する。
当社のTGTは、総合的なメトリクススイートにおいて、従来の方法よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:28:34 GMT)
OW-VISCap: Open-World Video Instance Segmentation and Captioning [95.7] 本研究では,映像中の映像や未確認の物体の分割,追跡,キャプションを共同で行う手法を提案する。
マスク付アテンション拡張LDM入力により,検出対象毎にリッチな記述文とオブジェクト中心のキャプションを生成する。
当社のアプローチは,3つのタスクにおいて最先端の作業と一致しているか,あるいは超えています。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:59:58 GMT)
OpenNeRF: Open Set 3D Neural Scene Segmentation with Pixel-Wise Features and Rendered Novel Views [90.7] 提案するOpenNeRFは,ポーズ画像上で自然に動作し,NeRF内のVLM機能を直接符号化する。
我々の研究は、ピクセルワイドVLM機能を用いることで、DINO正規化を必要とせずに、全体的なアーキテクチャがより複雑になることを示している。
Replicaデータセット上の3Dポイントクラウドセグメンテーションでは、OpenNeRFはLERFやOpenSceneといった最近のオープン語彙法を少なくとも4.9 mIoUで上回っている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:59:08 GMT)
EulerFormer: Sequential User Behavior Modeling with Complex Vector Attention [88.5] 複素ベクトル注意を持つ新しい変圧器変圧器(EulerFormer)を提案する。
意味的差と位置的差の両方を定式化するための統一的な理論的枠組みを提供する。
意味的変動に対してより堅牢であり、原理上はより上述の理論的性質を持つ。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:29:34 GMT)
ReFT: Representation Finetuning for Language Models [74.5] 我々は、$textbfRepresentation Finetuning (ReFT)$メソッドのファミリーを開発する。
LoReFTは、従来の最先端PEFTよりも10x-50倍高いパラメータ効率の介入を学習する。
本稿では,8つのコモンセンス推論タスク,4つの算術推論タスク,Alpaca-Eval v1.0,GLUEについて紹介する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:00:37 GMT)
How Much Data are Enough? Investigating Dataset Requirements for Patch-Based Brain MRI Segmentation Tasks [74.2] ディープニューラルネットワークを確実にトレーニングするには、大規模なデータセットへのアクセスが必要である。
モデル開発に関連する時間的・経済的コストを緩和するためには,満足度の高いモデルをトレーニングするために必要なデータの量を明確に理解することが重要である。
本稿では,パッチベースのセグメンテーションネットワークのトレーニングに必要なアノテートデータの量を推定するための戦略的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:55:06 GMT)
Scaling Up Video Summarization Pretraining with Large Language Models [73.7] 本稿では,大規模ビデオ要約データセットを生成するための,自動化されたスケーラブルなパイプラインを提案する。
我々は既存のアプローチの限界を分析し、それらに効果的に対処する新しいビデオ要約モデルを提案する。
我々の研究は、プロが注釈付けした高品質の要約を持つ1200本の長編ビデオを含む新しいベンチマークデータセットも提示した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:59:06 GMT)
Learning to Plan and Generate Text with Citations [69.6] 提案手法は, テキストの忠実性, 接地性, 制御性を向上させるために最近実証されたプランベースモデルの帰属性について検討する。
本稿では,異なるブループリントの変種を利用する帰属モデルと,質問をゼロから生成する抽象モデルと,質問を入力からコピーする抽出モデルを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:27:54 GMT)
Learning Subject-Aware Cropping by Outpainting Professional Photos [69.1] 本稿では,高品質な主観的作物を生産する要因を,プロのストックイメージから学習するための弱教師付きアプローチを提案する。
私たちの洞察は、ストックイメージのライブラリと、最新のトレーニング済みのテキスト-画像拡散モデルを組み合わせることです。
我々は、収穫された無作為のトレーニングペアの大規模なデータセットを自動的に生成して、収穫モデルをトレーニングすることができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:36:21 GMT)
Concept -- An Evaluation Protocol on Conversation Recommender Systems with System- and User-centric Factors [68.7] 本稿では,システムとユーザ中心の要素を統合した新しい包括的評価プロトコルであるConceptを提案する。
まず、現在のCRSモデルの長所と短所を概観する。
第二に、「全能」なChatGPTにおける低ユーザビリティの問題を特定し、CRSを評価するための包括的なリファレンスガイドを提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:56:48 GMT)
No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance [68.2] マルチモーダルモデルは、下流の"ゼロショット"のパフォーマンスを線形改善するために、指数関数的に多くのデータを必要とする。
本研究は,大規模な訓練パラダイムの下での「ゼロショット」一般化能力の鍵となる訓練データに対する指数関数的要求を明らかにする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:58:02 GMT)
KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantization [67.7] LLMは、大きなコンテキストウィンドウを必要とするドキュメント分析や要約のようなアプリケーションでの利用が増えている。
KVキャッシュアクティベーションは、推論中のメモリ消費の主要な要因である。
本稿では,KVアクティベーションを定量化するための新しい手法を導入することで,この問題に対処するKVQuantを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:45:34 GMT)
CMB: A Comprehensive Medical Benchmark in Chinese [67.7] そこで我々は,中国語の包括的医療ベンチマークであるCMB(Comprehensive Medical Benchmark)を提案する。
伝統的な中国医学はこの評価に欠かせないものであるが、全体としては成り立たない。
われわれは,ChatGPT,GPT-4,中国専用LSM,医療分野に特化したLSMなど,いくつかの大規模LSMを評価した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:16:57 GMT)
Uncertainty in Language Models: Assessment through Rank-Calibration [65.1] 言語モデル(LM)は、自然言語生成において有望な性能を示している。
与えられた入力に応答する際の不確実性を正確に定量化することは重要である。
我々は、LMの確実性と信頼性を評価するために、Rank$-$Calibration$と呼ばれる斬新で実用的なフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:31:05 GMT)
From Language Modeling to Instruction Following: Understanding the Behavior Shift in LLMs after Instruction Tuning [63.6] そこで本研究では,本質的な変化に着目した事前学習モデルの調整方法について検討する。
次に、事前訓練されたモデルと命令調整されたモデルから導かれた説明を比較することで、命令チューニングの影響について研究する。
この結果から,指導指導の3つの重要な影響が明らかになった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:30:31 GMT)
Mitigating the Impact of Outlier Channels for Language Model Quantization with Activation Regularization [62.2] 言語モデルには、平均値が他のチャネルよりも桁違いに高い外れ値チャネルが含まれていることが知られている。
本稿では,QAT(Quantization-Aware Training)とアクティベーション・カルトシス・正規化(Activation Kurtosis regularization)によって,レイヤの入力を正規化する戦略を提案する。
入力と出力の両方を正規化することは、入力量子化の難しさを重みに"移行"するのを防ぐために重要であることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:25:30 GMT)
Meta Invariance Defense Towards Generalizable Robustness to Unknown Adversarial Attacks [62.0] 現在の防衛は主に既知の攻撃に焦点を当てているが、未知の攻撃に対する敵意の強固さは見過ごされている。
メタ不変防衛(Meta Invariance Defense, MID)と呼ばれる攻撃非依存の防御手法を提案する。
MIDは高レベルの画像分類と低レベルの頑健な画像再生における攻撃抑制において,知覚不能な逆方向の摂動に対して同時に頑健性を実現する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:10:38 GMT)
Investigating the Robustness of Counterfactual Learning to Rank Models: A Reproducibility Study [61.6] ランク付け学習(CLTR: Counterfactual Learning to rank)は、IRコミュニティにおいて、ログ化された大量のユーザインタラクションデータを活用してランキングモデルをトレーニングする能力において、大きな注目を集めている。
本稿では,複雑かつ多様な状況における既存のCLTRモデルのロバスト性について検討する。
その結果, DLAモデルとIPS-DCMは, PS-PBMやPSSよりも, オフラインの確率推定による堅牢性が高いことがわかった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:54:38 GMT)
FUN with Fisher: Improving Generalization of Adapter-Based Cross-lingual Transfer with Scheduled Unfreezing [60.6] 微調整タスクアダプタのためのスケジュール付き凍結アルゴリズムについて検討する。
実験により, 完全微調整に近づき, 言語間移動性能が向上した。
本研究では,4つのデータセットに対して平均2点改善を達成できる一般的な非凍結アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:43:16 GMT)
A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.5] 我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:07:24 GMT)
HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud [60.5] ハンドポーズ推定は、様々な人間とコンピュータの相互作用アプリケーションにおいて重要なタスクである。
本論文は,手形画像点雲上での正確な手ポーズを反復的に認知する拡散型手ポーズ推定モデルであるHandDiffを提案する。
実験の結果,提案したHandDiffは,4つの挑戦的なハンドポーズベンチマークデータセットにおいて,既存のアプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:15:16 GMT)
RELIC: Investigating Large Language Model Responses using Self-Consistency [58.6] LLM(Large Language Models)は、フィクションと事実を混同し、幻覚として知られる非事実コンテンツを生成することで有名である。
本稿では,ユーザが生成したテキストの信頼性を把握できる対話型システムを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:18:30 GMT)
Revisiting subword tokenization: A case study on affixal negation in large language models [57.8] 現代英語大言語モデル(LLM)に対する接尾辞否定の影響を計測する。
我々は、異なるサブワードトークン化手法を用いてLLMを用いて実験を行う。
モデルは全体として、接尾辞の意味を確実に認識できることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:52:37 GMT)
Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.7] Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:57:56 GMT)
P^3SUM: Preserving Author's Perspective in News Summarization with Diffusion Language Models [57.6] 既存のアプローチは、要約の50%以上で、ニュース記事の政治的意見やスタンスを変えている。
政治的視点分類器によって制御される拡散モデルに基づく要約手法であるP3SUMを提案する。
3つのニュース要約データセットの実験により、P3SUMは最先端の要約システムより優れていることが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:10:34 GMT)
SC4D: Sparse-Controlled Video-to-4D Generation and Motion Transfer [57.5] 動作と外観を分離するSC4Dという,効率的でスパース制御されたビデオ・ツー・4Dフレームワークを提案する。
我々の手法は、品質と効率の両面で既存の手法を超越している。
動作を多種多様な4Dエンティティにシームレスに転送する新しいアプリケーションを考案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:05:18 GMT)
LongVLM: Efficient Long Video Understanding via Large Language Models [55.8] LongVLMは、長いビデオ理解のための強力なビデオLLMである。
長編ビデオを短期セグメントに分解し、階層的トークンモジュールを介して各ローカルセグメントのローカル特徴を符号化する。
グローバルなセマンティクスを各ローカル機能に統合し、コンテキスト理解を強化する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:33:29 GMT)
Rewiring the Transformer with Depth-Wise LSTMs [55.5] カスケードトランスとサブ層を接続する奥行きLSTMを用いたトランスフォーマーを提案する。
6層トランスを用いた実験では、WMT 14英語/ドイツ語/フランス語タスクとOPUS-100多言語NMTタスクの両方でBLEUが大幅に改善された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:17:11 GMT)
Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [55.3] 現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:47:09 GMT)
Geometry of degenerate quantum states, configurations of $m$-planes and invariants on complex Grassmannians [55.2] 退化状態の幾何学を非アーベル接続(英語版)$A$に還元する方法を示す。
部分空間のそれぞれに付随する独立不変量を見つける。
それらのいくつかはベリー・パンチャラトナム位相を一般化し、1次元部分空間の類似点を持たないものもある。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:39:28 GMT)
Training LLMs over Neurally Compressed Text [55.1] 本稿では,高度に圧縮されたテキスト上での大規模言語モデル(LLM)の訓練について検討する。
テキストをブロックに分割し,それぞれが同じビット長に圧縮する新しい圧縮手法であるEqual-Info Windowsを提案する。
提案手法は, 大規模化により向上し, パープレキシティと推論速度のベンチマークにおいて, バイトレベルのベースラインをはるかに上回る, ニューラルネットワークによる効果的な学習を実演する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:48:28 GMT)
AIGIQA-20K: A Large Database for AI-Generated Image Quality Assessment [54.9] AIGIQA-20Kとして知られる2万のAIGIと420,000の主観評価を備えた、これまでで最大のAIGI主観的品質データベースを作成します。
このデータベース上でベンチマーク実験を行い、16の主流AIGI品質モデルと人間の知覚との対応性を評価する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:12:24 GMT)
SceneFake: An Initial Dataset and Benchmarks for Scene Fake Audio Detection [54.7] 本稿では,シーンフェイク音声検出のためのデータセットSceneFakeを提案する。
操作されたオーディオは、オリジナルオーディオの音響シーンを改ざんするだけで生成される。
本論文では,SceneFakeデータセット上での擬似音声検出ベンチマーク結果について報告する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:58:35 GMT)
MVD-Fusion: Single-view 3D via Depth-consistent Multi-view Generation [54.3] 本稿では,多視点RGB-D画像の生成モデルを用いて,単視点3次元推論を行うMVD-Fusionを提案する。
提案手法は,蒸留に基づく3D推論や先行多視点生成手法など,最近の最先端技術と比較して,より正確な合成を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:59:57 GMT)
Cameras as Rays: Pose Estimation via Ray Diffusion [54.1] カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:27:06 GMT)
SemGrasp: Semantic Grasp Generation via Language Aligned Discretization [53.4] 本稿では,SemGraspと呼ばれるセマンティックなグリップ生成手法を提案する。
そこで本研究では,握り空間を意味空間に整合させる離散表現を導入し,握り姿勢の生成を可能にする。
その後、MLLM(Multimodal Large Language Model)が微調整され、オブジェクト、把握、言語を統一意味空間内で統合する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:58:26 GMT)
AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution [53.2] 我々は、処理時間を数時間から秒に短縮する最初のオンザフライ適応量子化フレームワークを導入する。
我々は,従来の適応量子化法と競合する性能を実現し,処理時間をx2000で高速化する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:37:27 GMT)
L2MAC: Large Language Model Automatic Computer for Extensive Code Generation [52.8] トランスフォーマーベースの大規模言語モデル(LLM)は、基盤となるトランスフォーマーアーキテクチャの固定コンテキストウィンドウによって制約される。
本稿では,L2MAC について述べる。L2MAC は LLM をベースとした初の実用的自動計算機フレームワークで,長期的かつ一貫した出力生成を実現する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:53:27 GMT)
Metric-aware LLM inference for regression and scoring [52.8] 大規模言語モデル(LLM)は、様々なNLPタスクに対して強い結果を示してきた。
我々は,この推論戦略が,様々な回帰・スコアリングタスクや関連する評価指標に最適であることを示す。
我々は、カスタム回帰を最適化し、推定時にメトリクスをスコアリングする決定論的アプローチである、意識的距離 LLM 推論を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:48:19 GMT)
Untangle the KNOT: Interweaving Conflicting Knowledge and Reasoning Skills in Large Language Models [51.7] 大規模言語モデル(LLM)の知識文書は、時代遅れや誤った知識のためにLLMの記憶と矛盾する可能性がある。
我々は,知識紛争解決のための新しいデータセットKNOTを構築した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:40:11 GMT)
A Cause-Effect Look at Alleviating Hallucination of Knowledge-grounded Dialogue Generation [51.5] 我々は,対話知識の相互作用を利用して,KGDの幻覚を緩和するための解決策を提案する。
本手法は,他の対話性能を損なうことなく幻覚を低減できることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:45:26 GMT)
Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.3] 継続的な学習は破滅的な忘れ込みという課題を克服しようと試み、そこでは新しいタスクを解くための学習が、モデルが以前に学習した情報を忘れる原因となる。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れ込みを抑える新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:32:43 GMT)
Can Small Language Models Help Large Language Models Reason Better?: LM-Guided Chain-of-Thought [51.2] タスク推論において,ブラックボックスの大きな (>10B) LMを導くために,軽量 (すなわち 1B) 言語モデル (LM) を利用する新しいフレームワーク LM-Guided CoT を導入する。
1)知識蒸留と2)合理性指向とタスク指向の報酬信号からの強化学習を通してモデルを最適化する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:46:37 GMT)
Mapping of attention mechanisms to a generalized Potts model [50.9] ニューラルネットワークのトレーニングは、いわゆる擬似様相法によって逆ポッツ問題を解くのと全く同じであることを示す。
また、レプリカ法を用いてモデルシナリオにおける自己意図の一般化誤差を解析的に計算する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:24:36 GMT)
Evaluating Generative Language Models in Information Extraction as Subjective Question Correction [49.7] 本稿では,新しい評価手法SQC-Scoreを提案する。
主観的質問訂正の原則に着想を得て,新しい評価手法SQC-Scoreを提案する。
3つの情報抽出タスクの結果から,SQC-Scoreは基準値よりもアノテータの方が好ましいことが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:36:53 GMT)
Struc-Bench: Are Large Language Models Really Good at Generating Complex Structured Data? [49.7] Struc-Benchは、大きな言語モデル(LLM)を特徴とする包括的なベンチマークである。
Pスコア(Prompting Score)とHスコア(Heuristical Score)の2つの革新的な指標を提案する。
実験の結果,LLaMA-7Bに構造認識の微調整を適用すると,性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:57:12 GMT)
CodeEditorBench: Evaluating Code Editing Capability of Large Language Models [49.4] コードのための大規模言語モデル(LLM)は急速に進化しており、コード編集が重要な機能として現れている。
コード編集タスクにおけるLLMの性能を厳格に評価するための評価フレームワークであるCodeEditorBenchを紹介する。
5つのソースからさまざまなコーディング課題やシナリオをキュレートし、さまざまなプログラミング言語、複雑性レベル、編集タスクをカバーしています。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:49:49 GMT)
Theoretical and Empirical Insights into the Origins of Degree Bias in Graph Neural Networks [43.8] 高次テストノードは、GNNの訓練方法にかかわらず、誤分類の確率が低いことを示す。
次数バイアスはノードの次数に関連する様々な要因から生じることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:24:27 GMT)
Incorporating Recklessness to Collaborative Filtering based Recommender Systems [43.0] 本稿では,行列分解に基づく推薦システムの学習過程において,新しい用語を取り入れることを提案する。
無謀さは、予測された評価の出力確率分布のばらつきを考慮に入れます。
実験結果から、無謀性はリスクレギュレーションだけでなく、予測の量や品質も改善することが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:26:03 GMT)
Crafting In-context Examples according to LMs' Parametric Knowledge [42.4] 文脈内サンプルは言語モデル(LM)をトリガーし、パラメトリック知識に格納された情報をサーフェスする。
モデルがパラメトリックな知識から正しく答えられるような'既知の'例と、未知の'未知の'例を識別する。
実験の結果,「未知」の例では幻覚が促進されるため,効果が低下する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:00:16 GMT)
SpikeExplorer: hardware-oriented Design Space Exploration for Spiking Neural Networks on FPGA [42.2] SpikExplorerは、ハードウェア指向のAutomatic Design Space ExplorationのためのPythonツールである。
最適なネットワークアーキテクチャ、ニューロンモデル、内部およびトレーニングパラメータを検索する。
MNISTデータセットでは95.8%の精度に達し、消費電力は180mW/image、レイテンシは0.12ms/imageである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:53:08 GMT)
Three perspectives on entropy dynamics in a non-Hermitian two-state system [41.9] 利得と損失のバランスが取れたオープンな2状態系における物理挙動の指標としてのエントロピーダイナミクスが提示される。
我々は,従来のHermitian-adjoint状態の枠組みを利用する際の視点を,biorthogonal-adjoint状態に基づくアプローチ,およびアイソスペクトルマッピングに基づく第3のケースと区別する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:45:28 GMT)
Ziya2: Data-centric Learning is All LLMs Need [41.4] 基礎モデルとしてLLaMA2を採用した13億のパラメータを持つモデルであるZiya2を提案する。
実験の結果、Ziya2は他のモデルを特にオープンソースと比較して有望な結果で、複数のベンチマークで大きく上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:41:12 GMT)
Recording and Describing Poker Hands [40.4] ポーカーは、人間が様々な種類のポーカーハンドを文書化するのに使える一貫したフォーマットを欠いている。
本稿では,手書き履歴の簡潔な可読性表現を提供するPHHフォーマットを提案する。
補足では、PHHフォーマットの11種類の変種をカバーする10,088個の手を提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:06:03 GMT)
Reason from Fallacy: Enhancing Large Language Models' Logical Reasoning through Logical Fallacy Understanding [40.3] 大規模言語モデル(LLM)は多くの推論タスクにおいて優れたパフォーマンスを示している。
しかしそれでも、論理的推論を含む複雑な推論タスクに苦戦している。
本稿では,WHAT,WHY,HOWの3次元から具体的な5つのタスクを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:38:03 GMT)
Red Teaming GPT-4V: Are GPT-4V Safe Against Uni/Multi-Modal Jailbreak Attacks? [39.9] この研究は、11の異なる安全ポリシーをカバーする1445の有害な質問を含む包括的なジェイルブレイク評価データセットを構築している。
GPT4 と GPT-4V は、オープンソースの LLM や MLLM と比較して、ジェイルブレイク攻撃に対する堅牢性を向上している。
Llama2とQwen-VL-Chatは、他のオープンソースモデルよりも堅牢である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:38:14 GMT)
Long-context LLMs Struggle with Long In-context Learning [39.8] 大規模言語モデル(LLM)は32Kトークンを超える長いシーケンスを扱うために大きな進歩を遂げた。
本研究は,極端ラベル分類の領域における長い文脈内学習に焦点を当てた特殊なベンチマーク(LongICLBench)を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:01:25 GMT)
SemEval Task 1: Semantic Textual Relatedness for African and Asian Languages [39.8] 意味的テクスト関連性(STR)に関する最初の共有課題を提示する。
14言語にまたがる意味的関連性の広範な現象について検討する。
これらの言語は5つの異なる言語族の出身であり、主にアフリカとアジアで話されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:30:14 GMT)
Flattening the Parent Bias: Hierarchical Semantic Segmentation in the Poincaré Ball [39.8] 親が子どもから推定されるフラットな(階層的でない)セグメンテーションネットワークは,階層的アプローチよりも高いセグメンテーション精度を有することを示す。
また,ポアンカー球モデルを用いた階層的セグメンテーションに対するより原理的なアプローチについても検討する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:50:57 GMT)
ShapeFusion: A 3D diffusion model for localized shape editing [37.8] 本研究では,任意の形状領域の局所的な操作を容易にする効果的な拡散マスキングトレーニング戦略を提案する。
現在の最先端技術と比較して、我々の手法は遅延コード状態に依存する方法よりも解釈可能な形状操作をもたらす。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:05:49 GMT)
Shadow Cones: A Generalized Framework for Partial Order Embeddings [37.2] 我々は、物理に着想を得たエンテーメントコーン構築である「シャドウコーン」フレームワークを導入する。
具体的には、光源によって形成される影と双曲空間における不透明物体との間の部分的順序を部分的関係としてモデル化する。
種々の大きさのデータセットと階層構造に関する実験により、シャドーコーンは、既存のエンテーメントコーン構造よりも一貫して、著しく優れていることが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:30:22 GMT)
PreAfford: Universal Affordance-Based Pre-Grasping for Diverse Objects and Environments [37.0] 二本指グリップを用いた非重力物体のロボット操作は重要な課題である。
従来のプレグラスピング技術は、オブジェクトの再配置とテーブルエッジのような外部のエイズを活用するもので、オブジェクトのカテゴリやシーン間の適応性が欠如している。
適応性を高めるために,ポイントレベルのアベイランス表現とリレートレーニングアプローチを利用する,新しいプレグラスピング計画フレームワークであるPreAffordを紹介する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:54:12 GMT)
Engineering the impact of phonon dephasing on the coherence of a WSe$_{2}$ single-photon source via cavity quantum electrodynamics [36.9] Emitter dephasingは固体単一光子源の性能の鍵となる問題の一つである。
単一WSe$単層ドットから放射される光子のコヒーレンスを、スペクトル共振器共振器に選択的に結合させることにより調整および設計可能であることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:42:24 GMT)
HumanNeRF-SE: A Simple yet Effective Approach to Animate HumanNeRF with Diverse Poses [36.2] 本稿では,多様な新しいポーズ画像を簡単な入力で合成する,シンプルで効果的なHumanNeRF-SEを提案する。
私たちのキーとなる洞察は、明示的な形状は暗黙の表現に合うために使用されるサンプリングポイントを減らすことができるということです。
実験により,任意のポーズで数発の入力で画像を合成し,画像の合成速度を15倍に向上できることが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:10:58 GMT)
Waveguide QED at the onset of spin-spin correlations [36.1] 結晶Bに属する分子は1次元スピン鎖を形成する。
マイクロ波透過は、準恒等スピンと伝播光子の集団結合の証拠を示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:00:05 GMT)
MiniGPT4-Video: Advancing Multimodal LLMs for Video Understanding with Interleaved Visual-Textual Tokens [36.0] MiniGPT4-Videoは、ビデオ理解に特化した多モード大言語モデル(LLM)である。
MiniGPT4-videoは、視覚的コンテンツだけでなく、テキストによる会話も含んでいるため、モデルが視覚的コンポーネントとテキストコンポーネントの両方を含むクエリに効果的に答えることができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:46:01 GMT)
How Easily do Irrelevant Inputs Skew the Responses of Large Language Models? [35.8] 大規模言語モデル(LLM)は多くの知識集約的なタスクを達成するための拡張された能力を示す。
しかし、現在の検索システムに固有の欠陥があるため、検索する上位のパスには無関係な情報が存在する可能性がある。
我々は,意味的に無関係で,部分的に関連があり,質問に関連するような,高品質な無関係な情報を構築するための枠組みを導入する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:52:30 GMT)
Evaluating In-Context Learning of Libraries for Code Generation [35.6] 大規模言語モデル(LLM)は高いレベルのコード生成と理解能力を示す。
近年の研究では、大規模プロプライエタリなLLMがデモから新しいライブラリの使用法を学習できることが示されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:54:01 GMT)
TransformerLSR: Attentive Joint Model of Longitudinal Data, Survival, and Recurrent Events with Concurrent Latent Structure [35.5] フレキシブルトランスフォーマーに基づく深層モデリングおよび推論フレームワークであるTransformerLSRを開発し,これら3つのコンポーネントを同時にモデル化する。
腎移植後の患者に対する実世界の医療データセットをシミュレーションし分析することでTransformerLSRの有効性と必要性を実証する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 20:51:37 GMT)
AutoWebGLM: Bootstrap And Reinforce A Large Language Model-based Web Navigating Agent [33.6] AutoWebGLMはChatGLM3-6B上に構築された自動Webナビゲーションエージェントである。
人間のブラウジングパターンにインスパイアされた我々は、Webページを表現するためのHTML単純化アルゴリズムを設計する。
テストのために、現実世界のWebブラウジングタスクのためのバイリンガルベンチマーク -- AutoWebBench -- を確立しました。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:58:40 GMT)
LaMPilot: An Open Benchmark Dataset for Autonomous Driving with Language Model Programs [33.1] 本稿では,Large Language Modelsを自律走行システムに統合するフレームワークであるLaMPilotを紹介する。
我々はLaMPilot-Benchにおける既設LLMの性能評価実験を行った。
この結果から,多様な運転シナリオの処理や運転時のユーザ指示に従う上でのLLMの可能性が示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:20:11 GMT)
3DGS-Avatar: Animatable Avatars via Deformable 3D Gaussian Splatting [32.6] 3Dガウススプラッティング(3DGS)を用いた単眼ビデオからアニマタブルな人間のアバターを作成する手法を提案する。
我々は、30分以内でトレーニングでき、リアルタイムフレームレート(50以上のFPS)でレンダリングできる非剛性ネットワークを学習する。
実験結果から,本手法は単分子入力によるアニマタブルアバター生成に対する最先端手法と比較して,同等,さらに優れた性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:06:02 GMT)
The More You See in 2D, the More You Perceive in 3D [32.6] SAP3Dは、任意の数の未提示画像から3D再構成と新しいビュー合成を行うシステムである。
入力画像の数が増えるにつれて,提案手法の性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:59:40 GMT)
Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation [32.1] 本稿では,映像レベルの参照表現理解を静的および運動知覚に分離することを提案する。
我々は、視覚的に類似した物体の動きを区別するために、対照的な学習を採用する。
これらのコントリビューションは、5つのデータセットにまたがって最先端のパフォーマンスを提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:58:21 GMT)
Planning and Editing What You Retrieve for Enhanced Tool Learning [32.0] 本稿では,Planning, Learning, and Understanding for TOols(P&R)とEdit-and-Ground(E&G)のパラダイムを取り入れた新しいPLUTO(Planning, Learning, and Understanding for TOols)アプローチを提案する。
実験の結果、これらのパラダイムはツール検索タスクにおけるリコールとNDCGを大幅に改善し、現在の最先端モデルを大きく上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:33:07 GMT)
Sailor: Open Language Models for South-East Asia [31.8] Sailor(セイラー)は、東南アジア(SEA)言語向けに作られたオープン言語モデルである。
セイラーモデルは200Bから400Bのトークンを受け取り、主に英語、中国語、ベトナム語、タイ語、インドネシア語、マレー語、ラオス語をカバーしている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:31:32 GMT)
Designing for Human-Agent Alignment: Understanding what humans want from their agents [31.7] われわれは、カメラをオンラインで販売する架空の作業中に交渉できるエージェントの設計について研究した。
エージェントがタスクを成功させるためには,人間やユーザ,エージェントが6次元以上を調整する必要があることがわかった。
これらの知見は、プロセスと仕様のアライメントと、人間とAIのインタラクションにおける価値と安全性の必要性に関する以前の作業を拡張した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:01:57 GMT)
Temporally Consistent Unbalanced Optimal Transport for Unsupervised Action Segmentation [31.6] 本稿では,長編未編集ビデオに対するアクションセグメンテーションタスクに対する新しいアプローチを提案する。
グロモフ・ワッサーシュタイン問題に先立って時間的一貫性を符号化することにより、時間的に一貫したセグメンテーションをデコードすることができる。
本手法では,ビデオの時間的整合性を達成するための動作順序を知る必要はない。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:06:15 GMT)
GP-MoLFormer: A Foundation Model For Molecular Generation [31.6] 本研究では,大規模ケミカルデータセット上での化学言語トランスフォーマーの訓練パラダイムを,本研究における生成タスクにまで拡張する。
具体的には, GP-MoLFormerを提案する。GP-MoLFormerは1.1B以上のケミカルSMILESをトレーニングした自己回帰分子文字列生成装置である。
GP-MoLFormerは、生成分子の数が100億の範囲にあり、参照集合が10億を超える場合でも、かなりの数の新規かつ有効でユニークなSMILESを生成することができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:20:06 GMT)
Evaluating LLMs at Detecting Errors in LLM Responses [30.6] この研究は、LLMによる客観的、現実的で多様なエラーからなる最初のエラー検出ベンチマークであるReaLMistakeを紹介した。
我々はReaLMistakeを用いて12の大規模言語モデルに基づいて誤り検出を行う。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:19:47 GMT)
SalUn: Empowering Machine Unlearning via Gradient-based Weight Saliency in Both Image Classification and Generation [30.2] 本稿では,機械学習における「重み値」の概念を導入し,モデル説明における入力値値と並列性について述べる。
サリエンシ・アンラーニング(SalUn)と呼ばれる結果の手法は、パフォーマンスのギャップを「正確な」アンラーニングで狭める。
SalUnは、画像分類と生成タスクの両方において、データ、クラス、概念を忘れることの影響を効果的に消すことができる最初の原則MUアプローチである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:45:38 GMT)
Would Deep Generative Models Amplify Bias in Future Models? [29.9] 今後のコンピュータビジョンモデルにおいて、深層生成モデルが潜在的な社会的バイアスに与える影響について検討する。
我々は,COCOおよびCC3Mデータセットの原画像に,安定拡散により生成された画像に代えてシミュレーションを行う。
予想とは対照的に、トレーニング中に生成された画像を導入することはバイアスを均一に増幅しないことを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:58:39 GMT)
DQ-DETR: DETR with Dynamic Query for Tiny Object Detection [29.6] DQ-DETR は分類的カウントモジュール,カウント誘導機能拡張,動的クエリ選択の3つのコンポーネントから構成される。
我々のモデルは、AI-TOD-V2データセット上で最先端のmAPを30.2%達成し、従来のCNNベースおよびDETRライクな手法より優れている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:10:24 GMT)
SENSOR: Imitate Third-Person Expert's Behaviors via Active Sensoring [28.4] 多くの実世界のビジュアル・イミテーション・ラーニング(IL)のシナリオでは、エージェントの視点と専門家の視点との間には不一致がある。
従来の手法は一般にドメインアライメントによってこの問題を解決してきた。
本稿では,エージェントの視点を自動的に変更して専門家の視点に合わせるモデルに基づくSENSory mimicor(SENSor)を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:37:55 GMT)
DIDA: Denoised Imitation Learning based on Domain Adaptation [28.4] ノイズのあるデータから学習するためには、模倣者が必要とされるLND(Learning from Noisy Demonstrations)の問題に焦点を当てる。
本稿では、雑音レベルと専門知識レベルを区別する2つの識別器を設計する、ドメイン適応(DIDA)に基づくDenoized Imitation Learningを提案する。
MuJoCoの実験結果は、DIDAが様々な種類のノイズを持つデモから挑戦的な模倣タスクをうまく処理できることを示した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:29:05 GMT)
Fairness Improvement with Multiple Protected Attributes: How Far Are We? [27.9] 本稿では,複数の保護属性に対する公平性向上について検討した。
我々は,11種類の最先端の公平性向上手法の有効性を解析した。
単一属性と複数の保護属性を考えると,精度損失の差はほとんどない。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:54:25 GMT)
Do Large Language Models Rank Fairly? An Empirical Study on the Fairness of LLMs as Rankers [27.7] 本稿では,TREC Fair Ranking データセットを用いて,Large Language Models (LLMs) の評価実験を行った。
本稿では, 歴史的に検索結果に乏しい, 性別や地理的位置などの二項保護属性の表現に焦点を当てる。
我々の分析は、これらのLCMがこれらの属性に関連するクエリやドキュメントをどのように扱うのかを考察し、ランキングアルゴリズムのバイアスを明らかにすることを目的としている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:23:19 GMT)
Language Model Evolution: An Iterated Learning Perspective [27.6] 我々は,Large Language Models (LLMs) の行動と人間の文化の進化の類似性を描いている。
我々のアプローチは、人間の文化進化においてどのように微妙なバイアスが拡大されるかを解明するベイズ的枠組みである反復学習(IL)を活用することである。
本稿では,ベイジアン・イルフレームワークにおけるエージェントの行動の特徴を概説する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:01:25 GMT)
OmniGS: Omnidirectional Gaussian Splatting for Fast Radiance Field Reconstruction using Omnidirectional Images [27.5] 現在の3次元ガウス散乱システムは、歪みのない視点画像を用いた放射場再構成しかサポートしていない。
高速な放射野再構成のための全方位画像を利用するため,新しい全方位撮影システムであるOmniGSを提案する。
本手法は,全方位画像を用いた最先端の復元品質と高速レンダリングを実現する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:10:26 GMT)
Convergence to Nash Equilibrium and No-regret Guarantee in (Markov) Potential Games [27.5] 我々は、コストと帯域幅のフィードバックの下で、潜在的なゲームとマルコフ潜在的なゲームについて研究する。
我々のアルゴリズムは、潜在的なゲームに対して、ナッシュの後悔と、O(T4/5)の後悔の限界を同時に達成する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:02:03 GMT)
pixelSplat: 3D Gaussian Splats from Image Pairs for Scalable Generalizable 3D Reconstruction [26.7] pixelSplatは、画像のペアから3次元ガウスプリミティブによってパラメータ化された3次元放射界の再構成を学ぶフィードフォワードモデルである。
我々のモデルは、スケーラブルなトレーニングのためのリアルタイム・メモリ効率のレンダリングと、推論時の高速な3次元再構成を特徴としている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:04:55 GMT)
LeGrad: An Explainability Method for Vision Transformers via Feature Formation Sensitivity [26.7] 視覚変換器(ViT)に特化して設計された説明可能性手法であるLeGradを提案する。
LeGradは、その勾配自体を説明可能性信号として考慮して、ViT層の注意マップに関する勾配を計算する。
我々はLeGradを,セグメンテーション,摂動,オープン語彙設定の難易度で評価し,その汎用性を示した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:39:09 GMT)
Robust Pronoun Use Fidelity with English LLMs: Are they Reasoning, Repeating, or Just Biased? [26.6] 代名詞使用の忠実度を評価するために,500万件以上のデータセットを提示する。
モデルはほとんどが、気晴らしのない存在下で、以前は特定されていた代名詞を忠実に再利用できることがわかりました。
しかし、彼女(彼女)、特異種(彼女)、新生代(新生代)の処理は著しく悪化する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:07:14 GMT)
$CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.6] 群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:55:04 GMT)
The Probabilities Also Matter: A More Faithful Metric for Faithfulness of Free-Text Explanations in Large Language Models [24.1] 本稿では,インプット介入に基づく信頼度テストに使用できる指標である相関説明忠実度(CEF)について紹介する。
我々の測定基準は、モデルが予測するラベル分布の総シフトを考慮に入れている。
次に, 相関対実テスト(CCT)を導入し, 相関対実テスト(CEF)をインスタンス化する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:20:04 GMT)
Bootstrapping SparseFormers from Vision Foundation Models [24.0] 我々は、VTベースの視覚基盤モデルからSparseFormersをシンプルで効率的な方法でブートストラップすることを提案する。
ブートストラップ付きunimodal SparseFormerは、49トークンしか持たないIN-1Kで84.9%の精度に達することができる。
CLIP-bootstrapped SparseFormersは、単語を見ることなく出力空間を言語に合わせることで、マルチモーダルな大規模言語モデルにおける効率的な視覚エンコーダとして機能する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:40:21 GMT)
Bias Behind the Wheel: Fairness Analysis of Autonomous Driving Systems [23.5] 本稿では,自律走行システムにおける重要な課題である自動歩行者検出の公平性について分析する。
我々は,大規模な実世界のデータセットを用いて,人口集団間で最先端のディープラーニングに基づく歩行者検出器を8つ評価した。
以上の結果から, 未発見の小児の割合は, 成人と比較して20.14%高かった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:56:59 GMT)
Learn When (not) to Trust Language Models: A Privacy-Centric Adaptive Model-Aware Approach [23.3] Retrieval-augmented large language model (LLMs) は、様々なNLPタスクにおいて非常に有能である。
LLMの事前学習データを解析することにより,データ認識による検索をいつ行うかを決定する方法が提案されている。
これらのデータ認識手法は、特に機密データや広範な事前学習データへのアクセスを必要とする場合に、プライバシー上のリスクとメモリ制限をもたらす。
我々は、トークンの埋め込みがモデルの本質的な知識を捉えることができると仮定し、事前学習データへのアクセスに関連するプライバシーリスクを伴わずに、検索の必要性を判断するためのより安全で簡単な方法を提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:21:22 GMT)
On the Theoretical Expressive Power and the Design Space of Higher-Order Graph Transformers [20.7] 次数-k$グラフ変圧器とスパース変圧器の理論表現力について検討する。
自然近傍に基づくスパースオーダー-$k$変換モデルは,計算効率だけでなく,表現性も高いことを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:26:51 GMT)
Two Tricks to Improve Unsupervised Segmentation Learning [20.5] 教師なしセグメンテーション学習のための2つの実践的改善手法を提案する。
まず、誘導フィルタリングなどの画像後処理技術を利用して出力マスクを洗練する。
第2に,教師-学生養成方式に基づくマルチスケールの一貫性基準を導入する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:49:56 GMT)
PARIS3D: Reasoning-based 3D Part Segmentation Using Large Multimodal Model [19.3] 本稿では,3次元オブジェクトに対する推論部分分割と呼ばれる新しいセグメンテーションタスクを提案する。
我々は3Dオブジェクトの特定の部分に関する複雑で暗黙的なテキストクエリに基づいてセグメンテーションマスクを出力する。
本稿では,暗黙のテキストクエリに基づいて3次元オブジェクトの一部を分割し,自然言語による説明を生成するモデルを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 23:38:45 GMT)
Provably Robust and Plausible Counterfactual Explanations for Neural Networks via Robust Optimisation [19.1] PROPLACE(Provably RObust and PLAUSible Counterfactual Explanations)を提案する。
証明可能な堅牢なCEを計算し、その収束性、健全性、完全性を証明するための反復アルゴリズムを定式化する。
ProPLACEは,3つの評価点において,計測値に対する最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:29:25 GMT)
DreamWalk: Style Space Exploration using Diffusion Guidance [19.1] Photoshopのような直接編集ツールとは異なり、テキスト・コンディショニングのモデルではアーティストが「プロンプト・エンジニアリング」を行う必要がある。
私たちのゴールは、プロンプトによって指定されたスタイルと物質をきめ細かな制御を提供することです。
メソッドはLoRA-またはDreamBoothで訓練されたモデルと併用することができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:39:01 GMT)
TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones [19.0] 本稿では,様々な視覚言語タスクを対象とした効率的なトレーニングと推論を目的とした,オープンソースのMLLMであるTinyGPT-Vを紹介する。
TinyGPT-Vは、Phi-2言語モデルと事前訓練された視覚エンコーダを統合し、視覚情報と言語情報の融合のためのユニークなマッピングモジュールを利用する。
我々の実験では、TinyGPT-Vは言語モデル280億のパラメータを持ち、VQAと画像推論タスクにおいて、より大きなパラメータに匹敵する結果が得られることを示した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:53:58 GMT)
Stable Anisotropic Regularization [18.5] I-STAR: IsoScore*-based STable Anisotropic regularization, a novel regularization method that can can be increase or reduce of isotropy in embedded space during training。
I-STARはIsoScore*を用いており、IsoScore*はアイソトロピーの最初の正確な測定値であり、ミニバッチ計算では微分可能で安定である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:04:12 GMT)
Scaling of quantum Fisher information for quantum exceptional point sensors [18.3] 近年,古典システムにおけるスペクトル応答率のばらつき(EP)を利用したセンシングが顕著に進展している。
量子EPセンサにとって重要な問題は、量子EPの順序と量子フィッシャー情報(QFI)のスケーリングの関係である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 20:47:54 GMT)
ChangeMamba: Remote Sensing Change Detection with Spatio-Temporal State Space Model [18.1] 空間状態モデルに基づくMambaアーキテクチャは、一連の自然言語処理タスクにおいて顕著な性能を示している。
我々は、リモートセンシング変更タスクのためのMambaの可能性について、Mambaをカスタマイズする。
提案するフレームワークは、複雑な戦略やトリックを使わずに、現在のCNNおよびTransformerベースのアプローチより優れている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:06:25 GMT)
Unleashing the Potential of Large Language Models for Predictive Tabular Tasks in Data Science [17.9] この研究は、これらの予測タスクにLarge Language Models (LLM)を適用する試みである。
本研究の目的は,Llama-2 の大規模学習を行う上で,注釈付きテーブルの包括的コーパスをコンパイルすることで,このギャップを緩和することにある。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:28:25 GMT)
A Block-Coordinate Descent EMO Algorithm: Theoretical and Empirical Analysis [17.9] 進化的多目的最適化において,ブロック座標降下が効率的である条件が存在するかを検討する。
本稿では,GSEMOのブロックコーディネートバージョンを提案し,その実行時間を標準GSEMOアルゴリズムと比較する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 23:50:18 GMT)
Extracting Social Determinants of Health from Pediatric Patient Notes Using Large Language Models: Novel Corpus and Methods [17.8] 健康の社会的決定因子(SDoH)は、健康結果を形成する上で重要な役割を担っている。
小児社会史コーパス(PedSHAC)について紹介する。
我々は、微調整および文脈内学習手法を用いて、詳細なSDoH表現の自動抽出を評価する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:21:34 GMT)
DreamScene: 3D Gaussian-based Text-to-3D Scene Generation via Formation Pattern Sampling [17.8] 本稿では,上記の3つの課題に主に2つの戦略を用いて対処する,新しいテキストから3Dシーン生成フレームワークDreamSceneを提案する。
まずDreamSceneは、3Dオブジェクトの生成パターンによってガイドされるマルチステップサンプリング戦略であるFormation Pattern Smpling(FPS)を採用して、高速でセマンティックにリッチで高品質な表現を形成する。
第二に、DreamSceneは、屋内と屋外の両方に特化して設計されたプログレッシブな3段階カメラサンプリング戦略を採用しており、オブジェクト環境統合とシーン全体の3D一貫性を効果的に確保している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:38:57 GMT)
Quantifying Uncertainty in Motion Prediction with Variational Bayesian Mixture [17.8] 安全と堅牢性は、信頼できる自動運転車を開発する上で重要な要素である。
本研究では,1つの移動物体に対する将来の軌跡の分布を記述する生成モデルSeNeVAを提案する。
提案手法は,不確実性を定量化し,競争性能を向上しつつ,アウト・オブ・ディストリビューションデータを識別することができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 20:04:12 GMT)
If It's Not Enough, Make It So: Reducing Authentic Data Demand in Face Recognition through Synthetic Faces [17.0] 大規模な顔データセットは、主にWebベースのイメージから作成され、明示的なユーザの同意が欠如している。
本稿では,合成顔データを用いて効果的な顔認識モデルの訓練を行う方法について検討する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:45:25 GMT)
Knowledge Graph Representation for Political Information Sources [17.0] 我々は、Britbart News(BN)とNew York Times(NYT)の2つのニュースポータルから収集されたデータを分析する。
本研究は,BNおよびNYTメディアポータルから収集した11.5年間のデータセットを用いて,知識グラフを用いて行った。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:36:01 GMT)
The Death of Feature Engineering? BERT with Linguistic Features on SQuAD 2.0 [17.0] BERTと追加の言語的特徴を取り入れたエンドツーエンドの質問応答モデルを開発した。
EMスコアとF1スコアはBERT(base)と比較して2.17と2.14が改善される
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:50:34 GMT)
Learn What You Want to Unlearn: Unlearning Inversion Attacks against Machine Unlearning [16.8] 我々は、機械学習が未学習データの機密内容を漏洩させる範囲を理解するために、最初の調査を行う。
機械学習・アズ・ア・サービス・セッティングの下で、未学習サンプルの特徴とラベル情報を明らかにするアンラーニング・インバージョン・アタックを提案する。
実験結果から,提案攻撃は未学習データのセンシティブな情報を明らかにすることができることが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:37:46 GMT)
CORP: A Multi-Modal Dataset for Campus-Oriented Roadside Perception Tasks [16.4] CORPは、キャンパスシナリオ下でのマルチモーダルな路面認識タスク用に調整された最初の公開ベンチマークデータセットである。
カメラ18台とLiDARセンサー9台から撮影した205K画像と102K点の雲で構成されている。
都市交通に関する他の道路脇のデータセットとは異なり、CORPはキャンパスや他の住宅地におけるマルチモーダル認識の課題を強調するためにスペクトルを拡張している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:22:50 GMT)
Transforming LLMs into Cross-modal and Cross-lingual Retrieval Systems [16.3] 大規模言語モデル(LLM)は、ペア化された音声とテキストデータを持つ言語を超えた、テキストのみのデータに基づいて訓練される。
マルチモーダルDEM検索システムの初期化にLLMを使うことを提案する。
本システムは,21言語のみを訓練しながら,102言語で音声とテキストをマッチングできる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:51:22 GMT)
Towards Leveraging AutoML for Sustainable Deep Learning: A Multi-Objective HPO Approach on Deep Shift Neural Networks [16.3] 本研究では,資源消費を最小化しつつ,DSNNの性能を最大化するためのハイパーパラメータ最適化(HPO)の影響について検討する。
実験の結果,提案手法の有効性が示され,精度が80%以上,計算コストが低いモデルが得られた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:54:04 GMT)
Test Time Training for Industrial Anomaly Segmentation [16.0] 産業品質管理にはAD&S(Anomaly Detection and Ranging)が不可欠である。
本稿では,セグメンテーション性能を向上させるためのテストタイムトレーニング戦略を提案する。
我々は,MVTec ADとMVTec 3D-ADの広範囲な実験と評価を通じて,ベースラインに対するアプローチの有効性を実証した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:31:24 GMT)
HAPNet: Toward Superior RGB-Thermal Scene Parsing via Hybrid, Asymmetric, and Progressive Heterogeneous Feature Fusion [15.5] 本研究では,RGB熱水シーン解析のためのVFM機能をフル活用するための実現可能な戦略について検討する。
具体的には、VFMと畳み込みニューラルネットワークの両方を組み込んだハイブリッド非対称エンコーダを設計する。
この設計により、相補的な異種特徴のより効果的な抽出が可能となり、後に二重経路の進行的な方法で融合される。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:31:11 GMT)
MMIDR: Teaching Large Language Model to Interpret Multimodal Misinformation via Knowledge Distillation [15.3] MMIDRは,マルチモーダル誤報の意思決定プロセスにおいて,文章の質や質の良質な説明を提供するためのフレームワークである。
マルチモーダルな誤情報を適切な命令追従形式に変換するために,データ拡張の視点とパイプラインを示す。
さらに, オープンソースのLLMに多モード誤情報を説明するために, プロプライエタリなLLMを蒸留する効率的な知識蒸留手法を設計する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:13:56 GMT)
DiffBody: Human Body Restoration by Imagining with Generative Diffusion Prior [15.2] 人体修復は、人体に関する様々な応用において重要な役割を担っている。
近年の画像修復の進歩にもかかわらず、人体修復におけるその性能はいまだに中途半端である。
本稿では,ドメイン固有の知識を活用して性能を向上させる人体認識拡散モデルを構築することによって,新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:57:25 GMT)
Real-time Control of Electric Autonomous Mobility-on-Demand Systems via Graph Reinforcement Learning [14.1] エレクトロニック・モビリティ・オン・デマンド(E-AMoD)は、いくつかのリアルタイムな意思決定を行う必要がある。
強化学習のレンズによるE-AMoD制御問題を提案する。
本稿では,拡張性を大幅に向上し,性能の最適化に優れるグラフネットワークベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:43:42 GMT)
iSeg: Interactive 3D Segmentation via Interactive Attention [14.0] iSegは3次元形状を分割するインタラクティブな手法である。
異なる数や種類のクリックを処理できる対話型アテンションモジュールを提案する。
我々は、iSegを異なるドメインからの無数の形状に適用し、その汎用性とユーザ仕様への忠実性を示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:54:19 GMT)
SoK: Unintended Interactions among Machine Learning Defenses and Risks [14.0] 過度に適合し、意図しない相互作用を弱体化させるという予想に基づく枠組みを提案する。
2つの未探索相互作用の予想に我々のフレームワークを使用し、我々の予想を実証的に検証する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:43:44 GMT)
Semi-supervised Domain Adaptation on Graphs with Contrastive Learning and Minimax Entropy [12.2] グラフ上の半教師付きドメイン適応(SSDA)は、ラベル付きソースグラフの知識を活用して、限られたラベルを持つターゲットグラフ上のノード分類を支援することを目的としている。
本稿では,textbfGraph textbfContrastive textbfLとminimax entropy trainingを用いたSemiGCLと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:08:25 GMT)
PRobELM: Plausibility Ranking Evaluation for Language Models [12.1] PRobELM(PRobELM)は、言語モデルがパラメトリック知識を通じてより妥当なシナリオを識別する能力を評価するために設計されたベンチマークである。
我々のベンチマークは、Wikidata編集履歴から算出したデータセットから構築され、評価されたモデルに対するトレーニングデータの時間的境界を整列するように調整されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:57:11 GMT)
Foundation Model for Advancing Healthcare: Challenges, Opportunities, and Future Directions [12.0] 幅広いデータに基づいて事前訓練され、幅広いタスクに適応できるファンデーションモデルは、医療を進歩させています。
より広範な医療シナリオは、医療基盤モデル(HFM)の開発から恩恵を受けるだろう。
HFMの展開が間近に迫っているにもかかわらず、現在、医療分野での働き方について明確な理解が得られていない。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:39:55 GMT)
Probing Large Language Models for Scalar Adjective Lexical Semantics and Scalar Diversity Pragmatics [11.8] 我々は、スカラー形容詞の語彙意味論の知識を得るために、大規模言語モデルの異なるファミリーを探索する。
それらがスカラー形容詞に関する豊富な語彙・意味情報を符号化していることがわかった。
私たちはまた、異なるサイズと複雑さの現在のモデルを比較し、より大きなモデルは必ずしも良いとは限らないことに気付きます。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:52:25 GMT)
CSEPrompts: A Benchmark of Introductory Computer Science Prompts [11.7] AI、機械学習、NLPの最近の進歩は、新しい世代のLarge Language Models(LLM)の開発に繋がった。
商業的応用により、この技術は一般大衆に利用できるようになったため、学術的および専門的な目的のために高品質なテキストを作成するためにLLMを使用することが可能である。
学校や大学は、学生によるAI生成コンテンツの利用の増加に気づいており、この新しい技術とその潜在的な誤用の影響を調査している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:17:27 GMT)
SteinGen: Generating Fidelitous and Diverse Graph Samples [11.6] 我々はSteinGenを導入し、観測された1つのグラフからグラフを生成する。
我々は,SteinGenが,サンプルの多様性と組み合わせて,元のデータに高い分布類似性(高忠実度)をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 22:38:02 GMT)
Roadside Monocular 3D Detection via 2D Detection Prompting [11.5] 本稿では,2次元検出を用いて3次元検出器を誘導する手法を提案する。
提案手法は,3次元検出器と比較して2次元検出器の訓練がはるかに容易であり,2次元画像平面上でのWr.t検出の精度が著しく向上する,という重要な知見に基づいている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:48:30 GMT)
Select and Summarize: Scene Saliency for Movie Script Summarization [11.3] そこで本研究では,100本の映画に対して,人間による注釈付きサリエントシーンからなるシーン・サリエンシ・データセットを提案する。
そこで本研究では,まずスクリプト中の健全なシーンを識別し,そのシーンのみを用いて要約を生成する2段階の抽象要約手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:16:53 GMT)
SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling [11.2] 我々は107億のパラメータを持つ大規模言語モデル(LLM)であるSOLAR 10.7Bを紹介し、様々な自然言語処理(NLP)タスクにおいて優れた性能を示す。
本稿では,深層スケーリングと継続事前学習を含むDUS(Deep Up-scaling)と呼ばれるLSMのスケーリング手法を提案する。
DUSモデル上に構築されたSOLAR 10.7B-インストラクトは、Mixtral-8x7B-インストラクトを超越した、命令追従機能用に微調整された変種である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:53:38 GMT)
Outlier-Efficient Hopfield Layers for Large Transformer-Based Models [11.0] Outlier-Effient Modern Hopfield Model (termed $mathttOutEffHop$)を導入する。
我々の主な貢献は、テクティトゥーラ効率の良い連想記憶検索を容易にする新しい連想記憶モデルである。
本稿では,大規模トランスモデルとホップフィールドモデルにまたがって提案モデルの有効性を示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 23:08:43 GMT)
FACTUAL: A Novel Framework for Contrastive Learning Based Robust SAR Image Classification [10.9] FACTUALは、逆行訓練と堅牢なSAR分類のためのコントラストラーニングフレームワークである。
本モデルでは, 洗浄試料の99.7%, 摂動試料の89.6%の精度が得られた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:20:22 GMT)
Towards Fine-grained Large Object Segmentation 1st Place Solution to 3D AI Challenge 2020 -- Instance Segmentation Track [10.5] このレポートでは、3D AI Challenge 2020におけるインスタンストラックのためのTeam 'FineGrainedSeg'のソリューションを紹介します。
3D-Futureで非常に大きなオブジェクトを扱うために、HTCやSOLOv2に比べてきめ細かいマスクを出力するPointRendを基本フレームワークとして採用しています。
最後の提出は5つのPointRendモデルのアンサンブルで、検証とテストのリーダーボードの両方で1位を獲得します。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:25:22 GMT)
Optimistic Online Non-stochastic Control via FTRL [10.3] 本稿は、オンライン非確率制御(NSC)の新しいフレームワークに「最適化」の概念をもたらす。
すなわち,将来的なコスト予測に寄与する未知品質の予測オラクルから,NSCがどのような恩恵を受けられるかを検討する。
新しい境界は、完全な予測から、全ての予測が失敗してもオーダー最適化の $mathcalO(sqrtT)$ まで、オラクルの精度と相容れない。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:08:04 GMT)
Approximate Gradient Coding for Privacy-Flexible Federated Learning with Non-IID Data [10.0] この研究は、フェデレートラーニングにおける非IIDデータとストラグラー/ドロップアウトの課題に焦点を当てる。
クライアントのローカルデータの一部を非プライベートとしてモデル化する、プライバシフレキシブルなパラダイムを導入し、検討する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:29:50 GMT)
Edisum: Summarizing and Explaining Wikipedia Edits at Scale [10.0] 優れた編集要約を生成するために訓練された言語モデルにより生成された編集要約を推薦するモデルを提案する。
本稿では,Web上で最大かつ最も目に見えるプロジェクトの1つを維持する上で,言語モデリング技術が人間にどのように役立つかを紹介する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:15:28 GMT)
Per-Gaussian Embedding-Based Deformation for Deformable 3D Gaussian Splatting [9.9] 3D Gaussian Splatting (3DGS)は、高速で高品質な新規ビュー合成を提供する。
正準3DGSを複数のフレームに変形させる自然な拡張である。
それまでの作品は、ダイナミックなシーンを正確に再構築することができなかった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:34:41 GMT)
Fakes of Varying Shades: How Warning Affects Human Perception and Engagement Regarding LLM Hallucinations [9.7] 大規模言語モデル(LLM)は、不正確で架空のコンテンツを生成する能力に関する懸念を引き起こしている。
本研究の目的は,幻覚の程度を体系的に変化させることで,幻覚の人間の知覚を理解することである。
我々は,警告が真の内容の正しさに悪影響を及ぼすことなく,幻覚検出を改善することを観察した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:34:32 GMT)
Effective Lymph Nodes Detection in CT Scans Using Location Debiased Query Selection and Contrastive Query Representation in Transformer [9.7] 我々はLN-DETRと呼ばれる新しいLN検出TRansformerを提案し、より正確な性能を実現する。
マルチスケール2.5D機能融合による2Dバックボーンの強化により,LNクエリの表現品質向上に大きく貢献する。
本手法は, 内部試験と外部試験の両方において, 同一のFPレートでの4-5%平均リコールにより, 先行手法の性能を著しく向上させる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 22:31:15 GMT)
Evaluating Document Simplification: On the Importance of Separately Assessing Simplicity and Meaning Preservation [9.6] 本稿では,文書レベルの簡易化評価に焦点をあてる。
我々は、意味の保存と単純化のために異なる指標を用いて既存のモデルを比較した。
我々は、単純さのために参照なし計量変種を導入し、モデルは、単純化または意味保存のどちらにも偏っていることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:04:24 GMT)
Real-time Noise Source Estimation of a Camera System from an Image and Metadata [9.6] 本研究で論じる基本的なカメラ問題はノイズである。
本研究では,データモデルと物理モデルを組み合わせたリアルタイム,メモリ効率,信頼性の高いノイズ源推定器について検討する。
本研究では,合成雑音,2つのカメラシステムからの実環境騒音,および実地運動を含む6つのデータセットに対する7つの異なる推定器について検討した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:14:12 GMT)
An Investigation into Misuse of Java Security APIs by Large Language Models [9.5] 本稿では,Java のセキュリティ API ユースケースに対する ChatGPT のコード生成に対する信頼性を体系的に評価する。
タスク毎に30の試行にまたがるコードインスタンスの約70%には、セキュリティAPIの誤用が含まれており、20の異なる誤用タイプが識別されている。
約半数のタスクにおいて、この割合は100%に達し、開発者がセキュリティAPIコードを安全に実装するためにChatGPTに頼るまでには長い道のりがあることを示している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 22:52:41 GMT)
NMF-Based Analysis of Mobile Eye-Tracking Data [9.4] 非負行列因子化(NMF)を用いて刺激の関心領域を同定することを提案する。
ユーザ定義整数 k に対して、NMF は k 成分への説明可能な分解を生成する。
我々はNMFベースの手法と可視化技術を組み合わせて、複数の録音の探索的分析を可能にする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:50:51 GMT)
Conversational Disease Diagnosis via External Planner-Controlled Large Language Models [9.0] 本研究では,大規模言語モデル(LLM)を付加した外部プランナを用いた医療タスク指向対話システムの開発に,革新的なアプローチを提案する。
MIMIC-IVデータセットを用いた評価により,既存モデルよりも優れた性能を示すことができた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:16:35 GMT)
Cross-Modality Gait Recognition: Bridging LiDAR and Camera Modalities for Human Identification [9.0] 多様なデータモダリティをクロス検索できるCrossGaitを提案する。
本稿では,2つのモーダリティ特化特徴からモーダリティ共有特徴を学習するプロトタイプ型モーダリティ共有アテンションモジュールを提案する。
また、学習したモダリティ固有の特徴を統一された特徴空間に変換するクロスモダリティ特徴適応器を設計する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:12:55 GMT)
Antiferromagnetic magnons on a Möbius strip: topology-induced symmetry breaking [8.9] M "obius strip" 上のマグノンは、キラリティのないN'eelベクトルの線形分極を特徴とする。
トポロジーによって引き起こされる対称性破壊のメカニズムを解明することにより、実空間トポロジーがマグノンの物理的性質に深く影響することを明らかにする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:29:07 GMT)
Challenges for Reinforcement Learning in Quantum Circuit Design [8.9] ハイブリッド量子機械学習(QML)は、機械学習(ML)を改善するためのQCの応用と、QCアーキテクチャを改善するためのMLの両方を含む。
本稿では,マルコフ決定過程として定式化された具体的な枠組みを提案し,連続パラメータ化量子ゲートの普遍的な集合を制御することができる学習ポリシーを実現する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:26:06 GMT)
Conditioning of Banach Space Valued Gaussian Random Variables: An Approximation Approach Based on Martingales [8.8] ガウス確率変数として有意な2つのバナッハ空間の条件分布について検討する。
次に、連続経路のガウス過程の場合には、その経路の部分的な観察を条件とした一般結果を適用する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:57:44 GMT)
Discontinuity-preserving Normal Integration with Auxiliary Edges [8.8] 補助エッジを導入し、ドメイン内の断片的に滑らかなパッチ間をブリッジすることで、隠れたジャンプの規模を明示的に表現できるようにします。
提案手法は, 繰り返し再重み付き最小二乗と, 補助エッジ上の跳躍等級の反復フィルタリングを組み合わせることで, 不連続性を最適化する。
従来の不連続性保存正規積分法と比較して,ジャンプの明示的な表現により,微不連続性を正確に再構成する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:22:23 GMT)
InsectMamba: Insect Pest Classification with State Space Model [8.5] InsectMambaは、ステートスペースモデル(SSM)、畳み込みニューラルネットワーク(CNN)、マルチヘッド自己認識機構(MSA)、マルチレイヤパーセプトロン(MLP)をMix-SSMブロックに統合する新しいアプローチである。
5種類の害虫分類データセットの強い競争相手に対して評価された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:34:21 GMT)
Decoding Natural Images from EEG for Object Recognition [8.4] 本稿では,脳波信号からの学習画像表現の実現可能性を示すための自己教師型フレームワークを提案する。
我々はトップ1の精度を15.6%、トップ5の精度を42.8%で達成し、200ウェイゼロショットタスクに挑戦する。
これらの発見は、実世界のシナリオにおける神経復号と脳-コンピュータインタフェースの貴重な洞察をもたらす。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:08:10 GMT)
Security Weaknesses of Copilot Generated Code in GitHub [8.4] GitHub Copilotが生成したコードスニペットをGitHubプロジェクトから分析します。
分析の結果,Copilotが生成した452個のスニペットが検出された。
また、実践者は、対応するセキュリティ意識とスキルを育む必要があることも示している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:53:03 GMT)
Standardizing Knowledge Engineering Practices with a Reference Architecture [8.2] 本稿では,知識工学の分野でのベストプラクティスを調和させるビジョンを提案する。
本稿では,ユーザニーズと繰り返し発生するシステムパターンを関連付けるために,参照アーキテクチャを反復的に設計,実装する方法について述べる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:46:32 GMT)
Using construction waste hauling trucks' GPS data to classify earthwork-related locations: A Chengdu case study [8.1] アースワーク関連地域(ERL)は、都市ごみ汚染の主な原因である(粒子状物質)。
本研究は,16,000台以上の建設廃棄物運搬トラック(CWHT)のGPSトラジェクトリデータを用いた都市ERLの識別と分類を目的とする。
いくつかの機械学習モデルを比較し,中国成都市における実世界データを用いた分類性能に及ぼす時空間的特徴の影響を検討した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:41:04 GMT)
Short-term prediction of construction waste transport activities using AI-Truck [7.9] 建設廃棄物運搬トラック(スラグトラック)は、都市部でよく見られる重厚なディーゼル車である。
本稿では, 都市規模でスラグトラック活動のレベルを重汚染発生時に予測する実践的問題に対処する。
ディープアンサンブル学習フレームワーク (coined AI-Truck) は,Bi-LSTM, TCN, STGCN, PDFormerをベース分類器として使用するソフト投票積分器を用いて設計されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:31:36 GMT)
You Only Scan Once: A Dynamic Scene Reconstruction Pipeline for 6-DoF Robotic Grasping of Novel Objects [7.8] 本稿では,動的シーン再構築のための新しい2段階パイプラインを提案する。
最初の段階では,各対象物をメッシュ再構成と新規オブジェクトポーズトラッキングで登録するために,シーンスキャンを入力として利用する。
第2段階では、オブジェクトのポーズをリアルタイムで提供し、再構成されたオブジェクトポイントの雲をシーンに戻せるようにします。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:13:56 GMT)
UniHand: Privacy-preserving Universal Handover for Small-Cell Networks in 5G-enabled Mobile Communication with KCI Resilience [7.8] 小型セルネットワーク(SCN)の導入は、無線リンク品質、スペクトル効率、ネットワーク容量を大幅に改善した。
本研究は,5Gモバイル通信におけるSCNに対するセキュアなプライバシー保護ユニバーサルHOスキーム(UniHand$)を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:46:23 GMT)
DeepIPCv2: LiDAR-powered Robust Environmental Perception and Navigational Control for Autonomous Vehicle [7.6] DeepIPCv2は、より堅牢な乾燥性のためにLiDARセンサーを使用して環境を知覚する自律運転モデルである。
DeepIPCv2は、LiDAR点雲の集合を主知覚入力とする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:07:48 GMT)
DeepIPC: Deeply Integrated Perception and Control for an Autonomous Vehicle in Real Environments [7.6] 本稿では,自動運転に適した新しいエンドツーエンドモデルであるDeepIPCを紹介する。
DeepIPCは知覚と制御タスクをシームレスに統合する。
本評価は,DeepIPCの乾燥性およびマルチタスク効率において優れた性能を示すものである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:52:43 GMT)
Capabilities of Large Language Models in Control Engineering: A Benchmark Study on GPT-4, Claude 3 Opus, and Gemini 1.0 Ultra [7.5] GPT-4, Claude 3 Opus, Gemini 1.0 Ultra を用いて, 学部レベルの制御問題の解法について検討した。
我々は,人間専門家のパネルによる評価を行った。
我々の研究は、制御工学に人工知能を採用するという、より広い目標に向けた最初のステップとなる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:58:38 GMT)
Mining Architectural Information: A Systematic Mapping Study [7.4] 建築情報マイニングに関する文献がどのような文献で利用できるかは明らかになっていない。
建築情報のマイニングに関する文献を特定し,分析し,合成することを目的としている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:47:54 GMT)
Towards Standards-Compliant Assistive Technology Product Specifications via LLMs [7.3] 我々は、AT製品仕様のコンプライアンスプロセスを合理化するための先駆的なフレームワークであるCompliATを紹介します。
CompliATは3つの重要なタスクに対処する。一貫性の用語をチェックし、標準に従って製品を分類し、主要な製品仕様を標準要件にトレースする。
本稿では,国際標準に適合するAT製品を正確に分類するために,検索拡張生成モデルを活用する新しい製品分類手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:10:39 GMT)
Embodied Neuromorphic Artificial Intelligence for Robotics: Perspectives, Challenges, and Research Development Stack [7.3] スパイキングニューラルネットワーク(SNN)によるニューロモルフィックコンピューティングの最近の進歩は、ロボット工学の具体的インテリジェンスを可能にする可能性を実証している。
本稿では, ロボットシステムにおいて, エンボディ型ニューロモーフィックAIを実現する方法について考察する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:52:22 GMT)
Towards more realistic human motion prediction with attention to motion coordination [7.2] 本稿では,この動き調整と結合対間の局所的相互作用を統一的に組み合わせた新しい結合関係モデリングモジュール,Comprehensive Joint Relation Extractor (CJRE)を提案する。
提案手法は,H3.6M,CMU-Mocap,3DPWの短期および長期予測において,最先端の手法より優れている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:48:40 GMT)
Is CLIP the main roadblock for fine-grained open-world perception? [7.2] 最近の研究では、オープン語彙設定における微粒化認識能力の制限が強調されている。
細粒度理解の欠如は,CLIP潜伏空間における物体特性の分離性の欠如が原因であることを示す。
実験の結果,単純なCLIP遅延空間再射は,微細な概念の分離に役立つことがわかった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:47:30 GMT)
Multi-modal Learning for WebAssembly Reverse Engineering [7.2] We present WasmRev, a first multi-modal pre-trained language model for WebAssembly reverse engineering。
WasmRevは大規模マルチモーダルコーパス上で自己教師型学習を用いて事前訓練される。
WasmRevを3つの重要なリバースエンジニアリングタスク、タイプリカバリ、関数目的の識別、WebAssemblyの要約に微調整します。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:03:38 GMT)
On the Surprising Efficacy of Distillation as an Alternative to Pre-Training Small Models [7.1] 我々は、小モデルがその利点を享受するために事前学習のコストを吸収する必要がないことを提案する。
事前訓練されたモデルからタスクを蒸留すると、そのタスクで事前訓練されたり微調整されたりした場合、小さなモデルで達成される性能を達成または超えることが観察された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:38:11 GMT)
A Novel Garment Transfer Method Supervised by Distilled Knowledge of Virtual Try-on Model [6.9] 本稿では,仮想試行から知識蒸留を指導する新しい衣服転送手法を提案する。
我々は、伝達解析推論モデルの訓練を監督するために、多段階の教育戦略を採用する。
本手法は, 衣料品転送における他の仮想試着法や衣服転送法と比較して, 最先端性能を有することを示した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:57:39 GMT)
BiSHop: Bi-Directional Cellular Learning for Tabular Data with Generalized Sparse Modern Hopfield Model [6.9] BiSHopは、深層表型学習の2つの大きな課題に対処する。
BiSHopはデュアルコンポーネントのアプローチを採用し、列ワイドと行ワイドの両方のデータを逐次処理する。
We show BiSHop comes over current SOTA method with significantly less HPO run。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 23:13:32 GMT)
GENEVIC: GENetic data Exploration and Visualization via Intelligent interactive Console [6.8] GENEVICは、遺伝的データ生成と生物医学的知識発見のギャップを埋める、AI駆動のチャットフレームワークである。
カスタマイズされたドメイン固有の遺伝情報の分析、検索、可視化を自動化する。
機能を統合して、タンパク質相互作用ネットワークの生成、遺伝子セットの強化、PubMed、Google Scholar、arXivから科学文献の検索を行う。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 20:53:30 GMT)
RoleCraft-GLM: Advancing Personalized Role-Playing in Large Language Models [6.8] RoleCraft-GLMは、大規模言語モデル(LLM)によるパーソナライズされたロールプレイングの強化を目的とした革新的なフレームワークである。
従来の有名人中心のキャラクターから多彩な非有名人ペルソナへとシフトする、ユニークな会話データセットをコントリビュートする。
私たちのアプローチには、細心の注意深いキャラクタ開発、対話が現実的かつ感情的に共鳴することを保証することが含まれる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:27:38 GMT)
Trust in AI: Progress, Challenges, and Future Directions [6.7] 私たちの日常生活における人工知能(AI)システムの利用の増加は、ユーザの視点からAIにおける信頼と不信の重要性を説明してくれます。
AIにおける信頼/不信は規制官の役割を担い、この拡散のレベルを著しく制御することができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:34:37 GMT)
MPOFI: Multichannel Partially Observed Functional Modeling for Defect Classification with Imbalanced Dataset via Deep Metric Learning [6.7] 現代の製造業では、ほとんどの製品ラインが適合しており、非コンフォーミングであるが欠陥タイプが異なる製品はほとんどない。
欠陥型の同定は、生産ラインのさらなる根本原因診断に役立つ。
不均衡データセットを用いた欠陥分類のための多チャンネル部分観測機能モデリング」として知られる革新的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:55:11 GMT)
Graph Neural Networks for Electric and Hydraulic Data Fusion to Enhance Short-term Forecasting of Pumped-storage Hydroelectricity [6.7] 揚水型水力発電所(PSH)はグリッド電力周波数制御に積極的に参加している。
動的に変化する状態を予測することは、基礎となるセンサーとマシンの状態を理解するために不可欠である。
この研究は、自己認識機構を利用して意味のあるサブシステム間の相互依存を同時に捕捉し学習するスペクトル時間グラフニューラルネットワークの応用を導入している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:09:49 GMT)
How does Multi-Task Training Affect Transformer In-Context Capabilities? Investigations with Function Classes [6.7] 大規模言語モデル(LLM)は、テキストとして提供される少数の例に基づいて、目に見えないタスクを実行するという異常な能力を示している。
我々は、ICLモデルによるデータ効率の向上と、より安定した収束を実現するための効果的なカリキュラム学習戦略をいくつか提案する。
実験の結果, ICLモデルでは, 従来の課題を混在させながら, 段階的に難しいタスクを学習することで, 難易度を効果的に学習できることが判明した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:15:23 GMT)
Learning From Simplicial Data Based on Random Walks and 1D Convolutions [6.6] ランダムウォークと高速1D畳み込みに基づく単純な複雑なニューラルネットワーク学習アーキテクチャ。
実世界のデータセット上でSCRaWlを実証的に評価し、他の単純なニューラルネットワークよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:27:22 GMT)
Okay, Let's Do This! Modeling Event Coreference with Generated Rationales and Knowledge Distillation [6.1] イベント参照解決(ECR)は、同じ実際のイベントを参照するイベントクラスタを接続するタスクである。
本研究では,現代の自己回帰 LLM によって生成される帰納的自由文論理(FTR)を用いて検討する。
イベント・コアス・スコアリングのための新しい合理的なイベント・クラスタリングと知識蒸留手法を実装した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:49:46 GMT)
Schroedinger's Threshold: When the AUC doesn't predict Accuracy [6.1] エリアアンダーカーブ測度(AUC)は、様々なモデルを評価し比較する傾向にある。
我々は,AUCが,アプリケーションで観測される実際の精度と誤認できる,学術的で楽観的な精度の概念を導出することを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:18:03 GMT)
Demystifying Code Snippets in Code Reviews: A Study of the OpenStack and Qt Communities and A Practitioner Survey [6.1] コードレビューのコードスニペットに関する情報と知識をマイニングするために、混合メソッドの研究を行います。
調査の結果は、レビュー担当者が開発者がコードレビューに必要な特定の情報を満たすために、適切なシナリオでコードスニペットを提供することができることを強調している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:55:55 GMT)
Solving Schrödinger Equation with a Language Model [6.1] 本稿では,言語モデルで使用されるトランスフォーマーアーキテクチャに基づいて,QiankunNetという機械学習モデルを提案する。
QiankunNetは複雑な量子相関を十分に捉え、その表現力を高める。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:40:41 GMT)
SpikeNAS: A Fast Memory-Aware Neural Architecture Search Framework for Spiking Neural Network-based Autonomous Agents [6.0] スパイキングニューラルネットワークは、高精度で超低消費電力/エネルギー計算を提供する。
SpikeNASは、SNNのための新しい高速メモリ対応ニューラルアーキテクチャ検索フレームワークである。
その結果,SpikeNASは検索時間を改善するとともに,最先端技術と比較して精度が向上していることがわかった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:55:05 GMT)
A Methodology for Improving Accuracy of Embedded Spiking Neural Networks through Kernel Size Scaling [6.0] Spiking Neural Networks(SNN)は、機械学習ベースのアプリケーションに対して、超低電力/エネルギー消費を提供する。
現在、ほとんどのSNNアーキテクチャはより高精度なモデルサイズを必要とする。
本稿では,カーネルサイズスケーリングによるSNNの精度向上手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:36:18 GMT)
EGTR: Extracting Graph from Transformer for Scene Graph Generation [5.9] SGG(Scene Graph Generation)は、オブジェクトを検出し、オブジェクト間の関係を予測するための課題である。
本稿では,DETRデコーダのマルチヘッド自己アテンション層で学習した様々な関係から関係グラフを抽出する軽量一段SGGモデルを提案する。
本稿では,Visual Genome と Open Image V6 データセットに対する提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:59:51 GMT)
Uniform Memory Retrieval with Larger Capacity for Modern Hopfield Models [5.9] 本稿では,現代のホップフィールドモデルに対する2段階のメモリ検索ダイナミクスを提案する。
私たちの重要な貢献は、ホップフィールドエネルギー関数をカーネル空間に変換する学習可能な特徴写像$Phi$である。
実世界のデータセットでは、$mathttUtext-Hop$が既存のHopfieldモデルよりも優れています。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 23:05:30 GMT)
API Is Enough: Conformal Prediction for Large Language Models Without Logit-Access [5.9] 本研究では,ロジットアクセスを伴わない大規模言語モデル (LLM) における不確実性を定量化する,広範囲にわたる課題に対処することを目的とする。
LLM の既存の Conformal Prediction (CP) メソッドは一般的に、APIのみの LLM では利用できないロジットへのアクセスを前提としている。
本稿では,ロジットアクセスのないAPIのみのLCMに適した新しいCP手法を提案する。(2)予測セットのサイズを最小化し,(3)ユーザ定義のカバレッジの統計的保証を保証する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:15:39 GMT)
What Makes a Language Easy to Deep-Learn? [5.9] 言語の基本的性質は、その構成構造であり、人間は新しい意味の形を作ることができる。
人間にとって、より構成的で透明な構造を持つ言語は、不透明で不規則な構造を持つ言語よりも学習しやすい。
この学習可能性の利点は、人間の言語学習のモデルとしての使用を制限するディープニューラルネットワークでは、まだ示されていない。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:26:54 GMT)
BodyMAP -- Jointly Predicting Body Mesh and 3D Applied Pressure Map for People in Bed [5.7] 人体メッシュと人体全体にわたる3次元加圧マップを共同で予測するBodyMAPについて紹介する。
本手法は,体メッシュおよび3次元加圧マップ予測タスクにおいて,現在の最先端技術よりも25%優れていた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:45:17 GMT)
Vestibular schwannoma growth prediction from longitudinal MRI by time conditioned neural fields [5.7] 本稿では,腫瘍進展予測のためのニューラルネットワークとリカレントニューラルネットワークを組み合わせたディープラーニング手法であるDeepGrowthを紹介する。
社内の経時的VSデータセットを用いた実験により,提案モデルにより性能が有意に向上した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:57:00 GMT)
The Reversal Curse: LLMs trained on "A is B" fail to learn "B is A" [5.6] 自己回帰型大言語モデル(LLM)における一般化の驚くべき失敗を示す。
例えば、もしモデルが"Valentina Tereshkovaが最初に宇宙に旅行した女性"で訓練されたとしても、"誰が最初に宇宙に旅行した女性なのか?"という疑問に自動的に答えることはできません。
GPT-3とLlama-1を架空の文で微調整することで、逆曲線の証拠を提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:25:17 GMT)
A Methodology to Study the Impact of Spiking Neural Network Parameters considering Event-Based Automotive Data [5.6] 本稿では,イベントベース自動車データを考慮したSNNパラメータの影響を系統的に研究し,分析する手法を提案する。
本稿では,自律走行システムのSNNモデルを改善する手法を提案する。
本研究は,SNNパラメータ拡張のための一連のガイドラインを提供し,SNNベースのADシステムの実用化を可能にする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:48:26 GMT)
About Test-time training for outlier detection [5.6] 本稿では,テストタイムのトレーニングを外乱検出に適用するDOUSTを紹介する。
ラベル付き外れ値が与えられなくても,アルゴリズムがほぼ教師付き性能に到達可能であることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:50:50 GMT)
Quantum Algorithms in a Superposition of Spacetimes [5.5] 量子コンピュータは私たちの情報処理能力に革命をもたらすと期待されている。
量子重力(QG)に基づく自然計算モデルの最初の例を示す。
量子コンピュータは,計算機科学の基本的な2つの問題を時間内に解くことができることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:37:41 GMT)
Generalizable 3D Scene Reconstruction via Divide and Conquer from a Single View [5.2] シングルビュー3D再構成は現在、2つの主要な視点からアプローチされている。
分割・分散戦略に従うハイブリッド手法を提案する。
まず、深度と意味情報を抽出し、そのシーンを全体的に処理する。
次に、個々のコンポーネントの詳細な再構築に単発オブジェクトレベル手法を利用する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:58:46 GMT)
Investigating Regularization of Self-Play Language Models [5.2] 本稿では,言語モデルアライメントの文脈における様々な形態の正規化の効果を,セルフプレイによる検討する。
KL法に基づく正則化器は,SPIN損失関数内の基本方針と幾何的混合により,以前の方針を置き換えることが示される。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:38:44 GMT)
Closed universes in two dimensional gravity [5.2] 閉宇宙を2次元重力の単純なモデルで研究する。
我々は、この理論の摂動的側面と非摂動的側面の間に、非常に強いコントラストといくつかの関係を見出した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:08:22 GMT)
Accurate Low-Degree Polynomial Approximation of Non-polynomial Operators for Fast Private Inference in Homomorphic Encryption [5.0] ホモモルフィック暗号化(FHE)は、暗号化されたデータの推論を可能にし、データのプライバシと機械学習モデルの両方のプライバシを保存する。
非多項式作用素を高次多項式近似関数(PAF)に置き換える根本原因として、最大5等級の安全推論を遅くする。
我々は,非多項式演算子を低次PAFに置き換えた上で,PAF近似モデルの精度を4つの手法で再現するフレームワークであるSmartPAFを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:45:52 GMT)
UINav: A Practical Approach to Train On-Device Automation Agents [5.0] モバイル機器に適合する自動化エージェントをトレーニングするための,デモベースのアプローチであるUINavを提案する。
わずか10のデモでUINavは70%の精度を達成でき、十分なデモで90%以上の精度を達成できる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:51:56 GMT)
Pulse optimization for high-precision motional-mode characterization in trapped-ion quantum computers [4.7] 量子コンピュータの高忠実度演算は、特性解析を通じて物理系の正確な知識を必要とする。
閉じ込められたイオンの運動による絡み合いの発生には、モード周波数やラムディッケパラメータといった運動モードパラメータの正確な知識が不可欠である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 23:29:11 GMT)
Performance of computer vision algorithms for fine-grained classification using crowdsourced insect images [4.7] 生物多様性のモニタリングや多くの生態系の基盤となるため、Insectaの種認識に重点を置いている。
深層畳み込みネットワーク(CNN)、視覚変換器(ViT)、局所性に基づく視覚変換器(LBVT)の9つのアルゴリズムの完全かつ詳細な評価を行う。
We found that the ViT are the best on inference speed and compute cost while the LBVT while the other performance on performance and embedded quality。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:26:58 GMT)
Steering nonlocality in high-speed telecommunication system without detection loophole [4.7] 本報告では, 通信波長で閉じた検出ループホールを用いた非局所性ステアリングの初の実演を報告する。
この取り組みでは、効率的な絡み合い発生のための低損失シリコンチップの設計と製造を行う。
我々は、複数の測定設定で量子ステアリングに必要な検出効率を克服できる光ファイバー装置を構築している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:27:46 GMT)
DiffObs: Generative Diffusion for Global Forecasting of Satellite Observations [4.7] 本研究は, 自然降雨のグローバルな進化を予測するための自己回帰的生成拡散モデル(DiffObs)を提案する。
モデルは, 日頭降雨の確率論的予測のために訓練されているが, 複数ヶ月のロールアウトには安定であり, 熱帯における対流結合波動モードの定性的に現実的な重ね合わせが明らかである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:24:22 GMT)
Entanglement Degradation in the Presence of Markovian Noise: a Statistical Analysis [4.6] ランダムに分散したマルコフ雑音のアンサンブルの作用による量子系の絡み合いの劣化について検討する。
我々は、ランダムに分散した局所的均一なマルコフ雑音の進化を行う$n$クォーディットで形成された量子メモリの絡み合い劣化統計を特徴付ける。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:09:25 GMT)
Experimental demonstration of magnetic tunnel junction-based computational random-access memory [4.6] 「計算ランダムアクセスメモリ(CRAM)が登場し、この基本的限界に対処している」
CRAMは、データがメモリを離れることなく、メモリセルを直接使用するロジック操作を実行する。
本研究では,磁気トンネル接合(MTJ)に基づくCRAMアレイ実験を行った。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:44:47 GMT)
Convergence Conditions of Online Regularized Statistical Learning in Reproducing Kernel Hilbert Space With Non-Stationary Data [4.6] 本研究では,HilbertHSカーネルにおける正規化学習アルゴリズムの収束性について検討した。
独立および非独立に分散したデータストリームに対して、入力データによって引き起こされる限界確率測度が徐々に変化している場合、アルゴリズムは平均二乗整合を達成する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:35:59 GMT)
EASSE-DE: Easier Automatic Sentence Simplification Evaluation for German [4.5] EASSE-multiは、英語以外の言語での文の自動評価を容易にするフレームワークである。
トークン化器と、複数の言語に適したテキスト単純化評価メトリクスのバージョンを含んでいる。
本稿では、ドイツ語TSにおけるEASSE-multiの使用例を示し、その結果、EASSE-DEとなる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:18:37 GMT)
Towards Pareto Optimal Throughput in Small Language Model Serving [4.5] SLM(Small Language Models)は、リソース制約のあるユーザに対して、新たな機会を提供する。
本研究では,SLM推論を性能およびエネルギーレベルで評価するための一連の実験について述べる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:45:07 GMT)
OptoGPT: A Foundation Model for Inverse Design in Optical Multilayer Thin Film Structures [4.3] 我々は,デコーダのみのトランスであるOptoGPT(Opto Generative Pretrained Transformer)を導入し,これらの欠点と問題を同時に解決する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:45:51 GMT)
Entangling cavity-magnon polaritons by interacting with phonons [4.3] 2つの強く結合したマイクロ波キャビティとマグノンモードによって形成される2つのキャビティ-マグノン偏光子(CMP)の絡み合わせ方法を示す。
絡み合ったCMPは、CMPを用いた暗黒物質探索実験における検出感度を向上させることができ、周波数に絡み合ったマイクロ波光子の放出につながる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:13:51 GMT)
Learning-to-Optimize with PAC-Bayesian Guarantees: Theoretical Considerations and Practical Implementation [4.2] 最適学習の設定にはPAC-ベイズ理論を用いる。
証明可能な一般化保証付き最適化アルゴリズムを学習する最初のフレームワークを提示する。
学習アルゴリズムは、(決定論的)最悪のケース分析から得られた関連アルゴリズムを確実に上回ります。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:24:57 GMT)
Laser Learning Environment: A new environment for coordination-critical multi-agent tasks [4.1] 本稿では,協調型マルチエージェント強化学習環境であるLaser Learning Environment (LLE)を紹介する。
LLEでは、エージェントはお互いに依存して進行(相互依存)し、成功するための特定のアクションのシーケンスを共同で取らなければならない(完全な調整)。
我々は、複数の最先端値ベースMARLアルゴリズムをLLEに対してテストし、状態空間ボトルネックを回避できないために、協調作業で一貫して失敗することを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:05:42 GMT)
Cryptographic Hardness of Score Estimation [4.1] L2$-accurate score Estimation, in without the strong assumptions on the data distribution, is calculatedly hard in if the sample complexity is in the relevant problem parameters。
我々の難しい推定分布は「ガウシアン・パンケーキ」分布であり、もともとはダイアコニコラス等が原因である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:49:09 GMT)
Enhancing the Performance of Aspect-Based Sentiment Analysis Systems [4.0] 本研究では,セティシィス(SentiSys)と呼ばれる革新的なエッジ強化GCNを導入し,無傷な特徴情報を保存しながら構文グラフをナビゲートする。
その結果,SentiSysを用いたアスペクトベース感情分析では,常に改善が見られた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:31:56 GMT)
On Extending the Automatic Test Markup Language (ATML) for Machine Learning [3.6] 本稿では,自動テストマークアップ言語(ATML)として知られるIEEE標準1671(IEEE Std 1671)の機械学習(ML)アプリケーションテストへの適用性について検討する。
本稿では, 対向ロバスト性やドリフト検出などの様々なテストのモデル化を通じて, 特定のアプリケーションに適用可能なフレームワークを提案する。
我々は、ATMLは、MLアプリケーションの効果的でほぼリアルタイムな運用T&Eのための有望なツールである、と結論付けている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:28:38 GMT)
A Systems Theoretic Approach to Online Machine Learning [3.6] オンライン学習の機械学習の定式化は、システム理論の観点からは不完全である。
このフレームワークはインプット・アウトプット・システムの観点から定式化され、さらにシステム構造とシステム挙動に分けられる。
この研究は、システム行動特性の一部として、コンセプトドリフトに正式にアプローチする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:36:47 GMT)
Knowledge-Based Convolutional Neural Network for the Simulation and Prediction of Two-Phase Darcy Flows [3.6] 物理インフォームドニューラルネットワーク(PINN)は、科学計算とシミュレーションの分野で強力なツールとして注目されている。
本稿では、ニューラルネットワークのパワーと、離散化微分方程式によって課される力学を組み合わせることを提案する。
支配方程式を識別することにより、PINNは不連続性を考慮し、入力と出力の間の基礎となる関係を正確に捉えることを学ぶ。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:56:32 GMT)
Accurate estimation of feature importance faithfulness for tree models [3.5] 我々は、PGI二乗と呼ぶ特徴ランク(または属性)の予測忠実度を摂動に基づく計量として考える。
PGI2乗に基づく木モデルの予測において重要となる特徴のランク付け手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:09:26 GMT)
What we can learn from TikTok through its Research API [3.4] 最近リリースされた無料のResearch APIは、投稿されたビデオ、関連コメント、ユーザーアクティビティのデータを集めるための扉を開く。
本研究は,TikTokビデオのランダムなサンプルを6年間にわたって収集し,分析することにより,Research APIが返した結果の信頼性を評価することに焦点を当てた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:08:06 GMT)
Diverse and Tailored Image Generation for Zero-shot Multi-label Classification [3.4] ゼロショットのマルチラベル分類は、人間のアノテーションを使わずに、目に見えないラベルで予測を実行する能力について、かなりの注目を集めている。
一般的なアプローチでは、目に見えないものに対する不完全なプロキシとしてクラスをよく使用します。
本稿では,未確認ラベル上でのプロキシレストレーニングに適したトレーニングセットを構築するために,合成データを生成する,革新的なソリューションを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:34:36 GMT)
Terrain Point Cloud Inpainting via Signal Decomposition [3.3] 塗装アルゴリズムは点雲に穴をあけるのに広く使われている。
本研究では,大域的スムーズさとリッチな局所的詳細に基づく地形点雲の表現を提案する。
この2つの問題を解くことで、地形点雲の非常に複雑で不規則な穴を十分に埋めることができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:37:42 GMT)
CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models [3.2] 厳密にキュレートされた高品質データセットに基づいてトレーニングされたTinyAgentモデルを紹介する。
また,言語エージェントの能力向上を目的とした革新的システムであるCMAT(Collaborative Multi-Agent Tuning)フレームワークを提案する。
本研究では,マルチエージェントシステムと環境フィードバック機構を統合した新しいコミュニケーションエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:40:03 GMT)
The Relational Bottleneck as an Inductive Bias for Efficient Abstraction [3.2] ニューラルネットワークはアーキテクチャを通して、個々の入力の属性ではなく、知覚的入力間の関係に焦点を絞っていることを示す。
データ効率のよい方法で抽象化を誘導するために、このアプローチを用いたモデルのファミリーをレビューする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:08:52 GMT)
A replica analysis of Self-Training of Linear Classifier [3.1] 自己学習 (ST) は、半教師あり学習における単純で標準的なアプローチである。
モデルに誤った擬似ラベルを付けることによって、なぜ、どのようにパフォーマンスを改善するのかは、まだよく分かっていない。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:14:30 GMT)
BioVL-QR: Egocentric Biochemical Video-and-Language Dataset Using Micro QR Codes [3.0] 本稿では,バイオケミカル・ビジョン・アンド・ランゲージ・データセットを提案する。
24のエゴセントリックな実験ビデオ、対応するプロトコル、そしてビデオと言語によるアライメントで構成されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:22:37 GMT)
Retail Central Bank Digital Currency: Motivations, Opportunities, and Mistakes [2.9] 世界中の各国が中央銀行デジタル通貨(CBDC)の設計について調査を行っている
CBDCは、現金と中央銀行の予備金と共に中央銀行によって発行される。
CBDCは個人や企業によって通常の商業に適した金として使われる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:29:00 GMT)
Relational superposition measurements with a material quantum ruler [2.9] 位置測定装置として機能する拡張材料量子システムを記述するためのモデルを提案する。
我々は「位置の重畳」に対応する量子計測手順を定義することができることを示す。
なぜなら、唯一有意な変数は、支配者とシステムの間の相対的な位置であるからである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:41:13 GMT)
CantTalkAboutThis: Aligning Language Models to Stay on Topic in Dialogues [2.8] CantTalkAboutこのデータセットは、異なるドメインからの幅広い会話トピックに関する合成対話で構成されている。
このデータセット上の微調整言語モデルは、割り当てられたロールから逸脱する耐性を高めるのに役立ちます。
予備的な観察では、このデータセット上でのトレーニングモデルが、タスクに追従するきめ細かい命令のパフォーマンスを向上させることが示唆されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 22:31:58 GMT)
QDarts: A Quantum Dot Array Transition Simulator for finding charge transitions in the presence of finite tunnel couplings, non-constant charging energies and sensor dots [2.8] QDartsは、平衡状態にある量子ドットアレイ(QDA)デバイスの現実的な電荷安定性図のシミュレータである。
これには、有限トンネル結合、非定常充電エネルギー、ノイズの多いセンサドットのシミュレーションなどが含まれる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:39:34 GMT)
Data-Efficient Strategies for Probabilistic Voltage Envelopes under Network Contingencies [2.8] 本研究では,ネットワーク共振器を有するグリッドにおける電力フロー学習を用いた確率電圧エンベロープ(PVE)を構築するための効率的なデータ駆動手法を提案する。
提案手法は,モンテカルロサンプリング法に比べて16倍少ない電力フロー解を用いてPVEを実現できることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:52:32 GMT)
A Deep Reinforcement Learning Approach for Security-Aware Service Acquisition in IoT [2.8] モノのインターネットにおけるサービスの獲得において、適切なレベルのプライバシとセキュリティ要件を定義するための完全なフレームワークを提案する。
強化学習ベースのソリューションを使用することで、環境内のユーザエージェントは、ターゲットサービスへのアクセスを許可する最適なスマートオブジェクトを選択するように訓練される。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:00:12 GMT)
ILPO-NET: Network for the invariant recognition of arbitrary volumetric patterns in 3D [2.8] 本稿では、局所的なパターン配向に本質的に不変な畳み込み操作を伴う任意の形状のパターンを扱う新しいアプローチであるILPO-Netを提案する。
我々のアーキテクチャは、新しい畳み込み演算子をシームレスに統合し、MedMNISTやCATHといった様々なボリュームデータセットをベンチマークすると、優れた性能を示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:44:23 GMT)
HDR Imaging for Dynamic Scenes with Events [2.8] 本稿では,実世界の動的シナリオにおけるHDRI性能を一般化する,自己教師付き学習パラダイムにおけるイベントベースのHDRIフレームワークを提案する。
ぼやけたLDR画像から鋭いLDR画像へのクロスドメイン変換を学習することにより、自己教師付き学習戦略を実行する。
提案手法の有効性を評価するため,大規模合成および実世界のデータセットを構築した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 05:33:06 GMT)
Heckler: Breaking Confidential VMs with Malicious Interrupts [2.7] Hecklerは新しい攻撃で、ハイパーバイザは悪意のある非タイマー割り込みを注入し、CVMの機密性と整合性を壊す。
In AMD SEV-SNP and Intel TDX, we demonstrate Heckler on OpenSSH and bypass authentication。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:37:59 GMT)
Data Quality in Crowdsourcing and Spamming Behavior Detection [2.6] 本稿では,データ品質を評価し,分散分解によるスパムの脅威を検出するための体系的手法を提案する。
データ一貫性を評価するためにスパマーインデックスが提案され、群衆労働者の信頼性を測定するために2つの指標が開発された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:21:38 GMT)
Non-Hermitian topology and criticality in photonic arrays with engineered losses [2.6] 統合フォトニクスシステムは、人工格子を再構成可能な方法で設計できる柔軟なプラットフォームを提供する。
工学的な損失を伴う1次元フォトニックアレイは、非ハーミティシティとバルクモード臨界から生じるトポロジカル励起の実現を可能にする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:36:40 GMT)
An Adaptive Hydropower Management Approach for Downstream Ecosystem Preservation [2.6] 適応的な生態放電を用いて生態系の保護体として水力発電所を利用するという見落とされがちな可能性を強調した。
ニューラルネットワークを用いて、所望の時間毎に最小の生態的排出値を予測することを提案する。
本稿では,水力管理ソフトウェアにシームレスに統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:47:28 GMT)
AdaGlimpse: Active Visual Exploration with Arbitrary Glimpse Position and Scale [2.5] Active Visual Exploration (AVE)は、観察(グランプ)を動的に選択するタスクである。
光ズーム機能を備えた既存のモバイルプラットフォームは、任意の位置とスケールを垣間見ることができる。
AdaGlimpseは、探索作業に適した強化学習アルゴリズムであるSoft Actor-Criticを使って、任意の位置と規模を垣間見る。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:35:49 GMT)
A Learning-Based Caching Mechanism for Edge Content Delivery [2.4] 5GネットワークとIoT(Internet of Things)の台頭により、ネットワークのエッジはますます拡大している。
このシフトは、特に限られたキャッシュストレージとエッジにおける多様な要求パターンのために、ユニークな課題をもたらす。
HR-Cacheは、ハザードレート(HR)順序付けの原則に基づく学習ベースのキャッシュフレームワークである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:41:11 GMT)
Comprehensible Artificial Intelligence on Knowledge Graphs: A survey [2.3] このサーベイは知識グラフに関する理解可能な人工知能に短い歴史を与えている。
説明可能な人工知能という概念は、解釈可能な機械学習によって過負荷になり、重複している、と我々は主張する。
これにより、知識グラフに関する理解可能な人工知能のための新しい分類法が導入された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:57:32 GMT)
Predictive Analytics of Varieties of Potatoes [2.3] 本研究では, 育種試験におけるRussetポテトクローンの適合性を予測するため, 機械学習アルゴリズムの適用について検討する。
我々はオレゴン州で手作業で収集した試験のデータを活用している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:49:05 GMT)
The power of a single Haar random state: constructing and separating quantum pseudorandomness [2.3] このような神託が量子擬似ランダム性を構成することを、おそらく驚くべきことに示している。
シングルコピー擬似ランダム状態 (1PRS) と呼ばれるより弱い概念は、単一コピーに関してこの性質を満たす。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:36:44 GMT)
Missing Data Imputation Based on Structural Equation Modeling Enhanced with Self-Attention [2.3] 自己注意法(Self-Attention method, SESA)は, EHRにおけるデータ計算の革新的手法である。
SESAは、自己保持機構を組み込むことで、従来のSEMベースの手法を超えて革新する。
実験により,SESAは頑健な予測性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:38:32 GMT)
Fermionic quantum computation with Cooper pair splitters [2.2] 量子ビットではなく局所フェルミオンモード(LFM)を用いる普遍量子コンピュータの実践的実装を提案する。
デバイスレイアウトは、ハイブリッド超伝導島で結合された量子ドットトンネルと、ドット間の可変容量結合からなる。
クーパー対分割、弾性コツネリング、クーロン相互作用のコヒーレント制御により、量子ゲートの普遍的な集合を実装することができることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:22:37 GMT)
Effective Learning with Node Perturbation in Deep Neural Networks [2.1] バックプロパゲーション(BP)は、ディープニューラルネットワークモデルのパラメータをトレーニングするための支配的かつ最も成功した手法である。
node perturbation (NP) は、ネットワークアクティベーションにノイズを注入することで学習を提案する。
NPは、非誘導ノイズに基づく探索プロセスのため、データ非効率で不安定である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:40:51 GMT)
SiloFuse: Cross-silo Synthetic Data Generation with Latent Tabular Diffusion Models [2.1] クロスサイロデータから高品質な合成を行うための新しい生成フレームワークであるSiloFuseを紹介する。
The impossibility of data reconstruction for vertically partitioned synthesis and Quantify privacy risk。
SiloFuseはGANよりも43.8ポイント、29.8ポイント高い。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:48:30 GMT)
LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation [2.1] 医用画像分割のための軽量だが効率的な新しいモデル LiteNeXt を提案する。
LiteNeXtは、少量のパラメータ (0.71M) とギガ浮動小数点演算 (0.42) でスクラッチから訓練されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:59:19 GMT)
High fidelity control of a many-body Tonks--Girardeau gas with an effective mean-field approach [2.0] STA(Shortcut to adiabaticity)は、高忠実度で量子システムを制御できる強力なツールである。
ここでは、Schr"odinger方程式のキネティック非線形項を通して、強相互作用効果を簡潔にキャプチャする平均場アプローチを用いる。
提案手法のロバスト性を強調するために,非調和ポテンシャルに対して効果的に作用し,他の一般的な制御手法よりも高い忠実性を達成することを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:46:27 GMT)
nicolay-r at SemEval-2024 Task 3: Using Flan-T5 for Reasoning Emotion Cause in Conversations with Chain-of-Thought on Emotion States [2.0] 我々は既存の三脚推論手法(THOR)を用いて、感情状態(THOR状態)と、一方の話者から他方の話者への感情(THOR原因)という、大きな言語モデルによる学習を行う。
最終提出は,Flan-T5ベース(250M)とルールベースのスパン補正技術に基づいて,THOR-stateで予備調整し,THOR-cause-rrで競技トレーニングデータに微調整し,第3位と第4位(F1-proportional)と第5位(F1-strict)を15チームで実施した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:03:33 GMT)
Sequential Monte Carlo Bandits [1.9] 我々は、連続モンテカルロ法(SMC)を用いることで、ベイジアン多重武装バンディット(MAB)アルゴリズムを元の設定を超えて拡張する。
MABは、長期的な支払いを最大化するポリシーを学ぶことを目標とするシーケンシャルな意思決定問題である。
本稿では,線形力学系を用いて時間力学をモデル化した非定常帯域について述べる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:00:42 GMT)
Using Large Language Models to Enrich the Documentation of Datasets for Machine Learning [1.8] 大規模言語モデル(LLM)を用いて,文書から次元を自動的に抽出する戦略について検討する。
当社のアプローチは、データパブリッシャや実践者がマシン可読なドキュメントを作成するのに役立ちます。
我々は、我々のアプローチを実装するオープンソースツールと、実験のコードと結果を含むレプリケーションパッケージをリリースした。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:09:28 GMT)
M3TCM: Multi-modal Multi-task Context Model for Utterance Classification in Motivational Interviews [1.8] 発話分類のためのマルチモーダル・マルチタスクコンテキストモデルであるM3TCMを提案する。
われわれのアプローチでは、マルチタスク学習を用いて、セラピストとクライアントの振る舞いのジョイントコンポーネントと個別コンポーネントの両方を効果的にモデル化する。
提案手法により,最近導入されたAnnoMIデータセットの発話分類技術は,クライアントで20%,セラピストで15%向上した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:17:22 GMT)
Part-Attention Based Model Make Occluded Person Re-Identification Stronger [1.8] PAB-ReIDは,問題に効果的に対処するための部分認識機構を組み込んだ新しいReIDモデルである。
まず、より正確な人的部分注意マップの生成を導くために、人間のパーシングラベルを導入する。
また、背景干渉を抑えつつ、きめ細かい人間の局所的特徴表現を生成するための細粒度特徴焦点器を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:43:11 GMT)
Kernel Debiased Plug-in Estimation: Simultaneous, Automated Debiasing without Influence Functions for Many Target Parameters [1.6] カーネル・デバイアスド・プラグイン推定(KDPE)という新しい手法を提案する。
KDPEは、我々の規則性条件を満たす全ての微分可能なターゲットパラメータを同時に分離する。
我々は、KDPEの使用法を数値的に説明し、理論結果を検証した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:41:34 GMT)
Improvement of Performance in Freezing of Gait detection in Parkinsons Disease using Transformer networks and a single waist worn triaxial accelerometer [1.6] 歩行の凍結(FOG)はパーキンソン病の最も無力な症状の1つである。
本稿では、トランスフォーマーと畳み込みネットワークに基づく新しい分類アルゴリズムと、単体回転三軸加速度計を用いた自動FOG検出の進歩について述べる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:02:17 GMT)
Privacy Engineering From Principles to Practice: A Roadmap [1.6] プライバシーエンジニアリングは、業界や学界で勢いを増している。
現実世界の情報システムへの導入を促進するためには、研究や実践において意識的に考慮すべき追加の側面が必要である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:39:49 GMT)
New Well-Posed Boundary Conditions for Semi-Classical Euclidean Gravity [1.5] ディリクレ条件は、十分に仮定された楕円系を生じさせない。
アンダーソンとディリクレの境界条件は、これらの極限$p から 0$ および $infty$ と見なすことができる。
p 1/6$ の場合、球対称セクターや静的セクターでも不安定モードが存在する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:41:57 GMT)
SHROOM-INDElab at SemEval-2024 Task 6: Zero- and Few-Shot LLM-Based Classification for Hallucination Detection [1.4] SHROOM-INDElabシステムは、幻覚検出のための分類器を構築するために、プロンプトプログラミングとインコンテキスト学習を使った以前の研究に基づいている。
タスク、役割、ターゲット概念のコンテキスト固有の定義を取り入れ、数発のプロンプトアプローチで使用するためのサンプルの自動生成を通じて、作業を拡張する。
その結果,タスク6のモデル非依存トラックとモデル認識トラックにおいて,第4位と第6位を達成した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:01:21 GMT)
An Optimization Framework to Personalize Passive Cardiac Mechanics [1.3] 本研究は、心臓組織の受動力学的特性を推定する逆有限要素解析(iFEA)フレームワークを提案する。
受動的機械的挙動を特徴づけることに焦点をあて、このフレームワークは構造に基づく異方性超弾性モデルを採用している。
本フレームワークは,心相分解CT画像から得られた胆道および左房の心筋モデルを用いて検討した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 12:54:30 GMT)
Self-Testing Graph States Permitting Bounded Classical Communication [1.2] 自己検査は非局所性を示す量子状態と相関を識別する。
グラフ状態は、基礎グラフ上の有界古典的通信が許される場合でも非局所的相関を示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:53:17 GMT)
A Framework for Guided Motion Planning [1.2] 我々は、ガイド空間の概念を定義することにより、ガイド付き探索の概念を定式化する。
この新しい言語は、同じフレームワークの下で、明らかに異なる先行メソッドをカプセル化している。
本稿では,既知のアルゴリズムでテストした場合の直感と実験的に一致したガイダンスを評価するための情報理論手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:58:19 GMT)
Exploring Emotions in Multi-componential Space using Interactive VR Games [1.2] インタラクティブバーチャルリアリティ(VR)ゲームを用いたデータ駆動型アプローチを運用した。
機械学習(ML)手法を用いて、各コンポーネントの感情分化に対するユニークな貢献を識別した。
これらの知見は、感情研究におけるVR環境の利用にも影響する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:54:44 GMT)
CBR-RAG: Case-Based Reasoning for Retrieval Augmented Generation in LLMs for Legal Question Answering [1.1] Retrieval-Augmented Generation (RAG) は、入力のコンテキストとして事前知識を提供することで、Large Language Model (LLM) の出力を向上させる。
ケースベース推論(CBR)は、LLMにおけるRAGプロセスの一部として、構造検索を行う重要な機会を提供する。
我々は,CBRサイクルの初期検索段階,インデックス語彙,類似性知識コンテナを,文脈に関連のあるケースでLLMクエリを強化するために使用するCBR-RAGを紹介する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:47:43 GMT)
Federated Bayesian Deep Learning: The Application of Statistical Aggregation Methods to Bayesian Models [1.0] 集約戦略は、分散決定論的モデルの重みとバイアスをプールまたはフューズするために開発されている。
決定論的モデルに対するFLスキームに付随するアグリゲーション手法の簡単な適用は不可能か、あるいは準最適性能をもたらすかを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:09:21 GMT)
Learning smooth functions in high dimensions: from sparse polynomials to deep neural networks [1.0] 有限個の点検点集合から多くの変数の滑らかな対象関数への近似を学習することは、科学計算において重要な課題である。
この10年で、効率的な方法への重要な進歩が見られた。
近年,これらの手法の近似理論と解析が進展している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:07:21 GMT)
AQuA - Combining Experts' and Non-Experts' Views To Assess Deliberation Quality in Online Discussions Using LLMs [1.0] AQuAは、議論投稿ごとに複数の指標から統一された熟考品質スコアを算出する付加的なスコアである。
我々は,20の熟考指標に対する適応モデルを開発し,専門家のアノテーションと認識された熟考度との相関係数を非専門家によって計算し,各指標を1つの熟考スコアに重み付けする。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:34:31 GMT)
Robust deep learning for eye fundus images: Bridging real and synthetic data for enhancing generalization [0.9] この研究は、合成眼底画像を生成するために10の異なるGANアーキテクチャをAMDなしで比較する。
StyleGAN2は最も低いFrechet Inception Distance(166.17)に達し、臨床医は実際の画像と合成画像とを正確に区別できなかった。
精度はテストセットで82.8%、STAREデータセットで81.3%であり、モデルの一般化可能性を示している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:13:42 GMT)
A linear program for testing nonclassicality and an open-source implementation [0.8] 実験が古典的な説明に抵抗することを示すためのよく動機付けられた方法は、その統計が一般化された非文脈性に反することを示すことである。
本稿では,この問題を線形プログラムとして定式化し,任意の準備実験が古典的に説明可能であるか否かを検証したオープンソース実装を提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:47:55 GMT)
The Great Ban: Efficacy and Unintended Consequences of a Massive Deplatforming Operation on Reddit [0.7] Reddit上で2000近いコミュニティに影響を与えた大規模なデプラットフォーム運用であるThe Great Banの有効性を評価した。
14ヶ月の間に17万のユーザーが投稿した16万のコメントを分析して、望ましい結果とそうでない結果の両方について、微妙な結果を提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:26:32 GMT)
Passive and Deterministic Controlled-phase Gate for Single-photon Wavepackets Based on Time-reversal Symmetric Photon Transport [0.7] 提案されたゲートは、時間反転対称光子輸送の概念に根ざしている。
非線形媒体を用いたフォトニック位相ゲートに固有のウェーブパレット歪みの長年の問題を回避することができる。
ゲートの忠実度はノードの99%を超え、単一光子と2光子の両方で4つの空洞しか持たない。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:01:16 GMT)
TinyVQA: Compact Multimodal Deep Neural Network for Visual Question Answering on Resource-Constrained Devices [0.7] 本稿では,視覚質問応答タスクのための新しいマルチモーダルディープニューラルネットワークTinyVQAを提案する。
このモデルは、災害後の被害評価に使用されるFloodNetデータセットで評価された。
TinyVQAモデルは56ミリ秒の低レイテンシを実現し、小型ドローンに搭載されている間に693ミリワットの電力を消費する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:38:49 GMT)
SleepVST: Sleep Staging from Near-Infrared Video Signals using Pre-Trained Transformers [0.7] 本研究では,カメラベース睡眠ステージ分類における最先端性能を実現するトランスフォーマーモデルであるSleepVSTを紹介する。
本研究では,ビデオから抽出した呼吸波形にSleepVSTをうまく移行させることにより,完全接触型睡眠ステージリングが可能となることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 23:24:14 GMT)
Weighted structure tensor total variation for image denoising [0.5] 画像復号化問題に対して、構造テンソル全変量モデル(STV)は、他の競合する正規化手法と比較して優れた性能を示す。
異方性全変動(ATV)モデルに導入された異方性重み付き行列を用いてSTVモデルを改善する。
提案する重み付きSTVモデルは,画像からローカル情報を効果的に取得し,復調過程において詳細を維持できる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:00:56 GMT)
Two-dimensional coherent spectrum of high-spin models via a quantum computing approach [0.5] 本稿では,高スピンモデルの2次元コヒーレントスペクトル(2DCS)を計算するための量子コンピューティング手法を提案する。
得られた2DCSスペクトルは、未摂動ハミルトニアンの異なる固有状態間の遷移から生じるマグノン周波数の倍数の異なるピークを示す。
量子ハイスピンモデルの2DCSにおける高調波発生信号の観測強度は実験データとよく一致し, 対応する平均場よりも顕著に向上した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:39:17 GMT)
Classical Half-Adder using Trapped-ion Quantum Bits: Towards Energy-efficient Computation [0.4] エネルギー効率のよい計算のための未来のパラダイムとして,可逆計算が提案されている。
量子技術上で動く古典論理ゲートの証明を提供する。
我々は論理ゲートを操作するのに必要なエネルギーを理論的にも実験的にも分析する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:51:22 GMT)
Efficient Learning of Quantum States Prepared With Few Non-Clifford Gates II: Single-Copy Measurements [0.4] 最近の研究で、回路によって出力される$n$-qubitの量子状態が、最大$t$1-qubitの非クリフォードゲートを持つ場合、$mathsfpoly(n,2t,1/epsilon)$時間とサンプルを用いて、距離$epsilon$をトレースすることができることが示されている。
そこで本研究では,単一コピー計測のみを用いて,同じ状態のクラスを学習するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:27:11 GMT)
Agnostic Tomography of Stabilizer Product States [0.4] クラス $mathcalC$ of $n$-qubit 安定化器状態に対する効率的な非依存トモグラフィーアルゴリズムを提案する。
我々は少なくとも$mathcalC$の任意の状態と近似する状態の簡潔な記述を出力する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 21:39:47 GMT)
PAC-learning of free-fermionic states is NP-hard [0.3] 自由フェルミオン状態は、その効率的な古典的シミュラビリティのため、量子状態の基本クラスである。
いくつかのマヨラナ相関関数の推定値によって生成される与えられたデータセットは、NP完全問題である自由フェルミオン状態と整合可能であることを示す。
これは古典的にシミュレート可能な量子状態の最初のクラスであり、この性質を持つ。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:50:10 GMT)
Layerwise Early Stopping for Test Time Adaptation [0.3] テスト時間適応(TTA)は、事前訓練されたモデルがテスト時に見えないドメインで新機能を学習できるようにすることで、分散シフトの問題に対処する。
新機能の学習と,トレーニング済みの有用な機能の維持のバランスを維持する上で,これは大きな課題となる。
本稿では,TTAのためのレイヤワイズEArly Stopping(LEAST)を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:55:11 GMT)
ROBUST: 221 Bugs in the Robot Operating System [0.3] 私たちは、人気があり多様な7つのソフトウェアシステムにまたがって、221のバグのデータセットを体系的にキュレートしました。
私たちは、Dockerイメージという形で、221の欠陥のあるソフトウェアバージョンを、歴史的に正確なレクリエーションを作成しています。
基礎理論のアプローチを使用して、対応する障害、障害、修正を調べ、分類します。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:49:38 GMT)
Image Outlier Detection Without Training using RANSAC [0.2] RANSAC-NNと呼ばれる新しい画像異常検出アルゴリズムを提案する。
既存のアプローチとは異なり、RANSAC-NNはデータのサブセットをサンプリングして比較することで、アウトレーヤを含むデータセットに直接適用することができる。
提案アルゴリズムは, 既存のベンチマーク手法と比較して, 良好な性能を保っている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:11:05 GMT)
Generative AI and Teachers -- For Us or Against Us? A Case Study [0.2] 大学教員によるジェネレーション人工知能(GenAI)の導入に関する調査
その結果,67名中35名(半数以上)がGenAIを使用していることがわかった。
59%は教育に影響を与えていると回答しているが、55%はGenAIの使用に関する法律があるべきだと回答している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:40:07 GMT)
From News to Summaries: Building a Hungarian Corpus for Extractive and Abstractive Summarization [0.2] HunSum-2は、抽象的および抽出的要約モデルのトレーニングに適したオープンソースのハンガリー語コーパスである。
データセットは、徹底的なクリーニングを行うCommon Crawlコーパスのセグメントから組み立てられる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:07:06 GMT)
Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection [0.1] 本稿では,GPT-4による金融市場における株式選択の先進的推論を活用する革新的なフレームワークであるMarketSenseAIを紹介する。
MarketSenseAIは、市場動向、ニュース、基礎、マクロ経済要因などさまざまなデータソースを分析し、専門家の投資決定をエミュレートする。
本研究は,金融意思決定における大規模言語モデルの変容の可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:18:55 GMT)
Reevaluating Bias Detection in Language Models: The Role of Implicit Norm [0.0] 大規模言語モデル(LLM)は、過度な差別から暗黙的なステレオタイプに至るまで、様々な形態で現れるバイアスを運ぶことができる。
偏見の1つの側面は、LLMのパフォーマンス格差であり、しばしば人種的少数派のような未成年集団に害を与える。
バイアスを定量化するための一般的なアプローチは、テンプレートベースのバイアスプローブを使用することである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:24:06 GMT)
Fine-tuning Large Language Models for Automated Diagnostic Screening Summaries [0.0] 我々は、精神状態検査から簡潔な要約を生成するために、いくつかの最先端の大規模言語モデル(LLM)を評価した。
確立されたROUGEメトリクスと人間評価器からの入力を用いて、要約生成のための4つの異なるモデルを厳格に評価する。
我々の最高性能の微調整モデルは既存のモデルより優れており、ROUGE-1とROUGE-Lはそれぞれ0.810と0.764である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:36:48 GMT)
Work fluctuation theorems with initial quantum coherence [0.0] ゆらぎ定理は、線形反応則を超えた非平衡熱力学の基本的な結果である。
作業変動定理における初期量子コヒーレンスの役割について検討する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:47:21 GMT)
Universal Time-Entanglement Trade-off in Open Quantum Systems [0.0] マルコフ開系のクラスにおいて、純粋な定常状態絡み合いと緩和時間スケールの間の驚くべき関係を示す。
このセットアップは、継続的な測定とフィードバックに基づいて、適応量子力学の幅広いクラスを補完する。
我々の研究は、動的および絡み合いがオープンシステムでどのように接続されているかに関する一般的な洞察を与え、量子貯水池工学に特に関係している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:47:52 GMT)
The thermodynamics of the quantum Mpemba effect [0.0] エネルギー固有基底において、状態が対角状態に変換された場合、指数的な平衡へのスピードアップが常に起こることを示す。
変換状態がより高い非平衡自由エネルギーを持つとき、熱力学的推論を用いて、これはテクスチゲヌイン量子Mpemba効果であると主張する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:08:36 GMT)
Synthesis of Annotated Colorectal Cancer Tissue Images from Gland Layout [0.0] 合成生成された画像とアノテーションは、この領域におけるアルゴリズムのトレーニングと評価に有用である。
そこで本研究では, 腺構造レイアウトから, 対応する腺マスクを用いて, リアルな大腸癌組織像を生成するインタラクティブなフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 22:51:42 GMT)
Stronger Speed Limit for Observables: Tight bound for Capacity of Entanglement, Modular Hamiltonian and Charging of Quantum Battery [0.0] 観測可能な速度の限界は、観測可能な速度の限界と呼ばれる。
観測可能な速度限界のより強いバージョンを証明し、得られた境界が新しい境界の特別な場合であることを示す。
我々の発見は、量子熱力学、演算子成長の複雑さ、量子相関成長の時間速度と量子技術において重要な応用を持つことができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 07:06:09 GMT)
Spectral stability of V2 centres in sub-micron 4H-SiC membranes [0.0] 炭化ケイ素のカラーセンターは、有望な半導体量子技術プラットフォームとして出現する。
シリコン空孔中心は, サブミクロンシリコン炭化物膜に統合できることが示されている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:49:39 GMT)
Site-specific Deterministic Temperature and Humidity Forecasts with Explainable and Reliable Machine Learning [0.0] 近年の機械学習の発展により、この問題に対する新しいアプローチとしてMLを適用することへの関心が高まっている。
我々は'Multi-SiteBoost'という名前のワーキングMLフレームワークを開発し、初期テストの結果はバイアス補正NWPモデルのグリッド値と比較して大幅に改善された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:12:13 GMT)
Simultaneous Discovery of Quantum Error Correction Codes and Encoders with a Noise-Aware Reinforcement Learning Agent [0.0] 本研究は,QECコード発見における強化学習の能力を大幅に拡張するものである。
本稿では,所定のゲートセットに対して,QEC符号と符号化回路の両方を自動的に検出するRLエージェントを訓練する。
本稿では,様々なノイズモデルのための符号化戦略を同時に生成することを学ぶ,ノイズ対応メタエージェントの概念を紹介する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:10:38 GMT)
Shareability of Quantum Correlations in a Many-Body Spin System with Two- and Three-Body Interactions [0.0] マルチパーティ量子スピン系における量子相関の共有性を特徴付ける。
このシステムにおけるモノガミースコアは、モノガミー特性と非モノガミー特性の両方を示す。
非一夫一婦制状態が一夫一婦制となる量子相関測度の積分力を同定する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:44:43 GMT)
Separability criterion using one observable for special states: Entanglement detection via quantum quench [0.0] 単に$textitone$ basisで接続相関を測定するだけで十分である状態のクラスを確立する。
保存電荷のないものを含む,様々なシステムにおける観測可能な絡み合い検出の可能性について論じる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:53:41 GMT)
Resonance energies and linewidths of Rydberg excitons in Cu$_2$O quantum wells [0.0] リドベルク励起子は、リドベルク原子の固体アナログであり、$mu$mの領域で容易に大きな大きさに達することができる。
結晶における量子井戸のような構造の形成は、量子閉じ込め効果をもたらす。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:53:18 GMT)
R5Detect: Detecting Control-Flow Attacks from Standard RISC-V Enclaves [0.0] R5Detectは、修正されていないRISC-V標準アーキテクチャに対する制御フロー攻撃を検出し防止するセキュリティ監視ソフトウェアである。
我々は,R5Detectを標準の低消費電力RISC-Vデバイス上で実装し,そのセキュリティ機能を最小限のハードウェアサポートで効果的に利用できることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:32:45 GMT)
Quantum querying based on multicontrolled Toffoli gates for causal Feynman loop configurations and directed acyclic graphs [0.0] マルチループFeynmanダイアグラムの因果関係を問合せするための量子アルゴリズムを提案する。
量子オラクルの構成は驚くほど、多制御トフォリゲートとXNOTゲートのみに基づいている。
これまでに検討されていない3-,4-,5-エループトポロジを明示的に解析する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:51:43 GMT)
Pymablock: an algorithm and a package for quasi-degenerate perturbation theory [0.0] 実効的なハミルトニアンと,それを実装するPythonパッケージであるPymablockを構築するアルゴリズムを導入する。
我々は、パッケージがk.pモデルの構築をどのように処理し、超伝導量子ビットを解析し、大きな強結合モデルの低エネルギースペクトルを計算するかを実証する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:00:08 GMT)
Proceedings 12th International Workshop on Theorem proving components for Educational software [0.0] ThEduシリーズは、中等教育における数学の直感的な方法から、STEM教育におけるより形式的なアプローチへのスムーズな移行を追求している。
ThEdu'23は非常に成功し、Yves Bertot(フランス、イリア)の講演で「型理論を使って数学を教えることの課題」と7つの定期的な貢献があった。
私たちのレビュアーは7件の提出を受諾し、各コントリビューションについて少なくとも3件の注意深いレポートを共同で作成しました。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:51:26 GMT)
Privacy-Enhancing Technologies for Artificial Intelligence-Enabled Systems [0.0] 人工知能(AI)モデルは、システムにプライバシーの脆弱性を導入する。
これらの脆弱性は、モデル開発、デプロイメント、推論フェーズの間に存在する。
我々は、AI対応システムを保護するために、いくつかのプライバシー強化技術(PET)の使用を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:14:40 GMT)
Integrated conversion and photodetection of virtual photons in an ultrastrongly coupled superconducting quantum circuit [0.0] 量子化モードに超強結合された人工原子の基底状態は、任意の数の仮想光子を含む。
近年, 人工原子の非従来型設計と高度なコヒーレント制御を組み合わせることで, 克服可能であることを示す実験的問題に対処している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:10:40 GMT)
Injective norm of real and complex random tensors I: From spin glasses to geometric entanglement [0.0] 量子情報において、射影ノルム(英: injective norm)は、量子状態の真の多部絡み合いの1つの重要な尺度である。
本稿では,実数および複素ガウス乱テンソルの射影ノルムに高確率上界を与える。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:49:23 GMT)
Identifying Climate Targets in National Laws and Policies using Machine Learning [0.0] 我々は,国家法や政策から気候目標の言及を抽出するアプローチを提案する。
ターゲットの3つのカテゴリ('ネットゼロ'、'リダクション'、'その他')を識別するエキスパートアノテートデータセットを作成します。
我々は、我々のモデルに関連するバイアスと株式の影響を調査し、問題のある特徴として特定の年と国名を特定する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:23:59 GMT)
From the Choi Formalism in Infinite Dimensions to Unique Decompositions of Generators of Completely Positive Dynamical Semigroups [0.0] 我々は、任意のヒルベルト空間に一意な有界作用素 $K$ と一意に正の写像 $Phi$ が存在することを証明している。
特に、上述のヒルベルト空間が無限次元となるとすぐに、チェイ形式の下で空の事前像を持つ正半定値作用素の例が見つかる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 13:04:55 GMT)
From integrability to chaos: the quantum-classical correspondence in a triple well bosonic model [0.0] ボソニック量子多体系の半古典的限界について検討する。
古典力学における規則性からカオスへの遷移は、ポアンカーのセクションを通して可視化される。
この研究は、2つ以上の井戸を持つボソニック多体系の量子古典対応を体系的に確立する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 01:46:51 GMT)
Form of Contextuality Predicting Probabilistic Equivalence between Two Sets of Three Mutually Noncommuting Observables [0.0] 相互に相補的な観測可能な2つ以上の擬似文脈の集合と結果の確率和からなる文脈量子システムを提案する。
これらの擬コンテキストはヒルベルト空間内の非直交基底を構成し、状態に依存しない確率の和を特徴とする。
このセットアップにおける測定の文脈性は、ハイパーグラフの量子化から生じ、これは確率の線形結合の特定の境界に固執する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:23:24 GMT)
Few-shot point cloud reconstruction and denoising via learned Guassian splats renderings and fine-tuned diffusion features [0.0] 本稿では,少数の画像から点雲を再構成し,そのレンダリングから点雲を識別する手法を提案する。
制約条件下での再構成を改善するため,ハイブリッド表面と外観の相違点のトレーニングを規則化する。
これらの学習したフィルタを使って、3Dの監督なしに来る点雲ノイズを除去する方法を実証する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:31:05 GMT)
Faster and shorter synthesis of Hamiltonian simulation circuits [0.0] 本稿では,現在最先端のエンタングゲートと比較して,最大4倍の深さ低下を示すベンチマーク結果を示す。
また、これらを合成・再合成することで、汎用量子回路の最適化に利用できることを示す。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:07:22 GMT)
Entanglement Classification via Single Entanglement Measure [0.0] そこで本研究では,古典通信を用いたローカル操作下での一般的な$n$-qubit状態間の等価性を検証するのに,単一の絡み合い尺度が十分であることを示す。
無限反復手順をバイパスする 4-qubit 状態の正規形式を求める手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:58:23 GMT)
Dynamical heterogeneity and large deviations in the open quantum East glass model from tensor networks [0.0] 数値テンソルネットワークを用いた散逸量子東モデルの非平衡ダイナミクスについて検討する。
我々は行列積状態を用いて、正確な対角化にアクセスできるものを超える大きさの量子ジャンプなき大きさの進化を表現する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:41:18 GMT)
Direct interpolative construction of the discrete Fourier transform as a matrix product operator [0.0] 補間分解を用いたQFT MPOの簡単な閉形式構成を提案する。
この構成は、量子回路シミュレーションとQTTアプリケーションにおいて、それぞれQFTとDFTの適用を高速化することができる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 03:42:17 GMT)
Diagnosing non-Hermitian Many-Body Localization and Quantum Chaos via Singular Value Decomposition [0.0] 相互作用する量子スピン鎖の強い局所障害は、非局在化された固有モードを局所化された固有状態に変換する。
これは、非局在化相はカオスであり、局所化相は可積分である。
我々は、ランダムな散逸(ランダムな乱れなしで)が、他の可積分系においてカオス的あるいは局所的な振る舞いを誘発するかどうかを問う。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:57:52 GMT)
Design and Development of a Framework For Stroke-Based Handwritten Gujarati Font Generation [0.0] 本稿では,手書き文字のバリエーションを模倣して,手書きフォントをグジャラート文字で生成するための枠組みを設計することを目的とする。
学習段階では、Gujaratiスクリプトを解析し、各文字を設計するためのルールを定式化する。
生成フェーズでは、ユーザは文字の小さなサブセットを提供し、システムは残りの文字グリフを自動的に生成する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:04:00 GMT)
Demonstration of logical qubits and repeated error correction with better-than-physical error rates [0.0] 我々は,フォールトトレラント符号化と誤り訂正を用いて,物理誤差率以下のレベルまで論理誤差率を抑えることができる,トラップイオンQCCDプロセッサの実験を行った。
結果は、ノイズの多い中間スケールの量子コンピューティングから信頼性のある量子コンピューティングへの重要な移行を示している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:43:25 GMT)
Deep Learning in Cardiology [0.0] 医療分野は、医師が解読し、効率的に使用できない大量のデータを作成している。
ディープラーニングは、幅広い医療問題において、より正確で効果的な技術として登場した。
ディープラーニング(Deep Learning)は、データを非線形に変換するレイヤで構成される表現学習手法である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 11:34:52 GMT)
Data Science for Geographic Information Systems [0.0] データサイエンスを地理情報システムに統合することで、これらのツールの完全な空間分析プラットフォームへの進化が促進された。
機械学習とビッグデータ技術の採用により、これらのプラットフォームはますます複雑なデータを扱う能力を備えてきた。
この研究は、研究分野としてのデータサイエンスとGISの歴史的・技術的進化を辿り、ドメイン間の収束の要点を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:50:58 GMT)
Contextuality with vanishing coherence and maximal robustness to dephasing [0.0] 文脈性は、任意量の部分的に強調される雑音に対して頑健であることを示す。
これは、文脈性を破壊するのに常に十分である部分偏極ノイズとは対照的である。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 09:52:04 GMT)
Compensatory Biases Under Cognitive Load: Reducing Selection Bias in Large Language Models [0.0] 大規模言語モデル(LLM)は意味に基づくタスクの解釈と実行に役立っている。
本研究は、これらのバイアスを批判的に検討し、代表リスト選択タスクへの影響を定量化する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 19:54:07 GMT)
Collective coupling of driven multilevel atoms and its effect on four-wave mixing [0.0] 多レベル原子に基づく顕微鏡モデルは、非線形光学応答と光のコヒーレント制御の中心となる。
電磁環境に結合した多層原子からなる駆動系における協調効果の系統的解析を行った。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:36:24 GMT)
Classification of Nasopharyngeal Cases using DenseNet Deep Learning Architecture [0.0] 鼻咽頭癌(Nasopharyngeal carcinoma, NPC)は, 東南アジアで最多の死亡例である。
NPCは、初期無症候性であるため、診断が遅くなることが多い。
本論文は,NPC,NPI,正常症例の違いを特定するための最初の取り組みである。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 04:16:31 GMT)
Classical analogue of quantum superdense coding and communication advantage of a single quantum system [0.0] 古典的共有ランダム性の助けのないキュービット通信は,その目的を達成することができることを示す。
また、対称多角形状態空間によって記述された古典的でない玩具類の通信ユーティリティについても検討する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:58:31 GMT)
CONFLARE: CONFormal LArge language model REtrieval [0.0] Retrieval-augmented Generation (RAG)フレームワークは、大規模言語モデル(LLM)が知識ベースから関連する情報を検索し、応答を生成するコンテキストに組み込むことを可能にする。
RAGは、検索が必要な情報を応答生成のコンテキストとして識別できない場合、有効な応答を保証しない。
本稿では,RAGフレームワークにおける検索不確実性を定量化するために,共形予測を適用するための4段階のフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 02:58:21 GMT)
CARLOS: An Open, Modular, and Scalable Simulation Framework for the Development and Testing of Software for C-ITS [0.0] CARLOS - C-ITSにおけるソフトウェアの開発とテストのためのオープンでモジュール化されたスケーラブルなシミュレーションフレームワークを提案する。
このフレームワークの中核となるビルディングブロックを提供し、コミュニティによってどのように利用され、拡張されるかを説明します。
本稿では、重要な設計原則を説明し、3つの主要なユースケースを示すことによって、アーキテクチャのモチベーションを高める。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:20:23 GMT)
Böttcher-Wenzel inequality for weighted Frobenius norms and its application to quantum physics [0.0] 有名な B'ottcher-Wenzel (BW) の不等式を自然に一般化する。
本稿では,ケース (iii) と (v) のタイトバウンドを確立し,ケース (i) と (ii) のタイトバウンドに関する予想を提案する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 00:54:16 GMT)
Benchmarking Parameter Control Methods in Differential Evolution for Mixed-Integer Black-Box Optimization [0.0] 微分進化(DE)は一般に、スケール係数とクロスオーバー率のパラメータ制御法(PCM)を必要とする。
本稿では,混合整数ブラックボックス最適化ベンチマーク(bbob-mixint)スイート上で,DECのPCMをベンチマークする。
SHADEのPCMは数値ブラックボックス最適化の最先端技術であるが, 混合整数ブラックボックス最適化の性能は低かった。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 08:54:15 GMT)
As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli [0.0] 合成メディアによる誤解に対する主な防御は、人間の観察者が実物と偽物とを視覚的に聴覚的に識別する能力に依存する。
被験者1276名を対象に, 合成画像, 音声のみ, ビデオのみ, 映像のみ, 音声視覚刺激を正当性から識別する能力について検討した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 14:51:56 GMT)
Approximate Bayesian Computation As An Informed Fuzzing-Inference System [0.0] ファズテストの力は、ソフトウェアアプリケーションの予期せぬ振る舞いや脆弱性を引き起こすインプットの生成と実行を無作為に、しばしば残酷な力で行います。
無限に可能な入力シーケンスの現実を考えると、全てのテストの組み合わせを追求することは計算に高価であるだけでなく、事実上不可能である。
ABCはこの問題に対処するための新しい確率論的アプローチを表している。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 22:41:49 GMT)
Analyzing Musical Characteristics of National Anthems in Relation to Global Indices [0.0] 国歌音楽データを分析し、特定の音楽特性が平和、幸福、自殺率、犯罪率などと関連しているかどうかを判定する。
以上の結果から,国歌の楽曲的特徴と,調査対象の指標との間には相関があることが示唆された。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:25:31 GMT)
Analysing heterogeneity in Alzheimer Disease using multimodal normative modelling on ATN biomarkers [0.0] アルツハイマー病(英語: Alzheimer Disease, AD)は、多面性疾患の一種で、ADの特異な相補的な情報を提供する。
本研究では,ATN(アミロイド・タウ・ニューロジェネレーション)バイオマーカーの局所脳パターンの不均一性を評価するために,深層学習型ニューロイメージングに基づく規範モデルを用いた。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 06:06:26 GMT)
AI and the Problem of Knowledge Collapse [0.0] 特定の知識モードへのアクセスコストを削減することにより、AIが公衆の理解をパラドックス的に損なう可能性のある条件を特定する。
学習者やイノベーターのコミュニティが従来の手法を使うか、割引されたAI支援プロセスに頼るというシンプルなモデルを提供する。
我々のデフォルトモデルでは、AI生成コンテンツに対する20%の割引は、ディスカウントがない場合よりも真実から2.3倍の信条を生成する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:06:23 GMT)
A quantum Pascal pyramid and an extended de Moivre-Laplace theorem [0.0] 我々は「量子パスカルピラミッド」をパスカルの三角形の一般化として記述する。
de Moivre-Laplace定理の拡張は、量子パスカルピラミッドの$q$thカラムに適用される。
量子パスカルピラミッドの最初の2つの列を用いて、S_z$$I_N S$スピン系におけるS_z$偏光転移の既知上界を計算する運動が示される。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 16:15:44 GMT)
A new indeterminacy-based quantum theory [0.0] 環境決定性に基づく、あるいはEnD量子理論(EnDQT)と呼ぶ新しい量子論(解釈)を提案する。
よく知られた量子論とは対照的に、EnDQTは隠れ変数を追加しないという利点がある。
EnDQTは、量子論の他の解釈と区別する可能性のある、一連の新しい経験的ポジットを提供する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 17:58:12 GMT)
A QAOA approach with fake devices: A case study for the maximum cut in ring graphs [0.0] 我々は、クラウドで自由に利用できるフェイクデバイスとして知られる量子デバイスのエラーマップを評価した。
近似比,期待エネルギーおよびこの問題の成功確率を評価した。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 15:05:50 GMT)
3D scene generation from scene graphs and self-attention [0.0] 本稿では,シーングラフとフロアプランから3次元シーンを合成する条件付き変分オートエンコーダ(cVAE)モデルを提案する。
我々は、シーン内のオブジェクト間の高レベルな関係をキャプチャするために、自己注意層の特性を利用する。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 18:29:00 GMT)
(Re)Construction of Quantum Space-Time: Transcribing Hilbert Into Configuration Space [0.0] 量子力学における時空はヒルベルトと構成空間をブリッジすることである。
ニュートン時空劇場を、おそらく高次元ヒルベルト空間の像に置き換えることで、新たな視点が得られる。
論文参考訳(メタデータ) (Thu, 4 Apr 2024 10:30:49 GMT)