DeepEdit: Knowledge Editing as Decoding with Constraints [118.8] 多段階推論における知識の編集は、大規模言語モデル(LLM)の知識編集(KE)において大きな課題となっている。
我々は、深度優先探索により新しい知識を持つコヒーレント推論チェーンを生成するLLMの能力を高める新しいKEフレームワークDEEPEDITを提案する。
DEEPEDITに加えて, MQUAKE-2002 と MQUAKE-HARD という2つの新しい KE ベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:53:54 GMT)
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model [118.1] We present DeepSeek-V2, a strong Mixture-of-Experts (MoE) language model characterized by economical training and efficient inference。
DeepSeek-V2は、MLA(Multi-head Latent Attention)やDeepSeekMoEといった革新的なアーキテクチャを採用している。
DeepSeek-V2はDeepSeek 67Bと比較して大幅に性能が向上し、トレーニングコストは42.5%削減された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:04:17 GMT)
Hydra-MDP: End-to-end Multimodal Planning with Multi-target Hydra-Distillation [115.6] 教師-学生モデルに複数の教師を取り入れた新しいパラダイムであるHydra-MDPを提案する。
このアプローチは、学生モデルを訓練するために、人間とルールベースの教師の両方からの知識蒸留を利用する。
ルールベースの教師の知識により、Hydra-MDPは、非微分不可能な後処理に頼るのではなく、エンド・ツー・エンドの方法で環境がプランニングにどのように影響するかを学ぶ。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:24:43 GMT)
ARDuP: Active Region Video Diffusion for Universal Policies [114.4] 我々は,ビデオベースのポリシー学習のための新しいフレームワークである,ユニバーサルポリシーのためのActive Region Video Diffusion(ARDuP)を紹介する。
ARDuPは、活動領域、すなわち潜在的な相互作用領域の生成を強調し、条件付きポリシーの対話領域へのフォーカスを高めている。
シミュレータCLIPortと実世界のデータセットBridgeData v2の広範な実験を通じてARDuPの有効性を検証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:42:02 GMT)
VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.6] V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。
Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。
6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:09:16 GMT)
GenAI-Bench: Evaluating and Improving Compositional Text-to-Visual Generation [103.3] VQAScoreは、VQAモデルが画像がプロンプトを正確に描写しているとみなす可能性を測定するメトリクスである。
VQAScoreによるランク付けは、PickScore、HPSv2、ImageRewardなどの他のスコアリング方法よりも2倍から3倍効果的である。
我々は、同じプロンプトから生成されたランキング画像のメトリクスを評価するために、4万以上の人間格付けを備えた新しいGenAI-Rankベンチマークをリリースする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:00:07 GMT)
Synchronous Faithfulness Monitoring for Trustworthy Retrieval-Augmented Generation [96.8] Retrieval-augmented Language Model (RALMs) は、知識集約型タスクにおいて、高い性能と幅広い適用性を示している。
本稿では,非偽文の検出に微細な復号力学を利用する軽量モニタであるSynCheckを提案する。
また、長文検索拡張生成のためのビームサーチによって導かれる忠実度指向の復号アルゴリズムであるFODを導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:42:57 GMT)
Representing Noisy Image Without Denoising [91.7] ラドン空間におけるフラクショナルオーダーモーメント(FMR)は、ノイズの多い画像から直接ロバストな表現を引き出すように設計されている。
従来の整数順序法とは異なり、我々の研究は特別な場合のような古典的手法を取り入れたより汎用的な設計である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:54:15 GMT)
CoAct: A Global-Local Hierarchy for Autonomous Agent Collaboration [87.5] 既存のLLMは、様々なNLPタスクで顕著なパフォーマンスを示すが、それでも複雑な現実世界タスクに苦戦している。
本稿では,人間社会における階層的計画と協調のパターンをLLMシステムに伝達するCoActフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:23:53 GMT)
Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate [85.3] 複数のエージェントが"tit for tat"の状態で議論を表現するマルチエージェント議論(MAD)フレームワークを提案し、審査員が議論プロセスを管理して最終解を得る。
我々のフレームワークは、深い熟考を必要とするタスクに役立ちそうなLSMにおける散発的思考を奨励する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:35:12 GMT)
MoDA: Modeling Deformable 3D Objects from Casual Videos [84.3] 神経二元四元系ブレンドスキンニング(NeuDBS)を提案し,スキンを折り畳むことなく3次元点変形を実現する。
異なるフレーム間で2Dピクセルを登録する試みにおいて、標準空間内の3D点を符号化する標準特徴埋め込みの対応性を確立する。
本手法は,ヒトと動物の3Dモデルを,最先端の手法よりも質的,定量的な性能で再構築することができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:24:30 GMT)
Jack of All Tasks, Master of Many: Designing General-purpose Coarse-to-Fine Vision-Language Model [83.9] VistaLLMは、粗くきめ細かな視覚言語タスクに対処する視覚システムである。
2値分割マスクをシーケンスとして表現するために、勾配対応の適応サンプリング技術を採用している。
また、新しいタスクであるAttCoSegを導入し、複数の入力画像に対してモデルの推論とグラウンド化能力を高める。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:20:40 GMT)
Beyond Natural Language: LLMs Leveraging Alternative Formats for Enhanced Reasoning and Communication [79.8] 自然言語(NL)は長年、人間の認知とコミュニケーションの主要なフォーマットであった。
本研究では,異なる文脈における非NLフォーマットの有用性を検討することで,NLのデフォルト利用に挑戦する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:42:22 GMT)
FinBen: A Holistic Financial Benchmark for Large Language Models [75.1] FinBenは、24の財務タスクにまたがる36のデータセットを含む、最初の大規模なオープンソース評価ベンチマークである。
FinBenは、幅広いタスクとデータセット、ストックトレーディングの最初の評価、新しいエージェントと検索可能な生成(RAG)の評価、およびテキスト要約、質問応答、株式トレーディングのための3つの新しいオープンソース評価データセットを提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:38:56 GMT)
StableToolBench: Towards Stable Large-Scale Benchmarking on Tool Learning of Large Language Models [74.9] ToolBenchから進化したベンチマークであるStableToolBenchを紹介します。
仮想APIサーバには、キャッシングシステムとAPIシミュレータが含まれており、APIステータスの変更を緩和するための補完となる。
安定評価システムは、GPT-4を自動評価器として使用し、評価中のランダム性を排除し、解決可能なパスと勝利率を設計する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:59:08 GMT)
The Real Price of Bandit Information in Multiclass Classification [73.2] バンディットフィードバックを用いた複数クラス分類の古典的問題を再考する。
我々は, 後悔すべき$smashwidetildeO(|H|+sqrtT)$を保証する新しい帯域分類アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:20:04 GMT)
Adaptable Logical Control for Large Language Models [68.3] Ctrl-Gは、推論時にモデル生成のトラクタブルでフレキシブルな制御を容易にする適応可能なフレームワークである。
TULU2-7Bモデルに適用したCtrl-Gは、インタラクティブテキスト編集のタスクにおいて、GPT3.5とGPT4より優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:47:59 GMT)
Simultaneous Map and Object Reconstruction [66.7] 本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。
我々は、最近の新しいビュー合成法から着想を得て、大域的な最適化として再構築問題を提起する。
連続動作の慎重なモデリングにより, 回転するLiDARセンサの回転シャッター効果を補うことができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:53:31 GMT)
Empowering Tuberculosis Screening with Explainable Self-Supervised Deep Neural Networks [66.6] 結核は、特に資源に制限された人口や遠隔地において、世界的な健康危機として存続している。
本研究では,結核症例検診に適した自己指導型自己学習ネットワークを提案する。
ネットワーク全体の精度は98.14%で、それぞれ95.72%と99.44%という高いリコール率と精度を示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:10:06 GMT)
Cardiac Copilot: Automatic Probe Guidance for Echocardiography with World Model [66.4] 心臓の複雑な構造と重要な手術上の課題のため、経験豊富なソノグラフィーが不足している。
本稿では,リアルタイムなプローブ移動誘導が可能なCardiac Copilotシステムを提案する。
中心となるイノベーションは、心臓の空間構造を表現するためのデータ駆動の世界モデル、Cardiac Dreamerの提案である。
実世界の超音波データとそれに対応するプローブの動きを,3人のソノグラフィーによる151Kサンプル対を用いた110の定期的な臨床スキャンからトレーニングする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:42:29 GMT)
4K4DGen: Panoramic 4D Generation at 4K Resolution [66.3] 本研究では,360度画像に一貫したアニメーション化を実現するために,汎用的な2次元拡散に適応するパノラマデノイザを提案する。
高品質なパノラマから4D生成を(4096$times$2048)初めて達成しました。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:11:02 GMT)
BPO: Supercharging Online Preference Learning by Adhering to the Proximity of Behavior LLM [64.4] 選好からの直接アライメント(DAP)は、事前コンパイルされたオフライン選好データセットからヒトデシダラタに大型言語モデル(LLM)をアライメントするための有望なパラダイムとして登場した。
オンライントレーニングのパワーをフル活用するために、特定のオンラインDAPアルゴリズムを開発する必要性を強調します。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:25:27 GMT)
Deciphering RNA Secondary Structure Prediction: A Probabilistic K-Rook Matching Perspective [63.4] RFoldは、与えられたシーケンスから最もよく一致するK-Rook解を予測する方法である。
RFoldは、最先端のアプローチよりも競争性能とおよそ8倍の推論効率を達成する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:08:23 GMT)
RLHFPoison: Reward Poisoning Attack for Reinforcement Learning with Human Feedback in Large Language Models [62.7] Reinforcement Learning with Human Feedback (RLHF) は、Large Language Models (LLM) を人間の好みに合わせるために設計された方法論である。
その利点にもかかわらず、RLHFはテキストのランク付けに人間のアノテーションに依存している。
そこで我々は,ある悪意ある行動に到達するために,候補の選好ランク選択に対する中毒攻撃手法であるRancPoisonを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:40:07 GMT)
RobGC: Towards Robust Graph Condensation [61.3] グラフニューラルネットワーク(GNN)は、グラフ表現学習の目覚ましい能力によって広く注目を集めている。
しかし,大規模グラフの普及は,その計算要求により,GNNトレーニングにとって大きな課題となる。
本稿では,GNNを効率よく学習し,性能を保ちつつ,情報的コンパクトなグラフを生成するために,GC(Graph Condensation)を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:14:57 GMT)
Surgical Triplet Recognition via Diffusion Model [60.8] 外科的三重項認識は、次世代のコンテキスト対応手術室を実現するために必要不可欠なビルディングブロックである。
拡散モデルを用いた外科的三重項認識のための新しい生成フレームワークであるDifftを提案する。
CholecT45とColecT50データセットの実験は、手術用三重項認識のための新しい最先端性能を達成する上で、提案手法の優位性を示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:43:41 GMT)
Joint vs Sequential Speaker-Role Detection and Automatic Speech Recognition for Air-traffic Control [60.4] 本稿では,標準のASRアーキテクチャを頼りながら,両タスクを協調的に解決するトランスフォーマーベースのジョイントASR-SRDシステムを提案する。
複数のATCデータセット上でのASRとSRDの2つのケースドアプローチとの比較を行った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:11:01 GMT)
You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.3] 擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:58:40 GMT)
WikiContradict: A Benchmark for Evaluating LLMs on Real-World Knowledge Conflicts from Wikipedia [60.0] Retrieval-augmented Generation (RAG) は,大規模言語モデル(LLM)の限界を緩和する,有望なソリューションとして登場した。
本研究では,ウィキペディアからの矛盾文に基づく質問に対するLLM生成回答の総合評価を行う。
我々は、単一のパスを持つRAGと2つの矛盾するパスを持つRAGを含む、様々なQAシナリオ下で、クローズドおよびオープンソース両方のLSMをベンチマークする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:13:42 GMT)
Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.9] Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。
2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。
本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:47:25 GMT)
High-Fidelity Facial Albedo Estimation via Texture Quantization [59.1] 得られたアルベドデータを必要とせずに、単一の画像から直接アルベドマップを復元するHiFiAlbedoを提案する。
本手法は優れた一般化性を示し,眼内アルベド回復のための高忠実度化を実現することができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:53:30 GMT)
The Male CEO and the Female Assistant: Gender Biases in Text-To-Image Generation of Dual Subjects [58.3] 本稿では,T2Iモデルを二重オブジェクト生成設定で体系的に評価するPaired Stereotype Test (PST) フレームワークを提案する。
PSTは、二重オブジェクト生成タスク、すなわち、同じイメージで2人を生成するタスクである。
DALLE-3は、一見公平で反ステレオタイプな単体画像でも、PST下では顕著な偏見を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:23:44 GMT)
Knowledge Graph-Enhanced Large Language Models via Path Selection [58.2] 大規模言語モデル(LLM)は、様々な現実世界のアプリケーションで前例のない性能を示している。
LLMは実際に不正確な出力、すなわち幻覚の問題を発生させることが知られている。
上記の問題に対処する3段階の原理的フレームワークKELPを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:45:20 GMT)
LongBench: A Bilingual, Multitask Benchmark for Long Context Understanding [58.2] LongBenchは、コンテキスト理解のための最初のバイリンガルでマルチタスクのベンチマークである。
英語と中国語の6つのタスクカテゴリにまたがる21のデータセットで構成され、平均的な長さは6,711語(英語)と13,386文字(中国語)である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:00:32 GMT)
Joint Demonstration and Preference Learning Improves Policy Alignment with Human Feedback [58.0] 我々は、報酬モデルとポリシーをトレーニングするために、AIHF(Alignment with Integrated Human Feedback)と呼ばれる単一ステージアプローチを開発する。
提案した手法は、一般的なアライメントアルゴリズムに容易に還元し、活用できる、効率的なアルゴリズムの集合を認めている。
本研究では,LLMにおけるアライメント問題と,MuJoCoにおけるロボット制御問題を含む広範な実験により,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:04:23 GMT)
Part-aware Unified Representation of Language and Skeleton for Zero-shot Action Recognition [58.0] 本稿では,PURLS(Part-aware Unified Representation between Language and Skeleton)を紹介する。
本手法はスケルトン/言語のバックボーンと3つの大規模データセットを用いて評価する。
その結果、PURLSの普遍性と優れた性能を示し、以前のスケルトンベースのソリューションと他のドメインからの標準ベースラインを上回った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:22:32 GMT)
von Mises Quasi-Processes for Bayesian Circular Regression [57.9] 円値ランダム関数上の表現的および解釈可能な分布の族を探索する。
結果の確率モデルは、統計物理学における連続スピンモデルと関係を持つ。
後続推論のために、高速マルコフ連鎖モンテカルロサンプリングに寄与するストラトノビッチのような拡張を導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:57:21 GMT)
Fooling Polarization-based Vision using Locally Controllable Polarizing Projection [55.4] 我々は、RGBベースのビジョンよりも深刻な偏光ベースのビジョンの脆弱性のコミュニティに警告する。
商用LCDプロジェクタに適応することにより、局所的に制御可能な偏光投影を実現し、最先端の偏光に基づく視覚アルゴリズムにうまく活用する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:36:22 GMT)
Can Long-Context Language Models Subsume Retrieval, RAG, SQL, and More? [54.7] 長文言語モデル(LCLM)は、従来、検索システムやデータベースといった外部ツールに依存していたタスクへのアプローチに革命をもたらす可能性がある。
実世界のタスクのベンチマークであるLOFTを導入し、文脈内検索と推論においてLCLMの性能を評価するために設計された数百万のトークンを出力する。
以上の結果からLCLMは,これらのタスクを明示的に訓練したことがないにも関わらず,最先端の検索システムやRAGシステムと競合する驚くべき能力を示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:28:58 GMT)
Style-NeRF2NeRF: 3D Style Transfer From Style-Aligned Multi-View Images [54.6] 本稿では,3次元シーンをスタイリングするための簡易かつ効果的なパイプラインを提案する。
我々は、スタイル整列画像-画像拡散モデルにより生成されたスタイリング画像を用いて、ソースNeRFモデルを精細化し、3Dスタイルの転送を行う。
本手法は,現実の3Dシーンに多彩な芸術的スタイルを,競争力のある品質で伝達できることを実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:36:18 GMT)
Reinforcing Pre-trained Models Using Counterfactual Images [54.3] 本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:07:14 GMT)
Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models [54.1] トレーニングデータを自動的に生成する最初のスケーラブルで信頼性の高いAutoIFを導入する。
AutoIFは命令追従データ品質の検証をコード検証に変換する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:29:53 GMT)
An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance [54.0] われわれは、画像の翻訳を文化的に意味のあるものにするための第一歩を踏み出した。
タスクを行うために、最先端の生成モデルからなる3つのパイプラインを構築します。
我々は,翻訳画像の人間による評価を行い,文化的意義と保存の意味を評価する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:07:19 GMT)
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation [53.7] 我々は適応的包摂トークンを学習し、最終的な生成出力の属性分布をシフトする。
本手法では,明示的な属性仕様やバイアス分布の事前知識は必要としない。
提案手法は,特定の属性を要求されたり,生成の方向を編集するモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:28:33 GMT)
Extrinsic Evaluation of Cultural Competence in Large Language Models [53.6] 本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:18:56 GMT)
Retrieval-Augmented Egocentric Video Captioning [53.3] EgoInstructor(エゴインストラクタ)は、意味的に関連する第三者の指導ビデオを自動的に検索する、検索拡張マルチモーダルキャプションモデルである。
我々は、エゴセントリックでエゴセントリックなビデオ機能を引き出す新しいEgoExoNCE損失でクロスビュー検索モジュールをトレーニングし、同様のアクションを記述した共有テキスト機能にアライメントすることで、より近づいた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:20:06 GMT)
Through the Theory of Mind's Eye: Reading Minds with Multimodal Video Large Language Models [52.9] ビデオとテキストを用いたマルチモーダルToM推論のためのパイプラインを開発する。
また、ToM質問に応答するキーフレームを検索することで、明示的なToM推論を可能にする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:24:31 GMT)
A Primal-Dual Framework for Transformers and Neural Networks [52.8] 自己注意は、シーケンスモデリングタスクにおけるトランスフォーマーの顕著な成功の鍵である。
自己アテンションは、支持ベクトル回帰問題から導かれる支持ベクトル展開に対応することを示す。
Batch Normalized Attention (Attention-BN) と Scaled Head (Attention-SH) の2つの新しい注意点を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:11:22 GMT)
Direct Evaluation of Chain-of-Thought in Multi-hop Reasoning with Knowledge Graphs [52.4] 大規模言語モデル(LLM)は、回答とともにチェーン・オブ・シントの説明を生成するよう促されたとき、強い推論能力を示す。
本稿では,LLMの推論知識と生成したCoTの精度を評価するために,新しい識別的・生成的CoT評価パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:14:05 GMT)
Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.6] 第6世代(6G)ネットワークは、従来のRISの限界を克服するために、再構成可能なインテリジェントサーフェス(STAR-RIS)を同時に送信および反射する。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を示す。
屋内通信に複数のアクセスポイント(AP)とSTAR-RISを利用する新しいネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:17:04 GMT)
Multi-Hop Table Retrieval for Open-Domain Text-to-SQL [51.5] 我々はリライトとビームサーチによるマルチホップテーブル検索を提案する(Murre)。
我々はSpiderUnionとBirdUnion+の実験を行い、6.38%の平均的な改善で新しい最先端の結果を得た。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:19:16 GMT)
Improving Demonstration Diversity by Human-Free Fusing for Text-to-SQL [51.5] 本稿では,テキスト・ツー・ダイバーシティ研究における実証の多様性を計測し,改善する方法について論じる。
我々は,高多様性のデモンストレーションプールを構築するために,デモ(Fused)のために反復的に融合することを提案する。
本手法は,複数の主流データセットにラベルを付けることなく,平均3.2%と5.0%の改善を実現する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:02:23 GMT)
Few-shot Knowledge Graph Relational Reasoning via Subgraph Adaptation [51.5] Few-shot Knowledge Graph (KG) Reasoningは、KGにおける稀な関係に対して、目に見えない三つ子(すなわちクエリ三つ子)を予測することを目的としている。
本稿では,種々のサブグラフに文脈化グラフの情報を効果的に適応させる手法であるSAFER(Subgraph Adaptation for Few-shot Reasoning)を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:40:35 GMT)
Debatrix: Multi-dimensional Debate Judge with Iterative Chronological Analysis Based on LLM [51.4] Debatrixは、Large Language Models (LLMs)に基づく自動ディスカッションジャッジである。
実世界の議論シナリオに合わせるため、私たちはPanelBenchベンチマークを導入し、システムの性能と実際の議論結果を比較した。
以上の結果から,LSMを直接使用して議論評価を行ない,顕著な改善が見られた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:39:42 GMT)
A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.8] グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:30:08 GMT)
MC-MKE: A Fine-Grained Multimodal Knowledge Editing Benchmark Emphasizing Modality Consistency [50.4] MLLM(Multimodal large language model)は、非現実的または時代遅れの知識問題を引き起こす。
マルチモーダルな知識を視覚的およびテキスト的構成要素に分解する。
本稿では,マルチモーダル知識編集ベンチマークMC-MKEを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:15:21 GMT)
Stock Volume Forecasting with Advanced Information by Conditional Variational Auto-Encoder [50.0] 本研究では,短時間・長期の予測作業において,日当たりのストックボリューム時系列の予測を改善するために,条件変動(CVAE)を用いることを実証する。
CVAEは非線形時系列をサンプル外予測として生成し、精度が向上し、実際のデータとの相関関係がより緊密になる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:13:06 GMT)
Adiabatic versus instantaneous transitions from a harmonic oscillator to an inverted oscillator [49.2] 周波数が初期値に戻ると平均エネルギーが増加し、インクリメント係数は周波数交差ゼロのパワー則の指数によって決定される。
周波数が虚数になった場合、平均エネルギーの絶対値は、断熱状態においても指数関数的に増加する。
単純な断熱近似式(英語版)の先行項に対する小さな補正は、運動の不安定な性質のため、この場合非常に重要である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:26:40 GMT)
Global Human-guided Counterfactual Explanations for Molecular Properties via Reinforcement Learning [49.1] 我々は分子特性予測のための新しいグローバルな説明モデルRLHEXを開発した。
反事実的な説明と人間の定義した原則を一致させ、説明をより解釈しやすくし、専門家が容易に評価できるようにする。
RLHEXによるグローバルな説明は、より多くの4.12%の入力グラフをカバーし、3つの分子データセットの平均0.47%の反実的な説明セットと入力セットの間の距離を削減している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:16:40 GMT)
Recent and Upcoming Developments in Randomized Numerical Linear Algebra for Machine Learning [49.1] RandNLA (Randomized Numerical Linear Algebra) は、ランダムネスを用いてユビキタス行列問題に対する改良アルゴリズムを開発する分野である。
この記事では、これらの開発状況を踏まえた自己完結したRandNLAの概要を紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:43:48 GMT)
Boosting Consistency in Dual Training for Long-Tailed Semi-Supervised Learning [49.1] Long-tailed semi-supervised learning (LTSSL)アルゴリズムは、ラベル付きデータとラベルなしデータのクラス分布がほぼ同一であると仮定する。
未知のクラス分布からラベル付けされていないデータを効果的に活用できる新しい簡易手法を提案する。
BOATは様々な標準LTSSLベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:35:26 GMT)
Lazy Data Practices Harm Fairness Research [49.0] 本稿では,公正な機械学習データセットを包括的に分析し,不反射的手法がアルゴリズム的公正度発見の到達度と信頼性をいかに妨げているかを示す。
本分析では,(1)データと評価における特定の保護属性の表現のテクスブフラック,(2)データ前処理におけるマイノリティの広汎なテキストbf,(3)フェアネス研究の一般化を脅かすテキストbfopaqueデータ処理の3つの分野について検討した。
この研究は、公正なMLにおけるデータプラクティスの批判的な再評価の必要性を強調し、データセットのソーシングと使用の両方を改善するための指針を提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:52:16 GMT)
Splatter a Video: Video Gaussian Representation for Versatile Processing [49.0] ビデオ表現は、トラッキング、深度予測、セグメンテーション、ビュー合成、編集など、さまざまなダウンストリームタスクに不可欠である。
我々は,映像を3Dガウスに埋め込む,新しい3D表現-ビデオガウス表現を導入する。
トラッキング、一貫したビデオ深度と特徴の洗練、動きと外観の編集、立体映像生成など、多数のビデオ処理タスクで有効であることが証明されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:20:03 GMT)
In-Context Former: Lightning-fast Compressing Context for Large Language Model [48.8] 本稿では,Transformer-based large language model (LLM) の長期入力コンテキストを圧縮する手法を提案する。
我々は,単語の埋め込みから情報を集めるために,クロスアテンション機構と少数の学習可能なダイジェストトークンを使用する。
実験の結果, 圧縮時のベースライン浮動小数点演算の1/32しか必要とせず, 処理速度を68倍から112倍に向上することがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:14:55 GMT)
Knowledge Tagging System on Math Questions via LLMs with Flexible Demonstration Retriever [48.6] 大きな言語モデル(LLM)は知識タグ付けタスクを自動化するために使われる。
算数問題における知識タグ付けタスクに対するゼロショットと少数ショットの結果の強い性能を示す。
強化学習に基づくデモレトリバーの提案により,異なるサイズのLLMの潜在能力を活用できた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:30:01 GMT)
IGL-Bench: Establishing the Comprehensive Benchmark for Imbalanced Graph Learning [47.3] IGL-Benchは、不均衡グラフ学習のための包括的なベンチマークである。
ノードレベルおよびグラフレベルのタスクにおける有効性、堅牢性、効率性の観点から、最先端のIGLアルゴリズムについて検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:34:40 GMT)
Approximately Equivariant Neural Processes [47.1] ニューラルプロセスにおけるほぼ同変アーキテクチャの利用について考察する。
提案手法の有効性を, 合成および実世界のレグレッション実験で実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:17:14 GMT)
Vikhr: The Family of Open-Source Instruction-Tuned Large Language Models for Russian [46.8] Vikhrは、ロシア語のための、最先端のオープンソースインストラクションチューニング LLM である。
ヴィフフルは、適応されたトークン化剤の語彙を特徴とし、全ての重みの訓練と指導の継続を行っている。
Vikhhr は、ロシアのオープンソース LLM の新たな状態を設定するだけでなく、特定のベンチマークでプロプライエタリなクローズドソースモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:32:23 GMT)
WellDunn: On the Robustness and Explainability of Language Models and Large Language Models in Identifying Wellness Dimensions [46.6] 言語モデル (LM) は, 予後のリスクを高めることで, 臨床実践におけるモデルの有用性の十分なリトマステストにはならない, メンタルヘルスの分野で提案されている。
ウェルネス次元(WD)の同定におけるLMの妥当性と説明性に着目した評価設計を提案する。
LM/LLMの4つの驚くべき結果が明らかになった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:19:39 GMT)
QRMeM: Unleash the Length Limitation through Question then Reflection Memory Mechanism [46.4] メモリメカニズムは、長いコンテキストを管理するための柔軟なソリューションを提供する。
本稿では,二重構造メモリプールを組み込んだ新しい手法であるQRMeMを提案する。
マルチチョイス質問 (MCQ) とマルチドキュメント質問応答 (Multi-doc QA) のベンチマークによる評価では,既存手法と比較してQRMeMの性能が向上している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:46:18 GMT)
In-Context Reinforcement Learning for Variable Action Spaces [46.3] Headless-ADは、可変サイズ、セマンティックコンテンツ、順序の離散的なアクション空間に一般化することができる。
我々は、ヘッドレスADは、これまでに遭遇したことのないアクション空間に一般化する重要な能力を示すことを示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:42:56 GMT)
Computing in the Life Sciences: From Early Algorithms to Modern AI [45.7] 本稿では,生命科学におけるコンピューティングの歴史的発展を通じて,重要なマイルストーンと技術進歩を強調した。
この議論には、生物学的プロセスの計算モデルの導入、バイオインフォマティクスツールの出現、現代の生命科学研究におけるAI/MLの統合が含まれる。
科学的な大規模言語モデルやバイオAIツールなど、生命科学で使用されるAI対応ツールに注意が向けられ、その能力、限界、生物学的リスクへの影響を調べる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:54:28 GMT)
SD-Eval: A Benchmark Dataset for Spoken Dialogue Understanding Beyond Words [45.3] 音声対話理解と生成の多次元評価を目的としたベンチマークデータセットであるSD-Evalを提案する。
我々は3つの異なるモデルを実装し、SD-Evalと同様のプロセスに従ってトレーニングセットを構築する。
トレーニングセットには、1,052.72時間の音声データと724.4kの発話が含まれている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:46:29 GMT)
S-Adapter: Generalizing Vision Transformer for Face Anti-Spoofing with Statistical Tokens [45.1] Face Anti-Spoofing (FAS) は、スプーフされた顔を表示することによって、顔認識システムに侵入しようとする悪意のある試みを検出することを目的としている。
本稿では,局所的なトークンヒストグラムから局所的な識別や統計情報を収集する新しい統計適応器(S-Adapter)を提案する。
統計的トークンの一般化をさらに改善するために,新しいトークンスタイル正規化(TSR)を提案する。
提案したS-AdapterとTSRは、ゼロショットと少数ショットのクロスドメインテストの両方において、いくつかのベンチマークテストにおいて、最先端の手法よりも優れた、大きなメリットをもたらすことを示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:46:23 GMT)
Composite Concept Extraction through Backdooring [44.9] 本稿では,複合概念エクストラクタ(CoCE)と呼ばれる新しい手法を紹介する。
CoCEは従来のバックドア攻撃のテクニックを活用して、ゼロショット環境で複合概念を学習する。
異なるデータセットにわたる詳細な分析実験により、提案手法の有用性と適用性を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:02:54 GMT)
Learning Translations via Matrix Completion [44.8] 本稿では,このタスクを行列補完問題としてモデル化し,行列完了のための効果的で拡張可能なフレームワークを提案する。
この方法は多種多様なバイリンガル信号とモノリンガル信号を利用し、それぞれが不完全またはノイズである可能性がある。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:03:19 GMT)
Learning Personalized Alignment for Evaluating Open-ended Text Generation [44.6] 本稿では,人間の好みに合わせてアライメントを評価するための,解釈可能なオープンエンド評価フレームワークPerSEを提案する。
当社の13B LLaMA-2ベースのPerSEでは、ケンドール相関が15.8%増加し、ゼロショットレビュアーの精度が13.7%上昇している。
また、新しいドメインでのケンドール相関ではGPT-4を46.01%上回り、転送可能性を示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:05:12 GMT)
AlanaVLM: A Multimodal Embodied AI Foundation Model for Egocentric Video Understanding [44.4] 身体化されたAIパーソナルアシスタントは、人間と効果的に協力するために具体的理解を必要とする。
現在のビジョンランゲージモデル(VLM)は主に、エゴセントリックな体験の豊かさを無視して、第三者の視点ビデオに焦点を当てている。
本稿では、ビデオキャプションにおけるVLMのトレーニングと、エゴセントリックなビデオに特有の質問応答タスクのためのEgocentric Video Understanding dataset(EVUD)を紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:14:14 GMT)
Can Few-shot Work in Long-Context? Recycling the Context to Generate Demonstrations [44.2] In-Context Learning (ICL) の例は少ないが、長いコンテキストでLLMのパフォーマンスを向上させるための魅力的なソリューションである。
そこで本稿では,コンテキストのリサイクルにより,長時間のQAタスクの少数例を自動的に生成する手法を提案する。
長いコンテキストを持つ様々なQAデータセットにおいて、特に回答がコンテキストの中央にある場合、大幅な改善が得られます。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:28:29 GMT)
Structured Tree Alignment for Evaluation of (Speech) Constituency Parsing [43.8] 本稿では, 音声評価の問題に起因した, 区切り木間の類似度尺度STRUCT-IOUについて述べる。
パラメータを計算するために,音声領域に強制アライメントを施して接地構文解析木を投影し,予測された接地構造成分と予測された成分を一定の制約下で整列させ,すべての整列構成ペアの平均IOUスコアを算出する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:33:17 GMT)
How effective is Multi-source pivoting for Translation of Low Resource Indian Languages? [43.4] 本稿では、ソース文とピボット文の両方を用いて、ピボットを用いた「複数ソース翻訳」アプローチについて検討する。
これまでの主張とは対照的に、マルチソースのピボットは最先端よりも限界的な改善をもたらすことが分かっています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:31:52 GMT)
Unfolding ADMM for Enhanced Subspace Clustering of Hyperspectral Images [43.2] 本稿では,スパースサブスペースクラスタリングのためのマルチプライヤの交互方向法(ADMM)に基づく反復解法を展開させることにより,ハイパースペクトル画像(HSI)のための革新的なクラスタリングアーキテクチャを提案する。
提案手法は, 構造保存モジュールの一部として, K近傍近傍のアルゴリズムを用いて, HSIデータの構造特性をよく把握する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:15:22 GMT)
Transferable Watermarking to Self-supervised Pre-trained Graph Encoders by Trigger Embeddings [43.1] Graph Self-supervised Learning (GSSL)は、基礎グラフエンコーダの事前トレーニングを可能にする。
このようなエンコーダは簡単にプルインできるので、著作権侵害に弱い。
我々はGSSL設定でグラフエンコーダを保護する新しい透かしフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:16:11 GMT)
Efficient Sharpness-Aware Minimization for Molecular Graph Transformer Models [42.6] シャープネスを意識した最小化(SAM)は、訓練軌道と一般化劣化からシャープな局所最小化を効果的に排除できるため、コンピュータビジョンにおいて注目を集めている。
本稿では、SAMのトレーニングコストを削減し、グラフトランスフォーマーモデルの一般化性能を向上させる、GraphSAMという新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:03:23 GMT)
Linear response theory for cavity QED materials [41.9] 空洞と物質の両方の様々な応答に対する閉公式を導出する。
我々は、マグノン対を局所状態に結合する量子磁石において、新しい励起を発見した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:56:16 GMT)
Cavity QED materials: Comparison and validation of two linear response theories at arbitrary light-matter coupling strengths [41.9] 我々は,光物質結合のすべての条件において有効であるキャビティに結合した材料に対する線形応答理論を開発した。
熱グリーン関数を得るための2つの異なるアプローチを比較する。
量子ホール効果と磁気モデルの収集にこの理論の詳細な応用を与える。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:54:50 GMT)
MM-SafetyBench: A Benchmark for Safety Evaluation of Multimodal Large Language Models [41.7] 我々は,Multimodal Large Language Models (MLLM) がクエリ関連画像によって容易に損なわれることを観察した。
画像ベース操作に対するMLLMの安全性クリティカルな評価を行うためのフレームワークであるMM-SafetyBenchを紹介する。
我々の研究は、潜在的に悪意のある悪用に対して、オープンソースのMLLMの安全性対策を強化し、強化するための協力的な努力の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:32:14 GMT)
Improving Visual Commonsense in Language Models via Multiple Image Generation [41.6] 既存の大規模言語モデル(LLM)は、主にテキストデータのみを使用して訓練されている。
視覚言語モデルは視覚的に指向するタスクに優れており、基本的なコモンセンス推論のような視覚的でないタスクでは失敗することが多い。
この分散は、基本的なテキストベースの言語推論と堅牢な視覚的理解の統合という、重要な課題を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:17:10 GMT)
ERASE: Benchmarking Feature Selection Methods for Deep Recommender Systems [40.8] 本稿では,Deep Recommender Systems(DRS)のためのフェースセレクションのための包括的bEnchmaRkであるERASEについて述べる。
ERASEは11種類の特徴選択手法を徹底的に評価し、従来のアプローチとディープラーニングアプローチの両方をカバーしている。
私たちのコードは簡単に再現できる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:48:25 GMT)
One Fits All: Learning Fair Graph Neural Networks for Various Sensitive Attributes [40.6] 不変学習,すなわちFairINVに基づくグラフフェアネスフレームワークを提案する。
FairINVはセンシティブな属性分割を取り入れ、ラベルと各種のセンシティブな属性の間の急激な相関を排除し、公正なGNNを訓練する。
いくつかの実世界のデータセットの実験結果から、FairINVは最先端のフェアネスアプローチを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:30:17 GMT)
Preserving Knowledge in Large Language Model with Model-Agnostic Self-Decompression [40.5] 大規模言語モデル(LLM)は、ドメイン固有のデータに対して、事前訓練後または監督された微調整後(SFT)において、破滅的な忘れ込みに悩まされることが多い。
本稿では,TG-SFTに着目し,SFTデータを合成的に生成する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:36:30 GMT)
PetalView: Fine-grained Location and Orientation Extraction of Street-view Images via Cross-view Local Search with Supplementary Materials [40.5] マルチスケール検索が可能なPetalView抽出器を提案する。
PetalViewの抽出子は、2つの大きな異なるビューで同等のセマンティックな機能を提供します。
先行する角度が与えられると、この情報を利用するための学習可能な事前角度ミキサーを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:58:16 GMT)
Robust Melanoma Thickness Prediction via Deep Transfer Learning enhanced by XAI Techniques [40.0] 本研究は,メラノーマの深さを測定するために皮膚内視鏡像の解析に焦点をあてる。
顆粒層の上部から腫瘍浸潤の最も深い地点まで測定されたブレスロー深さは、黒色腫のステージングと治療決定の指針となる重要なパラメータである。
ISICやプライベートコレクションを含むさまざまなデータセットが使用され、合計で1162枚の画像が含まれている。
その結果, 従来の手法に比べて, モデルが大幅に改善された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:07:55 GMT)
TroL: Traversal of Layers for Large Language and Vision Models [39.3] 大言語とビジョンモデル(LLVM)は、大言語モデル(LLM)の一般化力によって駆動されている。
GPT-4VのようなクローズドソースLLVMと互換性のある既存のオープンソースLLVMは、大きすぎると考えられていることが多い。
1.8B, 3.8B, 7B LLMモデルサイズ, Traversal of Layers (TroL) を持つLLVMファミリーを新たに提案する。
我々は、TroLが単純な層トラバースアプローチを採用しているが、より大きなモデルサイズを持つオープンソースのLLVMよりも効率的に性能を向上することを示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:40:03 GMT)
Biomedical Visual Instruction Tuning with Clinician Preference Alignment [38.6] 臨床適応型バイオメディカル・ビジュアル・インストラクション・チューニング(BioMed-VITAL)を提案する。
本研究では,臨床医の嗜好を生医学的マルチモーダル基礎モデルのチューニングのための指導データの生成と選択の両段階に組み込んだデータ中心型フレームワークを提案する。
その結果,提案手法から得られた指示追従データに調整したモデルでは,オープン・ビジュアル・チャット(18.5%)と医療用VQA(81.73%)の大幅な改善が見られた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:07:33 GMT)
Joint Wire Cutting with Non-Maximally Entangled States [37.9] ワイヤ切断は分散量子コンピューティングを可能にする。
ワイヤ切断は、結果の精度を維持するために追加の回路実行を必要とする。
本報告では,NME 状態を用いた接合線切断について検討し,サンプリングオーバーヘッドをさらに低減することを目的としている。
この3つの主な貢献は、(i)このシナリオの最小サンプリングオーバーヘッドを決定すること、(ii)より小さなNME状態から構築された複合NME状態を使用する際のオーバーヘッドを分析すること、(iii)純NME状態で最適なサンプリングオーバーヘッドを達成するワイヤ切断技術を導入することである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:05:30 GMT)
Open Problem: Anytime Convergence Rate of Gradient Descent [37.3] また, ベニラ勾配降下は, 段差列を変化させることで, 滑らかな凸目標に対して加速可能であることを示す。
古典的な$mathcalO (1/T)$収束率を加速する勾配降下の段階的なスケジュールは、幻の停止時間$T$で存在するか?
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:34:47 GMT)
Jogging the Memory of Unlearned Model Through Targeted Relearning Attack [37.1] LLMにおける未学習に対する既存のアプローチは、単純な再学習攻撃の標的セットに驚くほど影響を受けやすいことを示す。
小さく、潜在的にゆるやかに関連付けられたデータのみにアクセスすることで、未学習モデルのメモリを“ジョグ”して、未学習の影響を反転させることができることが分かりました。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:03:21 GMT)
Differentially Private Bias-Term Fine-tuning of Foundation Models [36.6] 本研究では,大規模事前学習モデルにおける差分プライベート(DP)微調整の問題について検討する。
本稿では,DPアルゴリズムの最先端精度と標準BiTFiTの効率とを一致させるDP-BiTFiTを提案する。
幅広いタスクにおいて、DP-BiTFiTは230倍高速で、完全な微調整よりも28倍少ないメモリを使用する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:40:18 GMT)
ChartBench: A Benchmark for Complex Visual Reasoning in Charts [36.5] MLLM(Multimodal Large Language Models)は画像の理解と生成に優れた能力を示している。
現在のベンチマークでは、限定的なチャートタイプと不適切なメトリクスのため、MLLMのチャート理解を正確に評価することができない。
複雑な視覚的推論によってチャートの理解とデータの信頼性を評価するための総合的なベンチマークであるChartBenchを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:58:32 GMT)
CITADEL: Context Similarity Based Deep Learning Framework Bug Finding [36.3] 本稿では,CITADELを提案する。CITADELは,効率と有効性の観点から,バグの発見を高速化する手法である。
これは、まず既存のバグレポートを収集し、問題のあるAPIを特定することで機能する。
CITADELが生成したテストケースの35.40%はバグを引き起こすことができ、その割合は0.74%、1.23%、および3.90%を大きく超える。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:46:25 GMT)
Understanding the RoPE Extensions of Long-Context LLMs: An Attention Perspective [35.9] 本稿では,RoPE拡張の注意点から,直接的かつ詳細な理解を提供する。
RoPE拡張の長い継続事前トレーニング長を使用することで、注意の不確実性を低減し、外挿を著しく向上させることができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:23:33 GMT)
RNA-FrameFlow: Flow Matching for de novo 3D RNA Backbone Design [35.7] 本稿では3次元RNAバックボーン設計のための最初の生成モデルであるRNA-FrameFlowを紹介する。
我々は、剛体フレームと関連する損失関数の集合としてRNA構造を定式化する。
3次元RNAデータセットの多様性の欠如に対処するため、構造的クラスタリングと収穫増強によるトレーニングについて検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:06:44 GMT)
NeRF-Feat: 6D Object Pose Estimation using Feature Rendering [35.6] 我々は、NeRFを用いてオブジェクトの形状を暗黙的に学習し、後にビュー不変の特徴を学習する。
CNNは、NeRFの暗黙の3dモデルとの対応を確立するために使用できるビュー不変の機能を予測するために使用される。
我々のアプローチは、同様のトレーニング設定を使用して、他のアプローチとは異なり、対称オブジェクトを処理できる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:45:17 GMT)
Ultra-High-Definition Restoration: New Benchmarks and A Dual Interaction Prior-Driven Solution [35.6] UHD-Snow と UHD-Rain という名の UHD 雪と降雨のベンチマークを構築した。
各ベンチマークには3200の分解/クリアイメージ対の4K解像度が含まれている。
モデル設計における勾配と正規項を考慮した効率的なUHD画像復元法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:58:49 GMT)
Improving Zero-Shot Cross-Lingual Transfer via Progressive Code-Switching [35.3] コードスイッチング(Code-switching)は、複数の言語の単語をソース言語テキストに混ぜるデータ拡張スキームである。
そこで本研究では,PCS(Progressive Code-Switching)手法を提案する。
実験により,10言語にまたがる3つのゼロショット言語間移動タスクについて,最先端の結果が得られた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:06:24 GMT)
Thread: A Logic-Based Data Organization Paradigm for How-To Question Answering with Retrieval Augmented Generation [35.3] Threadは、文書を相互接続性に基づいて論理単位に変換する新しいデータ組織パラダイムである。
オープンドメインと産業シナリオにわたる実験では、ThreadがRAGベースのQAシステムで既存のデータ組織パラダイムより優れていることが示されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:14:41 GMT)
Certificates of Differential Privacy and Unlearning for Gradient-Based Training [35.2] プライバシとアンラーニング保証に対する新たな検証中心のアプローチを提案する。
私たちのフレームワークは、プライバシとアンラーニング保証に対する新たな検証中心のアプローチを提供します。
我々は,金融サービス,医用画像,自然言語処理などのタスクに対するアプローチの有効性を検証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:47:00 GMT)
Learning Linear Utility Functions From Pairwise Comparison Queries [35.0] 線形効用関数のペア比較クエリによる学習可能性について検討する。
受動的学習環境では、線形ユーティリティは第一の目的に対して効率的に学習可能であることを示す。
この場合、第2の目的であっても効率よく学習できることを示し、ノイズフリーおよびノイズの多いクエリ応答設定のためのアルゴリズムを提示する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:08:13 GMT)
Mathador-LM: A Dynamic Benchmark for Mathematical Reasoning on Large Language Models [34.8] 大規模言語モデル(LLM)の数学的推論を評価するための新しいベンチマークであるMathador-LMを紹介する。
Mathador-LMはMathadorのゲームにインスパイアされており、そのゲームの目的は、与えられた基本数の集合の基本的な算術演算を用いてターゲット数に到達することである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:28:10 GMT)
M4Fog: A Global Multi-Regional, Multi-Modal, and Multi-Stage Dataset for Marine Fog Detection and Forecasting to Bridge Ocean and Atmosphere [34.6] これまでに最も包括的な海洋霧検出・予測データセットであるM4Fogを提示する。
データセットは、元素、緯度、経度、時間という4つの次元に沿って68,000個の「スーパーフォッグデータ立方体」で構成され、時間分解能は30時間、空間分解能は1kmである。
実用的応用を考えると,マルチメトリック評価システムを用いた3つの意味トラックを定義し,検討した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:11:07 GMT)
Extending Input Contexts of Language Models through Training on Segmented Sequences [34.4] 本研究では,事前学習したモデルの入力コンテキストサイズをアーキテクチャ変更なしに拡張する訓練手法を開発した。
提案手法は,パープレキシティを改善しつつ,入力コンテキストを4倍に拡張できることを実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:00:27 GMT)
Connecting the Dots in News Analysis: Bridging the Cross-Disciplinary Disparities in Media Bias and Framing [34.4] 我々は、現在支配的な方法論は、理論的メディア研究において対処される複雑な問題や効果に対処するに足りていないと論じる。
我々はオープンな質問を議論し、理論と予測モデルの間の特定されたギャップを埋めるための可能な方向を提案し、その評価を行う。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:35:13 GMT)
DPO: Dual-Perturbation Optimization for Test-time Adaptation in 3D Object Detection [34.0] 実世界での3D検出器のトレーニングは、テストデータの分布がトレーニングデータから著しくずれたときに、しばしば不満足なパフォーマンスをもたらす。
我々は,textbfunderlineTest-underlinetime underlineAdaptation in Underline3Dに対して,textbfdual-perturbation Optimization (DPO)を提案する。
我々は、平らなロスランドスケープを育むためのシャープさを最小限に抑え、小さなデータバリエーションに対するモデルレジリエンスを確保する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:46:08 GMT)
Is poisoning a real threat to LLM alignment? Maybe more so than you think [33.6] そこで我々は,異なるシナリオ下での中毒攻撃に対するDPOの脆弱性を調査し,嗜好中毒の有効性を比較検討した。
PPOベースの手法とは異なり、バックドア攻撃では、有害な行動を誘発するために、少なくとも4%のデータを汚染する必要がある。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:56:17 GMT)
Evaluating Short-Term Temporal Fluctuations of Social Biases in Social Media Data and Masked Language Models [33.5] 社会的偏見はあらゆるバイアスに存在しているが、ほとんどの社会的偏見は時間とともに比較的安定している。
以上の結果から, 男性など一部の集団は, トレーニングコーパス上の女性など, 他者よりも高い嗜好を得ていることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:45:21 GMT)
AniFaceDiff: High-Fidelity Face Reenactment via Facial Parametric Conditioned Diffusion Models [33.4] 顔再現とは、ポーズと表情を、参照(運転)ビデオから静的な顔(ソース)画像に転送する過程を指す。
この領域における以前の研究は、顔を生成するために制御可能な深層生成モデルを訓練することで大きな進歩を遂げた。
本稿では,AniFaceDiffと呼ばれる安定拡散に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:08:48 GMT)
PRESTO: Progressive Pretraining Enhances Synthetic Chemistry Outcomes [33.3] MLLM(Multimodal Large Language Models)は、様々な科学分野において普及している。
しかし、現在のアプローチは化学反応を理解する上での複数の分子グラフ相互作用の重要な役割を無視することが多い。
PRESTOは、事前学習戦略とデータセット構成の包括的なベンチマークを統合することで、分子-テキストのモダリティギャップを橋渡しする新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:59:46 GMT)
MoreHopQA: More Than Multi-hop Reasoning [32.9] 提案するマルチホップデータセットであるMoreHopQAは,抽出結果から生成結果へシフトする。
我々のデータセットは,HotpotQA,2WikiMultihopQA,MuSiQueの3つの既存のマルチホップデータセットを利用して作成されている。
この結果から,初期のマルチホップ質問ではモデルの性能は良好であったが,拡張された質問では困難であった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:38:59 GMT)
ModelMix: A New Model-Mixup Strategy to Minimize Vicinal Risk across Tasks for Few-scribble based Cardiac Segmentation [32.2] そこで本研究では,モデルパラメータをモデルパラメータとして用いたスクリブル教師付きセグメンテーションに対する新しいアプローチを提案する。
ModelMixは、別々のエンコーダから畳み込みパラメータの凸組み合わせを使って仮想モデルを構築する。
次に、教師なしとスクリブル付きの両方の方法で、タスク間のビジナルリスクを最小限に抑えるために、モデルセットを正規化します。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:58:11 GMT)
ObscurePrompt: Jailbreaking Large Language Models via Obscure Input [32.0] 本稿では,LLMをジェイルブレイクするための単純で斬新な手法であるObscurePromptを紹介する。
まず、脱獄過程における決定境界を定式化し、次にLLMの倫理的決定境界に不明瞭な文章がどう影響するかを考察する。
本手法は,2つの防御機構に対する有効性を保ちながら,攻撃効果の観点から従来の手法を大幅に改善する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:09:58 GMT)
Enabling Intelligent Interactions between an Agent and an LLM: A Reinforcement Learning Approach [31.7] 大規模言語モデル(LLM)は、大量のテキストデータセットから得られた膨大な量の世界の知識を符号化する。
LLMは、高レベルな命令を提供することで、複雑なシーケンシャルな意思決定タスクを解決するための実施エージェントを支援することができる。
本研究では,高レベルの命令に対してLLMを問合せする必要がある場合に学習する強化学習ベースのアプローチである When2Ask を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:22:25 GMT)
Towards Trustworthy Unsupervised Domain Adaptation: A Representation Learning Perspective for Enhancing Robustness, Discrimination, and Generalization [31.2] Robust Unsupervised Domain Adaptation (RoUDA)は、クリーンなだけでなく、堅牢なドメイン間の知識伝達を実現することを目的としている。
我々は, 相互情報理論(MIRoUDA)を利用した新しいアルゴリズムを設計する。
我々の手法は最先端の技術をはるかに上回っている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:19:34 GMT)
Diffusion-EXR: Controllable Review Generation for Explainable Recommendation via Diffusion Models [31.0] Diffusion-EXR と呼ばれる説明可能なレコメンデーションに対する拡散モデルに基づくレビュー生成
拡散-EXRと呼ばれる説明可能な勧告に対する拡散モデルに基づくレビュー生成を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:53:18 GMT)
Human Action Co-occurrence in Lifestyle Vlogs using Graph Link Prediction [30.7] 1組の視覚アクションとそれに対応するビデオクリップを共起する12kのグラフからなるACEデータセットを公開し、公開します。
視覚情報とテキスト情報を利用して2つのアクションが共起しているかどうかを自動的に推測するグラフリンク予測モデルについて述べる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:18:41 GMT)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding [30.5] 自動音声キャプション(英: Automated Audio Casting, AAC)は、自然言語で音声を記述するための音声からテキストへのタスクである。
大規模言語モデル(LLM)の最近の進歩は、AACを改善する可能性を広げている。
提案手法は,DCASE 2023 Task 6Aの勝者よりも優れた33.0 SPIDEr-FLスコアを得る。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:09:46 GMT)
The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes [30.3] 我々は、訓練データとテストデータの間の相互影響を浮き彫りにして、ミラーレッド影響仮説を導入し、探求する。
具体的には、テスト予測に対するトレーニングデータの影響を評価することは、等価だが逆問題として再定義することができることを示唆している。
トレーニングポイント毎に前方パスとペアを組むことで,特定のテストサンプルの勾配を計算し,トレーニングデータの影響を推定する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:35:04 GMT)
MLVU: A Comprehensive Benchmark for Multi-Task Long Video Understanding [30.0] 我々は,Long Video Understanding の包括的かつ詳細な評価を行うため,MLVU と呼ばれる新しいベンチマークを提案する。
MLVUは以下の重要な値を示す: 1) ビデオ長の実質的かつ柔軟な拡張により、ベンチマークは幅広い期間にわたってLVUのパフォーマンスを評価することができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:04:38 GMT)
MAiDE-up: Multilingual Deception Detection of GPT-generated Hotel Reviews [29.2] 私たちは、AIが生成した偽のホテルレビュー1万件からなるMAiDE-upデータセットを公開しています。
我々は、AIの偽ホテルレビューと実際のホテルレビューを比較するために、広範な言語学的分析を行う。
これらの次元は、AIが生成した偽レビューをいかに検出できるかに影響を及ぼす。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:34:42 GMT)
Communication-Efficient and Privacy-Preserving Decentralized Meta-Learning [29.2] 集中的な場所でトレーニングデータを収集する必要のない分散学習は、ビッグデータ時代においてますます重要になっている。
本稿では,異なるクライアントが限られた学習データで異なる(しかし関連する)タスクを実行する,より困難なメタラーニング環境について考察する。
そこで我々はLoDMeta(Local Decentralized Meta-learning)を提案する。LoDMeta(Local Decentralized Meta-learning)は局所的な最適化パラメータとランダムな摂動をモデルパラメータに用いて提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:29:51 GMT)
Data Contamination Can Cross Language Barriers [29.1] 大規模言語モデル(LLM)の開発における不透明さは、事前学習データにおける公開ベンチマークの汚染の可能性への懸念が高まっている。
まず, 電流検出手法を回避しつつ, LLMの性能を増大させる多言語性汚染について述べる。
本稿では,このような汚染を深く隠蔽する一般化に基づく手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:53:27 GMT)
Is the Pope Catholic? Yes, the Pope is Catholic. Generative Evaluation of Non-Literal Intent Resolution in LLMs [29.1] 非リテラル発話に対する応答を調べることで,大規模言語モデル(LLM)の意図的理解を評価する。
以上の結果から,LLMは非リテラル言語に対する実用的応答の獲得に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:07:47 GMT)
Learning to Generate Answers with Citations via Factual Consistency Models [28.7] 大型言語モデル(LLM)は、ミッションクリティカルな状況においてその信頼性を阻害する。
本稿では,事実整合性モデル(FCM)を利用した弱教師付き微調整法を提案する。
集中学習は目的に統合され、ファインチューニングプロセスが現実の単位トークンを強調するように指示される。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:40:19 GMT)
When Parts are Greater Than Sums: Individual LLM Components Can Outperform Full Models [28.5] 本稿では,大規模言語モデルの出力を,注目頭やコンポーネントの個々のコントリビューションに分解することで,文脈内学習(ICL)について検討する。
モデルが貧弱な場合であっても、分類タスクで個別にうまく機能する優れたパフォーマンスのコンポーネント、偶然よりもはるかに悪いパフォーマンスのコンポーネント、常に同じラベルを予測するラベルバイアスのコンポーネント。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:48:44 GMT)
Enhancing Cross-Prompt Transferability in Vision-Language Models through Contextual Injection of Target Tokens [28.4] 我々は、勾配に基づく摂動を利用して、ターゲットトークンを視覚的・テキスト的両方の文脈に注入するコンテキストインジェクション攻撃(CIA)を提案する。
CIAは敵画像のクロスプロンプト転送性を高める。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:32:55 GMT)
Cross-cultural Inspiration Detection and Analysis in Real and LLM-generated Social Media Data [28.4] この研究は、機械学習を通じて異文化間のインスピレーションを初めて研究した。
我々は、実物とAIが生み出す異文化の刺激的なポストを特定し、分析することを目指している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:27:43 GMT)
DTGB: A Comprehensive Benchmark for Dynamic Text-Attributed Graphs [28.3] 動的テキスト分散グラフ(DyTAG)は、様々な実世界のシナリオで一般的である。
幅広い適用性にもかかわらず、DyTAGに合わせたベンチマークデータセットは、顕著に不足している。
大規模な時間進化グラフのコレクションである動的テキスト分散グラフベンチマーク(DTGB)を導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:58:35 GMT)
AgentDojo: A Dynamic Environment to Evaluate Attacks and Defenses for LLM Agents [27.7] 我々は、信頼できないデータ上でツールを実行するエージェントの評価フレームワークであるAgentDojoを紹介した。
AgentDojoは静的テストスイートではなく、新しいエージェントタスク、ディフェンス、アダプティブアタックを設計、評価するための環境である。
AgentDojoには97の現実的なタスク、629のセキュリティテストケースと、文献からのさまざまな攻撃および防御パラダイムが組み込まれています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:55:56 GMT)
TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods [27.5] 時系列は、経済、交通、健康、エネルギーといった様々な領域で生成される。
本稿では,時系列予測(TSF)手法の自動ベンチマークであるTFBを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:29:46 GMT)
Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification [26.9] 本稿では,特許分類に関する特許に関する情報を包括的に検討する統合フレームワークを提案する。
まず,その意味表現を導出するためのICC符号相関学習モジュールを提案する。
最後に、IPC符号のセマンティクスを含む特許文書の文脈情報と、予測を行うために利用者のシーケンシャルな選好を割り当てる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:45:02 GMT)
Improved bounds for calibration via stronger sign preservation games [26.6] 予測器の各予測が、その予測がなされた時間ステップのサブセットにおける結果の経験的分布を近似すると、確率予測のセットを校正する。
Foster & Vohra (1998) は、$O(T2/3)$キャリブレーション誤差を$T$タイムステップ後に引き起こし、$Omega(T1/2)$の低い境界を示した。
Qiao & Valiant (2021) は、符号保存と呼ばれるゲームを導入することにより、下限を$Omega(T0.528) に改善した。
我々は,符号保存と校正予測の関係が証明された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:19:39 GMT)
Slot State Space Models [26.2] 本稿では,情報分離の保存・促進を目的として,独立したメカニズムをSSMに組み込む新しいフレームワークであるSlotSSMを紹介する。
実験では,対象中心の映像理解,3次元視覚推論,映像予測タスクにおけるモデルの評価を行った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:53:36 GMT)
SQLFixAgent: Towards Semantic-Accurate SQL Generation via Multi-Agent Collaboration [26.2] 本稿では,誤字の検出と修復を目的とした,革新的なマルチエージェント協調フレームワークを提案する。
私たちのフレームワークはコアエージェントであるsqlRefinerと2つの補助エージェントであるsqlReviewerとQueryCrafterで構成されています。
実験結果から,本手法はベースラインモデルの性能を継続的に向上することが示された。
当社のフレームワークは,他の高度なメソッドと比較してトークン効率も高く,競争力も向上しています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:57:19 GMT)
A Federated Learning Approach for Multi-stage Threat Analysis in Advanced Persistent Threat Campaigns [26.0] 高度な永続的脅威(APT)のようなマルチステージの脅威は、データを盗み、インフラストラクチャを破壊することによって深刻なリスクを引き起こす。
APTは新たな攻撃ベクトルを使用し、ネットワークの存在を隠蔽することでシグネチャベースの検出を回避する。
本稿では,APTを検出するための3段階の非教師付きフェデレーション学習(FL)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:34:41 GMT)
MAMA-MIA: A Large-Scale Multi-Center Breast Cancer DCE-MRI Benchmark Dataset with Expert Segmentations [25.6] MAMA-MIAデータセットは1506例のダイナミックコントラスト強調MRIで一次腫瘍と非質量増強領域を専門に分類した。
このデータセットは、ディープラーニングモデルの開発とベンチマークを加速し、乳癌の診断と治療計画の革新を促進することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:11:46 GMT)
Federating to Grow Transformers with Constrained Resources without Model Sharing [25.5] 本稿では,複数の参加者を対象としたFed-Growというフェデレーションフレームワークについて考察する。
Dual-LiGOでは、Local-LiGO部は、様々な事前学習モデルによって生じる不均一性問題に対処するために使用される。
Global-LiGOの部分は、事前訓練されたモデル、ローカルデータ、参加者のトレーニングプロセスから暗黙の知識を交換するために共有されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:17:59 GMT)
Toward Structure Fairness in Dynamic Graph Embedding: A Trend-aware Dual Debiasing Approach [25.3] 本稿では,FairDGEを提案する。
また,FairDGEは埋め込みの有効性と公平性を同時に向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:20:12 GMT)
Formally Certified Approximate Model Counting [25.2] 本稿では、その出力近似の品質に関する保証を正式に保証した、近似モデルカウントのための最初の認証フレームワークを提案する。
i)Isabelle/HOL証明アシスタントにおけるアルゴリズムのPAC保証の静的かつ1回限りの公式な証明、(ii)証明証明書を用いた外部CNF-XORソルバに対するApproxMCの呼び出しの動的かつ1回実行による検証。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:24:40 GMT)
Resource-Aware Hierarchical Federated Learning in Wireless Video Caching Networks [24.7] いくつかの人気ファイルの動画トラフィックによるバックホールトラフィックの混雑は、要求されるコンテンツを保存することで軽減できる。
本稿では,ユーザの今後のコンテンツ要求を予測するためのリソース対応階層型学習(RawHFL)ソリューションを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:18:42 GMT)
Allocation Requires Prediction Only if Inequality Is Low [24.6] 本研究では,個人がより大きなユニットに属している環境での予測に基づくアロケーションの有効性を評価する。
予測に基づくアロケーションは,ユニット間の不平等が低く,介入予算が高い場合にのみ,ベースライン手法よりも優れることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:23:32 GMT)
Lost in UNet: Improving Infrared Small Target Detection by Underappreciated Local Features [24.5] HintUは、様々なUNetベースの手法によって失われた局所的特徴を回復し、効果的な赤外線小ターゲット検出を行う新しいネットワークである。
これは"Hint"メカニズムを初めて導入し、すなわち、ターゲット位置の事前の知識を活用して、重要なローカル特徴を強調する。
メインストリームのUNetベースのアーキテクチャを改善して、ダウンサンプリング後もターゲットピクセルを保存する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:11:38 GMT)
Rethinking Negative Instances for Generative Named Entity Recognition [24.5] GNERはジェネレーティブNERシステムであり、見えないエンティティドメイン間でゼロショットのパフォーマンスが改善されている。
本稿では,非構造的予測を構造化エンティティに変換するために最適化したLCSマッチングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:16:58 GMT)
Secure Combination of Untrusted Time information Based on Optimized Dempster-Shafer Theory [24.3] 多重経路方式は時間遅延攻撃(TDA)の影響を低減させる効果的なセキュリティ対策と考えられる
本稿では,複数経路法に対して,Dempster-Shafer理論に基づくセキュアな組合せアルゴリズムを提案する。
理論的シミュレーションにより,提案アルゴリズムは単一経路に基づくフォールトトレラントアルゴリズム (FTA) や攻撃検出手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:15:12 GMT)
MINERS: Multilingual Language Models as Semantic Retrievers [23.7] 本稿では,意味検索タスクにおける多言語言語モデルの有効性を評価するためのベンチマークであるMINERSを紹介する。
我々は,200以上の多言語にわたるサンプルの検索において,LMの堅牢性を評価する包括的なフレームワークを構築した。
以上の結果から,意味論的に類似した埋め込みを検索することで,最先端のアプローチと競合する性能が得られることが示された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:29:51 GMT)
Automatic Generation of Model and Data Cards: A Step Towards Responsible AI [23.4] 大規模言語モデル(LLM)を用いた自動生成手法を提案する。
CardBenchは4.8kモデルカードと1.4kデータカードから集約された包括的なデータセットである。
当社のアプローチでは、生成されたモデルとデータカードにおける完全性、客観性、忠実性が向上しています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:36:01 GMT)
Finding Blind Spots in Evaluator LLMs with Interpretable Checklists [23.4] テキスト生成タスクにおける評価器として,Large Language Models (LLMs) の有効性を検討する。
我々は,4つの重要な能力を評価する上で,評価用LLMの習熟度を評価するための新しいフレームワークであるFBIを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:59:48 GMT)
BeHonest: Benchmarking Honesty of Large Language Models [23.2] 我々は、大規模言語モデルにおける誠実さを評価するために特別に設計された、先駆的なベンチマークであるBeHonestを紹介する。
BeHonest氏は、知識境界の認識、偽造の回避、応答の一貫性の3つの重要な側面を評価している。
以上の結果から,LSMの正直性には改善の余地がまだ残っていることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:46:59 GMT)
Towards Minimal Targeted Updates of Language Models with Targeted Negative Training [23.0] 最小限の目標更新の概念を定式化し、そのような更新を実現する方法を提案する。
提案したTNT(Targeted Negative Training)は,新たなディストリビューションをオリジナルに近い状態に維持する更新を行う。
実験では、TNTは、不要な振る舞いを減らし、ベースラインよりもモデル生成の挙動を保ちながら、よりよいトレードオフをもたらすことを示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:06:21 GMT)
Effective Edge-wise Representation Learning in Edge-Attributed Bipartite Graphs [22.9] 本稿では,エッジ分散二部グラフ(EABG)のためのグラフ表現学習法を提案する。
エッジの観点からの構造と属性のセマンティクスを取り入れ、AEBGにおける2つの異種ノード集合 U と V の別個の影響を考慮している。
APでは少なくとも38.11%、AUCでは1.86%を達成している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:11:03 GMT)
Bridging Law and Data: Augmenting Reasoning via a Semi-Structured Dataset with IRAC methodology [22.7] 本稿では,法シナリオ分析のためのベンチマークであるLEGALSEMIを紹介する。
LEGALSEMIは54の法的シナリオで構成されており、それぞれが包括的なIRAC(Issue, Rule, Application, Conclusion)フレームワークに基づいて、法の専門家によって厳格に注釈付けされている。
IRAC分析におけるLEGALSEMIの有用性を評価するための一連の実験を行った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:59:09 GMT)
Signatures Meet Dynamic Programming: Generalizing Bellman Equations for Trajectory Following [22.7] 信号は経路の分析的特徴と幾何学的特徴を効率的に捉えた経路の強力な表現として提案されている。
本研究では、経路シグネチャの最適制御や興味深い性質に典型的に使用される値関数間の接続を確立する。
我々は、シグネチャ制御と呼ばれるフレームワークの特性と利点を分析する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:07:53 GMT)
SALI: Short-term Alignment and Long-term Interaction Network for Colonoscopy Video Polyp Segmentation [22.4] 大腸内視鏡ビデオは直腸癌診断のためのポリープセグメンテーションにおいてより豊かな情報を提供する。
内視鏡の速い動きとクローズアップの観察により、現在の手法は大きな空間的不整合と連続的な低品質フレームに悩まされる。
短期アライメントモジュール(SAM)と長期インタラクションモジュール(LIM)のハイブリッドであるSALIネットワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:15:04 GMT)
A Resource-Adaptive Approach for Federated Learning under Resource-Constrained Environments [22.0] 本稿では,不均一な制約リソースを持つ複数のクライアントを対象とする,基礎的連合学習(FL)問題について検討する。
資源適応型非同期フェデレーション学習アルゴリズムであるFed-RAAを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:55:40 GMT)
Towards Measuring and Modeling "Culture" in LLMs: A Survey [21.9] 大規模言語モデル(LLM)における文化的表現と包摂性の研究を目的とした,90以上の最近の論文について調査する。
いずれの研究も「文化」を明確に定義していない。
これらの側面を文化のプロキシと呼び、人口統計学と意味論的プロキシの2つの側面にまたがってそれらを整理します。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:43:27 GMT)
MMTE: Corpus and Metrics for Evaluating Machine Translation Quality of Metaphorical Language [21.9] 図形言語の翻訳に焦点をあてた評価指標のセットを提案する。
評価プロトコルは,メタフォラル等価性,感情,認証性,品質の4つの側面を推定する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:52:22 GMT)
APPL: A Prompt Programming Language for Harmonious Integration of Programs and Large Language Model Prompts [21.8] 大規模言語モデル(LLM)は、巧妙なプロンプトの助けを借りて、多様なタスクを扱う能力が高まっている。
APPLはコンピュータプログラムとLLMの間のブリッジとして機能し、Python関数へのプロンプトのシームレスな埋め込みを可能にする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:29:59 GMT)
SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation [21.7] 本研究では,データ・テキスト生成における合成一般化のための総合的・実践的な評価手法であるSPORを提案する。
2つの異なるデータセット上でSPORを実証し、LLMを含む既存の言語モデルを評価する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:09:32 GMT)
Self-Explainable Temporal Graph Networks based on Graph Information Bottleneck [21.6] テンポラルグラフネットワーク(TGNN)は、時間とともにグラフ内の相互作用のトポロジと動的依存関係をキャプチャする能力を持つ。
過去の出来事が予測にどのように影響するかを特定するのが困難であるため、TGNNモデルの予測を説明する必要性が高まっている。
これは、時間グラフの予測と説明をエンドツーエンドで同時に行う最初の作品である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:55:34 GMT)
Hierarchical IoU Tracking based on Interval [21.6] マルチオブジェクト追跡(MOT)は、フレーム間で与えられたクラスのすべてのターゲットを検出し、関連付けることを目的としている。
HITと呼ばれる階層型IoU追跡フレームワークを提案し、トラックレット間隔を先行として利用して階層型追跡を実現する。
提案手法は,MOT17,KITTI,DanceTrack,VisDroneの4つのデータセットに対して有望な性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:03:18 GMT)
ClinicalLab: Aligning Agents for Multi-Departmental Clinical Diagnostics in the Real World [21.4] 包括的臨床診断剤アライメントスイートである ClinicalLab を紹介する。
ClinicalLabには、エンドツーエンドの多部門間臨床診断評価ベンチマークである ClinicalBenchが含まれている。
我々は17個のLDMを評価し,その性能が各部門で大きく異なることを発見した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:44:25 GMT)
FastPersist: Accelerating Model Checkpointing in Deep Learning [21.3] 本稿では,Deep Learning(DL)トレーニングにおけるチェックポイント生成の高速化を目的としたFastPersistを提案する。
FastPersistは、(i)高速なチェックポイント書き込みと推論のための最適化、(ii)トレーニング環境で利用可能な効率的な書き込み並列化、(iii)独立したトレーニング計算と重複するチェックポイント処理の3つの新しいテクニックを組み合わせる。
我々の評価では、FastPersistは、ベースラインよりも最大116倍高速な永続ストレージでチェックポイントを生成し、無視できるオーバーヘッドでイテレーション毎のチェックポイントを可能にする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:31:23 GMT)
Scalable unsupervised alignment of general metric and non-metric structures [21.3] 異なるドメインからのデータのアライメントは、非常に異なる領域にわたる幅広いアプリケーションによる機械学習の基本的な問題である。
我々は、2次代入問題 (QAP) の最小化問題でもある、関連よく計算可能な線形代入問題 (LAP) を学習する。
単一セルマルチオミクスとニューラル潜在空間からの合成および実データに対するアプローチを評価する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:54:03 GMT)
Implicit Bias of Mirror Flow on Separable Data [21.2] 線形分離可能な分類問題に対して,ミラー降下の連続時間,すなわちミラーフローについて検討する。
指数的尾尾損失とポテンシャルに対する軽度の仮定では、イテレートは$phi_infty$-maximumマージンに向かって収束する。
関数 $phi_infty$ はミラーポテンシャルの $textithorizon 関数$ であり、無限大でその形を特徴づける」
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:25:57 GMT)
Can GPT-4 Replicate Empirical Software Engineering Research? [20.9] 我々は,GPT-4が実験ソフトウェア工学研究の複製を行う能力について検討した。
GPT-4は正しい仮定を導出できるが、ソフトウェア工学データに関する共通知識を応用した仮説を生成するのに苦労している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:17:28 GMT)
Discerning and Resolving Knowledge Conflicts through Adaptive Decoding with Contextual Information-Entropy Constraint [20.5] 本稿では,知識が相反するかどうかを識別し,解決するための適応的復号法を提案する。
実験により、COIECDは現実的なデータセットにおける知識の衝突に対して強い性能と堅牢性を示すことが示された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:07:37 GMT)
Can LLMs Reason in the Wild with Programs? [20.5] 本研究では, LLM が未知型推論問題の解法を課題とする, 野生における推論の課題を紹介する。
我々は,多種多様な推論問題に対する詳細な解を含む大規模戦術誘導軌道データセットを作成する。
実験では、既存のLLMは曖昧で混在したスコープの問題で著しく失敗する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:26:19 GMT)
Improving Zero-shot LLM Re-Ranker with Risk Minimization [20.3] Retrieval-Augmented Generation (RAG) システムでは、高度なLarge Language Models (LLMs) が、教師なしの方法で有効なQuery Likelihood Models (QLMs) として登場した。
しかし、直接的にQLMを近似させる手法は、推定された分布が実際の文書固有の分布から分岐する可能性があるため、偏りがある。
我々はベイズ決定理論を利用してこの推定バイアスを定量化し緩和する新しいフレームワーク、$mathrmUR3$を導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:29:54 GMT)
LLM as Prompter: Low-resource Inductive Reasoning on Arbitrary Knowledge Graphs [20.2] 知識グラフ帰納的推論における重要な課題は、テキストと構造の両方面で不足した低リソースシナリオを扱うことだ。
我々は、Large Language Models (LLMs) を用いて、事前学習されたグラフニューラルネットワーク(GNNs)を強化するグラフ構造的プロンプトを生成する。
手法面では、任意のKGをまたいだ低リソース帰納的推論のために設計された、新しい事前学習・促進フレームワークProLINKを導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:00:53 GMT)
Is Your HD Map Constructor Reliable under Sensor Corruptions? [20.0] 運転システムは、しばしば正確な環境情報のために高精細(HD)マップに頼っている。
現在のHDマップコンストラクタは理想的な条件下ではよく機能するが、現実の課題に対するレジリエンスはよく理解されていない。
この研究は、HDマップ構築手法の堅牢性を評価するために設計された最初の総合的なベンチマークであるMapBenchを紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:43:05 GMT)
Evaluating representation learning on the protein structure universe [19.9] ProteinWorkshopは、Graph Neural Networksでタンパク質構造の表現学習を行うためのベンチマークスイートである。
本研究は,実験と予測の両方における大規模事前学習および下流作業について考察する。
1)AlphaFold構造と補助タスクの大規模事前学習は、回転不変および同変GNNの性能を一貫して改善する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:48:34 GMT)
A Unified Framework for Combinatorial Optimization Based on Graph Neural Networks [19.6] 最適化問題(COP)を解決する強力なツールとして、グラフニューラルネットワーク(GNN)が登場した。
本稿では,GNNのグラフ表現,非グラフ構造COPのグラフ構造COPへの等価変換,グラフ分解,グラフ単純化などを含む,統一的なCOP解決フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:40:31 GMT)
On the Utility of Domain-Adjacent Fine-Tuned Model Ensembles for Few-shot Problems [19.5] 本稿では,ドメイン・アジャセント・ファイン・チューン・ファウンデーション・モデル(DAFT-E)を数ショット問題に応用したフレームワークについて検討する。
ゼロショット問題に対して、このアンサンブル法は、単一最良モデルの精度に近い性能を提供する。
数ショットの問題を発生させると、この性能はさらに向上し、DEFT-Eはどのドメイン・アジャセントモデルよりも優れている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:24:36 GMT)
GUI Action Narrator: Where and When Did That Action Take Place? [19.3] 我々は,4,189種類の動画キャプションサンプルからなるGUIアクションの動画キャプションベンチマークを開発した。
本課題は,自然映像のキャプションに比較して,独特な課題を呈する。
GUI アクションデータセット textbfAct2Cap と GUI ビデオキャプションのためのシンプルなフレームワーク textbfGUI Narrator を紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:22:11 GMT)
Any360D: Towards 360 Depth Anything with Unlabeled 360 Data and Möbius Spatial Augmentation [19.2] 我々は、Any360Dと呼ばれる360度深度基礎モデルを学ぶための半教師付き学習フレームワークを提案する。
SSLの傘の下で、Any360Dはまず、メートル法深度監視を通じてDAMを微調整することで教師モデルを学ぶ。
大規模な実験では、Any360DはDAMと多くの先行データ固有モデルより優れており、360度基礎モデルとして印象的なゼロショット能力を示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:19:06 GMT)
Adaptive Hyperparameter Optimization for Continual Learning Scenarios [19.2] 本稿では,連続学習におけるハイパーパラメータ選択の役割について検討する。
分散に基づく手法の機能解析を用いて、性能に影響を及ぼす最も重要なハイパーパラメータを同定する。
提案手法は,連続的なシナリオや戦略に依存しない手法で,タスク間のハイパーパラメータ最適化を継続的に高速化し,逐次的なタスク順序に直面する場合においても堅牢性を示すことを実証的に実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:17:51 GMT)
Combining Optimal Transport and Embedding-Based Approaches for More Expressiveness in Unsupervised Graph Alignment [19.1] 教師なしグラフアライメントは、グラフ構造とノード特徴のみを利用して、属性グラフのペア間の1対1ノード対応を見つける。
モデル表現性の理論的解析によって動機付けられたそれらの利点を組み合わせるための原理的アプローチを提案する。
我々は,問題を最大重み付けに還元することで,一対一のマッチング制約を最初に保証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:57:35 GMT)
Low-Rank Mixture-of-Experts for Continual Medical Image Segmentation [19.0] 破滅的な忘れ」問題は、モデルが新しいカテゴリやタスクに拡張された際に、以前に学習した特徴を忘れたときに発生する。
本稿では,データ固有のMixture of Experts構造を導入して,新しいタスクやカテゴリを扱うネットワークを提案する。
クラスレベルおよびタスクレベルの連続学習課題に対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:19:50 GMT)
Rethinking Abdominal Organ Segmentation (RAOS) in the clinical scenario: A robustness evaluation benchmark with challenging cases [18.9] RAOSデータセットは、17例(男性)または19例(男性)のラベル付き臓器を持つ413例のCT413例からなる。
1) 診断・放射線療法(第317巻), 2) 全臓器欠損のない部分切除(第22巻), 3) 全臓器欠失を伴う部分切除(第74巻)に分類した。
RAOSは臓器幻覚を含むモデルの堅牢性を評価するための潜在的なベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:23:42 GMT)
Breaking News: Case Studies of Generative AI's Use in Journalism [18.7] 本研究では、WildChatデータセットを閲覧することで、2つの報道機関によるジャーナリストとAIのインタラクションの研究を行う。
本稿では,ジャーナリストが他の機関からの資料や記事との機密通信などの機密資料をLCMに送付し,記事作成を促す事例を明らかにする。
本稿では,AIの活用に責任を負うものに関するさらなる研究と,ジャーナリストの文脈でLLMを使用するための明確なガイドラインとベストプラクティスの確立を求めている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:58:32 GMT)
SecureBoost+: Large Scale and High-Performance Vertical Federated Gradient Boosting Decision Tree [18.7] 本稿では,大規模かつ高性能な垂直配向勾配向上決定木フレームワークSecureBoost+を提案する。
SecureBoost+はSecureBoostと同じ半正直なモデルでセキュアである。
実験の結果、SecureBoost+はSecureBoostの6~35倍高速であるが、同じ精度で数千万のデータサンプルと数千の機能ディメンションまでスケールできることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:45:59 GMT)
Right on Time: Revising Time Series Models by Constraining their Explanations [18.3] RioTは、初めて、時間領域と周波数領域の両方にわたるモデル説明とのインタラクションを可能にする。
私たちは、RioTがP2Sの間違った理由や一般的な時系列分類や予測データセットからモデルを効果的に誘導できることを実証的に実証した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:20:54 GMT)
De-Hallucinator: Mitigating LLM Hallucinations in Code Generation Tasks via Iterative Grounding [18.1] 公開ソースコードのデータセットに基づいてトレーニングされた大規模言語モデル(LLM)は、コード生成タスクにおける新たな最先端技術を確立した。
LLMは、主に特定のプロジェクトに存在するコードに気づいていないため、モデルが既存のAPIをうまく利用できない。
本稿では,適切なAPI参照を検索する新たな組み合わせにより,LLMの予測を基礎とするDe-Hallucinatorを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:54:15 GMT)
Synthesizing PET images from High-field and Ultra-high-field MR images Using Joint Diffusion Attention Model [18.1] PETスキャンはコストが高く、放射性曝露を伴うため、PETが欠如する。
超高磁場イメージングは臨床と学術の両方で有用であることが証明されている。
高速MRIと超高磁場MRIの合成PET法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:09:55 GMT)
KU-DMIS at EHRSQL 2024:Generating SQL query via question templatization in EHR [18.0] 本稿では、ドメイン外質問とクエリ実行で生成されたクエリを堅牢に処理する新しいテキスト・ツー・ドメインフレームワークを提案する。
我々は,強力な大規模言語モデル (LLM) と細調整のGPT-3.5を用いて,EHRデータベースシステムのテーブルスキーマを含む詳細なプロンプトを出力する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:21:46 GMT)
Neural Residual Diffusion Models for Deep Scalable Vision Generation [17.9] 我々は,統一的かつ大規模に拡張可能なニューラルネットワーク残差拡散モデルフレームワーク(Neural-RDM)を提案する。
提案したニューラル残差モデルは、画像およびビデオ生成ベンチマークの最先端スコアを取得する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:57:18 GMT)
Neuro-symbolic Training for Reasoning over Spatial Language [17.9] 本稿では,推論の論理的ルールを制約として活用できる,ニューロシンボリックな手法による学習言語モデルを提案する。
テキストによる空間的推論という課題に焦点をあてる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:47:36 GMT)
Locating and Extracting Relational Concepts in Large Language Models [17.9] 我々は,事実記憶過程における因果解析を通じて,実体と関係概念を表現できる隠された状態を特定する。
その結果,リレーショナル表現はリライトによる制御可能なファクトリコールに有意な可能性を示唆している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:29:51 GMT)
Learning with 3D rotations, a hitchhiker's guide to SO(3) [17.8] 本論文は、回転表現によるサーベイおよびガイドとして機能する。
回転に基づく学習からの洞察を集約することにより、回転表現を用いた学習機能の包括的概要を提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:17:54 GMT)
Global-Local Convolution with Spiking Neural Networks for Energy-efficient Keyword Spotting [17.8] 我々は、ニューラルネットワークのエネルギー効率をスパイクし、エンドツーエンドの軽量KWSモデルを提案する。
1)グローバル・ローカル・スパイキング・コンボリューション (GLSC) モジュールと 2) Bottleneck-PLIF モジュールである。
Bottleneck-PLIFモジュールはさらにGLSCからの信号を処理し、より少ないパラメータで高い精度を達成する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:19:25 GMT)
WATT: Weight Average Test-Time Adaption of CLIP [17.7] 完全テスト時間適応の先駆的アプローチであるCLIPのウェイト平均テスト時間適応(WATT)について述べる。
提案手法では,CLIPの既存のフレームワークを拡張し,テキストプロンプトに多種多様なテンプレートを用いる。
本研究は,WATTが多様なデータセットにまたがる性能向上に有効であることを示すものである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:37:42 GMT)
Single-photon triggered quantum entanglement between two qubits or at least 2000 identical qubits [17.7] 2つの量子ビットと複数の同一量子ビットの直接状態における量子絡み合いに対する単光子光場の効果について検討する。
大きな量子ビット系では、励起状態の重みが基底状態の重みを超える場合や、全ての量子ビットが初期状態にある場合、単一の光子が絡み合うことができない。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:09:52 GMT)
Amphista: Accelerate LLM Inference with Bi-directional Multiple Drafting Heads in a Non-autoregressive Style [17.5] Amphistaは投機的復号化アルゴリズムであり、非自己回帰復号化パラダイムに準拠している。
本手法は自己回帰法よりも推論効率が高いことを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:53:39 GMT)
PowerPeeler: A Precise and General Dynamic Deobfuscation Method for PowerShell Scripts [17.4] サイバー攻撃者は、悪意のあるスクリプトを難読化するために様々なテクニックを使うことが多い。
既存の難読化ツールは静的解析の限界に悩まされている。
PowerPeelerは、命令レベルでの最初の動的スクリプトの難読化アプローチである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:42:55 GMT)
Enabling Large-Scale and High-Precision Fluid Simulations on Near-Term Quantum Computers [17.3] 量子計算流体力学(QCFD)は古典計算流体力学(CFD)に代わる有望な選択肢を提供する
本稿では,量子線形解法における誤りを抑制する反復的手法 "Iterative-QLS" を含む包括的QCFD法を提案する。
本手法を超伝導量子コンピュータに実装し,定常ポアゼイユ流と非定常音波伝搬のシミュレーションに成功した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:23:37 GMT)
ProG: A Graph Prompt Learning Benchmark [17.2] グラフプロンプト学習が「プレトレイン・ファインチューン」に代わる有望な選択肢として登場
グラフプロンプト学習のための総合ベンチマークを初めて導入する。
本稿では,さまざまなグラフプロンプトモデルの実行を合理化する,使いやすいオープンソースライブラリである'ProG'を紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:55:22 GMT)
EndoUIC: Promptable Diffusion Transformer for Unified Illumination Correction in Capsule Endoscopy [17.1] 本稿では,DFTモデルを用いたWCE統合照明補正ソリューションであるEndoUICを紹介する。
我々の研究では、照明プロンプトモジュールは、異なる露光レベルに適応し、ターゲット画像の強調を行うためにモデルをナビゲートする。
本稿では,専門写真家が注釈を付した地上構造と劣化画像のペアを含む,新しいカプセル・内視鏡露光補正データセットを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:58:28 GMT)
MISS: A Generative Pretraining and Finetuning Approach for Med-VQA [17.0] 本稿では,医療用VQAタスクのためのMultI-task Self-Supervised Learning based framework (MISS)を提案する。
我々は,テキストエンコーダとマルチモーダルエンコーダを統一し,マルチタスク学習を通じて画像テキスト機能を調整する。
提案手法は,より少ないマルチモーダルデータセットで優れた結果を得るとともに,生成VQAモデルの利点を実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:14:40 GMT)
Molecule Graph Networks with Many-body Equivariant Interactions [16.9] 等変ベクトル表現は、幾何データ対称性をキャプチャすることで、表現性を高める。
反対の2体結合ベクトルは、メッセージパッシング中に互いにキャンセルされ、方向情報が失われる可能性がある。
指向性情報を保存するために,同変多体インタラクションを明示的に統合するENINetを開発した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:53:09 GMT)
AGSOA:Graph Neural Network Targeted Attack Based on Average Gradient and Structure Optimization [16.7] グラフニューラルネットワーク(GNN)は、グラフに小さな摂動を加えることでパフォーマンス低下を引き起こす敵攻撃に対して脆弱である。
本稿では、平均勾配計算と構造最適化モジュールで構成されるAGSOAと呼ばれるGNNに対する攻撃を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:29:20 GMT)
Timely Communications for Remote Inference [16.7] リモート推論システムにおけるデータの鮮度の影響を解析する。
そこで本稿では,特徴の送出のための"selection-from-buffer"モデルを提案する。
また、推論性能を向上させるために、低複雑さスケジューリングポリシーを設計する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:09:20 GMT)
In-Context Learning on a Budget: A Case Study in Named Entity Recognition [16.7] 事前定義された予算内でアノテートするサンプルを選択するための様々な方法について検討する。
注釈付きサンプルの比較的小さなプールは、トレーニングセット全体の使用に匹敵する結果が得られることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:09:46 GMT)
Instances and Labels: Hierarchy-aware Joint Supervised Contrastive Learning for Hierarchical Multi-Label Text Classification [16.3] 我々は、教師付きコントラスト学習とHMTCのギャップを埋める、$textbfH$ierarchy-aware $textbfJ$oint Supervised $textbfC$ontrastive $textbfL$法を提案する。
4つのマルチパスHMTCデータセットの実験により、HJCLが有望な結果とHMTCにおけるコントラスト学習の有効性を実証した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:59:14 GMT)
CaMML: Context-Aware Multimodal Learner for Large Models [16.3] 大規模マルチモーダルモデル(LMM)をチューニングするためのコンテキスト認識型マルチモーダル学習器(CaMML)を導入する。
CaMMLは、マルチモーダルなコンテキストサンプルを大きなモデルにシームレスに統合し、類似したドメイン固有の最新の情報から知識を引き出すことができるように設計されている。
CaMMLに基づく2つのマルチモーダルモデルであるCaMML-7BとCaMML-13Bを開発した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:29:41 GMT)
LLMs Are Zero-Shot Context-Aware Simultaneous Translators [16.3] 大きな言語モデル(LLM)が注目されているのは、その汎用性と幅広い言語タスクにおける強力なパフォーマンスのおかげでである。
ここでは,オープンソースのLLMが同時機械翻訳(SiMT)タスクにおいて,最先端のベースラインと同等以上の性能を発揮することを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:57:42 GMT)
Mitigating Social Biases in Language Models through Unlearning [16.2] 言語モデル(LM)におけるバイアスの緩和は、LMが広く展開されているため、重大な問題となっている。
そこで我々は,(1)デコーダモデルに適用したPCGU(Partitioned Contrastive Gradient Unlearning)と(2)タスクベクトルによる否定(Negation)の2つの非学習手法について検討する。
LLaMA-27Bでは、タスクベクトルによる否定はバイアススコアを11.8%削減する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:38:34 GMT)
Sparse High Rank Adapters [16.2] ローランク適応(LoRA)は、最近の生成AI研究で大きな注目を集めている。
提案するSparse High Rank Adapters (SHiRA) は,推論オーバーヘッドを伴わず,高速な切り替えが可能で,概念の損失を大幅に低減する新しいパラダイムである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:13:11 GMT)
CodeGemma: Open Code Models Based on Gemma [16.1] 私たちは、Gemma上に構築された特別なオープンコードモデルのコレクションであるCodeGemmaを紹介します。
CodeGemma 7B pretrained (PT) と instruction-tuned (IT) の変種は、非常に弾力的な自然言語理解を持っている。
CodeGemma 2Bは、レイテンシに敏感な設定で高速なコード入力とオープンな生成のために設計された、最先端のコード補完モデルである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:37:50 GMT)
A Survey of Data-Efficient Graph Learning [16.1] 研究フロンティアとして,データ効率グラフ学習(DEGL)の新たな概念を紹介した。
我々は、自己教師付きグラフ学習、半教師付きグラフ学習、少数ショットグラフ学習など、いくつかの重要な側面に関する最近の進歩を体系的にレビューした。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:34:24 GMT)
SwinGNN: Rethinking Permutation Invariance in Diffusion Models for Graph Generation [16.0] 置換同変ネットワークに基づく拡散モデルは、グラフデータの置換不変分布を学習することができる。
我々は、効率的なエッジツーエッジ2-WLメッセージパッシングネットワークを利用する、$textitSwinGNN$と呼ばれる不変な拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:48:13 GMT)
Lockpicking LLMs: A Logit-Based Jailbreak Using Token-level Manipulation [15.9] JailMineは、大規模な言語モデルから悪意ある応答を引き出すために、自動化された"マイニング"プロセスを採用している。
JailMineの有効性と効率を実証し、使用時間の86%の大幅な削減を実現した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:51:06 GMT)
Distinguishing a maximally entangled basis using LOCC and shared entanglement [15.7] 本稿では,LOCC(ローカル操作と古典通信)と資源として機能する部分的絡み合い状態との相違を考察する。
最適成功確率の正確な式を導出し、それが資源状態の完全絡み合った分数に対応することを発見する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:44:51 GMT)
Multimodal Sentiment Analysis with Missing Modality: A Knowledge-Transfer Approach [15.5] マルチモーダル感情分析は、視覚的、言語的、音響的手がかりを通じて、個人が表現する感情を特定することを目的としている。
既存の研究努力の多くは、すべてのモダリティがトレーニングとテストの両方で利用可能であり、そのアルゴリズムが欠落したモダリティシナリオに影響を受けやすいと仮定している。
本稿では,欠落した音声のモダリティを再構築するために,異なるモダリティ間の翻訳を行う新しいナレッジ・トランスファーネットワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:52:24 GMT)
Controlling Forgetting with Test-Time Data in Continual Learning [15.5] 継続学習研究は、新しい知識が得られたときの過去の情報の破滅的な忘れを克服する技術を提供する。
テストタイムデータには,従来の学習タスクのモデルメモリをリフレッシュするために,自己管理的な方法で活用できる優れた情報がある,と我々は主張する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:56:21 GMT)
DCS Chain: A Flexible Private Blockchain System [15.4] この研究は、DCS Chainという新しいプライベートブロックチェーンシステムを導入している。
中心となる考え方は、DCSメトリクスを定量化し、これらの3次元にわたってブロックチェーンのパフォーマンスを動的に調整することだ。
全体として、当社のシステムはDCS定量化、コンセンサスプロトコル調整、通信ネットワークシミュレーションなど、ブロックチェーン必需品の包括的なスイートを提供しています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:09:27 GMT)
Remembering to Be Fair: Non-Markovian Fairness in Sequential Decision Making [15.3] 我々は、連続的な意思決定の文脈における非マルコフ的公正の概念を探求する。
非マルコフ的フェアネスの性質を同定し、長期的、時空的、周期的、有界公正の概念を含む。
フェアポリシの合成において,サンプル効率を向上させるために,トレーニングデータを自動的に拡張するFairQCMアルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:29:19 GMT)
InstructRAG: Instructing Retrieval-Augmented Generation with Explicit Denoising [14.7] InstructRAGを提案する。そこでは、LMが自己合成的理性を通して認知過程を明示的に学習する。
インストラクションRAGは追加の監視を必要としないため、予測された回答の検証が容易になる。
実験によると、InstructRAGはトレーニング不要とトレーニング可能な両方のシナリオにおいて、既存のRAGメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:25:29 GMT)
AdaMoE: Token-Adaptive Routing with Null Experts for Mixture-of-Experts Language Models [14.6] 我々はAdaMoEを導入し、MoEのトークン適応ルーティングを実現する。
AdaMoEは各トークンに一定数のnullエキスパートを占有させません。
パフォーマンスを向上しながら、平均的な専門家負荷(FLOP)を削減できます。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:47:10 GMT)
Smurfs: Leveraging Multiple Proficiency Agents with Context-Efficiency for Tool Planning [14.6] Smurfs'は、大規模言語モデルの応用に革命をもたらすために設計された最先端のマルチエージェントフレームワークである。
Smurfは、余分なコストなしで複雑なタスクを解くモデルの能力を高めることができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:18:12 GMT)
GVT2RPM: An Empirical Study for General Video Transformer Adaptation to Remote Physiological Measurement [14.4] トレーニング設計,すなわちデータ前処理とネットワーク構成が,RPMに適用されたモデル性能に与える影響について検討する。
ビデオ変換器の構造に基づいて、信号特徴抽出に必要なRPMの高密度時間情報と整合するように、その時間的階層を設定する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:59:27 GMT)
Semantic Structure-Mapping in LLM and Human Analogical Reasoning [14.4] アナロジカル推論は人間の学習と認知の中核であると考えられている。
近年の研究では、抽象的なシンボル操作タスクにおいて、人体の類似推論能力とLLM(Large Language Models)を比較している。
言語を非言語的領域にリンクする類似性を引き出す能力は、言語習得とより広範な認知発達において重要な役割を担っていると考えられている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:07:37 GMT)
A Study on the Effect of Color Spaces in Learned Image Compression [14.4] 本稿では,YUV,LAB,RGBなどの色空間と,学習画像の圧縮に対する効果の比較を行った。
先行研究から得られた構造と色に基づく学習画像%(SLIC)は、輝度成分(Y, L)と色成分(UV, AB)の2つの枝から構成される。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:05:28 GMT)
ModSec-Learn: Boosting ModSecurity with Machine Learning [14.4] ModSecurityは、標準のオープンソースWebアプリケーションファイアウォール(WAF)として広く認識されている。
コアルールセット(CRS)ルールを入力として使用する機械学習モデルを提案する。
ModSec-Learnは、予測にそれぞれのCRSルールのコントリビューションをチューニングできるため、Webアプリケーションに対する重大度レベルを保護できる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:32:47 GMT)
Evidence-Focused Fact Summarization for Knowledge-Augmented Zero-Shot Question Answering [14.4] 本稿では,QA(Quesetion Answering)の性能向上を目的とした,エビデンスに着目したFact SummarizationフレームワークであるEFSumを提案する。
実験の結果,EFSumはLDMのゼロショットQA性能を向上することがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:47:32 GMT)
Quantifying non-Hermiticity using single- and many-particle quantum properties [14.4] 量子系の非エルミート的パラダイムは、エルミート的パラダイムとは大きく異なる有能な特徴を示す。
単体および多粒子量子特性に対して、これらの左右のアンサンブルの(dis-)相似性を定量化する形式論を提案する。
我々の発見は、非エルミート量子多体系の新しいエキゾチック量子相を明らかにするのに役立てることができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:04:47 GMT)
The Surprising Benefits of Base Rate Neglect in Robust Aggregation [14.3] 私たちの仕事は、基準レートを無視する傾向のある専門家を考慮に入れています。
ある程度のベースレートの無視は、堅牢な予測アグリゲーションに役立ちます。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:20:29 GMT)
CoSLight: Co-optimizing Collaborator Selection and Decision-making to Enhance Traffic Signal Control [14.1] 既存の作業は主に近隣の交差点を協力者として選択している。
我々は,共同作業者選択を学習すべき第2の方針として分離することを提案する。
具体的には、リアルタイムで選択ポリシーは、フェーズレベルと交差点レベルの特徴に応じて、最適なチームメイトを適応的に選択する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:07:02 GMT)
Unveiling and Mitigating Bias in Mental Health Analysis with Large Language Models [14.0] GPT-4 は大規模言語モデル (LLM) における性能と公平性において最高の総合バランスであることを示す。
フェアネスを意識した私たちのプロンプトは、メンタルヘルスの予測を効果的にバイアスし、この分野におけるフェアネス分析の大きな可能性を浮き彫りにします。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:28:22 GMT)
DialSim: A Real-Time Simulator for Evaluating Long-Term Dialogue Understanding of Conversational Agents [13.9] リアルタイム対話シミュレータであるDialSimを紹介する。
本シミュレータでは、人気番組のキャラクターの役割をエージェントに割り当てる。
DialSimの主な特徴は、適切な時間内に応答するエージェントの能力を評価することである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:37:10 GMT)
Evaluating Structural Generalization in Neural Machine Translation [13.9] SGETは,単語や文構造を制御して,様々な種類の合成一般化を包含するデータセットである。
ニューラルネットワーク翻訳モデルは、語彙的一般化よりも構造的一般化に苦慮していることを示す。
また、セマンティック解析と機械翻訳において、様々なタスクにおける評価の重要性を示す様々なパフォーマンストレンドを見出した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:09:11 GMT)
LLM-Enhanced Bayesian Optimization for Efficient Analog Layout Constraint Generation [13.9] 本稿では,アナログレイアウト合成のためのtexttLLANA フレームワークを提案する。
アナログ設計に依存したパラメータ制約をより効率的に生成するために、LLM(Large Language Models)の少数ショット学習能力を利用する。
その結果、textttLLANAは、最先端(SOTA)BO法に匹敵する性能を達成するだけでなく、アナログ回路設計空間をより効果的に探索できることを示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:49:26 GMT)
Controllable and Gradual Facial Blemishes Retouching via Physics-Based Modelling [13.7] CGFR
我々のCGFRは物理的モデリングに基づいており、メラニンとヘモグロビンの色空間における皮膚下散乱を近似するために、Sum-of-Gaussianを採用している。
実際の臨床データに基づく実験結果は、CGFRがブレンディッシュの段階的回復過程を現実的にシミュレートできることを示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:28:52 GMT)
SUGARCREPE++ Dataset: Vision-Language Model Sensitivity to Semantic and Lexical Alterations [13.6] SuGARCREPE++データセットを導入し、視覚・言語モデルのセマンティックな変化に対する感度を解析する。
SuGARCREPE++では,構成性データセットの性能向上に寄与するすべてのモデルが同等に動作しないことを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:03:42 GMT)
Listenable Maps for Audio Classifiers [13.6] 本稿では,忠実で聞きやすい解釈を生成するポストホック解釈法であるリスナブル・マップ・フォー・オーディオ(L-MAC)を紹介する。
L-MACは、事前訓練された分類器の上のデコーダを使用して、入力オーディオの関連部分をハイライトするバイナリマスクを生成する。
L-MACは複数の勾配法やマスキング法よりも忠実な解釈を一貫して生成することを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:49:14 GMT)
Framing Social Movements on Social Media: Unpacking Diagnostic, Prognostic, and Motivational Strategies [13.5] 私たちは、2018-2019年の3つの問題(銃、移民、LGBTQの権利)を取り巻く社会運動からのTwitterメッセージに焦点を当てています。
コードブック、注釈付きデータセット、計算モデルを作成し、診断(確率的識別と属性)、予測(提案された解決策と戦術)、モチベーション(行動を呼び起こす)フレーミング戦略を検出する。
例えば、診断フレーミングはオリジナルの放送投稿よりも回答の方が一般的であり、社会運動組織はジャーナリストや一般市民よりも予後や動機づけのフレーミングに重点を置いていることが示される。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:31:34 GMT)
Understanding Understanding: A Pragmatic Framework Motivated by Large Language Models [13.3] チューリングテストの手法では、このフレームワークはエージェントのパフォーマンスのみをベースとしており、特にその答えの正確さに基づいている。
ランダムサンプリングによる高い信頼度と確率的信頼境界の適用性を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:34:21 GMT)
Multimodal MRI-based Detection of Amyloid Status in Alzheimer's Disease Continuum [13.2] Amyloid-$beta$ plaquesはアルツハイマー病(AD)の神経病理学的特徴である
この目的のためには、主にアミロイドPET画像に依存する深層学習法が用いられている。
我々は,AD連続体におけるA$beta$状態を識別するために,構造,機能,拡散MRIデータからの情報を統合する新しいマルチモーダルアプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:51:21 GMT)
An interpretable generative multimodal neuroimaging-genomics framework for decoding Alzheimer's disease [13.2] アルツハイマー病(英語: Alzheimer's disease、AD)は認知能力の低下が進行する認知症である。
本研究では, 構造的, 機能的MRIを用いて, 病原性灰白質と機能的ネットワーク接続性の変化について検討した。
本稿では,Cycle GANsを用いた生成モジュールを,潜伏空間内の欠落データをインプットするために採用した,新しいディープラーニングに基づく分類フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:31:47 GMT)
Advancing Retail Data Science: Comprehensive Evaluation of Synthetic Data [13.1] 本稿では, 総合的な小売データ評価フレームワークを導入し, 忠実度, 実用性, プライバシに着目した。
提案手法は連続データ属性と離散データ属性を区別し,正確な評価基準を提供する。
以上の結果から,このフレームワークが総合小売データに対して信頼性およびスケーラブルな評価を提供することが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:47:38 GMT)
Low Latency Visual Inertial Odometry with On-Sensor Accelerated Optical Flow for Resource-Constrained UAVs [13.0] オンセンサーハードウェアアクセラレーションは、低遅延視覚慣性オドメトリー(VIO)を実現するための有望なアプローチである
本稿では,グローバルシャッターカメラとアプリケーション固有集積回路(ASIC)を組み合わせたコンパクトなOFセンサを利用したVIOセンサシステムの高速化について検討する。
VINS-Monoパイプラインの機能追跡ロジックをこのOFカメラのデータに置き換えることで、49.4%のレイテンシの削減と、元のVINS-Mono実装よりも53.7%の計算負荷の削減を実証した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:51:19 GMT)
Feature learning as alignment: a structural property of gradient descent in non-linear neural networks [13.0] ニューラルネットワークは特徴学習を通じて入力ラベル対から統計を抽出することを示す。
このアライメントは,SGDによって誘導される重量変化と,前活性化機能との相互作用によって引き起こされることが確認された。
我々は、任意の層におけるNFA相関を劇的に向上させ、学習した特徴の質を向上させるための単純な最適化ルールを導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:56:30 GMT)
ElicitationGPT: Text Elicitation Mechanisms via Language Models [12.9] 本稿では,大規模言語モデルに対するドメイン知識のないクエリを用いて,提案したテキストを真理テキストに対してスコアリングする機構について述べる。
ピアグレーディングデータセットからのピアレビューと、ピアレビューのマニュアルインストラクタースコアとの比較により、経験的評価を行う。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:12:35 GMT)
Challenges in Binary Classification [12.8] カーネル関数の選択は経験的であり、カーネル関数は最適でない可能性がある。
線形分類では、SVMがこの変分問題フレームワークの特別な場合であると推測できる。
ユークリッド距離について、提案された変分問題には非線形分類にいくつかの制限があることが証明されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:11:59 GMT)
Textual Unlearning Gives a False Sense of Unlearning [12.8] 言語モデル(LM)は、大量のプライベートまたは著作権保護されたコンテンツを含むトレーニングデータを「記憶する」ことができる。
本研究では,学習前後のモデルにアクセスするだけで,学習者が未学習データに関する情報を推測できるテクスチュアル・アンラーニング・リーク・アタック(TULA)を提案する。
私たちの研究は、LMにおける機械学習の非学習が、逆により大きな知識リスクを生み出し、より安全な非学習メカニズムの開発を促すことを初めて明らかにしたものです。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:51:54 GMT)
An evidential time-to-event prediction model based on Gaussian random fuzzy numbers [12.8] 検閲データを用いた時間-時間予測のための明らかなモデルを提案する。
事象時間の不確かさはガウス乱ファジィ数によって定量化される。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:14:45 GMT)
SpatialBot: Precise Spatial Understanding with Vision Language Models [12.7] 視覚言語モデル (VLM) は2次元画像理解において優れた性能を発揮している。
彼らはまだ、Embodied AIの基盤である空間的理解に苦戦している。
本稿では,RGB画像と深度画像の両方をフィードすることで,空間的理解を向上させるためのSpatialBotを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:41:30 GMT)
The Impact of Auxiliary Patient Data on Automated Chest X-Ray Report Generation and How to Incorporate It [12.6] 本研究は,胸部X線自動レポート生成のための多モーダル言語モデルへの多様な患者データソースの統合について検討する。
MIMIC-CXRおよびMIMIC-IV-EDデータセットを用いて, 診断精度を高めるために, バイタルサイン周期, 医薬, 臨床歴などの詳細な患者情報を組み込んだ。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:25:31 GMT)
Stabilizing the Kerr arbitrary cat states and holonomic universal control [12.6] 任意の猫状態を安定化し、重畳されたコヒーレント状態を独立に操作し、相空間で任意に動く新しい工学的ハミルトン的手法を提案する。
我々はコヒーレント状態と衝突状態の量子ホロノミーを利用した普遍ホロノミック量子コンピューティングプロトコルを開発した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:32:14 GMT)
EvTexture: Event-driven Texture Enhancement for Video Super-Resolution [12.5] イベントベースの視覚は、高時間分解能や高ダイナミックレンジなどの独特の特徴により、注目されている。
本稿では,テクスチャ強化のためのイベント信号を利用した最初のVSR手法を提案する。
我々の手法はEvTextureと呼ばれ、VSRのテクスチャ領域をよりよく復元するためにイベントの高周波詳細を利用する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:27:44 GMT)
Strengthening Layer Interaction via Dynamic Layer Attention [12.3] 既存のレイヤーアテンション手法は固定された特徴写像上の層間相互作用を静的に達成する。
注意機構の動的コンテキスト表現能力を復元するために,動的レイヤアテンションアーキテクチャを提案する。
実験の結果,提案したDLAアーキテクチャの有効性が示され,画像認識や物体検出タスクにおける他の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:35:14 GMT)
Dr.E Bridges Graphs with Large Language Models through Words [12.2] 本稿では,Dr.E(Deal-Residual Vector Quantized-Variational AutoEncoder)を用いたエンドツーエンドのモダリティ調整フレームワークを提案する。
このフレームワークは,大規模言語モデル(LLM)とのトークンレベルのアライメントを容易にするように設計されている。
標準GNNノード分類タスクの評価は、他の最先端手法と競合する性能を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:43:56 GMT)
Multi-intention Inverse Q-learning for Interpretable Behavior Representation [12.1] 逆強化学習(IRL)法は、複雑な行動の基礎となる動物の意図を再構築するのに役立つことが証明されている。
階層型逆Q-ラーニング(HIQL)アルゴリズムのクラスを紹介する。
シミュレーション実験と実際の動物行動データセットにHIQLを適用することで、我々のアプローチは行動予測の現在のベンチマークよりも優れています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:55:34 GMT)
Situational Instructions Database: Task Guidance in Dynamic Environments [12.0] 状況インストラクションデータベース(SID)は、動的環境で動作する人工知能(AI)システムにおいて、状況認識の強化の必要性に対処する。
SIDは、コンテキスト感度と運用精度を改善して、AIシステムが複雑な現実世界のタスクを実行できる新しいデータセットを提供する。
SIDは研究と開発に利用でき、複雑な環境でインテリジェントシステムの能力を向上するための重要なリソースとして機能する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:42:48 GMT)
Stability and Generalizability in SDE Diffusion Models with Measure-Preserving Dynamics [11.9] 逆問題では、測定やデータから因果因子を推定する過程を記述する。
拡散モデルは、逆問題を解決する強力な生成ツールとして期待されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:55:12 GMT)
R^2AG: Incorporating Retrieval Information into Retrieval Augmented Generation [11.9] Retrieval augmented generation (RAG) は、検索者によって提供される外部文書で大規模言語モデル(LLM)を拡張するために、多くのシナリオで適用されてきた。
本稿では,R$2$AGを提案する。R$2$AGは,検索情報を検索用拡張生成に組み込む新しい拡張RAGフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:19:48 GMT)
Anatomically-Controllable Medical Image Generation with Segmentation-Guided Diffusion Models [11.8] 解剖学的に制御可能な医用画像生成を支援する拡散モデルに基づく手法を提案する。
また, ランダムマスクアブレーショントレーニングアルゴリズムを導入し, 解剖学的制約の組合せの条件付けを可能にする。
SegGuidedDiffは、生成した画像の忠実さを新たな最先端に到達して、解剖学的マスクを入力します。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:10:31 GMT)
DiLA: Enhancing LLM Tool Learning with Differential Logic Layer [11.8] 本稿では,ネットワーク層の前方・後方通過に論理的制約を組み込むディファレンシャル・ロジック・レイヤ支援言語モデリング(DiLA)手法を提案する。
2つの古典的推論問題に対するDiLAの性能評価を行い、既存のプロンプトベースおよびソルバ支援アプローチに対する一貫した性能を実証した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:52:00 GMT)
RSAdapter: Adapting Multimodal Models for Remote Sensing Visual Question Answering [11.8] 本稿では,実行時間とパラメータの効率を優先するRSAdapterという新しい手法を提案する。
RSAdapterの有効性を示すため、3つの異なるRS-VQAデータセットを用いて大規模な実験を行った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:39:49 GMT)
VLPrompt: Vision-Language Prompting for Panoptic Scene Graph Generation [11.8] Panoptic Scene Graph Generation (PSG) は、オブジェクトをセグメント化し、オブジェクト間の関係を予測することで、包括的な画像理解を実現することを目的としている。
以前の手法は主に視覚情報に依存するか、オブジェクトや関係名などの限られた言語情報を利用する。
言語情報を用いて関係予測,特に稀な関係の予測を支援することを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:48:35 GMT)
Heterogeneous Graph Neural Networks with Post-hoc Explanations for Multi-modal and Explainable Land Use Inference [11.8] 本稿では、異種グラフニューラルネットワーク(HGN)と説明可能なAI技術を組み合わせた土地利用推定のための説明可能なフレームワークを提案する。
実験により、提案したHGNは6つの土地利用指標すべてに対して、ベースライングラフニューラルネットワークを著しく上回っていることが示された。
これらの分析は,提案したHGNが都市計画や政策立案において,都市利害関係者を適切に支援できることを示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:39:10 GMT)
Do Multimodal Foundation Models Understand Enterprise Workflows? A Benchmark for Business Process Management Tasks [11.7] 既存のMLベンチマークには、ビジネスプロセス管理(BPM)タスクのモデルを評価するのに必要なアノテーションの深さと多様性が欠けている。
我々のベンチマークでは、最先端のFMはドキュメンテーションを自動的に生成できるが、ワークフロー補完のよりきめ細かい検証に向けてその知識を再適用するのに苦労している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:50:15 GMT)
Advancing UWF-SLO Vessel Segmentation with Source-Free Active Domain Adaptation and a Novel Multi-Center Dataset [11.5] UWF-SLO画像における正確な血管セグメンテーションは網膜疾患の診断に不可欠である。
高い解像度のUWF-SLO画像を手動でラベル付けすることは、非常に難しく、時間がかかり、高価な作業である。
本研究では、パッチベースのアクティブドメイン適応アプローチを活用する先駆的なフレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:49:06 GMT)
Every Language Counts: Learn and Unlearn in Multilingual LLMs [11.4] 本稿では,多言語大言語モデル(LLM)における有害情報の伝播について検討する。
フェイク情報は、どのような言語であっても、異なる言語にまたがって広がり、生成されたコンテンツの完全性と信頼性を損なう。
標準のアンラーニング技術は、典型的には英語データに焦点を当てるが、多言語文脈における有害なコンテンツの拡散を緩和するには不十分である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:01:08 GMT)
Constructing and Evaluating Digital Twins: An Intelligent Framework for DT Development [11.4] デジタルツインズ(DT)の開発は、制御されたデジタル空間における複雑なシステムをシミュレートし最適化するための変革的な進歩を表している。
本稿では,アルゴリズム性能試験におけるDTの精度と有用性を高めるために,DTの構築と評価のためのインテリジェントなフレームワークを提案する。
本稿では,Deep Learning-based policy gradient techniqueを統合してDTパラメータを動的に調整し,物理システムのデジタル複製における高い忠実性を確保する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:45:18 GMT)
Recurrent Inference Machine for Medical Image Registration [11.4] 本稿では,リカレント推論画像登録(RIIR)ネットワークと呼ばれる新しい画像登録手法を提案する。
RIIRは、メタラーニングによる登録問題の解法として反復的に定式化される。
実験の結果、RIIRはトレーニングデータの5%しか持たない深層学習法よりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:06:35 GMT)
HuBERT-EE: Early Exiting HuBERT for Efficient Speech Recognition [11.2] 我々は、モデルが推論を動的に停止することを可能にするASRの早期終了スキーム、すなわちHuBERT-EEを導入する。
LibriSpeechの実験結果によると、HuBERT-EEは性能とレイテンシのトレードオフを同時にバランスしながら、HuBERTの推論を加速できる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:39:15 GMT)
MCAD: Multi-modal Conditioned Adversarial Diffusion Model for High-Quality PET Image Reconstruction [11.1] 標準線量ポジトロン放射トモグラフィ(SPET)画像に関連する放射線の危険性は依然として懸念されている。
低線量PET(LPET)画像の品質は臨床要件を満たしていない。
マルチモーダル入力からSPETイメージを再構成するためのMCAD(Multi-modal Conditioned Adrial Diffusion Model)を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:53:40 GMT)
Attention-aware Post-training Quantization without Backpropagation [11.1] 量子化は、リソース制約のあるデバイスに大規模言語モデルをデプロイするための有望なソリューションである。
既存の量子化アプローチは勾配に基づく最適化に依存している。
バックプロパゲーションに頼らずに層間依存関係を考慮した新しいPTQアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:53:21 GMT)
On the Convergence of Federated Learning Algorithms without Data Similarity [11.1] 本稿では,データ類似性条件を必要とせずに,フェデレーション学習アルゴリズムの収束を解析するための新しい枠組みを提案する。
我々は,3つの広く使用されているステップサイズスケジュール(固定,縮小,ステップデカイステップサイズ)の正確な表現を導出する。
その結果,収束速度と全体的な性能は著しく向上した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:21:15 GMT)
Evaluation of Missing Data Analytical Techniques in Longitudinal Research: Traditional and Machine Learning Approaches [11.0] 本研究ではモンテカルロシミュレーションを用いて,成長曲線モデリングフレームワークにおけるデータ不足に対する6つの解析手法の有効性を評価・比較する。
本研究では,サンプルサイズ,データ速度の欠如,データメカニズムの欠如,データ分布がモデル推定の精度と効率に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:20:30 GMT)
LangTopo: Aligning Language Descriptions of Graphs with Tokenized Topological Modeling [10.9] 本稿では,グラフ構造モデリングと自然言語理解をトークンレベルで整合させるLangTopoを紹介する。
複数のデータセットに対して提案手法の有効性を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:20:22 GMT)
Enhancing Collaborative Semantics of Language Model-Driven Recommendations via Graph-Aware Learning [10.9] 大規模言語モデル(LLM)は、レコメンデーションシステムドメインにおいてますます顕著になっている。
Gal-Recは、グラフニューラルネットワーク(GNN)の意図を模倣することで、ユーザとイテムの協調的意味論の理解を強化する
Gal-Recはコラボレーティブセマンティクスの理解を大幅に強化し、レコメンデーションパフォーマンスを向上させる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:50:15 GMT)
Identifiable Causal Representation Learning: Unsupervised, Multi-View, and Multi-Environment [10.8] 因果表現学習は、機械学習のコアとなる強みと因果性を組み合わせることを目的としている。
この論文は、CRLが直接の監督なしに何が可能であるかを調査し、理論的基礎に寄与する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:14:40 GMT)
Explaining time series models using frequency masking [10.7] 時系列データは、医療、金融、気候など多くの重要な領域を記述する上で重要である。
正当性マップを得るための現在の方法は、生の入力空間における局所的な情報を仮定する。
本稿では、FreqRISEを提案する。FreqRISEは、マスキングに基づく手法を用いて、周波数領域と時間周波数領域の説明を生成する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:19:59 GMT)
Bayes' capacity as a measure for reconstruction attacks in federated learning [10.5] 定量的情報フローの情報理論フレームワークを用いて,再構成脅威モデルを定式化する。
我々は,シブソンの次数無限性の相互情報に関連するベイズの能力が,DP-SGDアルゴリズムの逆数へのリークの密接な上限を表していることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:58:42 GMT)
Language Models are Surprisingly Fragile to Drug Names in Biomedical Benchmarks [10.4] 我々はRABBITSという新しいデータセットを作成し、ブランド名とジェネリックドラッグ名を取り替えた後、医療ベンチマークのパフォーマンス差を評価する。
MedQA と MedMCQA のオープンソース LLM と API ベースの LLM を比較し,一貫した性能低下が 1-10% に及んでいることを明らかにした。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:59:41 GMT)
Trapezoidal Gradient Descent for Effective Reinforcement Learning in Spiking Networks [10.4] 低消費電力特性と性能を持つスパイキングニューラルネットワーク(SNN)が注目を集めている。
強化学習の実践的応用の省エネを図るため,Pop-SAN と MDC-SAN のアルゴリズムが提案されている。
本稿では,スパイクネットワークの代替として,従来の安定した学習状態を保ちつつ,様々な信号力学下でのモデルの適応性と応答感度を高めることを目的とした,台形近似勾配法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:56:22 GMT)
Image Distillation for Safe Data Sharing in Histopathology [10.4] 病理組織学は、臨床医が正確な診断を行い、疾患の予後を判断し、適切な治療戦略を立案するのに役立つ。
深層学習技術が医療分野で成功していることが証明されるにつれ、主な課題はデータ可用性の制限とデータ共有とプライバシに関する懸念である。
私たちは、制約なしに共有できる必須情報をカプセル化する小さな合成データセットを作成します。
我々は,潜在拡散モデルを訓練し,少数の可読性合成画像を用いた新しい蒸留合成データセットを構築した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:19:08 GMT)
Learning from Emergence: A Study on Proactively Inhibiting the Monosemantic Neurons of Artificial Neural Networks [10.4] オンライン計算の効率性を保証するため,ニューロンのモノセマンティリティを測定するための新しい指標を提案する。
モノセマンティリティが異なるモデルスケールで性能変化をもたらすという予想を検証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:18:00 GMT)
LLM4Decompile: Decompiling Binary Code with Large Language Models [10.3] Decompilationはバイナリコードを高レベルのソースコードに変換することを目的としているが、Ghidraのような従来のツールでは読み書きが難しい場合が多い。
LLM4Decompileは,バイナリコードのデコンパイルを訓練した最初の,かつ最大のオープンソースLLMシリーズ(1.3Bから33B)である。
その結果、GPT-4oとGhidraをHumanEvalとExeBenchベンチマークで100%以上上回った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:45:03 GMT)
VisualRWKV: Exploring Recurrent Neural Networks for Visual Language Models [10.3] 線形RNNモデルのマルチモーダル学習タスクへの最初の応用であるVisualRWKVを紹介する。
モデリング能力を高めるために,データ依存の再現とサンドイッチプロンプトを提案する。
VisualRWKVは、様々なベンチマークでLLaVA-1.5のようなTransformerベースのモデルと比較して、競争力がある。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:07:31 GMT)
Are Logistic Models Really Interpretable? [10.2] 最も単純なAI分類モデルの1つ、ロジスティック回帰は、そのモデルの重みを控えめに解釈する。
ユーザスタディを通じて、熟練した参加者が小さなLRモデルの動作を確実に再現できないことを示す。
線形加法モデル(LAM)はロジスティックモデルよりも解釈可能である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:36:38 GMT)
Dynamic Speculation Lookahead Accelerates Speculative Decoding of Large Language Models [10.2] DISCOは投機的ルックアヘッド(SL)を動的に選択する新しい手法である。
4つのデータセットによる実験により、disCOは最高の静的SLベースラインに比べて平均10%のスピードアップに達することが示された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:54:51 GMT)
Contrast Sets for Evaluating Language-Guided Robot Policies [10.1] 我々は、ロボット工学のコントラストセットを導入して、独立で同一の分散テストインスタンスに対して、小さく、しかし特異な摂動を発生させる。
我々はコントラストセットを用いて、シミュレーション操作タスクと物理ロボットの視覚・言語ナビゲーションタスクの両方において、実験者の作業を減らし、ポリシーを特徴づける。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:31:21 GMT)
Probing the Emergence of Cross-lingual Alignment during LLM Training [10.1] 多言語大言語モデル(LLM)は、ゼロショットの多言語間転送性能を著しく向上させる。
本研究では,LLMの事前学習において,このような言語間アライメントがどのように出現するかを検討する。
ニューロンの重なり合いと下流性能の相関関係を観察する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:31:59 GMT)
Enhance the Image: Super Resolution using Artificial Intelligence in MRI [10.0] 本章では,MRIの空間分解能向上のためのディープラーニング技術の概要を紹介する。
深層学習に基づくMRI超解像の実現可能性と信頼性に関する課題と今後の展望について論じる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:19:41 GMT)
Leveraging Large Language Models to Measure Gender Bias in Gendered Languages [10.0] 本稿では,スペイン語コーパスにおけるジェンダー表現を定量的に分析するために,大規模言語モデル(LLM)の文脈理解機能を活用する新しい手法を提案する。
その結果,男女比が4:01の有意差があることが判明した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:30:58 GMT)
Archive-based Single-Objective Evolutionary Algorithms for Submodular Optimization [9.9] 我々は、制約付き部分モジュラー問題の異なるクラスに対して証明可能な成功を収めた、初めての単目的アルゴリズムを紹介する。
私たちのアルゴリズムは$(lambda)$-EAと$(+1)$-EAの変種です。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:08:12 GMT)
A Catalyst Framework for the Quantum Linear System Problem via the Proximal Point Algorithm [9.8] 古典的近位点法(PPA)に着想を得た量子線形系問題(QLSP)に対する新しい量子アルゴリズムを提案する。
提案手法は,既存のtexttimattQLSP_solverを経由した修正行列の逆変換が可能なメタアルゴリズムとみなすことができる。
ステップサイズ$eta$を慎重に選択することにより、提案アルゴリズムは線形システムに対して、以前のアプローチの適用性を阻害する条件数への依存を軽減するために、効果的に事前条件を定めることができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:15:35 GMT)
Root Cause Localization for Microservice Systems in Cloud-edge Collaborative Environments [9.7] マイクロサービスベースのソフトウェアシステムは、障害発生時の根本原因を正確に特定する上で、課題に直面します。
我々は,クラウドエッジの協調環境において,カーネルとアプリケーションレベルで根本原因をピンポイントする新しいアプローチであるMicroCERCLを提案する。
このような環境では、MicroCERCLはマイクロサービスシステムの根本原因を正確にローカライズすることができ、最先端のアプローチよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:49:37 GMT)
Evaluating the Performance of ChatGPT for Spam Email Detection [9.6] 本研究は,ChatGPTの英語および中国語のメールデータセットにおけるスパム識別能力を評価することを目的とする。
In-context Learning を用いたスパムメール検出にはChatGPT を用いる。
また,実演回数がChatGPTの性能に与える影響についても検討した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:49:09 GMT)
AntibodyFlow: Normalizing Flow Model for Designing Antibody Complementarity-Determining Regions [9.4] セラピー抗体(Therapeutic antibody)は、抗原にロック・ツー・キーで結合する特殊な保護タンパク質である。
抗体と特定の抗原との結合強度/親和性は、抗体上の相補性決定領域(CDR)によって決定される。
既存の機械学習手法は、CDRのシークエンスまたは3Dグラフの生成タスクとして、シリコ開発に使用されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:31:23 GMT)
PathoLM: Identifying pathogenicity from the DNA sequence through the Genome Foundation Model [9.3] PathoLMは、細菌およびウイルス配列の病原性の同定に最適化された最先端の病原体言語モデルである。
ESKAPEE病原体を含む約30種のウイルスと細菌からなる包括的データセットを開発した。
比較評価では、PathoLMはDciPathoのような既存のモデルよりも劇的に優れており、堅牢なゼロショットと少数ショット機能を示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:53:48 GMT)
Optimizing Psychological Counseling with Instruction-Tuned Large Language Models [9.2] 本稿では,心理カウンセリングにおける大規模言語モデル(LLM)の適用について検討する。
本稿では,共感的,関連性,支援的な応答を提供することで,特定のプロンプトを持つLLMを指導し,その性能を高める方法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:13:07 GMT)
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation [9.0] MIRAGE --Model Internals-based RAG Explanations -- このモデル内部を用いたプラグアンドプレイアプローチは、質問応答アプリケーションにおける忠実な回答属性である。
提案手法を多言語QAデータセット上で評価し,人間の回答属性と高い一致性を見いだした。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:10:26 GMT)
Rideshare Transparency: Translating Gig Worker Insights on AI Platform Design to Policy [8.9] 我々は透明性に関連した害、緩和戦略、労働者のニーズを特徴づける。
この結果から,既存のプラットフォーム設計とドライバが必要とする情報との透明性のギャップが明らかになった。
公共透明性レポートの公開をプラットフォームに要求する新たな規制は、労働者の幸福を改善するためのより効果的なソリューションになるかもしれない。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:17:41 GMT)
Poisoning Prevention in Federated Learning and Differential Privacy via Stateful Proofs of Execution [8.9] フェデレートラーニング(FL)とローカルディファレンシャルプライバシ(LDP)は、ここ数年で多くの注目を集めています。
彼らは毒殺攻撃に弱いという共通の制限を共有している。
本稿では,国家執行の証明という新たなセキュリティ概念に基づいて,この問題を是正するシステムレベルのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:01:31 GMT)
Is AI fun? HumorDB: a curated dataset and benchmark to investigate graphical humor [8.8] HumorDBは、視覚的ユーモア理解を促進するために特別に設計された、イメージのみのデータセットである。
このデータセットは、バイナリ分類、レンジ回帰、ペアワイズ比較タスクによる評価を可能にする。
HumorDBは、強力な大規模マルチモーダルモデルの貴重なベンチマークとしての可能性を示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:51:40 GMT)
Beyond IID: data-driven decision-making in heterogeneous environments [8.7] 本研究では,未知の分布と異なる分布から過去のサンプルを生成する,データ駆動型意思決定フレームワークについて検討する。
この研究は、中央データ駆動型ポリシのパフォーマンスだけでなく、ほぼ最適のポリシーも分析することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:49:17 GMT)
Tradeoffs between convergence rate and noise amplification for momentum-based accelerated optimization algorithms [8.7] モーメントに基づく1次最適化アルゴリズムについて検討し, 繰り返しが付加的な白色雑音を受ける場合について検討した。
強い凸2次問題に対しては、雑音増幅の定量化のために最適化変数における誤差の定常分散を用いる。
雑音増幅と定位時間のバランスをとるアルゴリズムの2つのパラメータ化ファミリを導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:26:12 GMT)
ViLCo-Bench: VIdeo Language COntinual learning Benchmark [8.7] ビデオテキストタスクの連続学習モデルを評価するために設計されたViLCo-Benchを提案する。
データセットは10分間のビデオと、公開されているデータセットから収集された対応する言語クエリで構成されている。
本稿では,自己教師付き学習を取り入れ,長期記憶効果と短期記憶効果を模倣する新しい記憶効率フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:38:19 GMT)
Distributional reasoning in LLMs: Parallel reasoning processes in multi-hop reasoning [8.6] 本稿では,大規模言語モデルにおける内部マルチホップ推論プロセスの新規かつ解釈可能な解析手法を提案する。
推論中、ネットワークの中間層は高度に解釈可能な埋め込みを生成する。
我々の発見は、LLMが推論タスクの解決に使っている戦略を明らかにするのに役立ち、人工知能から生まれる思考プロセスのタイプに関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:36:40 GMT)
Cluster Quilting: Spectral Clustering for Patchwork Learning [8.5] 我々は、パッチワーク学習におけるクラスタリングの問題に焦点をあて、何らかの機能に対して共同で観測されない場合であっても、すべてのサンプル間のクラスタを見つけることを目的としている。
本稿では, (i) パッチ間の重なり構造を利用するパッチ順序付け, (ii) パッチワイズSVD, (iii) パッチオーバーラップのためのトップ特異ベクトルの逐次線形マッピング, (iv) 結合および重み付き特異ベクトル上のk-meansからなる新しいスペクトルクラスタリング手法を提案する。
準ガウス混合モデルの下では、両者を反映する非漸近的誤クラスタリング率による理論的保証を確立する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:52:47 GMT)
Rationale-based Ensemble of Multiple QA Strategies for Zero-shot Knowledge-based VQA [8.5] K-VQA(Knowledge-based Visual Qustion-Awering)は、画像に描かれているもの以外の背景知識の活用を必要とする。
現在のゼロショットK-VQA法は、通常、イメージを単一のタイプのテキスト決定コンテキストに変換し、テキストベースのモデルを使用して、それに基づいて質問に答える。
本稿では,複数問合せ戦術の動的アンサンブルを実現するために,Rationale を用いたアンサーコンテキスト戦術のアンサンブル(REACT)を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:02:13 GMT)
IoT-Based Preventive Mental Health Using Knowledge Graphs and Standards for Better Well-Being [8.4] デジタル技術は持続可能な開発目標3をサポートすることができる。
「健康と幸福」は、あらゆる年齢の幸福を促進する。
燃え尽き症候群やうつ病は 予防的健康を増すことで減らせる
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:35:14 GMT)
GraphMU: Repairing Robustness of Graph Neural Networks via Machine Unlearning [8.4] グラフニューラルネットワーク(GNN)は、敵の攻撃に対して脆弱である。
本稿では,GNNのモデル修復という新しい概念を紹介する。
我々は、Graph Unlearning (GraphMU)によるグラフニューラルネットワークのロバスト性を修復する修復フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:41:15 GMT)
Fredformer: Frequency Debiased Transformer for Time Series Forecasting [8.4] Transformerモデルは時系列予測において主要なパフォーマンスを示している。
データの中で低周波の特徴を学習し、高周波の特徴を見落とし、周波数バイアスを示す傾向がある。
そこで我々はFredformerを提案する。Fredformerは、異なる周波数帯域にまたがる特徴を均等に学習することで、周波数バイアスを軽減するために設計されたフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:25:23 GMT)
Children's Speech Recognition through Discrete Token Enhancement [8.0] 本研究では,ASRの性能を著しく低下させることなく,個々の音声トークンを幼児の音声認識システムに組み込むことを入力として検討する。
その結果,子供用離散トークンASRは,約83%のパラメータでほぼ同等の性能を発揮することがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:45:12 GMT)
Enhancing Language Model Factuality via Activation-Based Confidence Calibration and Guided Decoding [7.9] キャリブレーション言語モデル(LM)は、その生成信頼度を実際の回答の正しさの確率と整合させる。
本稿では,アクティベーションに基づくキャリブレーション手法であるActCabを提案する。
また,信頼度の高い復号法であるCoDecを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:33:34 GMT)
Annotator-Centric Active Learning for Subjective NLP Tasks [7.8] アクティブラーニング(AL)は、最も有益なサンプルを戦略的に注釈付けすることで、人間のアノテーションを収集するコストに対処する。
本稿では,データサンプリングに続き,アノテーション選択戦略を取り入れたACAL(Annotator-Centric Active Learning)を提案する。
本研究の目的は,人間の判断の多様性を効率的に近似し,アノテータ中心の指標を用いてモデル性能を評価することである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:05:34 GMT)
Physics-informed machine learning as a kernel method [7.8] 経験的リスクを偏微分方程式で正則化する一般回帰問題を考える。
カーネル理論の利点を生かして、正規化リスクの最小化に対する収束率を導出する。
物理誤差に応じて高速な速度が達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:40:56 GMT)
Confidence Is All You Need for MI Attacks [7.7] モデルのトレーニングセットにおけるデータポイントのメンバシップを計測する新しい手法を提案する。
トレーニング中、モデルは基本的にトレーニングデータに'適合'しており、目に見えないデータへの一般化において特に困難に直面している可能性がある。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:58:19 GMT)
CoDreamer: Communication-Based Decentralised World Models [7.6] CoDreamerはマルチエージェント環境のためのDreamerアルゴリズムの拡張である。
我々はCoDreamerがDreamerの単純な応用よりも表現力が高いことを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:42:40 GMT)
Longitudinal Data and a Semantic Similarity Reward for Chest X-Ray Report Generation [7.6] 放射線学者は、解釈と報告を必要とする胸部X線(CXR)の量の増加のために、高いバーンアウト率に直面している。
提案するCXRレポートジェネレータは,ワークフローの要素を統合し,強化学習のための新たな報酬を導入する。
本研究の結果から, 提案モデルでは, 最新技術モデルよりも, 放射線学者の報告に適合した報告が生成されることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:34:18 GMT)
Tree-Sliced Wasserstein Distance on a System of Lines [7.4] システム・オブ・ライン (TSW-SL) 上で, SW と TSW を接続するツリースライスワッサースタイン距離を提案する。
TSW-SL では、Randon Transform の変種を用いて直線系に測度を射影し、ツリー距離を持つ空間上で測度を行い、TW を利用してそれらの距離を効率的に計算する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:40:11 GMT)
A Gradient Accumulation Method for Dense Retriever under Memory Constraint [7.3] Contrastive Accumulation (ContAccum) は高密度レトリバーの安定かつ効率的なメモリ削減手法である。
広く使われている5つの情報検索データセットの実験は、ContAccumが既存のメモリ削減手法だけでなく、高リソースシナリオを克服できることを示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:35:05 GMT)
Defying the Odds: Solana's Unexpected Resilience in Spite of the Security Challenges Faced by Developers [7.3] 我々は90分間のスマートコントラクトコードレビュータスクからなるSolanaプラットフォームに関する総合的研究を行った。
私たちの研究は、コードレビュータスクにおいて重要なセキュリティ脆弱性をすべて検出できる参加者は誰もいないことを非常に恐れています。
これらの課題にもかかわらず、現在デプロイされているSolanaスマートコントラクトの自動分析は、脆弱性の頻度が0.3%未満であることを驚くほど示唆しています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:42:33 GMT)
Large Language Models are Biased Because They Are Large Language Models [7.2] 本稿では,大規模言語モデルの設計から生じる有害なバイアスは避けられない結果である,と読者に納得させようとする。
これは事実である範囲において、LLMによって駆動されるAIの深刻な再考なしに有害なバイアスの問題は適切に対処できないことを示唆している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:08:03 GMT)
Enhancing Travel Choice Modeling with Large Language Models: A Prompt-Learning Approach [6.9] 本稿では,予測精度を大幅に向上させ,個々の予測に対して明確な説明を提供する,プロンプト学習に基づく大規模言語モデル(LLM)フレームワークを提案する。
スイスで収集されたLondon Passenger Mode Choice(LPMC)とOptima-Mode(Optima-Mode)の2つの選択肢データセットを用いて,フレームワークの有効性を検証した。
その結果,LLMは人々の選択を予測する上で,最先端のディープラーニング手法や個別選択モデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:46:08 GMT)
Evaluating Large Language Models along Dimensions of Language Variation: A Systematik Invesdigatiom uv Cross-lingual Generalization [6.9] 大規模言語モデルは、見知らぬ近縁言語(CRL)や方言(HRLN)に対する性能劣化(PD)に悩まされる。
我々は,音韻,形態,語彙距離をベイズ雑音過程としてモデル化し,HRLNから制御的に離れた人工言語を合成する。
実際のCRL-HRLNペアデータからパラメータ後部を計算し、それらが人工言語の計算された傾向に従うことを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:20:28 GMT)
Probabilistic Conceptual Explainers: Trustworthy Conceptual Explanations for Vision Foundation Models [6.7] 本稿では, 信頼度, 安定度, 疎度, マルチレベル構造, パーシモニーの5つのViTを説明するデシラタを提案する。
PACE(ProbAbilistic Concept Explainers)と呼ばれる変分ベイズの説明フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:21:09 GMT)
Transferable Tactile Transformers for Representation Learning Across Diverse Sensors and Tasks [6.7] T3は、マルチセンサーとマルチタスクにまたがる触覚表現学習のためのフレームワークである。
FoTaで事前訓練したT3は、特定のセンサとタスクのペアリングにおいてゼロショット転送性を達成した。
また、T3は長距離接点リッチな操作のための触覚エンコーダとしても有効である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:39:27 GMT)
Supervised low-rank semi-nonnegative matrix factorization with frequency regularization for forecasting spatio-temporal data [6.7] 周波数正規化を伴う半負行列分解(SMF)を用いた時間データの予測手法を提案する。
提案手法による結果は,地球物理学の分野におけるこれまでの研究に匹敵するが,より明瞭な解釈性を提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:22:27 GMT)
Blockchain Bribing Attacks and the Efficacy of Counterincentives [6.7] ゲーム理論の観点から,プロオフ・オブ・ステーク分散台帳におけるブラビング攻撃を分析した。
誘導贈賄では、贈賄者が指示通りに振る舞う限り贈賄される。
効果的なブレンビングでは、プロトコルと"オールブリブ"の設定が平衡であることが示される。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:45:38 GMT)
Machine Learning Applications of Quantum Computing: A Review [6.6] このレビューでは、高度なデータ処理とアプリケーションに焦点を当てた、量子コンピューティングと機械学習の相互作用について論じている。
主にサイバーセキュリティにおける量子コンピューティングの重要性の増大に焦点を当てている。
このレビューは、量子化された機械学習アルゴリズムの進歩とサイバーセキュリティなどの分野における潜在的な応用を強調している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:47:35 GMT)
Confidence interval estimation of mixed oil length with conditional diffusion model [6.5] 原油パイプライン網の経済的利益には, 混合油長の正確な推定が重要な役割を担っている。
様々な提案手法が混合油長の予測を試みたが、しばしば過小評価の可能性が極めて高い。
これは、混合油の推定した長さに固有の統計的変動を考慮できなかったためである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:07:19 GMT)
Improving GFlowNets with Monte Carlo Tree Search [6.5] 近年の研究では,GFlowNetsとエントロピー規則化強化学習の強い関係が明らかにされている。
我々はモンテカルロ木探索(MCTS)を適用してGFlowNetの計画能力を高めることを提案する。
実験により,本手法により,GFlowNetトレーニングのサンプル効率と,事前学習したGFlowNetモデルの生成精度が向上することが示された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:58:35 GMT)
Factual Confidence of LLMs: on Reliability and Robustness of Current Estimators [6.4] 大規模言語モデル(LLM)は、その答えの事実において信頼できない傾向にある。
本稿では,事実信頼度の推定者の調査と実証的比較について述べる。
実験により, 訓練された隠れ状態プローブが最も信頼性の高い信頼度を推定できることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:11:37 GMT)
Straight Through Gumbel Softmax Estimator based Bimodal Neural Architecture Search for Audio-Visual Deepfake Detection [6.4] マルチモーダルディープフェイク検出器は 従来の融合法に依存している 多数決ルールや アンサンブル投票など
本稿では,マルチモーダル融合モデルアーキテクチャを検索するための包括的アプローチを提供する,Straight-through Gumbel-Softmaxフレームワークを提案する。
FakeAVCelebとSWAN-DFデータセットの実験では、最小のモデルパラメータでAUCの94.4%が達成された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:26:22 GMT)
Conditional score-based diffusion models for solving inverse problems in mechanics [6.3] 条件付きスコアベース拡散モデルを用いてベイズ推定を行う枠組みを提案する。
条件付きスコアベース拡散モデルは条件分布のスコア関数を近似する生成モデルである。
メカニクスにおける高次元逆問題に対して提案手法の有効性を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:09:15 GMT)
Synthetic Context Generation for Question Generation [6.2] 本稿では,大規模言語モデルによる合成文脈を用いたQGモデルの訓練について検討する。
たとえ合成されたとしても、QGタスクにはコンテキストが不可欠であることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:37:52 GMT)
Learning to Maximize Gains From Trade in Small Markets [6.2] 両面市場(ダブルオークション)をインセンティブの整合性と予算バランスの制約の下で設計する問題について検討する。
この結果は,1つの売り手と2つの買い手の間でも相関した値の分布の場合の一般的な不可能性である。
2つ目は、独立分布の場合、1つの売り手と2つの買い手のための効率的な学習アルゴリズムです。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:02:22 GMT)
Spatialyze: A Geospatial Video Analytics System with Spatial-Aware Optimizations [6.2] Spatialyzeは、地理空間ビデオのエンドツーエンドクエリのための新しいフレームワークである。
その結果、Spatialyzeは、最適化されていない実行と比較して最大97.1%の精度を維持しながら、実行時間を最大5.3倍に短縮できることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:03:09 GMT)
MEV Ecosystem Evolution From Ethereum 1.0 [6.2] 従来の金融では、市場の非効率性から価値を創出する仲裁提案や、特権的な役割を持つ参加者に対して価値を抽出する前払い提案など、価値を創出する可能性がある。
このような機会は、様々な参加者が金融活動に従事しているDeFiエコシステムで容易に利用することができる。
この調査では、まず、このような機会がいかに豊かになるかを示す。次に、そのような機会を捉えようとする参加者のプロトコルフォローが、ブロックチェーンのパフォーマンスを妨害する恐れがあるかについて議論する。
最後に、すべてのDeFi参加者に公正な市場を提供するために、信頼の欠如と分散化を回復しようとする研究の現状を概観する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:22:26 GMT)
DEFN: Dual-Encoder Fourier Group Harmonics Network for Three-Dimensional Indistinct-Boundary Object Segmentation [6.1] 本稿では,学習コーパス内の不明瞭な境界オブジェクトの表現多様性を高めるために,欠陥注入(SDi)を導入する。
そこで我々はDEFN(Dual-Encoder Fourier Group Harmonics Network)を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:49:30 GMT)
On AI-Inspired UI-Design [6.0] アプリデザイナがモバイルアプリのより優れた、より多様な、創造的なUIを作成するのをサポートするために、AI(Artificial Intelligence)を使用する方法に関する3つの主要な補完的なアプローチについて議論する。
まず、デザイナーはGPTのようなLarge Language Model(LLM)に1つまたは複数のUIを直接生成、調整するよう促すことができる。
第2に、VLM(Vision-Language Model)により、デザイナは、アプリストアに公開されたアプリから、大規模なスクリーンショットデータセットを効率的に検索することができる。
第3に、ディフュージョンモデル(DM)は、インスピレーションのあるイメージとしてアプリUIを生成するように設計されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:28:21 GMT)
DDLNet: Boosting Remote Sensing Change Detection with Dual-Domain Learning [5.9] 変化センシング(RSCD)は、多時間リモートセンシング画像を分析して、ある領域における関心の変化を特定することを目的としている。
既存のRSCD法は、関心の変化を高めるために空間領域におけるコンテキストモデリングに費やされている。
二重領域学習(周波数領域と空間領域)に基づくRSCDネットワークDNetを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:54:09 GMT)
Efficient Offline Reinforcement Learning: The Critic is Critical [5.9] オフ・ポリシー強化学習は、教師付きアプローチを超えてパフォーマンスを改善するための有望なアプローチを提供する。
本稿では、まず行動方針を学習し、教師付き学習で批判し、その後に非政治強化学習で改善することによるベスト・オブ・ボス・アプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:16:38 GMT)
Symmetric Dot-Product Attention for Efficient Training of BERT Language Models [5.8] 本稿では,Transformer アーキテクチャによって導入された自己注意機構の代替互換性関数を提案する。
BERTライクなモデルの事前トレーニングに適用すると、この新しい対称アテンション機構はGLUEベンチマークで79.36点に達し、従来の実装では78.74点だった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:42:15 GMT)
Structsum Generation for Faster Text Comprehension [5.7] 大規模言語モデル(LLM)を用いてテキストの構造化表現を生成するタスクについて検討する。
表やマインドマップを代表的モダリティとして重視する。
現在のモデルでは、構造的なアウトプットの生成に苦労しています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:59:51 GMT)
StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images [5.5] 視覚シーンの意味を理解することはコンピュータビジョンの基本的な課題である。
テキストと画像のフレームワークの最近の進歩は、自然のシーン統計を暗黙的に捉えるモデルにつながっている。
提案するStableSemanticsは、224万件の人為的なプロンプト、処理された自然言語キャプション、200万以上の合成画像、そして個々の名詞のチャンクに対応する1000万のアテンションマップからなるデータセットである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:59:40 GMT)
LLMatDesign: Autonomous Materials Discovery with Large Language Models [5.5] 新しい材料は科学的、技術的に重要な意味を持つ。
機械学習の最近の進歩により、データ駆動の手法により、有望な材料を素早くスクリーニングしたり、生成したりすることが可能になった。
LLMatDesignは,大規模言語モデルを用いた材料設計のための新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:35:02 GMT)
Optimal Control of Logically Constrained Partially Observable and Multi-Agent Markov Decision Processes [5.5] まず、部分的に観測可能なマルコフ決定過程に対する最適制御理論を導入する。
累積報酬を最大化するポリシを合成するための構造化手法を提供する。
次に、論理的に制約されたマルチエージェント設定のための最適制御フレームワークを設計するために、このアプローチを構築します。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:11:31 GMT)
Generative Data Assimilation of Sparse Weather Station Observations at Kilometer Scales [5.5] そこで本研究では,現実的に複雑な1kmスケールの気象条件下でのスコアベースデータ同化の実現可能性を示す。
40の気象観測所からの観測を取り入れることで、左の観測所で10%低いRMSEが達成される。
ますます野心的な地域国家ジェネレータと、In situ、地上ベース、衛星リモートセンシングデータストリームの集合を組み合わす拡張を探求する時期だ。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:28:11 GMT)
DefSent+: Improving sentence embeddings of language models by projecting definition sentences into a quasi-isotropic or isotropic vector space of unlimited dictionary entries [5.3] 本論文は,DefSent として知られる以前の会議報告において,大幅な改善を示すものである。
そこで本稿では,制約を満たさない進入埋め込みを段階的に構築する手法を提案する。
その結果、定義文は無限辞書エントリの準等方的あるいは等方的ベクトル空間に投影できる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:26:53 GMT)
Dense outputs from quantum simulations [5.3] 量子密度出力問題は、時間依存の量子力学から時間累積観測値を評価する過程である。
この問題は量子制御や分光計算などの応用で頻繁に発生する。
我々は、早期および完全フォールトトレラントな量子プラットフォームの両方で動作するように設計されたアルゴリズムを提示する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:54:34 GMT)
Using Multimodal Large Language Models for Automated Detection of Traffic Safety Critical Events [5.2] MLLM(Multimodal Large Language Models)は、テキスト、ビジュアル、オーディオのモダリティを統合する新しいアプローチを提供する。
我々のフレームワークはMLLMの推論能力を活用し、文脈固有のプロンプトを通して出力を誘導する。
予備的な結果は、ゼロショット学習と正確なシナリオ分析におけるフレームワークの可能性を示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:50:41 GMT)
Snowy Scenes,Clear Detections: A Robust Model for Traffic Light Detection in Adverse Weather Conditions [5.2] 逆天候は、現在の検知システムにとって大きな課題を示し、しばしば失敗と潜在的な安全リスクをもたらす。
本稿では,そのような条件下での物体検出を改善するための新しいフレームワークとパイプラインを提案する。
その結果、平均IoUとF1のスコアは、素早い微調整に比べて40.8%改善した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:52:12 GMT)
Smart Contracts in the Real World: A Statistical Exploration of External Data Dependencies [5.2] スマートコントラクトと外部データとの相互作用に関する統計的、定量的研究が欠如している。
10,500の実際のスマートコントラクトを調べて,古いものやコンパイルエラーのあるものを除いて,9,356の有効なサンプルを選択します。
また、スマートコントラクトの複雑さと外部データへの依存との関係についても検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:36:23 GMT)
Multi-level Phenotypic Models of Cardiovascular Disease and Obstructive Sleep Apnea Comorbidities: A Longitudinal Wisconsin Sleep Cohort Study [5.1] 閉塞性睡眠時無呼吸症候群(OSA)患者における心血管疾患(CVD)の意義
従来のモデルでは、OSA患者のCVD軌跡を正確に予測するために必要な動的および縦方向のスコープが欠如している。
本研究では,ウィスコンシン・スリープ・コーホートのデータを利用して,これらの状態の進行と相互作用を時間とともに解析する,新しい多段階表現型モデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:50:16 GMT)
Application of Computer Deep Learning Model in Diagnosis of Pulmonary Nodules [5.1] 再建法を用いて肺の3次元シミュレーションモデルを構築した。
コンピュータ支援肺結節検出モデルを構築した。
診断率は従来の診断法に比べて有意に改善した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:27:27 GMT)
Genuine Multipartite Entanglement induced by a Thermal Acoustic Reservoir [5.0] 汎用量子コンピューティングと量子ネットワークの実現には、GME(Genuine Multipartite entanglement)が不可欠である。
そこで本研究では,NLC共振器の線形鎖における多粒子絡み合い(ME)のダイナミクスについて検討する。
この研究はMEの分野を根本的に拡張し、耐熱ノイズ耐性量子情報処理と多体量子シミュレーションの実装に広く応用されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:10:50 GMT)
Informatics & dairy industry coalition: AI trends and present challenges [5.0] この研究は、AIを活用可能な産業上の課題を包括的に記述し、乳製品産業に焦点を当てている。
結論は、牛のモニタリングと農家に対する新しいアプローチを、彼らのニーズに先進的な技術ソリューションを提案して適用する上で有効である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:49:03 GMT)
ZeroDL: Zero-shot Distribution Learning for Text Clustering via Large Language Models [5.0] 特定の大規模言語モデル(LLM)に対してタスクを文脈化するための,シンプルで効果的な手法を提案する。
本稿では,テキストクラスタリングタスクにおけるこのアプローチの有効性を示すとともに,上記の手順の例による文脈化の重要性を強調する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:48:05 GMT)
DKEC: Domain Knowledge Enhanced Multi-Label Classification for Diagnosis Prediction [4.9] 本稿では,診断予測のためのドメイン知識強化分類であるDKECについて述べる。
3つのオンライン医療知識源を用いてDKECを構築し,現実の救急医療サービス(EMS)データセットと電子健康記録(EHR)データセットで評価する。
その結果、DKECは、最先端のラベルワイドアテンションネットワークや、異なるサイズのトランスフォーマーモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:58:52 GMT)
WaterMono: Teacher-Guided Anomaly Masking and Enhancement Boosting for Robust Underwater Self-Supervised Monocular Depth Estimation [4.9] 深度推定と画像強調のための新しいフレームワークであるWaterMonoを提案する。
1)教師が指導する異常マスクを用いて画像内の動的領域を識別し,(2)水中画像形成モデルと組み合わせた深度情報を用いて深度推定タスクに寄与する拡張画像を生成し,(3)回転蒸留手法を用いてモデルの回転ロバスト性を高める。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:49:45 GMT)
Encoder vs Decoder: Comparative Analysis of Encoder and Decoder Language Models on Multilingual NLU Tasks [4.9] NLUタスク上でデコーダモデルを評価する手法を導入し,デンマーク語,スウェーデン語,ノルウェー語,アイスランド語,フェロー語,ドイツ語,オランダ語,英語の言語に適用する。
この結果から,デコーダモデルでは,異なるタスクや言語間でニュアンスを観測することで,エンコーダモデルよりもはるかに優れたNLU性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:50:09 GMT)
Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization [4.8] 本稿では,画像フォージェリーローカライゼーションのための多視点Pixel-wise Contrastive Algorithm (MPC)を提案する。
具体的には、まず、教師付きコントラスト損失を伴うバックボーンネットワークを事前訓練する。
次に、クロスエントロピー損失を用いてローカライゼーションヘッドを微調整し、ピクセルローカライザを改良する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:51:52 GMT)
Enhancing Distractor Generation for Multiple-Choice Questions with Retrieval Augmented Pretraining and Knowledge Graph Integration [4.8] 複数項目の質問に対して, イントラクタ生成(DG)の課題に取り組む。
そこで本稿では,DGの下流タスクとより緊密に連携するために,言語モデルの事前訓練を改良するテキスト検索型拡張事前学習を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:12:05 GMT)
GraphKAN: Enhancing Feature Extraction with Graph Kolmogorov Arnold Networks [4.8] グラフニューラルネットワーク(GNN)は、グラフ内の依存関係をキャプチャして特徴を抽出するために使用される。
Kolmogorov Arnold Networks (KANs) にインスパイアされた私たちは,kans による GNN の最初の試みを行う。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:41:09 GMT)
Diffusion Model-based FOD Restoration from High Distortion in dMRI [4.8] 感受性によって引き起こされるdMRIの歪みなどのイメージングアーティファクトは、信号損失を引き起こす。
拡散モデルのような生成モデルは、様々な画像復元タスクにうまく適用されている。
歪みアーチファクトによる信号損失を回復できる新しいFOD復元モデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:41:29 GMT)
BiLD: Bi-directional Logits Difference Loss for Large Language Model Distillation [4.6] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにまたがる例外的な機能を示している。
知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を移すことによって解を提供する。
本稿では,LLMのロージットレベルでのタスク特異的蒸留について検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:44:56 GMT)
LIT: Large Language Model Driven Intention Tracking for Proactive Human-Robot Collaboration -- A Robot Sous-Chef Application [4.5] 大型言語モデル (LLM) と視覚言語モデル (VLM) は、ロボットが自然言語のプロンプトを制御アクションに接地できるようにする。
言語駆動型意図追跡(LIT)は,人間の長期動作をモデル化し,ロボットを積極的に協調するための次の人間の意図を予測する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:18:40 GMT)
Classifying multiparticle entanglement with passive state energies [4.5] 極端受動的状態エネルギーは、それぞれの量子状態のクラスに対して凸ポリトープを形成することを示す。
SLOCC下でのマルチパーティの絡み合いを分類するために、マルチパーティの受動的状態エネルギー基準を導入する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:32:56 GMT)
Multiparticle entanglement classification with ergotropic gap [4.5] 量子多粒子の絡み合いの存在は、エルゴトロピックギャップとして知られる熱力学量の存在を示唆している。
局所的な演算や古典的な通信において等価となる量子状態のクラスごとに、すべての辺のエルジトロピックギャップが凸ポリトープを形成することを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:13:08 GMT)
On the Consistency of Fairness Measurement Methods for Regression Tasks [4.5] 本稿では,様々な公正度測定手法の出力の整合性について検討する。
いくつかの公正度測定手法は様々な回帰タスクに対して強い整合性を示すが、特定の回帰タスクでは比較的不整合性を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:35:23 GMT)
Towards Holistic Language-video Representation: the language model-enhanced MSR-Video to Text Dataset [4.5] より堅牢で総合的な言語とビデオの表現が、ビデオの理解を前進させる鍵だ。
現在の平易で単純なテキスト記述と、言語ビデオタスクに対する視覚のみの焦点は、現実世界の自然言語ビデオ検索タスクにおいて限られた能力をもたらす。
本稿では,ビデオ言語データセットを自動的に拡張し,モダリティと文脈認識を向上する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:16:17 GMT)
BEACON: Balancing Convenience and Nutrition in Meals With Long-Term Group Recommendations and Reasoning on Multimodal Recipes [4.4] 本稿では,新しい食事レコメンデーション問題に対するデータ駆動型アプローチを提案する。
コントリビューションには、良心尺度、テキストからのレシピ変換方法、文脈的包帯を用いた学習方法が含まれる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:14:41 GMT)
One Model Many Scores: Using Multiverse Analysis to Prevent Fairness Hacking and Evaluate the Influence of Model Design Decisions [4.4] 設計と評価の決定の公平さをよりよく理解するために,多変量解析をどのように利用できるかを示す。
結果から,システム評価に関する決定が,同じモデルに対して,極めて異なる公平度指標を導出する可能性を強調した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:49:07 GMT)
Quantum Networks: from Multipartite Entanglement to Hypergraph Immersion [4.3] マルチパーティ・エンタングルメントは量子ネットワーク(QN)アプリケーションにおいて、バイパート・エンタングルメントよりも様々な利点を提供する。
本稿では,QNを絡み合うルーティングによって,位相的に別のQNに変換できるかどうかという問題に対処する。
我々の重要な結果は、マルチパーティ・エンタングルメント・ルーティングから、ハイパーグラフに拡張されたナッシュ・ウィリアムズのグラフ浸漬問題への正確なマッピングである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:21:00 GMT)
MVSBoost: An Efficient Point Cloud-based 3D Reconstruction [4.3] 拡張現実や仮想現実、医用画像、映画特殊効果など、様々な応用において、効率的で正確な3D再構成が不可欠である。
従来のMulti-View Stereo (MVS) システムはこれらのアプリケーションには基本的だが、暗黙の3次元シーンモデリングは複雑なトポロジや連続面を扱う新しい可能性をもたらした。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:02:17 GMT)
Benchmarking Unsupervised Online IDS for Masquerade Attacks in CAN [4.3] CAN(Vehicular Control Area Network)は、悪意のある敵によるマスクレード攻撃の影響を受けやすい。
我々は,CANにおけるマスクレード攻撃に対する4種類の非深層学習(DL)に基づく非教師なしオンライン侵入検知システム(IDS)のベンチマーク研究を紹介する。
ベンチマークしたIDSは全ての攻撃タイプを検出するには有効ではないが,時系列クラスタの階層構造の変化を検出する手法が最適であることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:04:51 GMT)
Fine-Tuning Gemma-7B for Enhanced Sentiment Analysis of Financial News Headlines [4.2] 我々はNLP(Natural Language Processing)とLLM(Large Language Models)を使って、小売投資家の視点から感情を分析する。
感性分類における効果を評価するために, distilbert-base-uncased, Llama, gemma-7b などいくつかのモデルを微調整した。
実験の結果,精巧なgemma-7bモデルは他のモデルよりも優れており,高い精度,リコール,F1スコアが得られた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:20:19 GMT)
Towards Cyber Threat Intelligence for the IoT [4.2] 本稿では,CTI(Cyber Threat Intelligence)フレームワークとCTI(Cyber Threat Intelligence)交換プラットフォームの分類と分析について述べる。
カスタマイズされたIoT環境に焦点を当てた、MISPのThreat Intelligence Sharing Platformに依存する、新たなCTIアーキテクチャを提案する。
提案されたCTIアーキテクチャは、IoTネットワーク、特に厳しい、敵対的な環境で働くものを保護する上で、非常に有益である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:30:01 GMT)
EPR Steering Criterion and Monogamy Relation via Correlation Matrices in Tripartite Systems [4.1] 量子ステアリングの非対称性は、一方のデバイス非依存の量子情報処理に不可欠である。
相関行列を用いて,任意の3量子状態に対する新規かつ有望な操舵基準を導出する。
本稿では, ステアリング基準とモノガミーの関係を, いくつかの代表例を用いて示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:28:38 GMT)
Large Language Models Lack Understanding of Character Composition of Words [4.0] 大規模言語モデル(LLM)は、幅広い自然言語処理において顕著な性能を示した。
これらの課題の多くは、人間が完璧に扱える簡単なタスクでさえ、確実に実行できないことが示されています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:58:14 GMT)
BSRBF-KAN: A combination of B-splines and Radial Basic Functions in Kolmogorov-Arnold Networks [3.8] BSRBF-KANはコルモゴロフ・アーノルドネットワーク (KAN) で、Bsplines と radial basis function (RBF) を組み合わせてベクトルをデータトレーニングに適合させる。
BSRBF-KANは5回のトレーニングセッションで安定性を示し、MNISTでは97.55%、FashionMNISTでは89.33%である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:01:14 GMT)
Freq-Mip-AA : Frequency Mip Representation for Anti-Aliasing Neural Radiance Fields [3.8] Mip-NeRFはフラストタムを用いてピクセルを描画し、統合位置符号化(IPE)を提案する。
このアプローチは有効であるが、ボリュームアーキテクチャに依存しているため、長いトレーニング時間を必要とする。
本稿では,グリッドベース表現を利用した新しいアンチエイリアス手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:33:56 GMT)
Reasoning with trees: interpreting CNNs using hierarchies [3.7] 畳み込みニューラルネットワーク(CNN)の忠実かつ解釈可能な説明に階層的セグメンテーション技術を用いるフレームワークを導入する。
本手法はモデルの推論忠実性を維持するモデルに基づく階層的セグメンテーションを構築する。
実験により、我々のフレームワークであるxAiTreesが高度に解釈可能で忠実なモデル説明を提供することが示された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:45:19 GMT)
Reinforcement Learning for Infinite-Horizon Average-Reward MDPs with Multinomial Logistic Function Approximation [3.7] 無限水平平均報酬設定のための2つのアルゴリズムを開発する。
ここでは、$tildemathcalO(d2/5 Mathrmsp(v*)T4/5)$に対して、$mathrmsp(v*)$は関連する最適バイアス関数のスパンである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:29:14 GMT)
Transferable speech-to-text large language model alignment module [3.6] State of the art speech-text bimodal work can achieved challenge task like spoken translation (ST) and question answering (SQA) through completely simple architectures。
我々は、Whisperエンコーダと事前訓練されたYi-6Bの能力を利用する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:04:43 GMT)
LightGBM robust optimization algorithm based on topological data analysis [3.6] 本研究の目的は、従来の画像処理において、不安定な特徴抽出とデータノイズによる分類精度の低下に関連する課題を克服することである。
実験結果から,TDA-LightGBMはSOCOFingデータセット上での光GBMよりも3%精度が向上することが確認された。
本手法は乳がんデータセットの超音波乳房画像の分類精度を6%,Masked CASIA WebFaceデータセットの15%向上させる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:40:37 GMT)
Locating and measuring marine aquaculture production from space: a computer vision approach in the French Mediterranean [3.5] 航空画像と衛星画像から海洋養殖用ケージを識別するコンピュータビジョンモデルを訓練する。
2000-2021年にフランス地中海のフィンフィッシュ生産地の空間的明らかなデータセットを生成した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:19:44 GMT)
Is GPT-4 conscious? [3.5] GPT-4は、しばしば主要な商用AI製品として宣伝されている。
しかし、それは意識を持っているだろうか?
本稿では,ビルディングブロック理論の9つの質的測定値を用いて,この重要な問題について考察する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:26:55 GMT)
Optimizing Wireless Discontinuous Reception via MAC Signaling Learning [3.4] 本稿では,基地局 (BTS) からの不連続受容 (DRX) ポリシーを制御するための強化学習手法を提案する。
5G New Radioで指定された高速なLayer-2信号の送信を最適タイミングでタイミングで行う。
シミュレーションの結果,提案手法は遅延と省エネのトレードオフの改善を図っている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:55:12 GMT)
MiSuRe is all you need to explain your image segmentation [3.4] 画像セグメンテーションのためのサリエンシマップを生成するアルゴリズムとしてMiSuReを提案する。
MiSuReが生成したサリエンシマップの目標は、無関係な領域を排除し、画像分割決定に不可欠な入力画像内のこれらの領域のみをハイライトすることである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:27:37 GMT)
Towards a multimodal framework for remote sensing image change retrieval and captioning [3.3] 本稿では,両時間RS画像ペアのための新しい基礎モデルを提案する。
コントラストエンコーダとキャプションデコーダを共同でトレーニングすることにより、両時間的変化検出の文脈でテキスト画像検索機能を付加する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:30:56 GMT)
Advancing Parsimonious Deep Learning Weather Prediction using the HEALPix Mesh [3.3] 110kmのメッシュ上で最大1年間のリードタイムで,3時間分解能を持つ7つの大気変数の予測を行うため,同種の深層学習天気予報モデルを提案する。
Pangu-WeatherやGraphCastのような最先端の機械学習(SOTA)天気予報モデルと比較して、我々のDLWP-HPXモデルは粗い分解能と予測変数がはるかに少ない。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:54:30 GMT)
GSR-BENCH: A Benchmark for Grounded Spatial Reasoning Evaluation via Multimodal LLMs [3.3] 画像中の物体間の空間的関係を理解する能力は、視覚的推論の重要な構成要素である。
我々は、以前リリースされたWhat'sUpデータセットを拡張し、空間関係理解のための新しい包括的評価を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:15:26 GMT)
Advancing continual lifelong learning in neural information retrieval: definition, dataset, framework, and empirical evaluation [3.2] 連続的なニューラル情報検索の系統的なタスク定式化を示す。
包括的連続神経情報検索フレームワークを提案する。
経験的評価は,提案フレームワークが神経情報検索における破滅的な忘れ込みを効果的に防止できることを示唆している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:45:30 GMT)
Enhanced Object Detection: A Study on Vast Vocabulary Object Detection Track for V3Det Challenge 2024 [3.2] 本研究の成果は, 最大語彙視覚検出課題を対象としたVast Vocabulary Visual Detectionのデータセットから得られたものである。
我々のモデルは,V3Det Challenge 2024のVast Vocabulary Object Detection(Supervised)トラックとOpen Vocabulary Object Detection(OVD)トラックの両方において,ベースラインを改良し,Leadboardの優れたランキングを達成した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:51:28 GMT)
Putting GPT-4o to the Sword: A Comprehensive Evaluation of Language, Vision, Speech, and Multimodal Proficiency [3.2] 本研究は, GPT-4oの言語, 視覚, 音声, マルチモーダル能力を包括的に評価する。
GPT-4oは、言語と推論能力において、複数のドメインにわたる高い精度と効率を示す。
モデルは可変性を示し、複雑であいまいな入力を扱う際の制限に直面している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:00:21 GMT)
The Uli Dataset: An Exercise in Experience Led Annotation of oGBV [3.1] ヒンディー語、タミル語、インド英語の3言語で性別による虐待に関するデータセットを提示する。
このデータセットは、女性や南アジアのLGBTQIAコミュニティのメンバーと同一視する専門家によって、性虐待の経験に関する3つの質問に沿って注釈付けされたツイートで構成されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:50:25 GMT)
State-of-the-Art Review: The Use of Digital Twins to Support Artificial Intelligence-Guided Predictive Maintenance [3.1] 予測保守(PMx)は、効率性、自動化、正確性、費用対効果を高める可能性で有名である。
本稿では、これらの課題を克服するために、Digital Twins(DT)がPMxに統合可能であることを示唆する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:10:57 GMT)
DOCTOR: A Multi-Disease Detection Continual Learning Framework Based on Wearable Medical Sensors [3.1] ウェアラブル医療センサ(WMS)に基づく多相検出連続学習フレームワークであるDOCTORを提案する。
マルチヘッドディープニューラルネットワーク(DNN)とリプレイスタイルのCLアルゴリズムを採用している。
平均テスト精度は1.43倍、F1スコアは1.25倍、後方転送は0.41倍である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:06:15 GMT)
PPT-GNN: A Practical Pre-Trained Spatio-Temporal Graph Neural Network for Network Security [3.1] PPTGNNは、侵入検知のための実用的で大規模な事前訓練モデルである。
リアルタイムに近い予測が可能で、ネットワークアタックの時間的ダイナミクスをよりよく捉えることができる。
E-ResGATやE-GraphSAGEといった最先端モデルよりも優れ、平均精度は10.38%向上した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:09:46 GMT)
Enhancing supply chain security with automated machine learning [3.0] この研究は、港の混雑、材料不足、インフレーションによって引き起こされる混乱にますます弱いグローバルサプライチェーンの複雑さに取り組む。
我々の焦点は、不正検出、メンテナンス予測、および材料予約予測を通じてサプライチェーンのセキュリティを強化することである。
これらのプロセスを自動化することで,サプライチェーンセキュリティ対策の効率性と有効性を向上させることができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:45:32 GMT)
Root-KGD: A Novel Framework for Root Cause Diagnosis Based on Knowledge Graph and Industrial Data [2.9] Root-KGDは,ナレッジグラフと産業データに基づく根本原因診断フレームワークである。
より正確な根本原因変異診断結果と解釈可能な断層関連情報を提供する。
オンライン産業においてより効果的である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:11:43 GMT)
Multi-Resolution Diffusion for Privacy-Sensitive Recommender Systems [2.8] Score-based Diffusion Recommendation Module (SDRM)を導入し、高精度なレコメンデータシステムのトレーニングに必要な実世界のデータセットの複雑なパターンをキャプチャする。
SDRMは、ユーザのプライバシを保護するために既存のデータセットを置き換える合成データを生成することができる。
提案手法は,Recall@kで平均4.30%,NDCG@kで平均4.65%向上した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:23:55 GMT)
SwinStyleformer is a favorable choice for image inversion [2.8] 本稿では,SwinStyleformerと呼ばれるトランスフォーマー構造インバージョンネットワークを提案する。
実験の結果、トランスフォーマーのバックボーンによるインバージョンネットワークは、画像の反転に成功しなかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:08:45 GMT)
Sync+Sync: A Covert Channel Built on fsync with Storage [2.8] 永続ストレージ用にSync+Syncという隠蔽チャネルを構築します。
Sync+Syncは、通常のソリッドステートドライブで約0.40%のエラーレートで、毎秒20,000ビットの伝送帯域を提供する。
Sync+Syncでサイドチャネルアタックを起動し、被害者データベースの操作を正確に検出する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:37:58 GMT)
Generative AI Misuse: A Taxonomy of Tactics and Insights from Real-World Data [2.8] ジェネレーティブでマルチモーダルな人工知能(GenAI)は、産業全体にわたる変革的なポテンシャルを提供するが、その誤用は重大なリスクをもたらす。
これまでの研究は、悪意ある目的のために悪用される高度なAIシステムの可能性を明らかにしてきた。
本報告では,2023年1月から2024年3月までに報告された約200件の誤用事例の質的分析を行った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:11:17 GMT)
Classical-Quantum correspondence in Lindblad evolution [2.8] 我々は、(多くは)古典的ハミルトン多様体と(多くは)線型的に成長する古典的ジャンプ関数を用いて定義されるリンドブラッドの進化について、エルベルト-シュミットのノルムにおける古典的フォッカー-プランクの進化に近い量子可観測物がエレンフェスト時をはるかに超えていることを示す。
この付録は、リンドブラッド進化における古典的/量子対応を描写し、数学的結果と比較する数値実験を提示する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:05:57 GMT)
Explainable by-design Audio Segmentation through Non-Negative Matrix Factorization and Probing [2.7] 非負行列分解(NMF)に基づく説明可能な音声分割モデルを提案する。
そこで本研究では,NMFから抽出した潜在表現の詳細な解析を行い,高いセグメンテーション性能を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:26:33 GMT)
Fine-tuned Generative Adversarial Network-based Model for Medical Image Super-Resolution [2.6] The Real-Enhanced Super-Resolution Generative Adversarial Network (Real-ESRGAN) is a practical model for recovery HR images from real-world LR images。
実世界の画像劣化をシミュレートするReal-ESRGANの高次劣化モデルを用いる。
提案モデルでは,Real-ESRGANモデルに比べて知覚品質が優れ,細部を効果的に保存し,より現実的なテクスチャで画像を生成する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:07:25 GMT)
CLIP-Branches: Interactive Fine-Tuning for Text-Image Retrieval [2.4] CLIPアーキテクチャ上に構築された新しいテキストイメージ検索エンジンであるCLIP-Branchesを紹介する。
本手法は,インタラクティブな微調整フェーズを組み込むことにより,従来のテキスト画像検索エンジンを強化する。
この結果から, 微調整により, 検索結果の関連性や精度が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:15:10 GMT)
Can LLM-Augmented autonomous agents cooperate?, An evaluation of their cooperative capabilities through Melting Pot [2.4] 本稿では,よく知られたメルチンポット環境を用いた大規模言語モデル拡張自律エージェント(LAA)の協調機能について検討する。
研究のコントリビューションには、LLMにメルティングポットゲームシナリオを適用するための抽象化レイヤが含まれている。
Melting Potの"Commons Harvest"ゲームに関連するメトリクスのセットを用いた協調機能の評価。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:23:05 GMT)
Search-based DNN Testing and Retraining with GAN-enhanced Simulations [2.4] 安全クリティカルなシステムでは、ディープニューラルネットワーク(DNN)がコンピュータビジョンタスクの重要なコンポーネントになりつつある。
本稿では,シミュレータを用いて入力空間を探索するメタヒューリスティック検索と,シミュレータが生成したデータをリアルな入力画像に変換するGAN(Generative Adversarial Networks)を組み合わせることを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:05:16 GMT)
We Are The Clouds: Blending Interaction and Participation in Urban Media Art [2.3] 本稿では,都市環境における対話型・参加型アートの特徴と交差について考察する。
We Are The Cloudsのケーススタディは、インタラクションと参加の戦略的統合がコミュニティのつながりを高め、公共空間を再活性化する上で、焦点となる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:28:51 GMT)
MedCLIP-SAM: Bridging Text and Image Towards Universal Medical Image Segmentation [2.3] 本稿では,CLIPモデルとSAMモデルを組み合わせて臨床スキャンのセグメンテーションを生成する新しいフレームワーク MedCLIP-SAM を提案する。
3つの多様なセグメンテーションタスクと医用画像モダリティを広範囲にテストすることにより、提案手法は優れた精度を示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:21:34 GMT)
Multi-scale Restoration of Missing Data in Optical Time-series Images with Masked Spatial-Temporal Attention Network [2.2] リモートセンシング画像に欠落した値を出力する方法は、補助情報を十分に活用していない。
MS2と呼ばれるディープラーニングベースのアプローチは、リモートセンシング画像の時系列再構成を提案する。
平均信号-信号-信号比0.40dB/1.17dBの改善により、最先端の手法よりも優れる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:05:05 GMT)
CV-Attention UNet: Attention-based UNet for 3D Cerebrovascular Segmentation of Enhanced TOF-MRA Images [2.2] 脳血管画像の正確な抽出にはCV-AttentionUNetと呼ばれる3次元脳血管注意UNet法を提案する。
低と高のセマンティクスを組み合わせるために,注意機構を適用した。
このアルゴリズムの新規性は、ラベル付きデータとラベルなしデータの両方でうまく機能する能力にあると考えています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:57:46 GMT)
StackRAG Agent: Improving Developer Answers with Retrieval-Augmented Generation [2.2] StackRAGは,大規模言語モデルに基づく検索拡張マルチエージェント生成ツールである。
SOからの知識を集約して、生成された回答の信頼性を高める、という2つの世界を組み合わせています。
最初の評価は、生成された回答が正確で正確で、関連があり、有用であることを示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:07:35 GMT)
A Survey on Image-text Multimodal Models [2.2] 本稿ではまず,画像テキストマルチモーダルモデルの技術的進化について概説する。
次に、一般的な画像テキストマルチモーダル技術の開発が、バイオメディカル分野におけるマルチモーダル技術の進展を促進する方法について説明する。
最後に,一般的な画像テキスト・マルチモーダルモデルのアーキテクチャ,コンポーネント,データについて概説し,バイオメディカル分野における画像テキスト・マルチモーダルモデルの適用と改善について紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:53:38 GMT)
Unveiling the Hidden Structure of Self-Attention via Kernel Principal Component Analysis [2.2] 自己アテンション(自己アテンション)は,キー行列の主成分軸上のクエリベクトルを特徴空間に投影することを示す。
本稿では,ロバスト成分を用いたアテンション(RPC-Attention)を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:22:32 GMT)
Global Solutions to Master Equations for Continuous Time Heterogeneous Agent Macroeconomic Models [2.1] エージェント分布を近似し,非線型偏微分方程式により経済の平衡を特徴づける。
ニューラルネットワークを用いて値関数を表現し、ディープラーニングツールを用いた微分方程式の解法を訓練する。
この手法の主な利点は、高次元非線形問題に対する大域的な解を見つけることができることである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:42:53 GMT)
Trusted Video Inpainting Localization via Deep Attentive Noise Learning [2.1] 本稿では,堅牢性と一般化性に優れたTruVIL(Trusted Video Inpainting Localization Network)を提案する。
塗装された痕跡を捉えるために,複数段階の深い注意雑音学習を設計する。
十分なトレーニングサンプルを作成するために,2500本のビデオからなるフレームレベルのビデオオブジェクトセグメンテーションデータセットを構築した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:08:58 GMT)
Combinatorial Reasoning: Selecting Reasons in Generative AI Pipelines via Combinatorial Optimization [2.1] 大きな言語モデル(LLM)は、人間の知性を必要とするタスクにおいて印象的な能力を示す。
しかし、LLMの推論能力は重要な議論の的となっている。
本稿では,完全自動プロンプト方式である Combinatorial Reasoning (CR) について紹介する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:47:44 GMT)
What's Next? Exploring Utilization, Challenges, and Future Directions of AI-Generated Image Tools in Graphic Design [2.1] 本研究は、グラフィックデザインにおけるAI生成画像ツールの現在の使用状況、課題、今後のニーズを理解するために、様々な経験レベルを持つ7人のデザイナーと半構造化インタビューを行った。
私たちの調査結果が示すように、AIツールはデザインにおける創造的なパートナとして機能し、人間の創造性を高め、戦略的洞察を提供し、チームのコラボレーションとコミュニケーションを促進する。
この発見は、エンジニアがグラフィックデザイナのニーズに合うように、これらのツールの最適化を支援することを目的とした、AI生成イメージツールの今後の開発のためのガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:51:56 GMT)
Analyzing Diversity in Healthcare LLM Research: A Scientometric Perspective [1.9] 本稿では,医療のための大規模言語モデル(LLM)研究の包括的科学的分析について述べる。
以上の結果から,男女差や地理的格差が顕著であり,男性作家の優位性が示唆された。
人工知能研究における多様性と傾斜度を高めるための実用的な戦略を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:00:51 GMT)
Robust Time Series Forecasting with Non-Heavy-Tailed Gaussian Loss-Weighted Sampler [1.9] 近年のリサンプリング手法は, ランニング損失に基づいてサンプルを再重み付けすることで, トレーニング効率を向上させることを目的としている。
本稿では,ガウスの損失重みとガウスの分布重みとを乗算するガウスの損失重み付きサンプリング手法を提案する。
これは、平均的な損失に近いものを選びながら、非常に低い、または非常に高い損失でサンプルを選択する確率を下げる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:28:18 GMT)
M3T: Multi-Modal Medical Transformer to bridge Clinical Context with Visual Insights for Retinal Image Medical Description Generation [1.9] Multi-Modal Medical Transformer (M3T)は、視覚表現と診断キーワードを統合する新しいディープラーニングアーキテクチャである。
DeepEyeNetデータセットに関する実験的研究は、眼科医の基準を満たす上でのM3Tの成功を検証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:46:48 GMT)
Guided Context Gating: Learning to leverage salient lesions in retinal fundus images [1.9] 本稿では,ガイド付きコンテキストゲーティングと呼ばれる新しいアテンション機構を提案する。
コンテキスト定式化、チャネル相関、ガイド付きゲーティングを統合して、グローバルコンテキスト、空間相関、局所的病変コンテキストを学ぶ。
ゼノド-DR-7データセットの実験では、高度な注意機構よりも精度が2.63%向上した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:42:35 GMT)
Leveraging Large Language Models for Patient Engagement: The Power of Conversational AI in Digital Health [1.9] 大規模言語モデル(LLM)は、会話型AIを通じて医療における患者のエンゲージメントを変革する新たな機会を開いた。
4つのケーススタディを通して,LLMの非構造化会話データ処理能力を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:02:04 GMT)
A Tree-of-Thoughts to Broaden Multi-step Reasoning across Languages [1.8] CoT(Chain-of-Thought)メソッドは、LLM(Large Language Models)によって複雑なタスクをステップバイステップで解決する。
事前学習データの分布の不均衡のため、多段階推論を実現する能力は英語に限られている。
言語間の相互言語CoT推論を整合させる手法としてクロス言語木(Cross-ToT)を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:07:54 GMT)
Retrieval Augmented Generation using Engineering Design Knowledge [1.7] 本稿では,特許資料から明確で工学的な設計事実を識別する手法を提案する。
本手法では,一対のエンティティが一意にマークされた文を与えられた場合,その文で明示的に伝達される関係を抽出する。
4,870件のファンシステム特許のドメインにこの手法を適用すると、2,93万件以上の知識ベースを蓄積する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:39:46 GMT)
Multi-Meta-RAG: Improving RAG for Multi-Hop Queries using Database Filtering with LLM-Extracted Metadata [1.7] Retrieval-augmented Generation(RAG)は、外部知識ソースから関連する情報の検索を可能にする。
従来のRAGアプリケーションは、マルチホップの質問に答えるには不十分である。
LLM抽出メタデータを用いたデータベースフィルタリング手法であるMulti-Meta-RAGを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:53:48 GMT)
Replica symmetry breaking in spin glasses in the replica-free Keldysh formalism [1.6] ガラス相の持続的緩やかな時効ダイナミクスから, 超音波測定が現れることを示す。
我々は、微視的量子モデルから始まるギンズバーグ・ランダウ効果的なケルディシュ作用を導出した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:08:49 GMT)
Imagining In-distribution States: How Predictable Robot Behavior Can Enable User Control Over Learned Policies [1.6] Imaginary Out-of-Distribution Actions, IODAは, ロボットの行動に対する期待を利用して新しいタスクを遂行するアルゴリズムである。
IODAは、タスクパフォーマンスの向上と、ロボットの動作とユーザの期待の一致の度合いの向上につながる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:08:28 GMT)
Tensor Decompositions and Adiabatic Quantum Computing for Discovering Practical Matrix Multiplication Algorithms [1.6] 本稿では,実用的な行列乗算アルゴリズムの発見と,量子コンピュータ上での分解計算のための2つのアルゴリズムの開発に焦点をあてる。
アルゴリズムは高次非制約バイナリ最適化(HUBO)問題として表現される。
最大分解長よりも短い長さを固定することにより、全体最適化問題の解がより高速な行列乗算アルゴリズムが得られることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:05:57 GMT)
SQL2Circuits: Estimating Metrics for SQL Queries with a Quantum Natural Language Processing Method [1.6] この研究は量子機械学習モデルを構築するために量子自然言語処理(QNLP)に着想を得たアプローチを採用する。
このモデルは、古典的および量子サブルーチンを含むエンコーディング機構とトレーニングフェーズで構成されている。
我々は,このモデルが二項分類タスクにおけるQNLPモデルと同等の精度に達することを結論付けた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:21:44 GMT)
Gate Teleportation in Noisy Quantum Networks with the SquidASM Simulator [1.6] 本稿では,ゲート切断の実装にゲートテレポーテーション方式を用いる方法を示す。
CNOT,DCNOT,CZ,SWAP,Toffoliゲートのシミュレーション結果を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:53:13 GMT)
CNN Based Flank Predictor for Quadruped Animal Species [1.5] 我々は、画像中の4つの哺乳類の視覚的な側面を予測する側面予測器を訓練する。
発達したモデルは、未知の環境と未知の環境において、異なる未知の四つ組種の異なるシナリオで評価された。
EfficientNetV2のバックボーンで訓練された最良のモデルは、複雑な生息地において未知の種であるlynxに対して88.70%の精度を達成した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:24:26 GMT)
Coupled Input-Output Dimension Reduction: Application to Goal-oriented Bayesian Experimental Design and Global Sensitivity Analysis [1.5] 本研究では,高次元関数の入力空間と出力空間の次元を共同で削減する手法を提案する。
従来の手法では、実際は2つを同時に削減するが、入力空間または出力空間の削減に重点を置いている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:31:57 GMT)
Learning Collective Variables with Synthetic Data Augmentation through Physics-inspired Geodesic Interpolation [1.5] 分子動力学シミュレーションでは、タンパク質の折り畳みのようなまれな事象は、通常、強化されたサンプリング技術を用いて研究される。
本研究では,タンパク質の折り畳み遷移に類似した測地線を生成するために物理に着想を得た指標を用いたシミュレーションフリーなデータ拡張戦略を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:01:57 GMT)
Provable Guarantees for Model Performance via Mechanistic Interpretability [1.4] 本稿では,モデル性能に関する形式的保証を導出し,コンパクトに証明するために,機械的解釈可能性を用いることを提案する。
提案手法は, 最大K$タスクで訓練した151個の小型変圧器の精度について, 下限を正式に証明して試作する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:52:58 GMT)
Where there's a will there's a way: ChatGPT is used more for science in countries where it is prohibited [1.4] 本稿では,ChatGPTと科学の事例を用いて,地理的にAIサービスを制限する効果を測定する。
2023年8月までに、ChatGPTは、約12.6%のプレプリントで使用され、法的なアクセスのない国では7.7%上昇した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:35:09 GMT)
Superfluid stiffness of twisted multilayer graphene superconductors [1.4] マジック角度ツイスト三層グラフェン(TTG)における$rho_s$の測定について報告する。
線形温度依存性は低温での$rho_s$と電流バイアス依存性における非線形マイスナー効果である。
その結果, TTGの能動超伝導の強い証拠が得られ, グラフェン系超伝導体の機構に強い制約が課された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:00:04 GMT)
Solving Robust MDPs through No-Regret Dynamics [1.4] 強化学習(Reinforcement Learning)は、エージェントがさまざまな状況をナビゲートするための強力なフレームワークである。
政策訓練法を改善するために,アルゴリズムをどのように利用できるかを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:53:55 GMT)
Quantumness Speeds up Quantum Thermodynamics Processes [1.4] 量子系のコヒーレンスは、すべての非コヒーレント状態を超えた循環的進化に関して、仕事の抽出を高速化することができることを示す。
さらに、量子系の真の絡み合いは、任意の二分割状態を超えて仕事の抽出をスピードアップする可能性があることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:52:19 GMT)
Automated Bioacoustic Monitoring for South African Bird Species on Unlabeled Data [1.4] このフレームワークは、選択された鳥類種の利用可能なプラットフォームからラベル付きデータを自動抽出する。
ラベル付きデータは、環境音やノイズを含む録音に埋め込まれ、畳み込みリカレントニューラルネットワーク(CRNN)モデルのトレーニングに使用された。
適応SED-CRNNモデルはF1スコア0.73に達し、ノイズの多い実世界の条件下で効率を実証した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:14:24 GMT)
On Creativity and Open-Endedness [1.3] 本研究の目的は,計算創造性(CC)と人工生命(ALife)の潜在的な関係に関する議論を活性化することである。
CCの主な目標は、人工システムに創造性を付与することであり、ALifeはOEと人工イノベーションの研究と合成に多くの研究努力を注いでいる。
これらの概念が近接しているにもかかわらず、それらの使用はそれぞれのコミュニティに限られており、それらの関係はほとんど不明である。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:14:33 GMT)
Large-Scale Dataset Pruning in Adversarial Training through Data Importance Extrapolation [1.3] 本稿では,少数のデータ集合からより大きなデータ集合へのデータ重要度スコアの補間に基づく新たなデータ抽出戦略を提案する。
実験的な評価では,外挿型プルーニングは頑健性を維持しつつ,データセットサイズを効率的に削減できることを示した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:23:51 GMT)
Graph-Based Bidirectional Transformer Decision Threshold Adjustment Algorithm for Class-Imbalanced Molecular Data [1.3] 本稿では,Merriman-Bence-Osher(MBO)手法と双方向変換器を組み合わせたBTDT-MBOアルゴリズムを提案する。
提案手法は,クラス不均衡比が非常に高い場合にも,競合アルゴリズムよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:34:07 GMT)
Open Generative Large Language Models for Galician [1.3] 大規模言語モデル(LLM)は自然言語処理に変化をもたらした。
しかし、彼らの主に英語中心のトレーニングは、言語間でのバイアスとパフォーマンスの相違につながっている。
この不均衡は、ガリシア語のような低い資源を持つ言語にとって、NLP技術への公平なアクセスを困難にしている。
このギャップを埋めるために、ガリシアに焦点をあてた最初の2つの生成LDMを提示する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:49:56 GMT)
Generative Modeling by Minimizing the Wasserstein-2 Loss [1.2] 本稿では,2次Wasserstein損失($W$損失)を最小限に抑え,教師なし学習問題にアプローチする。
アルゴリズムは、このスキームに従い、永続的なトレーニングを適用することで設計されます。
低次元と高次元の両方の実験において、我々のアルゴリズムはワッサーシュタイン生成逆数ネットワークよりもはるかに高速に収束する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:15:00 GMT)
Quantum Generative Learning for High-Resolution Medical Image Generation [1.2] 既存のQGAN(Quantum Generative Adversarial Network)は、パッチベースのピクセル単位の学習アプローチのため、高品質な画像を生成することができない。
高品質な医用画像生成のための量子画像生成学習(QIGL)手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:04:32 GMT)
Quantum computing with Qiskit [1.1] 量子情報科学のためのソフトウェア開発キットであるQiskitについて説明する。
我々は、その開発を形作る重要な設計決定について論じ、ソフトウェアアーキテクチャとその中核コンポーネントについて検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:39:44 GMT)
Privacy-Preserving ECG Data Analysis with Differential Privacy: A Literature Review and A Case Study [1.1] 本稿では、差分プライバシーにおける重要な概念の概要と、ECG分析への応用に関する文献レビューと議論について述べる。
論文の第2部では,6段階のプロセスを用いて不整脈データベース上で,差分プライベートなクエリリリースを実現する方法について検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:17:16 GMT)
Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning [1.1] 我々は60以上の異なる非政治エージェントを実装し、それぞれが最新の最先端アルゴリズムから確立された正規化技術を統合する。
これらのエージェントは,2つのシミュレーションベンチマークから,過大評価,過度適合,可塑性損失に関連するトレーニング指標を測定した。
ソフトアクター・クライブエージェントは、適切に正規化され、トレーニング体制内でより優れたパフォーマンスのポリシーを確実に見つける。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:32:01 GMT)
Research on fusing topological data analysis with convolutional neural network [1.0] 本稿では,TDA(Topological Data Analysis)とCNN(TDA-CNN)に基づく特徴融合手法を提案する。
本手法は,CNNが取得した数値分布特徴とTDAが取得した位相構造特徴を組み合わせることで,CNNの特徴学習と表現能力を向上させる。
書道家によるIntel Image、Gender Images、中国書道スタイルなどのデータセットに対する実験的検証では、TDA-CNNはVGG16、DenseNet121、GoogleNetネットワークのパフォーマンスをそれぞれ17.5%、7.11%、そして4.45%改善している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:43:53 GMT)
Quantum steering under constrained free-will [0.9] 量子ステアリング(quantum steering)は、あるパーティの測定が別のパーティの状態を遠隔で変化させるような二部量子相関の一種である。
敵のシナリオでは、当事者の計測設定の選択にバイアスをもたらす隠れ変数が存在する可能性がある。
我々は,相手が選択した測定設定が相手に偏りがある,MD-ステアリングのシナリオを紹介した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:29:35 GMT)
Convergence analysis of kernel learning FBSDE filter [0.9] カーネル学習 後方SDEフィルタは、非線形フィルタリング問題を解決するための反復的かつ適応的なメッシュフリーアプローチである。
フォッカー・プランカー方程式は状態変数の進化密度を定義し、近似密度を利用する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:34:49 GMT)
Low latency optical-based mode tracking with machine learning deployed on FPGAs on a tokamak [0.9] 本研究ではFPGAを用いた高速カメラデータ取得・処理システムについて述べる。
リアルタイムの機械学習ベースのトカマク診断と制御、および他の科学分野の潜在的な応用を可能にする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:10:49 GMT)
The Challenges of Machine Learning for Trust and Safety: A Case Study on Misinformation Detection [0.8] 信頼性と安全性の問題に機械学習を適用する際、奨学金と実践の切り離しについて検討する。
本研究は,現場における248件の有能な論文からなるコーパスにおける誤情報の自動検出に関する文献調査である。
完全自動検出における現在の最先端技術は、人為的誤報の検出において、限られた有効性を有すると結論づける。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:33:53 GMT)
Block-level Text Spotting with LLMs [0.8] 本稿では,ブロックレベルのテキストを識別するためのBTS-LLM (Block-level Text Spotting with LLMs)を提案する。
ブロックレベルのテキストスポッティングにLLMの強い意味的知識を活用することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:37:38 GMT)
M2CURL: Sample-Efficient Multimodal Reinforcement Learning via Self-Supervised Representation Learning for Robotic Manipulation [0.8] マルチモーダルコントラスト非教師強化学習(M2CURL)を提案する。
提案手法は,効率的な表現を学習し,RLアルゴリズムの高速収束に寄与する,新しいマルチモーダル自己教師学習技術を用いている。
Tactile Gym 2シミュレータ上でのM2CURLの評価を行い、異なる操作タスクにおける学習効率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:05:41 GMT)
Detecting Stimuli with Novel Temporal Patterns to Accelerate Functional Coverage Closure [0.7] 本稿では、新しい時間パターンで刺激を識別する2つの新しいテストセレクタを提案する。
両テストセレクタは、ランダムなテスト選択と比較して、商用バスブリッジの機能カバレッジを加速することができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:00:02 GMT)
Solving k-SAT problems with generalized quantum measurement [0.7] 我々は、ベンジャミン、ザオ、フィッツシモンズのプロジェクションに基づく量子測定駆動の$k$-SATアルゴリズムを任意の強度量子測定に一般化する。
このアルゴリズムは連続極限において時間と測定資源が有限であれば最も効率的であると主張する。
解ける$k$-SAT問題に対して、アルゴリズムによって生成されるダイナミクスは、長期(ゼノ)限界におけるターゲットダイナミクスに決定論的に収束する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:05:18 GMT)
Prose-to-P4: Leveraging High Level Languages [0.7] 自然言語命令から高レベルなデータプレーンコードを生成するシステムを開発した。
我々は、自然言語からLucidコードを生成するための有望な予備的な結果を提示する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:32:27 GMT)
COVID-19 Detection System: A Comparative Analysis of System Performance Based on Acoustic Features of Cough Audio Signals [0.7] 本研究は、新型コロナウイルス検出における機械学習(ML)モデルの性能向上を図ることを目的としている。
MFCC(Mel Frequency Cepstral Coefficients)、クロマ(Chroma)、スペクトルコントラスト(Spectral Contrast)の3つの特徴抽出手法の有効性について検討し、2つの機械学習アルゴリズム、SVM(Support Vector Machine)とMLP(Multilayer Perceptron)に適用した。
提案システムでは,COUGHVIDデータセットでは0.843,Virufyでは0.953,最先端の分類性能を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:51:04 GMT)
Physics-informed Neural Networks with Unknown Measurement Noise [0.7] 非ガウス雑音の場合、標準のPINNフレームワークが故障することを示す。
本稿では,エネルギーベースモデル(EBM)を共同で学習し,適切な雑音分布を学習することを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:11:28 GMT)
Generation of Asset Administration Shell with Large Language Model Agents: Towards Semantic Interoperability in Digital Twins in the Context of Industry 4.0 [0.7] 本研究は,デジタル双生児におけるセマンティック・インターオペラビリティを実現するための新しいアプローチを提案する。
業界 4.0 におけるデジタル双対モデルとしてアセット管理シェル (AAS) の作成を支援する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:32:21 GMT)
Emergent representations in networks trained with the Forward-Forward algorithm [0.7] 我々は,フォワード・フォワードアルゴリズムが,高い空間性を示すカテゴリ固有のアンサンブルに編成可能であることを示す。
その結果、フォワード・フォワードが提案する学習手順は、大脳皮質における学習のモデル化において、バックプロパゲーションよりも優れている可能性が示唆された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:32:54 GMT)
DG-RePlAce: A Dataflow-Driven GPU-Accelerated Analytical Global Placement Framework for Machine Learning Accelerators [0.6] DG-RePlAceは、OpenROADインフラストラクチャ上に構築された、GPUによる高速なグローバル配置フレームワークである。
提案手法は,DREAMPlace と比較して高速なグローバル配置とオンパー全実行時間により,経路長を10%削減し,全負スラック(TNS)を31%削減する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:13:46 GMT)
Efficient Training of Probabilistic Neural Networks for Survival Analysis [0.6] 変分推論(VI)は、ディープラーニングモデルにおけるベイズ推定と不確実性推定によく用いられる手法である。
これは、不確実性を表すためにトレーニング可能なパラメータの数を2倍にするため、計算コストがかかる。
本研究では,モデル複雑性のオーバーヘッドを増大させることなく,大規模データセットの深層確率的生存モデルをトレーニングする方法を検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:21:50 GMT)
Deep-learning-assisted reconfigurable metasurface antenna for real-time holographic beam steering [0.6] リアルタイムなホログラフィックビームステアリングが可能な準曲面アンテナを提案する。
再構成可能なダイポールの配列は、メタ原子状態の特定のエンコーディングを通じて、オンデマンドの遠距離放射線パターンを生成することができる。
我々の学習に基づくアルゴリズムは、メタ原子状態を決定するのに200マイクロ秒以内の計算時間を必要とし、ホログラフィックアンテナのリアルタイムなオプアを可能にする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:12:17 GMT)
Standardness Fogs Meaning: A Position Regarding the Informed Usage of Standard Datasets [0.5] 我々は、標準データセットのユースケース、派生カテゴリ、ラベルの一致を評価した。
20のNewsgroupsデータセットに対して、ラベルが不正確であることを実証する。
データセットの標準化の概念は、ユースケース、派生カテゴリ、クラスラベルに一致していることを意味すると結論付けている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:39:05 GMT)
Scarce Resource Allocations That Rely On Machine Learning Should Be Randomized [0.5] 本稿では,機械学習を用いて少ない資源を割当てることがしばしばランダム性を必要とすることを論じる。
我々は、個人が社会財や機会を割り当てなければならないという主張を、より適切に考慮する手順を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:53:11 GMT)
Energy-Efficient Seizure Detection Suitable for low-power Applications [0.5] てんかんは世界中で最も一般的で慢性的な神経疾患である。
神経インプラントは、検出時に来るべき発作を抑制することにより、効果的な治療に使用できる。
本稿では,TC-ResNetと時系列解析によるエネルギー効率の高い発作検出手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:36:29 GMT)
An Embedded Intelligent System for Attendance Monitoring [0.5] 提案システムは,顔認識のための組み込みデバイス (Raspberry with PI camera) と,出席者管理のためのWebアプリケーション (Web Application) の2つの部分から構成される。
提案されたソリューションは、Raspberry Piの限られたリソース、顔認識モデルへの適応の必要性、Raspberry Piカメラが提供するイメージを使用した許容可能なパフォーマンスの実現、といった、さまざまな課題を考慮に入れている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:46:19 GMT)
Topological phases of extended Su-Schrieffer-Heeger-Hubbard model [0.5] 拡張Su-Schrieffer-Heeger-Hubbardモデルは相互作用に対する堅牢なエッジ状態によって特徴付けられる豊富な位相位相を示す。
スピン相関とR'enyi絡み合いエントロピーを解析することにより、これらのエッジ状態の性質を定量化する。
本研究は,CP-AFQMCアルゴリズムを用いた大規模相互作用系におけるトポロジ特性の研究パラダイムを提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:51:28 GMT)
CONTAIN: A Community-based Algorithm for Network Immunization [0.5] 本研究では,ネットワークImmuNizationのための新しいCOmmuNiTyベースのアルゴリズムである containingを提案する。
本ソリューションでは,(1)有害なコンテンツスプレッドラーを検出するためにネットワーク情報を使用し,(2)分割を生成し,各スプレッドラーによって誘導されるサブグラフを用いて,それらをランク付けする。
実世界のデータセットで得られた実験結果は、その内容が最先端のソリューションより優れていることを示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:18:36 GMT)
A Bandit Approach with Evolutionary Operators for Model Selection [0.5] この研究は、モデル選択を無限武装のバンディット問題、すなわち意思決定者が無限数の固定された選択のうちの1つを反復的に選択する問題として定式化する。
アームは、モデルの部分的なトレーニングに対応するアームをトレーニングし、選択するための機械学習モデルである(リソース割り当て)。
本稿では,Audiber らによって導入された UCB-E bandit アルゴリズムに,進化的アルゴリズムからの演算子を組み込んだ Mutant-UCB アルゴリズムを提案する。
3つのオープンソース画像分類データセットで実施されたテストは、この新しい組み合わせ手法の妥当性を証明し、状態よりも優れている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:38:05 GMT)
Learned Graph Rewriting with Equality Saturation: A New Paradigm in Relational Query Rewrite and Beyond [0.4] 論理的および物理的関係性クエリ計画の書き直しは、NPハードなシーケンシャルな意思決定問題であることが証明されている。
本稿では,品質飽和度とグラフ強化学習を両立させることにより,クエリ書き換えの問題に対処する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:11:19 GMT)
Hidden Variables unseen by Random Forests [0.4] 木の成長過程で用いられる単純な代替パーティショニングスキームは、これらの相互作用の同定を促進することができると論じる。
その結果、純粋な相互作用が重要な役割を果たすシナリオにおいて、モデルが適合する能力を高めることが確認された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:07:22 GMT)
Kinetic Inductance, Quantum Geometry, and Superconductivity in Magic-Angle Twisted Bilayer Graphene [0.3] 魔法の角をねじった二層グラフェン(MATBG)の超伝導は、ムーア系の研究に強い関心を持つトピックである。
我々は、MATBGの超流動剛性を直接測定するために、直流輸送およびマイクロ波回路量子力学を用いる。
従来の単一バンドフェルミ液体理論では、超硬度は予想よりもはるかに大きい。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:00:02 GMT)
Neuromorphic quadratic programming for efficient and scalable model predictive control [0.3] イベントベースおよびメモリ統合ニューロモルフィックアーキテクチャは、大規模な最適化問題を解決することを約束する。
本稿では,Intel のスケーラブルなニューロモルフィック研究チップ Loihi 2 上での2次コスト関数と線形制約を用いた凸連続最適化問題の解法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:17:05 GMT)
Advancing Blockchain Scalability: An Introduction to Layer 1 and Layer 2 Solutions [0.2] 本稿では、レイヤ1プロトコルのコンポーネントと、下位レベルのブロックチェーンを直接改善するスケールアップ方法について検討する。
レイヤ1のソリューションには固有の制限があるが、レイヤ1のストレージコストとレイテンシが高いため改善が加えられている。
以上の結果から,Layer 2プロトコルは,ロールアップやチャネルなど,さまざまな実装によって,トランザクションスループットと効率の面で,Layer 1ソリューションよりも優れています。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:30:16 GMT)
MUSE: Flexible Voiceprint Receptive Fields and Multi-Path Fusion Enhanced Taylor Transformer for U-Net-based Speech Enhancement [0.2] マルチパス強化テイラー (MET) 変換器を用いた音声強調 (MUSE) のためのU-netを導入する。
提案手法は,Deformable Embedding (DE) を組み込んだ新しいMulti-path Enhanced Taylor (MET) Transformer Blockを導入し,音声プリントの柔軟な受容場を実現する。
MUSEは、トレーニングとデプロイメントの両方のコストを大幅に削減しながら、競争力のある性能を実現している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:18:31 GMT)
CLFT: Camera-LiDAR Fusion Transformer for Semantic Segmentation in Autonomous Driving [0.2] ビジョン・トランスフォーマー(Vision Transformer)は、コンピュータビジョンアプリケーションにマルチヘッドアテンション機構をうまく導入した新しいグラウンドブレーカーである。
自律運転に適用可能なセマンティックセグメンテーションのためのカメラ-LiDAR融合を実現するビジョントランスフォーマーネットワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:42:12 GMT)
Nicer Than Humans: How do Large Language Models Behave in the Prisoner's Dilemma? [0.1] 複数レベルの敵意を示すランダムな敵に対する反復的囚人ジレンマの演奏におけるLlama2の協調行動について検討した。
Llama2は欠陥を起こさない傾向にあるが、協調に慎重なアプローチを採用する。
ヒトの参加者に関する以前の研究と比較すると、Llama2は協調行動に対するより強い傾きを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:51:14 GMT)
Game of LLMs: Discovering Structural Constructs in Activities using Large Language Models [0.1] 我々は,大規模言語モデルを用いて,基礎となるビルディングブロック(構造構造体)の同定に着目する。
本稿では,これらのビルディングブロックをモデルとしたアクティビティ認識手法の開発を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:02:44 GMT)
Optimal Diffractive Focusing of Quantum Waves [0.1] 位相成分を使わずに1次元と2次元に焦点を合わせるために最適な実数値波動関数を導出する。
反射型および透過型液晶デバイスを用いた光ビームの集束特性を実験的に実証した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:30:51 GMT)
qSWIFT: High-order randomized compiler for Hamiltonian simulation [0.1] ハミルトンシミュレーションは、様々な量子アルゴリズムの基本的な構成要素の1つとして知られている。
ハミルトンシミュレーションのための高次ランダム化アルゴリズムqSWIFTを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:22:05 GMT)
Mining United Nations General Assembly Debates [0.1] 本研究は,国連総会(UNGA)における自然言語処理(NLP)技術の適用について検討する。
NLPを使用することで、大量のテキストデータの効率的な処理と分析が可能になり、セマンティックパターン、感情分析、トピックモデリングの抽出が可能になる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:43:27 GMT)
Wiretapped Commitment over Binary Channels [0.0] この研究における重要な関心は、盗聴者イヴとアリスとボブの共謀の効果を探ることである。
本稿では,いわゆる1民営体制下での有線通信能力について報告する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:02:23 GMT)
Variational Embeddings for Many Body Quantum Systems [0.0] 我々は、量子デバイスを高精度の解法として、関連する自由度に組み込む方法を示す。
スピン鎖および小分子に対するプロトコルの有効性を実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:04:25 GMT)
Utility Pole Fire Risk Inspection from 2D Street-Side Images [0.0] 本稿では,電力網内の山火事のリスクに対処するために,コンピュータビジョン技術を活用した枠組みを提案する。
提案されたパイプラインは、ユーティリティポールを特定するために、簡単に利用可能なGoogleストリートビューイメージを活用する。
本研究はグリッドレジリエンスの強化におけるデータ駆動型意思決定の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 02:21:35 GMT)
Unifying Mixed Gas Adsorption in Molecular Sieve Membranes and MOFs using Machine Learning [0.0] 最近の機械学習モデルは、ポリマーまたは金属-有機フレームワーク(MOF)を別途重視している。
両方のタイプの吸着剤の傾向を予測する統一モデルを作成することの難しさは困難である。
本研究では, ガス混合物と吸着剤の物理的性質のみを含む特徴ベクトルを用いて, これらの問題に対処する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:30:11 GMT)
Understanding User Preferences in Explainable Artificial Intelligence: A Survey and a Mapping Function Proposal [0.0] 本研究は、説明可能な機械学習(XML)における既存の研究の徹底的なレビューを行う。
我々の主な目的は、XMLの領域内でXAIメソッドの分類を提供することです。
本稿では,ユーザとその所望のプロパティを考慮に入れたマッピング関数を提案し,XAI手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:58:30 GMT)
Towards verifications of Krylov complexity [0.0] 私は16の量子力学系のモーメントの完全かつ明示的な表現をSchr"odinger と Heisenberg の両方で正確に解けるように提示する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:20:38 GMT)
Towards Robust Evaluation: A Comprehensive Taxonomy of Datasets and Metrics for Open Domain Question Answering in the Era of Large Language Models [0.0] 自然言語処理におけるオープンドメイン質問回答(ODQA)は,大規模知識コーパスを用いて,事実質問に回答するシステムを構築する。
高品質なデータセットは、現実的なシナリオでモデルをトレーニングするために使用されます。
標準化されたメトリクスは、異なるODQAシステム間の比較を容易にする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:43:02 GMT)
The quantum Ising chain for beginners [0.0] ここでは、学生や非専門家の利益のために、清潔で無秩序な量子イジングチェーンを扱うための様々なテクニックを提示する。
ジョーダン・ウィグナー変換から始まり、この文脈で自然に現れる超伝導相関に対処する基本的なアプローチを概観する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 11:03:29 GMT)
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis [0.0] 本研究は、認知バイアスの是正と人間とAIの相互作用における影響の認識における会話型人工知能(CAI)の有効性を評価する。
この研究は、典型的なユーザとボットの相互作用をシミュレートする臨床ベースの仮想ケースシナリオを用いた構造化手法を用いている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:20:28 GMT)
Text Serialization and Their Relationship with the Conventional Paradigms of Tabular Machine Learning [0.0] 本研究では,機械学習タスクにおける特徴表現と予測に言語モデル(LM)をどのように使用できるかを検討する。
本研究は,新しいLM技術が表型機械学習の伝統的なパラダイムとどのように比較されるかを評価する。
以上の結果から,現在の事前学習モデルは従来の手法に取って代わるべきではないことがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:19:37 GMT)
Strong Noninertial Radiative Shifts in Atomic Spectra at Low Accelerations [0.0] 実験可能な小型加速器において, 純非慣性放射シフトが50倍のエネルギーシフトが得られることを示す。
放射エネルギー準位シフトは、現在の技術でウンルー熱度を検出するための有望な観測可能であると我々は主張する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:01:19 GMT)
Solarcast-ML: Per Node GraphCast Extension for Solar Energy Production [0.0] このプロジェクトは、太陽エネルギー生産予測機能を統合することで、グローバル気象予報のための最先端グラフニューラルネットワーク(GNN)であるGraphCastモデルの拡張を示す。
提案手法は、GraphCastが生成した天気予報を利用して、ニューラルネットワークモデルを用いて、様々な気象条件に基づいて実際の太陽出力と潜在的な太陽出力の比率を予測する。
その結果, 太陽放射の正確な予測, 収束挙動, トレーニング損失の低減, および太陽放射パターンの正確な予測において, モデルの有効性が示された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:47:05 GMT)
Simulating open quantum systems with giant atoms [0.0] 我々は、巨大原子、すなわち原子(おそらく人工)に基づくオープン量子多体系のシミュレータを導入する。
まず、2つの巨大原子からなるシミュレータが2つの結合量子ビットの力学をシミュレートできることを示す。
巨大原子に影響を及ぼす雑音に対するこれらのシミュレーション結果の頑健さを実証および解析した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:31:42 GMT)
SemEval-2017 Task 4: Sentiment Analysis in Twitter using BERT [0.0] 本稿では,SemEval 2017のTwitterにおけるタスク4A,英語,感性分析の解法として,変換器ベースのアーキテクチャであるBERTモデルを用いる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:41:58 GMT)
Seeing the World through an Antenna's Eye: Reception Quality Visualization Using Incomplete Technical Signal Information [0.0] 我々は、一般的に監視や制御目的にのみ使用される技術信号情報に利点を付加する塗装アプローチについて述べる。
生データよりも製品にペンキを塗ることの利点と、技術信号情報の可視化の豊かな可能性を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:49:56 GMT)
Role of Bath-Induced Many-Body Interactions in the Dissipative Phases of the Su-Schrieffer-Heeger Model [0.0] シュリーファー・ヘーガー鎖(Su-Schrieffer-Heeger chain)は、対称性に保護されたトポロジカル絶縁体のプロトタイプである。
細胞間または細胞内のフェルミオントンネル要素を介して、局所的な熱環境に非摂動的に結合することで、トポロジカルウィンドウを修飾する。
我々は最近開発された反応座標ポラロン変換(RCPT)法を用いて,任意の強度でシステム-バス相互作用を処理できる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:07:17 GMT)
Recent advances in text embedding: A Comprehensive Review of Top-Performing Methods on the MTEB Benchmark [0.0] MTEB(Massive Text Embedding Benchmark)におけるテキスト埋め込みの最高性能に着目したユニバーサルテキスト埋め込みモデルの進歩について概説する。
詳細な比較と分析を通じて、この分野における重要な貢献と限界を強調し、将来的な研究の方向性を示唆する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:52:13 GMT)
Quantum spin systems: toroidal classification and geometric duality [0.0] マグノン系の双極子量子特性は、二極子強磁性材料と反強磁性材料の両方で同等に現れることを示す。
その結果、反強磁性系は強磁性系と超高速な双対であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:49:14 GMT)
Quantum simulation for strongly interacting fermions with neutral atoms array: towards the simulation of materials of interest [0.0] 化学のためのRydberg原子シミュレータに実装可能な変分アルゴリズムを設計する。
測定回数を制限することで、5%の誤差でH2、LiH、BeH2分子の基本的なエネルギーに到達できることが示される。
第二のアルゴリズムでは、Rydberg原子シミュレータ上でFermi-Hubbard 2Dモデルの物理を実装するために「スレーブ」スピン法を用いた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:48:10 GMT)
Quantum Algorithm for Solving the Advection Equation using Hamiltonian Simulation [0.0] 一次元の対流は、一階微分の中央有限差分作用素が反エルミート的であるため、直接シミュレートすることができる。
初期量子状態の1つのコピーが必要であり、回路深さは必要な時間ステップ数とともに線形に増加する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:48:43 GMT)
Public Computing Intellectuals in the Age of AI Crisis [0.0] この位置紙は4つのセクションで行うための努力である。
第一に、AI危機の物語の中で、コンピューティングに何が必要なのかを探求する。
第2部は、この危機に対する教育的な対応を明記している。
第3節では、学術計算の実践分野の斬新な特徴について述べる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:13:37 GMT)
Protocols for counterfactual and twin-field quantum digital signature [0.0] 量子デジタルシグネチャ(Quantum Digital signature、QDS)は、その古典的なデジタルシグネチャの量子バージョンである。
量子対実性に基づくQDSスキームを提案する。
本稿では,この双方向プロトコルを等価なノンカウンタブルなワンウェイプロトコルに変換する方法を示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:37:01 GMT)
Privacy-Preserving Logistic Regression Training on Large Datasets [0.0] 我々は,同型暗号化(HE)を用いた大規模暗号化データに対するロジスティック回帰学習のための効率的なアルゴリズムを提案する。
また、データセットがあまりに大きく、ミニバッチ方式で暗号化する必要がある場合に、それらのメソッドのフルバッチバージョンを実装する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 05:19:20 GMT)
Predictive Modeling of Coronal Hole Areas Using Long Short-Term Memory Networks [0.0] 太陽上に存在するコロナホールは 磁場線と 比較的低温で区別される
本研究は、コンピュータビジョンを利用して、コロナホール領域をピンポイントし、太陽ダイナミクス観測所の画像を用いてその次元を推定する。
本研究は, コロナホールの面積に関する時系列データから, コロナホールの挙動のパターンを明らかにすることを目的とする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:08:10 GMT)
Predicting from a Different Perspective: A Re-ranking Model for Inductive Knowledge Graph Completion [0.0] ルール推論モデルは、サブグラフを利用して関係パターンを規則として学習する。
ReDistLP(リンク予測のための個別モデル付き再ランク付け)と呼ばれる再ランク付けモデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:37:53 GMT)
Photon number distribution of squeezed light from a silicon nitride microresonator measured without photon number resolving detectors [0.0] 光子数分布(PND)は、基本的および技術的関連性の非古典性のメトリクスを抽出することができる。
本研究では、しきい値検出器と可変光減衰を用いた窒化ケイ素マイクロ共振器から発生する2モードパルス励起光のPNDを再構成する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:54:05 GMT)
Path-entangled radiation from kinetic inductance amplifier [0.0] そこで我々は,静止路絡み合ったマイクロ波放射を発生させる運動的インダクタンス量子制限増幅器を提案する。
この研究は、量子テレポーテーション、分散量子コンピューティング、拡張量子センシングなどの実用化のための運動インダクタンスパラメトリック増幅器の可能性を強調している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:00:43 GMT)
Outline of an Independent Systematic Blackbox Test for ML-based Systems [0.0] 本稿では、実際のトレーニングプロセスとは無関係に、MLモデルとMLベースのシステムをテストするために使用できるテスト手順を提案する。
このようにして、これらのモデルやシステムの精度や精度といった典型的な品質ステートメントを独立して検証することができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:16:17 GMT)
Optimizing Quantile-based Trading Strategies in Electricity Arbitrage [0.0] 本研究は、日頭取引と市場取引のバランスを最適化し、量的予測を活用することを目的としている。
調査の結果は、日頭市場とバランス市場の両方で同時参加する可能性を示している。
コストの増加と高額取引に伴う利益率の狭さにもかかわらず、高頻度戦略の実装は利益の最大化に重要な役割を果たしている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:27:12 GMT)
On rough mereology and VC-dimension in treatment of decision prediction for open world decision systems [0.0] 新しいオブジェクトが予測された決定値を持つ必要がある場合、オンライン学習は不可欠である。
提案するアプローチは、粗メアロジーの理論に基づいており、集合や概念の理論を必要とする。
我々はこの概念を手続きで適用し、新しいが見えない対象に対する決定を選択する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:22:51 GMT)
Neural Networks Assisted Metropolis-Hastings for Bayesian Estimation of Critical Exponent on Elliptic Black Hole Solution in 4D Using Quantum Perturbation Theory [0.0] 楕円型クラス$textSL(2,mathbbR)$変換の4次元アインシュタイン-アキション-ディラトン系の量子摂動理論について検討する。
本稿では, 量子摂動理論に基づくニューラルニューラルネットワークを用いたメトロポリス・ハスティングスアルゴリズムを開発し, 臨界指数の分布を求める。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:46:22 GMT)
Multipartite multiplexing strategies for quantum routers [0.0] 本研究は,通信ネットワークにおける量子ルータの役割について検討し,メモリと多重化戦略を用いた効率の向上について検討する。
基礎となるマッチング問題を定義した N 個のパーティに対する一般的なプロトコルを提案し、異なる N に対してルータレートを算出する。
多重化による改善を解析し、三部ネットワークの明示的な結果を用いて秘密鍵レートを解析する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:26:33 GMT)
Modeling & Evaluating the Performance of Convolutional Neural Networks for Classifying Steel Surface Defects [0.0] 近年,畳み込みニューラルネットワーク(CNN)により画像分類タスクにおける顕著な識別率が達成されている。
DenseNet201は、NEUデータセットで最大の検出率を示し、98.37%に低下した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:14:50 GMT)
Mixed state representability of entropy-density pairs [0.0] 正準および大正準状態を持つ密度エントロピー対の表現可能性を示す。
我々は、代表状態の運動エネルギーのバウンダリを提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:54:24 GMT)
Medical Spoken Named Entity Recognition [0.0] 医療領域における最初の音声NERデータセットであるVietMed-NERを紹介する。
様々な最先端の事前学習モデルを用いてベースライン結果を示す。
単に翻訳することで、文字はベトナム語だけでなく他の言語にも適用できる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:39:09 GMT)
Media Forensics and Deepfake Systematic Survey [0.0] Deepfakeは、顔の特徴を非常に現実的な方法で生成または変更する、生成的なディープラーニングアルゴリズムである。
映画を良く見せるだけでなく、有名人を模倣して偽情報を広めるのにも使える。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:33:33 GMT)
Mean-Variance Portfolio Selection in Long-Term Investments with Unknown Distribution: Online Estimation, Risk Aversion under Ambiguity, and Universality of Algorithms [0.0] 本稿では、データを徐々に、そして継続的に明らかにする視点を採用する。
提案された戦略の性能は特定の市場で保証される。
定常市場及びエルゴード市場では、投資中の過去の市場情報に基づいて、真の条件分布を利用するいわゆるベイズ戦略は、実証的効用、シャープ比、成長率の観点からは、ほぼ確実に、条件分布に依存しない。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:11:42 GMT)
Managing Temperature in Open Quantum Systems Strongly Coupled with Structured Environments [0.0] ヒルベルト空間における直交多項式 (T-TEDOPA) の定式化により, 階層運動方程式 (HEOM) で低温に達するか, 高温に達するかを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:00:26 GMT)
ManWav: The First Manchu ASR Model [0.0] 本研究は,高資源言語と低資源言語の間の音声認識研究におけるギャップの拡大に対処する。
満州は、最先端技術にアクセスする際の言語コミュニティの限界が直面する課題を実証している。
We introduced the first-ever Manchu ASR model ManWav, using Wav2Vec2-XLSR-53。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:47:34 GMT)
Liveness Detection in Computer Vision: Transformer-based Self-Supervised Learning for Face Anti-Spoofing [0.0] 顔認識システムは、攻撃者が写真、ビデオ、マスクを使って正当なユーザーを偽装する攻撃に対して脆弱である。
この研究は、DINOフレームワークで微調整されたVision Transformer (ViT)アーキテクチャを探索することで、これらの脆弱性に対処する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:44:43 GMT)
Liouville Space Neural Network Representation of Density Matrices [0.0] 本稿では、リウヴィル空間の密度行列を直接表現する制限ボルツマンマシンの拡張について述べる。
これにより平均場理論に現れる状態のコンパクト表現が可能になる。
我々は,2種類の散逸的逆場イジングモデルに対して,我々のアプローチをベンチマークし,他の最先端のアプローチと競合できることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:06:01 GMT)
Joint qubit observables induced by indirect measurements in cavity QED [0.0] 間接的時間連続測定により誘導される時間連続継手量子オブザーバブルについて検討する。
監視方式のタイプを変更したり、キャビティの初期状態を調整したりすることで、キュービットオブザーバブルの特性を調整できることが判明した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:50:25 GMT)
Introducing Individuality into Students' High School Timetables [0.0] 完璧な世界では、各高校生は、それぞれの強み、弱点、好奇心をサポートするパーソナライズされたタイムテーブルを通じて、自分の興味を追求することができる。
本稿では,学生個人の選択をモデル化するための2つの新しい制約と,それらから生じるグループ形成の要件を付加する,人気のあるXHSTTフレームワークの拡張を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:02:44 GMT)
Integration of Policy and Reputation based Trust Mechanisms in e-Commerce Industry [0.0] 電子商取引業界は現在、2つの異なる信頼アプローチを扱っている。
評価と政策に基づく信頼メカニズムの違いを分析する。
電子商取引業界では、買い手と売り手の間の信頼を高めるためのレコメンデーションが提案される。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:47:48 GMT)
Integrating Fuzzy Logic with Causal Inference: Enhancing the Pearl and Neyman-Rubin Methodologies [0.0] データに固有の曖昧さと不正確さの両方を考慮したファジィ因果推論手法を提案する。
線形構造方程式モデル (SEM) の場合, 正規化された式であるNFATE と NGFATE は ATE と同値であることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:54:31 GMT)
Influence of thermal bath on Pancharatnam-Berry phase in an accelerated frame [0.0] 均一に加速された原子は、パンチャラトナム・ベリー相を量子状態に捕獲する。
誘導相は、ウンルーと実際の熱浴の間の交換対称性を捉える。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 10:14:31 GMT)
Implementation and characterization of the dice lattice in the electron quantum simulator [0.0] 調整可能なパラメータを用いたダイス格子の実験的実現について検討する。
ショックレー状態電子の高モビリティは、人工格子の正確な理論的記述を可能にする。
実験結果から,アハロノフ-ボームケージ機構にともなう高縮退エネルギーは,電子移動性に起因している可能性が示唆された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:28:17 GMT)
INFusion: Diffusion Regularized Implicit Neural Representations for 2D and 3D accelerated MRI reconstruction [0.0] Inlicit Neural Representations (INRs) は、MRI(MRI)の取得を加速するための学習ベースのアプローチである。
本研究は、アンダーサンプルMR測定からINRの最適化を規則化する手法であるINFusionを提案する。
また,大規模な3次元MRデータセットにINRを適用可能な拡散正則化を用いたハイブリッド3次元アプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:51:26 GMT)
IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution [0.0] 本稿では,CFATモデルをIG-CFATと呼ばれる改良型GANモデルに拡張する。
IG-CFATは、画像の詳細をより正確に再構築するための意味認識型識別器を組み込んでいる。
提案手法は,GANを用いた超解像モデルにおける従来の損失関数にウェーブレット損失を加え,より効率的に高周波の詳細を再構成する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:21:26 GMT)
Hubbard physics with Rydberg atoms: using a quantum spin simulator to simulate strong fermionic correlations [0.0] 本稿では,スピンベースの量子プロセッサを用いた強相関フェルミオンモデルの平衡物理学と力学を研究するために,ハイブリッド量子古典法を提案する。
この提案では、スレーブスピン法により、オリジナルのハミルトニアンを自己相関フリーフェルミオンとスピンハミルトニアンの和に近似することができるため、フェルミオン-スピンマッピングの通常の落とし穴を避ける。
本稿では,現行のRydbergプロセッサの現実的な数値シミュレーションにより,不完全性が存在する場合でも定量的に実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:45:40 GMT)
How to choose the most appropriate centrality measure? A decision tree approach [0.0] 簡単なグラフ上での集中度挙動の専門的な概念に依拠したカリング法を導入する。
このアプローチを、新しいカーネルベースの指標を含む40の中央集権の多様な集合に適用する。
カルリング法を適用することで、いくつかの中心性指標に関する洞察に富んだ知見が得られる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:03:45 GMT)
Hitchhiker's guide on Energy-Based Models: a comprehensive review on the relation with other generative models, sampling and statistical physics [0.0] エネルギーベースモデル(EBM)は、生成モデリングの領域において強力なフレームワークとして登場した。
このレビューは、物理学者にESMの包括的理解を提供し、他の生成モデルとの関係を説明することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:08:00 GMT)
Hacking coherent-one-way quantum key distribution with present-day technology [0.0] 近年の研究では、コヒーレントワンウェイ(COW)量子鍵分布(QKD)の秘密鍵速度が、システムの透過率と2次的にスケールすることが示されている。
これはいわゆるゼロ・エラー・アタック(ゼロ・エラー・アタック)によって証明された。
本稿では,現在の技術によるCOW QKDに対するゼロエラー攻撃の有効性と有効性について検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:16:29 GMT)
GbHammer: Malicious Inter-process Page Sharing by Hammering Global Bits in Page Table Entries [0.0] 我々はGbHammerと呼ばれる新たな脆弱性を指摘し、攻撃者は悪意ある物理的メモリページを被害者と共有することができることを指摘した。
GbHammerは共有ページを生成するだけでなく、攻撃者が被害者のプロセスを任意のバイナリで実行できるようにする。
サイクル精度のCPUシミュレータ上で動作する実Linuxカーネル上で2つのエクスプロイトを実演する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:26:13 GMT)
From decision aiding to the massive use of algorithms: where does the responsibility stand? [0.0] 私たちが示すのは、彼らが完全な使用状況や結果を受け入れることができないという事実が、到達不可能な限界につながっているという事実です。
一方、技術の使用は、たとえその特性に制限があるとしても、決して責任を負わない。
記事は、その限界が徐々に進化してきたことを示し、未考の問題と責任共有の失敗を残しているように構成されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:10:34 GMT)
From Single Agent to Multi-Agent: Improving Traffic Signal Control [0.0] 本稿では,様々な既存手法を解析し,平均走行時間を短縮するエージェント数を増やすための選択肢を提案する。
その結果、場合によっては、複数のエージェントの実装によって既存のメソッドが改善されることが示されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:46:15 GMT)
Fine-Tuning BERTs for Definition Extraction from Mathematical Text [0.0] 定義抽出」を課題とした3つの事前学習BERTモデルを微調整した。
これは二項分類問題として示され、文が数学的項の定義を含むか、そうでないかのいずれかである。
その結果,高性能なSentence-BERTトランスモデルが全体の精度,リコール,精度の指標に基づいて最適に動作していることが判明した。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:47:23 GMT)
Faster Metallic Surface Defect Detection Using Deep Learning with Channel Shuffling [0.0] 本研究では,小型ネットワーク用に特別に設計されたYou Only Look Once (YOLOv5)に基づくリアルタイム金属表面欠陥検出モデルを提案する。
実験結果から,改良されたモデルでは,精度と検出時間において,他のモデルよりも優れた性能が得られた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:08:49 GMT)
Fair Differentiable Neural Network Architecture Search for Long-Tailed Data with Self-Supervised Learning [0.0] 本稿では,NASの長期化データセットにおける探索・訓練性能の向上について検討する。
まず、NASに関する関連する研究と、長い尾を持つデータセットに対するディープラーニング手法について論じる。
次に、自己教師付き学習と公正な差別化可能なNASを統合したSSF-NASと呼ばれる既存の研究に焦点を当てる。
最後に,性能評価のためのCIFAR10-LTデータセットについて実験を行った。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:39:02 GMT)
Extreme Solar Flare Prediction Using Residual Networks with HMI Magnetograms and Intensitygrams [0.0] HMI強度図とマグネティックグラムを用いた極端太陽フレアの予測手法を提案する。
強度図から太陽点を検出し、磁気グラムから磁場パッチを抽出することにより、極度のクラスフレアを分類するためにResidual Network(ResNet)を訓練する。
我々のモデルは高精度で、極端太陽フレアを予測し、宇宙天気予報を改善するための堅牢なツールを提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:11:28 GMT)
Exponential time differencing for matrix-valued dynamical systems [0.0] 指数時間差分法(ETD)は、線形項を正確に扱い、高度に安定な数値スキームを生成することが知られている。
本稿では,行列値の動的方程式に対するETDアルゴリズムのクラスの拡張を提案する。
これにより、高度に効率的で安定した統合スキームを作成できます。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:22:23 GMT)
Exploring the Impact of Hand Pose and Shadow on Hand-washing Action Recognition [0.0] 本稿では,ポーズと影が分類器の性能に与える影響について検討する。
それらがポーズや影の条件に大きく影響していることを示す。
モデル精度がほぼゼロに低下し、ポーズが大きく変化するのを観察するのは興味深いことです。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:49:12 GMT)
Entanglement-invertible channels [0.0] We generalize Werner's classification of tight quantum teleportation and dense coding schemes。
実際には、テレポーテーションや密度の高い符号化スキームだけでなく、絡み合った可逆チャネルも分類する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 09:46:47 GMT)
Entanglement source and quantum memory analysis for zero added-loss multiplexing [0.0] ZALM量子送信機は、一対のサニャック構成の自発パラメトリックダウンコンバータ(SPDC)、高密度波長分割多重化(DWDM)フィルタリングによるチャネル化、ベル状態測定(BSM)を用いる。
それぞれのバイフォトンは、アリスとボブに、その周波数チャネルと隠蔽された絡み合った状態を特定する古典的なメッセージで送信される。
本稿では、ZALMのSPDC、部分BSM、アリスとボブの量子メモリのロードについて深く研究する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:04:29 GMT)
Entangled Matter-waves for Quantum Enhanced Sensing [0.0] 実験では、共通のキャビティモードにおける原子間の効果的な運動量-交換相互作用を実証した。
キャビティ応答は、原子運動量状態間の多くの異なるスキーズ相互作用をもたらすことを示す。
このシステムは高度に調整可能な多体量子センサーとシミュレータを提供する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:10:27 GMT)
Empirical Evaluation of Integrated Trust Mechanism to Improve Trust in E-commerce Services [0.0] 我々は3つの異なるeコマースサービスにおける統合信頼メカニズムの影響を分析する。
実験で選択されたモデルは、ポリシーと評価に基づく信頼メカニズムの複合である。
学習システムにおける統合的信頼機構と従来の信頼機構の両方を分離することにより、実装の有効性を検証するために、実験が監督されている。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:38:51 GMT)
Efficient Implementation of a Quantum Search Algorithm for Arbitrary N [0.0] 本稿では,$N$が2のパワーではないインスタンスに対するGroverの探索アルゴリズムの拡張について述べる。
計算基底状態のサブセット上での均一な量子重ね合わせ状態の生成に効率的なアルゴリズムを用いることで、多くのケースにおいてオラクル呼び出し(およびグローバーの反復)の数を大幅に削減できることを実証する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 19:16:40 GMT)
Dynamics of a Generalized Dicke Model for Spin-1 Atoms [0.0] ディック模型は理論空洞量子力学(キャビティQED)の基礎である
これは、相転移、相乗法、カオスなど、多様なダイナミクスを示している。
モデルによって認識される多様で複雑な振る舞いは、そのダイナミクスをより厳密にマッピングする必要性を強調します。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 03:26:29 GMT)
Dimension-free uniform concentration bound for logistic regression [0.0] 制約付きロジスティック回帰の次元リスク関数に束縛された新規な一様濃度を与える。
我々の境界は、ラデマッハ複雑性論とマクダイアルメイドの不等式によって導かれる条件よりも大きな数の一様法則に対して、より穏やかな条件をもたらす。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 12:42:02 GMT)
Development of a Dual-Input Neural Model for Detecting AI-Generated Imagery [0.0] AI生成画像を検出するツールを開発することが重要である。
本稿では、画像とフーリエ周波数分解の両方を入力として扱うデュアルブランチニューラルネットワークアーキテクチャを提案する。
提案モデルでは,CIFAKEデータセットの精度が94%向上し,従来のML手法やCNNよりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 16:42:04 GMT)
Deep Learning-Based 3D Instance and Semantic Segmentation: A Review [0.0] 3Dセグメンテーションは、かなり冗長性があり、サンプル密度が変動し、組織が不足しているため、ポイントクラウドデータでは困難である。
ディープラーニングは、一般的なAI手法として、2次元視覚領域のスペクトルにうまく使われてきた。
本研究では3Dインスタンスとセマンティックセグメンテーションに提示された多くの戦略について検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:56:14 GMT)
Decoding the Digital Fine Print: Navigating the potholes in Terms of service/ use of GenAI tools against the emerging need for Transparent and Trustworthy Tech Futures [0.0] この研究は、特定のGenAIにおいて、ユーザの信頼を育み、AIの文脈における情報的意思決定を促進するために、明確で理解不能なサービス用語が果たす重要な役割について調査する。
これは、複雑な法的用語と詳細な細かな印刷によって提示される障害を強調しており、これは真のユーザの同意と会話を妨げる。
発見は文書品質の矛盾と変動を示し、開示の慣行における統一性の要求が押し寄せていることを示している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 13:26:47 GMT)
Data Collection and Labeling Techniques for Machine Learning [0.0] データ収集とラベル付けは、機械学習アプリケーションのデプロイにおいて重要なボトルネックである。
本稿では,データ収集,データラベリング,既存データおよびモデルの改良における最先端手法について概説する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:01:28 GMT)
Cyber Protection Applications of Quantum Computing: A Review [0.0] スキャン検査は 815件の論文を 検討して行われました。
サイバー保護のための多くの量子コンピューティングアプリケーションと、データとプライバシを保護するための多くのテクニックが同定された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:46:31 GMT)
Converging Dimensions: Information Extraction and Summarization through Multisource, Multimodal, and Multilingual Fusion [0.0] 本稿では,複数の情報源の強みを生かして,このような課題に対処する新たな要約手法を提案する。
この研究は、テキストドキュメントのような従来型にない情報源を超えて進展し、YouTubeのプレイリスト、プレプリント、ウィキペディアページなど、より多様なデータを統合している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:15:47 GMT)
Construction numbers: How to build a graph? [0.0] 部分順序の線型拡大の数を数えることは、約50年前にスタンレーによって検討された。
これらのc系列の数は、様々なグラフ族に数えられる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 22:23:31 GMT)
Concept Drift Visualization of SVM with Shifting Window [0.0] 機械学習において、概念ドリフト(英: concept drift)とは、現在のデータモデルを無効化する情報の進化である。
本稿では,並列座標に基づく新しい可視化モデルを提案する。
これらの図は、ドリフトポイントを選択する際に、機械学習モデルによってなされた決定を説明するためにどのように使用できるかを示す。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 18:12:02 GMT)
Chain-of-Thought Unfaithfulness as Disguised Accuracy [0.0] CoT(Chain-of-Thought)世代は、大きな言語モデルの内部計算(LLM)と一致している。
モデルが回答を生成するためのCoTへの依存度を測定する指標を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:49:54 GMT)
Can Low-Rank Knowledge Distillation in LLMs be Useful for Microelectronic Reasoning? [0.0] 電子設計自動化(EDA)におけるオフライン大規模言語モデル(LLM)の実現可能性に関する実証的な結果を示す。
目標は、マイクロエレクトロニクスQ&Aエキスパートとして機能する現代言語モデルの能力(Llama-2-7B)を調査し評価することである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 20:14:39 GMT)
Can AI be enabled to dynamical downscaling? Training a Latent Diffusion Model to mimic km-scale COSMO-CLM downscaling of ERA5 over Italy [0.0] ダウンスケーリング技術は、地球システムモデリングにおけるディープラーニング(DL)の最も顕著な応用の1つである。
本研究では,イタリア上空のERA5データを2kmまでダウンスケールするために,LDM(Latent Diffusion Model)を適用した。
我々の目標は、最近のジェネレーティブモデリングの進歩により、DLベースのモデルが数値的なダウンスケールモデルに匹敵する結果をもたらすことを実証することである。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 15:20:28 GMT)
Calibrating Neural Networks' parameters through Optimal Contraction in a Prediction Problem [0.0] 論文では、リカレントニューラルネットワーク(RNN)を、パラメータが線形な領域の収縮に変換する方法について詳述する。
次に、損失関数の特定の正規化項を持つRNNによってモデル化された予測問題は、その一階条件を解析的に表現できることを示した。
特定の条件が満たされた場合、最適なパラメータが存在し、任意の所望の精度に簡単なアルゴリズムで見つけることができる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 14:16:03 GMT)
CU-Net: a U-Net architecture for efficient brain-tumor segmentation on BraTS 2019 dataset [0.0] そこで本研究では,BraTS 2019データセットを用いた脳腫瘍セグメンテーションのためのColumbia-University-Netアーキテクチャの新たな実装を提案する。
CU-Netモデルは対称なU字型構造を持ち、畳み込み層、最大プーリング、アップサンプリング演算を用いて高分解能セグメンテーションを実現する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:01:01 GMT)
Bridging the Gap in Drug Safety Data Analysis: Large Language Models for SQL Query Generation [0.0] 伝統的に、安全データにアクセスするにはデータベースの専門知識が必要であり、より広範な使用を制限する。
本稿では,非技術的ユーザを対象としたデータベースアクセスの民主化に,LLM(Large Language Models)の新たな応用を提案する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 21:41:11 GMT)
Benchmarking Open-Source Language Models for Efficient Question Answering in Industrial Applications [0.0] 大規模言語モデル (LLM) は質問応答 (QA) のようなタスクにおいて顕著な機能を示した。
本稿では,オープンソース LLM とオープンソースでない LLM を比較し,質問応答の課題について総合的なベンチマーク研究を行う。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 17:11:51 GMT)
Asymmetric dynamical localization and precision measurement of BEC micromotion [0.0] 非零初期運動量で起動されるボース=アインシュタイン凝縮体(BEC)は、小さな初期電流を持つ移動体において非対称局在運動量分布を生成する。
BECを蹴り動かして動く光学格子に利用することにより、初期時間力学における非対称性を測定し、量子系のマイクロモーション現象を正確に特徴づけ、定量化する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:42:56 GMT)
Applications of Post-quantum Cryptography [0.0] レビューでは、2022年から2023年までの期間に制限された、体系的なスクーピングのレビューが採用されている。
このレビューでは、様々な分野における量子コンピューティングの適用について論じている。
本論文は格子ベース,ハッシュベース,コードベース,等質暗号など,様々なPQCアルゴリズムを解析する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 06:45:39 GMT)
An Integration of policy and reputation based trust mechanisms [0.0] この論文の目的は、政策と評価に基づく信頼メカニズムの強みと弱みを特定することである。
提案した統合信頼機構は, オークションシステムにおける買い手/売り手シナリオの実験により検証された。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:57:05 GMT)
Amplitude Amplification and Estimation using quantum kicked rotor [0.0] 量子キックローターは、アンダーソン局在の量子カオスと物理学の研究に広く用いられてきた。
その結果,QKRは非構造化探索を行う量子アルゴリズムの設計に利用できることがわかった。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 04:44:12 GMT)
A minimal quantum heat pump based on high-frequency driving and non-Markovianity [0.0] 2つのトンネル結合型量子ドットからなる量子ヒートポンプの最小構成を提案し、それぞれが単一レベルをホストし、それぞれが異なるフェルミオン貯水池に結合する。
本稿では,Floquet-Born-Markov理論と組み合わせた反応座標写像を用いて,その性能を特徴づけるシステムについて述べる。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 07:32:29 GMT)
A Systematic Literature Review on the Use of Machine Learning in Software Engineering [0.0] 本研究は,ソフトウェア工学プロセスに機械学習技術を適用する際の技術の現状を探るため,その目的と研究課題に従って実施された。
レビューでは、ソフトウェア品質保証、ソフトウェア保守、ソフトウェア理解、ソフトウェアドキュメントなど、MLが適用されたソフトウェアエンジニアリングにおける重要な領域を特定している。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 23:04:27 GMT)
A Simulation Environment for the Neuroevolution of Ant Colony Dynamics [0.0] 創発的集団行動の研究を促進するためのシミュレーション環境を導入する。
現実世界のデータを活用することで、環境はターゲットのアリの跡をシミュレートし、制御可能なエージェントが複製を学ばなければならない。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 01:51:15 GMT)
A New Approach for Evaluating and Improving the Performance of Segmentation Algorithms on Hard-to-Detect Blood Vessels [0.0] 容器の局所強度と画素周辺の画像背景を比較することにより、各容器画素に対して局所血管塩濃度(LVS)指数を算出する。
低濃度リコール(LSRecall)は、低濃度の血管セグメントにおけるセグメンテーションアルゴリズムの性能を定量化する新しい精度指標である。
高いDice値とリコール値を持つセグメンテーションアルゴリズムはLSRecall値が非常に低いことを示し、これらのアルゴリズムの系統的誤りを、低いサリエンスを持つ船舶に対して明らかにする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 00:45:57 GMT)
3D Instance Segmentation Using Deep Learning on RGB-D Indoor Data [0.0] 2次元領域をベースとした畳み込みニューラルネットワーク(Mask R-CNN)深層学習モデルにポイントベースレンダリングモジュールを適用し,深度情報と統合してオブジェクトの3Dインスタンスを認識し,セグメント化する。
3Dポイントクラウド座標を生成するために、RGB画像内の認識対象領域のセグメンテーションされた2Dピクセルを奥行き画像の(u,v)ポイントにマージする。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:00:35 GMT)
$su(d)$-squeezing and many-body entanglement geometry in finite-dimensional systems [0.0] 良く知られたスピンスクイーズの不等式を一般化し、集合$N$- Particle $su(d)$演算子のスクイーズと多粒子系の多体絡み合い幾何の関係について検討する。
論文参考訳(メタデータ) (Wed, 19 Jun 2024 08:40:11 GMT)