Language Model Alignment in Multilingual Trolley Problems [138.6] Moral Machine 実験に基づいて,MultiTP と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。
分析では、19の異なるLLMと人間の判断を一致させ、6つのモラル次元をまたいだ嗜好を捉えた。
我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:48:54 GMT)
AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results [121.0] 本稿では,ECCV 2024における画像操作の進歩(AIM)ワークショップと共同で開催されている圧縮映像品質評価の課題について述べる。
この課題は、様々な圧縮標準の14コーデックで符号化された459本の動画の多様なデータセット上で、VQA法の性能を評価することであった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:58:09 GMT)
Altogether: Image Captioning via Re-aligning Alt-text [118.3] 画像に関連付けられた既存のalt-textを編集・修正する鍵となるアイデアに基づいて、Altogetherの原理的なアプローチについて検討する。
トレーニングデータを生成するために、アノテータは既存のalt-textから始まり、それを複数のラウンドで画像コンテンツにアライメントする。
我々は、このデータに基づいて、大規模にアルトテキストを再調整するプロセスを一般化するキャプタを訓練する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:57 GMT)
MiniPLM: Knowledge Distillation for Pre-Training Language Models [109.8] MiniPLMは、学生言語モデルを事前学習するためのKDフレームワークである。
効率性のために、MiniPLMはオフラインの教師LM推論を実行し、複数の学生LMに対するKDを訓練時間のコストを伴わずに行えるようにした。
柔軟性のために、MiniPLMはトレーニングコーパスのみで動作し、モデルファミリ間のKDを可能にする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:40:32 GMT)
Foundation Models for Remote Sensing and Earth Observation: A Survey [101.8] 本調査は、リモートセンシング基礎モデル(RSFM)の新しい分野を体系的にレビューする。
モチベーションと背景の概要から始まり、続いて基本概念が導入された。
その後、データセットや技術貢献を含む既存のRSFM研究を分類し、レビューする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:08:21 GMT)
Frontiers in Intelligent Colonoscopy [96.6] 本研究は, インテリジェント大腸内視鏡技術のフロンティアと, マルチモーダル医療への応用の可能性について検討する。
大腸内視鏡的シーン知覚のための4つのタスクを通して,現在のデータ中心およびモデル中心のランドスケープを評価した。
今後のマルチモーダル時代を受け入れるために,大規模マルチモーダル・インストラクション・チューニング・データセットColoninST,大腸内視鏡で設計されたマルチモーダル言語モデルColonGPT,マルチモーダル・ベンチマークの3つの基本イニシアティブを構築した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:57:12 GMT)
PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction [94.1] 大きな視覚言語モデル(LVLM)では、画像は豊富な情報を運ぶ入力として機能する。
以前のアプローチでは、LVLMの初期レイヤの前後で画像トークンの数を減らそうとしていた。
本稿では,LVLMの視覚的冗長性低減戦略であるPraamidDropを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:53 GMT)
IPDreamer: Appearance-Controllable 3D Object Generation with Complex Image Prompts [90.5] IPDreamerは複雑な$textbfI$mage $textbfP$romptsから複雑な外観特徴をキャプチャし、合成した3Dオブジェクトをこれらの特徴と整合させる。
IPDreamerはテキストと複雑な画像のプロンプトに整合した高品質な3Dオブジェクトを一貫して生成することを示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:52:42 GMT)
Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.4] 大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。
本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:43:28 GMT)
Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution [90.3] 画像,ビデオ,3Dシーンの空間的時間的理解のための統合マルチモーダルアーキテクチャであるOryxを提案する。
Oryxは任意の空間サイズと時間長の視覚入力をシームレスかつ効率的に処理するオンデマンドソリューションを提供する。
デザイン機能により、Oryxは低解像度で高圧縮でビデオのような非常に長い視覚的コンテキストに対応できる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:17:13 GMT)
Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution [90.3] 画像,ビデオ,3Dシーンの空間的時間的理解のための統合マルチモーダルアーキテクチャであるOryxを提案する。
Oryxは任意の空間サイズと時間長の視覚入力をシームレスかつ効率的に処理するオンデマンドソリューションを提供する。
デザイン機能により、Oryxは低解像度で高圧縮でビデオのような非常に長い視覚的コンテキストに対応できる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:17:13 GMT)
Selective Volume Mixup for Video Action Recognition [89.7] 本稿では,限られたトレーニングビデオを用いた深層モデルの一般化能力を向上させるために,選択ボリューム混合(SV-Mix)と呼ばれる新しいビデオ拡張戦略を提案する。
SV-Mixは、2つのビデオから最も情報性の高いボリュームを選択するための学習可能な選択モジュールを考案し、新しいトレーニングビデオを達成するためにボリュームをミックスする。
SV-Mix拡張の利点を幅広いビデオアクション認識ベンチマークで実証的に実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:27:26 GMT)
The Causal Influence of Grammatical Gender on Distributional Semantics [87.8] 言語間のジェンダー割り当てがどの程度意味を持つかは、言語学と認知科学における研究の活発な領域である。
我々は、名詞の文法的性別、意味、形容詞選択の間の相互作用を共同で表現する、新しい因果的グラフィカルモデルを提供する。
名詞の意味を制御した場合、文法的性別と形容詞的選択の関係は、ほぼゼロであり、無意味である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:21:21 GMT)
Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.9] 検索強化に関して,言語モデルの信頼性に焦点をあてる。
検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。
言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:25:21 GMT)
Optimal Design for Reward Modeling in RLHF [83.4] 我々は,人間からの強化学習における報酬訓練モデルを定式化する。
有効なデータセットの選択は、単純な後悔の最小化タスクとしてフレーム化します。
適切な前提の下では、単純な後悔に縛られる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:36:44 GMT)
LiNeS: Post-training Layer Scaling Prevents Forgetting and Enhances Model Merging [80.2] LiNeSは、微調整タスク性能を向上しつつ、事前訓練された一般化を維持するために設計されたポストトレーニング編集技術である。
LiNeSは、視覚と自然言語処理のさまざまなベンチマークにおいて、シングルタスクとマルチタスクの両方で大幅に改善されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:26:05 GMT)
NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples [79.8] 視覚自動モデル(VLM)は、人間が容易に答えられるような自然なイメージや疑問に苦戦している。
我々は,1万個の人間検証VQAサンプルを用いて,VLMを確実に評価するための新しいベンチマークであるNaturalBenchを提案する。
LLaVA-OneVision, Cambrian-1, Llama3.2-Vision, Molmo, Qwen2-VL, および GPT-4o lag の 50%-70% 遅れ(90%以上)を示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:07:22 GMT)
Mini-InternVL: A Flexible-Transfer Pocket Multimodal Model with 5% Parameters and 90% Performance [78.5] Mini-InternVL は 1B から 4B までのパラメータを持つ一連の MLLM であり、パラメータの 5% しか持たない性能の90% を達成している。
我々は,ダウンストリームタスクにおける特化モデルの転送と性能向上を可能にする,Mini-InternVLの統一適応フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:09:52 GMT)
Aligning Large Language Models via Self-Steering Optimization [78.4] 本稿では,高品質な選好信号を自律的に生成するアルゴリズムであるSelf-Steering Optimization(SSO$)を紹介する。
SSO$は、選択された応答と拒否された応答の間に一貫したギャップを確保することで、信号の精度を維持する。
我々は、Qwen2とLlama3.1という2つの基礎モデルを用いて、$SSO$の有効性を検証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:04:03 GMT)
EF-3DGS: Event-Aided Free-Trajectory 3D Gaussian Splatting [76.0] 生物学的ビジョンにインスパイアされたイベントカメラは、時間分解能の高い画素の強度を非同期に記録する。
本稿では,イベントカメラの利点を3DGSにシームレスに統合するイベント支援フリートラジェクトリ3DGSを提案する。
提案手法を,パブリックタンクとテンプルのベンチマークと,新たに収集した実世界のデータセットであるRealEv-DAVISで評価した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:22:20 GMT)
Graph Transformers Dream of Electric Flow [72.1] グラフデータに適用された線形変換器は、正準問題を解くアルゴリズムを実装可能であることを示す。
そこで我々は,これらのグラフアルゴリズムをそれぞれ実装するための明示的な重み設定を提案し,基礎となるアルゴリズムの誤差によって構築したトランスフォーマーの誤差を限定する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:11:45 GMT)
CoPS: Empowering LLM Agents with Provable Cross-Task Experience Sharing [70.3] クロスタスク体験の共有と選択によるシーケンシャル推論を強化する一般化可能なアルゴリズムを提案する。
我々の研究は、既存のシーケンシャルな推論パラダイムのギャップを埋め、タスク間体験の活用の有効性を検証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:59:53 GMT)
Transformer for Object Re-Identification: A Survey [69.6] ビジョントランスフォーマーは、TransformerベースのRe-IDをさらに深く研究している。
本稿では、TransformerベースのRe-IDの総合的なレビューと詳細な分析を行う。
本稿では,教師なしRe-IDのトレンドを考えると,最先端性能を実現するための新しいトランスフォーマーベースラインUntransReIDを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:17:47 GMT)
Context-aware Prompt Tuning: Advancing In-Context Learning with Adversarial Methods [69.4] In this work introduced Context-aware Prompt Tuning (CPT) - ICL, PT, and adversarial attack。
入力および出力フォーマットのユニークな構造を考慮して、特定のコンテキストトークンを変更する。
敵の攻撃にインスパイアされた我々は、損失を最大化するのではなく、最小化に焦点をあてて、コンテキストに存在するラベルに基づいて入力を調整する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:45:47 GMT)
A Comparative Study on Reasoning Patterns of OpenAI's o1 Model [69.1] OpenAIのo1モデルは、ほとんどのデータセットで最高のパフォーマンスを実現しています。
また、いくつかの推論ベンチマークについて詳細な分析を行う。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:05:16 GMT)
Toward Fairer Face Recognition Datasets [69.0] 顔認識と検証は、ディープ表現の導入によってパフォーマンスが向上したコンピュータビジョンタスクである。
実際のトレーニングデータセットにおける顔データとバイアスのセンシティブな性格による倫理的、法的、技術的な課題は、彼らの開発を妨げる。
生成されたトレーニングデータセットに階層属性のバランス機構を導入することにより、公平性を促進する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:46:00 GMT)
Context-Parametric Inversion: Why Instruction Finetuning May Not Actually Improve Context Reliance [68.6] 本研究では,この文脈依存の根底にある理由,特に指導調律後の理解を試みている。
命令チューニング中、コンテキスト依存は期待通りに増大するが、命令の微調整が進むにつれて徐々に減少する。
我々はこの現象を、入力コンテキストがモデルのパラメトリック知識にすでに存在する情報を提供する命令微調整データ混合の例に結びつける。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:35:03 GMT)
Context-Parametric Inversion: Why Instruction Finetuning May Not Actually Improve Context Reliance [68.6] In-principleでは、モデルが命令の微調整後にユーザコンテキストに適応することを期待する。
インストラクションチューニング中、知識の衝突によるコンテキスト依存は、当初期待通りに増大するが、徐々に減少する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:35:03 GMT)
DI-MaskDINO: A Joint Object Detection and Instance Segmentation Model [67.6] MaskDinoの開始変圧器デコーダ層から中間結果を調べる際に, 物体検出遅延がインスタンスセグメンテーションの遅れ(すなわち, 性能不均衡)の原因となる。
本稿では,DI-MaskDINOモデルを提案する。その中核となる考え方は,検出・セグメンテーションの不均衡を緩和し,最終的な性能を改善することである。
DI-MaskDINOはCOCOとBDD100Kベンチマークで既存のジョイントオブジェクト検出とインスタンスセグメンテーションモデルを上回っている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:22:49 GMT)
Improving Reinforcement Learning from Human Feedback with Efficient Reward Model Ensemble [67.4] 人間のフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、大きな言語モデルと人間の価値を整合させる手法として広く採用されている。
しかし、RLHFは限られた量の人間の嗜好データで訓練された報酬モデルに依存している。
報奨モデルによりより正確な予測が可能となる報奨アンサンブル法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:19:20 GMT)
Evaluating Human Alignment and Model Faithfulness of LLM Rationale [66.8] 大規模言語モデル(LLM)が,その世代を理論的にどのように説明するかを考察する。
提案手法は帰属に基づく説明よりも「偽り」が少ないことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:13:15 GMT)
Cross-Modality Perturbation Synergy Attack for Person Re-identification [66.5] 相互モダリティReIDの主な課題は、異なるモダリティ間の視覚的差異を効果的に扱うことである。
既存の攻撃方法は、目に見える画像のモダリティの特徴に主に焦点を当てている。
本研究では,クロスモーダルReIDに特化して設計されたユニバーサル摂動攻撃を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:48:13 GMT)
LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding [65.5] LongVUは、長いビデオの視覚的詳細を保存しながら、ビデオトークンの数を減らす適応圧縮機構である。
DINOv2の機能を利用して、高い類似性を示す冗長なフレームを削除します。
時間的依存関係に基づいて,フレーム間の空間トークン削減を行う。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:21:37 GMT)
WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling [65.3] 言語モデルの重要な構成要素は、高次元の自然信号を低次元の離散トークンに圧縮するトークン化器である。
本稿では,従来の音響領域におけるSOTA音響モデルよりもいくつかの利点があるWavTokenizerを紹介する。
WavTokenizerは、優れたUTMOSスコアを持つ最先端の再構築品質を実現し、本質的によりリッチなセマンティック情報を含んでいる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:40:15 GMT)
NVLM: Open Frontier-Class Multimodal LLMs [64.0] NVLM 1.0は、フロンティアクラスのマルチモーダル言語モデル(LLM)のファミリーであり、視覚言語タスクの最先端結果を実現する。
トレーニング効率とマルチモーダル推論能力を両立させる新しいアーキテクチャを提案する。
我々は、NVLM-1.0モデルのための生産級マルチモーダリティを開発し、視覚言語タスクに優れる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:13:34 GMT)
VistaDream: Sampling multiview consistent images for single-view scene reconstruction [64.0] VistaDreamは、単一のビューイメージから3Dシーンを再構築するフレームワークである。
近年の拡散モデルでは、単一ビューの入力画像から高品質のノベルビュー画像を生成することができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:55:59 GMT)
JMMMU: A Japanese Massive Multi-discipline Multimodal Understanding Benchmark for Culture-aware Evaluation [63.8] JMMMU(JMMMU、日本語MMMU)は、日本の文化状況に基づいて、専門家レベルのタスクでLMMを評価するために設計された、日本初の大規模ベンチマークである。
CAサブセットを用いて、日本語で評価すると、多くのLMMのパフォーマンス低下が観察される。
両サブセットを組み合わせることで,一部のLMMはCAサブセットでは良好に機能するが,CSサブセットでは機能しないことが明らかとなり,文化的理解の深みに欠ける日本語の理解が浅かった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:56 GMT)
Remote Timing Attacks on Efficient Language Model Inference [63.8] タイミング差を利用してタイミングアタックをマウントできることが示される。
90%以上の精度でユーザの会話の話題を学習することができるかを示す。
相手はブースティング攻撃を利用して、オープンソースのシステム用のメッセージに置かれたPIIを回復することができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:51:36 GMT)
Arabic Dataset for LLM Safeguard Evaluation [63.0] 本研究では,アラビア語における大言語モデル(LLM)の安全性と,その言語的・文化的複雑さについて考察する。
本稿では, 直接攻撃, 間接攻撃, センシティブな単語による無害な要求を含む5,799の質問からなるアラブ地域固有の安全評価データセットを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:12:43 GMT)
Granularity Matters in Long-Tail Learning [62.3] より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:35:13 GMT)
Targeted Separation and Convergence with Kernel Discrepancies [62.0] カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:38:35 GMT)
Binarized Diffusion Model for Image Super-Resolution [62.0] 超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:28:13 GMT)
LFME: A Simple Framework for Learning from Multiple Experts in Domain Generalization [61.2] ドメイン一般化(Domain Generalization, DG)手法は、複数のソースドメインからのトレーニングデータを使用することで、目に見えないターゲットドメインにおける優れたパフォーマンスを維持することを目的としている。
この作業では、DGを改善するために、ターゲットモデルをすべてのソースドメインの専門家にすることを目的とした、複数の専門家(LFME)からの学習と呼ばれる、シンプルだが効果的なフレームワークを導入している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:44:10 GMT)
Emphasizing Discriminative Features for Dataset Distillation in Complex Scenarios [60.5] 合成画像における重要な識別領域を強化するデータセット蒸留法であるEDFを提案する。
単純なデータセットでは、高活性化領域が画像の大部分を占めるのに対して、複雑なシナリオでは、これらの領域のサイズはずっと小さくなります。
特にEDFは、ImageNet-1Kサブセットのような複雑なシナリオにおいて、SOTAの結果を一貫して上回る。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:13:19 GMT)
On the Vulnerability of Text Sanitization [60.2] テキストの衛生化を目的とした理論的に最適な再構築攻撃を提案する。
衛生性能を評価するためのベンチマークとして, ASR のバウンダリを導出する。
我々の攻撃の1つは、最先端のベースラインよりもASRが46.4%向上したことである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:31:53 GMT)
Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss [59.8] 本稿では, コントラスト損失計算を任意の小ブロックに分割するタイルベースの戦略を提案する。
分散システムの階層構造を活用するためのマルチレベルタイリング戦略も導入する。
SOTAメモリ効率のソリューションと比較すると、同等の速度を維持しながら、メモリの2桁の削減を実現している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:30 GMT)
Distill-SynthKG: Distilling Knowledge Graph Synthesis Workflow for Improved Coverage and Efficiency [59.7] 大規模言語モデル(LLM)によって生成される知識グラフ(KG)は、検索・拡張生成(RAG)アプリケーションにとってますます価値が増している。
既存のKG抽出法は、大規模コーパスの処理に非効率なプロンプトベースのアプローチに依存している。
LLMに基づく多段階文書レベルのKGワークフローであるSynthKGを提案する。
我々はまた、RAGのための新しいグラフベースの検索フレームワークを設計する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:47:54 GMT)
Holmes: A Benchmark to Assess the Linguistic Competence of Language Models [59.6] 言語モデル(LM)の言語能力を評価するための新しいベンチマークであるHolmesを紹介する。
我々は、計算に基づく探索を用いて、異なる言語現象に関するLMの内部表現を調べる。
その結果,近年,他の認知能力からLMの言語能力を引き離す声が上がっている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:08:52 GMT)
Holmes: A Benchmark to Assess the Linguistic Competence of Language Models [59.6] 言語モデル(LM)の言語能力を評価するための新しいベンチマークであるHolmesを紹介する。
我々は、計算に基づく探索を用いて、異なる言語現象に関するLMの内部表現を調べる。
その結果,近年,他の認知能力からLMの言語能力を引き離す声が上がっている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:08:52 GMT)
Exploration and Persuasion [58.9] 我々は、自己関心のあるエージェントが利用したいときの探索にインセンティブを与える方法を示す。
不確実性の下で決定を下す利己的なエージェントの集団を考える。
彼らは新しい情報を取得し、良い決定を下すためにこの情報を「発見」する。
これは、探査が費用がかかるためであるが、将来多くのエージェントにその利点が広がるためである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:13:13 GMT)
Point Cloud Matters: Rethinking the Impact of Different Observation Spaces on Robot Learning [58.7] ロボット学習においては、異なるモードの異なる特徴のために観察空間が不可欠である。
本研究では,RGB, RGB-D, 点雲の3つのモードに着目し, 様々な観測空間がロボット学習に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:42:39 GMT)
LIMIS: Towards Language-based Interactive Medical Image Segmentation [58.6] LIMISは、最初の純粋言語に基づく対話型医療画像分割モデルである。
我々は、Grounded SAMを医療領域に適応させ、言語に基づくモデルインタラクション戦略を設計する。
LIMISを3つの公開医療データセット上で,パフォーマンスとユーザビリティの観点から評価した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:13:47 GMT)
Rethinking Complex Queries on Knowledge Graphs with Neural Link Predictors [58.3] 本稿では,証明可能な推論能力を備えた複雑なクエリを用いたエンドツーエンド学習を支援するニューラルシンボリック手法を提案する。
これまでに検討されていない10種類の新しいクエリを含む新しいデータセットを開発する。
提案手法は,新しいデータセットにおいて先行手法を著しく上回り,既存データセットにおける先行手法を同時に上回っている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:28:13 GMT)
Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.3] 本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:09:57 GMT)
Towards Understanding the Working Mechanism of Text-to-Image Diffusion Model [57.2] 近年,高画質テキスト・トゥ・イメージ(T2I)生成に強力な遅延拡散確率モデル (DPM) が適用されている。
段階的デノナイジング生成過程における中間状態を調べることでDPMの背後にあるメカニズムを解明する。
本稿では,テキストガイダンスを適切に取り除き,T2I生成プロセスの高速化に本観測を適用した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:01:45 GMT)
Decoding Time Series with LLMs: A Multi-Agent Framework for Cross-Domain Annotation [56.8] TESSAは、時系列データに対する一般的なアノテーションとドメイン固有のアノテーションの両方を自動的に生成するように設計されたマルチエージェントシステムである。
General Agentは複数のソースドメインにまたがる共通パターンと知識をキャプチャし、時系列とテキストの両方の機能を利用する。
ドメイン固有のエージェントは、ターゲットドメインからの限定アノテーションを使用して、ドメイン固有の用語を学び、ターゲットアノテーションを生成する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:43:14 GMT)
Warped Diffusion: Solving Video Inverse Problems with Image Diffusion Models [56.7] 我々は、フレームを2次元空間における連続関数と見なし、ビデオは異なるフレーム間の連続的なワープ変換の列と見なす。
この観点から,画像上でのみ関数空間拡散モデルを訓練し,時間的に相関した逆問題を解くことができる。
本手法により,ビデオ逆問題を解決するために,安定拡散XLのような最先端の潜伏拡散モデルを展開することができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:37:37 GMT)
One Thousand and One Pairs: A "novel" challenge for long-context language models [56.6] NoChaは、67冊の架空の書籍に関する1,001対の真偽の主張のデータセットである。
当社のアノテータは、NoChaにおけるペアの最大シェアは、本全体に対するグローバルな推論を必要としていることを確認しています。
平均的なモデルでは、文レベルの検索しか必要としないペアの方が、グローバルな推論よりもはるかに優れています。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:09:58 GMT)
Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.4] 機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:19:27 GMT)
Sample-efficient Bayesian Optimisation Using Known Invariances [56.3] バニラと制約付きBOアルゴリズムは、不変目的を最適化する際の非効率性を示す。
我々はこれらの不変カーネルの最大情報ゲインを導出する。
核融合炉用電流駆動システムの設計に本手法を用い, 高性能溶液の探索を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:51:46 GMT)
SafetyAnalyst: Interpretable, transparent, and steerable LLM safety moderation [56.1] 本稿では,新しいLLM安全モデレーションフレームワークであるSafetyAnalystを紹介する。
SafetyAnalystは、プロンプトが与えられたら、構造化された「ハームベネフィットツリー」を作成する。
そして、この構造化された表現を有害度スコアに集約する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:38:37 GMT)
4Diffusion: Multi-view Video Diffusion Model for 4D Generation [55.8] 現在の4D生成法は, 高度な拡散生成モデルの助けを借りて, 有意義な有効性を実現している。
モノクロビデオから空間的・時間的に一貫した4Dコンテンツを生成することを目的とした,新しい4D生成パイプライン,すなわち4Diffusionを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:50:16 GMT)
Scattered Forest Search: Smarter Code Space Exploration with LLMs [55.7] Scattered Forest Searchを導入し,ソリューションを探索しながら解の多様性を高める。
HumanEval、MBPP、APPS、CodeContests、Leetcodeの実験では、大幅なパフォーマンス向上が示されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:58:29 GMT)
Offline Evaluation of Set-Based Text-to-Image Generation [55.2] 理想はテキスト・トゥ・イメージ(TTI)タスクの重要なサブクラスである。
TTIの既存の評価基準は、依然として分布類似度指標に焦点が当てられている。
我々は、ユーザが空間的に配置された画像の集合を閲覧し、どのように相互作用するかという明示的なモデルを用いて、TTI評価メトリクスを開発する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:04:00 GMT)
Large Language Models Empowered Personalized Web Agents [54.9] Webエージェントは、従来のエージェントから、LLM(Large Language Models)ベースのWebエージェントへと進化してきた。
まず, LLMを活用したパーソナライズされたWebエージェントのタスクを定式化し, パーソナライズされたデータとユーザ指示を統合する。
我々はパーソナライズされたユーザメモリ拡張アライメント(PUMA)フレームワークを提案し、パーソナライズされたWebエージェントタスクにLLMを適用する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:54:45 GMT)
Resolvability of classical-quantum channels [54.8] 2つの設定で古典量子チャネルの可解性について検討し、最悪の入力から生成されたチャネル出力について検討し、固定独立かつ同一に分散された(d.d.)入力を形成する。
固定入出力設定では、既知の量子ソフト被覆結果から直部が従うが、最近の代替量子サノフ定理を利用して強い逆を解く。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:18:43 GMT)
Interpreting Affine Recurrence Learning in GPT-style Transformers [54.0] インコンテキスト学習により、GPTスタイルのトランスフォーマーは、重みを変更することなく推論中に一般化できる。
本稿では,ICLタスクとしてアフィンの再発を学習し,予測する能力に着目する。
実験的手法と理論的手法の両方を用いてモデルの内部動作を分析する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:30:01 GMT)
Fast Graph Sharpness-Aware Minimization for Enhancing and Accelerating Few-Shot Node Classification [53.7] グラフニューラルネットワーク(GNN)はノード分類において優れた性能を示している。
高速グラフシャープネス認識最小化(FGSAM)を提案する。
提案アルゴリズムは,FSNCタスクにおいて,計算コストの低い標準SAMよりも優れる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:33:29 GMT)
Scalable spectral representations for network multiagent control [53.6] マルチエージェント制御の一般的なモデルであるNetwork Markov Decision Processes (MDPs)は、効率的な学習に重大な課題をもたらす。
まず、ネットワークMDPに対してスケーラブルなスペクトル局所表現を導出し、各エージェントの局所$Q$関数に対するネットワーク線形部分空間を誘導する。
我々は,連続的な状態対応ネットワークMDPのためのスケーラブルなアルゴリズムフレームワークを設計し,アルゴリズムの収束をエンドツーエンドで保証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:45:45 GMT)
HAF-RM: A Hybrid Alignment Framework for Reward Model Training [51.6] 報酬モデルトレーニングのためのハイブリッドアライメントフレームワークHaF-RMを提案する。
報酬モデルのパフォーマンスとアライメントを高めるための、原則的で効果的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:53:02 GMT)
How to Evaluate Reward Models for RLHF [51.3] 我々は、RLHF(Reinforcement Learning from Human Feedback)を通して強力な言語モデルを生成する能力を定量化する報酬モデルのための新しいベンチマークを導入する。
我々は,プロキシタスクの報酬モデルを評価することにより,下流LLM性能の予測モデルを構築した。
大規模クラウドソースによる人選好プラットフォーム上でのエンドツーエンドのRLHF実験をローンチした。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:18:14 GMT)
Learning to Denoise Biomedical Knowledge Graph for Robust Molecular Interaction Prediction [50.8] 分子間相互作用予測のためのバイオKDN (Biomedical Knowledge Graph Denoising Network) を提案する。
BioKDNは、ノイズの多いリンクを学習可能な方法で識別することで、局所的な部分グラフの信頼性の高い構造を洗練する。
ターゲットの相互作用に関する関係を円滑にすることで、一貫性とロバストなセマンティクスを維持する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:12:24 GMT)
Characterizing Robocalls with Multiple Vantage Points [50.4] 苦情や通話量はまだ高いものの、無言通話は緩やかに減少傾向にある。
ロボコールがSTIR/SHAKENに適応していることがわかりました。
以上の結果から,電話スパムの特徴化と防止に向けた今後の取り組みの最も有望な方向性が浮かび上がっている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:54:12 GMT)
Graph Neural Networks for Edge Signals: Orientation Equivariance and Invariance [50.3] 我々は、新しい方向対応エッジレベルグラフシフト演算子からなるアーキテクチャであるEIGNを開発する。
EIGNは、例えばRMSEのフローシミュレーションタスクを最大43.5%改善するなど、エッジレベルのタスクにおける以前の作業より優れていた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:12:43 GMT)
ControlSpeech: Towards Simultaneous Zero-shot Speaker Cloning and Zero-shot Language Style Control With Decoupled Codec [50.3] 話者の声を完全に模倣し,任意の発話スタイルの制御と調整を可能にするTTSシステムであるControlSpeechを提案する。
以前のゼロショットTSモデルとコントロール可能なTSモデルは、さらなる制御と調整機能なしでスピーカーの声を模倣することしかできず、スピーカー固有の音声生成とは無関係であった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:26:55 GMT)
LVSM: A Large View Synthesis Model with Minimal 3D Inductive Bias [50.1] スパースビュー入力からのスケーラブルで一般化可能な新規ビュー合成のためのトランスフォーマーに基づくアプローチを提案する。
本稿では,(1)入力画像トークンを1次元遅延トークンにエンコードするエンコーダデコーダLVSM,(2)入力画像を直接新規ビュー出力にマッピングするデコーダのみLVSMの2つのアーキテクチャを紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:58:28 GMT)
(Quantum) Indifferentiability and Pre-Computation [50.1] 微分可能性(Indifferentiability)は、理想的なオブジェクトのセキュリティを分析するための暗号パラダイムである。
その強さにもかかわらず、前処理攻撃に対するセキュリティを提供する無差別性は知られていない。
本稿では、構成可能であるだけでなく、任意の事前計算を考慮に入れた微分可能性の強化を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:41:47 GMT)
Exploring RL-based LLM Training for Formal Language Tasks with Programmed Rewards [49.8] 本稿では,PPOを用いた強化学習(RL)の実現可能性について検討する。
我々は,生成した出力の質を自動的に評価するために,明示的な報酬関数をプログラムできるプログラミングなどの形式言語で表されるタスクに焦点をあてる。
以上の結果から,2つの形式言語タスクに対する純粋なRLベースのトレーニングは困難であり,単純な算術タスクにおいても成功は限られていることがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:59:58 GMT)
S2-Attention: Hardware-Aware Context Sharding Among Attention Heads [49.1] スパースアテンションは、コンテキスト内のトークンのサブセットに選択的に出席する。
スパース・アテンションが今日の大規模言語モデルでモデルの品質を維持することができるかどうかは不明だ。
本稿では,Sparsely-Sharded(S2) attention, a Triton library that provide kernel optimization for sparse attention for sparse attention to customizable per-head and per-context-range levels。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:26:51 GMT)
S2-Attention: Hardware-Aware Context Sharding Among Attention Heads [49.1] スパースアテンションは、コンテキスト内のトークンのサブセットに選択的に出席する。
スパース・アテンションが今日の大規模言語モデルでモデルの品質を維持することができるかどうかは不明だ。
本稿では,Sparsely-Sharded(S2) attention, a Triton library that provide kernel optimization for sparse attention for sparse attention to customizable per-head and per-context-range levels。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:26:51 GMT)
S2-Attention: Hardware-Aware Context Sharding Among Attention Heads [49.1] スパースアテンションは、コンテキスト内のトークンのサブセットに選択的に出席する。
スパース・アテンションが今日の大規模言語モデルでモデルの品質を維持することができるかどうかは不明だ。
本稿では,Sparsely-Sharded(S2) attention, a Triton library that provide kernel optimization for sparse attention for sparse attention to customizable per-head and per-context-range levels。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:26:51 GMT)
Data-driven Coreference-based Ontology Building [49.0] 参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:30:40 GMT)
Mimicking Better by Matching the Approximate Action Distribution [49.0] そこで我々は,Imitation Learning from Observationsのための新しい,サンプル効率の高いオンライン政治アルゴリズムMAADを紹介する。
我々は、専門家のパフォーマンスを達成するためには、かなり少ないインタラクションが必要であり、現在最先端の政治手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:33:36 GMT)
Dynamic Planning for LLM-based Graphical User Interface Automation [48.3] LLMベースのGUIエージェントのための動的思考計画(D-PoT)と呼ばれる新しいアプローチを提案する。
D-PoTは環境フィードバックと実行履歴に基づいて計画の動的調整を行う。
実験の結果、提案されたD-PoTは強いGPT-4Vベースラインを+12.7%上回った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:47:13 GMT)
End-to-End Optimization and Learning of Fair Court Schedules [46.8] 合衆国の刑事裁判所は毎年何百万もの事件を処理している。
被告のスケジューリングの好みは、しばしば最優先事項である。
本稿では,エンドツーエンドで訓練された機械学習モデルと効率的なマッチングアルゴリズムを組み合わせた,共同最適化および学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:40:53 GMT)
Dynamic Planning for LLM-based Graphical User Interface Automation [46.6] LLMベースのGUIエージェントのための動的思考計画(D-PoT)と呼ばれる新しいアプローチを提案する。
D-PoTは環境フィードバックと実行履歴に基づいて計画の動的調整を行う。
実験の結果、提案されたD-PoTは強いGPT-4Vベースラインを+12.7%上回った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:47:13 GMT)
Enhancing Low-Resource ASR through Versatile TTS: Bridging the Data Gap [46.6] テキスト音声合成(TTS)モデルを用いた自動音声認識(ASR)の性能向上のための費用対効果と実用的なアプローチを提案する。
前例のないほど多種多様な低リソースデータセットの実験は、一貫性と実質的なパフォーマンス改善を示している。
本研究では,テキストの多様性,話者の多様性,合成データの量などの要因について検討し,本研究で初めてテキストの多様性について検討した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:25:16 GMT)
Language Model Non-myopic Generation for Reasoning and Planning [45.8] 本稿では,モデル予測制御を利用した予測復号化手法を提案する。
我々の実験では、数学、コーディング、エージェントの幅広いタスクにおいて、大幅な改善が示されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:13:38 GMT)
Multimodal hierarchical Variational AutoEncoders with Factor Analysis latent space [45.4] 本研究では,変分オートエンコーダ(VAE)と因子解析潜時空間(FA-VAE)を組み合わせることで,制約に対処する新しい手法を提案する。
FA-VAE法は複数のVAEを用いて連続潜伏空間における各異種データビューのプライベート表現を学習する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:17:21 GMT)
Exploring Diversity-based Active Learning for 3D Object Detection in Autonomous Driving [45.4] 多様性に基づくアクティブラーニング(AL)を,アノテーションの負担を軽減するための潜在的解決策として検討する。
選択したサンプルの空間的・時間的多様性を強制する新しい取得関数を提案する。
提案手法がnuScenesデータセットに与える影響を実証し,既存のAL戦略を著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:34:45 GMT)
Automated Spinal MRI Labelling from Reports Using a Large Language Model [45.3] 大規模言語モデルを用いたラジオロジーレポートからラベルの抽出を自動化するパイプラインを提案する。
本手法は,GPT-4と同等か,あるいは超えている。
抽出したラベルを用いて画像モデルの訓練を行い,MRスキャンによる特定条件の分類を行う。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:54:07 GMT)
Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly [45.0] 本稿では,3次元生成人工知能とロボットアセンブリを組み合わせることで,音声を物体に変換するシステムを提案する。
本稿では,格子型ボクセル部品を個別に組立てることで,生成AI出力を物理的生産に利用することの課題に対処することを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:16:23 GMT)
Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly [45.0] 本稿では,3次元生成人工知能とロボットアセンブリを組み合わせることで,音声を物体に変換するシステムを提案する。
本稿では,格子型ボクセル部品を個別に組立てることで,生成AI出力を物理的生産に利用することの課題に対処することを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:16:23 GMT)
packetLSTM: Dynamic LSTM Framework for Streaming Data with Varying Feature Space [44.6] ストリーミングデータの入力特徴空間の変化を特徴とするオンライン学習問題について検討する。
次元変化ストリームをモデル化するために,パケットLSTMと呼ばれる動的LSTMに基づく新しい手法を提案する。
packetLSTMは5つのデータセットで最先端の結果を達成し、その基本原則はGRUやバニラRNNといった他のRNNタイプにも拡張されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:01:39 GMT)
Lower Bounds for Time-Varying Kernelized Bandits [43.6] ノイズの多い観測によるブラックボックス関数の最適化は、広く応用される基本的な問題である。
特定のアプリケーションに不可欠な非定常シナリオについて検討するが、現時点では十分に理解されていない。
$ell_infty$-norm変異の下では、我々の境界は最先端の上限に近いことが分かる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:45:47 GMT)
Stacking Your Transformers: A Closer Look at Model Growth for Efficient LLM Pre-Training [42.9] この作業では、3つの重要な$textitO$bstacleを識別する: 包括的な評価の欠如、(textitO$2) スケーリングのためのテストされていない生存性、(textitO$3) 経験的ガイドラインの欠如。
G_textstack$と呼ばれる深い積み重ね演算子は、トレーニングにおいて顕著な加速を示し、損失が減少し、全体的な性能が向上することを示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:31:59 GMT)
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models [42.2] We present a new efficient LLVM, Mamba based traversal of rationales (Meteor)
豊富な情報を含む長大な論理を埋め込むために,線形時間複雑性を伴う逐次データ処理が可能なMambaアーキテクチャを用いる。
その後、バックボーン・マルチモーダル言語モデル (MLM) を訓練し、合理性の助けを借りて回答を生成する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:05:30 GMT)
The Impact of Large Language Models in Academia: from Writing to Speaking [42.2] 筆者らは,3万件以上の論文と1,000件以上の機械学習カンファレンスのプレゼンテーションに基づいて,文章や講演の言葉を調査,比較した。
以上の結果から,LLMスタイルの単語である「有意」が抽象語や口頭語ではより頻繁に用いられていることが示唆された。
人社会に対するLLMの暗黙の影響と波及効果に注意を向け、講演への影響が浮上し始めており、将来成長する可能性が高い。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:06:17 GMT)
The Impact of Large Language Models in Academia: from Writing to Speaking [42.2] 筆者らは,3万件以上の論文と1,000件以上の機械学習カンファレンスのプレゼンテーションに基づいて,文章や講演の言葉を調査,比較した。
以上の結果から,LLMスタイルの単語である「有意」が抽象語や口頭語ではより頻繁に用いられていることが示唆された。
人社会に対するLLMの暗黙の影響と波及効果に注意を向け、講演への影響が浮上し始めており、将来成長する可能性が高い。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:06:17 GMT)
Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination [41.7] アーキテクチャに基づく帰納バイアスが幻覚の確率にどのように影響するかを考察する。
発見は、これらの問題を相互によりよく理解することの必要性を強調し、幻覚を扱うためのより普遍的なテクニックをどう設計するかを検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:24:15 GMT)
MotionClone: Training-Free Motion Cloning for Controllable Video Generation [41.6] MotionCloneは、参照ビデオから多目的なモーションコントロールビデオ生成までのモーションクローンを可能にする、トレーニング不要のフレームワークである。
MotionCloneは、大域的なカメラの動きと局所的な物体の動きの両方の習熟度を示し、動きの忠実さ、テキストアライメント、時間的一貫性の点で顕著に優れている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:22:16 GMT)
Hyperboloid GPLVM for Discovering Continuous Hierarchies via Nonparametric Estimation [41.1] 次元性低減(DR)は複雑な高次元データの有用な表現を提供する。
最近のDR法は、階層データの忠実な低次元表現を導出する双曲幾何学に焦点を当てている。
本稿では,非パラメトリック推定による暗黙的な連続性を持つ高次元階層データを埋め込むためのhGP-LVMを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:07:30 GMT)
Context-aware Inductive Knowledge Graph Completion with Latent Type Constraints and Subgraph Reasoning [41.0] 本稿では,新しい文脈認識型インダクティブ知識グラフソリューションであるCATSを紹介する。
まず、型認識推論モジュールは、候補エンティティがクエリ関係で要求される潜在エンティティタイプと一致するかどうかを評価する。
そして、サブグラフ推論モジュールは、関連する推論パスと近隣の事実を選択し、クエリの3倍の相関性を評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:28:05 GMT)
RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance [40.7] 既存の分類器を用いて拡散モデルを操り、画像のパーソナライズのためのトレーニングフリー手法を利用する。
本研究は,近年の補正フローの枠組みに基づいて,バニラ分類器指導の限界を簡単な固定点解法で解決できることを示唆する。
本発明の方法は、市販画像識別装置の異なる正流に実装され、人間の顔、生きた被写体、特定の対象物に対して有利なパーソナライズ結果を提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:21:19 GMT)
Treeffuser: Probabilistic Predictions via Conditional Diffusions with Gradient-Boosted Trees [40.0] Treeffuserは、表データの確率的予測のための使いやすい方法である。
Treeffuserはよく校正された予測分布を学習し、幅広い回帰タスクを処理できる。
Walmartの営業データを用いて、不確実性の下での在庫配分への応用について、その汎用性を実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:29:19 GMT)
Analyzing and Evaluating Correlation Measures in NLG Meta-Evaluation [39.5] そこで本研究では,広範に使用されているNLG評価データセットと32の評価指標から,膨大な実世界のデータを用いて,12の共通相関測度を解析した。
我々は,グローバルグルーピングとピアソン相関を用いた測定が,全体的な性能の最高の指標であることが判明した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:14:21 GMT)
Computing Optimal Regularizers for Online Linear Optimization [38.7] FTRL(Follow-the-Regularized-Leader)アルゴリズムはオンライン線形最適化(OLO)のための一般的な学習アルゴリズムである。
本稿では,最良学習アルゴリズムの一定要素内における後悔を実現するFTRLのインスタンス化が存在することを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:10:50 GMT)
ClimaQA: An Automated Evaluation Framework for Climate Foundation Models [38.1] 気候学者と大学院の教科書から質問応答ペアを生成する自動化フレームワークであるClimaGenを開発した。
気候科学のための大規模で総合的な総合的なQAデータセットであるClimaQA-Silverとともに、専門家による注釈付きベンチマークデータセットであるClimaQA-Goldを提示する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:12:19 GMT)
Self-calibration for Language Model Quantization and Pruning [38.0] 量子化とプルーニングはモデル圧縮の基本的なアプローチである。
トレーニング後の環境では、最先端の量子化とプルーニングの方法はキャリブレーションデータを必要とする。
自己校正を解決策として提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:50:00 GMT)
UCFE: A User-Centric Financial Expertise Benchmark for Large Language Models [36.7] UCFEベンチマークは、大規模な言語モデル(LLM)が複雑な現実世界の財務タスクを処理する能力を評価するために設計されている。
804名を対象に,財務課題に対するフィードバックを収集し,ユーザ調査を行った。
その結果,Pearson相関係数は0.78。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:47:43 GMT)
CartesianMoE: Boosting Knowledge Sharing among Experts via Cartesian Product Routing in Mixture-of-Experts [36.4] Mixture-of-Experts(MoE)モデルは、トレーニングや推論コストを大幅に高めることなく、モデルのサイズを拡大可能にする。
MoEモデルは、専門家間の知識共有に関する課題に直面し、そのパフォーマンスをルーティング精度に何らかの敏感にする。
本稿では,より効果的な知識共有を実現するCartesianMoEを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:37:45 GMT)
MPT: A Large-scale Multi-Phytoplankton Tracking Benchmark [36.4] 本稿では,様々な背景情報と観測時の動作変化を網羅するベンチマークデータセットであるMultiple Phytoplankton Tracking (MPT)を提案する。
このデータセットには27種類の植物プランクトンと動物プランクトンが含まれ、14種類の背景があり、多様な複雑な水中環境をシミュレートしている。
標準特徴抽出器の出力残量を予測するための追加特徴抽出器を導入し、抽出器の異なる層の特徴に基づいて多スケールのフレーム間類似性を計算した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:57:28 GMT)
Can a Machine Distinguish High and Low Amount of Social Creak in Speech? [35.9] 社会的亀裂の研究は、社会言語学や生態学の研究でますます人気が高まっている。
フィンランド語話者90名による連続音声サンプルのクラック量は知覚的に評価された。
この研究で報告された分類体系は、将来のMLに基づく社会亀裂研究のベースラインとみなすことができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:52:51 GMT)
LLM Processes: Numerical Predictive Distributions Conditioned on Natural Language [35.8] 我々のゴールは、数値データを処理し、任意の場所で確率的予測を行うレグレッションモデルを構築することである。
まず、大規模言語モデルから明示的で一貫性のある数値予測分布を抽出する戦略を探求する。
本研究では,テキストを数値予測に組み込む能力を示し,予測性能を改善し,定性的な記述を反映した定量的な構造を与える。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:53:58 GMT)
Merging LoRAs like Playing LEGO: Pushing the Modularity of LoRA to Extremes Through Rank-Wise Clustering [35.5] Low-Rank Adaptation (LoRA) は、様々なドメインに最適化された大規模言語モデル(LLM)の一般的なテクニックとして登場した。
LoRA合成の既存の方法は、主に追加の訓練を必要とするタスク固有の適応に焦点を当てている。
本稿では,LoRAにおける各ランクに対応するパラメータが独立単位として機能する最小意味単位(MSU)の概念を紹介する。
我々は、異なるLoRAから$k$のクラスタにMSUをグループ化することで、ランクワイズパラメータクラスタリングを行うLoRA-LEGOフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:29:22 GMT)
Merging LoRAs like Playing LEGO: Pushing the Modularity of LoRA to Extremes Through Rank-Wise Clustering [35.5] Low-Rank Adaptation (LoRA) は、様々なドメインに最適化された大規模言語モデル(LLM)の一般的なテクニックとして登場した。
LoRA合成の既存の方法は、主に追加の訓練を必要とするタスク固有の適応に焦点を当てている。
本稿では,LoRAにおける各ランクに対応するパラメータが独立単位として機能する最小意味単位(MSU)の概念を紹介する。
我々は、異なるLoRAから$k$のクラスタにMSUをグループ化することで、ランクワイズパラメータクラスタリングを行うLoRA-LEGOフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:29:22 GMT)
Imprompter: Tricking LLM Agents into Improper Tool Use [35.3] 大規模言語モデル(LLM)エージェントは、生成機械学習とコードインタプリタ、Webブラウジング、メール、より一般的には外部リソースなどのツールを融合した、新興コンピューティングパラダイムである。
我々はエージェントベースのシステムのセキュリティ基盤に貢献し、自動的に計算された難読化された敵攻撃の新しいクラスを探索する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:53:48 GMT)
DEAN: Deactivating the Coupled Neurons to Mitigate Fairness-Privacy Conflicts in Large Language Models [34.7] 公平性とプライバシに結合したtextbfDEAN (textbfDEAN) をテキストbfDEアクティベートするためのトレーニングフリー手法を導入し, 公正性とプライバシ意識の相互情報を理論的かつ実証的に低減する。
大規模な実験結果から,DEANはトレードオフ現象を排除し,LLMの公平性とプライバシ意識を同時に向上することが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:08:27 GMT)
Forgettable Federated Linear Learning with Certified Data Unlearning [34.5] フェデレート・アンラーニング(FU)は、FLでのトレーニングを必要とせずに、"忘れられる権利"と、有毒なクライアントの影響を未学習にすることへの要求に対処するために登場した。
ほとんどのFUアルゴリズムは、保持またはターゲットクライアント(未学習のクライアント)、追加の通信オーバーヘッド、潜在的なセキュリティリスクの協力を必要とする。
我々は、クライアントとの通信や追加ストレージを必要とせず、サーバがターゲットクライアントを解放することを可能にする、認証され、効率的で、セキュアな未学習戦略であるFedRemovalを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:33:25 GMT)
Inferentially-Private Private Information [34.5] 情報開示は、公開情報がプライベート情報と相関している場合、プライバシーを侵害する可能性がある。
本稿では,ベイズ敵対者が得る推論パワーを,解放された信号を観測することで,プライバシー漏洩を計測する推論プライバシの概念について考察する。
我々のゴールは、解放された信号の情報を最大限に活用する、秘密の私的情報構造を考案することである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:21:00 GMT)
Boosting Sample Efficiency and Generalization in Multi-agent Reinforcement Learning via Equivariance [34.3] MARL(Multi-Agent Reinforcement Learning)は、サンプルの非効率性と一般化の欠如に苦慮する。
探索型等変グラフニューラルネットワーク(E2GN2)を提案する。
E2GN2は, 試料効率, 最終報酬収束率, 標準GNNよりも2x-5倍向上したことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:26:40 GMT)
Boosting Sample Efficiency and Generalization in Multi-agent Reinforcement Learning via Equivariance [34.3] MARL(Multi-Agent Reinforcement Learning)は、サンプルの非効率性と一般化の欠如に苦慮する。
探索型等変グラフニューラルネットワーク(E2GN2)を提案する。
E2GN2は, 試料効率, 最終報酬収束率, 標準GNNよりも2x-5倍向上したことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:26:40 GMT)
Boosting Sample Efficiency and Generalization in Multi-agent Reinforcement Learning via Equivariance [34.3] MARL(Multi-Agent Reinforcement Learning)は、サンプルの非効率性と一般化の欠如に苦慮する。
探索型等変グラフニューラルネットワーク(E2GN2)を提案する。
E2GN2は, 試料効率, 最終報酬収束率, 標準GNNよりも2x-5倍向上したことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:26:40 GMT)
Reducing Hallucinations in Vision-Language Models via Latent Space Steering [34.2] 幻覚は、アプリケーションに大規模な視覚言語モデル(LVLM)を配置する上での課題である。
本稿では,視覚的特徴の安定性を高めるために,視覚とテクスチュアル・インターベンション(VTI, Visual and Textual Intervention)を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:01:28 GMT)
Optimizing Chain-of-Thought Reasoning: Tackling Arranging Bottleneck via Plan Augmentation [34.0] そこで本研究では,抽象的な計画を通じてモデルを整理し,構成ステップを生成するための計画ベーストレーニングと推論手法を提案する。
その結果,CoTデータを直接微調整した場合と比較して,ボトルネックの緩和に優れた性能が得られた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:38:50 GMT)
On the Diversity of Synthetic Data and its Impact on Training Large Language Models [34.0] 大規模言語モデル(LLM)は、多種多様な高品質な事前学習データの必要性を強調している。
合成データは、データの不足とアクセシビリティの課題に対する、実行可能なソリューションとして現れます。
本研究では, 事前学習および微調整段階における合成データ多様性の下流効果について検討した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:54:23 GMT)
Progressive Compositionality In Text-to-Image Generative Models [33.2] 拡散モデルのコントラスト学習のための新しいカリキュラムであるEvoGenを提案する。
本研究では,大規模言語モデル(LLM)を活用し,現実的で複雑なシナリオを構成する。
また、VQA(Visual-Question Answering)システムと拡散モデルを用いて、コントラストデータセット(ConPair)を自動的にキュレートする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:59:29 GMT)
Coarse-to-fine Dynamic Uplift Modeling for Real-time Video Recommendation [33.1] リアルタイムビデオレコメンデーションのための動的アップリフトモデリング(CDUM)を提案する。
CDUMはCPMとFICの2つのモジュールから構成される。
提案したCDUMは最終的にKuaishouプラットフォームに完全にデプロイされ、毎日数億人のユーザにサービスを提供しています。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:20:37 GMT)
Self-Evolving Multi-Agent Collaboration Networks for Software Development [32.8] 本稿では,MACネットワークのための新たな自己進化パラダイムであるEvoMACを紹介する。
従来のニューラルネットワークトレーニングにインスパイアされたEvoMACは、テキストベースの環境フィードバックを取得する。
本稿では,要件指向ソフトウェア開発ベンチマークrSDE-Benchを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:20:23 GMT)
Security and RAS in the Computing Continuum [32.7] RAS(Reliability, Availability, Serviceability)は、システムのハードウェア欠陥に対する堅牢性を保証する。すなわち、信頼性が高く、可用性が高く、サービスが容易である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:48:00 GMT)
Feature Extraction for Generative Medical Imaging Evaluation: New Evidence Against an Evolving Trend [32.5] Fr'echet Inception Distance (FID)は、合成画像の品質を評価するための指標である。
最近の傾向は、医用画像で訓練された特徴抽出器による医用画像へのFIDの適用である。
本研究では,ImageNetをベースとした抽出器がRadImageNetよりも人間の判断に整合していることを示すことで,この実践に挑戦する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:42:06 GMT)
Polyp-E: Benchmarking the Robustness of Deep Segmentation Models via Polyp Editing [32.3] 日常的な臨床実践では、臨床医は位置と大きさのばらつきの両方でポリープを識別する堅牢性を示す。
自動大腸内視鏡検査において,深部分割モデルが同等の堅牢性を達成できるかどうかは不明である。
本研究は,ポリプ上でのセグメンテーションモデルのロバスト性について,様々な属性と健全なサンプルを用いて評価することに焦点を当てる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:30:37 GMT)
Understanding Linear Probing then Fine-tuning Language Models from NTK Perspective [32.0] 2段階ファインチューニング (FT) 法, 線形探傷 (LP) 法, 次いでファインチューニング (LP-FT) 法は線形探傷法とFT単独法より優れている。
ニューラルネットワークカーネル(NTK)理論に基づく分類タスクにおけるLP-FTのトレーニングダイナミクスを解析する。
本研究は,細調整言語モデルにおけるLP-FTの有効性を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:53:58 GMT)
Convex Markov Games: A Framework for Fairness, Imitation, and Creativity in Multi-Agent Learning [32.0] コンベックス・マルコフゲーム(英語版)のクラスを導入し、占有度よりも一般的なコンベックス・プレイスを可能にする。
無限の時間的地平線とマルコフゲームよりも厳密な一般性にもかかわらず、純粋な戦略 ナッシュ平衡は厳密な凸性の下で存在する。
我々の実験は、最後通しゲームにおける人間の選択を模倣し、繰り返しの囚人のジレンマに対する新しい解決策を明らかにし、反復的な非対称調整ゲームにおいて公正な解決策を見つける。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:55:04 GMT)
Variational Benchmarks for Quantum Many-Body Problems [31.6] 変動エネルギーとその分散から得られる変分精度の指標であるVスコアを導入する。
我々は多体量子系の変分計算を広範囲にキュレートしたデータセットを提供する。
Vスコアは、基底状態問題に対する量子優位性に向けた量子変分法の進行を評価する指標として用いられる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:31:48 GMT)
An Empirical Comparison of Vocabulary Expansion and Initialization Approaches for Language Models [31.2] 言語モデル(LM)は英語の自然言語処理タスクに優れるが、他のほとんどの言語では性能が低下している。
オリジナルのモデルのトークン化子の語彙範囲が限定されているため、新しい言語の表現が不十分になる。
制約付きWord2Vec (CW2V) は言語間埋め込みを必要としない。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:16:21 GMT)
Fine-Tuning Large Language Models to Appropriately Abstain with Semantic Entropy [31.1] 大型言語モデル (LLM) は幻覚として知られており、妥当だが不正確なテキストを生成する。
この現象は、医学や法学などの重要な応用に重大なリスクをもたらし、堅牢な幻覚緩和戦略を必要とする。
本稿では,外部ラベルを必要としないモデルへのイントロスペクションから導出される不確実性尺度であるセマンティックエントロピーを用いた微調整を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:54:03 GMT)
SysBench: Can Large Language Models Follow System Messages? [30.7] 大規模言語モデル(LLM)は、様々なアプリケーションにまたがって実装されており、これらのモデルを特定のシナリオにカスタマイズすることがますます重要になっている。
AI駆動型ソリューションを最適化するシステムメッセージの可能性は認識されているが、LLMがシステムメッセージにどの程度うまく従うかを評価するためのベンチマークは、特に欠落している。
我々は,既存のLLMの3つの制限の観点から,システムメッセージ追従能力を体系的に解析するベンチマークであるSysBenchを紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:07:35 GMT)
AGSENet: A Robust Road Ponding Detection Method for Proactive Traffic Safety [30.3] 道路の沈み込みは、車両を制御不能にさせ、小さなフェンダーの曲がり角から激しい衝突に至る事故を引き起こすことにより、道路の安全に深刻な脅威をもたらす。
既存技術は、複雑な道路テクスチャと反射特性の影響による可変な池色化により、道路の熟成を正確に識別するのに苦慮している。
本稿では,自己注意型グローバル・サリエンシ・エンハンス・ネットワーク(AGSENet)という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:21:36 GMT)
RetriBooru: Leakage-Free Retrieval of Conditions from Reference Images for Subject-Driven Generation [30.1] 拡散に基づく手法は、様々な高品質な画像を生成する能力を実証している。
顔と布の同一性の両方でアニメキャラクターをグループ化するマルチレベル同一性データセットRetriBooruを提案する。
条件付きエンコーダは複数の参照画像から異なる概念を検索する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:52:38 GMT)
TopoDiffusionNet: A Topology-aware Diffusion Model [30.1] 拡散モデルは視覚的に印象的な画像を作成するのに優れるが、しばしば特定の位相を持つ画像を生成するのに苦労する。
TopoDiffusionNet (TDN) は、所望のトポロジーを維持するために拡散モデルを強制する新しいアプローチである。
4つのデータセットに対する実験により、トポロジ的精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:45:46 GMT)
From Attention to Activation: Unravelling the Enigmas of Large Language Models [30.0] Llamaのような人気のある大規模言語モデルは、注意の98%で最初のトークンに最大で出席している。
我々は、適応的なオプティマイザ、例えばアダムを、大きなオプティマイザアクティベーションの主要因として特定する。
第1トークンの注意率を65%から3.3%、隠蔽状態の活性化カルトシスを1657から3.1、第4ビット量化によるパープレキシティペナルティを3565から0.3に減らした。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:51:27 GMT)
50 questions on Active Assisted Living technologies. Global edition [29.8] このブックレットは、AAL技術が高齢者、介護者、障害者の生活の質向上に果たす役割を通してあなたを導くように設計されています。
エンドユーザー、介護者、医療専門家、政策立案者を含む幅広い聴衆を対象としている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:33:48 GMT)
Insights on Disagreement Patterns in Multimodal Safety Perception across Diverse Rater Groups [29.7] AIシステムは人間のレーティングに大きく依存するが、これらのレーティングはしばしば集約される。
これは、社会文化的文脈によって知覚と関連する害が著しく異なる、生成的AIの安全性を評価する場合に特に関係している。
人口統計学的に多彩な630人のレーダプールから,約1000文字対画像(T2I)の高並列安全性評価を用いた大規模研究を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:59:21 GMT)
ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries [29.6] 大型言語モデル(LLM)は、意図した意味から逸脱する幻覚出力の傾向にある。
コード要約における幻覚検出に特化してキュレートされた$sim$10Kのサンプルを用いたファースト・オブ・ザ・キンドデータセットを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:19:40 GMT)
Towards Real Zero-Shot Camouflaged Object Segmentation without Camouflaged Annotations [29.2] 我々は、ロバストなゼロショットCamouflaged Object (COS)フレームワークを導入する。
このフレームワークは、効率的なゼロショット転送のために、サルエントオブジェクトセグメンテーション(SOS)から派生した広い意味的特徴空間を使用する。
ゼロショットCOSでは,CAMOでは72.9%,COD10Kでは71.7%のスコアが得られた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:33:38 GMT)
Magnetic Preference Optimization: Achieving Last-iterate Convergence for Language Models Alignment [29.2] 我々は,オリジナルゲームのNEに最終項目収束を達成できる新しいアプローチである磁気優先最適化(MPO)を導入する。
提案アルゴリズムは理論的に健全かつ実用的であることを保証するため,単純かつ効果的な実装を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:51:34 GMT)
AlphaChimp: Tracking and Behavior Recognition of Chimpanzees [29.1] 我々は,チンパンジーの位置を同時に検出し,動画から行動カテゴリーを推定するエンドツーエンドアプローチを開発した。
AlphaChimpは、最先端の手法と比較して、トラッキング精度が10%高く、動作認識が20%向上している。
我々のアプローチは、コンピュータビジョンと霊長類学のギャップを埋め、技術的能力を高め、霊長類コミュニケーションと社会性の理解を深める。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:08:09 GMT)
E-3DGS: Gaussian Splatting with Exposure and Motion Events [29.0] イベントを動作と露出に分割するイベントベースの新しいアプローチであるE-3DGSを提案する。
露光イベントと3DGSの新たな統合を導入し,明示的なシーン表現を高品質に再現する。
提案手法は,NeRF法よりもコスト効率が高く,イベントベースのNeRFよりも再現性が高い。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:17:20 GMT)
Privacy-Computation trade-offs in Private Repetition and Metaselection [28.1] プライベート反復アルゴリズムは、一定の成功確率を持つ差分プライベートアルゴリズムを入力として、高い確率で成功するアルゴリズムに後押しする。
これらのタスクの既存のアルゴリズムは、プライバシコストの大きなオーバーヘッドを支払うか、計算コストの大きなオーバーヘッドを支払う。
これは、計算オーバーヘッドで異常確率が指数関数的に低下する非プライベートな設定とは対照的である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:33:02 GMT)
Typography Leads Semantic Diversifying: Amplifying Adversarial Transferability across Multimodal Large Language Models [28.0] 現在、MLLMの対向移動可能性の脅威に関する体系的な研究は行われていない。
本稿では, MLLM間での対向転写性能を評価するため, TATM (Typography Augment Transferability Method) と呼ばれるブースティング手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:36:30 GMT)
Do Vision-Language Models Represent Space and How? Evaluating Spatial Frame of Reference Under Ambiguities [27.9] 視覚言語モデル(VLM)の空間的推論能力を評価するための評価プロトコルを提案する。
あいまいさを解消する英語の慣行と幾らかの整合性があるにもかかわらず、本実験はVLMの重大な欠点を明らかにした。
視覚言語モデルと人間の認知的直感の整合化を図りつつ、我々は空間的推論のあいまいさと文化的な多様性により多くの注意を払っている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:39:15 GMT)
EPContrast: Effective Point-level Contrastive Learning for Large-scale Point Cloud Understanding [27.6] 本稿では,textbfEPContrast と呼ばれる大規模クラウド理解のための効果的なポイントレベルのコントラスト学習手法を提案する。
EPContrastは非対称埋め込みに基づく正対と負対を構成し、ChannelContrastはチャネル特徴写像間の対照的な監督を課している。
EPContrastの有効性は、セマンティックセグメンテーション、インスタンスセグメンテーション、オブジェクト検出といったタスクを含む、S3DISとScanNetV2の包括的な検証を通じて裏付けられる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:27:16 GMT)
SG-FSM: A Self-Guiding Zero-Shot Prompting Paradigm for Multi-Hop Question Answering Based on Finite State Machine [27.3] MHQA (Multi-hop Question Answering) は、多くの既存モデルにおいて依然として困難である。
マルチホップ推論能力を高めるために,SG-FSM(Self-Guiding prompting Finite State Machine)を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:47:38 GMT)
Continuous Speech Tokenizer in Text To Speech [27.1] 本稿では,連続音声トークンに基づく簡易かつ効果的な連続音声トークン化手法とテキスト音声合成モデルを提案する。
この結果から,連続音声認識を用いた音声モデルの方が連続性が高く,平均オピニオンスコア(MoS)が高いことがわかった。
この拡張は、周波数領域における低周波および高周波の両方にわたる連続音声認識器の情報保存率の向上に起因する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:02:37 GMT)
IPL: Leveraging Multimodal Large Language Models for Intelligent Product Listing [26.9] IPLは知的製品リスト作成ツールであり,様々な製品属性を用いて記述を生成するのに適したツールである。
IPLは実運用システムで成功しており、ユーザの72%が生成したコンテンツに基づいて製品リストを公開しています。
これらの製品リストは、AIアシストのないものよりも品質スコアが5.6%高いことが示されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:56:04 GMT)
AG-SLAM: Active Gaussian Splatting SLAM [26.6] 本稿では,3次元ガウススプラッティング(3DGS)を利用したオンラインシーン再構築システムAG-SLAMを提案する。
そこで本手法では,環境情報ゲインの最大化と局所化誤差の最小化という2つの目的を両立させる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:51:45 GMT)
Exploring Edge Probability Graph Models Beyond Edge Independency: Concepts, Analyses, and Algorithms [26.6] 好ましくないランダムグラフモデル(RGM)は、高いクラスタリング(高サブグラフ密度)のような現実的な構造を生成するべきである。
RGMの一般的なクラス(例えば、ErdHos-R'enyi や Kronecker など)はエッジ確率を出力する。
エッジ独立性では、理論上RGMは高いサブグラフ密度と高い出力変動を同時に生成することはできない。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:05:57 GMT)
F-MALLOC: Feed-forward Memory Allocation for Continual Learning in Neural Machine Translation [26.5] F-MALLOCは、フィードフォワード層が神経記憶をエミュレートし、重要な翻訳知識をカプセル化しているという最近の洞察にインスパイアされている。
フィードフォワード層を個別のメモリセルに分解し、これらのメモリを異なるタスクに割り当てる。
この新プロトコルの後に行われた実験では、BLEUスコアが高く、ほとんど忘れられないことが証明されたF-MALLOCの優れた性能を示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:16:49 GMT)
MPDS: A Movie Posters Dataset for Image Generation with Diffusion Model [26.4] 映画のポスターは観客を魅了し、テーマを伝え、映画業界で市場競争を牽引するために不可欠である。
画像生成のエキサイティングな進歩にもかかわらず、現在のモデルでは十分なポスター結果が得られないことが多い。
ポスター制作に革命をもたらすために,テキスト・ツー・画像生成モデルに適した映画ポスターデータセット(MPDS)を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:20:03 GMT)
Achievable Entanglement-Assisted Communication Rate using Phase-Modulated Two-Mode Squeezed Vacuum [25.8] 我々は,2モードスクイーズド真空 (TMSV) 変調を位相シフト鍵 (PSK) に限定した形状のボソニックチャネル上の絡み合い支援型古典的通信において,クローズドフォームで達成可能な速度を導出する。
達成可能なレートは、平均信号光子数、平均ノイズ光子数、及び通信チャネルを定義する透過率の点で非漸近的である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:58:39 GMT)
Guaranteeing Conservation Laws with Projection in Physics-Informed Neural Networks [25.8] 本稿では,新しいプロジェクション法を用いて保全法を施行するPINN-Projを提案する。
その結果, PINN-Projは, 運動量保存においてPINNを著しく上回り, 予測誤差を3~4桁下げた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:46:55 GMT)
FDINet: Protecting against DNN Model Extraction via Feature Distortion Index [25.7] FDINETは、ディープニューラルネットワーク(DNN)モデルの特徴分布を活用する新しい防御メカニズムである。
FDI類似性を利用して、分散抽出攻撃から衝突する敵を識別する。
FDINETは、91%を超える精度で衝突する敵を識別する能力を示している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:39:19 GMT)
PHAnToM: Persona-based Prompting Has An Effect on Theory-of-Mind Reasoning in Large Language Models [25.7] 我々は,ロールプレイングの促進が理論・オブ・ミンド(ToM)推論能力にどのように影響するかを実証的に評価した。
本稿では、推論タスクの複雑さの固有のばらつきを超えて、社会的に動機づけられた相違が原因で、パフォーマンスの違いが発生するメカニズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:44:04 GMT)
Online Structured Prediction with Fenchel--Young Losses and Improved Surrogate Regret for Online Multiclass Classification with Logistic Loss [25.5] フルインフォメーションフィードバックを用いたオンライン構造化予測について検討する。
我々はエクスプロイト・ザ・サロゲート・ギャップ・フレームワークをemphFenchelによるオンライン構造化予測に拡張する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:23:43 GMT)
FastAttention: Extend FlashAttention2 to NPUs and Low-resource GPUs [25.0] FlashAttentionシリーズは、大規模言語モデル(LLM)の推論に広く応用されている。
しかし、FlashAttentionシリーズはAmpereやHopperのような高レベルのGPUアーキテクチャしかサポートしていない。
本研究では,NPUと低リソースGPUに対するFlashAttentionの適応の先駆けとなるFastAttentionを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:29:33 GMT)
Literature Meets Data: A Synergistic Approach to Hypothesis Generation [25.0] 本研究では,文献に基づく洞察とデータを組み合わせて仮説生成を行う手法を開発した。
また,人間の意思決定を支援するためのLLM生成仮説の有用性を評価するための最初の人的評価を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:00:00 GMT)
Causal Fairness under Unobserved Confounding: A Neural Sensitivity Framework [24.9] 本研究では, 因果フェアネスの非観測的コンバウンディングに対する感度分析を行った。
公正な予測を学習するための新しいニューラルネットワークフレームワークを提案する。
我々の知識を最大限に活用するために、我々の研究は、観測されていない発見の下で因果フェアネスを研究する最初の研究である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:37:04 GMT)
Diverse Policies Recovering via Pointwise Mutual Information Weighted Imitation Learning [24.6] 本稿では,専門家データから多様な警察を回収する手法を提案する。
特に,軌道の潜在スタイルを推測あるいは割り当てた後,重み付け機構を組み込んだバニラの挙動クローニングを強化する。
提案手法の有効性を実験的に検証し,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:06:36 GMT)
LucidFusion: Generating 3D Gaussians with Arbitrary Unposed Images [24.0] 我々はRelative Coordinate Map(RCM)を活用したフレキシブルなエンドツーエンドフィードフォワードフレームワークであるLucidFusionを紹介した。
LucidFusionは、画像と3Dワールドの徹底的なポーズを結びつける従来の方法とは異なり、RCMを使って幾何学的特徴を異なる視点に整合させる。
LucidFusionは、オリジナルのシングルイメージから3Dパイプラインとシームレスに統合され、詳細な3Dガウシアンを512倍の512ドルの解像度で生成する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:10:45 GMT)
The Scene Language: Representing Scenes with Programs, Words, and Embeddings [23.7] 本稿では,視覚シーンの構造,意味,アイデンティティを簡潔かつ正確に記述した視覚シーン表現であるシーン言語を紹介する。
シーン内のエンティティの階層構造と関係構造を指定するプログラム、各エンティティのセマンティッククラスを要約する自然言語の単語、各エンティティの視覚的アイデンティティをキャプチャする埋め込みである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:40:20 GMT)
RePD: Defending Jailbreak Attack through a Retrieval-based Prompt Decomposition Process [23.7] 我々は,大規模言語モデル(LLM)に対するジェイルブレイク攻撃のリスクを軽減するために設計された,革新的な攻撃フレームワークであるPDを導入する。
RePDはワンショットの学習モデルで動作し、Jailbreakプロンプトテンプレートのデータベースにアクセスして、ユーザプロンプトに埋め込まれた有害な問い合わせを特定して分解する。
我々は,典型的なユーザ要求に応答する際の性能を損なうことなく,LDMのジェイルブレイク攻撃に対するレジリエンスを高めるためのRePDの有効性を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:22:45 GMT)
RePD: Defending Jailbreak Attack through a Retrieval-based Prompt Decomposition Process [23.7] 我々は,大規模言語モデル(LLM)に対するジェイルブレイク攻撃のリスクを軽減するために設計された,革新的な攻撃フレームワークであるPDを導入する。
RePDはワンショットの学習モデルで動作し、Jailbreakプロンプトテンプレートのデータベースにアクセスして、ユーザプロンプトに埋め込まれた有害な問い合わせを特定して分解する。
我々は,典型的なユーザ要求に応答する際の性能を損なうことなく,LDMのジェイルブレイク攻撃に対するレジリエンスを高めるためのRePDの有効性を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:22:45 GMT)
Scaling transformer neural networks for skillful and reliable medium-range weather forecasting [23.2] 本稿では,標準変圧器バックボーンの変更を最小限に抑えつつ,気象予報の最先端性能であるStormerを紹介する。
Stormerの中核はランダムな予測目標であり、様々な時間間隔で天気のダイナミクスを予測するためにモデルを訓練する。
ウェザーベンチ2では、ストーマーは短距離から中距離の予測で競争力を発揮し、現在の手法を7日を超えて上回っている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:36:46 GMT)
SoK: Dataset Copyright Auditing in Machine Learning Systems [23.0] 本稿では,現在のデータセット著作権監査ツールについて検討し,その有効性と限界について検討する。
本稿では,データセットによる著作権監査研究を,侵入的手法と非侵入的手法の2つに分類する。
結果の要約として、現在の文献における詳細な参照テーブル、キーポイントのハイライト、未解決問題について紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:06:38 GMT)
Are Visual-Language Models Effective in Action Recognition? A Comparative Study [23.0] 本稿では,最先端のビジョン基盤モデルに関する大規模研究と知見を提供する。
ゼロショットとフレームワイドのアクション認識タスクへの転送能力を比較する。
最近の微粒な人間中心の行動認識データセットで実験を行う。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:28:21 GMT)
From an attention economy to an ecology of attending. A manifesto [22.9] 我々は、注意経済を非人間的であり、社会政治と生態的幸福への脅威であると非難する。
我々は, 概念化, 設計, 注意を組み込んだ形で利用することに集中する, 参加するエコロジーを提唱する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:51:10 GMT)
Fully Explicit Dynamic Gaussian Splatting [22.9] 3D Gaussian Splattingは、高密度な3D事前表現と明示的な表現を活用することで、静的シーンにおける高速かつ高品質なレンダリング結果を示している。
本稿では,Ex4DGSの収束性を改善するためのプログレッシブトレーニング手法とポイントバックトラッキング手法を提案する。
2080TiのGPU上で62fpsの高速レンダリングを実現するため,様々な場面での総合的な実験を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:02:29 GMT)
AdvWeb: Controllable Black-box Attacks on VLM-powered Web Agents [22.7] AdvWebは、Webエージェント向けに設計された新しいブラックボックス攻撃フレームワークである。
DPOを用いた逆プロンプトモデルの訓練と最適化を行う。
従来のアプローチとは異なり、我々の逆文字列注入はステルスと制御を維持している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:18:26 GMT)
DiP-GO: A Diffusion Pruner via Few-step Gradient Optimization [22.5] 本稿では,よりインテリジェントで微分可能なプルーナーを用いて,効率的な拡散モデルを導出する新しいプルーニング法を提案する。
提案手法はSD-1.5の4.4倍の高速化を実現し,従来の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:18:24 GMT)
ACPBench: Reasoning about Action, Change, and Planning [22.5] ACPBenchは、計画分野における推論タスクを評価するためのベンチマークである。
このコレクションは、形式言語で記述されたプランニングドメインから構築されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:16:17 GMT)
ACPBench: Reasoning about Action, Change, and Planning [22.5] ACPBenchは、計画分野における推論タスクを評価するためのベンチマークである。
このコレクションは、形式言語で記述されたプランニングドメインから構築されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:16:17 GMT)
Research on WebAssembly Runtimes: A Survey [22.0] WebAssembly(略してWasm)は、当初Web用に導入されたが、すぐにWeb以外のさまざまなドメインにリーチを広げた。
本稿ではWebAssemblyランタイムに関する総合的な調査を紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:29:41 GMT)
Thinking Forward: Memory-Efficient Federated Finetuning of Language Models [21.4] 連合学習環境における大規模言語モデル(LLM)の微調整には、リソース制約のあるデバイスに対して過剰なメモリを必要とする。
本稿では,LLMのトレーニング可能な重みをクライアント間で分割するFLアルゴリズムであるSpryを紹介する。
Spryはメモリフットプリントが低く、精度が高く、高速な収束を実現している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:32:59 GMT)
PAPILLON: PrivAcy Preservation from Internet-based and Local Language MOdel ENsembles [21.3] APIベースおよびローカルモデルをチェーンする新しいタスクであるPrivacy-Conscious Delegationを提案する。
我々は最近のユーザ-LLMインタラクションの公開コレクションを利用して、PUPAと呼ばれる自然なベンチマークを構築する。
私たちの最高のパイプラインは、85.5%のユーザクエリに対して高い応答品質を維持しながら、プライバシリークを7.5%に制限しています。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:00:26 GMT)
UrbanWorld: An Urban World Model for 3D City Generation [21.2] UrbanWorldは、フレキシブルな制御条件を備えたカスタマイズされたリアルでインタラクティブな3D都市世界を自動生成できる、ジェネレーティブな都市世界モデルである。
我々は5つの視覚的指標について広範囲に定量的に分析を行い、UrbanWorldがSOTA生成リアリズムを実現していることを示す。
エージェントの認識とナビゲーションを生成環境内で示すことで,これらの環境のインタラクティブな性質を検証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:31:44 GMT)
HyperspectralViTs: Fast and Accurate methane detection on-board satellites [21.2] メタンは気候変動に寄与する2番目に重要な温室効果ガスである。
機械学習モデルによるハイパースペクトルデータのオンボード処理は、幅広いタスクに対して前例のない量の自律性を可能にする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:55 GMT)
ETHIC: Evaluating Large Language Models on Long-Context Tasks with High Information Coverage [21.0] 本稿では,クエリの応答に必要な入力コンテキストの割合を定量化する,情報カバレッジ(IC)と呼ばれる新しい指標を提案する。
ETHICは、LLMがコンテキスト全体を活用する能力を評価するために設計された新しいベンチマークである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:35:42 GMT)
Corrected Soft Actor Critic for Continuous Control [20.9] SAC(Soft Actor-Critic)アルゴリズムは、その安定性と深層強化学習における高サンプリング効率で知られている。
本稿では,変換された分布内の最も可能性の高い動作を直接同定し,選択する,新しいアクションサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:46:28 GMT)
Towards Fair Graph Representation Learning in Social Networks [20.8] 本稿では, 十分性, 自立性, 分離性という3つの原則に基づいて, 公正表現学習の制約を導入する。
EAGNN法がグループフェアネスを効果的に達成できることを理論的に実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:31:19 GMT)
xLSTM-Mixer: Multivariate Time Series Forecasting by Mixing via Scalar Memories [20.8] 時系列データは様々な分野に分散しており、堅牢で正確な予測モデルの開発が必要である。
我々は,時間的シーケンス,共同時間可変情報,堅牢な予測のための複数の視点を効果的に統合するモデルであるxLSTM-Mixerを紹介する。
我々は,最近の最先端手法と比較して,xLSTM-Mixerの長期予測性能が優れていることを示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:59:36 GMT)
Evaluating the Effectiveness of Attack-Agnostic Features for Morphing Attack Detection [20.7] モーフィング攻撃検出(MAD)における画像表現の可能性について検討する。
ガウス混合モデル(GMM)によるボナフィド特性の分布をモデル化し,抽出した特徴量と一級検出値に基づいて単純な2次線形SVMを訓練し,教師付き検出器を開発する。
以上の結果から,攻撃非依存の特徴は,ほとんどのシナリオにおいて従来の教師付き・一級検知器よりも優れた形態的攻撃を効果的に検出できることが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:27:43 GMT)
DCDepth: Progressive Monocular Depth Estimation in Discrete Cosine Domain [20.6] DCDepthは長期の単眼深度推定のための新しいフレームワークである。
離散コサイン領域に変換した後、深さパッチの周波数係数を推定する。
我々は,NYU-Depth-V2,TOFDC,KITTIデータセットに関する総合実験を行い,DCDepthの最先端性能を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:27:32 GMT)
A Text is Worth Several Tokens: Text Embedding from LLMs Secretly Aligns Well with The Key Tokens [20.4] テキストを埋め込みモデルに入力すると、得られたテキストの埋め込みは入力テキストのキートークンと一致します。
この現象は普遍的であり,モデルアーキテクチャ,トレーニング戦略,埋め込み手法の影響を受けないことを示す。
最初のプリンシパルコンポーネントを調整することで、テキストの埋め込みをキートークンと整列することができます。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:32:10 GMT)
Representation Shattering in Transformers: A Synthetic Study with Knowledge Editing [20.3] 知識編集(KE)アルゴリズムは、モデルの内部重みを変更して、不正、時代遅れ、その他の望ましくない事実関連付けに対するターゲット更新を実行する。
近年の研究では、KEの適用がモデルの事実的リコール精度に悪影響を及ぼし、一般的な推論能力を低下させることが示されている。
我々は,KEが対象物以外の実体の表現に不注意に影響を与えていることを示し,対象物に関する未知の知識をモデルが推測できるような関連構造を歪めている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:13:34 GMT)
Adaptive $Q$-Aid for Conditional Supervised Learning in Offline Reinforcement Learning [20.1] Q$-Aided Conditional Supervised Learningは、RCSLの安定性と$Q$-functionの縫合能力を組み合わせる。
QCSは、トラジェクトリリターンに基づいたRCSLの損失関数に$Q$-aidを適応的に統合する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:46:09 GMT)
AttriPrompter: Auto-Prompting with Attribute Semantics for Zero-shot Nuclei Detection via Visual-Language Pre-trained Models [20.1] 本稿では,ゼロショット核検出のためのオブジェクトレベル視覚言語事前学習の可能性について検討する。
本稿では,手動プロンプト設計を避けるために,AttriPrompterという革新的な自動プロンプトパイプラインを提案する。
本手法はラベルのない核検出において顕著な性能を示し,既存の教師なし手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:48:41 GMT)
Is Your HD Map Constructor Reliable under Sensor Corruptions? [20.0] 運転システムは、しばしば正確な環境情報のために高精細(HD)マップに頼っている。
現在のHDマップコンストラクタは理想的な条件下ではよく機能するが、現実の課題に対するレジリエンスはよく理解されていない。
この研究は、HDマップ構築手法の堅牢性を評価するために設計された最初の総合的なベンチマークであるMapBenchを紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:58:01 GMT)
Learning Graph Filters for Structure-Function Coupling based Hub Node Identification [19.7] ハブノードは、特定の機能プロセスに対応する異なる脳ユニットをリンクするネットワーク内の特別なノードである。
本稿では,グラフ信号処理(GSP)に基づくハブ検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:33:16 GMT)
AdaptoML-UX: An Adaptive User-centered GUI-based AutoML Toolkit for Non-AI Experts and HCI Researchers [19.6] AdaptoML-UXは、自動機能エンジニアリング、機械学習、インクリメンタルラーニングを組み込んだアダプティブフレームワークである。
我々のツールキットは、多様な問題領域やデータセットに効率的に適応できることを示します。
インクリメンタルな学習を通じてモデルのパーソナライズをサポートし、個々のユーザの振る舞いに合わせてモデルをカスタマイズする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:52:14 GMT)
Online Tensor Learning: Computational and Statistical Trade-offs, Adaptivity and Optimal Regret [19.5] oRGradはテンソル学習のためのオンラインアルゴリズムで、計算効率が高く、メモリ消費がはるかに少なく、シーケンシャルに到着したデータを処理できる。
我々は、oRGradが太陽F10.7指数の予測においてオフラインよりも著しく優れていることを示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:24:55 GMT)
Collapse or Thrive? Perils and Promises of Synthetic Data in a Self-Generating World [19.3] 生成機械学習モデルがWebスケールデータセット上で事前訓練されている場合、崩壊と崩壊の回避について検討する。
意外なことに、実データと合成データの非自明な相互作用は、テスト損失を減らすための合成データの値は、実データの絶対量に依存する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:49:24 GMT)
Captions Speak Louder than Images (CASLIE): Generalizing Foundation Models for E-commerce from High-quality Multimodal Instruction Data [19.2] 本稿では,eコマースのためのマルチモーダル・インストラクション・データセットMMECInstructを紹介する。
また、eコマースのためのマルチモーダル情報を統合するための、シンプルで軽量で効果的なフレームワークであるCASLIEを開発した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:11:43 GMT)
Exploring Forgetting in Large Language Model Pre-Training [18.9] 大型言語モデル(LLM)における全能モデル構築の難易度障害としての破滅的忘れ込み
我々は,事前学習における忘れの存在と測定を体系的に検討し,パープレキシティ(PPL)などの従来の指標に疑問を呈し,エンティティメモリの保持をよりよく検出するための新しい指標を導入した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:39:47 GMT)
Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning [18.8] 大規模言語モデル(LLM)はゼロショットプロンプトと少数ショットプロンプトを使用して自然言語生成に優れる。
BERTベースのようなエンコーダのみのモデルは、GLUEやSuperGLUEのようなベンチマークでLLMより優れている。
本稿では,LLMのNLU能力を高めるために,SFTとPPOの2つのアプローチについて検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:42:39 GMT)
Graph-Structured Trajectory Extraction from Travelogues [18.6] 本稿では,地理的階層や訪問場所の時間的順序などの情報を保持するグラフ表現を提案する。
ベースラインを用いた実験では、訪問した場所とその順序を正確に予測できることが実証されているが、階層的な関係を予測することは依然として困難である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:21:42 GMT)
BeGin: Extensive Benchmark Scenarios and An Easy-to-use Framework for Graph Continual Learning [18.3] 連続学習(英: Continual Learning, CL)とは、絶え間なく一連のタスクを学習する過程である。
グラフデータ(グラフCL)は、標準的な実験的な設定が欠如しているため、比較的過小評価されている。
我々は,グラフCLのための容易かつ愚かなフレームワークであるBeGinを開発した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:40:48 GMT)
Aligning Individual and Collective Objectives in Multi-Agent Cooperation [18.1] 混合モチベーション協調は、マルチエージェント学習における最も顕著な課題の1つである。
textbftextitAltruistic textbftextitGradient textbftextitAdjustment (textbftextitAgA) という新しい最適化手法を導入する。
我々は,ベンチマーク環境によるAgAアルゴリズムの有効性を評価し,小規模エージェントとの混合モチベーションを検証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:10:01 GMT)
ERABAL: Enhancing Role-Playing Agents through Boundary-Aware Learning [17.6] ヒューマン・コンピュータ・インタラクション(HCI)分野におけるロールプレイング
大幅な進歩にもかかわらず、ロールプレイングエージェント(RPLA)は、会話間のロール一貫性を維持するのに依然として苦労している。
境界認識学習によるロールプレイング能力向上を目的としたフレームワークであるERABALを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:00:19 GMT)
ERABAL: Enhancing Role-Playing Agents through Boundary-Aware Learning [17.6] ヒューマン・コンピュータ・インタラクション(HCI)分野におけるロールプレイング
大幅な進歩にもかかわらず、ロールプレイングエージェント(RPLA)は、会話間のロール一貫性を維持するのに依然として苦労している。
境界認識学習によるロールプレイング能力向上を目的としたフレームワークであるERABALを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:00:19 GMT)
Deep Learning and Machine Learning -- Python Data Structures and Mathematics Fundamental: From Theory to Practice [17.6] 本はPythonに焦点をあて、理論数学と実践的応用のギャップを埋める。
基本的なPythonプログラミング、基本的な数学的演算、行列演算、線形代数、最適化技術などが含まれる。
初心者と高度な学習者の両方のためにデザインされた本は、スケーラブルなAIソリューションの開発における数学的原則の重要な役割を強調している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:55:53 GMT)
Learning Precise, Contact-Rich Manipulation through Uncalibrated Tactile Skins [17.4] 我々は、トランスフォーマーベースのポリシーを使用して、皮膚センサーデータを視覚情報とともに追加トークンとして扱うシンプルなアプローチであるVisuo-Skin(ViSk)フレームワークを提案する。
ViSkは、視力のみと光触覚に基づくポリシーの両方で著しく優れています。
さらに、触覚と視覚のモダリティを組み合わせることで、政策性能と空間的一般化が向上し、タスク全体で平均27.5%の改善が達成される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:49 GMT)
Is the MMI Criterion Necessary for Interpretability? Degenerating Non-causal Features to Plain Noise for Self-Rationalization [17.3] 本稿では, 突発的特徴をプレーンノイズとして扱う新しい基準を開発する。
実験により、我々のMDD基準は、近年の競争力のあるMMIの変種と比較して、有理量品質(人間注釈の有理量との重なりによって測定される)を最大10.4%向上させることが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:30:35 GMT)
Is the MMI Criterion Necessary for Interpretability? Degenerating Non-causal Features to Plain Noise for Self-Rationalization [17.3] 本稿では, 突発的特徴をプレーンノイズとして扱う新しい基準を開発する。
実験により、我々のMDD基準は、近年の競争力のあるMMIの変種と比較して、有理量品質(人間注釈の有理量との重なりによって測定される)を最大10.4%向上させることが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:30:35 GMT)
Is the MMI Criterion Necessary for Interpretability? Degenerating Non-causal Features to Plain Noise for Self-Rationalization [17.3] 本稿では, 突発的特徴をプレーンノイズとして扱う新しい基準を開発する。
実験により、我々のMDD基準は、近年の競争力のあるMMIの変種と比較して、有理量品質(人間注釈の有理量との重なりによって測定される)を最大10.4%向上させることが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:30:35 GMT)
Is the MMI Criterion Necessary for Interpretability? Degenerating Non-causal Features to Plain Noise for Self-Rationalization [17.3] 本稿では, 突発的特徴をプレーンノイズとして扱う新しい基準を開発する。
実験により、我々のMDD基準は、近年の競争力のあるMMIの変種と比較して、有理量品質(人間注釈の有理量との重なりによって測定される)を最大10.4%向上させることが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:30:35 GMT)
Incremental Joint Learning of Depth, Pose and Implicit Scene Representation on Monocular Camera in Large-scale Scenes [17.1] 本研究では,正確な深度,ポーズ推定,大規模シーン再構築を実現するための,段階的な共同学習フレームワークを提案する。
視覚変換器を用いたネットワークをバックボーンとして採用し、スケール情報推定の性能を向上させる。
暗黙的なシーン表現の観点から、大規模シーン全体を複数の局所放射場として構成するインクリメンタルなシーン表現法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:15:20 GMT)
Creativity in AI: Progresses and Challenges [17.0] 我々は,AIシステムの創造的能力について研究し,創造的な問題解決,言語的,芸術的,科学的創造性に注目した。
我々のレビューは、最新のAIモデルは言語的にも芸術的にも創造的なアウトプットを生成できるが、創造的な問題解決を必要とするタスクに苦労していることを示唆している。
プロセス駆動型で創造性のいくつかの側面を考慮した、包括的な創造性評価の必要性を強調します。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:43:39 GMT)
Compress Guidance in Conditional Diffusion Sampling [16.7] この研究は問題を識別し、定量化し、多くのタイミングでガイダンスを減らしたり除いたりすることでこの問題を軽減できることを示した。
画像の質と多様性を著しく向上させながら、必要なガイダンスタイムステップを40%近く削減する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:42:31 GMT)
Improving Causal Reasoning in Large Language Models: A Survey [16.6] 因果推論は知性の重要な側面であり、問題解決、意思決定、世界理解に不可欠である。
大規模言語モデル(LLM)は出力に対して有理性を生成することができるが、因果推論を確実に行う能力は未だ不明である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:18:19 GMT)
Reinforcement Learning for Infinite-Horizon Average-Reward Linear MDPs via Approximation by Discounted-Reward MDPs [16.5] 線形MDPを用いた無限水平平均逆強化学習について検討する。
本稿では,$widetildeO(sqrtT)$の後悔境界が,計算効率のよいアルゴリズムを実現することを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:57:34 GMT)
Can Large Language Models Identify Authorship? [16.4] 大規模言語モデル(LLM)は、推論と問題解決の特別な能力を示している。
1) LLM はゼロショット・エンド・ツー・エンドのオーサシップ検証を効果的に行うことができるか?
2) LLM は,複数の候補作家(例えば,10,20)の著者を正確に帰属させることができるか?
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:07:14 GMT)
On-Device LLMs for SMEs: Challenges and Opportunities [16.3] 本稿では,中小企業(中小企業)の文脈における大規模言語モデル(LLM)をデバイス上で展開するためのインフラ要件に焦点を当てる。
ハードウェアの観点から、GPUやTPUなどの処理ユニットの利用、効率的なメモリとストレージソリューション、効率的なデプロイメント戦略について議論する。
ソフトウェアの観点から、我々は、フレームワークの互換性、オペレーティングシステムの最適化、リソース制約のある環境に適した特別なライブラリの使用について検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:40:18 GMT)
Efficient Antibody Structure Refinement Using Energy-Guided SE(3) Flow Matching [16.2] FlowABはエネルギー誘導型フローマッチングに基づく新規な抗体構造精製法である。
適切な先行モデルと組み合わせて使用する場合、抗体構造予測タスクにおいて、新しい最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:13:55 GMT)
Evaluating AI-Generated Essays with GRE Analytical Writing Assessment [16.0] 本研究は,10個のLLMが生成したエッセイを用いて,研究記録エグゼクティブ(GRE)の分析書面アセスメントについて検討する。
我々はこれらのエッセイを、GREスコアリングパイプラインで用いられるように、人間のレーダとe-rater自動スコアリングエンジンの両方を用いて評価した。
トップパフォーマンスのGPT-4oは平均スコア4.67のスコアを受け取り、「全般的に思慮深く、よく発達した問題の分析と明確な意味の伝達」と「問題の有能な分析を示し、受け入れられる明快さで意味を伝達する」の中間にある。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:30:58 GMT)
Few-shot In-Context Preference Learning Using Large Language Models [15.8] 報酬関数の設計は強化学習の中核的な要素である。
報酬を学ぶことは、しばしばタトゥーラ・ラサを学ぶため、非常に非効率である。
In-Context Preference Learning (ICPL) を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:53:34 GMT)
Order Matters: Exploring Order Sensitivity in Multimodal Large Language Models [15.6] マルチモーダル入力の順序を変えることで、モデルの性能が高度な性能とランダムな推測の間で変動することを発見した。
この現象は、単一のモダリティ(テキストのみまたは画像のみ)と混合モダリティ(画像-テキスト-ペア)の両方の文脈に存在する。
MLLM評価における順序バイアスに対処する新しい指標である位置不変精度(PIA)を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:05:11 GMT)
YOLO-TS: Real-Time Traffic Sign Detection with Enhanced Accuracy Using Optimized Receptive Fields and Anchor-Free Fusion [15.6] 本稿では,新しいリアルタイムかつ効率的な道路標識検出ネットワーク YOLO-TS を提案する。
このネットワークは,マルチスケール特徴写像の受容場を最適化することにより,性能を著しく向上させる。
我々の革新的な機能融合戦略は、アンカーフリー手法の柔軟性を活用し、精度と速度の両面で顕著な向上を実現している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:19:55 GMT)
Denoise-I2W: Mapping Images to Denoising Words for Accurate Zero-Shot Composed Image Retrieval [15.4] Zero-Shot Composed Image Retrieval (ZS-CIR)は、幅広い視覚コンテンツ操作意図を持つ多様なタスクをサポートする。
ZS-CIRの重要な課題は、画像表現を疑似ワードトークンに正確にマッピングすることである。
そこで我々は,画像から擬似語トークンへのデノナイズのための新しいデノナイズ・イメージ・ツー・ワードマッピング手法,Denoise-I2Wを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:01:00 GMT)
Mitral Regurgitation Recognition based on Unsupervised Out-of-Distribution Detection with Residual Diffusion Amplification [15.3] 我々は,Mitral regurgitation (MR) を同定するための教師なしアウト・オブ・ディストリビューション(OOD)検出法を提案する。
提案手法は,特徴抽出器,特徴再構成モデル,残留蓄積増幅アルゴリズムから構成される。
提案手法を893個の非MRビデオと267個のMRビデオを含む大規模超音波データセット上で検証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:23:20 GMT)
Improving Pinterest Search Relevance Using Large Language Models [15.2] 我々はLarge Language Models (LLM) を検索関連モデルに統合する。
提案手法では,生成的視覚言語モデルから抽出したキャプションを含むコンテンツ表現とともに検索クエリを使用する。
LLMをベースとしたモデルからリアルタイム可観測モデルアーキテクチャと特徴を抽出する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:29:33 GMT)
Meta Stackelberg Game: Robust Federated Learning against Adaptive and Mixed Poisoning Attacks [15.2] フェデレーテッド・ラーニング(FL)は、様々なセキュリティ上の脅威を受けやすい。
我々は,ゲーム解決のための効果的なメタラーニング手法を開発し,堅牢で適応的なFLディフェンスを実現する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:08:28 GMT)
Benchmarking Multi-Scene Fire and Smoke Detection [15.1] 既存のパブリックファイア・アンド・スモーク検出(FSD)データセットの現在の不規則性は、FSD技術の進歩においてボトルネックとなっている。
我々は,現実のシーンを忠実に映し出す,標準化された,現実的で,統一された,効率的なFSD研究プラットフォームを確立することを目指している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:19:23 GMT)
Science Out of Its Ivory Tower: Improving Accessibility with Reinforcement Learning [15.0] 言語モデルを微調整して、学術的な抽象語をより理解しやすいバージョンに書き換える強化学習フレームワークを導入する。
我々の最良のモデルは、学者抽象学の可読性レベルを、およそ6つの米国学級レベルに調整する。
我々は,学術研究と一般大衆のギャップを埋めるための一歩として,この研究を構想する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:14:54 GMT)
The Complexity of Optimizing Atomic Congestion [14.8] アトミック・渋滞ゲームは、ネットワーク設計、ルーティング、アルゴリズムゲーム理論において古典的なトピックである。
非常に単純なネットワークでも問題は非常に難解なままである。
我々は、この問題の(さらに難しい)min-max変種に対する分析を拡張して結論付ける。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:52:15 GMT)
Fire and Smoke Detection with Burning Intensity Representation [14.7] 火災の破壊的可能性から, 効果的な火災・煙検知・解析システム(FSD)が重要視されている。
多くの既存のFSD法は、火災や煙の透明性を考慮せずに、直接ジェネリックオブジェクト検出技術を用いている。
この問題に対処するため,新しい火災・煙検知モデル (a-FSDM) が提案されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:41:37 GMT)
SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning [14.7] Tree-Search Enhanced LLM Agents (SELA)は、Monte Carlo Tree Search (MCTS)を利用してAutoMLプロセスを最適化するエージェントベースのシステムである。
SELAはパイプライン構成をツリーとして表現し、エージェントが知的かつ反復的に戦略を洗練させることを可能にする。
20の機械学習データセットにわたる広範囲な評価において、従来のAutoML手法とエージェントベースのAutoML手法のパフォーマンスを比較した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:56:08 GMT)
Scalable Influence and Fact Tracing for Large Language Model Pretraining [14.6] トレーニングデータ属性(TDA)メソッドは、特定のトレーニング例にモデル出力を振り返ることを目的としている。
本稿では,既存の勾配法を改良し,大規模に効果的に機能させる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:39:21 GMT)
Boosting the Generalization Ability for Hyperspectral Image Classification using Spectral-spatial Axial Aggregation Transformer [14.6] ハイパースペクトル画像分類(HSIC)タスクでは、最も一般的に使われているモデル検証パラダイムは、画素単位のランダムサンプリングによってトレーニング・テストデータセットを分割することである。
私たちの実験では、トレーニングとテストデータセットが多くの情報を共有しているため、高い精度が達成できたことが分かりました。
本稿では,データセット分割間の一般化を保ったスペクトル-空間軸アグリゲーション変換器モデルSaaFormerを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:29:07 GMT)
AmazonQAC: A Large-Scale, Naturalistic Query Autocomplete Dataset [14.5] 395万のサンプルからなるAmazon Searchログをソースとした,新たなQACデータセットであるAmazonQACを紹介する。
データセットには、最終検索語につながるユーザタイププレフィックスの実際のシーケンスと、セッションIDとタイムスタンプが含まれている。
修正木,意味検索,Large Language Models (LLMs) を微調整なしで評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:11:34 GMT)
A Bayesian Framework for Clustered Federated Learning [14.4] 連邦学習(FL)の主な課題の1つは、非独立で同一に分散された(非IID)クライアントデータを扱うことである。
本稿では、クライアントをクラスタに関連付けるクラスタ化FLのための統一ベイズフレームワークを提案する。
この作業は、クライアントとクラスタの関連に関する洞察を提供し、新しい方法でクライアントの知識共有を可能にする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:57:37 GMT)
Frequency-dependent squeezing via Einstein-Podolsky-Rosen entanglement based on silicon nitride microring resonators [14.3] 周波数依存性のスクイージング技術は、光学力測定における標準量子限界を克服した。
集積フォトニクスの開発は、Kerr量子周波数コムの出現の道を開いた。
オンチップ窒化ケイ素マイクロリング共振器を用いてEPR絡み合った量子周波数コムを設計するためのプラットフォームが確立されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:03:03 GMT)
FLAG: Financial Long Document Classification via AMR-based GNN [14.3] FLAG: AMRベースのGNNによるファイナンシャル・ロング・ドキュメントの分類。
我々は,文レベルAMRグラフから文書レベルグラフを構築し,財務領域に特殊なLLM単語埋め込みを付与し,GNNを利用したディープラーニング機構を適用し,長い財務文書からラベル付きターゲットデータを予測するためのAMRベースのアプローチの有効性を検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:22:11 GMT)
FLAG: Financial Long Document Classification via AMR-based GNN [14.3] FLAG: AMRベースのGNNによるファイナンシャル・ロング・ドキュメントの分類。
我々は,文レベルAMRグラフから文書レベルグラフを構築し,財務領域に特殊なLLM単語埋め込みを付与し,GNNを利用したディープラーニング機構を適用し,長い財務文書からラベル付きターゲットデータを予測するためのAMRベースのアプローチの有効性を検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:22:11 GMT)
Towards Domain Adaptive Neural Contextual Bandits [14.3] 文脈的包帯に対する第1次一般領域適応法を提案する。
提案手法は,ソースドメインからのフィードバックを収集することで,対象ドメインの帯域幅モデルを学習する。
実験結果から,本手法は実世界のデータセット上での最先端の文脈的帯域幅アルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:14:24 GMT)
Taming Diffusion Models for Image Restoration: A Review [14.3] 拡散モデルは、フォトリアリスティック画像復元のための低レベルコンピュータビジョンに適用されている。
本稿では,拡散モデルにおける鍵となる構成を導入し,拡散モデルを用いた一般的な赤外線課題の解法について検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:31:51 GMT)
A 10.60 $μ$W 150 GOPS Mixed-Bit-Width Sparse CNN Accelerator for Life-Threatening Ventricular Arrhythmia Detection [14.0] 本稿では、心室性不整脈(VA)検出を加速する超低消費電力混合ビット幅スパース畳み込みニューラルネットワーク(CNN)加速器を提案する。
チップはスパース処理素子(SPE)アーキテクチャを用いて量子化された1D CNNにおいて50%の間隔を達成する。
VA分類タスクのためのプロトタイプチップTSMC 40nm CMOS低消費電力(LP)プロセスの測定は、150 GOPSの性能と99.95%の診断精度を達成しながら、10.60 MU$Wの電力を消費することを示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:02:25 GMT)
LiNo: Advancing Recursive Residual Decomposition of Linear and Nonlinear Patterns for Robust Time Series Forecasting [13.9] 近年の深層時系列予測モデルでは, 季節分解とトレンド分解を利用して, 絡み合った成分を分離することが困難である。
線形パターンと非線形パターンの両方を明示的に抽出することにより再帰的残留分解を革新する。
我々は、一般的な学習可能な自己回帰モデルに対する現在の単純な線形パターン抽出器を開発し、すべての重要な非線形パターンを扱える新しいNoブロックを設計する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:33:54 GMT)
EVC-MF: End-to-end Video Captioning Network with Multi-scale Features [13.9] 本稿では,ビデオキャプションのためのエンド・ツー・エンドエンコーダ・デコーダ・ネットワーク(EVC-MF)を提案する。
マルチスケールの視覚的特徴とテキスト的特徴を効果的に利用し、ビデオ記述を生成する。
その結果,EVC-MFは最先端技術に比べて競争性能が高いことがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:16:02 GMT)
Satori: Towards Proactive AR Assistant with Belief-Desire-Intention User Modeling [13.6] 本稿では,ユーザ状態と環境状況の両方をモデル化し,積極的なガイダンスを提供する新しいAR支援システムである佐取を提案する。
本稿では,Breief-Desire-Intention(BDI)モデルと最先端のマルチモーダル言語モデル(LLM)を組み合わせて,文脈的に適切なガイダンスを推測する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:53:46 GMT)
Controlled Low-Rank Adaptation with Subspace Regularization for Continued Training on Large Language Models [13.6] 大規模言語モデル(LLM)は、自然言語処理において顕著な能力を示すが、新しいタスクを学ぶ際に破滅的な忘れに直面している。
本稿では,LoRA 構造上の部分空間正規化手法である Controlled LoRA (CLoRA) を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:27:23 GMT)
DyPNIPP: Predicting Environment Dynamics for RL-based Robust Informative Path Planning [13.5] DyPNIPPは、時間的環境を効果的に横断するために設計された堅牢なRLベースのIPPフレームワークである。
野火環境での実験では、DyPNIPPは既存のRLベースのIPPアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:07:26 GMT)
SpikMamba: When SNN meets Mamba in Event-based Human Action Recognition [13.4] 人間の行動認識(HAR)は、ビデオ分析、監視、自律運転、ロボット工学、医療など、様々な分野で重要な役割を果たしている。
ほとんどのHARアルゴリズムは、詳細な視覚情報をキャプチャするRGB画像から開発されている。
イベントカメラは、全画像を撮影することなく、ピクセルレベルでのシーンの明るさ変化をわずかに捉えることで、有望な解決策を提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:00:43 GMT)
Large Language Model-based Augmentation for Imbalanced Node Classification on Text-Attributed Graphs [13.4] LA-TAG (LLM-based Augmentation on Text-Attributed Graphs) と呼ばれる新しい手法を提案する。
グラフ内の既存のノードテキストに基づいて合成テキストを生成するように、Large Language Modelsに促す。
合成テキスト分散ノードをグラフに統合するために,テキストベースのリンク予測器を導入する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:36:15 GMT)
Subversive Characters and Stereotyping Readers: Characterizing Queer Relationalities with Dialogue-Based Relation Extraction [13.4] 本稿では,対話型対話におけるテレビキャラクタのステレオタイピングの認知過程をモデル化する。
ダイアドが与えられたら、話者が言葉を通してどのような社会的関係を示すかを予測したい。
次に、サブバーシブは、モデルの予測と基底真理ラベルの分布の相違によって特徴づけられる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:29:36 GMT)
GALA: Graph Diffusion-based Alignment with Jigsaw for Source-free Domain Adaptation [13.3] ソースコードのないドメイン適応は、現実世界で多くのアプリケーションを含むため、重要な機械学習トピックである。
最近のグラフニューラルネットワーク(GNN)アプローチは、ドメインシフトとラベルの不足により、パフォーマンスが著しく低下する可能性がある。
本稿では, ソースフリーなグラフドメイン適応に適した Jigsaw (GALA) を用いたグラフ拡散に基づくアライメント法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:32:46 GMT)
Learning Load Balancing with GNN in MPTCP-Enabled Heterogeneous Networks [13.2] 本稿では,MP TCP 対応 HetNet の LB 問題に対処するグラフニューラルネットワーク (GNN) モデルを提案する。
従来のディープニューラルネットワーク(DNN)と比較して、提案したGNNベースのモデルには2つの重要な長所がある。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:49:53 GMT)
Towards Enhancing the Reproducibility of Deep Learning Bugs: An Empirical Study [13.2] 本稿では,ディープラーニングのバグを再現する上で重要な課題について検討する。
重要な問題を改善する可能性のある編集動作と有用な情報を特定します。
165件のバグのうち148件を再現しました。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:50:29 GMT)
CHITNet: A Complementary to Harmonious Information Transfer Network for Infrared and Visible Image Fusion [13.2] 現在の赤外線および可視画像融合法(IVIF)は、相補的特徴を発掘するために非常に長い期間がかかる。
我々は、調和した情報伝達ネットワーク(CHITNet)を提案する。
相補的情報を調和したものに合理的に転送し、2つのモダリティから相補的特徴の共有と相補的特徴を統合する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:42:30 GMT)
FLAG: Financial Long Document Classification via AMR-based GNN [13.1] FLAG: AMRベースのGNNによるファイナンシャル・ロング・ドキュメントの分類。
我々は,文レベルAMRグラフから文書レベルグラフを構築し,財務領域に特殊なLLM単語埋め込みを付与し,GNNを利用したディープラーニング機構を適用し,長い財務文書からラベル付きターゲットデータを予測するためのAMRベースのアプローチの有効性を検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:22:11 GMT)
Unsupervised Time Series Anomaly Prediction with Importance-based Generative Contrastive Learning [13.1] 時系列異常予測は、環境防止やサイバー物理システムの早期維持など、多くの現実のシナリオにおいて重要な役割を果たす。
既存の時系列異常予測手法は、主に手動でラベル付けされた大量のデータで教師付きトレーニングを必要とする。
本稿では,教師なし時系列異常予測の新しい問題について検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:46:36 GMT)
DIRI: Adversarial Patient Reidentification with Large Language Models for Evaluating Clinical Text Anonymization [13.0] 本研究は, 大規模言語モデルを用いて患者を同定し, 臨床記録の再検討を行った。
本手法は, 臨床診断書に適合する患者を同定するために, 大規模言語モデルを用いている。
ClinicalBERTが最も有効であり, マスキングでPIIが同定できたが, 臨床記録の9%は再同定された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:06:31 GMT)
Federated Causal Inference: Multi-Centric ATE Estimation beyond Meta-Analysis [12.9] 我々は、中央に分散したデータから治療効果を推定するフェデレート因果推論(Federated Causal Inference)について検討する。
プラグインG-Formulaから得られた平均治療効果(ATE)推定器の3つのクラスを比較した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:19:17 GMT)
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice [12.9] 大規模言語モデル(LLM)は、テキストベースのシステムからマルチモーダルプラットフォームへと急速に進化してきた。
医療におけるMLLMの現況を考察し,臨床診断支援,医用画像,患者エンゲージメント,研究の分野にまたがる応用を分析した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:30:01 GMT)
Joint Point Cloud Upsampling and Cleaning with Octree-based CNNs [12.7] 本研究は, 簡易かつ効率的な連成アップサンプリング法とクリーニングポイント雲を提案する。
本手法はオフザシェルオクツリーベースの3D U-Net(OUNet)を小さな修正で利用することにより,単一ネットワーク内でのアップサンプリングとクリーニング処理を実現する。
我々のネットワークは、以前の作業のように各ポイントクラウドパッチを処理せずに、各入力ポイントクラウド全体を直接処理します。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:23:05 GMT)
Hierarchical Clustering for Conditional Diffusion in Image Generation [12.6] 本稿では,階層クラスタ上で拡散モデルを用いて,高品質なクラスタ固有世代を得る,深層生成モデルであるTreeDiffusionを紹介する。
提案するパイプラインは,データの階層構造を学習するVAEベースのクラスタリングモデルと,クラスタ毎に現実的な画像を生成する条件拡散モデルである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:35:36 GMT)
Traj-Explainer: An Explainable and Robust Multi-modal Trajectory Prediction Approach [12.6] 複雑な交通環境のナビゲーションはインテリジェントな技術の進歩によって大幅に向上し、自動車の正確な環境認識と軌道予測を可能にした。
既存の研究は、しばしばシナリオエージェントの合同推論を無視し、軌道予測モデルにおける解釈可能性に欠ける。
本研究では, 説明可能な拡散条件に基づく多モード軌道予測トラj-Explainerという, 説明可能性指向の軌道予測モデルが設計されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:17:33 GMT)
Learning to Poison Large Language Models During Instruction Tuning [12.5] この研究は、命令チューニングプロセスを利用するのに適した新しいデータ中毒攻撃を設計することで、LLM(Large Language Models)のさらなるセキュリティリスクを特定する。
本稿では,逆方向誘導学習(GBTL)アルゴリズムを提案する。
In-context Learning(ICL)とContinuous Learning(CL)の2つの防衛戦略を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:01:35 GMT)
ShEPhERD: Diffusing shape, electrostatics, and pharmacophores for bioisosteric drug design [12.4] 医薬品設計において、既知の生物活性ヒットの生体異性体類似は、しばしば、形状、静電気、薬局類似度スコアリング機能を持つ化学ライブラリーを事実上スクリーニングすることによって識別される。
3次元分子構造上の結合分布とその相互作用プロファイルを学習する生成モデルが3次元相互作用を意識した化学設計を促進すると仮定する。
具体的には、ShEPhERDという3次元分子グラフとそれらの形状、静電ポテンシャル表面、および(方向)医薬泳動をガウスノイズから/から連続的に拡散・除去するSE(3)同変拡散モデルの設計を行う。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:05:14 GMT)
PhysORD: A Neuro-Symbolic Approach for Physics-infused Motion Prediction in Off-road Driving [12.4] 自動オフロード運転には運動予測が不可欠である。
従来の物理学に基づくアプローチは、力学系と外乱を正確にモデル化することの難しさに直面する。
オフロード運転時の動作予測のためのデータ駆動型ニューラルモデルに保存則を統合するニューラルシンボリックアプローチであるPhysORDを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:47:12 GMT)
RecPrompt: A Self-tuning Prompting Framework for News Recommendation Using Large Language Models [12.3] 我々は、ニュースレコメンデーションのための最初のセルフチューニングプロンプトフレームワークであるRecPromptを紹介する。
また、説明可能性を評価するための新しいメトリクスであるTopicScoreを紹介します。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:40:25 GMT)
Mesa-Extrapolation: A Weave Position Encoding Method for Enhanced Extrapolation in LLMs [12.3] 位置がない理由を研究する。
(NoPE)は、その有効範囲外では故障し、位置のパワーを検査する。
(PE)。
本稿では,チャンクベースの三角アテンション行列を用いて,最終チャンクの管理にStair-Extrapolationを適用する,新しいウィーブPE手法であるMesaExtrapolationを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:00:00 GMT)
Responsibility in a Multi-Value Strategic Setting [12.1] 責任はマルチエージェントシステムにおいて重要な概念であり、安全で信頼性があり倫理的なAIを作成する。
マルチエージェント・マルチバリュー設定における責任帰属モデルを提案する。
責任の考慮は、エージェントがその価値に沿った戦略を選択するのにどのように役立つかを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:51:13 GMT)
Fine-tuning with Very Large Dropout [12.1] 今日では、機械学習の実践が、トレーニングデータとテストデータが同じ分布に従うという考えと互換性があるというふりは不可能である。
何人かの著者が最近、複数のデータ分散に関わるシナリオが、リッチな表現によってどのように最も役立っているかを示すためにアンサンブル技術を使用している。
この貢献は、このようなリッチな表現を得るために、アンサンブルの代わりに非常に高いドロップアウト率を使用することを調査する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:01:45 GMT)
TempoFormer: A Transformer for Temporally-aware Representations in Change Detection [12.1] 本研究では,動的表現学習のためのタスク依存型トランスフォーマーと時間認識型モデルであるTempoFormerを紹介する。
本手法はコンテキスト間の動的および内部的力学を共同で訓練し,回転位置埋め込みの時間的変化を新たに導入する。
3つの異なるリアルタイム変化検出タスクに対して新しいSOTA性能を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:49:57 GMT)
Bayes without Underfitting: Fully Correlated Deep Learning Posteriors via Alternating Projections [11.9] ベイジアン深層学習は、ベイジアン予測が単純な点推定よりも正確でないように、不適合であることが多い。
我々はベイズ近似を null 空間内に構築することを提案し、したがってベイズ予測が不適切でないことを保証した。
実験的な評価は、アプローチが2800万のパラメータを持つ視覚変換器を含む大きなモデルにスケールすることを示しています。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:15:07 GMT)
Governing equation discovery of a complex system from snapshots [11.8] スナップショットからの微分方程式のスパース同定 (Sparse Identification of Differential Equations from Snapshots (SpIDES)) と呼ばれるデータ駆動型シミュレーションフリーフレームワークを導入する。
SpIDESは、高度な機械学習技術を利用してスナップショットから複雑なシステムの制御方程式を発見する。
2つの潜在的な井戸に閉じ込められた過剰損傷ランゲヴィン系の支配方程式を同定し,SpIDESの有効性とロバスト性を検証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:55:12 GMT)
Correct after Answer: Enhancing Multi-Span Question Answering with Post-Processing Method [11.8] マルチスパン質問回答(Multi-Span Question Answering、MSQA)は、ある質問に答えるために、与えられたコンテキストから1つまたは複数の回答スパンを抽出するモデルを必要とする。
本稿では,不正確な予測処理に後処理戦略を用いるAnswering-Classifying-Correcting(ACC)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:04:32 GMT)
CamI2V: Camera-Controlled Image-to-Video Diffusion Model [11.8] 本稿では,明示的な物理的制約をモデル設計に統合する必要性を強調した。
ノイズ条件の新たな視点から,すべてのクロスフレーム関係をモデル化するためのエピポーラアテンションを提案する。
領域外画像への強い一般化を維持しつつ、RealEstate10K上でのカメラ制御性を25.5%向上させる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:26:45 GMT)
Transfer Learning Bayesian Optimization to Design Competitor DNA Molecules for Use in Diagnostic Assays [11.7] 最適化タスク間で情報を共有することで,実験の総数を削減する方法を示す。
我々は,DNAコンペティターの開発から得られたデータを用いて,実験数の減少を実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:19:36 GMT)
VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models [11.7] 大規模言語モデル(LLM)の極低ビット量子化のためのベクトル後学習量子化(VPTQ)を導入する。
VPTQはLLaMA-2で0.01$-$0.34$、Mistral-7Bで0.38$-$0.68$、LLaMA-3で4.41$-$7.34$を2ビットで還元する。
また、モデル精度を高め、モデルをさらに圧縮する残差量子化および外れ値量子化をサポートするためにVPTQを拡張した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:47:04 GMT)
Towards Reliable Evaluation of Behavior Steering Interventions in LLMs [11.7] 現在の評価から欠落している4つの特性を提唱することで、この問題に対処するための一歩を踏み出したいと考えています。
これらの基準を基礎として評価パイプラインを導入し、与えられた手法がいかに効果的に機能するかを定量的かつ視覚的に分析する。
我々はこのパイプラインを用いて、2つの表現工学手法の評価を行い、それらが真理性や調整可能性などの行動を効果的に操り、いくつかの介入が以前報告したよりも効果が低いことを発見した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:39 GMT)
Integrating Window-Based Correlated Decoding with Constant-Time Logical Gates for Large-Scale Quantum Computation [11.7] フォールトトレラント量子コンピューティングの重要な問題のひとつは、ゲートの実装のオーバーヘッドを減らすことである。
近年提案された相関復号化とアルゴリズム的フォールトトレランスは高速な普遍性ゲートを実現する。
このアプローチは、大規模な回路を扱うための自然な要求であるウィンドウベースの復号法とは相容れない。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:44:41 GMT)
Can Large Language Models Reason? A Characterization via 3-SAT [11.4] 大規模言語モデル(LLM)は高度な推論能力を持つAIモデルとして評価されている。
近年の研究では、LLMは、しばしばショートカットを使用した真の推論を回避し、懐疑論を引き起こすことが示されている。
本稿では,論理的推論と制約満足度タスクの中核に位置するNP完全問題である 3-SAT を中心にした実験プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:44:03 GMT)
Position Engineering: Boosting Large Language Models through Positional Information Manipulation [11.3] 位置工学と呼ばれる新しい手法を導入し,大規模言語モデルをより効率的にガイドする方法を提案する。
LLMに提供されるテキストを変更するのにかなりの労力を要するプロンプトエンジニアリングとは異なり、位置エンジニアリングは単にテキスト自体を変更することなくプロンプト内の位置情報を変更するだけである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:45:46 GMT)
Stochastic Gradient Descent for Nonparametric Regression [11.2] 本稿では,非パラメトリック加法モデルをトレーニングするための反復アルゴリズムを提案する。
結果の不等式は、モデルの誤特定を可能にする託宣を満足していることが示される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:06:05 GMT)
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice [11.2] 大規模言語モデル(LLM)は、テキストベースのシステムからマルチモーダルプラットフォームへと急速に進化してきた。
医療におけるMLLMの現況を考察し,臨床診断支援,医用画像,患者エンゲージメント,研究の分野にまたがる応用を分析した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:30:01 GMT)
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice [11.2] 大規模言語モデル(LLM)は、テキストベースのシステムからマルチモーダルプラットフォームへと急速に進化してきた。
医療におけるMLLMの現況を考察し,臨床診断支援,医用画像,患者エンゲージメント,研究の分野にまたがる応用を分析した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:30:01 GMT)
Image-aware Evaluation of Generated Medical Reports [11.2] 本稿では,X線画像から自動医療報告を生成するための新しい評価基準であるVLScoreを提案する。
測定基準の主な考え方は、対応する画像を考慮して、放射線学報告の類似度を測定することである。
我々は, 放射線学者が2対の報告で誤りを指摘し, 放射線学者の判断と顕著な一致を示したデータセットを用いた評価により, 測定値の利点を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:50:20 GMT)
Designing Network Algorithms via Large Language Models [11.1] 我々は,大規模言語モデル(LLM)の生成能力を活用することで,ネットワークアルゴリズムを自律的に設計する最初のフレームワークであるNADを紹介する。
我々は,NADがブロードバンド,衛星,4G,5Gを含む多様なネットワーク環境において,元のアルゴリズムを一貫して上回る新しいABRアルゴリズムを生成することを実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:09:15 GMT)
$\textit{MMJ-Bench}$: A Comprehensive Study on Jailbreak Attacks and Defenses for Vision Language Models [11.0] 我々は,MLLMのジェイルブレイク攻撃と防御技術を評価するための統合パイプラインであるtextitMMJ-Benchを紹介する。
我々は,SoTA MLLMに対する様々な攻撃方法の有効性を評価し,防御機構が防御効果とモデルの有用性に与える影響を評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:01:16 GMT)
$\textit{MMJ-Bench}$: A Comprehensive Study on Jailbreak Attacks and Defenses for Multimodal Large Language Models [11.0] 我々は,MLLMのジェイルブレイク攻撃と防御技術を評価するための統合パイプラインであるtextitMMJ-Benchを紹介する。
我々は,SoTA MLLMに対する様々な攻撃方法の有効性を評価し,防御機構が防御効果とモデルの有用性に与える影響を評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:01:16 GMT)
Real-time experiment-theory closed-loop interaction for autonomous materials science [11.0] 本稿では,自律機械検索エンジン(AMASE)を用いて,実験と計算予測の連続的連続的相互作用を自律的に行うことを実証する。
AMASEは自己誘導キャンペーンから、Sn-Biバイナリ薄膜システムの共晶相図を正確に決定することができた。
この研究では、人間の介入なしに行われた実験と理論のリアルタイム、自律的、反復的な相互作用の可能性が初めて実証された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:00:18 GMT)
On the Influence of Data Resampling for Deep Learning-Based Log Anomaly Detection: Insights and Recommendations [10.9] 本研究は,多様なデータ再サンプリング手法が既存のADアプローチに与える影響を詳細に分析する。
クラス不均衡のレベルが異なる4つのデータセットにまたがるこれらのADアプローチの性能を評価する。
正常なデータと異常なデータの最適な再サンプリング率を利用する際のデータ再サンプリング手法の有効性を評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:09:56 GMT)
Multi-Modal Transformer and Reinforcement Learning-based Beam Management [10.7] 動的ビーム指数予測のためのMMTとRLを組み合わせた2段階ビーム管理手法を提案する。
本研究では、利用可能なビーム指数を複数のグループに分割し、MMTを利用して様々なデータモダリティを処理し、最適なビーム群を予測する。
提案するフレームワークは6Gデータセットでテストされる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:44:25 GMT)
Bridging the Modality Gap: Dimension Information Alignment and Sparse Spatial Constraint for Image-Text Matching [10.7] 本稿では2つの側面からモダリティギャップを橋渡しするDIASと呼ばれる新しい手法を提案する。
この方法はFlickr30kとMSCOCOベンチマークで4.3%-10.2%のrSum改善を実現している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:37:29 GMT)
Evolution with Opponent-Learning Awareness [10.7] 学習エージェントの多種多様な集団が通常のゲームでどのように進化するかを示す。
進化シミュレーションに適した対向学習意識の高速で並列化可能な実装を導出する。
我々は,Hawk-Dove,Stag-Hunt,Rock-Paper-Scissorsの古典ゲームにおいて,20万エージェントのシミュレーションでアプローチを実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:49:04 GMT)
Context-Aware LLM Translation System Using Conversation Summarization and Dialogue History [10.6] 英語と韓国語を併用した文脈対応LLM翻訳システムを提案する。
提案手法では,2つの最新の対話を生データとして組み込んで,会話の要約を行い,文脈長を効果的に管理する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:45:18 GMT)
LLM4Decompile: Decompiling Binary Code with Large Language Models [10.3] Decompilationはバイナリコードを高レベルのソースコードに変換することを目的としているが、Ghidraのような従来のツールでは読み書きが難しい場合が多い。
LLM4Decompileは,バイナリコードのデコンパイルを訓練した最初の,かつ最大のオープンソースLLMシリーズ(1.3Bから33B)である。
結果、GPT-4oとGhidraをHumanEvalとExeBenchのベンチマークで100%以上上回った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:58:20 GMT)
UnStar: Unlearning with Self-Taught Anti-Sample Reasoning for LLMs [10.3] 大規模言語モデル(LLM)のための自己学習アンチサンプル推論を用いたアンラーニング(UnSTAR)について紹介する。
まず, 反サンプルによる非学習という新しい概念を提案し, 第二に, 誤解を招く合理性を活用して反サンプルを生成することにより, 関連性を逆転させ, 未学習プロセスを加速させる。
結果は、アンチサンプルがLLMに対して効率的でターゲットの未学習戦略を提供し、プライバシ保護機械学習とモデル修正のための新たな道を開くことを実証している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:30:03 GMT)
Math Neurosurgery: Isolating Language Models' Math Reasoning Abilities Using Only Forward Passes [10.3] 本稿では,Large Language Model (LLM)モデルにおいて,数学固有のパラメータを分離する手法であるMathNeuroを紹介した。
MathNeuroは、LLMの一般的な言語能力を破壊することなく、LLMの数学推論能力を削除する。
MathNeuro氏は、将来の研究が数学固有のパラメータに介入する可能性を強調している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:00:58 GMT)
Learning Mathematical Rules with Large Language Models [10.3] 本研究では,分散性や方程式の単純化など,特定の数学的規則を学習する大規模言語モデルの能力について検討する。
本稿では、これらのルールを一般化する能力と、単語問題を文脈で再利用する能力を実証的に分析する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:51:51 GMT)
Optimal Robust Estimation under Local and Global Corruptions: Stronger Adversary and Smaller Error [10.3] アルゴリズムによる頑健な統計は伝統的に、サンプルのごく一部が任意に破損する汚染モデルに焦点を当ててきた。
最近の汚染モデルでは, (i) 古典的ロバスト統計のように, 任意の外れ値のごく一部と (ii) 局所摂動, (ii) サンプルが平均的に有界シフトを行うことのできる2種類の汚染モデルを考える。
理論上最適誤差は, 偶発的局所摂動モデルの下で, 時間内に得られることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:51:23 GMT)
Counter-Hypothetical Particle Filters for Single Object Pose Tracking [10.2] 標準確率と平行して用いられる対数-補数的確率関数を導入する。
Evidential Reasoning の可算性と不確実性の概念にインスパイアされた我々の反補足的可能性関数の追加は、各粒子に疑念のレベルを割り当てる。
剛体物体6次元ポーズトラッキングタスクにおける本手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:51:50 GMT)
OMLog: Online Log Anomaly Detection for Evolving System with Meta-learning [10.2] OMLogはリアルタイムかつ信頼性の高いオンラインログ異常検出モデルである。
本稿では,平均誤差に基づく分布シフト検出手法を提案する。
また、ログシーケンスの繰り返しパターンを効果的に学習できるメタラーニングに基づくオンライン学習機構を設計する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:50:07 GMT)
Analyzing Nobel Prize Literature with Large Language Models [10.1] 本研究では,高度言語モデル(LLM),特にo1モデルの文芸分析における能力について検討する。
ハン・カンの「9章」、2024年の受賞者ジョン・フォッセの「友情」、2023年の受賞者ジョン・フォッセの2つのノーベル文学賞を受賞した短編小説に焦点を当て、AIが複雑な文学的要素と関わり得る程度について調査した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:03:28 GMT)
Influential Language Data Selection via Gradient Trajectory Pursuit [9.9] 勾配軌道探索法 (Gradient Trajectory Pursuit, GTP) は、L0-ノルム正規化目的の下でデータポイントを共同選択することで勾配軌道の追従を行うアルゴリズムである。
実験では,本アルゴリズムをドメイン内およびターゲット領域選択ベンチマークの両方で実演する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:32:40 GMT)
ICT Sector Greenhouse Gas Emissions -- Issues and Trends [9.7] 情報通信技術(ICT)が普及している。
温室効果ガスの排出が気候変動にどのように影響するかという懸念が高まっている。
我々はICTの炭素フットプリントを推定し、タスクを阻害する問題のいくつかを特定するためのフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:51:37 GMT)
Explaining Chest X-ray Pathology Models using Textual Concepts [9.7] 胸部X線(CoCoX)に対する概念的対実的説明法を提案する。
我々は既存の視覚言語モデル(VLM)の結合埋め込み空間を利用して、注釈付きデータセットを必要とせずにブラックボックス分類結果を説明する。
本稿では,本手法が生み出す説明が意味論的に意味を持ち,根底にある病理に忠実であることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:50:00 GMT)
PGCS: Physical Law embedded Generative Cloud Synthesis in Remote Sensing Images [9.7] 物理法則組み込みクラウド合成法 (PGCS) は, 実データを改善するために, 多様な現実的なクラウド画像を生成するために提案されている。
2つの雲補正法がPGCSから開発され、雲補正作業における最先端手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:36:03 GMT)
Are We There Yet? A Brief Survey of Music Emotion Prediction Datasets, Models and Outstanding Challenges [9.6] 利用可能な音楽感情データセットの概要を概観し,評価基準とフィールドでの競争について論じる。
我々は、データセットの品質、アノテーションの一貫性、モデル一般化に関連する問題など、音楽の感情を正確に捉え続ける課題を強調した。
発見を補完するGitHubリポジトリも用意しています。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:18:27 GMT)
EEG-DIF: Early Warning of Epileptic Seizures through Generative Diffusion Model-based Multi-channel EEG Signals Forecasting [9.6] 本研究では、生成拡散モデル(EEG-DIF)に基づく多信号予測アルゴリズムを提案する。
その結果,マルチチャネル脳波信号の将来動向を同時に予測できることが示唆された。
EEG-DIFは、多チャンネル脳波信号を特徴付ける新しいアプローチとてんかん発作に対する革新的な早期警告アルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:18:48 GMT)
Generate and Instantiate What You Prefer: Text-Guided Diffusion for Sequential Recommendation [9.6] 拡散に基づく生成レコメンデーションが有効なツールとして登場した。
我々は,iDreamRecを提案する。
iDreamRecは、既存の拡散ベースの生成レコメンデータよりも優れているだけでなく、意図的な命令の組み入れも容易である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:33:52 GMT)
Stochastic Sparse Sampling: A Framework for Variable-Length Medical Time Series Classification [9.5] 本稿では,医療用VTSCフレームワークであるtextbfS$tochastic $textbfS$parse $textbfS$ampling (SSS)を提案する。
SSSは、固定ウィンドウをわずかにサンプリングし、局所的な予測を計算することで可変長シーケンスを管理し、グローバルな予測を形成するために集約され、校正される。
4つの独立した医療センターから得られた頭蓋内脳波(iEEG)の異種収集であるてんかんiEEG Multicenterデータセットについて検討した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:11:31 GMT)
Stochastic Sparse Sampling: A Framework for Variable-Length Medical Time Series Classification [9.5] 本稿では,医療用VTSCフレームワークであるtextbfS$tochastic $textbfS$parse $textbfS$ampling (SSS)を提案する。
SSSは、固定ウィンドウをわずかにサンプリングし、局所的な予測を計算することで可変長シーケンスを管理し、グローバルな予測を形成するために集約され、校正される。
4つの独立した医療センターから得られた頭蓋内脳波(iEEG)の異種収集であるてんかんiEEG Multicenterデータセットについて検討した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:11:31 GMT)
PtychoFormer: A Transformer-based Model for Ptychographic Phase Retrieval [9.4] データ駆動単発写真位相検索のための階層型トランスフォーマーモデルを提案する。
本モデルでは, 細かな走査回折パターンに対する耐性を示し, 画像の再生速度は, 拡張された胸部反復エンジン (ePIE) の最大3600倍に向上した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:26:05 GMT)
IdenBAT: Disentangled Representation Learning for Identity-Preserved Brain Age Transformation [9.2] 脳年齢変換は、対象年齢群の年齢固有の特徴を正確に反映した、参照脳画像を合成画像に変換することを目的としている。
IdenBATと呼ばれるアイデンティティ保存型脳年齢変換に不整合表現学習を用いた新しいアーキテクチャを提案する。
本手法は,個々の特徴を正確に保持しながら,入力画像を目標年齢に適応的に変換する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:20:15 GMT)
On the use of Large Language Models in Model-Driven Engineering [9.2] この記事では、モデル駆動工学におけるLanguage Large Modelsのシームレスな統合に関する技術的な考察を概説する。
本稿では,モデリング生態系の管理,探索,進化を促進するため,LLM技術の展開を構想する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:10:46 GMT)
Bridging Search and Recommendation in Generative Retrieval: Does One Task Help the Other? [9.2] 検索とレコメンデーションのための生成的検索は、アイテムを検索する上で有望なパラダイムである。
これらの生成システムは、様々な情報検索タスクを単一のモデルにまとめる上で重要な役割を果たす。
本稿では,このような統合されたアプローチが,IRタスクの検索・推薦においてタスク固有モデルより優れているかどうかを考察する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:49:43 GMT)
Typos that Broke the RAG's Back: Genetic Attack on RAG Pipeline by Simulating Documents in the Wild via Low-level Perturbations [9.2] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) の限界に対処するための有望なソリューションである。
本研究では,RAGのロバスト性評価における2つの未解明点について検討する。
本稿では,RAG(textitGARAG)を標的とした新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:07:57 GMT)
Sample Compression Unleashed: New Generalization Bounds for Real Valued Losses [9.2] 実数値未有界損失を抑える新しいサンプル圧縮境界を導出するための一般的な枠組みを提案する。
ランダムな森林や複数種類のニューラルネットワークで評価することで,境界の厳密さと汎用性を実証的に実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:16:43 GMT)
SleepCoT: A Lightweight Personalized Sleep Health Model via Chain-of-Thought Distillation [9.1] 本研究は,CoT蒸留法を用いて睡眠管理を個別化するための新しいアプローチを提案する。
提案手法は,課題解決戦略,長期専門知識,大規模モデルからのパーソナライズされたレコメンデーション機能を,より効率的でコンパクトなモデルに同時に蒸留する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:56:34 GMT)
On the Power of Foundation Models [9.1] カテゴリー理論がこの問題に答える強力な機械を提供することを示す。
最小要求パワー(対称性まで)を持つ基礎モデルは、プリテキストタスクによって定義されたカテゴリの下流タスクを理論的に解くことができる。
最終結果は新しいタイプの一般化定理と見なすことができ、基礎モデルが対象圏から見えない対象を生成できることが示される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:35:27 GMT)
SmartRAG: Jointly Learn RAG-Related Tasks From the Environment Feedback [9.1] RAGシステムは複数のモジュールから構成される。
複数のモジュールを組み込んだRAGのようなシステムは、最適な性能を達成するために共同で最適化されるべきである、と我々は主張する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:23:11 GMT)
Do LLMs estimate uncertainty well in instruction-following? [9.1] 大規模言語モデル(LLM)は、ユーザ指示に従うことができるため、さまざまなドメインにわたるパーソナルAIエージェントとして価値のあるものになり得る。
命令追従の文脈におけるLCMの不確実性推定能力の最初の体系的評価について述べる。
以上の結果から,既存の不確実性手法は,特にモデルが後続の命令で微妙な誤りを犯した場合に困難であることがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:16:14 GMT)
SCMIL: Sparse Context-aware Multiple Instance Learning for Predicting Cancer Survival Probability Distribution in Whole Slide Images [9.0] WSI(Whole Slide Image)に基づく既存のがん生存予測法では、より臨床的に有意義な予測が得られないことが多い。
がん生存確率分布を予測するためのスパースコンテキスト対応マルチインスタンス学習フレームワークを提案する。
以上の結果から,SCMILは生存予測の最先端手法に優れており,より臨床的に有意かつ解釈可能な結果をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:34:43 GMT)
CDQuant: Greedy Coordinate Descent for Accurate LLM Quantization [8.9] 大規模言語モデル(LLM)は、最近、様々な言語タスクで顕著なパフォーマンスを示した。
量子化は、パフォーマンスに最小限の影響を伴って大きなモデルの圧縮を可能にする重要な技術として登場した。
学習後量子化(PTQ)法であるGPTQアルゴリズムは,LLMの圧縮に極めて有効であることが証明されている。
我々は、GPTQの単純でスケーラブルな代替品であるCDQuantを導入し、性能を改善した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:51:01 GMT)
Pyramid Vector Quantization for LLMs [8.8] 大規模言語モデルのためのピラミッドベクトル量子化(PVQ)。
PVQは1次元球面に点を投影することで球面上の固定整数格子を用いており、メモリに明示的なコードブックを必要とせずに効率的な符号化と復号を行うことができる。
比較手法と比較した場合, 性能と重量当たりのビット, アクティベーション当たりのビット間でのパリト最適トレードオフにより, 最先端の量子化性能を実現する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:57:32 GMT)
Enhancing Deep Learning based RMT Data Inversion using Gaussian Random Field [8.7] 本稿では, DLを用いた電波恒星データのインバージョン手法を提案する。
ネットワークの一般化能力は、アウト・オブ・ディストリビューション・データセットでテストされた。
本手法は,インド・ロルキー近郊の廃棄物処分場からの例証フィールドデータを用いて検証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:47:30 GMT)
Guarantees of a Preconditioned Subgradient Algorithm for Overparameterized Asymmetric Low-rank Matrix Recovery [8.7] 本研究では, 行列分解に基づくロバストな低ランクおよび非対称な行列復元手法に着目した。
本稿では,探索行列の条件数に依存しない事前条件付きアルゴリズムの利点を継承する段階的アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:58:44 GMT)
Advancing Training Efficiency of Deep Spiking Neural Networks through Rate-based Backpropagation [8.7] 最近の知見は、ディープスパイキングニューラルネットワーク(SNN)のトレーニングにおいて、レートコーディングが代理段階に基づくバックプロパゲーション・アット・タイム(BPTT)によって取得される情報表現の第一形態であることを明らかにしている。
本稿では、BPTTの複雑さを軽減するために、レートベースの表現を活用するために特別に設計されたトレーニング戦略である、レートベースのバックプロパゲーションを提案する。
提案手法は,SNNの学習におけるメモリと計算要求を減らすために,計算グラフの合理化を図り,平均的ダイナミクスに焦点をあてることで,詳細な時間微分への依存を最小限に抑える。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:18:29 GMT)
A Systematic Mapping Study on Architectural Approaches to Software Performance Analysis [8.6] 本稿では,ソフトウェアアーキテクチャと性能解析を統合した109論文の体系的マッピングについて述べる。
我々は,本研究領域の深い理解を得るために,研究者と実践者のためのガイダンスを提供する5つの研究質問に焦点をあてる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:12:03 GMT)
Token-wise Influential Training Data Retrieval for Large Language Models [8.4] RapidInは、トレーニングデータの影響を推定するために、大規模言語モデルに適応するフレームワークである。
RapidInはキャッシュされた勾配を効率よく横切り、数分で影響を推定し、6,326倍のスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:07:08 GMT)
Localize, Understand, Collaborate: Semantic-Aware Dragging via Intention Reasoner [8.3] 現在の手法では、この問題をポイントドラッグを通じて"ドラッグする方法"を自動学習するものとしてモデル化するのが一般的である。
我々はLucidDragを提案する。これは"ドラッグする方法"から"どうあるべきか"パラダイムに焦点を移すものだ。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:59:51 GMT)
Linear Partial Gromov-Wasserstein Embedding [8.2] Gromov Wasserstein(GW)問題は、機械学習とデータサイエンスコミュニティへの関心が高まっている。
PGW問題に対する線形化埋め込み手法であるGromov Wasserstein埋め込みを提案する。
古典的 OT 問題に対する線形化手法と同様に、LPGW が計量測度空間の有効な計量を定義することを証明している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:54:52 GMT)
Error estimates between SGD with momentum and underdamped Langevin diffusion [8.2] 運動量による勾配降下は勾配降下の一般的な変種であり、近年は下水ランゲヴィン拡散と密接な関係が報告されている。
1-ワッサーシュタインと全変動距離でそれらの間の量的誤差を推定する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:38:23 GMT)
Formal Privacy Guarantees with Invariant Statistics [8.1] 2020年の米国国勢調査製品に触発されたこの論文は、DP出力と非民間統計の共同リリースに対応するために、差分プライバシー(DP)を拡張した。
私たちのフレームワークであるSemi-DPは、与えられた不変量に対応するデータセットに焦点を当てることで、隣接性を再定義します。
我々は、Semi-DPフレームワークを使用して、2020年12月の米国国勢調査のプライバシー分析を行い、効果的なプライバシー保証が広告よりも弱いことを明らかにした。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:50:17 GMT)
GE2E-KWS: Generalized End-to-End Training and Evaluation for Zero-shot Keyword Spotting [8.1] GE2E-KWSは、カスタマイズされたキーワードスポッティングのためのエンドツーエンドのトレーニングおよび評価フレームワークである。
実行時の登録と検証の段階をシミュレートし、収束安定性とトレーニング速度を改善する。
我々の419KBの量子化コンバータモデルは、7.5GBのASRエンコーダを23.6%の相対AUCで打ち負かし、同じ大きさのトリプルト損失モデルを60.7%のAUCで打ち負かした。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:45:59 GMT)
Navigating Noisy Feedback: Enhancing Reinforcement Learning with Error-Prone Language Models [8.0] 本稿では,大規模言語モデルフィードバックによる強化学習の利点と限界について考察する。
本稿では,フィードバックを潜在的形状関数として提案する,シンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:52:08 GMT)
Metamorphic Debugging for Accountable Software [8.0] 法律書を正式な仕様に翻訳することは、一つの課題である。
クエリ(オラクル問題)に対する決定的な'真実'の欠如も問題である。
我々は,これらの課題に,関係仕様に焦点を合わせることで対処できることを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:14:05 GMT)
Hierarchical Multi-agent Reinforcement Learning for Cyber Network Defense [8.0] 本稿では,サイバー防御タスクをネットワーク調査やホストリカバリといった特定のサブタスクに分解する階層的PPOアーキテクチャを提案する。
我々のアプローチは、ドメインの専門知識が強化されたPPOを使用して、各サブタスクのサブ政治を訓練することである。
これらのサブ政治は、複雑なネットワーク防御タスクを解決するためにそれらの選択を調整するマスターディフェンスポリシーによって活用される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:35:05 GMT)
Adaptable and Reliable Text Classification using Large Language Models [8.0] 本稿では,Large Language Models(LLMs)を活用した適応的で信頼性の高いテキスト分類パラダイムを提案する。
我々は、4つの多様なデータセット上で、複数のLLM、機械学習アルゴリズム、ニューラルネットワークベースのアーキテクチャの性能を評価した。
システムの性能は、少数ショットや微調整の戦略によってさらに向上することができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:58:40 GMT)
Do LLMs "know" internally when they follow instructions? [7.9] この次元に沿った表現の修正は、ランダムな変化に比べて、命令追従の成功率を改善することを示す。
また、この次元は、タスクや命令の固有の困難さよりも、プロンプトの表現に密接に関連していることも判明した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:20:00 GMT)
Geometric representations of braid and Yang-Baxter gates [7.8] ヤンバクスターゲートからなるれんがウォール回路は積分可能である。
Yang-Baxterゲートを量子コンピュータに配置するには、量子コンピュータのネイティブゲートに分解する必要がある。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:03:01 GMT)
DNABERT-S: Pioneering Species Differentiation with Species-Aware DNA Embeddings [7.8] DNABERT-S(DNABERT-S)は,異なる種のDNA配列を自然にクラスターし,分離するために,種認識の埋め込みを開発するゲノムモデルである。
23の多様なデータセットの創発的な結果は、特に現実的なラベルスカースシナリオにおいて、DNABERT-Sの有効性を示している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:14:08 GMT)
LLM-Assisted Red Teaming of Diffusion Models through "Failures Are Fated, But Can Be Faded" [7.7] 『失敗は太っているが、消えることがある』は、事前学習された世代モデルにおける失敗の状況を探究し、構築するための枠組みである。
発見された障害モードから離れることで、障害状況の再構築をより望ましいものにする方法を示します。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:46:09 GMT)
Nash Meets Wertheimer: Using Good Continuation in Jigsaw Puzzles [7.7] Jigsawパズルの解法は、高レベルの空間的および意味的推論を必要とするため、コンピュータビジョンにとって難しい課題である。
本稿では,従来の色や形状を意図的に無視するパズル解法を,新たな課題として導入する。
我々は、合成データと実世界のデータの両方に対するアプローチを評価し、最先端のアルゴリズムと比較する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:46:09 GMT)
Graph Sampling for Scalable and Expressive Graph Neural Networks on Homophilic Graphs [7.7] グラフニューラルネットワーク(GNN)は多くのグラフ機械学習タスクに優れるが、大規模ネットワークへのスケーリングでは課題に直面している。
グラフ構造を保存するために特徴ホモフィリーを利用する新しいグラフサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:30:31 GMT)
SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes [7.6] 本稿では,3次元ガウススティング(3DGS)と物理ベースレンダリング(PBR)と変形場を組み合わせた新しいアプローチであるSpectroMotionを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:59:56 GMT)
From Text to Treatment Effects: A Meta-Learning Approach to Handling Text-Based Confounding [7.5] 本稿では,共起変数をテキストで表現する場合のメタラーナーの性能について検討する。
共同創設者の事前学習したテキスト表現を用いた学習者は,CATE推定精度の向上を図っている。
テキスト埋め込みの絡み合った性質のため、これらのモデルは、完全な共同創設者の知識を持つメタ学習者のパフォーマンスと完全には一致しない。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:23:03 GMT)
Security Enhancement of Quantum Communication in Space-Air-Ground Integrated Networks [7.4] 量子テレポーテーションは量子チャネルを通して量子状態の伝送を実現する。
本稿では,古典チャネルと量子チャネルの両方のエラーがあっても,セキュアな情報伝送を実現する実用的なソリューションを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:27:21 GMT)
SMARLA: A Safety Monitoring Approach for Deep Reinforcement Learning Agents [7.3] 本稿では,Deep Reinforcement Learning (DRL)エージェント用に特別に設計されたブラックボックス安全監視手法SMARLAを紹介する。
SMARLAは機械学習を利用して、実行中のエージェントの動作を観察し、安全違反を予測する。
実験の結果、SMARLAは偽陽性率の低い安全違反を予測するのに正確であり、違反が起こる前にエージェントの実行の途中で早期に違反を予測することができることが明らかになった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:29:53 GMT)
Context and Geometry Aware Voxel Transformer for Semantic Scene Completion [7.1] 視覚に基づくセマンティックシーンコンプリート(SSC)は、様々な3次元知覚タスクに広く応用されているため、多くの注目を集めている。
既存のスパース・トゥ・デンス・アプローチでは、様々な入力画像間で共有コンテキストに依存しないクエリを使用するのが一般的である。
セマンティックシーン補完を実現するためにCGFormerというニューラルネットワークを導入する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:28:56 GMT)
Sample-Efficient Geometry Reconstruction from Euclidean Distances using Non-Convex Optimization [7.1] ユークリッド距離情報点対を埋め込む適切な点を見つける問題は、コアタスクとサブマシン学習の問題の両方として生じる。
本稿では,最小限のサンプル数を考えると,この問題を解決することを目的とする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:02:12 GMT)
Beyond Trading Data: The Hidden Influence of Public Awareness and Interest on Cryptocurrency Volatility [7.1] 本研究はビットコイン・ドル取引レートのボラティリティに影響を及ぼす様々な独立した要因について検討する。
我々は,AdaBoost-LSTMアンサンブルモデルであるCoMForEを提案する。
先進的なモデルでは、全体的な暗号通貨価値分布の変動を予測し、投資決定に対する価値を高めることで、さらに一歩進んでいます。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:46:44 GMT)
Imaginary-Temperature Zeros for Quantum Phase Transitions [7.1] 想像温度ゼロ(ITZ)は、虚温度分割関数の根として定義される。
横フィールドイジング鎖におけるITZの解析的性質について述べる。
我々は、ITZとスペクトル形成係数の零点との整合性を照らし出す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:48:12 GMT)
Quantum Complexity for Discrete Logarithms and Related Problems [7.1] 我々は、群理論問題に対する量子計算の一般モデルを構築し、これを量子ジェネリックグループモデルと呼ぶ。
このモデルでは、量子複雑性の低い境界と、DLのほぼ一致するアルゴリズムと関連する問題を示す。
Shorのアルゴリズムのバリエーションは、量子群演算の数を減らすために古典的な計算を利用することができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:11:09 GMT)
EnvBridge: Bridging Diverse Environments with Cross-Environment Knowledge Transfer for Embodied AI [7.0] 大規模言語モデル(LLM)は、ロボットのためのテキスト計画や制御コードを生成することができる。
これらの手法は、異なる環境にまたがる柔軟性と適用性の観点からも、依然として課題に直面している。
本稿では,ロボット操作エージェントの適応性と堅牢性を高めるために,EnvBridgeを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:52:22 GMT)
CKSP: Cross-species Knowledge Sharing and Preserving for Universal Animal Activity Recognition [7.0] 我々は,多種多様な動物種のセンサデータに基づいて,多種間知識共有保存(CKSP)と呼ばれる一対一のフレームワークを提案する。
一般的な特徴を学習するために、共有されたフルランクの畳み込み層を使用し、CKSPフレームワークは種間の相補性を学ぶことができる。
種間のデータ分布の相違から生じる訓練競合を考慮し,種別バッチ正規化(SBN)モジュールを考案した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:44:10 GMT)
Interchangeable Token Embeddings for Extendable Vocabulary and Alpha-Equivalence [7.0] 言語モデルにおける交換可能なトークンを学習するための新しいアプローチを提案する。
本手法は,構文表現における境界変数のリネームが意味論を保存する原理であるα等価性に対処するように設計されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:34:36 GMT)
Dual-Model Defense: Safeguarding Diffusion Models from Membership Inference Attacks through Disjoint Data Splitting [7.0] 拡散モデルは、メンバーシップ推論攻撃(MIA)に弱いことが証明されている。
本稿では,MIAに対して拡散モデルを保護するための新しい2つのアプローチを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:02:29 GMT)
Survival Models: Proper Scoring Rule and Stochastic Optimization with Competing Risks [7.0] SurvivalBoostは、4つの実生活データセットで12の最先端モデルを上回っている。
優れたキャリブレーション、任意の時間軸にわたって予測する機能、既存のメソッドよりも高速な計算時間を提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:33:34 GMT)
Human-LLM Hybrid Text Answer Aggregation for Crowd Annotations [6.9] データアノテーションタスクのLarge Language Models (LLM) は研究者の関心を集めている。
本稿では,集合体としてのLCMsの有効性について検討する。
本稿では,Creator-Aggregator Multi-Stage (CAMS) クラウドソーシングフレームワークを用いたHuman-LLMハイブリッドテキスト応答アグリゲーション手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:22:58 GMT)
Neuroevolution Neural Architecture Search for Evolving RNNs in Stock Return Prediction and Portfolio Trading [6.8] 本稿では,ストックリターン予測のために,進化的eXploration of Augmenting Memory Models (EXAMM)アルゴリズムを用いて,リカレントニューラルネットワーク(RNN)を段階的に進化させる手法を提案する。
RNNは各株ごとに独立して進化し、ポートフォリオトレーディングの決定は予測された株価のリターンに基づいて行われる。
その結果,2022年と2023年はDJI指数とS&P500指数よりも高いリターンを得られることが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:37:18 GMT)
Klein Model for Hyperbolic Neural Networks [6.7] Kleinモデルに基づく双曲型ニューラルネットワークのためのフレームワークを提案する。
Klein HNN が Poincar'e の球モデルと同等に動作することを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:40:05 GMT)
Soft ascent-descent as a stable and flexible alternative to flooding [6.5] 我々は,軟化・ポイントワイド機構であるSoftADを提案する。この機構は,降水量と降水量の影響を制限し,洪水の上昇・昇華効果を維持できる。
我々は,より小さな損失一般化ギャップとモデル規範を享受しながら,浸水と競合する分類精度をSoftADが実現できることを実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:51:15 GMT)
Can Large Language Models Act as Ensembler for Multi-GNNs? [6.4] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するための強力なモデルとして登場した。
GNNは、リッチテキストノード属性の固有の意味理解能力に欠けており、アプリケーションにおけるその有効性を制限している。
本研究は、意味情報と構造情報を統合するための堅牢で優れたソリューションを提供することにより、テキストによるグラフアンサンブル学習を推進している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:48:52 GMT)
Are Large Language Models Ready for Travel Planning? [6.3] 大規模言語モデル (LLMs) は、宿泊や観光において有望であり、人口統計群にまたがるサービス提供能力は未だ不明である。
本稿では,LDMを旅行計画アシスタントとして利用する際の性別と民族的偏見について検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:08:25 GMT)
DROP: Distributional and Regular Optimism and Pessimism for Reinforcement Learning [6.2] 本稿では,制御を推論として導いた楽観主義と悲観主義を用いた理論的基礎モデルを提案する。
モデルでは学習性能は低かったが,DROPは全タスクにおいて高い一般性を示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:14:09 GMT)
A solution of the generalised quantum Stein's lemma [6.2] エンタングルメント試験に関連するスタイン指数が、エンタングルメントの正規化相対エントロピーと等しいことを証明した。
副生成物として、ヌル仮説がおよそ i.i.d であるとき、同じスタイン指数も達成できることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:33:14 GMT)
Interactive Residual Domain Adaptation Networks for Partial Transfer Industrial Fault Diagnosis [6.1] 対話型残留領域適応ネットワーク(IRDAN)と呼ばれる新しいPDAフレームワークを提案する。
IRDANでは、PDAチャレンジに対する新たな視点を提供するために、各ドメインのドメインワイドモデルを導入している。
提案したIRDANの優れた性能を示す実験が行われた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:46:05 GMT)
Quantum-inspired activation functions in the convolutional neural network [6.1] 畳み込みニューラルネットワーク(CNN)に組み込まれた量子回路の機能的表現性について検討する。
我々は,量子活性化関数の特性に基づいて,ハイブリッド量子Chebyshev-polynomial Network (QCPN) を開発した。
この結果から,量子インスパイアされたアクティベーション関数は,高次学習能力を維持しながらモデル深度を低減できることが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:53:31 GMT)
BETA: Automated Black-box Exploration for Timing Attacks in Processors [6.0] 我々は,ファジイングを利用してプロセッサのマルチフェイスタイミング脆弱性を効率的に発見する新しいブラックボックスフレームワークであるBETAを提案する。
我々は、IntelとAMDの4つのプロセッサにおけるBETAの性能と有効性を評価し、それぞれ異なるマイクロアーキテクチャを特徴とする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:48:19 GMT)
LLMScan: Causal Scan for LLM Misbehavior Detection [6.0] 大規模言語モデル(LLM)は、非現実的でバイアスがあり、有害な応答を生成する。
この研究は、因果解析に基づく革新的なモニタリング技術であるLLMScanを導入している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:27:57 GMT)
Mining Glitch Tokens in Large Language Models via Gradient-based Discrete Optimization [6.0] 大規模言語モデル(LLM)のGlitchトークンは予測不可能な振る舞いを引き起こし、モデルの信頼性と安全性を損なう。
既存の検出方法は、しばしばグリッチトークンの以前の分布を推測するために手動による観察に依存している。
GlitchMinerは、LLMにおける効率的なグリッチトークン検出のために設計された、勾配に基づく離散最適化フレームワークである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:22:46 GMT)
Automatic Search of Multiword Place Names on Historical Maps [5.9] 本稿では,過去の地図上で与えられた複数単語の地名を検索する効率的なクエリ手法を提案する。
過去の地図上での単語認識手法を用いて,最小分散木を構築することにより,単一単語のテキストラベルを潜在的多語句にリンクする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:07:11 GMT)
Adsorb-Agent: Autonomous Identification of Stable Adsorption Configurations via Large Language Model Agent [5.8] Adsorb-AgentはLarge Language Model(LLM)エージェントで、システム固有の安定な吸着剤触媒構成を効率的に導出する。
本研究では, NNH-CuPd3 (111) と NNH-Mo3Pd (111) の2つの例を用いて, ハーバーボッシュ法に代わる持続可能な窒素還元反応 (NRR) の性能を実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:19:16 GMT)
FDF: Flexible Decoupled Framework for Time Series Forecasting with Conditional Denoising and Polynomial Modeling [5.8] 時系列予測は多くのWebアプリケーションにおいて不可欠であり、業界全体で重要な意思決定に影響を与える。
我々は拡散モデルが大きな欠点に悩まされていることを論じる。
予測性能を向上させるために,高品質な時系列表現を学習するフレキシブルデカップリングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:58:21 GMT)
Understanding Transfer Learning via Mean-field Analysis [5.7] 我々は、KL規則化された経験的リスク最小化を用いて、$alpha$-ERMとファインチューニングの2つの主要なトランスファー学習シナリオを検討する。
平均場状態における一層ニューラルネットワークを用いたトランスファーラーニングの利点を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:00:44 GMT)
Breaking ReAct Agents: Foot-in-the-Door Attack Will Get You In [5.7] 本稿では,直感的かつ効果的な手法でReActエージェントをどのように活用できるかを検討する。
実験の結果,間接的プロンプトインジェクション攻撃は,後続の悪意ある行為を行うエージェントの可能性を著しく高めることができることがわかった。
この脆弱性を軽減するために,エージェントが実行中の動作の安全性を再評価する簡単なリフレクション機構の実装を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:24:41 GMT)
ARBEx: Attentive Feature Extraction with Reliability Balancing for Robust Facial Expression Learning [5.6] ARBExはVision Transformerによって駆動される新しい注意的特徴抽出フレームワークである。
ラベル分布とマルチヘッド自己保持機構を備えた埋め込み空間において学習可能なアンカーポイントを用いて、弱い予測に対する性能を最適化する。
我々の戦略は、様々な文脈で実施された広範な実験により、現在の最先端の方法論よりも優れています。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:51:22 GMT)
Beyond Yao's Millionaires: Secure Multi-Party Computation of Non-Polynomial Functions [5.6] 我々はシャミール秘密共有に基づく無条件でセキュアな$N$-party比較スキームを提案する。
各パーティは、プライベート番号を保持し、入力を公表することなく、$N$利用可能なプライベート番号の中で最大の番号を確認することを目指している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:22:08 GMT)
Zero-Shot Cross-Lingual NER Using Phonemic Representations for Low-Resource Languages [5.6] 既存のゼロショットの言語間NERアプローチは、ターゲット言語についてかなりの事前知識を必要とする。
我々は,異なる言語の表現間のギャップを埋めるために,国際音声アルファベット(IPA)に基づく音声表現を用いたNERの新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:31:31 GMT)
DENOASR: Debiasing ASRs through Selective Denoising [5.5] 本稿では,2つの性別グループ間の単語誤り率の相違を低減するために,選択的なデノケーション手法であるDeNOASRを提案する。
一般的な2つの音声認識手法である「DEMUCS」と「LE」を組み合わせることで、全体的な性能を損なうことなく、ASRの相違を効果的に軽減できることがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:39:24 GMT)
Community Detection Guarantees Using Embeddings Learned by Node2Vec [5.5] node2vec が生成した埋め込みのクラスタリングは,ブロックモデルにおけるノードに対して,弱い一貫したコミュニティリカバリをもたらすことを示す。
また、これらの埋め込みをノードおよびリンク予測タスクに利用することについても論じる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:35:02 GMT)
Dynamic User Grouping based on Location and Heading in 5G NR Systems [5.5] 本研究では,5G NR の商用展開において,屋外位置と方向に基づく動的ユーザグループ化に Sounding Reference Signals チャネル指紋をどのように利用できるかを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:10:23 GMT)
Testing Bell inequalities and probing quantum entanglement at CEPC [5.5] 円電子陽電子衝突型加速器(CEPC)におけるベル型不平等の量子絡み合いとテスト違反に関する研究
本研究は, ヒッグス粒子が250ドルGeVで崩壊した際のZ$ボソン対生成の高速シミュレーションに基づく。
量子絡み合いの存在は、2$sigma$信頼レベル以上で探索される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:48:06 GMT)
CLAP: Concave Linear APproximation for Quadratic Graph Matching [5.4] 線形モデルを導入し、グラフマッチングのための新しい近似行列を設計する。
次に、元のQAPを構造制約の凹凸となる線形モデルに変換する。
このモデルはシンクホーン最適輸送アルゴリズムを用いて解くことができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:28:18 GMT)
Efficient Reinforcement Learning for Global Decision Making in the Presence of Local Agents at Scale [5.4] 本研究では,地域エージェントの存在下でのグローバル意思決定のための強化学習について検討する。
この環境では、状態空間のサイズのため、スケーラビリティは長年にわたる課題でした。
この学習されたポリシーは、サブサンプリングエージェントの数が増加するにつれて、$tildeO (1/sqrtk+epsilon_k,m)$の順序で最適ポリシーに収束することを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:16:39 GMT)
Slicing Through Bias: Explaining Performance Gaps in Medical Image Analysis using Slice Discovery Methods [5.3] 我々はSlice Discovery Methodsを用いて、観測された性能格差の原因に関する仮説とデータの解釈可能な未実行部分集合を同定する。
本研究は, 仮説定式化におけるSDMの有効性を実証し, 既往の男女間パフォーマンスの相違について解説する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:32:34 GMT)
Test-time Adversarial Defense with Opposite Adversarial Path and High Attack Time Cost [5.2] 対向対向経路(OAP)に沿った拡散に基づく新しい対向防御法について検討する。
我々は、敵攻撃に抵抗するために、事前訓練されたモデルに差し込むことができる浄化器を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:32:17 GMT)
All Entities are Not Created Equal: Examining the Long Tail for Fine-Grained Entity Typing [5.2] 事前訓練された言語モデル(PLM)は大量のデータに基づいて訓練されており、言語能力とともに世界の知識を捉えるのに役立つ。
PLMは共起パターンから学習するので、事前学習データに含まれる頻度に応じて、エンティティに関するより多くの知識や少ない知識を含む可能性が高い。
PLMに依存したエンティティタイピングアプローチが、分布の長い部分でエンティティと競合することを示します。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:47:46 GMT)
Enhancing Answer Attribution for Faithful Text Generation with Large Language Models [5.1] 本稿では,より独立的で文脈的なクレームを生成できる新しい手法を提案する。
新しい手法が評価され,回答帰属成分の性能が向上することが示されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:37:46 GMT)
AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents [5.0] 私たちは、20の現実世界のAndroidアプリに116のプログラムタスクに対して報酬信号を提供する、完全に機能するAndroid環境であるAndroidWorldを紹介します。
静的テストセットを提供する既存のインタラクティブ環境とは異なり、AndroidWorldはパラメータ化され自然言語で表現されるタスクを動的に構築する。
私たちの最高のエージェントは、AndroidWorldのタスクの30.6%を完了できます。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:49:38 GMT)
COMMUNITY-CROSS-INSTRUCT: Unsupervised Instruction Generation for Aligning Large Language Models to Online Communities [5.0] コミュニティ・クロス・インストラクション(Community-Cross-Instruct)は,大規模言語モデルをオンラインコミュニティに整合させ,信念を導き出す,教師なしのフレームワークである。
Reddit上で政治・食生活のコミュニティを正確に表現する手法の有用性を実証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:38:07 GMT)
Real-time Sub-milliwatt Epilepsy Detection Implemented on a Spiking Neural Network Edge Inference Processor [5.0] 本研究では、スパイキングニューラルネットワーク(SNN)を用いてててんかん発作の経時的および経時的周期を検出することを目的とする。
提案手法は,体間期間の分類において,93.3%,92.9%の高い試験精度を有する。
我々の研究は、発作検出のための新しいソリューションを提供しており、将来的にはポータブルデバイスやウェアラブルデバイスで広く使用されることが期待されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:55:02 GMT)
Bounding the Sample Fluctuation for Pure States Certification with Local Random Measurement [4.9] ランダム化計測技術の最近の進歩は、この分野に新たな洞察をもたらした。
ランダム局所ハール測定により純粋量子状態の証明を行うスキームの基本特性について検討する。
その結果,演算子の複雑性と量子アルゴリズムの効率との本質的な相互作用が明らかになり,長距離絡み付き純粋状態の局所的認証の障害となった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:26:44 GMT)
Beyond Retrieval: Generating Narratives in Conversational Recommender Systems [4.9] 本稿では,会話レコメンデーションにおける自然言語生成タスクのための新しいデータセット(REGEN)を提案する。
我々は、よく知られた生成指標を用いてベンチマークを作成し、レーダLEMを用いて新しいデータセットの自動評価を行う。
そして、私たちの知る限りでは、レコメンデーター信号を理解し、リッチな物語を生成することにおけるLLMの能力を分析する最初の試みである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:53:41 GMT)
Hierarchical Upper Confidence Bounds for Constrained Online Learning [4.9] 階層的制約付き帯域幅(HCB)フレームワークを導入し、コンテキスト的帯域幅問題を拡張して階層的決定構造とマルチレベル制約を組み込む。
我々の理論的解析はHC-UCBのサブ線形後悔境界を確立し、すべての階層レベルでの制約満足度を高い確率で保証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:41:14 GMT)
TELII: Temporal Event Level Inverted Indexing for Cohort Discovery on a Large Covid-19 EHR Dataset [4.9] TELIIは、大規模なEHRデータセット上でのコホート発見のために設計された時間事象レベルの逆インデックス法である。
我々は,887万人の患者から得られたデータを含む,OPTUM未同定のCOVID-19 EHRデータセットにTELIIを実装した。
その結果、TELIIの時間的クエリ速度は、既存の非時間的逆索引の2000倍高速であることがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:06:33 GMT)
DEAR: Disentangled Environment and Agent Representations for Reinforcement Learning without Reconstruction [4.8] 強化学習(RL)アルゴリズムは視覚的な観察からロボット制御タスクを学習することができるが、大量のデータを必要とすることが多い。
本稿では,その形状に関するエージェントの知識が,視覚的RL法のサンプル効率を向上させる方法について検討する。
本稿では,エージェントのセグメンテーションマスクを監督対象とする,分散環境とエージェント表現という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:52:19 GMT)
LLM Gesticulator: Leveraging Large Language Models for Scalable and Controllable Co-Speech Gesture Synthesis [4.8] 本稿では,LLM Gesticulatorについて述べる。
本フレームワークは、自然な動きと編集性を示しながら、入力音声とリズミカルに整合したフルボディアニメーションを合成する。
また,本手法は,テキストプロンプトによって生成したジェスチャーの内容やスタイルを制御できる強い制御性を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:08:02 GMT)
Mechanical dynamics around higher-order exceptional point in magno-optomechanics [4.7] 実験的に実現可能なマグノオプトメカニクスにおける多種多様な例外点 (EP) を, 物理的に直接接触することで, 最適サブシステムとマグノメカニクスサブシステムからなる実験により検討した。
散逸性とパリティ時間対称な例外点が観察できる。
提案手法は多種多様なEPを設計し,非エルミート相転移をマグノ・オプトメカニクスにおける異常な動的挙動で定量化するための有望な方法である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:25:08 GMT)
Bauplan: zero-copy, scale-up FaaS for data pipelines [4.7] bauplanは、データ実践者向けに設計された、新しいFプログラミングモデルとサーバレスランタイムである。
bauplanを使用することで、ユーザはランタイム環境とともに、機能的なDAG(Directed Acyclic Graphs)を宣言的に定義することができる。
汎用性を減らし、データ認識を優先することで、バプランのパフォーマンスが向上し、データワークロードの開発者エクスペリエンスも向上していることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:49:01 GMT)
Towards tolerant testing stabilizer states [4.7] 我々は、パウリスの構造化部分集合に対する安定化子被覆上の状態と境界のガウワーズ-$3$ノルムに対する逆定理を証明した。
我々の証明は、量子状態に対するガウワーズノルムの新しい定義、状態のガウワーズ-$3$のノルムに対する逆定理、およびパウリスの構造的部分集合に対する安定化子被覆に関する新しい境界を含む。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:20:25 GMT)
Entangling two exciton modes using exciton optomechanics [4.6] 本稿では,エクシトン-オプトメカニクス系において2つのエクシトンモードを絡み合わせることを提案する。
このプロトコルは現在の技術の範囲内にあり、励起エンタングルメントを作成するための有望なアプローチになる可能性がある。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:03:57 GMT)
Optimizing LLMs with Direct Preferences: A Data Efficiency Perspective [4.5] 本研究では,異なる種類の嗜好データがモデル性能に与える影響について検討する。
収集に費用がかかる大量の好みデータへの依存を減らすことを目的としている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:11:41 GMT)
Optimizing Mixture-of-Experts Inference Time Combining Model Deployment and Communication Scheduling [4.5] Mixture-of-Experts (MoE)モデルは、関連する専門家を選択的に活性化する。
MoEモデルは、オール・ツー・オール操作による高い通信オーバーヘッドによって妨げられる。
本稿では,モデル配置とオール・ツー・オール通信スケジューリングの両方を最適化したAuroraを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:19:29 GMT)
High-Order Associative Learning Based on Memristive Circuits for Efficient Learning [4.5] 本稿では,生物学的に現実的な構造を持つ高次経験的連想学習フレームワークを提案する。
Pavlovの古典的条件付け実験では,学習効率が230%向上した。
大規模な画像認識タスクでは,20*20mmristor配列を用いて画像を表現する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:39:19 GMT)
Development of CODO: A Comprehensive Tool for COVID-19 Data Representation, Analysis, and Visualization [4.5] 標準化された語彙と関係を使ってドメイン内の知識を形式化するオントロジーは、AIにおいて重要な役割を果たす。
新型コロナウイルス(COVID-19)の多様性は、この情報を人間と機械の両方で理解する上での課題となる。
新型コロナウイルス(COVID-19)は、パンデミックの特定の側面に対処するように設計されているが、すべての重要な側面を包括的にカバーしていない。
統合オントロジ疫学モデルであるCODOは、エチオロジー、語彙、伝達、病原性、診断、予防、ゲノム学、治療安全など、新型コロナウイルス情報の重要な側面を包含して開発された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:59:54 GMT)
Foundation Models for Rapid Autonomy Validation [4.4] 重要な課題は、自動運転車が遭遇するあらゆる種類の運転シナリオでテストする必要があることだ。
本研究では,運転シナリオを再構築するための行動基礎モデル,特にマスク付きオートエンコーダ(MAE)の使用を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:32:43 GMT)
MoRE: Multi-Modal Contrastive Pre-training with Transformers on X-Rays, ECGs, and Diagnostic Report [4.3] 我々は,X線,心電図(ECG),放射線学・心臓医学報告を相乗的に組み合わせた,新しいマルチモーダルコントラスト事前学習フレームワークを提案する。
我々はLoRA-Peftを用いて、LLMにおけるトレーニング可能なパラメータを著しく削減し、視覚変換器(ViT)に最近の線形アテンション降下戦略を取り入れ、よりスムーズなアテンションを実現する。
我々の知る限り、我々はX線、心電図、放射線学・医学レポートをこの手法と組み合わせた統合モデルを提案している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:22:14 GMT)
Benchmarking Large Language Models for Image Classification of Marine Mammals [4.3] 我々は65種類の海洋哺乳類の1,423種類の画像を用いたベンチマークデータセットを構築した。
各動物は、種レベルから中レベル、グループレベルまで、それぞれ異なるレベルに分類される。
我々はこれらの海洋哺乳動物を分類するためのいくつかのアプローチを評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:49:49 GMT)
PLaMo-100B: A Ground-Up Language Model Designed for Japanese Proficiency [4.2] PLaMo-100Bは,日本語の習熟度を考慮した大規模言語モデルである。
モデルは2兆トークンを使用してゼロからトレーニングされ、トレーニングの安定性を確保するためにQK正規化などのアーキテクチャが使用されている。
ベンチマーク評価の結果,PLaMo-100Bは特に日本語のタスクにおいて良好に機能することが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:06:38 GMT)
Encoder Embedding for General Graph and Node Classification [4.2] エンコーダの埋め込み行列が大数の法則と中心極限定理を満たすことを証明している。
ある条件下では、クラスごとの正規性を達成し、識別分析による最適な分類を可能にする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:48:15 GMT)
Credal Bayesian Deep Learning [4.2] 分散シフトに対する不確実性と堅牢性は、機械学習と人工知能において重要な目標である。
クレダルベイズ深層学習(CBDL)について紹介する。
CBDLは1つのBNNよりも、事前およびおそらく不特定性、および分布シフトに対してより堅牢である。
CBDLは単一のBNNとBNNのアンサンブルよりも,異なるタイプの(予測的な)不確実性を定量化し,分離する方がよいことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:36:34 GMT)
PLaMo-100B: A Ground-Up Language Model Designed for Japanese Proficiency [4.1] PLaMo-100Bは,日本語の習熟度を考慮した大規模言語モデルである。
モデルは2兆トークンを使用してゼロからトレーニングされた。
ベンチマーク評価の結果,PLaMo-100Bは特に日本語のタスクにおいて良好に機能することが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:06:38 GMT)
Data-driven rainfall prediction at a regional scale: a case study with Ghana [4.0] 最先端の数値天気予報(NWP)モデルは、アフリカの熱帯地域で熟練した降雨予測を作成するのに苦労している。
2つのU-Net畳み込みニューラルネットワーク(CNN)モデルを開発し、12時間と30時間リード時の24時間降雨を予測する。
また,従来のNWPモデルとデータ駆動モデルを組み合わせることにより,予測精度が向上することがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:23:30 GMT)
Time-Resolved MNIST Dataset for Single-Photon Recognition [4.0] 時間分解単一光子イメージングは、単一光子の到着をタイムスタンプする能力に特徴付けられる、有望な画像モダリティである。
SPADは、非同期読み出しによるパッシブイメージングに適した、現代的な時間分解ピクセルを実装するための主要な技術である。
本稿では、光子到着の特異性と、時間分解SPADアレイの取得過程に関わる全てのノイズ源を考慮に入れたSPADイメージングの現実的なシミュレーションプロセスについて述べる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:58:37 GMT)
Are uGLAD? Time will tell! [4.0] 条件独立グラフ(CI)を用いた多変量時系列セグメンテーションのための新しい手法を提案する。
CIグラフは、ノード間の部分的相関を表す確率的グラフィカルモデルである。
身体活動モニタリングデータを用いて実験結果を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:45:44 GMT)
Efficient Feature Extraction Using Light-Weight CNN Attention-Based Deep Learning Architectures for Ultrasound Fetal Plane Classification [4.0] 本稿では,最大のベンチマークデータセットを分類するために,軽量な人工知能アーキテクチャを提案する。
アプローチは、ImageNet1kで事前トレーニングされた軽量のEfficientNet機能抽出バックボーンから微調整される。
本手法は,特徴を洗練するためのアテンション機構と3層パーセプトロンを組み込んだもので,トップ1の96.25%,トップ2の99.80%,F1スコアの0.9576で優れた性能を実現している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:02:38 GMT)
FairLoRA: Unpacking Bias Mitigation in Vision Models with Fairness-Driven Low-Rank Adaptation [4.0] 低ランク適応のための新しいフェアネス特化正規化器であるFairLoRAについて紹介する。
以上の結果から,偏見を緩和するためのより高いランクの必要性は普遍的ではなく,事前学習モデルやデータセット,タスクといった要因に依存していることがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:50:36 GMT)
Geometric Graph Neural Network Modeling of Human Interactions in Crowded Environments [3.8] 本稿では,歩行者のインタラクションをモデル化し,将来の軌跡を予測するために,心理学的な研究からドメイン知識を統合した幾何学的グラフニューラルネットワークアーキテクチャを提案する。
複数のデータセットにまたがる評価では、平均値と最終変位誤差のメトリクスを減らして予測精度が向上した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:33:10 GMT)
EP-SAM: Weakly Supervised Histopathology Segmentation via Enhanced Prompt with Segment Anything [3.8] がんなどの疾患の病理診断は、従来、医師や病理医による形態学的特徴の評価に頼っていた。
近年,診断支援ツールとしてコンピュータ支援診断(CAD)システムの進歩が注目されている。
本稿では,クラスアクティベーションマップとSAMに基づく擬似ラベルを組み合わせ,弱教師付きセマンティックセマンティックセグメンテーション(WSSS)モデルを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:47:06 GMT)
Dynamic Test-Time Augmentation via Differentiable Functions [3.7] DynTTAは、認識モデルを再訓練することなく、認識に優しい画像を生成する画像強調手法である。
DynTTAは、微分可能なデータ拡張技術に基づいて、多くの画像からブレンド画像を生成し、分布シフト時の認識精度を向上させる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:56:00 GMT)
Can Large Language Models Invent Algorithms to Improve Themselves? [3.6] 大規模言語モデル(LLM)は、顕著なパフォーマンス向上を示し、業界で急速に採用されている。
LLMが自律的にモデル改善アルゴリズムを生成・学習することを可能にするセルフ開発フレームワークを提案する。
数学的推論タスクでは、Self-Developingはシードモデルを超えたモデルを生成するだけでなく、人間が設計したアルゴリズムで作成したモデルよりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:14:46 GMT)
Stable dynamic helix state in the nonintegrable XXZ Heisenberg model [3.6] XXZハイゼンベルクモデルにおけるスピンヘリックス状態の安定性に対する外部場の影響について検討する。
系がカオスのままである限り、ヘリックス状態の不足範囲は顕著な変化を示さない。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:13:20 GMT)
Permutation Picture of Graph Combinatorial Optimization Problems [3.6] 本稿では、置換に基づく表現を用いて、幅広いグラフ最適化問題を定式化するフレームワークを提案する。
これらの問題には、旅行セールスマンの問題、最大独立セット、最大カット、その他様々な問題が含まれる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:36:04 GMT)
Dynamic Intelligence Assessment: Benchmarking LLMs on the Road to AGI with a Focus on Model Confidence [3.6] 我々は、AIモデルをテストするための新しい方法論であるDynamic Intelligence Assessment (DIA)を紹介する。
我々のフレームワークは、複数の試みにまたがってモデルの信頼性と信頼性を評価するために、4つの新しいメトリクスを導入します。
付随するDIA-Benchデータセットは、テキスト、PDF、コンパイルされたバイナリ、視覚パズルなど、さまざまなフォーマットで表示される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:46:35 GMT)
AskBeacon -- Performing genomic data exchange and analytics with natural language [3.5] AskBeaconは、GA4GH Beaconプロトコルを介して、安全に共有されたコホートに大規模言語モデルを適用することを可能にする。
単にBeaconを"探す"ことで、実行可能な洞察を得、分析し、出版対応にすることができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:11:54 GMT)
Temporal Graph Rewiring with Expander Graphs [3.5] 本稿では、時間グラフ上でのグラフリウィリングの最初のアプローチである時間グラフリウィリング(TGR)を提案する。
TGRは、連続時間動的グラフにおいて、時間的に離れたノード間のメッセージパッシングハイウェイを構築する。
tgbl-reviewでは、TGRはベースTGNモデルよりも50.5%改善され、ベースTNCNモデルより22.2%改善されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:43:01 GMT)
Methods of improving LLM training stability [3.4] 学習速度が高いと、全ての線形層出力のL2ノルムはトレーニングステップごとに成長し、モデルが分岐する。
この2つの手法により,QK層正規化のみに基づくアプローチと比較して,学習率を1.5倍に向上できることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:27:03 GMT)
3D Adaptive Structural Convolution Network for Domain-Invariant Point Cloud Recognition [3.4] 3D Adaptive Structure Convolution Network (3D-ASCN)は、3Dポイントクラウド認識のための最先端フレームワークである。
3次元畳み込みカーネル、構造木構造、および効果的な幾何学的特徴抽出のための適応近傍サンプリングを組み合わせる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:41:08 GMT)
Visual Question Answering in Ophthalmology: A Progressive and Practical Perspective [3.4] VQA(Visual Question Answering)は、コンピュータビジョンと自然言語処理を組み合わせて、医療画像に関するクエリを理解し、応答する。
本稿では, 眼科領域におけるVQAの進歩と今後の展望について, 理論的, 実用的両面から考察する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:28:41 GMT)
Universal approximation property of Banach space-valued random feature models including random neural networks [3.3] ランダムな特徴学習におけるバナッハ空間値の拡張を提案する。
特徴マップをランダムに初期化することにより、線形読み出しのみをトレーニングする必要がある。
我々は、与えられたバナッハ空間の要素を学ぶための近似率と明示的なアルゴリズムを導出する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:29:47 GMT)
General Frameworks for Conditional Two-Sample Testing [3.3] 本研究では, 条件付き2サンプル検定の問題点について検討し, 条件付き2サンプル検定の問題点について考察した。
この問題は、ドメイン適応やアルゴリズムフェアネスなど、様々な応用で一般的に発生する。
本稿では,その妥当性と能力について,分布の特定のクラスを暗黙的に,あるいは明示的にターゲットとする2つの一般的なフレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:27:32 GMT)
MEC-IP: Efficient Discovery of Markov Equivalent Classes via Integer Programming [3.3] 本稿では,ベイジアンネットワーク(BN)のマルコフ等価クラス(MEC)を発見するための新しいプログラミング(IP)手法を提案する。
我々の数値計算結果から,計算時間の大幅な削減はアルゴリズムによって達成されるだけでなく,多様なデータセットで因果発見精度の向上が見られた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:56:33 GMT)
Benchmarking Smoothness and Reducing High-Frequency Oscillations in Continuous Control Policies [3.2] 強化学習(RL)ポリシは、特に現実世界のハードウェアにデプロイする場合、高周波の発振を引き起こす。
深部RLにおける高周波発振を緩和することを目的とした文献からの手法を同定し,分類し,比較する。
最適性能のハイブリッドは,他の手法よりも優れており,ベースラインよりも26.8%スムーズ性の向上が期待できる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:21:30 GMT)
Characterizing the set of quantum correlations in prepare-and-measure quantum chain-shaped networks [3.2] 本稿では,P&M(Preate-and-measure)量子連鎖型ネットワークで生成された量子相関を表す確率分布$P$で満たされたテストの階層について紹介する。
具体的には、P&M量子連鎖型ネットワークにおける量子相関を特徴付けるために、有限個の線形および正の半定制約を組み込むことにより、元のNPA階層を適応する。
適応型NPA階層を用いて、逐次量子ランダムアクセスコード(QRAC)やランダムネス認証など、いくつかの量子情報タスクに対処する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:42:43 GMT)
Characterizing the set of quantum correlations in prepare-and-measure quantum chain-shaped networks [3.2] 本稿では,P&M(Preate-and-measure)量子連鎖型ネットワークで生成された量子相関を表す確率分布$P$で満たされたテストの階層について紹介する。
具体的には、P&M量子連鎖型ネットワークにおける量子相関を特徴付けるために、有限個の線形および正の半定制約を組み込むことにより、元のNPA階層を適応する。
適応型NPA階層を用いて、逐次量子ランダムアクセスコード(QRAC)やランダムネス認証など、いくつかの量子情報タスクに対処する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:42:43 GMT)
Characterizing the set of quantum correlations in prepare-and-measure quantum chain-shaped networks [3.2] 本稿では,P&M(Preate-and-measure)量子連鎖型ネットワークで生成された量子相関を表す確率分布$P$で満たされたテストの階層について紹介する。
具体的には、P&M量子連鎖型ネットワークにおける量子相関を特徴付けるために、有限個の線形および正の半定制約を組み込むことにより、元のNPA階層を適応する。
適応型NPA階層を用いて、逐次量子ランダムアクセスコード(QRAC)やランダムネス認証など、いくつかの量子情報タスクに対処する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:42:43 GMT)
Network Inversion for Training-Like Data Reconstruction [3.0] 本稿では,学習モデルからトレーニングライクなデータを再構成するネットワーク・インバージョン・ベース・アプローチであるトレーニングライクなデータ再構成(TLDR)を提案する。
提案手法を検証するため,複数の標準視覚分類データセットを用いて経験的評価を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:42:08 GMT)
Episodic Future Thinking Mechanism for Multi-agent Reinforcement Learning [3.0] 本稿では、強化学習(RL)エージェントのためのエピソード・フューチャー・シンキング(EFT)機構を導入する。
まず、異種ポリシーのアンサンブルで多様な文字をキャプチャするマルチ文字ポリシーを開発する。
キャラクタが推論されると、エージェントはターゲットエージェントの今後のアクションを予測し、将来のシナリオをシミュレートする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:12:42 GMT)
DepsRAG: Towards Agentic Reasoning and Planning for Software Dependency Management [3.0] DepsRAGは、ソフトウェア依存関係の推論を支援するために設計されたマルチエージェントフレームワークである。
開発者は会話インターフェースを通じてDepsRAGと対話し、依存関係に関するクエリをポーズすることができる。
GPT-4-Turbo と Llama-3 を多段階推論タスクで用いた DepsRAG の評価を行い,Critic-Agent 機構の統合による3倍の精度向上を観察した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:41:22 GMT)
Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective [3.0] 隣接する t-SNE, UMAP, LargeVis などの埋め込み手法は、一般的な可視化手法のファミリーである。
近年の研究では、これらの手法がしばしば視覚的な人工物を生み出し、誤った科学的結論につながる可能性が示唆されている。
本稿では,古典的な統計的概念に基づいて埋め込みマップを学習する,新しい概念的・計算的枠組み LOO-map を紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:40:43 GMT)
Randomly pivoted Cholesky: Practical approximation of a kernel matrix with few entry evaluations [2.8] ランダムにピボットされた部分チョレスキーアルゴリズム(RPCholesky)は、N x N の正準有限(psd)行列の階数-k近似を計算する。
RPCholeskyの単純さ、有効性、堅牢性は、科学計算や機械学習アプリケーションでの使用を強く支持している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:38:04 GMT)
plingo: A system for probabilistic reasoning in clingo based on lpmln [2.8] 様々な確率論的推論モードを備えたASPシステムクリンゴの拡張であるplingoを提案する。
Plingoは、Markov Logicの重みスキームに基づくASPの確率的拡張であるLPMLNを中心にしている。
我々は、他の確率システムと比較することにより、プリンゴの性能を実証的に評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:06:40 GMT)
Just In Time Transformers [2.7] JITtransは,エネルギー消費予測精度を大幅に向上させる,トランスフォーマー深層学習モデルである。
本研究は, エネルギー管理を革新し, 持続可能な電力システムを構築するための先進的な予測技術の可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:33:00 GMT)
Evaluating Feature Attribution Methods for Electrocardiogram [2.7] 我々は,ECGの特性に基づいて,特徴帰属手法の3つの評価指標を特定し,カスタマイズする。
広範に利用されている特徴属性法を11種類評価し,解析した。
特徴帰属手法のいくつかはECGの説明に適しており、Grad-CAMは2番目に良い方法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:57:55 GMT)
NucleiMix: Realistic Data Augmentation for Nuclei Instance Segmentation [2.7] NucleiMixは、データセット内のレアタイプの核の数を増やすことで、核種の分布のバランスをとるように設計されている。
第1段階では、希少型核の周囲に類似した候補位置を特定し、希少型核を候補部位に挿入する。
第2フェーズでは、事前訓練された拡散モデルを用いて、レアタイプの核を新しい環境にシームレスに統合するプログレッシブな塗布戦略を採用している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:03:36 GMT)
Efficient Frequency Selective Surface Analysis via End-to-End Model-Based Learning [2.7] 本稿では、高次元周波数選択面(FSS)の効率的な電磁解析のための革新的なエンドツーエンドモデルに基づくディープラーニング手法を提案する。
大規模なデータセットを必要とする従来のデータ駆動手法とは異なり、このアプローチは等価回路モデルからの物理的な洞察とディープラーニング技術を組み合わせて、モデルの複雑さを著しく低減し、予測精度を高める。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:27:20 GMT)
Developing a Thailand solar irradiance map using Himawari-8 satellite imageries and deep learning models [2.6] 本稿では,タイの太陽放射マップを30分毎に表示するオンラインプラットフォームを提案する。
これらの方法は、MERRA-2データベースから、クリアスキー光、クラウドインデックス、再解析されたGHI、および温度データを取得する。
最も優れたモデルはLightGBMで、MAEは78.58W/sqm、RMSEは118.97W/sqmである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:09:10 GMT)
Insights from the Usage of the Ansible Lightspeed Code Completion Service [2.6] LightspeedはIT自動化に特化した言語です。
Lightspeedサービスのためのコードと分析フレームワークは、他の人が利用できるようにされている。
N-Day ユーザ保持図を表示する最初のコード補完ツール。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:30:19 GMT)
Contrasting Attitudes Towards Current and Future AI Applications for Computerised Interpretation of ECG: A Clinical Stakeholder Interview Study [2.6] 英国で臨床医に一連のインタビューを行った。
我々の研究は、AI、特に未来の「人間のような」コンピューティングの可能性を探る。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:31:23 GMT)
Levels of AI Agents: from Rules to Large Language Models [2.5] AIエージェントは、環境を知覚し、決定し、行動を取るための人工エンティティとして定義される。
ルールベースのAIを使用するL1、ルールベースのAIをIL/RLベースのAIに置き換えるL2、推論と意思決定を追加するL3、IL/RLベースのAIの代わりにLLMベースのAIを適用するL3、メモリとリフレクションを設定するL1。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:05:17 GMT)
Global Optimization of Gaussian Process Acquisition Functions Using a Piecewise-Linear Kernel Approximation [2.3] 本稿では,プロセスカーネルに対する一括近似と,取得関数に対するMIQP表現を紹介する。
我々は,合成関数,制約付きベンチマーク,ハイパーチューニングタスクに関するフレームワークを実証的に実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:56:52 GMT)
Automated neuroradiological support systems for multiple cerebrovascular disease markers -- A systematic review and meta-analysis [2.3] 脳血管疾患(CVD)は脳卒中や認知症を引き起こすことがある。
脳画像で見られるCVDのマーカーはいくつかある。
白色物質高強度(WMH)、急性および慢性虚血性脳梗塞(ISL)、ラキューン、拡張血管周囲腔(PVS)、急性および慢性出血性病変、脳微小血腫(CMB)
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:59:07 GMT)
Publishing Neural Networks in Drug Discovery Might Compromise Training Data Privacy [2.3] 本研究では,これらの構造を訓練した機械学習モデルが一般公開される際に,秘密の化学構造を公開するリスクについて検討する。
我々は、ブラックボックス環境での分子特性予測のためのニューラルネットワークを調べるために、薬物発見の文脈でほとんど探索されていないプライバシーを評価する一般的な方法であるメンバーシップ推論攻撃を使用する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:55:02 GMT)
Neural Graph Revealers [2.3] 確率的グラフモデルとスパースグラフリカバリ手法を効率的にマージするために,NGR(Neural Graph Revealers)を提案する。
NGRはニューラルネットワークを「ガラス箱」、より具体的にはマルチタスク学習フレームワークとみなしている。
ガウス図形モデルとCenters for Disease Control and Preventionによるマルチモーダル乳幼児死亡データから,スパースグラフの復元と確率的推定を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:19:38 GMT)
Knowledge Propagation over Conditional Independence Graphs [2.3] 条件独立(CI)グラフは特徴間の依存をキャプチャする。
本稿では,CIグラフ上で知識伝達を行うアルゴリズムを提案する。
実験により,我々の技術は一般公開されたColaおよびPubMedデータセットの最先端性の向上を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:41:48 GMT)
Federated Learning with Neural Graphical Models [2.3] フェデレートラーニング(FL)は、プロプライエタリなデータに基づいたモデルを作成する必要性に対処する。
我々は,局所的なNGMモデルから平均情報を学習するグローバルなNGMモデルを維持するFLフレームワークを開発した。
我々は、CDCの乳幼児死亡データからインサイトを抽出するためのFedNGMsの使用を実験的に実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:46:41 GMT)
ExDBN: Exact learning of Dynamic Bayesian Networks [2.2] 本稿では,データから因果学習を行うためのスコアベースの学習手法を提案する。
提案手法は, 最大25の時系列の小型・中規模の合成インスタンスに適用した場合, 優れた結果が得られた。
バイオサイエンスとファイナンスにおける2つの興味深い応用は、この方法を直接適用することで、高度に正確でグローバルに収束した解法を開発する機会をさらに強調するものである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:16:03 GMT)
EMPOWER: Embodied Multi-role Open-vocabulary Planning with Online Grounding and Execution [2.2] 実生活環境におけるロボットのタスクプランニングは重要な課題である。
これらの課題は、目標を達成するためのステップの基底的なシーケンスを特定することの難しさ、高レベルのアクションと低レベルのコマンドの標準化されたマッピングの欠如、ロボットハードウェアの限られたリソースを考えると、計算オーバーヘッドを低く抑えることの3つの問題に起因している。
オープン・ボキャブラリ・オンライン・グラウンドディングのためのフレームワークであるEMPOWERを紹介し,これらの問題に対処するための具体的エージェントの計画について述べる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:58:31 GMT)
Covariance estimation using Markov chain Monte Carlo [2.2] 我々は、$pi$がポアンカーの不等式を満足し、その鎖がスペクトルギャップを持つ場合、MCMCを用いて同様のサンプル複雑性を達成できることを示した。
凸体を均一にサンプリングするための等方的丸め手順に関する保証を提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:27:29 GMT)
Can General-Purpose Large Language Models Generalize to English-Thai Machine Translation ? [2.2] 大規模言語モデル(LLM)は、一般的なタスクではうまく機能するが、低リソースおよび低計算環境での一般化に苦慮する。
本研究は,英語-タイ語機械翻訳とコードスイッチングデータセット上で,様々なLLMと特殊翻訳モデルをテストすることにより,この制限を検証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:26:03 GMT)
Debiasing Text Safety Classifiers through a Fairness-Aware Ensemble [2.1] クローズドソーステキストセーフティ分類器における対実フェアネスを緩和する軽量後処理法を提案する。
モデルの有効性を評価するためのしきい値に依存しない2つの指標を導入し、これらの指標をFDW(Fair Data Reweighting)と組み合わせることでバイアスを軽減できることを示す。
提案手法は, モデル性能に最小限の影響を伴って, 対実的公正性の向上を図っている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:01:56 GMT)
Debiasing Text Safety Classifiers through a Fairness-Aware Ensemble [2.1] クローズドソーステキストセーフティ分類器における対実フェアネスを緩和する軽量後処理法を提案する。
モデルの有効性を評価するためのしきい値に依存しない2つの指標を導入し、これらの指標をFDW(Fair Data Reweighting)と組み合わせることでバイアスを軽減できることを示す。
提案手法は, モデル性能に最小限の影響を伴って, 対実的公正性の向上を図っている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:01:56 GMT)
Generative Image Steganography Based on Point Cloud [2.1] 本稿では,点雲表現に基づく画像ステガノグラフィーを提案する。
実際のニーズに応じて任意の解像度で画像を生成することができ、画像ステガノグラフィーのための明示的なデータの必要性を省略することができる。
実験により, このスキームによって生成されたステガノグラフ画像は, 画像品質が極めて高く, メッセージ抽出精度が99%以上に達することが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:10:00 GMT)
Cooperative Multi-Agent Constrained Stochastic Linear Bandits [2.1] N$エージェントのネットワークがローカルに通信し、期待されるコストを所定の閾値$tau$で保持しながら、全体的な後悔を最小限に抑える。
我々は、textitMA-OPLBと呼ばれる安全な分散上信頼度有界アルゴリズムを提案し、そのT$ラウンドの後悔に基づく高い確率を確立する。
我々の後悔の限界は次数$ MathcalOleft(fracdtau-c_0fraclog(NT)2sqrtNsqrtTlog (1/|lambda|)であることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:34:53 GMT)
Tethering Broken Themes: Aligning Neural Topic Models with Labels and Authors [2.0] ラベルと著者情報の両方でニューラルトピックモデルを整列するFANToMを紹介する。
提案手法は,ラベル,トピック,著者間のアライメントを学習することで,従来のトピックモデルよりも表現力が高いことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:20:47 GMT)
Moonshine: Speech Recognition for Live Transcription and Voice Commands [2.0] Moonshineは、ライブの文字起こしと音声コマンド処理に最適化された音声認識モデルのファミリーである。
Moonshineはエンコーダ・デコーダ変換アーキテクチャをベースにしており、従来の絶対位置埋め込みの代わりにロータリー位置埋め込み(Rotary Position Embedding, RoPE)を採用している。
OpenAIのWhisper small-enをベンチマークすると、Moonshine Tinyは10秒の音声セグメントを変換するための計算要求を5倍削減することを示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:55:26 GMT)
An Eye for an AI: Evaluating GPT-4o's Visual Perception Skills and Geometric Reasoning Skills Using Computer Graphics Questions [1.9] 我々は,視覚知覚能力と幾何学的推論能力の異なるCG質問のデータセットを2つ構築する。
GPT-4oは視覚情報と独立して解答する大きな可能性を秘めているが,結果の正確性や質には大きな限界がある。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:12:47 GMT)
A Statistical Analysis of LLMs' Self-Evaluation Using Proverbs [1.9] 本稿では,300対の確率対からなる新規な確率データベースについて紹介する。
そこで本研究では,テキストのコンバージェンスと,類似の証明における数値コンバージェンスを評価するテストを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:38:48 GMT)
Learning shallow quantum circuits with many-qubit gates [1.9] 本稿では,量子回路の多ビットゲートを用いた平均ケース学習のための,計算効率のよい最初のアルゴリズムを提案する。
学習したユニタリを多対数深度で効率的に合成できることが示される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:48:36 GMT)
Masked Clinical Modelling: A Framework for Synthetic and Augmented Survival Data Generation [1.8] 本稿では,マスク付き言語モデリングに触発されたMCM(Masked Clinical Modelling)について紹介する。
MCMはデータ合成と条件付きデータ拡張の両方のために設計されている。
我々は,このプロトタイプをCox Proportional Hazardsモデルを用いてWHAS500データセット上で評価する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:38:46 GMT)
CK4Gen: A Knowledge Distillation Framework for Generating High-Utility Synthetic Survival Datasets in Healthcare [1.8] CK4Genは、Coxal Proportions(CoxPH)モデルからの知識蒸留を利用して、合成サバイバルデータセットを作成する新しいフレームワークである。
患者リスクプロファイルを個別に維持し、研究と教育のために現実的で信頼性の高いアウトプットを確実にする。
CK4Genは臨床条件にまたがってスケーラブルであり、コードは公開され、将来の研究者はそれを自身のデータセットに適用して、オープンな共有に適した合成バージョンを生成することができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:20:20 GMT)
GeoCode-GPT: A Large Language Model for Geospatial Code Generation Tasks [1.8] 本稿ではGeoCode-PTとGeoCode-SFTコーパスとGeoCode-Eval評価データセットをオープンソースとして公開した。
プレトレーニングと微調整にQRAとLoRAを活用することで,地理空間コード生成にフォーカスした最初のLLMであるGeoCode-GPT-7Bを導入する。
実験の結果、GeoCode-GPTは他のモデルよりも9.1%から32.1%、コード要約能力は5.4%から21.7%、コード生成能力は1.2%から25.1%で優れていた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:57:55 GMT)
ProveRAG: Provenance-Driven Vulnerability Analysis with Automated Retrieval-Augmented LLMs [1.7] セキュリティアナリストは、新たに発見された脆弱性をリアルタイムで軽減するという課題に直面している。
1999年以降、30,000以上の共通脆弱性と暴露が特定されている。
2024年には25,000以上の脆弱性が特定されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:28:57 GMT)
KANICE: Kolmogorov-Arnold Networks with Interactive Convolutional Elements [1.7] コンボリューショナルニューラルネットワーク(CNN)とコルモゴロフ・アルノルドネットワーク(KAN)の原理を組み合わせた,新しいニューラルネットワークアーキテクチャであるKanICEを紹介する。
KanICEはInteractive Convolutional Blocks (ICB) と Kan の線形層を CNN フレームワークに統合する。
MNIST, Fashion-MNIST, EMNIST, SVHNの4つのデータセットを用いて,KanICEの評価を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:50:34 GMT)
Semiclassical origin of suppressed quantum chaos in Rydberg chains [1.7] ライドベルク原子の鎖における長時間の振動は、相互作用する系が急速に熱化するという期待に反する。
我々は、Rydberg システムを任意のスピンの連鎖 $S$ に一般化する。
古典的極限は、量子極限のいくつかの経験的特徴をうまく説明できる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:45:59 GMT)
Knowledge Distillation-Based Model Extraction Attack using GAN-based Private Counterfactual Explanations [1.7] 本稿では,ML プラットフォーム内で MEA を実行する上で,モデル説明,特に非現実的説明をどのように活用できるかを検討することに注力する。
本稿では,代替モデルの抽出効率を高めるため,知識蒸留(KD)に基づくMEAの新しいアプローチを提案する。
また,差分プライバシー(DP)の有効性を緩和戦略として評価した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:31:49 GMT)
Towards Efficient IMC Accelerator Design Through Joint Hardware-Workload Co-optimization [1.6] IMCチップアーキテクチャパラメータを最適化するハードウェア-ワークロード最適化フレームワークを提案する。
VGG16, ResNet18, AlexNet, MobileNetV3の36%, 36%, 20%, 69%のエネルギー待ち時間スコアが達成された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:25:17 GMT)
DeLLiriuM: A large language model for delirium prediction in the ICU using structured EHR [1.5] デリリウムは急性の混乱状態であり、集中治療室(ICU)の31%の患者に影響を及ぼすことが示されている。
3大データベースにわたる195病院のICU入院患者104,303名を対象にDeLLiriuMの開発と評価を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:56:31 GMT)
DSORT-MCU: Detecting Small Objects in Real-Time on Microcontroller Units [1.4] 本稿では,YOLOモデルや一般的なFOMOネットワークを含む,軽量でエネルギー効率の高い物体検出ネットワークに対する適応型タイリング手法を提案する。
提案したタイリングにより,大規模検出モデルと比較して精度が損なわれることなく,低消費電力のMCU上で物体検出が可能となる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:37:47 GMT)
Towards Automated Penetration Testing: Introducing LLM Benchmark, Analysis, and Improvements [1.4] 大規模言語モデル(LLM)は、サイバーセキュリティなど、さまざまな分野に可能性を示している。
現在、包括的で、オープンで、エンドツーエンドの自動浸透テストベンチマークはありません。
本稿では,LLMを用いた自動貫入試験のための新しいオープンベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:18:41 GMT)
First Photon Machine Learning [1.4] 我々は,ニューラルネットワークの新しいパラダイムとして,最初の光子機械学習を提案する。
量子粒子の二重スリット実験の背景にある物理を多スリットバージョンに拡張することで、1つの光子が約30%の忠実度で画像認識を行うことができることがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:04:55 GMT)
From PINNs to PIKANs: Recent Advances in Physics-Informed Machine Learning [1.4] 物理インフォームドニューラルネットワーク(PINN)は、2017年に導入されて以来、サイエンティフィック機械学習の重要なツールとして現れてきた。
本稿では,ネットワーク設計,機能拡張,最適化技術,不確実性定量化,理論的洞察の改善に焦点を当てる。
また, バイオメディシン, 流体・固体力学, 物理, 力学系, 熱伝達, 化学工学など, 様々な分野の応用について検討した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:53:15 GMT)
Characterizing the Accuracy -- Efficiency Trade-off of Low-rank Decomposition in Language Models [1.4] 低ランクの分解は、大規模にリアルタイムサービスを必要とするLLMベースのアプリケーションにとって有望な方向である。
低ランクな分解設計空間を形式化し、分解設計空間が巨大であることを示す。
以上の結果から,最小精度で9%のモデルサイズ削減を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:05:32 GMT)
Deep-Sea A*+: An Advanced Path Planning Method Integrating Enhanced A* and Dynamic Window Approach for Autonomous Underwater Vehicles [1.4] 深海環境における極度の環境は、水中での作戦に重大な課題をもたらす。
改良されたA*アルゴリズムと動的ウィンドウアプローチ(DWA)を統合した高度な経路計画手法を提案する。
提案手法は,経路の滑らかさ,障害物回避,リアルタイム性能の観点から,従来のA*アルゴリズムを超越した手法である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:29:05 GMT)
AppPoet: Large Language Model based Android malware detection via multi-view prompt engineering [1.3] AppPoetは、Androidマルウェア検出のためのマルチビューシステムである。
本手法は, 検出精度97.15%, F1スコア97.21%であり, ベースライン法よりも優れている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:12:37 GMT)
D2S: Representing sparse descriptors and 3D coordinates for camera relocalization [1.3] 複雑な局所記述子とそのシーン座標を表現するための学習に基づくアプローチを提案する。
その単純さと費用対効果が特徴である。
本手法は, 室内環境と屋外環境の両方において, 従来の回帰に基づく手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:09:54 GMT)
Improving Insurance Catastrophic Data with Resampling and GAN Methods [1.3] 破滅的な事象に関するデータの品質を改善するため、ブートストラップ、ブートナイフ、GANアルゴリズムが提案されている。
これらの手法のシミュレーション出力は平均二乗(MSE)と平均絶対誤差(MAE)に基づいて比較される。
このような出力に関するファジィ専門家の意見を構築するための直接アルゴリズムも検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:47:56 GMT)
PerspectiveNet: Multi-View Perception for Dynamic Scene Understanding [1.3] PerspectiveNetは、複数のカメラビューにわたる長い記述を生成するための軽量モデルである。
提案手法では,視覚エンコーダ,コンパクトコネクタモジュール,および大規模言語モデルを用いる。
結果として得られるモデルは軽量で、効率的なトレーニングと推論を確実にします。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:57:17 GMT)
Composing Diffusion Policies for Few-shot Learning of Movement Trajectories [1.3] 人間は、毎回スクラッチからスキルを引き出すことなく、様々な物理的なスキルの組み合わせを実行することができる。
本稿では,DSEと呼ばれる新しい合成手法を提案する。
我々は,前向きキネマティクスカーネル(MMD-FK)における最大平均差を30%以上削減できることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:57:37 GMT)
Safe Load Balancing in Software-Defined-Networking [1.3] 負荷分散のためのDeep Reinforcement Learning (DRL)アルゴリズム上に設計された制御バリア(CBF)。
DRL-CBFアプローチは,トレーニングおよびテスト中の安全性要件を満たすことができることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:34:22 GMT)
Engineering Fault-tolerant Bosonic Codes with Quantum Lattice Gates [1.2] ボソニック符号は、単一の連続変数系における量子情報の保護と修正を可能にする。
Floquet Hamiltonian Engineeringに基づくフォールトトレラント量子コンピューティングのためのボソニックコードステートを設計するための体系的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:47:44 GMT)
VEMOCLAP: A video emotion classification web application [1.2] VEMOCLAP: ユーザが提供したビデオの感情的内容を分析するための,初めて利用可能かつオープンソースなWebアプリケーションであるPretrained機能を用いたビデオEMOtionについて紹介する。
提案手法は,Ekman-6ビデオ感情データセットの最先端分類精度を4.3%向上させる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:12:11 GMT)
Reinforcement Learning for Data-Driven Workflows in Radio Interferometry. I. Principal Demonstration in Calibration [1.2] 電波干渉計(Radio Interferometry)は、天体物理学的な現象を研究するために用いられる観測技術である。
干渉計によって収集されたデータは、天文学者が科学的な情報を抽出する前に、かなりの処理を必要とする。
本稿では、干渉法の背後にある原理とデータ処理に必要な手順を簡易に記述する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:07:55 GMT)
Duality defect in a deformed transverse-field Ising model [1.1] 準保存量構築におけるトポロジカル欠陥の役割について検討する。
半鎖クラマース・ワニエ変換、イジング融合圏における技術利用、欠陥修正弱積分性破壊の3つの方法により、双対性欠陥ハミルトニアンを構成する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:00:03 GMT)
Neuronal Competition Groups with Supervised STDP for Spike-Based Classification [1.1] Spike Timing-Dependent Plasticity(STDP)は、ニューロモルフィックハードウェア上でのスパイキングニューラルネットワーク(SNN)の局所的なトレーニングのバックプロパゲーションの代替となる。
STDPにより、SNNは特徴抽出のための教師なしSTDPと分類のための教師なしSTDPを組み合わせることで、分類タスクに対処できる。
本稿では,クラスごとのさまざまなパターンの学習を促進することによって,分類能力を向上させるアーキテクチャである神経コンペティショングループ(NCG)を紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:46:20 GMT)
Multi-Layer Gaussian Splatting for Immersive Anatomy Visualization [1.1] 医用画像の可視化において、CTスキャンのような体積医学データのパストレースは、生命に似た可視化を生成する。
本稿では,CTスキャンの高速かつ静的な中間表現を実現するために,GSを用いた新しい手法を提案する。
本手法は,対象ハードウェアに品質を調整可能な解剖学的構造を保ちながら,インタラクティブなフレームレートを実現する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:56:58 GMT)
A Self-Organizing Clustering System for Unsupervised Distribution Shift Detection [1.0] 本稿では,分布変化のモニタリングと検出のための連続学習フレームワークを提案する。
特に,2つのトポロジ保存マップ(自己組織化マップ)とスケール不変マップ(スケール不変マップ)の投影について検討する。
本手法は教師なしコンテキストと教師なしコンテキストの両方に適用できる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:30:36 GMT)
Solving Superconducting Quantum Circuits in Dirac's Constraint Analysis Framework [1.0] 我々は,超電導量子回路(SQC)の様々なタイプについて,反復的に検討する。
SQCのラグランジアンは、ハミルトンフレームワークに分類される制約を明らかにする。
また,SQCの汎用形式に対する新たな結果を解析し,予測した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:18:01 GMT)
Enhancing Two-Player Performance Through Single-Player Knowledge Transfer: An Empirical Study on Atari 2600 Games [1.0] 本研究では,Atari 2600 RAMを入力状態とした10種類のAtari 2600環境における提案手法について検討した。
我々は,スクラッチから2人プレイヤ設定のトレーニングよりも,シングルプレイヤートレーニングプロセスからトランスファーラーニングを使用することの利点について論じる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:57:44 GMT)
On Computational Indistinguishability and Logical Relations [1.0] この研究は、疑似乱数関数によって誘導される暗号化スキームが、純粋に方程式的なスタイルでアクティブな敵に対して安全であることが証明されたセキュリティ証明の例で締めくくられる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:28:16 GMT)
GlucOS: Security, correctness, and simplicity for automated insulin delivery [1.0] 本稿では,信頼性の高い自動インスリンデリバリーシステムであるGlucOSを紹介する。
GlucOSはアルゴリズムのセキュリティ、ドライバのセキュリティ、エンド・ツー・エンドの検証を組み合わせることで、悪意のあるMLモデル、脆弱なポンプドライバ、人間の生理学の急激な変化を防いでいる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:27:55 GMT)
Accelerating PoT Quantization on Edge Devices [1.0] パワー・オブ・ツー(PoT)量子化のような一様でない量子化は、一様量子化よりもデータ分布によく一致する。
エッジデバイス上でPoT量子化されたDeep Neural Networkを高速化するための既存のパイプラインは、オープンソースではない。
本稿では,リソース制約のあるエッジデバイス上でのPoT量子化DNNのエンドツーエンド高速化のための,オープンソースのパイプラインであるPoTAccを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:12:40 GMT)
Semantic-guided Search for Efficient Program Repair with Large Language Models [0.9] FLAMESは、修復効率とメモリ効率を向上させるためにセマンティック誘導パッチ生成を使用する。
FLAMESは従来のLCMベースのAPRに比べてメモリ消費を最大83%削減する。
FLAMESはDefects4JとHumanEval-Javaデータセットで333と163のバグに対して133と103の修正を成功させた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:59:47 GMT)
Wireless Link Quality Estimation Using LSTM Model [0.9] 本稿では,シーケンシャルな情報を活用することで,無線ネットワークの通信品質を推定する新しいモデルを提案する。
提案手法はLong Short-Term Memory (LSTM)に基づいて,リンク品質の逐次的情報を考慮した高精度な推定を可能にする。
LSTMを用いたLQEモデルでは,LQE-SAEモデルよりも4.0%高い精度と4.6%高いマクロF1スコアが得られた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:10:57 GMT)
Realism and causality imply information erasure by measurements [0.9] 射影測定は、結果が無視された場合、システム上の不確実性を減らすことはできない。
この特性は、測定過程の忠実な古典的因果シミュレーションによって継承されないことを示す。
シミュレーションにおいて、測定は、システムに部分リセットを行うことで、前の情報を消去する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:11:37 GMT)
A Surrogate Model for Quay Crane Scheduling Problem [0.9] 本研究では,NP-Hard として知られるポートにおけるタスクスケジューリング問題である Quay Crane Scheduling Problem (QCSP) の解法を提案する。
まず、実際のポートデータから学習し、QCの作業速度を正確に予測することで、Quay Cranesのより正確な作業計画を作成する方法を提案する。
次に、複雑な最適化問題を解くために広く使われている遺伝的アルゴリズム(GA)と機械学習(ML)モデルを組み合わせることで、サロゲートモデルを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:21:07 GMT)
On the analysis of saturated pressure to detect fatigue [0.9] 本稿では, 筆跡, カーシブテキスト, 大文字テキスト, シグネチャなど, 様々な手書き作業中の圧力信号の飽和度を, 疲労レベルの違いで検討する。
実験の結果, 手首を休ませることなく行う作業において, 激しい運動の後, 飽和試料の割合は有意に上昇した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:53:40 GMT)
High Precision Fault-Tolerant Quantum Circuit Synthesis by Diagonalization using Reinforcement Learning [0.8] 経験的探索に基づく合成法は、より広範なユニタリの集合に対して優れた実装を生成することができる。
探索に基づく手法を用いて、一般ユニタリ合成問題を対角ユニタリの1つに還元する。
将来の長期的応用のためのアルゴリズムのサブセットでは、対角化はTゲートの数を最大16.8%減らすことができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:32:31 GMT)
High Precision Fault-Tolerant Quantum Circuit Synthesis by Diagonalization using Reinforcement Learning [0.8] 経験的探索に基づく合成法は、より広範なユニタリの集合に対して優れた実装を生成することができる。
探索に基づく手法を用いて、一般ユニタリ合成問題を対角ユニタリの1つに還元する。
将来の長期的応用のためのアルゴリズムのサブセットでは、対角化はTゲートの数を最大16.8%減らすことができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:32:31 GMT)
Comment on "Multivariable quantum signal processing (M-QSP): prophecies of the two-headed oracle" [0.8] 本稿では,M-QSPの改訂に必要な条件を提案する。
本研究は,これらの条件が十分でないことを示し,M-QSP理論の完全化に必要となる追加条件について述べる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:24:26 GMT)
The Internet of Forgotten Things: European Cybersecurity Regulation and IoT Manufacturer Cessation [0.8] 本稿は、現在の欧州製品法は、競合するIoT市場における問題の増加の盲点である、と論じる。
メーカーのクラウドサーバがなければ、多くのIoTデバイスはデータ分析のようなコア機能を実行できない。
本報告では,IoT製造中止の解決策を見つける上で,立法者を支援することができる3つの特性について検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:57:49 GMT)
XReal: Realistic Anatomy and Pathology-Aware X-ray Generation via Controllable Diffusion Model [0.7] 大規模な生成モデルは、視覚的に魅力的な画像を生成するという印象的な能力を示している。
しかし、彼らは幻覚障害や解剖学的に不正確なアウトプットの発生に悩まされ続けている。
胸部X線画像を生成するための新しい制御可能な拡散モデルであるXRealを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:26:09 GMT)
Personalized Recommendation Systems using Multimodal, Autonomous, Multi Agent Systems [0.7] 本稿では,マルチモーダル,自律型,マルチエージェントシステムを用いた高度に開発されたパーソナライズされたレコメンデーションシステムについて述べる。
このシステムは、未来的なAI技術と、顧客サービス体験を改善するためにGemini-1.5- ProやLLaMA-70BのようなLLMを取り入れることに焦点を当てている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:11:26 GMT)
TopoNav: Topological Navigation for Efficient Exploration in Sparse Reward Environments [0.7] TopoNavは、スパース・リワード設定における効率的な目標指向の探索とナビゲーションのための新しいフレームワークである。
TopoNavは環境のトポロジカルマップを動的に構築し、主要な場所と経路をキャプチャする。
本研究では,Clearpath Jackalロボットを用いて,シミュレーションと実世界のオフロード環境におけるTopoNavの評価を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:31:13 GMT)
Lex2Sent: A bagging approach to unsupervised sentiment analysis [0.6] 本稿では,テキストの分類方法として,Lex2Sentを提案する。
テキストを分類するために、文書埋め込みと適切な辞書の埋め込みの距離を決定するために埋め込みモデルを訓練する。
本稿では,このモデルがレキシカよりも優れており,バイナリ感情分析のタスクにおいて,高パフォーマンスな数発の微調整手法の基盤となることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:18:55 GMT)
Solving the Independent Domination Problem by Quantum Approximate Optimization Algorithm [0.6] 独立支配問題(IDP)は、様々な現実のシナリオにおいて実践的な意味を持つ。
IDPの既存の古典的アルゴリズムは計算の複雑さに悩まされている。
本稿では、IDPに対処するための量子近似最適化(QAOA)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:49:00 GMT)
AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed and Low Tolerance [0.6] Per-IMage Overlap(PIMO)は、AUROCとAUPROの欠点に対処する新しいメトリクスである。
画像ごとのリコールの測定は、計算を単純化し、ノイズの多いアノテーションに対してより堅牢である。
実験の結果,PIMOは実用的優位性があり,性能の見識に乏しいことがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:39:52 GMT)
Technical Report: Toward Applying Quantum Computing to Network Verification [0.6] ネットワーク検証(NWV)は、ブルート力によって古典的ハードウェア上で効率よく解決できない。
我々は、NWV問題をより効率的に解くために量子コンピューティングを適用するという、根本的に異なるアプローチを考える。
しかし、ハードウェアとアルゴリズムの開発の急速な進歩は、彼らのアプリケーションについて考えるのに絶好のタイミングだ。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:02:43 GMT)
Maximal Extractable Value in Decentralized Finance: Taxonomy, Detection, and Mitigation [0.5] 最大抽出可能な値(MEV)は、ブロックチェーン上の金融トランザクションから抽出することができる。
MEVは、DeFiエコシステムのセキュリティ、効率、分散化目標を破壊し、金融損失とコンセンサス不安定を引き起こす。
この調査は、研究者、開発者、利害関係者、政策立案者に貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:11:41 GMT)
Are Large Language Models Moral Hypocrites? A Study Based on Moral Foundations [0.5] 我々は,現在最先端の大規模言語モデル (LLM) が道徳的偽善であるかどうかを検討する。
モラル基礎理論に基づく2つの研究機器を採用。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:02:28 GMT)
The Neuromorphic Analog Electronic Nose [0.5] 2つの異なる経路のパルス間の時間差でガス濃度を符号化する1つのMOxセンサのための単純なアナログフロントエンドを導入する。
一定の気流中に注入されたガスパルスに対して,嗅球内の2つの主出力ニューロン間のスパイク時間差と同様,パルス間の時間差はガス濃度の増加とともに減少することを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:20:51 GMT)
Polyak's Heavy Ball Method Achieves Accelerated Local Rate of Convergence under Polyak-Lojasiewicz Inequality [0.5] 連続時間と離散時間の両方において、Polyakの球法が非対象関数に収束することを考察する。
この手法は不等式ジャシエヴィチを満たす目的関数のクラスで加速する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:35:47 GMT)
On the Sampling Sparsity of Neuromorphic Analog-to-Spike Conversion based on Leaky Integrate-and-Fire [0.5] 本稿では,Threshold-Based Representation を用いた情報符号化がアナログからスパイクへの変換に結びついていることを示す。
周期感覚ニューロモルフィックエンジニアリングの伝統的な原則とは対照的に、バイオインスパイアされたイベントベースセンシングへのパラダイムシフトを追求している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:42:07 GMT)
Parsimonious Dynamic Mode Decomposition: A Robust and Automated Approach for Optimally Sparse Mode Selection in Complex Systems [0.4] 本稿では,Parsimonious Dynamic Mode Decomposition (parsDMD)を紹介する。
ParsDMDは、時間的および純粋に時間的データの両方に対して最適にスパースされた動的モードのサブセットを自動選択するように設計された新しいアルゴリズムである。
定在波信号、隠れ力学の同定、流体力学シミュレーション、大気表面温度(SST)データなど、さまざまなデータセットで検証されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:00:11 GMT)
Enhancing Algorithm Performance Understanding through tsMorph: Generating Semi-Synthetic Time Series for Robust Forecasting Evaluation [0.4] 本稿では,データセットのモーフィングによる半合成時系列生成ツールであるtsMorphについて述べる。
本稿では,Long Short-Term Memory NetworkとDeepAR予測アルゴリズムの予測性能を評価することにより,tsMorphの利点を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:22:33 GMT)
Auxiliary CycleGAN-guidance for Task-Aware Domain Translation from Duplex to Monoplex IHC Images [0.4] サイクル生成共役ネットワーク(GAN)は確立されているが、関連するサイクル一貫性の制約は、2つの領域の間に可逆写像が存在することに依存する。
我々は,新しいトレーニングデザインの導入を通じて,免疫蛍光(IF)画像の集合を補助的未ペア画像領域として活用する代替的制約を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:07:54 GMT)
Quantum metrology timing limits of biphoton frequency comb [0.4] バイフォトン周波数コム(BFC)は、高い情報容量とエラーレジリエンスのため、量子情報処理において重要である。
ここでは、周波数モードの数と2次スケールの量子クラム・ラオ境界を導出する。
モード数の増加は、実際のタイミング精度を改善するための最適な戦略であることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:23:55 GMT)
MBD: Multi b-value Denoising of Diffusion Magnetic Resonance Images [0.3] 畳み込みニューラルネットワークアプローチを導入し,多値デノイング(MBD)と呼ぶ。
MBDは、異なるb値にまたがる拡散重み付き画像(DWI)の類似性を利用するが、同じ拡散符号化方向に沿っている。
ぼやけを回避し、少数の入力画像のみを用いることで、ノイズのばらつきの高い拡散画像の雑音化を可能にする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:03:06 GMT)
Adversarial Challenges in Network Intrusion Detection Systems: Research Insights and Future Prospects [0.3] 本稿では,機械学習を用いたネットワーク侵入検知システム(NIDS)の総合的なレビューを行う。
NIDSにおける既存の研究を批判的に検討し、重要なトレンド、強み、限界を強調した。
我々は、この分野における新たな課題について議論し、より堅牢でレジリエントなNIDSの開発に向けた洞察を提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:49:44 GMT)
Adversarial Challenges in Network Intrusion Detection Systems: Research Insights and Future Prospects [0.3] 本稿では,機械学習を用いたネットワーク侵入検知システム(NIDS)の総合的なレビューを行う。
NIDSにおける既存の研究を批判的に検討し、重要なトレンド、強み、限界を強調した。
我々は、この分野における新たな課題について議論し、より堅牢でレジリエントなNIDSの開発に向けた洞察を提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:49:44 GMT)
Business Process Simulation: Probabilistic Modeling of Intermittent Resource Availability and Multitasking Behavior [0.3] ビジネスプロセスシミュレーションでは、典型的にリソースの可用性は、各リソースにカレンダーを割り当てることによってモデル化される。
本稿では,資源の可利用性とマルチタスク動作をモデル化するための確率論的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:16:11 GMT)
Enhancing Robustness and Efficiency of Least Square Twin SVM via Granular Computing [0.3] 機械学習の分野では、最小二乗サポートベクターマシン(LSTSVM)が最先端モデルの1つとして際立っている。
LSTSVMはノイズやインバージョンに対する感受性に悩まされており、リサンプリングの原則と不安定さを見落としている。
そこで我々は,従来のデータポイントの代わりに粒状球を用いて学習した,頑健な粒状球 LSTSVM (GBLSTSVM) を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:13:01 GMT)
Development of CNN Architectures using Transfer Learning Methods for Medical Image Classification [0.3] 本稿では,医療画像分類分野における伝達学習技術を用いたCNNアーキテクチャの開発について検討する。
本研究は,CNNアーキテクチャを最適かつ最新に選択した上で,その決定を下すのに役立つ。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:37:51 GMT)
Detection of Electron Paramagnetic Resonance of Two Electron Spins Using a Single NV Center in Diamond [0.3] 相互作用するスピン系は、基本的な量子物理学と量子センシングおよび量子シミュレーションへの応用のための優れたテストベッドである。
本研究では、2つの電子スピンに結合した1つの窒素空孔(NV)中心の同定と特性について述べる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:37:54 GMT)
Graph Neural Network-Accelerated Network-Reconfigured Optimal Power Flow [0.2] 本稿では、特にグラフニューラルネットワーク(GNN)を利用した機械学習(ML)に基づくアプローチを提案する。
GNNモデルは最適化段階に入る前に最高のトポロジを予測するためにオフラインで訓練される。
高速なオンラインポストML選択層も提案され、GNN予測を分析し、高い信頼性で予測されたNRソリューションのサブセットを選択する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:35:09 GMT)
Hybrid Generative AI for De Novo Design of Co-Crystals with Enhanced Tabletability [0.2] Generative Method for Co-Crystal Design (GEMCODE) は、コクリスタル自動スクリーニングのための新しいパイプラインである。
GEMCODEは高速デノボコクリスタル設計が可能で、ターゲットの可視性プロファイルを持つ。
GEMCODEは,現実的な計算制約下であっても有効であることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:25:28 GMT)
Decoherence of Quantum Emitters in hexagonal Boron Nitride [0.2] コヒーレント量子エミッタは先進量子技術の中心的な資源である。
ここでは、hBNプロセスがhBNにおける量子エミッタのコヒーレンス、すなわち機能性を分解できることを実証する。
我々は,hBNにおけるコヒーレント量子エミッタの実現における結晶格子品質の重要性を強調した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:25:35 GMT)
Survival of the Fittest: Evolutionary Adaptation of Policies for Environmental Shifts [0.2] 進化ゲーム理論(EGT)にインスパイアされた適応的再学習アルゴリズムを開発する。
ERPOは、ポリシー適応の高速化、平均報酬の向上、およびポリシー適応の計算コストの削減を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:29:53 GMT)
Mask-guided cross-image attention for zero-shot in-silico histopathologic image generation with a diffusion model [0.1] 拡散モデルは、シリコン内画像を生成する最先端のソリューションである。
自然画像の出現伝達拡散モデルが設計されている。
計算病理学、特に腫瘍学では、画像内のどのオブジェクトを前景と背景に分類すべきかを簡単に定義することはできない。
我々は,クラス固有のAdaIN特徴量マッチングを交互に行うために,外観伝達指導を変更することで,拡散安定画像への外観伝達モデルの適用性に寄与する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:41:38 GMT)
AI-Driven Approaches for Glaucoma Detection -- A Comprehensive Review [0.1] コンピュータ支援診断システム(CADx)は、臨床医が早期に緑内障の正確な診断を支援するための有望なツールとして登場した。
本稿では,緑内障の診断にCADxシステムで使用されるAI技術の概要を概観する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:58:06 GMT)
Natural Language to Verilog: Design of a Recurrent Spiking Neural Network using Large Language Models and ChatGPT [0.1] 我々はOpenAIのChatGPT4と自然言語プロンプトを使ってハードウェア記述コード、すなわちVerilogを生成する。
得られた設計は、3つの単純な機械学習タスク、排他的OR、IRIS花の分類、MNIST手書き桁の分類で検証された。
デザインはEfabless Tiny Tapeout 6に提出された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:31:22 GMT)
A Lightweight Modular Framework for Low-Cost Open-Vocabulary Object Detection Training [0.1] 我々は軽量なフレームワークを導入し、性能を保ちながらパラメータの数を大幅に減らします。
MDETR の最適化版である Lightweight MDETR (LightMDETR) を開発した。
LightMDETRは計算コストを削減できるだけでなく、いくつかの最先端の手法よりも精度が高い。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:51:43 GMT)
A Lightweight Modular Framework for Low-Cost Open-Vocabulary Object Detection Training [0.1] 我々は軽量なフレームワークを導入し、性能を保ちながらパラメータの数を大幅に減らします。
MDETR の最適化版である Lightweight MDETR (LightMDETR) を開発した。
LightMDETRは計算コストを削減できるだけでなく、いくつかの最先端の手法よりも精度が高い。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:51:43 GMT)
Assessment of Transformer-Based Encoder-Decoder Model for Human-Like Summarization [0.1] この研究は、トランスフォーマーベースのBARTモデルを利用して人間のような要約を行う。
エンコーダ・デコーダモデルの訓練および微調整において,多種多様なサンプル記事を用いて検証を行った。
微調整モデルの性能をベースライン事前訓練モデルと比較する。
BBC Newsの記事に載った実証的な結果は、人間によって書かれた金の標準要約の方が17%も現実的に一貫性があることを示している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:25:04 GMT)
Leaky ReLUs That Differ in Forward and Backward Pass Facilitate Activation Maximization in Deep Neural Networks [0.0] アクティベーション(AM)は最適な入力を生成し、トレーニングされたディープニューラルネットワークで高い応答をトリガーする機能を明らかにする。
本稿では,ReLU や Leaky ReLU を含む単純な関数に対して,AM が最適入力を生成できないことを示す。
本稿では,後進パスに負の勾配を持つLeaky ReLUを用いて,前進パスに,元の(通常ゼロの)傾斜を保ちながら,後方パスに高い負の勾配を持つ解を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:38:39 GMT)
p-SWAP: A Generic Cost-Effective Quantum Boolean-Phase SWAP Gate Using Two CNOT Gates and the Bloch Sphere Approach [0.0] p-SWAP は交換された量子ビット間のカスタマイズ可能な位相差であり、0 = p = $pm pi$ radians である。
p-SWAPゲートの費用対効果は、最終的な量子回路の実際の量子コンピュータへの量子コストの低下に起因する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:40:09 GMT)
Vulnerability anti-patterns in Solidity: Increasing smart contracts security by reducing false alarms [0.0] 我々は、現在の分析の統合と拡張が実現可能なだけでなく、スマートコントラクトセキュリティにおける次の論理的なステップであることを示す。
開発者中心の脆弱性の概念から,Solidityコードの形態と動的性に関する軽量な静的チェックを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:21:28 GMT)
VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation [0.0] 高速ビデオ(HSV)セグメンテーションは、沸騰熱伝達などの科学・産業応用における動的物理過程の解析に不可欠である。
位相検出のための多様なHSVデータセットを微調整したSegment Anything Model (SAM) の特殊適応であるVideoSAMを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:46:36 GMT)
ViMGuard: A Novel Multi-Modal System for Video Misinformation Guarding [0.0] 誤情報保護のためのビデオマスク付きオートエンコーダ(ViMGuard)について紹介する。
ViMGuardはSFVのファクトチェックが可能な最初のディープラーニングアーキテクチャである。
評価では、ViMGuardは最先端のファクトチェッカーを3つ上回った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:30:08 GMT)
Using Platt's scaling for calibration after undersampling -- limitations and how to address them [0.0] シミュレーション研究やケーススタディを通じて解析的にPlattのスケーリングはアンダーサンプリング後のキャリブレーションには使用すべきでないことを示した。
我々は、ベースモデルの予測のロジットに、ロジスティックな一般化された加算モデルに適合する、プラットのスケーリングの修正版を推奨する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:30:30 GMT)
Unsupervised Assessment of Landscape Shifts Based on Persistent Entropy and Topological Preservation [0.0] 入力データのドリフトは、学習予測器とシステムの安定性に負の結果をもたらす可能性がある。
本稿では,多次元データストリームの変化をモニタリングする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:24:05 GMT)
Unsupervised Assessment of Landscape Shifts Based on Persistent Entropy and Topological Preservation [0.0] 入力データのドリフトは、学習予測器とシステムの安定性に負の結果をもたらす可能性がある。
本稿では,多次元データストリームの変化をモニタリングする新しいフレームワークを提案する。
このフレームワークは、教師なし環境と教師なし環境の両方で動作する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:24:05 GMT)
Universal approximation property of ODENet and ResNet with a single activation function [0.0] 本研究ではODENetとResNetの普遍近似特性について検討する。
制限ベクトル場を持つようなODENetとResNetは、一般ベクトル場を持つODENetを均一に近似できることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:27:01 GMT)
Universal Gate Set for Optical Lattice Based Atom Interferometry [0.0] 慣性センシングのための原子光学成分の普遍的集合が存在することを示す。
これらの成分は、私たちが量子演算を行うゲートを構成する。
そのようなゲート集合は、量子コンピューティングの普遍ゲート集合と類似して、距離論的に普遍的であると断言する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:09:03 GMT)
Uncovering RL Integration in SSL Loss: Objective-Specific Implications for Data-Efficient RL [0.0] SPRフレームワークにおけるSSLの客観的な修正の効果について検討する。
これには、端末状態マスキングと優先順位付けされたリプレイ重み付けが含まれる。
Atari 100kベンチマークのSPR版を6種類評価した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:57:10 GMT)
Uncovering Key Trends in Industry 5.0 through Advanced AI Techniques [0.0] 本稿では,約200のオンライン記事を分析し,人工知能技術を用いて産業5.0のトレンドを特定する。
結果は、中核的なテーマの集合に収束し、また、産業5.0は幅広いトピックにまたがっていることを強調している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:06:00 GMT)
Typical Quantum States of the Universe are Observationally Indistinguishable [0.0] 普遍量子状態がヒルベルト空間の高次元部分空間から典型的な単位ベクトルと仮定できるならば、どのベクトルがどのベクトルであるかを観測することはできない。
我々の議論は、量子統計力学の典型性に基づいている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:59:57 GMT)
Trustworthy XAI and Application [0.0] 本稿では、XAI、信頼性の高いXAI、信頼性の高いXAIの実用的利用について論じる。
我々は、この状況に関係があると判断した3つの主要なコンポーネント、透明性、説明可能性、信頼性を乗り越えます。
結局のところ、人間とAIシステム間の信頼の確立と維持には信頼性が不可欠である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:10:10 GMT)
Transmon qubit modeling and characterization for Dark Matter search [0.0] 本研究では,超伝導トランスモン量子ビット回路の試作機の設計,シミュレーション,実験的評価を行う。
本稿では,2つの非干渉トランスモン量子ビット,1つは固定周波数,もう1つは可変フラックスを特徴とする平面回路設計について述べる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:02:40 GMT)
Tracing the Development of the Virtual Particle Concept Using Semantic Change Detection [0.0] 本稿では,仮想粒子を用いた意味的変化検出の有効性について検討する。
SCDの指標は,科学史と哲学における質的研究の洞察とよく一致している。
この測定結果から、1950年以降、仮想粒子の概念はより安定になったが、同時によりポリセム性も高まったことが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:43:39 GMT)
Topological excitations at time vortices in periodically driven systems [0.0] タイムボルテックスと呼ばれる運転するハミルトンの時空欠陥が、$pi$Majoranaモードに結合できることが示される。
クリフォードゲートを用いて時間渦を作成することができ、その実現を短期量子シミュレーターで単純化する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:00:01 GMT)
Toolshed: Scale Tool-Equipped Agents with Advanced RAG-Tool Fusion and Tool Knowledge Bases [0.0] 強化されたツール表現を格納するように設計されたツール知識ベース(ベクトルデータベース)であるToolshed Knowledge Basesを紹介する。
RAG-Tool Fusion(Advanced RAG-Tool Fusion)も提案する。
このアプローチでは,ToolEシングルツール,ToolEマルチツール,Seal-Toolsベンチマークデータセットの46%,56%,絶対的な改善を実現しています。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:27:12 GMT)
Thermodynamics of a Quantum Subsystem [0.0] 外部力によって準静的に駆動される量子サブシステムの熱力学を解析する。
量子サブシステムの熱力学関数は局所スペクトルの観点から動的に定義できることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:06:20 GMT)
The classical-quantum hybrid canonical dynamics and its difficulties with special and general relativity [0.0] 古典的部分系と量子的部分系の間のハミルトンハイブリッド結合について論じる。
量子化された物質に結合した古典的な重力に当てはまると、このハイブリッド理論は完全な量子重力に取って代わる「捕獲後量子」を実現できるかもしれない。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:18:35 GMT)
The Persian Rug: solving toy models of superposition using large-scale symmetries [0.0] 入力次元が大きければ最小限の非線形スパースデータオートエンコーダによって学習されたアルゴリズムの完全なメカニスティック記述を示す。
我々の研究は、オートエンコーダの構造を理解する技術を導入することによって、ニューラルネットワークの解釈可能性に貢献している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:48:56 GMT)
The Optical HMW Geometric Phase and the Abraham Minkowski Controversy [0.0] 我々は、He-McKellar-Wilkens(光学HMW)位相の光誘起バージョンを測定するための干渉計測手法を提案する。
この幾何学的位相は、ユーラー・ラグランジュ運動方程式を通して、論争の中心にあるアブラハム力と直接関係していることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:30:14 GMT)
TensorProjection Layer: A Tensor-Based Dimension Reduction Method in Deep Neural Networks [0.0] 本稿では,ディープニューラルネットワークにおけるテンソル構造特徴データに特化して設計された次元削減手法を提案する。
この手法は「プロジェクション層」と呼ばれる隠された層として実装され、入力テンソルをモードワイドプロジェクションを通じて縮小次元の出力テンソルに変換する。
数値実験により,提案手法はタスクにおいて,プール層などの従来のダウンサンプリング手法よりも優れており,特徴要約の有望な代替手段である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:40:17 GMT)
TE-PAI: Exact Time Evolution by Sampling Random Circuits [0.0] 量子ハミルトニアンの下での時間進化のシミュレーションは、量子コンピュータの最も自然な応用の1つである。
TE-PAIは、ランダムな量子回路をサンプリングすることによって、時間進化を正確にシミュレートする。
回路深度を最適に浅めながら、離散化やアルゴリズム誤差を伴わずに時間進化をシミュレートすることを証明する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:36:11 GMT)
Supersonic shear waves in dipolar supersolids [0.0] 三角構造とハニカム構造を有する双極子超固体における横波パケット伝搬について検討した。
注目すべきは、ハニカム超固体は異常な分散を示し、音の逆速度よりも高速に進行する波を支えることである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 07:23:19 GMT)
Strong symmetries in collision models and physical dilations of covariant quantum maps [0.0] 共変あるいは弱対称な量子写像は、量子進化を定義する上で重要な役割を果たす。
この研究は、量子マップの弱い対称性がどのようにその拡張に現れるかを探求する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:28:36 GMT)
Spontaneously induced emitter-radiation entanglement due to confinement to photonic band gap [0.0] フォトニックバンドギャップ(PBG)を具現化した結晶構造上に埋め込まれた2レベルエミッタのアンサンブルの相互作用による自然誘起非古典性の研究
結合系の状態は閉じ込めによる絡み合いと非古典的な強度相関を示し, 放射光の強度と絡み合いの度合いはエッジ付近で高められることがわかった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:26:56 GMT)
Spatial Wavefunctions of Spin [0.0] 量子力学的角運動量の別の定式化を提案する。
波動関数は、Wigner D-functions, $D_n ms (phi,theta,chi)$である。
基本粒子に対する量子数$n$のいくつかの意味を論じる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:40:10 GMT)
SmartGSN: a generative AI-powered online tool for the management of assurance cases [0.0] 我々は,大規模言語モデルに依存する革新的なオンラインツールであるSmartGSNを導入し,GSNに準拠した保証ケースの管理を(半)自動化する。
SmartGSNの評価は、複数のアプリケーションドメインにまたがる5つのシステムで手作業で作成された保証ケース内の保証ケースパターンを検出する強力な能力を示している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:16:19 GMT)
SigCLR: Sigmoid Contrastive Learning of Visual Representations [0.0] SigCLRは、ユビキタスで、様々なドメインで大きな成功を収めているSimCLRの代替として有望であることを示す。
以上の結果から,SigLUPの場合のように学習可能なバイアスの重要性が検証された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:56:04 GMT)
Shortcut-to-adiabaticity for coupled harmonic oscillators [0.0] 断熱法へのショートカットは、断熱力学の望ましい状態を得ることを可能にする。
この手法を2結合ボソニックモードに適用する問題に対処する。
この手法を2結合ボソニックモードに適用する問題に対処する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:15:03 GMT)
SU(N) magnetism with ultracold molecules [0.0] SU($N$)対称性を持つ量子系は、量子多体物理学のパラダイム的な設定である。
静電場やマイクロ波との破壊衝突から守られた超低温分子は、SU($N$)対称性を示す。
彼らはそのドアを、ボソンに32ドル、フェルミオンに36ドル(約3万2000円)まで開けた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:13:19 GMT)
SPVSoAP3D: A Second-order Average Pooling Approach to enhance 3D Place Recognition in Horticultural Environments [0.0] ボクセルに基づく特徴抽出ネットワークと2次平均プール演算子に基づく集約手法を組み合わせた新しいモデリング手法であるSPVSoAP3Dを紹介する。
園芸環境から得られた2つの新しいシーケンスを導入し,既存のHORTO-3DLMデータセットを拡張した。
OverlapTransformer, PointNetVLAD, LOGG3D-Netなど, 最先端(SOTA)モデルに対するSPVSoAP3Dの性能評価を行った。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:37:55 GMT)
Robust Variable Selection for High-dimensional Regression with Missing Data and Measurement Errors [0.0] そこで本研究では、ミスや測定誤差データに適用するために、チューニングパラメータを持つ指数損失関数を提案する。
逆確率重み付けと加算率誤差モデルを用いて、不足データや測定誤差に対処する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:07:01 GMT)
Revealing Hidden Bias in AI: Lessons from Large Language Models [0.0] 本研究では,Claude 3.5 Sonnet, GPT-4o, Gemini 1.5, Llama 3.1 405B による面接レポートのバイアスについて検討した。
LLMによる匿名化によるバイアス低減効果について検討した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:58:54 GMT)
Rethinking generalization of classifiers in separable classes scenarios and over-parameterized regimes [0.0] 分離可能なクラスでは、トレーニングデータ n の数で「悪い」大域最小値の割合が指数関数的に減少することを示す。
本稿では,MNIST と CIFAR-10 の実験と整合した学習曲線を求める,真の誤差の密度分布のモデルを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:12:57 GMT)
Research on Travel Route Planing Problems Based on Greedy Algorithm [0.0] 欲求アルゴリズムに基づく経路計画問題は、与えられた開始点と終了点の間の最適経路またはほぼ最適経路を特定する方法を表す。
本稿では,まず都市評価指標をダウンスケールし,主要な主要成分を抽出し,データをダウンスケールするためにPCA法を用いる。
旅行者のニーズに応じて個別にルートをカスタマイズする,欲求に基づく経路計画アルゴリズムが提案され,最適化されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:28:28 GMT)
Reinforcement learning on structure-conditioned categorical diffusion for protein inverse folding [0.0] 逆折り畳みは、複数の列が同じ構造に折り畳むことができる1対多の問題である。
RL-DIFは、逆折り畳みのカテゴリー的拡散モデルであり、シーケンス回復に基づいて事前訓練され、強化学習によって調整される。
実験の結果、RL-DIFはCATH 4.2で29%の折りたたみ可能な多様性を達成できることが示された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:50:34 GMT)
Random Real Valued and Complex Valued States Cannot be Efficiently Distinguished [0.0] アンサンブル $O vert 0rangle langle 0 vert Otop vert O in mathbbO(d)$ は、$t = Omega(sqrtd)$ がなければ、ハール乱状態の $t$ コピーと区別できないことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:39:24 GMT)
RKadiyala at SemEval-2024 Task 8: Black-Box Word-Level Text Boundary Detection in Partially Machine Generated Texts [0.0] 本稿では,与えられたテキストのどの部分が単語レベルで生成されたかを特定するための信頼性の高いアプローチをいくつか紹介する。
本稿では,プロプライエタリシステムとの比較,未確認領域におけるモデルの性能,ジェネレータのテキストの比較を行う。
その結果,検出能の他の側面との比較とともに,検出精度が著しく向上した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:21:59 GMT)
Quantum many-body scars as remnants of stable many-body periodic orbits [0.0] 量子多体傷(Quantum many-body scars, QMBS)は、閉量子系における熱化の一般的なシナリオを否定する弱いエルゴード性破壊現象である。
多数のフレーバーを持つボソニックモデルを研究することによって、予想に反例を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:48:13 GMT)
Quantum Mechanics on a background modulo observation [0.0] 我々は量子力学を、観測モジュール量子力学(OM-QM)と呼ばれる非常にリッチな二重数理論にマッピングする。
我々は、ディラック方程式、量子波動関数、自由粒子質量に対する OM-双対を求める。
OM-QM対応の解釈は、測定や観測に依存しない情報の一部を与えるものとして提案される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:18:58 GMT)
Quantum Large Language Models via Tensor Network Disentanglers [0.0] 本稿では,量子コンピューティングと量子インスパイアされた技術を統合することで,Large Language Models(LLM)の性能を向上させる手法を提案する。
我々のアプローチは、自己保持層と多層パーセプトロン層における重み行列を、2つの変分量子回路と量子インスパイアされたテンソルネットワークの組み合わせで置き換えることである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:12:04 GMT)
Prototype-Based Methods in Explainable AI and Emerging Opportunities in the Geosciences [0.0] 我々はプロトタイプベースのXAI文献を,プロトタイプの開発と可視化,プロトタイプの種類,各種学習タスクにおけるプロトタイプの利用という3つのテーマにまとめる。
我々は、XAI手法の開発に使用される標準ベンチマークと地学データセットの違いを強調し、既存のプロトタイプベースのXAI技術を使用したり、修正したりすることで、特定の地学応用がどのような恩恵を受けるかについて議論する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:19:23 GMT)
Privacy-hardened and hallucination-resistant synthetic data generation with logic-solvers [0.0] 我々は,論理解法(SATソルバ)であるGenomatorを導入し,元のデータのプライベートかつ現実的な表現を効率的に生成する。
本稿では、最も複雑かつプライベートな情報であるゲノムデータについて示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:20:21 GMT)
Predicting and Accelerating Nanomaterials Synthesis Using Machine Learning Featurization [0.0] 反射型高エネルギー電子回折データの特徴抽出と機械学習による一般化を行う。
専門家ラベル付きデータの小さなセット(10)で定量的に予測関係を確立し、その後に成長したサンプルでかなりの時間を節約した。
これらの予測は、未解決の試行を回避し、後続のキャラクタリゼーションを減らし、材料合成の制御分解能を改善するためのガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:02:51 GMT)
Precision Multi-Mode Microwave Spectroscopy of Paramagnetic and Rare-Earth Ion Spin Defects in Single Crystal Calcium Tungstate [0.0] 低温におけるCaWO$_4$の低損失単結晶単結晶試料中の希薄イオンスピンアンサンブル欠陥を30$mKまで冷却した実験的検討を行った。
共振器は多数のささやかなギャラリーモードを示し、最高$Q$、最大$3times 107$、損失は$sim 3times 10-8$だった。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 04:36:01 GMT)
Plasmonic Nanocavity to Boost Single Photon Emission from Defects in Thin Hexagonal Boron Nitride [0.0] ナノスケール固体材料に基づく単一光子エミッタは、速い発光速度と強い輝度要求を満たす。
提案したハイブリッドナノフォトニクス構造は、室温での単一光子放出の高速化と大幅な増強を実現する。
提案した量子ナノキャビティ単一光子源は、室温集積型量子フォトニクスネットワークにおいて最重要となることが期待されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:11:59 GMT)
Physical proof of the topological entanglement entropy inequality [0.0] 最近、二次元ギャップ基底状態の位相エンタングルメントエントロピー(TEE)は、普遍的不等式$gamma geq log MathcalD$に従うことが示されている。
ここでは、この不等式のより直接的な証明を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:54:02 GMT)
Persistent currents in ultracold gases [0.0] 空間的に閉じた軌道に流れる永久電流は、メソスコピック物理学において最も象徴的な概念の1つを定義する。
これらは超流動、超伝導体、金属などの固体プラットフォームで研究されている。
物質波ジャイロスコープや干渉計などの新しい技術応用の基礎となる持続電流について論じる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:00:03 GMT)
Pedestrian motion prediction evaluation for urban autonomous driving [0.0] 我々は、従来の動き予測指標の妥当性を決定するために、提供されたオープンソースソリューションを用いて、選択した出版物を解析する。
この視点は、既存の最先端の歩行者運動予測問題の現実的なパフォーマンスを探している、自動運転やロボット工学の潜在的なエンジニアにとって価値があるだろう。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:06:50 GMT)
PROMPTHEUS: A Human-Centered Pipeline to Streamline SLRs with LLMs [0.0] PROMPTHEUSは、システム文学レビューのためのAI駆動パイプラインソリューションである。
システム検索、データ抽出、トピックモデリング、要約など、SLRプロセスの重要な段階を自動化する。
高い精度を実現し、一貫性のあるトピック組織を提供し、レビュー時間を短縮します。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:56:35 GMT)
PLDR-LLM: Large Language Model from Power Law Decoder Representations [0.0] RefinedWebデータセットから小さなバッチサイズ32と$sim$8Bのトークンで、さまざまなレイヤサイズでPLDR-LLMを事前トレーニングします。
ゼロショットおよび少数ショット設定で競合性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:16:19 GMT)
Optimal conversion of Kochen-Specker sets into bipartite perfect quantum strategies [0.0] 各BPQS は、関連する Kochen-Specker (KS) 集合を持つことを示す。
任意のKS集合に対して最小設定数でBPQSを識別するアルゴリズムを導入する。
各次元において、アルゴリズムは既知の最高のBPQSを得るか、少ない入力を持つBPQSを見つける。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:00:24 GMT)
On Functional Dimension and Persistent Pseudodimension [0.0] 本稿では,ReLUネットワーククラスに対する局所的に適用可能な2つの複雑性尺度と,それらの関係について知る。
前者は有限個の点のバッチで計算しやすく、後者はギャップに局所的な境界を与え、二重降下現象の力学の理解を知らせる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:12:21 GMT)
Nonlinear semiclassical spectroscopy of ultrafast molecular polariton dynamics [0.0] 分子偏光子の超高速非線形応答の体系的かつ効率的な記述を可能にする理論的枠組みを導入する。
我々のアプローチは、分子ハミルトニアンと空洞場の半古典的平均場進化に基づいている。
パルスを格納することで、空洞が自由空間では不可能な追加の励起経路を促進することを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:19:13 GMT)
Non-Stationary Long-Term Dynamics via Selected Incomplete Dual Bases [0.0] 我々は、SU(2)コヒーレント状態基底を提案し、時間非依存および時間依存ハミルトニアンの運動方程式を導出する。
本手法は7ビット系の数値シミュレーションにより評価する。
結論は,選択された不完全二元基底法は,短期的・長期的両方のダイナミクスを効率的に捉えることができることを示唆している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:00:36 GMT)
Nitrogen-Vacancy Magnetic Relaxometry of Nanoclustered Cytochrome C Proteins [0.0] 窒素空洞(NV)磁気メトリーは、細胞内の常磁性中心を検出する代替の手段を提供する。
ここではNV磁気緩和法を用いて窒素C(Cyt-C)ナノクラスターを検出する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:57:09 GMT)
Multi-modal Machine Learning Analysis of X-ray Absorption Near-Edge Spectra and Pair Distribution Functions: Performance and Interpretability towards Experimental Design [0.0] 我々はX線吸収近接スペクトル(XANES)と原子対分布関数(PDF)からの情報を組み合わせて、遷移金属酸化物の局所構造と化学情報を取り出す。
具体的には, XANES, PDF, およびこれらを併用したランダム森林モデルを用いて, 遷移金属陽イオンの電荷(酸化)状態, 配位数, 平均近傍結合長の抽出を行った。
XANESのみのモデルは全てのタスクにおいてPDFのみのモデルよりも優れており、XANESからの情報は2つの入力が組み合わされたときに支配されることが多い。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:49:31 GMT)
Multi-Layer Feature Fusion with Cross-Channel Attention-Based U-Net for Kidney Tumor Segmentation [0.0] U-Netベースのディープラーニング技術は、自動化された医用画像セグメンテーションのための有望なアプローチとして登場しつつある。
腎腫瘍の診断のためのCTスキャン画像のエンドツーエンド自動セマンティックセマンティックセグメンテーションのための改良されたU-Netモデルを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:59:51 GMT)
Multi Kernel Estimation based Object Segmentation [0.0] 我々は、オブジェクトセグメンテーションマスクに基づいて2つの異なるカーネルを推定することにより、カーネルGANの機能を拡張するマルチカーネルGANを紹介する。
本手法は,テクスチャベースのパッチFast Fourier Transform (FFT) 計算,詳細ベースのセグメンテーション,ディープラーニングベースのオブジェクトセグメンテーションの3つの方法によって検証されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:44:47 GMT)
Mitigating Vanishing Activations in Deep CapsNets Using Channel Pruning [0.0] カプセルネットワークは、視点不変性による部分的関係の学習において、畳み込みニューラルネットワークを上回っている。
カプセルネットワークにおけるカプセル層の増加はモデル性能を高めると仮定された。
最近の研究により、カプセルネットワークはより深い層のカプセルの活性化が消えるためスケーラビリティが欠如していることが判明した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:28:39 GMT)
Microscopic theory for a minimal oscillator model of exciton-plasmon coupling in hybrids of 2d semiconductors and metal nanoparticles [0.0] 本研究では,2次元励起子からなるハイブリッドにおける励起子-プラズモン相互作用に特化して設計された結合振動子モデルを提案する。
本研究は,空間分散の重要性,すなわちTMDC励起体の非局在性に注目した。
プラズモンとモーメントダークエキシトンの間には強い結合が見られ、弱い結合の明るいエキシトンはスペクトルの3番目のピークとして現れる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:21:59 GMT)
Measuring error rates of mid-circuit measurements [0.0] そこで本研究では,マルチキュービット回路における中間回路計測による誤差発生率を計測する最初のベンチマークプロトコルを提案する。
我々は、20量子ビットの量子コンピュータにおいて、未検出の測定によるクロストークを検出し、排除する。
動的デカップリングにより、そのエラーのどれだけを除去するかを定量化する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:22:43 GMT)
Meaning Typed Prompting: A Technique for Efficient, Reliable Structured Output Generation [0.0] 本稿では,効率的な構造化出力生成技術であるMeaning Typed Prompting (MTP)を紹介する。
表現力のある型定義を利用することで、MTPは出力の明確さを高め、複雑な抽象化への依存を減らす。
本稿では,MPPを実装したフレームワークであるSemantixについて紹介する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:43:50 GMT)
Magnetic Relaxometry of Methemoglobin by Widefield Nitrogen-Vacancy Microscopy [0.0] ヘモグロビン(ヘモグロビン、Hemoglobin、Hb)は、金属タンパク質、クロムタンパク質、グロブリンに分類される多面体タンパク質である。
ヘモグロビン(ヘモグロビン、Hemoglobin、Hb)は、金属タンパク質、クロムタンパク質、グロブリンに分類される多面体タンパク質である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:51:38 GMT)
Linking Edge Modes and Geometrical Clocks in Linearized Gravity [0.0] 線形化重力におけるエッジモードと幾何学時計の関連性を示す。
これらのゲージ固定条件が、アシュテカール・バーベロ接続の観点から、幾何時計の特定の選択をどのように回復するかを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 18:14:21 GMT)
Limits of noisy quantum metrology with restricted quantum controls [0.0] ハイゼンベルク極限 (HL) と標準量子極限 (propto 1/sqrtn$) は、未知のパラメータを量子チャネルの$n$コピーで推定する基本的な極限である。
しかし、QECが利用できない場合に制限量子デバイスでこれらの制限が達成可能であるかどうかは不明である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:31:17 GMT)
Layered LA-MAPF: a decomposition of large agent MAPF instance to accelerate solving without compromising solvability [0.0] 近年,Multi-Agent Path Finding (MAPF) が広く研究されている。
既存のMAPFアルゴリズムの多くは、エージェントがグリッドベースのマップ内の1つのグリッドしか占有していないと仮定している。
textbfLayered LA-MAPFは、幾何学的エージェントを含むMAPFインスタンスをクラスタに分解する手法である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:34:24 GMT)
LLMs left, right, and center: Assessing GPT's capabilities to label political bias from web domains [0.0] 本研究では,現在最先端の大規模言語モデルである OpenAI の GPT-4 が,URLのみに基づいて,ニュースソースの政治的バイアスを正確に分類できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:59:12 GMT)
Interação entre robôs humanoides: desenvolvendo a colaboração e comunicação autônoma [0.0] 本研究は,ヒューマノイドロボットNAOとPepperの相互作用について検討し,教育環境におけるその可能性を強調した。
プログラムされた一連のインタラクションを通じて、ロボットは自律的に行動のコミュニケーションとコーディネートを行う能力を実証した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:55:54 GMT)
Industrially fabricated single-electron quantum dots in Si/Si-Ge heterostructures [0.0] 本稿では,ヘテロ構造をベースとしたスピン量子ビットデバイスと産業用CMOS技術との互換性について報告する。
Infineonの200mm生産ラインで製造されたSi/Si-Ge量子ドットデバイスを、制限された熱予算内に備えている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:40:48 GMT)
In Context Learning and Reasoning for Symbolic Regression with Large Language Models [0.0] LLM(Large Language Models)は、トランスフォーマーベースの機械学習モデルである。
GPT-4がデータセットから方程式のシンボリックレグレッションを実現する方法を示す。
このアプローチは、ターゲット方程式がより複雑である確立されたSRプログラムよりも優れているわけではない。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:50:52 GMT)
ISImed: A Framework for Self-Supervised Learning using Intrinsic Spatial Information in Medical Images [0.0] 本稿では,自己監督学習(SSL)を用いて医用画像の解釈可能な表現を学習するために空間情報を利用することを実証する。
我々は、物理的領域における位置をキャプチャ可能な潜在表現を生成する自己教師対象を確立する。
提案手法は,データの基盤構造を捉える表現を効率的に学習し,下流の分類タスクに転送することができることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:21:39 GMT)
Higher-Order Message Passing for Glycan Representation Learning [0.0] グラフネットワーク(GNN)は、グラフ構造化データの処理と解析のために設計されたディープラーニングモデルである。
本研究は, グリカン構造から潜在空間表現へ特徴を引き出すために, 錯体と高次メッセージパッシングに基づく新しいモデルアーキテクチャを提案する。
これらの改良により、計算グリコ科学のさらなる進歩が促進され、生物学におけるグリカンの役割が明らかにされることを期待している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:32:23 GMT)
Higher-Order Message Passing for Glycan Representation Learning [0.0] グラフネットワーク(GNN)は、グラフ構造化データの処理と解析のために設計されたディープラーニングモデルである。
本研究は, グリカン構造から潜在空間表現へ特徴を引き出すために, 錯体と高次メッセージパッシングに基づく新しいモデルアーキテクチャを提案する。
これらの改良により、計算グリコ科学のさらなる進歩が促進され、生物学におけるグリカンの役割が明らかにされることを期待している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:32:23 GMT)
Hierarchical Simplicity Bias of Neural Networks [0.0] 非平衡ラベル結合と呼ばれる新しい手法を導入し、この単純さのバイアスを階層的なレベルにわたって探索し、拡張する。
提案手法は,トレーニングセット内のラベルとの相関に基づいて,複雑性を増大させる特徴を逐次考慮していることを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 01:41:21 GMT)
Good Parenting is all you need -- Multi-agentic LLM Hallucination Mitigation [0.0] 本研究では,大規模言語モデル(LLM)エージェントによるAI生成コンテンツの幻覚の検出と修正能力について検討する。
各種のプライマリエージェントとレビューエージェントの組み合わせを含む4900回のテスト実行では、高度なAIモデルは幻覚を識別する上でほぼ完璧に正確であることを示した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:12:00 GMT)
Geometry and purity properties of qudit Hamiltonian systems [0.0] 最大エントロピーの原理は有限次元ハミルトン系のアンサンブルの幾何学的性質を研究するために用いられる。
リプキン・メシュコフ・グリク・ハミルトニアンに対して、量子位相図はパラメータ空間の異なる温度値に対して明示的に示される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:26:35 GMT)
Generation of non-classical and entangled light states using intense laser-matter interactions [0.0] 非古典的および絡み合った光状態は、量子力学に基本的な関心を持つ。
レーザー・マター相互作用における完全量子化手法を用いることで、高光子数非古典状態の発生につながることを示す。
強レーザー場を用いた非古典的光工学の将来方向と超高速・量子情報科学への応用の可能性について論じる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:00:43 GMT)
Floquetifying stabiliser codes with distance-preserving rewrites [0.0] ZX計算(ZX calculus)は、量子回路の表現と書き換えのためのグラフィカル言語である。
エラー訂正コードを実装する回路に書き換えを適用することで、その距離を変更できる。
距離を変更せずに誤り訂正符号の変換を可能にする距離保存リライトの概念を定義する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:56:26 GMT)
Finite-temperature properties of string-net models [0.0] 弦-ネットモデルの分割関数を計算し,いくつかの熱力学量について検討する。
熱力学の限界では、分配関数は純粋フラクトンと呼ばれる特別な粒子の寄与によって支配されることを示す。
また、励起に付随するウェグナー・ウィルソンループの挙動を解析し、それらが領域法則に従うことを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:20:00 GMT)
Finite Operator Learning: Bridging Neural Operators and Numerical Methods for Efficient Parametric Solution and Optimization of PDEs [0.0] 本稿では,ニューラルネットワーク,物理情報処理機械学習,およびPDEを解くための標準的な数値法を組み合わせた手法を提案する。
データのない方法で偏微分方程式をパラメトリックに解き、正確な感度を与えることができる。
本研究では, 不均一材料中の定常熱方程式に着目した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:04:49 GMT)
Few-Photon SUPER: Quantum emitter inversion via two off-resonant photon modes [0.0] 本研究では、2つの光子モードを量子エミッタに非共鳴的に結合する拡張Jaynes-Cummingsモデルについて検討する。
我々は、共振子外光子を1つのモードから別のモードに移動させながら、エミッタの完全な反転につながる少数の光子散乱機構を同定する。
我々の結果は、最近開発された量子EmitteRのSwing-UPとして知られる非共鳴量子制御スキームの量子化アナログとして理解することができる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:47:11 GMT)
Feature Homomorphism -- A Cryptographic Scheme For Data Verification Under Ciphertext-Only Conditions [0.0] 本稿では、新しいタイプの準同型:特徴準同型を提案する。
この機能に基づいて、暗号文のみの条件下でのデータ検証のための暗号スキームを導入する。
提案手法は,本論文で概説した要件を満たすアルゴリズム群を設計することを含む。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:30:24 GMT)
Extending Radiowave Frequency Detection Range with Dressed States of Solid-State Spin Ensembles [0.0] 固体スピン欠陥を用いた量子センサは、高周波磁場の検出に優れる。
PDDプロトコルは一般的に適用され、RF信号に対する感度を高める。
連続的動的デカップリングスキームに基づく代替手法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:31:10 GMT)
Exploring Possibilities of AI-Powered Legal Assistance in Bangladesh through Large Language Modeling [0.0] 本研究はバングラデシュの法体系を支援するための特別大規模言語モデル(LLM)の開発を目的とする。
我々は、バングラデシュの法律文書の英文コーパスであるUKIL-DB-ENを作成し、様々な法的行為に関するデータを収集し、取り除いた。
我々はこのデータセット上でGPT-2モデルを微調整し、英語の法的支援を目的としたLPMであるGPT2-UKIL-ENを開発した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:34:59 GMT)
Explaining Explanations in Probabilistic Logic Programming [0.0] ほとんどのアプローチでは、システムはブラックボックスと見なされており、適切な説明を生成することは困難である。
確率論的論理プログラミング(PLP)は、知識表現のための論理プログラミングと不確実性をモデル化する確率を組み合わせたパラダイムである。
本稿では,証明に「選択表現」をラベル付けした PLP の新しいクエリ駆動推論機構の定義に基づく説明法を提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:06:48 GMT)
Experimental preparation of multiphoton-added coherent states of light [0.0] 光子の条件付加は、光量子状態工学にとって重要なツールである。
各種振幅のコヒーレント状態への1, 2, 3光子の付加を実証する。
結果は、複雑な光量子演算の実験的実現への道を開く。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:13:06 GMT)
Evaluation of Study Plans using Partial Orders [0.0] 提案した進路順と実路順のずれと,期待する進路順と実路順の時間差を組み合わせて偏差を検出する(s)
本研究では,学習計画のプロセスモデルと学生のコーステイク行動を部分順序としてモデル化し,部分順序アライメントを計算する。
提案手法は, アーヘン大学における実生活データに基づいて評価した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:34:47 GMT)
Evaluation of Study Plans using Partial Orders [0.0] 提案した進路順と実路順のずれと,期待する進路順と実路順の時間差を組み合わせて偏差を検出する(s)
本研究では,学習計画のプロセスモデルと学生のコーステイク行動を部分順序としてモデル化し,部分順序アライメントを計算する。
提案手法は, アーヘン大学における実生活データに基づいて評価した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:34:47 GMT)
Entanglement in Algebraic Quantum Field Theories [0.0] 本稿では,AQFT を Haag Theory-Araki-Kastler (HAK) の公理で定式化するために必要な数学的構造について述べる。
QFTに対する局所共変法(Locally Covariant approach)と呼ばれる手法を用いて、一般大域的双曲時空への拡張を提供し、これはカテゴリー理論言語を用いてHAK公理を一般時空へ拡張する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:53:30 GMT)
Entanglement dynamics in double Jaynes-Cummings model and intensity-dependent double Jaynes-Cummings model for squeezed coherent thermal states [0.0] 収縮光子と熱光子が絡み合いのダイナミクスに及ぼす影響を観察した。
二重Jaynes-Cummingsモデルの主な特徴は、すべてのサブシステムに対して絡み合う突然死が観察されることである。
相互作用パラメータ、デチューニング、カー非線形性の適切な選択は、動的から絡み合う死を効果的に除去する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 06:18:40 GMT)
Enhancing Generalization in Convolutional Neural Networks through Regularization with Edge and Line Features [0.0] 本稿では、バイアス畳み込みニューラルネットワーク(CNN)に対する新しい正規化手法を提案する。
任意のカーネルを学ぶのではなく、畳み込み層をエッジとライン検出カーネルに制約する。
テスト精度は、4つの挑戦的なきめ細かい分類データセットに対して5-11ポイントのマージンで改善される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:02:32 GMT)
Dynamical formulation of low-frequency scattering in two and three dimensions [0.0] 一次元における散乱の理論は、効果的な非単位量子系に対する時間進化作用素の言葉で表すことができる。
2次元と3次元では、進化作用素から散乱器の散乱特性を抽出する定常散乱の同様の定式化が存在する。
我々は、低周波散乱振幅の明示的な式を求め、その効果を、正確に解ける散乱問題のクラスの研究で検証し、低周波散乱法を考案する際の応用を概説する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:26:58 GMT)
Dynamic graph neural networks for enhanced volatility prediction in financial markets [0.0] 本稿では,グローバル金融市場を動的グラフとして表現するために,グラフニューラルネットワーク(GNN)を用いた新たなアプローチを提案する。
相関に基づくボラティリティ指標とボラティリティ指標を利用することで、テンポラルGATは、ボラティリティ予測の精度を高める有向グラフを構成する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:52:15 GMT)
Dynamic Adaptive Rank Space Exploration for Efficient Sentiment Analysis with Large Language Models [0.0] 大規模言語モデル(LLM)は、ニュアンスド言語パターンをキャプチャすることで感情分析の分野に革命をもたらした。
LLMを用いた効率的な感情分析のための動的適応ランク空間探索(DARSE)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:14:36 GMT)
Dual Space Training for GANs: A Pathway to Efficient and Creative Generative Models [0.0] GAN(Generative Adversarial Networks)は、生成モデルにおいて顕著な進歩を見せている。
本稿では,初期データの双対空間内での動作によってトレーニングプロセスを変換する新しい最適化手法を提案する。
二重空間の符号化された表現に対してGANを訓練することにより、生成過程は大幅に効率が良くなり、人間の認識以外のパターンを明らかにする可能性がある。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:44:13 GMT)
Downtime Required for Bitcoin Quantum-Safety [0.0] Bitcoinが取引を保護するために使っている公開鍵暗号システムを破ることのできる量子デバイスは、10年以内に妥当な確率で期待されている。
量子攻撃はBitcoinネットワーク全体のリスクを冒すことになる。
このような攻撃を防ぐ唯一の方法は、現在使われている公開鍵暗号システム、すなわちECDSAのアップグレードである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:47:10 GMT)
Dhoroni: Exploring Bengali Climate Change and Environmental Views with a Multi-Perspective News Dataset and Natural Language Processing [0.0] 気候変動は世界規模で重要な課題であり、低所得国に不公平に影響を及ぼしている。
バングラデシュは気候変動に対する最も脆弱な国であるにもかかわらず、気候変動とNLPに関するベンガル語研究では研究のギャップが続いている。
この格差に対処するために、ベンガル(バンガラ)の気候変動と環境ニュースデータセットであるDhoroniを紹介します。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:47:05 GMT)
Dephasing-assisted transport in a tight-binding chain with a linear potential [0.0] 境界駆動型強結合鎖におけるバルクデファスティングと線形ポテンシャルの相互作用について検討した。
線形ポテンシャルはノイズがないときにワニエ・スタークの局在を誘導し、デフォーカスは傾きがないときに拡散輸送を誘導する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:18:39 GMT)
Deep Memory Search: A Metaheuristic Approach for Optimizing Heuristic Search [0.0] 本稿では,メタヒューリスティック検索をメモリ駆動プロセスとしてモデル化するDeep Heuristic Search (DHS) という新しい手法を提案する。
DHSは複数の探索層とメモリベースの探索探索機構を用いて、大きな動的探索空間をナビゲートする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:16:49 GMT)
De la Extensión a la Investigación: Como La Robótica Estimula el Interés Académico en Estudiantes de Grado [0.0] UruBotsグループによって行われたこの研究は、ロボット工学に関わる学生が理論的な知識を補強するだけでなく、研究や学術的なコミットメントへの関心を高めていることを示している。
この研究は、ロボティクスが高等教育を強化し、学業や専門職の学生を動機づけていくための、将来の研究の基盤となる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 21:51:31 GMT)
Data Obfuscation through Latent Space Projection (LSP) for Privacy-Preserving AI Governance: Case Studies in Medical Diagnosis and Finance Fraud Detection [0.0] 本稿では、AIガバナンスの強化と、責任あるAIコンプライアンスの確保を目的とした、新しい技術であるLSP(Data Obfuscation through Latent Space Projection)を紹介する。
LSPは機械学習を使用して、機密データを潜在空間に投影し、モデルトレーニングと推論に不可欠な機能を保ちながら効果的に難読化する。
LSPの有効性は、ベンチマークデータセットの実験と、医療がん診断と金融詐欺分析の2つの実世界のケーススタディを通じて検証する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 22:31:03 GMT)
DNAHLM -- DNA sequence and Human Language mixed large language Model [0.0] 本稿では、GPT-2ネットワーク上で訓練されたハイブリッドモデルを紹介し、DNA配列と英文を組み合わせて、DNAモデルにおけるプロンプトと微調整の可能性を探求する。
このモデルはDNA関連ゼロショット予測およびマルチタスク応用においてその効果を実証している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 11:51:09 GMT)
Cutting Through the Confusion and Hype: Understanding the True Potential of Generative AI [0.0] 本稿では,生成型AI(genAI)の微妙な景観について考察する。
それは、Large Language Models (LLMs)のようなニューラルネットワークベースのモデルに焦点を当てている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:18:44 GMT)
Critical Phase Transition in Large Language Models [0.0] 大きな言語モデル(LLM)は素晴らしいパフォーマンスを示しています。
それらの振る舞いを理解するためには、LCMが時折質的な変化を示すという事実を考慮する必要がある。
温度パラメータが変化すると, LLM に相転移が生じることが示唆された。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:32:17 GMT)
Counterdiabatic Driving for Periodically Driven Systems [0.0] 周期的に駆動されるシステムは、量子システムの特性を設計するのに有用な技術として登場した。
我々は、非摂動光子共鳴を捕捉し、高忠実度プロトコルを得る技術を開発した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:20:03 GMT)
Coniferest: a complete active anomaly detection framework [0.0] coniferestはPythonで書かれたオープンソースの汎用アクティブな異常検出フレームワークである。
Active Anomaly Discovery (AAD)とPineforestアルゴリズムは、アクティブな異常検出問題に対処するために利用できる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:19:13 GMT)
Chatting with Bots: AI, Speech Acts, and the Edge of Assertion [0.0] チャットボットをプロトアサータとして扱うことは、アサーションのジレンマに満足な解決をもたらすと我々は主張する。
私たちは、試行錯誤のカテゴリのスペースを作る必要があると論じます。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 02:45:09 GMT)
Capturing long-range memory structures with tree-geometry process tensors [0.0] 時間スケールに分散した時間的相関とメモリを示す量子非マルコフ過程のクラスを導入する。
このようなプロセスの長い範囲の相関は、ほとんど完全に記憶効果から生じる傾向があることを示す。
本稿では,パラダイムスピンボソンモデルの強いメモリダイナミクスを効率的に近似する方法を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 23:37:31 GMT)
Boardwalk Empire: How Generative AI is Revolutionizing Economic Paradigms [0.0] 深層生成モデル — 生成的および深層学習技術の統合 — は、既存のデータを分析することを越えて、新たなデータの作成に長けている。
設計、最適化、革新のサイクルを自動化することで、ジェネレーティブAIは、コア産業プロセスを変えようとしている。
金融セクターでは、リスクアセスメント、トレーディング戦略、予測を変革し、その大きな影響を示している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 03:19:43 GMT)
Audio-to-Score Conversion Model Based on Whisper methodology [0.0] この論文は、音楽情報をトークンに変換するカスタム表記システムである"Orpheus' Score"を革新的に導入している。
実験によると、従来のアルゴリズムと比較して、モデルは精度と性能を大幅に改善した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 17:31:37 GMT)
Artificial Intelligence in Brazilian News: A Mixed-Methods Analysis [0.0] 本研究は,2023年7月1日から2024年2月29日までに発行されたブラジルのメディアから,13の人気ニュースメディアから3,560件のニュース記事を分析した。
この結果から、ブラジルのAIに関するニュースは、職場やプロダクトのローンチにおけるアプリケーションに関連するトピックに支配されていることが明らかになった。
この分析はまた、業界関連企業の存在が顕著に強調され、企業の課題が国内のニュースに強く影響していることを示している。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 20:52:51 GMT)
Applying Data Driven Decision Making to rank Vocational and Educational Training Programs with TOPSIS [0.0] このランキングは、これらの研究を完了した個人の詳細な情報と労働データとの完全なデータベースへの統合を通じて実施されている。
本発明の多基準法は、TOPSISと、各基準の影響を評価するための新しい意思決定支援方法である。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 09:04:41 GMT)
Annotation-Free MIDI-to-Audio Synthesis via Concatenative Synthesis and Generative Refinement [0.0] CoSaRefはMIDI-to-audio合成法であり、MIDI-audioペアデータセットを使わずに開発することができる。
まず、MIDI入力に基づいて結合的な合成を行い、音声のみのデータセットに基づいて訓練された拡散に基づく深層生成モデルを用いて、結果のオーディオをリアルなトラックに洗練する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 08:01:40 GMT)
Ancilla-Assisted Process Tomography with Bipartiete Mixed Separable States [0.0] システム状態とアシラリー状態の絡み合いは、アシラ支援プロセス断層撮影(AAPT)を行うための厳密な要件ではないことが示されている。
我々は、ある状態が量子過程に関する完全な情報を抽出できるならば、その状態は忠実である、という操作的定義を採っている。
操作的意味で忠実であることが保証された2量子状態を構築し、プロセスの平均誤差に基づいて境界を推定する手法を導出する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:37:56 GMT)
Advancing Super-Resolution in Neural Radiance Fields via Variational Diffusion Strategies [0.0] 本稿では,ニューラルレンダリングにおけるビュー一貫性超解像(SR)のための拡散誘導フレームワークを提案する。
提案手法は,既存の2次元SRモデルと,変分スコア蒸留(VSD)やLoRAファインチューニングヘルパなどの高度な技術を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:02:26 GMT)
Accelerated Quantum Circuit Monte-Carlo Simulation for Heavy Quark Thermalization [0.0] 重クォーク熱化をシミュレートする加速量子回路Monte-Carloフレームワークを提案する。
具体的には、1Dおよび2Dおよび等方性と異方性媒体における重クォークの熱化を理想的な量子シミュレータを用いてシミュレートする。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 10:06:13 GMT)
Absence of Bound States for Quantum Walks and CMV Matrices via Reflections [0.0] 量子ウォークとカンテロ-モラル-ベラスケス(CMV)行列に対する点スペクトルの欠如を示す。
ユニタリ・ニア・マチュー作用素の位相における算術的非局所化を導出する。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:32:54 GMT)
AI Future Envisioning with PLACARD [0.0] メアリー・テデスキはドイツで「AI Future Envisioning with PLACARD」を率いた。
3人のカンファレンス参加者が参加し、Sridevi、Paola、CharlesがリモートでWebカンファレンスを開催した。
参加者は今後人工知能(AI)の構想を捉えることを目的として、Futures Studiesのテクニックを紹介した。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 16:31:46 GMT)
A class of modular and flexible covariate-based covariance functions for nonstationary spatial modeling [0.0] 固定された観測可能な空間情報に依存する共分散関数のクラスを示す。
このモデルは、辺標準偏差、幾何学的異方性、滑らかさなど、異なる非定常性源に対する別々の構造を可能にする。
シミュレーション研究を通じて提示されたモデルの性能解析とスイスの降水データへの適用について述べる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 05:53:25 GMT)
A circuit-generated quantum subspace algorithm for the variational quantum eigensolver [0.0] 本稿では,変分量子固有解法(VQE)と量子部分空間技術の組み合わせを提案する。
本手法では,パラメータ化量子回路を,より小さなサブ回路に分割する。
これらのサブ回路を初期状態に順次適用すると、量子部分空間として使用する一連の波動関数が生成され、高精度な基底状態エネルギーが得られる。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 13:16:02 GMT)
A Survey on Deep Learning-based Gaze Direction Regression: Searching for the State-of-the-art [0.0] 本稿では,頭部・眼像からの視線方向ベクトルの回帰に対する深層学習に基づく手法について検討する。
本稿では、入力データ、モデルのアーキテクチャ、モデルの監視に使用される損失関数に焦点をあてた、多数の公開手法について詳述する。
本稿では、視線方向回帰法を訓練し、評価するために使用できるデータセットのリストを示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 15:07:07 GMT)
A Soluble Modified Fermi-Hubbard Model [0.0] その結果得られたフェルミ・ハッバードモデル(英語版)は可溶であり、整数量子ホール抵抗の連続相転移(第2次)と基底状態の第一次相転移(英語版)を示す。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 12:17:31 GMT)
A Novel Reinforcement Learning Model for Post-Incident Malware Investigations [0.0] 本研究は,サイバーインシデント対応時のマルウェア調査を最適化する新たな強化学習モデルを提案する。
偽陰性を低減し、マルウェアシグネチャの進化に現在のプラクティスを適用することにより、法医学的な調査効率を向上させることを目的としている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:55:54 GMT)
A Machine Learning Approach to Trapped Many-Fermion Systems [0.0] 標準的な機械学習技術が基底状態に素早く収束することを示します。
学習中の相互作用の強度を増大させることにより, 高い結合を効率的に処理できることが示される。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 19:37:15 GMT)
A Comparison of Baseline Models and a Transformer Network for SOC Prediction in Lithium-Ion Batteries [0.0] 電池管理システムが充電状態を正確に推定する能力は、この問題を軽減するのに役立つ。
本稿では,SOC推定のためのニューラルネットワークモデルと一般的な回帰モデルを比較した。
BMW i3バッテリの自然運転サイクルから得られたデータを用いて様々な実験を行った結果、決定木は他の全てのモデルよりも優れた結果が得られた。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 14:27:43 GMT)
12-spin-qubit arrays fabricated on a 300 mm semiconductor manufacturing line [0.0] 実用的な量子コンピュータを構築するためのIntelの取り組みは、スケーラブルなスピンキュービットプラットフォームの開発に焦点を当てている。
本稿では、新しい量子テストチップの設計、製造、デモの概要について述べる。
これらの装置は、他の標準的な高体積製造プロセスとともに、浸漬および極端紫外線リソグラフィー(EUV)を用いて製造されている。
論文参考訳(メタデータ) (Tue, 22 Oct 2024 00:05:32 GMT)