YuLan: An Open-source Large Language Model [179.6] 本稿では,12億ドルのパラメータを持つオープンソースの大規模言語モデル (LLM) であるYuLanの開発について述べる。
YuLanのベースモデルは、英語、中国語、多言語テキストを含む多種多様なコーパスから派生した約1.7ドルのトークンで事前訓練されている。
これらの段階にまたがってカリキュラム学習フレームワークを考案し,LLMが知識を習得し易い方法で学習することを支援する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:52:53 GMT)
Web2Code: A Large-scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs [112.9] MLLM(Multimodal large language model)は、画像、ビデオ、オーディオなどのモダリティにおいて顕著な成功を収めている。
現在のMLLMは、Webページのスクリーンショットを理解し、対応するHTMLコードを生成するのに驚くほど貧弱です。
命令チューニングのための大規模Webページ・ツー・コードデータセットを新たに構築したベンチマークであるWeb2Codeを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:59:46 GMT)
One Prompt is not Enough: Automated Construction of a Mixture-of-Expert Prompts [110.9] 大規模言語モデル(LLM)は、言語命令やコンテキスト内デモによって、強力な一般化能力を示す。
命令設計を自動化するために様々な手法が検討されてきたが、探索されたプロンプトを1つの命令に制限した。
我々はMixture-of-Expertパラダイムを採用し、問題空間を一連のサブリージョンに分割する。
地域ごとに専門的な専門家を構築するための2段階のプロセスが開発されている。
専門家1人当たりの命令の地域ベースの共同探索は、それに割り当てられたデモを補完し、相乗効果をもたらす。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:05:08 GMT)
Prompt Refinement with Image Pivot for Text-to-Image Generation [103.6] テキスト・ツー・イメージ生成のための画像Pivot(PRIP)を用いたPrompt Refinementを提案する。
PRIPは精細化処理を2つのデータリッチなタスクに分解する。
これは幅広いベースラインを著しく上回り、ゼロショット方式で見えないシステムに効果的に転送する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:19:24 GMT)
Robust Model-Based Optimization for Challenging Fitness Landscapes [96.6] タンパク質の設計には、フィットネスのランドスケープの最適化が含まれる。
指導法は, トレーニングセットにおける高適合度サンプルの多彩さに課題を呈する。
デザイン空間における「分離」というこの問題は、既存のモデルベース最適化ツールにおいて重大なボトルネックとなっていることを示す。
本稿では,新しいVAEを検索モデルとして利用して問題を克服する手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:33:28 GMT)
EgoGaussian: Dynamic Scene Understanding from Egocentric Video with 3D Gaussian Splatting [95.4] 本稿では,3Dシーンを同時に再構築し,RGBエゴセントリック入力のみから3Dオブジェクトの動きを追跡するEgoGaussianについて紹介する。
我々のアプローチでは、人間の活動の動的な性質を活用するクリップレベルのオンライン学習パイプラインを採用している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:39:36 GMT)
UniGen: A Unified Framework for Textual Dataset Generation Using Large Language Models [88.2] UniGenは、多様で正確で高度に制御可能なデータセットを作成するように設計された包括的なフレームワークである。
データ多様性を強化するため、UniGenは属性誘導生成モジュールとグループチェック機能を備えている。
大規模な実験は、UniGenによって生成されたデータの優れた品質を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:12:28 GMT)
Covert Malicious Finetuning: Challenges in Safeguarding LLM Adaptation [86.1] Black-boxファインタニングは、最先端の言語モデルをユーザのニーズに適応するための、新たなインターフェースである。
本研究では,検出を回避しながら,モデル安全性を損なう手法である隠れ悪意のある微調整を導入する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:05:46 GMT)
Can LLMs Keep a Secret? Testing Privacy Implications of Language Models via Contextual Integrity Theory [82.7] 私たちは、最も有能なAIモデルでさえ、人間がそれぞれ39%と57%の確率で、プライベートな情報を公開していることを示しています。
我々の研究は、推論と心の理論に基づいて、新しい推論時プライバシー保護アプローチを即時に探求する必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:27:10 GMT)
Understanding and Mitigating Language Confusion in LLMs [77.0] 我々は,既存の英語および多言語プロンプトを用いた15の型的多様言語の評価を行った。
Llama Instruct と Mistral のモデルでは,言語的混乱の度合いが高いことがわかった。
言語混乱は,数発のプロンプト,多言語SFT,選好調整によって部分的に緩和できることがわかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:03:51 GMT)
Revisiting Backdoor Attacks against Large Vision-Language Models [76.4] 本稿では,LVLMの命令チューニングにおけるバックドア攻撃の一般化可能性について実験的に検討する。
以上に基づいて,既存のバックドア攻撃を修正した。
本稿では,従来のシンプルなバックドア戦略でさえ,LVLMに深刻な脅威をもたらすことを指摘する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:21:13 GMT)
Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.6] 本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:14:13 GMT)
Interactive Topic Models with Optimal Transport [75.3] ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:57:27 GMT)
ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.9] 非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:28:38 GMT)
Direct Preference Knowledge Distillation for Large Language Models [73.5] 大規模言語モデル(LLM)のためのDPKD(Direct Preference Knowledge Distillation)を提案する。
我々はLLMのKDを、暗黙の報酬と逆のKL分岐からなる最適化と目的の2段階に再構成する。
実験と理論的解析により,KDにおける暗黙の報酬と出力選好の価値と効果を証明した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:23:40 GMT)
Apollo: A Lightweight Multilingual Medical LLM towards Democratizing Medical AI to 6B People [72.5] 我々は6つの最も広く話されている言語にまたがる医療用LLMの開発を目指しており、世界人口は610億人である。
この取り組みは、ApolloCorpora多言語医療データセットとXMedBenchベンチマークの作成で頂点に達した。
トレーニングコーパス、コード、モデルの重み付け、評価ベンチマークをオープンソースにします。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:16:24 GMT)
SciBench: Evaluating College-Level Scientific Problem-Solving Abilities of Large Language Models [70.6] 拡張ベンチマークスイートSciBench for Large Language Model (LLM)を導入する。
SciBenchには、数学、化学、物理学の分野から、さまざまな大学レベルの科学的問題を含むデータセットが含まれている。
その結果、現在のLLMは満足のいく性能を達成できないことが判明し、全体のスコアは43.22%に過ぎなかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:24:13 GMT)
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.5] 我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:11:48 GMT)
Evaluating Human Alignment and Model Faithfulness of LLM Rationale [66.8] 帰属的有理は帰属的有理数よりも人称有理数とよく一致していることを示す。
さらに,従来の研究で特定されたプロンプトベース手法の忠実度制限は,その崩壊予測と関係があることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 20:06:30 GMT)
Structure-aware World Model for Probe Guidance via Large-scale Self-supervised Pre-train [66.4] 心エコー法を成功させるには、二次元平面上の構造と三次元空間における平面間の空間的関係を徹底的に理解する必要がある。
心構造を意識した世界モデルを取得するための,大規模自己指導型事前学習手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:54:44 GMT)
Segment Anything without Supervision [65.9] 高速かつ自動的な全画像分割のためのUnsupervised SAM(UnSAM)を提案する。
UnSAMは、視覚シーンの階層構造を「発見」するために、分割・コンカ戦略を利用する。
教師付きSAMは自己教師付きラベルの恩恵を受けることができることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:47:32 GMT)
MetaDesigner: Advancing Artistic Typography through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.8] MetaDesignerは、Large Language Models(LLM)の強みを活用して、ユーザエンゲージメントを中心としたデザインパラダイムを推進することによって、芸術的なタイポグラフィに革命をもたらす。
総合的なフィードバックメカニズムは、マルチモーダルモデルとユーザ評価からの洞察を活用して、設計プロセスを反復的に洗練し、拡張する。
実証的な検証は、MetaDesignerが様々なWordArtアプリケーションに効果的に機能し、審美的に魅力的でコンテキストに敏感な結果を生み出す能力を強調している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:58:26 GMT)
Belief Revision: The Adaptability of Large Language Models Reasoning [63.0] 本稿では,LMの信念修正能力をテストするための新しいデータセットであるBelief-Rを紹介する。
このタスクは、人間が事前の推論を抑える方法にインスパイアされ、新しく提案されたデルタ推論フレームワーク内のLMを評価する。
様々なプロンプト戦略にまたがる$sim$30 LMを評価した結果,LMは一般的に,新たな情報に反応して信念を適切に修正するのに苦慮していることがわかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:09:36 GMT)
AutoMix: Automatically Mixing Language Models [62.5] 大規模言語モデル(LLM)は、さまざまなサイズと構成のクラウドAPIプロバイダから利用可能になった。
より小さなLMからの出力の近似精度に基づいて,クエリを大規模LMに戦略的にルーティングする手法であるAutomixを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:57:05 GMT)
Modeling State Shifting via Local-Global Distillation for Event-Frame Gaze Tracking [61.4] 本稿では,イベントデータとフレームデータの両方を用いた受動的視線推定の問題に取り組む。
我々は、現在の状態からいくつかの事前登録されたアンカー状態に移行する状態の定量化として、視線推定を再構成する。
大規模視線推定ネットワークを直接学習する代わりに,地域の専門家グループと学生ネットワークを連携させることにより,一般化能力の向上を図る。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:13:18 GMT)
Stochastic Zeroth-Order Optimization under Strongly Convexity and Lipschitz Hessian: Minimax Sample Complexity [59.8] 本稿では,アルゴリズムが検索対象関数の雑音評価にのみアクセス可能な2次スムーズかつ強い凸関数を最適化する問題を考察する。
本研究は, ミニマックス単純後悔率について, 一致した上界と下界を発達させることにより, 初めて厳密な評価を行ったものである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:56:22 GMT)
Networked Communication for Decentralised Agents in Mean-Field Games [59.0] 平均フィールドゲームフレームワークにネットワーク通信を導入する。
私たちのアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを示しています。
さらに、ネットワーク化されたアプローチには、中央集権型と独立型の両方の選択肢よりも大きなアドバンテージがあることも示します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:39:10 GMT)
STLLaVA-Med: Self-Training Large Language and Vision Assistant for Medical [58.8] STLLaVA-Medは、医療ビジュアルインストラクションデータを自動生成できるポリシーモデルを訓練するために設計されている。
STLLaVA-Medの有効性とデータ効率を3つの主要な医用視覚質問応答(VQA)ベンチマークで検証した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:01:23 GMT)
Bringing Generative AI to Adaptive Learning in Education [58.7] 我々は、生成AIと適応学習の交差研究に光を当てた。
我々は、この連合が教育における次の段階の学習形式の発展に大きく貢献するだろうと論じている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:43:07 GMT)
Detection and Measurement of Syntactic Templates in Generated Text [58.1] モデルにおける一般的な反復を特徴付けるための構文的特徴の解析を行う。
モデルでは、下流のタスクにおいて、人間の参照テキストよりも高いレートでテンプレートテキストを生成する傾向にある。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:34:23 GMT)
LLaRA: Supercharging Robot Learning Data for Vision-Language Policy [56.5] 大規模言語モデル(LLM)は、広い世界知識と強力な推論スキルを備えており、ドメイン間の多様なタスクに対処することができる。
LLaRA:Large Language and Robotics Assistantは,ロボットの行動ポリシーを会話として定式化するフレームワークである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:59:12 GMT)
Molecular Facts: Desiderata for Decontextualization in LLM Fact Verification [56.4] 我々は、完全な原子的事実は正しい表現ではなく、分子的事実の2つの基準を定義する。
本稿では,分子事実を自動生成するための基準手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:43:48 GMT)
Transcendence: Generative Models Can Outperform The Experts That Train Them [55.9] 生成モデルがデータを生成する専門家の能力を超える能力を達成するとき、超越現象を研究する。
我々は,自動回帰変換器をトレーニングして,ゲームスクリプティングからチェスを学習し,トレーニングされたモデルが,データセットのすべてのプレイヤーよりも優れたパフォーマンスが得られることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:28:27 GMT)
EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation [54.3] CVPR 2024のEgoVis Challengesには、Ego4Dチャレンジの5トラックとEPIC-Kitchensチャレンジの3トラックが含まれています。
ビデオ言語2towerモデルを構築し,厳密に整理された自我中心型ビデオデータを活用することにより,EgoVideoという新しい基礎モデルを導入する。
このモデルは、エゴセントリックなビデオの特徴に特化して設計されており、当社のコンペティションへの強力なサポートを提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:50:19 GMT)
Virtual Context: Enhancing Jailbreak Attacks with Special Token Injection [54.1] 本稿では、以前LLMセキュリティで見過ごされていた特別なトークンを活用して、ジェイルブレイク攻撃を改善する仮想コンテキストを提案する。
総合的な評価によると、仮想コンテキストによるジェイルブレイク攻撃は、4つの広く使われているジェイルブレイク手法の成功率を約40%向上させることができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:35:54 GMT)
Generative AI-Driven Human Digital Twin in IoT-Healthcare: A Comprehensive Survey [53.7] IoT(Internet of Things)は、特にヘルスケアにおいて、人間の生活の質を大幅に向上させる。
ヒトデジタルツイン(HDT)は、個体の複製を包括的に特徴付ける革新的なパラダイムとして提案されている。
HDTは、多用途で生き生きとした人間のデジタルテストベッドとして機能することで、医療監視の応用を超えて、IoTヘルスの強化を図っている。
最近、生成人工知能(GAI)は、高度なAIアルゴリズムを利用して、多種多様なデータを自動的に生成、操作、修正できるため、有望なソリューションである可能性がある。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:49:52 GMT)
Towards Stable and Storage-efficient Dataset Distillation: Matching Convexified Trajectory [53.4] ディープラーニングと大規模言語モデルの急速な進化により、トレーニングデータの需要が指数関数的に増加した。
MTT(Matching Training Trajectories)は、専門家ネットワークのトレーニングトラジェクトリを、合成データセットで実データ上に複製する、顕著なアプローチである。
そこで本研究では,学生の軌道に対するより良いガイダンスを提供することを目的として,MCT (Matching Convexified Trajectory) と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:06:46 GMT)
When Search Engine Services meet Large Language Models: Visions and Challenges [53.3] 本稿では,大規模言語モデルと検索エンジンの統合が,両者の相互に利益をもたらすかどうかを詳細に検討する。
LLM(Search4LLM)の改良と,LLM(LLM4Search)を用いた検索エンジン機能の向上という,2つの主要な領域に注目した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:52:13 GMT)
Stochastic Optimal Control Matching [53.2] 最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。
この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。
実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:37:36 GMT)
Logical Closed Loop: Uncovering Object Hallucinations in Large Vision-Language Models [53.0] オブジェクト幻覚(Object Hallucination)とは、LVLMが画像に存在しない物体を主張する現象である。
本稿では,物体の幻覚検出と緩和,すなわちLogicCheckGPTのための論理閉ループベースのフレームワークを提案する。
プラグアンドプレイ法として、既存のすべてのLVLMにシームレスに適用することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:20:22 GMT)
Kolmogorov-Smirnov GAN [52.4] 我々は、KSGAN(Kolmogorov-Smirnov Generative Adversarial Network)という新しい深層生成モデルを提案する。
既存のアプローチとは異なり、KSGANはKS距離の最小化として学習プロセスを定式化している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:30:14 GMT)
A Unified Data Augmentation Framework for Low-Resource Multi-Domain Dialogue Generation [52.1] 現在の最先端の対話システムは、広範なトレーニングデータセットに大きく依存している。
我々はtextbfAMD$2$G と呼ばれる textbfMulti-textbfDomain textbfDialogue textbfGeneration のための新しいデータ textbfAugmentation フレームワークを提案する。
AMD$2$Gフレームワークは、データ拡張プロセスと、ドメインに依存しないトレーニングとドメイン適応トレーニングという2段階のトレーニングアプローチで構成されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:58:11 GMT)
Cost-aware Bayesian optimization via the Pandora's Box Gittins index [51.7] 我々は,コストを意識したベイズ最適化と,経済学の意思決定問題であるPandoraのBox問題との間に,従来未解決の接続関係を構築した。
我々の研究は、Gittinsインデックス理論からベイズ最適化への技術統合に向けた第一歩となる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:20:13 GMT)
Mixture of In-Context Experts Enhance LLMs' Long Context Awareness [51.7] 大規模言語モデル(LLM)は、異なる文脈の位置に対する不均一な認識を示す。
本稿では,この課題に対処するため,"Mixture of In-Context Experts' (MoICE)"という新しい手法を提案する。
MoICEには2つの重要なコンポーネントがある: LLM内の各アテンションヘッドに統合されたルータと、軽量なルータのみのトレーニング最適化戦略である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:46:41 GMT)
Breaking the Script Barrier in Multilingual Pre-Trained Language Models with Transliteration-Based Post-Training Alignment [50.3] 転送性能は、低リソースのターゲット言語が高リソースのソース言語とは異なるスクリプトで書かれている場合、しばしば妨げられる。
本論文は,この問題に対処するために翻訳を用いた最近の研究に触発されて,翻訳に基づくポストプレトレーニングアライメント(PPA)手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:59:24 GMT)
PruningBench: A Comprehensive Benchmark of Structural Pruning [50.2] textitPruningBenchと呼ばれる、構造的プルーニングのための最初の包括的なベンチマークを提示する。
PruningBenchは、多様な構造的プルーニング技術の有効性を評価するために、統一的で一貫したフレームワークを使用している。
将来の刈り取り方法の実装を容易にするための実装が容易なインターフェースを提供し、その後の研究者が自身の作業をリーダボードに組み込めるようにします。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:03:03 GMT)
Methodology to Deploy CNN-Based Computer Vision Models on Immersive Wearable Devices [49.9] 本稿では,コンピュータ上でCNNモデルをトレーニングし,最適化した重量行列をヘッドセットに転送することで,ARヘッドセットにCNNモデルをデプロイする方法を提案する。
我々は、PyTorchを用いてMNISTデータセット上でLeNet-5 CNNモデルをトレーニングし、HoloLens ARヘッドセットにデプロイすることで、この手法を実証する。
その結果,コンピュータの性能と同様,約98%の精度を維持していることがわかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:08:10 GMT)
Comprehensive Generative Replay for Task-Incremental Segmentation with Concurrent Appearance and Semantic Forgetting [49.9] 一般的なセグメンテーションモデルは、異なる画像ソースからの様々なオブジェクトを含む様々なタスクに対して、ますます好まれている。
画像とマスクのペアを合成することで外観と意味の知識を復元する包括的生成(CGR)フレームワークを提案する。
漸進的タスク(心身、基礎、前立腺のセグメンテーション)の実験は、同時出現と意味的忘れを緩和する上で、明らかな優位性を示している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:05:58 GMT)
SafeAligner: Safety Alignment against Jailbreak Attacks via Response Disparity Guidance [48.8] SafeAlignerは、ジェイルブレイク攻撃に対する防御を強化するためのデコード段階で実装された方法論である。
安全性を高めるために訓練されたセンチネルモデルと、よりリスクの高い応答を生成するように設計されたイントルーダモデルである。
SafeAlignerは有害なトークンの発生を低減しつつ、有益トークンの可能性を高めることができることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:06:59 GMT)
Explore as a Storm, Exploit as a Raindrop: On the Benefit of Fine-Tuning Kernel Schedulers with Coordinate Descent [48.8] カーネルの品質を向上しながら,Ansorの検索時間を短縮する可能性を示す。
このアプローチを、Ansorが生成した最初の300のカーネルに適用する。
この結果は20の有名なディープラーニングモデルで再現されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:34:22 GMT)
The SIFo Benchmark: Investigating the Sequential Instruction Following Ability of Large Language Models [48.5] 本稿では,複数の命令を逐次的に追従するモデルの性能を評価するためのベンチマークを提案する。
本ベンチマークでは, 4つのタスク(テキスト修正, 質問応答, 数学, セキュリティルール)を用いて, 逐次的命令の異なる側面を評価する。
オープンソースとクローズドソースの両方で人気のあるLCMを評価した結果、SIFoタスクでは、より最近の大規模モデルの方が、より古いモデルやより小さなモデルよりも大幅に優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:34:26 GMT)
Reduce, Reuse, Recycle: Is Perturbed Data better than Other Language augmentation for Low Resource Self-Supervised Speech Models [48.4] 自己教師付き表現学習(SSRL)は、音素認識を含むタスクの教師付きモデルよりも優れた性能を示した。
SSRLモデルのトレーニングは、十分な事前学習データが入手できない低リソース言語にとって課題となる。
本稿では,低リソース環境下でのSSRLモデルの事前学習にピッチ変動,雑音付加,アクセント付きターゲット言語,その他の言語音声を用いることを提案し,音素認識の評価を行う。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:45:32 GMT)
Data-Driven Lipschitz Continuity: A Cost-Effective Approach to Improve Adversarial Robustness [48.0] 我々は、ディープニューラルネットワーク(DNN)の敵攻撃に対する堅牢性を証明するために、リプシッツ連続性の概念を探求する。
本稿では,入力領域を制約範囲に再マップし,リプシッツ定数を低減し,ロバスト性を高める新しいアルゴリズムを提案する。
本手法は,ロバストベンチリーダーボード上のCIFAR10,CIFAR100,ImageNetデータセットに対して,最も堅牢な精度を実現する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:10:36 GMT)
Watermarking Language Models for Many Adaptive Users [47.9] 証明可能な保証付き言語モデルの透かし方式について検討する。
モデル生成テキストを個々のユーザに対してトレース可能なマルチユーザ透かしを導入する。
検出不能なChrist, Gunn, Zamir (2024) のゼロビットスキームが適応的に堅牢であることを証明する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:15:59 GMT)
SampleAttention: Near-Lossless Acceleration of Long Context LLM Inference with Adaptive Structured Sparse Attention [47.6] 大きな言語モデル(LLM)は、非常に長いコンテキストウィンドウをサポートするようになった。
バニラの注意の二次的な複雑さは、TTFT(Time-to-First-Token)レイテンシを著しく長くする。
適応型構造とほぼロスレスなスパースアテンションであるSampleAttentionを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:55:17 GMT)
Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and Challenges [47.5] データ強化(DA)は、データ収集を必要とせずにトレーニング例を多様化することにより、モデルパフォーマンスを向上させる重要な手法として登場した。
本調査では,大規模言語モデル(LLM)がDAに与える影響,特に自然言語処理(NLP)以降の文脈において,それらが持つ固有の課題と機会に対処する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:35:38 GMT)
Manipulate-Anything: Automating Real-World Robots using Vision-Language Models [47.2] 実世界のロボット操作のためのスケーラブルな自動生成手法であるManipulate-Anythingを提案する。
Manipulate-Anythingは、特権のある状態情報や手書きのスキルなしで現実世界の環境で動作でき、静的オブジェクトを操作できる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:13:22 GMT)
WellDunn: On the Robustness and Explainability of Language Models and Large Language Models in Identifying Wellness Dimensions [46.6] 言語モデル (LM) は, 予後のリスクを高めることで, 臨床実践におけるモデルの有用性の十分なリトマステストにはならない, メンタルヘルスの分野で提案されている。
ウェルネス次元(WD)の同定におけるLMの妥当性と説明性に着目した評価設計を提案する。
LM/LLMの4つの驚くべき結果が明らかになった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:08:12 GMT)
Mining Open Semantics from CLIP: A Relation Transition Perspective for Few-Shot Learning [46.3] そこで本稿では,イメージ・アンカー関係から画像・ターゲット関係に遷移して予測を行うアンカーとしてオープンセマンティクスを抽出することを提案する。
本手法は, 数ショットの分類設定を考慮し, 従来の最先端技術に対して良好に機能する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:59:01 GMT)
Revisiting MoE and Dense Speed-Accuracy Comparisons for LLM Training [46.0] Mixture-of-Experts (MoE)は、計算コストを一定に保ちながら、モデルキャパシティを増大させることにより、パフォーマンスの向上を享受する。
我々は高密度から高密度までのステップタイムを健全な範囲で増加させる3Dシャーディング法を採用した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:39:45 GMT)
Multimodal Prototyping for cancer survival prediction [45.6] ギガピクセルヒストロジー全体スライディング画像(WSI)と転写学的プロファイルを組み合わせたマルチモーダルサバイバル法は,患者の予後と成層化に特に有望である。
現在のアプローチでは、WSIを小さなパッチ(>10,000パッチ)にトークン化し、トランスクリプトミクスを遺伝子グループに分割し、結果を予測するためにTransformerを使用して統合する。
このプロセスは多くのトークンを生成し、これは注意を計算するための高いメモリ要求をもたらし、ポストホック解釈可能性分析を複雑にする。
我々のフレームワークは、新しい解釈可能性解析を解き放ちながら、はるかに少ない計算で最先端の手法より優れている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 20:37:01 GMT)
Viewport Prediction for Volumetric Video Streaming by Exploring Video Saliency and Trajectory Information [45.3] 本稿では,Saliency and Trajectory Viewport Prediction (STVP) という新しいアプローチを提案し,提案する。
ボリュームビデオストリーミングにおけるビューポート予測の精度の向上を目的としている。
特に,計算複雑性を低減するために,新しいサンプリング手法であるUniform Random Smpling (URS)を導入する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:04:21 GMT)
SpotlessSplats: Ignoring Distractors in 3D Gaussian Splatting [44.4] 3D Gaussian Splatting (3DGS)は、3D再構成のための有望な技術であり、効率的なトレーニングとレンダリング速度を提供する。
現在の手法では、3DGSのビュー間の一貫性の仮定を満たすために、高度に制御された環境が必要である。
SpotlessSplatsは、トレーニング済みと汎用の機能と堅牢な最適化を併用して、過渡的障害を効果的に無視するアプローチである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:07:11 GMT)
ToolBeHonest: A Multi-level Hallucination Diagnostic Benchmark for Tool-Augmented Large Language Models [43.9] ツール拡張大型言語モデル(LLM)は、現実世界のアプリケーションに急速に統合されている。
我々はLLMの幻覚を深さと幅の2つの視点で評価する。
ツールセットの特徴に基づいた,必要なツールや潜在的なツール,限定的な機能ツールの3つのシナリオについて検討する。
結果は、ToolBHベンチマークで提示された重要な課題を示している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:03:30 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [43.6] 本稿では,知識グラフタスクに大規模言語モデル(LLM)を活用する新しいフレームワークである知識グラフ大言語モデル(KG-LLM)を紹介する。
まず、構造化知識グラフデータを自然言語に変換し、次にこれらの自然言語プロンプトを微調整 LLM に変換する。
KG-LLMフレームワークの有効性を示すため,Flan-T5,LLaMa2,Gemmaの3つのLLMを微調整した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:03:33 GMT)
Evaluating the Social Impact of Generative AI Systems in Systems and Society [43.3] テキスト(コードを含む)、画像、オーディオ、ビデオなどを含むモダリティにまたがる生成AIシステムは、幅広い社会的影響を持つ。
これらの影響を評価するための公式な基準や、どの影響を評価するべきかの基準はありません。
本稿では,任意のモダリティに対して基本生成型AIシステムを評価するための,標準的なアプローチに向けたガイドを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:50:57 GMT)
On the Trade-off between Flatness and Optimization in Distributed Learning [42.6] 本稿では,分散学習のための勾配差アルゴリズムの性能を評価・比較するための理論的枠組みを提案する。
このことは、分散学習戦略がローカライズから逃れることができることを示している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:46:08 GMT)
MKRAG: Medical Knowledge Retrieval Augmented Generation for Medical Question Answering [42.5] 大規模言語モデル(LLM)は、医療質問応答(QA)のようなドメイン固有のタスクでよく機能しないことが多い。
外部知識ベースから医学的事実を抽出し,LSMのクエリプロンプトに注入するための総合的検索手法を提案する。
Vicuna-7Bは44.46%から48.54%の精度向上を示した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:21:45 GMT)
A perturbative approach to the solution of the Thirring quantum cellular automaton [42.2] Thirring Quantum Cellular Automaton (QCA) は、ディラックセルオートマトンの一段階に従って進化する局所フェルミオンモードの離散時間ダイナミクスと、最も一般的なオンサイト数保存相互作用を記述し、量子場理論におけるTirrringモデルのQCAとして機能する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:44:10 GMT)
Forecasting Electricity Market Signals via Generative AI [42.0] 本稿では,電気市場信号の確率予測のための生成人工知能アプローチを提案する。
非パラメトリック時系列のWiener-Kallianpur革新表現に触発されて、弱いイノベーションオートエンコーダアーキテクチャと新しいディープラーニングアルゴリズムを提案する。
提案手法の有効性は, 理想的な訓練条件下では, 生成したサンプルが基底真理と同じ条件付き確率分布を持つことを証明することによって確立される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:17:12 GMT)
FlowVQA: Mapping Multimodal Logic in Visual Question Answering with Flowcharts [41.8] FlowVQAは、フローチャートをビジュアルコンテキストとして推論することで、視覚的質問応答型マルチモーダル言語モデルの能力を評価することを目的とした、新しいベンチマークである。
我々は,様々な戦略を用いて,オープンソースおよびプロプライエタリなマルチモーダル言語モデルのスイートに対して,徹底的なベースライン評価を行う。
この結果は、マルチモーダルモデリングの分野を前進させる重要なツールとしてのベンチマークの可能性を強調している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:43:46 GMT)
MotionClone: Training-Free Motion Cloning for Controllable Video Generation [41.6] MotionCloneはトレーニング不要のフレームワークで、参照ビデオからのモーションクローンによってテキスト・ツー・ビデオ生成を制御することができる。
実験により、MotionCloneは、グローバルカメラモーションとローカルオブジェクトモーションの両方に熟練度を示すことが示された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:08:19 GMT)
Auto Cherry-Picker: Learning from High-quality Generative Data Driven by Language [41.4] 拡散に基づくモデルは、様々なレイアウトで高品質な画像を生成する大きな可能性を示している。
本稿では,高品質なマルチモーダルトレーニング例を生成する新しいフレームワークであるAuto Cherry-Pickerを紹介する。
特に,合成レイアウトと画像スコア(CLIS, Composite Layout and Image Score)を新たに提案し,生成した画像の公平な評価を行う。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:53:18 GMT)
CMMaTH: A Chinese Multi-modal Math Skill Evaluation Benchmark for Foundation Models [41.0] CMMaTHという中国のマルチモーダル数学スキル評価ベンチマークを提案する。
我々は,CMMaTHデータセットと統合したオープンソースツール GradeGPT を構築し,安定,迅速,低コストなモデル評価を容易にする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:35:51 GMT)
ANLS* -- A Universal Document Processing Metric for Generative Large Language Models [40.9] 本稿ではANLS*と呼ばれる生成モデルを評価するための新しい指標を提案する。
ANLS*メトリックは、既存のANLSメトリクスをドロップ・イン・リプレースとして拡張し、以前報告されたANLSスコアと互換性がある。
また、SFTと呼ばれる文書のプロンプトを生成する新しい手法を、LATINなどの他のプロンプト技術に対してベンチマークする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:49:39 GMT)
Exploring the Dynamics between Cobot's Production Rhythm, Locus of Control and Emotional State in a Collaborative Assembly Scenario [40.9] コボットの生成リズムが経験的制御軌跡(ELoC)および31人の感情状態に及ぼす影響について検討した。
結果は、その人の心理的特徴を考慮し、差別化され、最適な相互作用体験を提供する必要があることを示しているように思われる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:16:13 GMT)
MathChat: Converse to Tackle Challenging Math Problems with LLM Agents [40.2] MathChatは、数学問題用に設計された会話型問題解決フレームワークである。
MathChatは従来のツール利用促進手法を6%改善できることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:26:27 GMT)
Behavior Generation with Latent Actions [40.2] 本稿ではベクトル量子化動作変換器(VQ-BeT)について述べる。
VQ-BeTは、多モード動作予測、条件生成、部分観察を扱う振る舞い生成のための汎用モデルである。
本稿では,VQ-BeTによる動作モードのキャプチャ能力の向上と,拡散ポリシに対する推論速度の5倍の高速化を実証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:15:33 GMT)
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model [39.6] 初期ビジョン言語Fusion-based SAM (EVF-SAM) について紹介する。
EVF-SAMは、マルチモーダルプロンプト(画像とテキスト)を利用する、シンプルだが効果的な参照セグメンテーション手法である
BEIT-3をベースとしたEVF-SAMにより,RefCOCO/+/gにおける表現セグメンテーションの最先端性能が得られた。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:38:18 GMT)
MM-Instruct: Generated Visual Instructions for Large Multimodal Model Alignment [39.4] MM-Instructは、多種多様な高品質な視覚命令データの大規模なデータセットである。
大規模マルチモーダルモデルの命令追従能力を向上させるように設計されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:25:27 GMT)
Are LLM-based Evaluators Confusing NLG Quality Criteria? [39.1] 本研究では,従来の研究と異なる基準で,11の共通点を対象とした明確な階層分類システムを提案する。
行動検査にインスパイアされた我々は、異なるLCMの評価行動のきめ細かい分析のために、18種類のアスペクトターゲット摂動攻撃を精巧に設計した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:53:35 GMT)
Finite basis Kolmogorov-Arnold networks: domain decomposition for data-driven and physics-informed problems [38.5] Kolmogorov-Arnoldネットワーク(KAN)は、機械学習のための多層パーセプトロン(MLP)に代わるものとして近年注目を集めている。
本研究では,数個の小さなkanを並列に訓練し,マルチスケール問題に対する正確な解を与えるkanの領域分解法を開発した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:13:43 GMT)
CUPID: Improving Battle Fairness and Position Satisfaction in Online MOBA Games with a Re-matchmaking System [38.4] CUPIDは、フェアネスとプレイヤーの満足度の両方を改善するために、チームとポジションの割り当てを最適化することを目的としている。
マッチング品質の最小レベルを確保するために、事前フィルタリングのステップを組み込んだ後、事前マッチの勝利率予測モデルが続く。
CUPIDの有効性を検証するために、2つの大規模な実世界のMOBAデータセットを用いて実験を行った。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:09:55 GMT)
DiffuseDef: Improved Robustness to Adversarial Attacks [38.3] 敵の攻撃は、事前訓練された言語モデルを使って構築されたシステムにとって重要な課題となる。
本稿では,拡散層をエンコーダと分類器のデノイザとして組み込んだDiffuseDefを提案する。
推測中、敵対的隠蔽状態はまずサンプルノイズと組み合わせられ、次に反復的に復調され、最後にアンサンブルされ、堅牢なテキスト表現が生成される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:36:17 GMT)
From the Least to the Most: Building a Plug-and-Play Visual Reasoner via Data Synthesis [38.3] 視覚言語モデル(VLM)における多段階推論について検討する。
まず、質問のステップをサブクエストにインターリーブする、最小から最短の視覚的推論パラダイムを導入する。
画像に対する質問や多段階の推論経路を自動生成する新しいデータ合成手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:04:10 GMT)
HouseCrafter: Lifting Floorplans to 3D Scenes with 2D Diffusion Model [38.1] フルサイズの3D屋内シーン(例えば家)にフロアプランを持ち上げる新しいアプローチであるHouseCrafterを紹介します。
我々の重要な洞察は、Webスケールの画像に基づいて訓練された2次元拡散モデルを適用して、シーンの異なる場所で一貫した多視点色(RGB)と深度(D)画像を生成することである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:39:38 GMT)
Non-unitary Coupled Cluster Enabled by Mid-circuit Measurements on Quantum Computers [37.7] 本稿では,古典計算機における量子化学の柱である結合クラスタ(CC)理論に基づく状態準備法を提案する。
提案手法は,従来の計算オーバーヘッドを低減し,CNOTおよびTゲートの数を平均で28%,57%削減する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:03:59 GMT)
Operator World Models for Reinforcement Learning [37.7] 政策ミラーDescentは強化学習(RL)に直接適用されない
本研究では,条件付き平均埋め込みを用いた環境のワールドモデル学習に基づく新しいアプローチを提案する。
次に、RLの演算的定式化を利用して、行列演算による閉形式でこの量で作用値関数を表現する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:05:47 GMT)
DISCO: Efficient Diffusion Solver for Large-Scale Combinatorial Optimization Problems [37.2] DISCOは、組合せ最適化問題の拡散解法である。
ソリューションの品質と推論速度の両面で優れています。
10000のノードを持ち、最大独立セットのベンチマークに挑戦する非常に大きなトラベリングセールスマン問題に対して、最先端の結果が得られます。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:36:31 GMT)
HarmonICA: Neural non-stationarity correction and source separation for motor neuron interfaces [37.0] 本研究では、教師なし学習アルゴリズムを用いて、信号非定常性を駆動する潜在過程の効果を盲目的に補正する潜在的な解決策を提案する。
提案した設計であるHarmonICAは、非線形ICAの識別可能性問題を脇に置いている。
模擬・実の両方の侵襲的・非侵襲的記録に対してHarmonICAを試験した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:08:13 GMT)
Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach [36.5] 自己教師付き事前学習のための高品質データセットの自動キュレーションの問題点を考察する。
これらの基準をすべて満たしたクラスタリングに基づく手法を提案する。
我々の方法は、大規模で多様なデータリポジトリ上で、$k$-meansの連続的かつ階層的なアプリケーションを含む。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:22:38 GMT)
Direct pulse-level compilation of arbitrary quantum logic gates on superconducting qutrits [36.3] 任意のqubitおよびqutritゲートを高忠実度で実現でき、ゲート列の長さを大幅に削減できることを示す。
最適制御ゲートは少なくとも3時間ドリフトでき、同じ校正パラメータを全ての実装ゲートに利用できることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:14:10 GMT)
Closed-Form Test Functions for Biophysical Sequence Optimization Algorithms [36.0] 生物物理シーケンス最適化のための新しい閉形式テスト関数のクラスを提案し、このクラスをEhrlich関数と呼ぶ。
これらの機能は研究の興味深い対象であり、標準的な遺伝的最適化ベースラインで解決するのは簡単ではないことを示す実証的な結果を提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:13:57 GMT)
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.6] タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は, 分子を多モード外部モジュール, MolX で設計し, 実装することで, LLM の分子理解能力を高めることを目的とする。
特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:07:29 GMT)
Character-Adapter: Prompt-Guided Region Control for High-Fidelity Character Customization [34.3] character-Adapterは、参照文字の詳細を保持するイメージを生成するために設計されたプラグイン・アンド・プレイのフレームワークである。
character-Adapterは、参照文字のきめ細かい地域的特徴を保証するために、プロンプト誘導セグメンテーションを使用する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:21:15 GMT)
Sampled Datasets Risk Substantial Bias in the Identification of Political Polarization on Social Media [34.2] ポーランドの政治論争の構造分極を24時間にわたって調査する。
大規模なサンプルはプラットフォーム上の政治的議論全体を表すことができるが、小さなサンプルはオンラインでの偏光の真の構造を正確に反映することができない。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:13:29 GMT)
Personalized Interpretation on Federated Learning: A Virtual Concepts approach [34.0] 本稿では,クライアント間での非IIDデータのロバスト化と解釈を行う新しいFL法を提案する。
概念ベクトルは、人間とループのプロセスで事前に定義したり、洗練したりすることができる。
提案手法の有効性をベンチマークデータセットで検証した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:39:45 GMT)
A Multimodal Foundation Agent for Financial Trading: Tool-Augmented, Diversified, and Generalist [33.8] FinAgentは金融取引タスクのためのマルチモーダル・ファンデーション・エージェントである。
金融市場を正確に分析するために、多種多様なデータ数字、テキスト、視覚的に処理する。
既存のトレーディング戦略と専門家の洞察を統合し、そのトレーディングアプローチがデータ駆動であり、健全な金融原則に根ざしていることを保証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:35:56 GMT)
SMPLOlympics: Sports Environments for Physically Simulated Humanoids [33.8] SMPLOlympics(SMPLOlympics)は、ヒューマノイドが様々なオリンピック競技に出場できるように、物理的にシミュレートされた環境の集合体である。
ゴルフ、ジャベリン投げ、ハイジャンプ、ロングジャンプ、ハードルなど、さまざまなスポーツ環境を提供する。
分析の結果,強い動きの先行と単純な報酬が組み合わさると,様々なスポーツにおいて人間のような行動が生じる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:53:05 GMT)
Towards Generating Diverse Audio Captions via Adversarial Training [33.8] 音声キャプションシステムの多様性を向上させるために,条件付き生成対向ネットワーク(C-GAN)を提案する。
キャプションジェネレータと2つのハイブリッドディスクリミネータが競合し、共同で学習し、キャプションジェネレータは、キャプションを生成するのに使用される標準エンコーダデコーダキャプションモデルとなることができる。
その結果,提案モデルでは,最先端手法と比較して,より多様性の高いキャプションを生成できることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:18:47 GMT)
A Simple Mixture Policy Parameterization for Improving Sample Efficiency of CVaR Optimization [33.8] 政策勾配(PG)を利用してリスク条件値(CVaR)を最適化する強化学習アルゴリズムは、サンプルの非効率性において重大な課題に直面している。
本稿では,リスクニュートラル政策と調整可能な政策を統合し,リスク・アバース政策を形成する簡易な混合政策パラメタライゼーションを提案する。
実験により、この混合パラメータ化は様々なベンチマーク領域で一意に有効であることが判明した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:31:06 GMT)
MMRo: Are Multimodal LLMs Eligible as the Brain for In-Home Robotics? [33.6] 本研究では,Multimodal LLM for Robotic (MMRo)ベンチマークを評価するための最初のベンチマークを紹介する。
我々は、MLLMがロボットの中央処理ユニットとして持つべき4つの重要な能力知覚、タスク計画、視覚的推論、安全性の測定を識別する。
以上の結果から,現在のMLLMはロボットの認知コアとして機能するほど信頼できないことが示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:09:06 GMT)
PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators [32.9] PoliFormerはRGBのみの屋内ナビゲーションエージェントで、エンドツーエンドでトレーニングされ、大規模に強化学習を行う。
シミュレーションで純粋に訓練されているにもかかわらず、適応せずに現実世界に一般化する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:51:10 GMT)
Scaling Synthetic Data Creation with 1,000,000,000 Personas [31.5] 私たちは、Webデータから自動的にキュレートされた10億の多様なペルソナのコレクションであるPersona Hubを紹介します。
この10億のペルソナ(世界の人口の13%)は、世界の知識の分散キャリアとして機能し、大きな言語モデルにカプセル化されたほぼ全ての視点に到達することができる。
ペルソナ駆動のデータ合成は、汎用的で、スケーラブルで、柔軟性があり、使いやすく、合成データ作成とアプリケーションの実践におけるパラダイムシフトを促進する可能性があることを実証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:59:01 GMT)
Deep Learning-based Depth Estimation Methods from Monocular Image and Videos: A Comprehensive Survey [31.4] 単一のRGB画像とビデオから深度を推定することは、多くの分野で応用されているため、広く関心を集めている。
過去10年間に500以上のディープラーニングベースの論文が出版されている。
入力と出力のモダリティ、ネットワークアーキテクチャ、学習方法に基づいて、現在の作業を分類するための分類を提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:25:21 GMT)
RepAct: The Re-parameterizable Adaptive Activation Function [31.2] RepActは、エッジデバイスの計算制限内で軽量ニューラルネットワークを最適化するための適応アクティベーション関数である。
画像分類や物体検出などのタスクで評価すると、RepActは従来のアクティベーション機能を上回った。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:25:45 GMT)
InfiniBench: A Comprehensive Benchmark for Large Multimodal Models in Very Long Video Understanding [31.1] InfiniBenchは非常に長いビデオ理解のための総合的なベンチマークである。
1) ビデオの長さは, 平均76.34分, 2) 質問対数の最大108.2K, 3) 異なる9つのスキルを検査し, 複数選択の質問とオープンエンドの質問の両方を含む質問の多様性, 4) 映像ソースは映画やテレビ番組から来る人間中心である。
我々の結果によると、Geminiのような最高のAIモデルは、平均精度42.72%、平均スコア5点中2.71パーセントでうまく機能しない。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:35:01 GMT)
LEMoE: Advanced Mixture of Experts Adaptor for Lifelong Model Editing of Large Language Models [30.8] 大規模言語モデル(LLM)は、変化し続ける世界の事実をそのまま維持するために、継続的な知識更新を必要とする。
我々は、生涯モデル編集のための高度なMixture of Experts (MoE)アダプタLEMoEを紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:17:41 GMT)
Efficient Event Stream Super-Resolution with Recursive Multi-Branch Fusion [30.7] 本稿では,正と負のイベントを分離する効率的な再帰的マルチブランチ情報融合ネットワーク(RMFNet)を提案する。
FEMは、正と負の分岐間の情報の融合と交換を効率的に促進する。
提案手法は,2.3倍の加速を伴い,合成データセットと実データセットの17%以上と31%以上の改善を実現している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:10:21 GMT)
Self-Supervised Spatial-Temporal Normality Learning for Time Series Anomaly Detection [30.4] Time Series Anomaly Detection (TSAD)は、金融市場、工業生産、医療など、さまざまな分野に広く応用されている。
既存のTSAD手法の多くは、空間次元における意味情報を無視しながら、時間次元からのデータモデリングに重点を置いている。
時空間正規化学習(Spatial-Temporal Normality Learning, STEN)と呼ばれる新しい手法を導入する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:17:58 GMT)
The Intelligible and Effective Graph Neural Additive Networks [29.7] Graph Neural Additive Network (GNAN) は、一般化加法モデルの解釈可能なクラスの拡張である。
GNANは完全に解釈可能で、機能レベルとグラフレベルでのグローバルな説明とローカルな説明が可能である。
我々は、さまざまなタスクやデータセットの一連の例において、GNANの知性を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:27:36 GMT)
TimeBench: A Comprehensive Evaluation of Temporal Reasoning Abilities in Large Language Models [29.7] 階層的時間的推論ベンチマークであるTimeBenchを提案する。
TimeBenchは、大規模な言語モデルの時間的推論能力を調べるための徹底的な評価を提供する。
実験結果から, 最先端のLDMと人間の間には, 顕著な性能差があることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:40:26 GMT)
BeamAggR: Beam Aggregation Reasoning over Multi-source Knowledge for Multi-hop Question Answering [29.4] 本研究では,知識集約型マルチホップQAの推論フレームワークであるBeamAggRを提案する。
複雑な質問を木に解析し、これには原子や複合的な質問が含まれる。
原子的問題に対して、LLMは答え候補を得るためにマルチソースの知識を推論する。
複合的な問題に対して、LLMはビーム候補を結合し、確率的集約を通じて複数の推論経路を探索し、最も有望な軌道を優先する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:53:48 GMT)
Computational Politeness in Natural Language Processing: A Survey [29.1] 丁寧さに対する計算的アプローチは、テキストの丁寧さを自動的に予測し、生成するタスクである。
本稿は、自然言語処理における計算の丁寧さに関する過去の研究のまとめである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:46:36 GMT)
FootBots: A Transformer-based Architecture for Motion Prediction in Soccer [28.3] FootBotsは、動作予測と条件付き動作予測に対処するエンコーダ・デコーダベースのアーキテクチャである。
FootBotsは、設定されたアテンションブロックとマルチアテンションブロックデコーダを使用して、時間的および社会的ダイナミクスをキャプチャする。
実際のサッカーデータに対する実証的な結果は、フットボットがモーション予測においてベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:49:59 GMT)
A Survey on Failure Analysis and Fault Injection in AI Systems [28.3] AIシステムの複雑さは脆弱性を露呈し、レジリエンスと信頼性を確保するために、障害分析(FA)と障害注入(FI)の堅牢な方法を必要とする。
この研究は、AIシステムの6層にわたる既存のFAとFIのアプローチを詳細に調査することで、このギャップを埋める。
この結果から,AIシステム障害の分類,既存のFIツールの能力評価,実世界とシミュレーション失敗の相違点が明らかになった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:32:03 GMT)
Empowering Interdisciplinary Insights with Dynamic Graph Embedding Trajectories [28.2] DyGETVizは動的グラフ(DG)を効果的に視覚化するための新しいフレームワーク
これらのグラフ内のマイクロレベルとマクロレベルの構造シフトをキャプチャし、複雑で大規模な動的グラフを表現する堅牢な方法を提供する。
DyGETVizの適用範囲は、民族学、疫学、金融学、遺伝学、言語学、コミュニケーション研究、社会学、国際関係など、多岐にわたる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:44:45 GMT)
ScaleBiO: Scalable Bilevel Optimization for LLM Data Reweighting [28.1] バイレベル最適化は、さまざまな機械学習設定でその有用性を示している。
2段階最適化問題に効果的に対処できる一階アルゴリズムが登場した。
本稿では,このパラダイムの最初のスケーラブルなインスタンス化であるScaleBiOを紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:03:08 GMT)
Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity [27.9] 大規模言語モデル(LLM)はますます多くのオンラインサービスに統合されているが、デプロイにはコストがかかる。
我々は,所与のLLMサービスに対して,最小コストのGPUアロケーションを自動かつ効率的に導出するフレームワークであるM'elangeを紹介する。
M'elangeは、会話設定で最大77%、ドキュメントベースの設定で33%、混合設定で51%のデプロイメントコストを削減する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:24:22 GMT)
Backdoor Attack in Prompt-Based Continual Learning [27.8] 本稿では,バックドア・アタック(バックドア・アタック)という潜在的な脅威に対して,継続的な学習を露呈する。
本稿では,インクリメンタル学習者に対するバックドアアタックの実行における3つの重要な課題を強調し,それに対応するソリューションを提案する。
我々のフレームワークは、最大で100%の攻撃成功率を達成し、さらなるアブレーション研究により、我々の貢献を確認します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:53:33 GMT)
Odd-One-Out: Anomaly Detection by Comparing with Neighbors [27.5] 本稿では、シーン内の他のインスタンスと比較して奇異な物体を識別することに焦点を当てた、新しい異常検出(AD)問題を提案する。
従来のADベンチマークとは異なり、私たちの設定では、このコンテキストの異常はシーン固有のものであり、多数を占める通常のインスタンスによって定義されます。
本稿では,各インスタンスに対して3次元オブジェクト中心表現を生成し,インスタンス間の相互比較により異常表現を検出する手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:59:51 GMT)
ASSR-NeRF: Arbitrary-Scale Super-Resolution on Voxel Grid for High-Quality Radiance Fields Reconstruction [27.2] 暗黙的あるいは明示的な表現を持つ放射場を構築することにより、NeRFに基づく3Dシーンの再構成を行う。
超高解像度ノベルビュー合成のための新しいフレームワークであるArbitrary-Scale Super-Resolution NeRF (ASSR-NeRF)を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:22:33 GMT)
BGE M3-Embedding: Multi-Lingual, Multi-Functionality, Multi-Granularity Text Embeddings Through Self-Knowledge Distillation [26.7] 本稿では,M3-Embeddingと呼ばれる新しい埋め込みモデルを提案する。
100以上の作業言語をサポートすることができるため、多言語および多言語検索タスクにおける最先端のパフォーマンスが新たに向上する。
M3-Embeddingは、短い文から最大8192トークンの長いドキュメントまで、さまざまな粒度の入力を処理することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:55:49 GMT)
Less is More: Accurate Speech Recognition & Translation without Web-Scale Data [26.5] Canaryは多言語ASRおよび音声翻訳モデルである。
英語、フランス語、スペイン語、ドイツ語でWhisper、OWSM、Seamless-M4Tを上回っている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:22:23 GMT)
PopAlign: Population-Level Alignment for Fair Text-to-Image Generation [26.5] 人口レベルの選好最適化のための新しいアプローチであるPopAlignを紹介する。
我々は,PopAlignが事前学習したT2Iモデルのバイアスを著しく軽減し,生成品質をほぼ保っていることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:38:32 GMT)
AIGB: Generative Auto-bidding via Diffusion Modeling [26.3] 本稿では,AIGB(AI-Generated Bidding)について紹介する。
このパラダイムでは、入札生成のための条件付き拡散モデルであるDiffBidを提案する。
Alibabaの広告プラットフォーム上で、実世界のデータセットとオンラインA/Bテストで実施された実験は、DiffBidの有効性を実証している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:59:15 GMT)
Decoupling General and Personalized Knowledge in Federated Learning via Additive and Low-Rank Decomposition [26.2] パーソナライズド・フェデレーション・ラーニング(Personalized Federated Learning)の主な戦略は、一般的な知識(クライアント間で共有される)とクライアント固有の知識を分離することである。
この問題に対処するためにパラメータ分解加算を用いた単純だが効果的なPFLパラダイムであるFedDecompを紹介する。
複数のデータセットにまたがる実験結果は、FedDecompが最先端のメソッドを最大4.9%上回っていることを示している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:01:22 GMT)
BESTOW: Efficient and Streamable Speech Language Model with the Best of Two Worlds in GPT and T5 [25.6] 我々は,TwO Worlds の BESt 機能を高効率でマルチタスク能力の強い単一モデルに組み込むための BESTOW アーキテクチャを提案する。
我々は,ストリーム可能なSpeechLLMを読み書きポリシ問題として再構成し,BESTOWアーキテクチャを用いてオフラインおよびストリーミング研究を統合する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:40:03 GMT)
Unlocking Varied Perspectives: A Persona-Based Multi-Agent Framework with Debate-Driven Text Planning for Argument Generation [25.4] 議論記述のためのペルソナベースのマルチエージェントフレームワークを提案する。
人間の議論に触発されて、我々はまず各エージェントに、その高いレベルの信念を表すペルソナを、ユニークな視点から割り当てる。
次にエージェントインタラクションプロセスを設計し、エージェントが協調して議論し、議論書の全体計画を形成するアイデアを議論できるようにします。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:21:20 GMT)
BioMNER: A Dataset for Biomedical Method Entity Recognition [25.4] 本稿では,生物医学的手法による実体認識のための新しいデータセットを提案する。
我々は、人間のアノテーションを支援するために、自動的なBioMethodエンティティ認識と情報検索システムを採用している。
実験の結果,言語モデルのパラメータ数が大きくなると,実体抽出パターンの有効同化が著しく阻害されることが判明した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:34:24 GMT)
TabSketchFM: Sketch-based Tabular Representation Learning for Data Discovery over Data Lakes [25.2] データレイク上のデータ発見のためのニューラルネットワークグラフモデルであるTabSketchFMを提案する。
本稿では,データ発見手法の有効性を高めるための,事前学習型スケッチベースアプローチを提案する。
我々は,最先端技術と比較して,検索のためのF1スコアの改善を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:28:53 GMT)
Dataset Representativeness and Downstream Task Fairness [24.6] そのデータセット上で訓練された分類器のデータセット代表性とグループフェアネスとの間に自然な緊張関係があることを実証する。
また、過度にサンプル化されていない群は、それらの群に偏りを示す分類器を生じる可能性があることも見出した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:11:16 GMT)
AnyControl: Create Your Artwork with Versatile Control on Text-to-Image Generation [24.1] 言語制御は効果的なコンテンツ生成を可能にするが、画像生成のきめ細かい制御に苦慮する。
AnyControlは、生成プロセスのガイドとして、統一されたマルチモーダル埋め込みを抽出する、新しいマルチControlフレームワークを開発している。
このアプローチは、ユーザ入力の全体的理解を可能にし、汎用的な制御信号の下で高品質で忠実な結果を生成する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:47:07 GMT)
LLaVolta: Efficient Multi-modal Models via Stage-wise Visual Context Compression [24.0] 本稿では,視覚トークンに関する冗長性の解析と,大規模多言語モデルにおける効率的なトレーニングについて述べる。
最初の実験では、単に平均プーリングによってテスト段階で最大70%の視覚トークンを除去することは、視覚的質問応答精度の最小3%の低下にしか至らないことが示された。
トレーニング中の視覚トークンの数を削減し、パフォーマンスを犠牲にすることなく、トレーニング効率を向上させる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:57:14 GMT)
Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.9] 本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。
犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:59:45 GMT)
Impact of Domain Knowledge and Multi-Modality on Intelligent Molecular Property Prediction: A Systematic Survey [22.7] 様々なベンチマークに基づいて,近年のディープラーニング手法を検証,定量的に分析する。
分子情報の統合は、回帰処理と分類処理の両方において分子特性予測(MPP)を大幅に改善する。
また、1D SMILESによる2Dグラフの強化により、回帰タスクのマルチモーダル学習性能が最大9.1%向上し、3D情報による2Dグラフの増大により、分類タスクのパフォーマンスが最大13.2%向上することを発見した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:32:03 GMT)
QQQ: Quality Quattuor-Bit Quantization for Large Language Models [22.6] QQQは、4ビットの重みと8ビットのアクティベーションを持つQuality Quattuor-bit Quantization法である。
QQQは適応的平滑化とヘッセン型補償を採用し、広範囲のトレーニングを伴わずに量子化されたモデルの性能を大幅に向上させる。
専用チャネルごとのW4A8 GEMMとグループごとのW4A8 GEMMは、FP16 GEMMよりも3.67$times$と3.29$times$の大幅な速度向上を実現している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:53:12 GMT)
Simulating Financial Market via Large Language Model based Agents [22.4] ほとんどの経済理論は、金融市場の参加者が完全に合理的な個人であり、金融市場の人間の振る舞いをシミュレートするために数学的モデルを使用していると仮定している。
textbfAgentベースのtextbfSimulated textbfFinancial textbfMarket (ASFM) を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:54:12 GMT)
StreamMOTP: Streaming and Unified Framework for Joint 3D Multi-Object Tracking and Trajectory Prediction [22.3] 我々は3次元多目的追跡・軌道予測(StreamMOTP)のためのストリーミング統合フレームワークを提案する。
ストリーミング方式でモデルを構築し、メモリバンクを利用して、追跡対象の長期潜伏機能をより効果的に保存し、活用する。
また,予測トラジェクタの品質と一貫性を2ストリーム予測器で改善する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:35:35 GMT)
NetNN: Neural Intrusion Detection System in Programmable Networks [22.2] 本稿では、ネットワークデータプレーン内で完全に動作し、低レイテンシを実現する新しいDNNベースの侵入検知システムであるNetNNを紹介する。
実時間要求を満たす場合,NetNN は侵入検出精度を 99% に向上できることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:20:46 GMT)
CHASE: A Causal Heterogeneous Graph based Framework for Root Cause Analysis in Multimodal Microservice Systems [22.0] マルチモーダルデータを持つマイクロサービスシステムにおける根本原因解析,すなわちCHASEのための因数不均一なgraAph baSed framEworkを提案する。
CHASEは、因果関係の流れを表すハイパーエッジを持つ構築されたハイパーグラフから学習し、根本原因の局在を実行する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:46:51 GMT)
EHRmonize: A Framework for Medical Concept Abstraction from Electronic Health Records using Large Language Models [21.6] EHRデータから医療概念を抽象化するために,大規模言語モデルを活用するフレームワークであるEHRmonizeを紹介する。
本研究は,2つの自由テキスト抽出と6つのバイナリ分類タスクにおいて,実世界のEHRデータベースからの薬物データを用いて5つのLSMを評価する。
GPT-4oはジェネリックルート名同定において97%,ジェネリックドラッグ名では82%,抗生物質のバイナリ分類では100%の精度を達成した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:39:20 GMT)
Modeling the Real World with High-Density Visual Particle Dynamics [20.8] HD-VPDは100K以上の粒子を含む巨大な潜在点雲を処理することで、現実のシーンの物理力学をエミュレートすることができる。
RGB-Dカメラを2台搭載した高自由度バイマニュアルロボットの動特性をモデル化し,HD-VPDの能力を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:13:50 GMT)
Information-Theoretic Foundations for Neural Scaling Laws [20.6] 我々は、ニューラルスケーリング法則のための情報理論の基礎を開発する。
データとモデルサイズの間の最適関係は、対数的要因まで線形であることが観察された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:20:54 GMT)
Scalable and Domain-General Abstractive Proposition Segmentation [20.5] 我々は抽象命題セグメンテーションの課題に焦点を当てる。
本稿では,スケーラブルで精度の高い命題セグメンテーションモデルを提案する。
論文の重要なコントリビューションとして、NLP実践者が利用できる使いやすいAPIを共有します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:24:31 GMT)
MIntRec2.0: A Large-scale Benchmark Dataset for Multimodal Intent Recognition and Out-of-scope Detection in Conversations [20.5] MIntRec2.0は、マルチパーティ会話におけるマルチモーダルインテント認識のための大規模なベンチマークデータセットである。
1,245の対話と15,040のサンプルがあり、それぞれが30のきめ細かいクラスからなる新しい意図的分類に注釈付けされている。
各発話における話者の包括的情報を提供し、多人数会話研究に活用する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:05:59 GMT)
Cross-domain Denoising for Low-dose Multi-frame Spiral Computed Tomography [20.5] X線被曝は、がんなどの潜在的な健康リスクへの懸念を引き起こす。
放射線線量を減らすという欲求は、研究者に再建の質の向上を促した。
本稿では,市販マルチスライス・スパイラルCTスキャナの2段階化手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:01:03 GMT)
MOYU: A Theoretical Study on Massive Over-activation Yielded Uplifts in LLMs [20.4] MYU(Massive Over-activation Yielded Uplifts)は、大規模言語モデル固有の特性である。
Massive Over-activation Yielded Uplifts (MOYU) は、これらのモデルにおける推論を加速するために設計された、巧妙だが未探索の戦略である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:23:16 GMT)
Token Erasure as a Footprint of Implicit Vocabulary Items in LLMs [20.1] Llama-2-7b のトークン化子は、"northeast" という単語をトークン ['_n', 'ort', 'he', 'astern'] に分割する。
本研究では,名前付きエンティティとマルチトークン語の最後のトークン表現が,先行および現在のトークンに関する情報が早期の層で急速に忘れられるような,顕著な「消去」効果を示すことを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:54:47 GMT)
Single Parent Family: A Spectrum of Family Members from a Single Pre-Trained Foundation Model [20.1] 本稿では,大規模言語モデルの圧縮に適したプログレッシブ・ローランク分解法(PLRD)を提案する。
PLRDは計算オーバーヘッドとエネルギー消費を大幅に削減する。
この結果から,PLRD は LLM の効率的なスケーリングのための新しい標準となる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:27:57 GMT)
Latent Logic Tree Extraction for Event Sequence Explanation from LLMs [19.9] 医療やロボティクスなどの現代のハイテイクシステムは、しばしば巨大なストリーミングイベントシーケンスを生成する。
我々のゴールは、Large Language Models (LLMs) から論理木に基づく説明を引き出すための効率的なプラグイン・アンド・プレイツールを設計し、観測された各イベントシーケンスに対するカスタマイズされた洞察を提供することです。
オンライン設定では、ローカルに構築された軽量なモデルが、数回だけ繰り返して、各シーケンスのLSMから最も関連性の高いルールを反復的に抽出します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:54:19 GMT)
AstMatch: Adversarial Self-training Consistency Framework for Semi-Supervised Medical Image Segmentation [19.8] 半教師付き学習(SSL)は,医用画像のセグメンテーションにおいて有意な可能性を示唆している。
本研究では,対戦型自己学習一貫性フレームワーク(AstMatch)を提案する。
提案されたAstMatchは、3つの公開データセット上の最先端SSLメソッドで広く評価されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:38:12 GMT)
LLMEasyQuant -- An Easy to Use Toolkit for LLM Quantization [19.8] LLM量子化には多くの量子化方法が存在するが、ユーザフレンドリで、ローカルにデプロイしやすいものはほとんどない。
このパッケージは、ユーザフレンドリで初心者の学習に適した量子化デプロイメントを容易にすることを目的としている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:56:53 GMT)
Pairwise Difference Learning for Classification [19.2] PDL(Pairwise difference learning)は、最近、回帰のための新しいメタラーニング技術として導入されている。
元のトレーニングデータのペアバージョン上で、適切に定義された(バイナリ)分類問題を解くことにより、PDLを分類タスクに向けて拡張する。
PDLの実装はPythonパッケージで簡単に利用でき、公開されています。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:20:22 GMT)
Integrating Pre-Trained Language Model with Physical Layer Communications [19.2] 本稿では、物理層(PHY)通信機能と統合された実用的なオンデバイスAI通信フレームワークを提案する。
我々のフレームワークは、チャネルノイズによるエンドツーエンドトレーニングを取り入れ、レジリエンスを高め、ベクトル量子化変分オートエンコーダ(VQ-VAE)を効率よく堅牢な通信に組み込み、事前学習エンコーダ・デコーダ変換を用いて一般化能力を向上させる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:00:45 GMT)
Active Sequential Two-Sample Testing [19.0] サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。
我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。
実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:57:21 GMT)
Into the Unknown: Generating Geospatial Descriptions for New Environments [18.7] レンデブー課題は、同心空間関係の推論を必要とする。
座標と組み合わせたオープンソース記述(例えばウィキペディア)を使用することで、トレーニングデータを提供するが、空間指向の限られたテキストに悩まされる。
新しい環境のための高品質な合成データを生成するための大規模拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:56:21 GMT)
DECOR: Improving Coherence in L2 English Writing with a Novel Benchmark for Incoherence Detection, Reasoning, and Rewriting [18.7] 我々は,L2英語文における不整合を検出するための専門家アノテーションを含む新しいベンチマークであるDECORを紹介する。
DECORは、L2英語の文章を改善するために特別に設計された最初のコヒーレンスアセスメントデータセットである。
学生エッセイにおける不整合を自動的に検出および書き直しするために、モデルを微調整した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:38:54 GMT)
PPTFormer: Pseudo Multi-Perspective Transformer for UAV Segmentation [18.6] 我々は,新しいtextbfPseudo Multi-textbfPerspective textbfTranstextbfformerネットワークであるPTFormerを紹介する。
提案手法は,マルチパースペクティブ学習の強化のための疑似視点を作成することによって,実際のマルチパースペクティブデータの必要性を回避する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:43:49 GMT)
Idle is the New Sleep: Configuration-Aware Alternative to Powering Off FPGA-Based DL Accelerators During Inactivity [18.2] FPGA構成フェーズのオーバーヘッドを最小限に抑えるために,革新的な最適化を導入する。
設定パラメータを正確に調整することで、構成エネルギーを40.13倍に削減した。
我々のアイドルウェイティング戦略は499.06msまでの要求期間で従来のオンオフ戦略より優れていた。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:22:12 GMT)
Position: Explain to Question not to Justify [17.8] 説明可能な人工知能(XAI)は有望な研究分野である。
我々はXAI領域内で絡み合った様々なスレッドを、人間/価値指向の説明の相補的な2つの文化に分けた。
RED XAIの領域は、AIシステムの安全性を確保するために必要な重要な研究の機会と可能性を秘めている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:37:28 GMT)
NoteChat: A Dataset of Synthetic Doctor-Patient Conversations Conditioned on Clinical Notes [17.3] NoteChatは、Large Language Models (LLMs)を活用して、患者と物理学者の対話を生成する新しい協調型マルチエージェントフレームワークである。
NoteChatは、臨床ノートに基づいた優れた合成患者と物理学の対話を生成する際に、ドメインの専門家によって、ChatGPTやGPT-4のような最先端のモデルを22.78%まで大幅に上回っている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:28:08 GMT)
Learning Decision Policies with Instrumental Variables through Double Machine Learning [16.8] データリッチな設定における意思決定ポリシーの学習における一般的な問題は、オフラインデータセットにおける急激な相関である。
2段階IV回帰のバイアスを低減する非線形IV回帰法であるDML-IVを提案する。
IV回帰ベンチマークでは、最先端のIV回帰法よりも優れており、楽器の存在下で高い性能のポリシーを学ぶ。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:31:48 GMT)
AlignIT: Enhancing Prompt Alignment in Customization of Text-to-Image Models [16.6] ユーザによる参照画像を用いたテキスト・画像拡散モデルのカスタマイズの問題点を考察する。
新しいプロンプトが与えられた場合、既存のメソッドは参照イメージからキーコンセプトをキャプチャできるが、生成されたイメージとプロンプトを一致させることができない。
興味ある概念の鍵と値を注入する新しい後処理アルゴリズムAlignITを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:22:33 GMT)
Calibrating LLMs with Preference Optimization on Thought Trees for Generating Rationale in Science Question Scoring [16.4] より忠実な論理を生成できる新しいフレームワークを提案し、さらに重要なことに、ブラックボックススコアリングシステムと性能をマッチングする。
まず,Large Language Models (LLM) をクエリして思考木を生成することで,人間の評価プロセスを模倣する。
次に、各思考木経路から中間的評価決定を要約し、合成的合理性データと合理性選好データを作成する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:33:05 GMT)
Sequential Model for Predicting Patient Adherence in Subcutaneous Immunotherapy for Allergic Rhinitis [16.4] 本研究は, 逐次逐次変量モデル(SLVM)と長短期記憶(LSTM)の2つのモデルを開発し, 解析する。
SLACモデルの予測付着精度は60%から72%であり、LSTMモデルでは66%から84%であり、時間ステップによって異なる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:53:51 GMT)
Universal Checkpointing: Efficient and Flexible Checkpointing for Large Scale Distributed Training [16.0] 既存のチェックポイントアプローチは、分散トレーニングには適していないようだ。
本稿では,効率的なチェックポイント作成を実現する手法であるユニバーサル・チェックポイントを提案する。
本評価は,最先端モデルアーキテクチャにおけるユニバーサルチェックポイントの有効性と汎用性を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:33:11 GMT)
PM-VIS+: High-Performance Video Instance Segmentation without Video Annotation [16.0] ビデオインスタンスのセグメンテーションには、ビデオ内のオブジェクトを検出し、セグメンテーションし、追跡する必要がある。
本稿では,画像データセットを利用してビデオアノテーションを除去する手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:22:39 GMT)
LightStereo: Channel Boost Is All Your Need for Efficient 2D Cost Aggregation [15.8] LightStereoは、マッチングプロセスを加速するために作られた最先端のステレオマッチングネットワークである。
私たちのブレークスルーは、3Dコストボリュームのチャネル次元に特化してパフォーマンスを向上させることです。
LightStereoは、SceneFlowデータセットで競合するEPEメトリックを達成し、最低でも22GFLOPしか必要とせず、推論時間はわずか17msである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:11:24 GMT)
High-Throughput Secure Multiparty Computation with an Honest Majority in Various Network Settings [15.8] 本稿では,セキュアな3次元計算(3PC)と悪意のある4次元計算(4PC)のためのリング上の新しいプロトコルを提案する。
高スループットに最適化されたオープンソースのC++フレームワークで、最先端プロトコル(Replicated 3PC, ASTRA, Fantastic Four, Tetrad)とともに、当社のプロトコルを実装しています。
実装された6つの3PCおよび4PCプロトコルのうち5つは、25Gbit/sのLAN環境において、毎秒10億以上の32ビット乗算または32億のANDゲートを達成する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:44:43 GMT)
InfoNCE: Identifying the Gap Between Theory and Practice [15.7] 異方性設定における潜伏因子を確実に発見できるInfoNCEの一般化であるAnInfoNCEを紹介する。
CIFAR10 と ImageNet では,AnInfoNCE がダウンストリーム精度を犠牲にすることなく,以前に崩壊した情報の回復を増大させることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:08:26 GMT)
Applying RLAIF for Code Generation with API-usage in Lightweight LLMs [15.4] Reinforcement Learning from AI Feedback (RLAIF)は、さまざまな領域で大きな可能性を証明している。
本稿では,軽量 (1B パラメータ) LLM のコード生成能力を改善するための RLAIF フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:16:03 GMT)
All-In-One Medical Image Restoration via Task-Adaptive Routing [15.3] 我々は、単一のユニバーサルモデルで複数の異なるMedIRタスクに対処することを目的とした、オールインワンの医療画像復元の課題に焦点を当てた。
本稿では,タスク適応型ルーティング戦略を提案する。
提案するtextbfAll-in-one textbfMedical textbfImage textbfRestoration (textbfAMIR) ネットワークは、3つのMedIRタスクで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:25:19 GMT)
Nonlinear interferometry-based metrology of magneto-optical properties at infrared wavelengths [15.1] 本研究では, 非線形干渉法に基づく測定セットを提案し, 赤外線波長域における材料の磁気光学特性について検討する。
原理実証実験では、近赤外域の600nmのスペクトル帯域上でビスマス鉄ガーネットのバーデット定数を測定する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:44:24 GMT)
PathGen-1.6M: 1.6 Million Pathology Image-text Pairs Generation through Multi-agent Collaboration [15.0] CLIPのような視覚言語モデル(VLM)は病理学に大きな注目を集めている。
病理学をトレーニングするための現在の取り組みは、PubMed、YouTube、Twitterなどのプラットフォームからの病理画像テキストペアに依存している。
TCGAのような大規模WSIデータセットを利用して、多数の高品質な画像パッチを抽出する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:18:09 GMT)
ProbRadarM3F: mmWave Radar based Human Skeletal Pose Estimation with Probability Map Guided Multi-Format Feature Fusion [14.8] 本稿では,確率マップによるマルチフォーマット特徴融合モデルProbRadarM3Fを提案する。
ProbRadarM3Fは従来のヒートマップの特徴と位置特徴を融合させ、効果的に14個の人体のキーポイントを推定する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:11:11 GMT)
Automatic Regularization for Linear MMSE Filters [14.8] 最小平均二乗誤差(MMSE)線形フィルタの設計における正規化の問題を考える。
ベイズ的手法を用いて、観測された信号から、単純かつ自動で正規化パラメータが見つかる。
提案手法はシステム同定とビームフォーミングの例で示され, 自動正規化によりほぼ最適結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:35:58 GMT)
SPIRONet: Spatial-Frequency Learning and Topological Channel Interaction Network for Vessel Segmentation [14.7] 上記の問題に対処するために,新しい空間周波数学習・トポロジカルチャネル相互作用ネットワーク(SPIRONet)を提案する。
デュアルエンコーダを用いて、局所的な空間的および大域的な周波数容器の特徴を包括的にキャプチャする。
空間的および周波数的特徴を効果的に融合するために、クロスアテンション融合モジュールが導入された。
トポロジカルチャネル相互作用モジュールは、グラフニューラルネットワークに基づいてタスク非関連応答をフィルタリングするように設計されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:48:14 GMT)
ORCDF: An Oversmoothing-Resistant Cognitive Diagnosis Framework for Student Learning in Online Education Systems [14.5] 認知診断モデル(CDM)は、生徒の反応ログを用いて、生徒の熟達度を学習するように設計されている。
既存のCDMによって達成された成功にもかかわらず、学習者の熟達レベルが似すぎているという厄介な問題に悩まされていることがわかった。
本稿では,既存のCDMを増強するために,過平滑化耐性認知診断フレームワーク(ORCDF)を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:42:53 GMT)
MuGSI: Distilling GNNs with Multi-Granularity Structural Information for Graph Classification [14.4] グラフ分類に多粒性構造情報を利用する新しいフレームワークであるMuGSIを紹介する。
さまざまなデータセットと異なる教師/学生モデルアーキテクチャにまたがる広範な実験を行います。
実験結果は, MuGSIの有効性, 有効性, 堅牢性を示した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:11:16 GMT)
Parallax-tolerant Image Stitching via Segmentation-guided Multi-homography Warping [14.1] 画像セグメンテーションによって導かれるマルチホモグラフィーワープを用いた新しい画像縫合法を提案する。
提案手法は,最先端の手法と比較して,大きなマージンで最適アライメント精度を提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:51:59 GMT)
DLRover-RM: Resource Optimization for Deep Recommendation Models Training in the Cloud [14.0] ディープラーニングモデル(DLRM)は、スパース機能を管理するために大きな埋め込みテーブルに依存している。
このような埋め込みテーブルの拡張は、モデルパフォーマンスを大幅に向上させるが、GPU/CPU/メモリ使用量の増加を犠牲にする。
テクノロジ企業は、DLRMモデルを大規模にトレーニングするための、広範なクラウドベースのサービスを構築している。
DLRMのための弾性トレーニングフレームワークであるDLRover-RMを導入し,資源利用量を増やし,クラウド環境の不安定性に対処する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:17:31 GMT)
NLPerturbator: Studying the Robustness of Code LLMs to Natural Language Variations [13.9] 大規模言語モデル(LLM)は、与えられた自然言語記述に基づいてコード生成において有望な結果を達成する。
本稿では,実世界のシナリオにおいて,LLMが自然言語記述のバリエーションに頑健であるかを検討する。
我々は,一組のプロンプトを与えられた各カテゴリの摂動を実行できる自動フレームワーク,NLPerturbatorを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:39:33 GMT)
Localizing Anomalies via Multiscale Score Matching Analysis [13.9] 本稿では,脳MRIにおける異常局所化のための新しい教師なし手法であるSpatial-MSMAを紹介する。
パッチ位置とグローバル画像の特徴を条件としたフレキシブルな正規化フローモデルを用いて、パッチワイド異常スコアを推定する。
この方法は、通常発達している幼児の1,650T1およびT2重み付き脳MRIのデータセットで評価される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:57:12 GMT)
Learning to utilize image second-order derivative information for crisp edge detection [13.8] エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:53:06 GMT)
A synthetic data approach for domain generalization of NLI models [13.8] 自然言語推論(NLI)はLLMにとって重要なベンチマークタスクである。
合成された高品質データセットは、下流アプリケーションでゼロショット使用にNLIモデルを適用することができることを示す。
我々は、このデータに基づいてトレーニングされたモデルが、完全に下流のテスト設定に最適な一般化があることを示します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:36:27 GMT)
Safety through feedback in Constrained RL [13.7] 安全クリティカルなRL設定では、エージェントの安全な振る舞いを保証するために報酬関数を変更するよりも、追加のコスト関数を含めることが好まれる。
より複雑なドメインにスケールし、状態レベルのフィードバックを超えて拡張するアプローチを導入します。
安全体育館環境と現実的な自動運転シナリオのベンチマーク実験により,本手法の有効性を実証した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:29:33 GMT)
Optimal Rate of Kernel Regression in Large Dimensions [13.6] 我々はまず,大次元データに対する上界と最小値下界のカーネル回帰を特徴付ける汎用ツールを構築する。
我々は、新しいツールを使用して、カーネル回帰の余剰リスクの最小値が$n-1/2$であることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:59:08 GMT)
If in a Crowdsourced Data Annotation Pipeline, a GPT-4 [12.9] 本稿では,GPT-4と倫理的かつ優れたMTurkパイプラインを比較した。
ベストプラクティスにもかかわらず、MTurkパイプラインの最高精度は81.5%であり、GPT-4は83.6%に達した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:33:48 GMT)
Deconvolving Complex Neuronal Networks into Interpretable Task-Specific Connectomes [12.8] タスク特異的機能MRI(fMRI)画像は、認知過程の神経基盤を研究する上で優れたモダリティを提供する。
我々は、fMRIデータを用いて、タスク固有の集約ニューロンネットワークを、標準ネットワークと呼ばれる基本的なビルディングブロックの集合に分解する問題を定式化し、解決する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:13:48 GMT)
The G-invariant graph Laplacian [12.7] 我々は、既知のユニタリリー群 G の作用の下で閉じた多様体上のデータポイントを持つデータセットを考える。
グラフラプラシアンは、データセット上のGの作用によって生成されるすべての点間の距離を組み込むことで構成する。
G-GL はデータ多様体上のラプラス・ベルトラミ作用素に収束するが、収束速度は大幅に改善される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:40:00 GMT)
Scaling laws for learning with real and surrogate data [12.6] シュロゲートデータをトレーニングに統合するための重み付き経験的リスク最小化(ERM)アプローチを導入する。
$(i)$ サロゲートデータを統合すれば、元のディストリビューションにおけるテストエラーを大幅に削減できる。
$(ii)$ 代理データの利点を享受するためには、最適な重み付けのERMを使用することが重要です。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:36:50 GMT)
Beyond Human Preferences: Exploring Reinforcement Learning Trajectory Evaluation and Improvement through LLMs [12.6] 強化学習(Reinforcement Learning, RL)は、複雑なゲームタスクにおけるポリシートラジェクトリを評価する上での課題である。
PbRLは、人間の嗜好を重要な報酬信号として活用する先駆的なフレームワークである。
LLM4PG という LLM 対応自動選好生成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:21:24 GMT)
An Analysis of MLOps Architectures: A Systematic Mapping Study [12.4] 本研究は、アーキテクチャの観点から、MLOpsにおける技術の現状を概観する。
研究者や実践者は、私たちの発見を利用して、MLOpsシステムのアーキテクチャ設計を知らせることができます。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:38:50 GMT)
Beyond First-Order: A Multi-Scale Approach to Finger Knuckle Print Biometrics [12.2] フィンガーナックルプリント(FKP)は、リッチなテクスチャパターンによって注目され、アイデンティティ認識のための有望なバイオメトリックとして位置づけられている。
以前のFKP認識手法は、複雑なテクスチャの詳細をキャプチャするが構造情報を考慮できない一階特徴記述子を主に利用していた。
本稿では,FKP画像のテクスチャ情報を包括的にキャプチャするための新しいFKP認識手法であるDual-Order Texture Competition Network (DOTCNet)を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:06:01 GMT)
Active Preference Learning for Large Language Models [12.1] 我々は、好みラベルをよりよく活用するために、DPOのアクティブな学習戦略を開発する。
本稿では,言語モデルの予測エントロピーに基づく,プロンプト/コンプリートペアの実用的な獲得関数を提案する。
提案手法は,ペアの選好データに基づく微調整の学習率と最終性能の両方を改善する方法を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:22:01 GMT)
Generative Autoencoding of Dropout Patterns [12.0] 本稿では,デ暗号オートエンコーダと呼ばれる生成モデルを提案する。
トレーニングデータセットの各データポイントに、ユニークなランダムなドロップアウトパターンを割り当てます。
次に、オートエンコーダをトレーニングして、このパターンを符号化する情報として、対応するデータポイントを再構築する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:53:56 GMT)
Empirical Bayes for Dynamic Bayesian Networks Using Generalized Variational Inference [12.0] 本研究では,動的ベイズネットワークを学習するための経験的ベイズアプローチを実演する。
構造と重みのいくつかの点推定から始めることで、データ駆動モデルを使用して不確実性を定量化することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:40:19 GMT)
SimTxtSeg: Weakly-Supervised Medical Image Segmentation with Simple Text Cues [11.9] 我々は、単純なテキストキューを利用して高品質な擬似ラベルを生成する新しいフレームワーク、SimTxtSegを提案する。
大腸ポリープ・セグメンテーションとMRI脳腫瘍セグメンテーションという2つの医療画像セグメンテーションの枠組みについて検討した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:56:08 GMT)
DCSM 2.0: Deep Conditional Shape Models for Data Efficient Segmentation [11.5] 本稿では,エッジ検出器とエッジマップ上に条件付けされた暗黙の形状関数を用いて,モード間の形状情報を活用するDeep Conditional Shape Models 2.0を紹介する。
エッジ検出段階で使用するトレーニングデータの量を変化させることで,対象領域におけるデータ効率を実証する。
トレーニングデータの2%(22巻)しか使用していない場合、平均表面距離は最大5%、平均表面距離は2.58mm、ハウスドルフ距離は21.02mmである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:52:11 GMT)
CodeAgent: Collaborative Agents for Software Engineering [11.5] コードレビューは、ソフトウェアの全体的な品質と信頼性を保証することを目的としている。
既存の自動手法は単一入力出力生成モデルに依存している。
コードレビュー自動化のための新しいマルチエージェント大規模言語モデル(LLM)システムであるCodeAgentを紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:48:23 GMT)
Distributed Speculative Inference of Large Language Models [11.3] 大規模言語モデル(LLM)の推論を加速することは、人工知能において重要な課題である。
本稿では,分散投機推論(DSI)について紹介する。分散投機推論(DSI)は,投機推論(SI)よりも確実に高速な分散推論アルゴリズムである。
ターゲットとドラフトの複数のインスタンスをオーケストレーションすることで、DSIはSIよりも高速なだけでなく、SIで加速できないLLMもサポートする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:34:26 GMT)
MimicMotion: High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance [11.3] 我々は、任意の長さの高品質なビデオを生成することができるMimicMotionと呼ばれる制御可能なビデオ生成フレームワークを提案する。
信頼を意識したポーズガイダンスは、高いフレーム品質と時間的滑らかさを保証する。
長大かつスムーズなビデオを生成するために,我々は進行的な潜伏融合戦略を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:40:53 GMT)
MALIBO: Meta-learning for Likelihood-free Bayesian Optimization [11.1] 本稿では,サロゲートモデルをバイパスし,タスク間のクエリの有用性を直接学習するメタラーニングBO手法を提案する。
本手法は,タスクの不確実性を明示的にモデル化し,新しいタスクへのロバスト適応を可能にする補助モデルを含む。
提案手法は, 常に高い性能を示し, 様々なベンチマークにおいて, 最先端のメタラーニングBO法より優れた性能を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:55:35 GMT)
Large-scale, Independent and Comprehensive study of the power of LLMs for test case generation [11.1] クラスやメソッドなどのコードモジュールのバグを特定するのに不可欠なユニットテストは、時間的制約のため、開発者によって無視されることが多い。
GPTやMistralのようなLarge Language Models (LLM)は、テスト生成を含むソフトウェア工学における約束を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 20:38:41 GMT)
Enhancing Radiological Diagnosis: A Collaborative Approach Integrating AI and Human Expertise for Visual Miss Correction [11.0] CoRaXは、胸部放射線学の診断精度を高めるために、視線データと放射線学レポートを統合している。
CoRaXは28%(332)の異常を欠いた271サンプルのシミュレーションエラーデータセットで試験された。
このシステムはこれらのエラーの21%(332件中71件)を修正し、7%(312件中22件)を未解決に残した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:51:38 GMT)
Bell nonlocality and entanglement in $e^{+}e^{-} \rightarrow Y\bar{Y}$ at BESIII [10.9] 電子-陽電子消滅で生成するハイパーオン-反ハイペロン系の非局所性と絡み合いを高精度なデータで調べる。
ハイパロンとその反ハイパロンの非消滅分極では、ハイパロン-反ハイパロン系の非局所性の運動領域は$tau+tau-$系よりも制限されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:55:15 GMT)
Multimodal Data Integration for Precision Oncology: Challenges and Future Directions [10.8] 正確な腫瘍学の本質は、腫瘍の個々の特性に基づいて、各患者に標的とした治療とケアの調整を約束することにある。
過去10年間で、精度オンコロジーのためのマルチモーダルデータ統合技術は、大きな進歩を遂げてきた。
精密腫瘍学における最先端のマルチモーダルデータ統合技術について概説した約300の論文の概要を概説する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:35:05 GMT)
Last Iterate Convergence of Incremental Methods and Applications in Continual Learning [10.8] 連続学習における応用により、漸進的勾配法と漸進的近位法の両方の最後の繰り返しに対する収束保証を得る。
一般化を伴う連続学習のモデルとしての漸進的近位法について検討し,大惨な忘れ込みを防ぐために大量の正規化が不可欠であると主張している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:25:20 GMT)
Solving Token Gradient Conflict in Mixture-of-Experts for Large Vision-Language Model [10.7] 大規模視覚言語モデル(LVLM)研究において,Mixture-of-Experts(MoE)が注目されている。
LVLMの既存のMoEメソッドは、異なる専門家に異なるトークンを扱うよう促すため、ルータを使用して各トークンのルーティングを予測する。
本稿ではトークンレベルの勾配解析に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:20:17 GMT)
Optimizing Cyber Defense in Dynamic Active Directories through Reinforcement Learning [10.6] 本稿では,動的実世界のネットワークにおけるエッジブロッキングACO戦略の欠如に対処する。
具体的には、組織的Active Directory(AD)システムのサイバーセキュリティ脆弱性を対象とする。
ADシステムを静的エンティティとみなす、エッジブロッキング防衛に関する既存の文献とは異なり、本研究では、それらの動的性質を認識してこれに対応する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:37:46 GMT)
A Refer-and-Ground Multimodal Large Language Model for Biomedicine [10.5] Med-GRIT-270kデータセットは、バイオメディカルドメインに初めて専用のデータセットであり、参照と地上の会話を統合している。
本稿では,このデータセットとマルチタスク・インストラクション・ラーニングを用いて,バイオメディシンのためのRefer-and-Ground Multimodal Large Language Model(BiRD)を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:43:39 GMT)
Optimized 3D Point Labeling with Leaders Using the Beams Displacement Method [10.5] リーダーレーベルは、ポジション・コンフィギュレーションにおいて大きな自由を持っている。
我々は,地図変位問題の解法に類似したラベル位置の動的構成過程を概念化する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:31:37 GMT)
SBOM.EXE: Countering Dynamic Code Injection based on Software Bill of Materials in Java [10.4] ソフトウェアサプライチェーンの攻撃は重大な脅威となっている。
従来のセーフガードは、ビルド時にサプライチェーン攻撃を軽減することができるが、実行時の脅威を軽減するには限界がある。
本稿では,SBOM.EXEについて紹介する。SBOM.EXEは,Javaアプリケーションをそのような脅威から保護するためのプロアクティブシステムである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:08:17 GMT)
Multimodal Learning and Cognitive Processes in Radiology: MedGaze for Chest X-ray Scanpath Prediction [10.4] 提案システムは,放射線学報告やCXR画像から視線シーケンスを予測することを目的としている。
本モデルでは, 医用スキャンパス予測において重要な固定座標と期間を予測し, コンピュータビジョンコミュニティにおける既存モデルよりも優れていた。
放射線学者の評価に基づいて、MedGazeは関連する領域に焦点をあてたヒトのような視線配列を生成することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:38:58 GMT)
FloorSet -- a VLSI Floorplanning Dataset with Design Constraints of Real-World SoCs [10.3] システム・オン・ア・チップ(SoC)とそのサブシステムのフロアプランニングは、物理的設計フローの重要かつ非自明なステップである。
FloorSet -- 合成固定アウトラインフロアプランレイアウトの包括的なデータセットを2つ紹介する。
FloorSetは、大規模制約付き最適化問題の基礎研究を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:05:14 GMT)
From Local Concepts to Universals: Evaluating the Multicultural Understanding of Vision-Language Models [10.1] 視覚言語モデルの性能は、西欧文化のイメージに最適以下である。
様々なベンチマークが、モデルの文化的傾向をテストするために提案されているが、それらは限られた範囲の文化をカバーしている。
我々はGlobalRGベンチマークを導入し、普遍性を越えた検索と文化的な視覚的接地という2つの課題からなる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:28:28 GMT)
Quantum computation of conical intersections on a programmable superconducting quantum processor [10.1] 円錐交差(CI)は多くの光化学過程において中心的である。
本稿では,量子古典的状態平均空間自己整合法の最初の成功例を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:02:07 GMT)
Semihierarchical Reconstruction and Weak-area Revisiting for Robotic Visual Seafloor Mapping [10.0] 海底のヘクタールの自動3次元再構築を容易にするために,ナビゲーション支援型階層的再構築手法を提案する。
我々の階層的アプローチは、漸進的なSfMよりもはるかに効率的であるSLAMとグローバルSfMの利点を組み合わせたものです。
これは、問題または弱い再構成された領域を特定し再考し、画像の省略を避け、限られた潜水時間をうまく利用することで達成される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 20:37:38 GMT)
Kernel vs. Kernel: Exploring How the Data Structure Affects Neural Collapse [10.0] ニューラル・コラプス(Neural Collapse)とは、NC1と呼ばれるネットワークの最も深い機能のクラス内での多様性の低下である。
この制限に悩まされないカーネルベースの分析を提供する。
NTKは、原型データモデルに対するNNGPよりも崩壊した特徴を表現していないことを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:05:53 GMT)
A Survey on Deep Clustering: From the Prior Perspective [9.6] この調査は、6種類の事前知識に分類することで、ディープクラスタリング手法の包括的なレビューを提供する。
広範に使われている5つのデータセットのベンチマークを提供し、様々な先行する手法のパフォーマンスを分析する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:18:16 GMT)
ITERTL: An Iterative Framework for Fine-tuning LLMs for RTL Code Generation [9.4] 大規模言語モデル(LLM)は、人間の命令を理解し、コードを生成するのに優れた性能を示した。
我々は,ITERTLという,シンプルながら効果的な反復訓練パラダイムを導入する。
提案手法によってトレーニングされたモデルは、最先端のオープンソースモデル(SOTA)と競合し、さらに優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:44:57 GMT)
CSAKD: Knowledge Distillation with Cross Self-Attention for Hyperspectral and Multispectral Image Fusion [9.3] 本稿では, HR-MSI/LR-HSI融合のための新しい知識蒸留(KD)フレームワークを導入し, LR-HSIのSRを実現する。
LR-HSI と HR-MSI の空間的特徴表現とスペクトル的特徴表現をフル活用するために,我々は新しい自己認識(CSA)融合モジュールを提案する。
実験結果から,学生モデルがLR-HSI SRの性能に匹敵する結果を得た。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:25:57 GMT)
eMoE-Tracker: Environmental MoE-based Transformer for Robust Event-guided Object Tracking [9.3] 本稿では,eMoE-Trackerと呼ばれる,トランスフォーマーに基づくイベント誘導トラッキングフレームワークを提案する。
私たちのキーとなるアイデアは、環境をいくつかの学習可能な属性に分解し、属性固有の特徴を動的に学習することです。
さまざまなイベントベースのベンチマークデータセットの実験は、従来の技術と比較して、eMoE-Trackerの優れたパフォーマンスを示しています。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:13:55 GMT)
Importance Weighted Expectation-Maximization for Protein Sequence Design [8.7] そこで本研究では,IsEM-Proという,特定の適合基準に向けてタンパク質配列を生成する手法を提案する。
中心となるIsEM-Proは、独立に学習されたマルコフランダムフィールド(MRF)の構造特徴によって強化された潜在生成モデルである。
8つのタンパク質配列設計タスクの実験により、我々のIsEM-Proは、平均的なフィットネススコアで少なくとも55%以上のパフォーマンスで過去のベストメソッドよりも優れていたことが示される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:36:08 GMT)
Combating Missed Recalls in E-commerce Search: A CoT-Prompting Testing Approach [8.7] mrDetectorは、ミスリコールに特化した最初の自動テスト手法です。
実際の産業データによる実験では、mDetectorは17の偽陽性で100以上のミスリコールを発見した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:44:57 GMT)
QuTracer: Mitigating Quantum Gate and Measurement Errors by Tracing Subsets of Qubits [8.5] 量子誤差緩和は、現在のノイズの中規模量子(NISQ)時代に重要な役割を果たす。
キュービットのサブセットにおけるゲートと測定誤差を緩和するフレームワークQuTracerを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:39:14 GMT)
Directly Training Temporal Spiking Neural Network with Sparse Surrogate Gradient [8.5] 脳にインスパイアされたスパイキングニューラルネットワーク(SNN)は、イベントベースのコンピューティングとエネルギー効率の良い機能によって、多くの注目を集めている。
本研究では,SNNの一般化能力を向上させるため,MSG(Masked Surrogate Gradients)を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:21:32 GMT)
JMLR: Joint Medical LLM and Retrieval Training for Enhancing Reasoning and Professional Question Answering Capability [8.5] LLM(Large Language Models)は、医学知識の獲得と質問応答において顕著な可能性を実証している。
LLMは、ドメイン固有の事前訓練であっても、幻覚を起こし、事実的に誤った結果をもたらす可能性がある。
JMLR(LLMと情報検索)を微調整期間中に導入し,幻覚に対処する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:23:31 GMT)
ProgressGym: Alignment with a Millennium of Moral Progress [8.5] プログレスガイム(ProgressGym)は、道徳的進歩力学を歴史から学べる実験的なフレームワークである。
本稿では,進捗アライメントのベースライン手法として,長寿命・外挿アルゴリズムを提案する。
私たちは、新しいアルゴリズムと課題を募集するオープンなリーダーボードを構築します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:55:24 GMT)
The global landscape of academic guidelines for generative AI and Large Language Models [8.4] ジェネレーティブ・人工知能(GAI)とLarge Language Models(LLM)の学界への統合は、その潜在的な教育的利益と倫理的考察に関する世界的な議論を刺激している。
ポジティブな反応は、コラボレーティブな創造性、教育へのアクセスの増加、トレーナーとトレーナーの強化など、いくつかの可能性を強調している。
しかし、ネガティブな反応は、倫理的な複雑さ、イノベーションと学術的整合性のバランス、不平等なアクセス、誤情報リスクに関する懸念を引き起こす。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:54:06 GMT)
The Computational Curse of Big Data for Bayesian Additive Regression Trees: A Hitting Time Analysis [8.4] BARTサンプルは、しばしばゆっくり収束し、他の研究者による経験的観察を確認する。
n$が増加するにつれて、近似的なBART後部は、正確な後部とますます異なる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:45:29 GMT)
IDT: Dual-Task Adversarial Attacks for Privacy Protection [8.3] プライバシを保護するには、センシティブな属性を検出できないモデル内の表現を使用する必要がある。
補助的および解釈可能なモデルによる予測を分析し,どのトークンが変更に重要かを識別する手法であるIDTを提案する。
我々は、異なるタスクに適したNLPのための異なるデータセットを評価する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:14:35 GMT)
An Approach to Detect Abnormal Submissions for CodeWorkout Dataset [8.1] 本稿では,異常を伴うログデータを解析するための予備研究について述べる。
本研究の目的は、プログラミング学習環境におけるパーソナライズ可能なレコメンデーションをモデル化する際の異常な事例を克服することである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:26:15 GMT)
Enhancing Stability for Large Models Training in Constrained Bandwidth Networks [8.0] 我々は、階層分割(hpZ)方式における競合状態が、数十億のパラメータを持つモデルのトレーニング時に不安定を引き起こす可能性を示す。
次に、これらの収束問題に対処し、競争力のあるトレーニング効率を維持しながら、分割アルゴリズムの変更を提案する。
このアルゴリズムは、98%のスループットを持つ大型モデルの堅牢なトレーニングを可能にし、収束の質を犠牲にすることなく、モデルのトレーニング速度を向上する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:46:10 GMT)
CANDY: A Benchmark for Continuous Approximate Nearest Neighbor Search with Dynamic Data Ingestion [8.0] 我々は、動的データ取り込みを伴う連続近似Nearest Neighbor Searchに適したベンチマークであるCANDYを紹介する。
CANDYは幅広いAKNNアルゴリズムを包括的に評価し、機械学習駆動推論のような高度な最適化を統合する。
多様なデータセットに対する評価では、より単純なAKNNベースラインが、リコールやレイテンシの点で、より複雑な選択肢を上回ることが示されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:46:11 GMT)
Vision Transformer with Key-select Routing Attention for Single Image Dehazing [8.0] Ksformerは、マルチチャネル、トップk演算子付きマルチスケールウィンドウ、およびLFPM(Lightweight Frequency Processing Module)を用いて、キー領域のインテリジェントな選択にMKRA(Multiscale Key-Select Routing Attention)を利用する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:28:50 GMT)
M2Lingual: Enhancing Multilingual, Multi-Turn Instruction Alignment in Large Language Models [8.0] 我々は,M2Lingualと呼ばれる多言語多言語命令微調整データセットの完全合成・新規分類法(Evol)を提案する。
最初は多様な種子の例を選択し、次に提案されたEvol分類を用いてこれらの種子を複雑で挑戦的なマルチターン命令に変換することによって構築される。
異なる大きさのLLMを学習し,多種多様な言語に対して性能向上を示すことで,M2Lingualの有効性を実証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:14:53 GMT)
Nearest Neighbor Sampling for Covariate Shift Adaptation [7.9] 重みを推定しない新しい共変量シフト適応法を提案する。
基本的な考え方は、ソースデータセットの$k$-nearestの隣人によってラベル付けされたラベル付けされていないターゲットデータを直接扱うことだ。
実験の結果, 走行時間を大幅に短縮できることがわかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:10:53 GMT)
On the Response Entropy of APUFs [7.9] Physically Unclonable Function (PUF) は、認証と鍵生成に使用されるハードウェアセキュリティプリミティブである。
反応エントロピー(英: response entropy、英: response entropy)は、1つの(および2つの)他の反応の知識が与えられた任意の反応のエントロピーである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:02:50 GMT)
ULLER: A Unified Language for Learning and Reasoning [7.7] 我々はNeSyのための言語を提案し、それをULLER(Unfied Language for LEarning and Reasoning)と呼ぶ。
ULLERは様々な設定を包含し、その知識が既存のNeSyシステムで利用できることを保証している。
ULLERはNeSyリサーチをよりアクセスしやすく、同等にするための第一歩だと思います。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:48:06 GMT)
AI for Extreme Event Modeling and Understanding: Methodologies and Challenges [7.6] この論文は、AIが極端な出来事(洪水、干ばつ、山火事、熱波など)を分析するためにどのように使われているのかをレビューする。
限られたデータに対処し、情報をリアルタイムで統合し、モデルをデプロイし、それらを理解できるようにするというハードルについて論じる。
私たちは、実践的、理解可能、信頼に値するAIソリューションを作成するために、さまざまな分野にわたるコラボレーションの必要性を強調します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:45:25 GMT)
FRED: Flexible REduction-Distribution Interconnect and Communication Implementation for Wafer-Scale Distributed Training of DNN Models [7.6] 分散ディープニューラルネットワーク(DNN)トレーニングは、トレーニングタスクを複数のアクセラレータに分散することで、トレーニングオーバーヘッドを低減するテクニックである。
我々は,ウエハスケールネットワークの高BW要求に適したウェハスケール相互接続であるFREDを提案する。
その結果、FREDはResNet-152, Transformer-17B, GPT-3, Transformer-1Tの平均エンドツーエンドトレーニング時間を1.76X, 1.87X, 1.34X, 1.4Xで改善できることがわかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:05:53 GMT)
GRACE: Graph-Regularized Attentive Convolutional Entanglement with Laplacian Smoothing for Robust DeepFake Video Detection [7.6] 本稿では,グラフラプラシアンを用いたグラフ畳み込みネットワークに基づく,堅牢なDeepFakeビデオ検出手法を提案する。
提案手法は,雑音の多い顔シーケンス下でのDeepFakeビデオ検出における最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:17:16 GMT)
A Small and Fast BERT for Chinese Medical Punctuation Restoration [6.6] そこで本研究では,中国医学的句読点回復のための「事前訓練・微調整」パラダイムに基づく,高速で軽量な事前訓練モデルを提案する。
各種蒸留モデルを用いた実験により, 現状の中国RoBERTaと比較して, モデルサイズが10%であるのに対して, 95%の性能が得られることがわかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:44:36 GMT)
Towards Secure and Efficient Data Scheduling for Vehicular Social Networks [6.5] 本稿では,車載ソーシャルネットワーク内でのデータ伝送をスケジューリングする革新的な学習アルゴリズムを提案する。
このアルゴリズムはまず、特別に構築されたニューラルネットワークを使用して、データ処理能力を向上する。
データ転送フェーズ中にQラーニングパラダイムを組み込んで情報交換を最適化する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:20:50 GMT)
Prompting Explicit and Implicit Knowledge for Multi-hop Question Answering Based on Human Reading Process [6.4] 心理学的研究は、通過中の明示的な情報と読書中の人間の事前知識の間に重要なつながりがあることを示唆している。
本稿では,明示的知識と暗黙的知識を結び付けるためにプロンプトを利用するPmpting Explicit and Implicit Knowledge (PEI)フレームワークを提案する。
我々のモデルは、暗黙の知識の形式であるプロンプトによる型固有の推論を取り入れている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:26:41 GMT)
Exploiting Structure in Quantum Relative Entropy Programs [6.3] 量子情報理論の応用から生じる共通構造が、量子相対エントロピープログラムの解法効率を向上させるためにどのように活用できるかを示す。
数値計算の結果,これらの手法は計算時間を最大数桁改善し,それまでの難解な問題を解くことができることがわかった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:37:45 GMT)
Emotion Loss Attacking: Adversarial Attack Perception for Skeleton based on Multi-dimensional Features [6.2] 骨格運動に対する行動認識器を攻撃するための新しい攻撃法を提案する。
本手法は骨格運動の差を測定するために動的距離関数を体系的に提案する。
我々は、感情的特徴の有効性を初めて証明し、骨格運動間の距離を測定するための新しいアイデアを提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:45:37 GMT)
Towards Secure Management of Edge-Cloud IoT Microservices using Policy as Code [6.2] IoTアプリケーションプロバイダは、IoTデータを貴重な情報に変換するアプリケーションを開発するために、ますますMicroService Architecture(MSA)を使用している。
提案されたフレームワークには、“コントロールプレーン”が含まれており、クラウドネイティブ(コンテナオーケストレータとサービスメッシュ)テクノロジをインテリジェントかつ動的に利用して、セキュリティポリシを強制する。
提案されたフレームワークのプロトタイプを、Docker、Istio、Open Policy Agentといったオープンソースのクラウドネイティブテクノロジを使って実装し、フレームワークを検証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:53:32 GMT)
Solving the Inverse Problem of Electrocardiography for Cardiac Digital Twins: A Survey [6.2] ECG逆問題の解決は、正確な仮想心臓モデリングに不可欠である。
近年の進歩は、仮想心臓モデリングの強化に大きく貢献している。
本稿では,ECG逆問題の解法を包括的に検討することを目的とする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:24:45 GMT)
Minimax And Adaptive Transfer Learning for Nonparametric Classification under Distributed Differential Privacy Constraints [6.0] まず、プライバシ制約、ソースサンプル、ターゲットサンプルが分類精度に与える影響を正確に評価し、ミニマックスの誤分類率を確立する。
その結果、興味深い位相遷移現象が明らかとなり、プライバシーの保護と分類精度の達成との複雑なトレードオフが浮き彫りになった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:55:41 GMT)
Rateless Stochastic Coding for Delay-constrained Semantic Communication [5.9] 我々は、歪みと知覚制約を伴い、達成可能なジョイントソースチャネル符号レートに対して、新しい有限ブロック長境界を求める。
次に、レートレス符号化(RSC)と呼ばれる新しいJSCC符号化方式を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:27:06 GMT)
Scalable Bayesian uncertainty quantification with data-driven priors for radio interferometric imaging [5.7] 次世代の電波干渉計は、前例のない角分解能と感度のおかげで、科学的発見を解き放つ可能性がある。
潜在的な可能性を解き放つ鍵の1つは、受信データの希薄さと複雑さを扱うことである。
本研究では,ラジオインターフェロメトリイメージングにおける不確実性定量化に対処するQuantifAIという手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:17:05 GMT)
MatText: Do Language Models Need More than Text & Scale for Materials Modeling? [5.6] MatTextは、モデリング材料における言語モデルのパフォーマンスを体系的に評価するために設計されたベンチマークツールとデータセットのスイートである。
MatTextは、材料科学の文脈で言語モデルのパフォーマンスをトレーニングし、ベンチマークするための重要なツールを提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:28:04 GMT)
Is Watermarking LLM-Generated Code Robust? [5.5] 大規模言語モデルにより生成されたPythonコードに対する既存の透かし手法の堅牢性に関する最初の研究について述べる。
セマンティック保存変換により、これらの透かしをコードから取り除くことは容易であることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:35:22 GMT)
Tracking Object Positions in Reinforcement Learning: A Metric for Keypoint Detection (extended version) [5.5] ロボット制御のための強化学習(RL)は通常、環境状態の詳細な表現を必要とする。
空間オートエンコーダ(SAE)のようなキーポイント検出器は、高次元画像データから低次元表現を抽出する一般的な手法である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:02:06 GMT)
Detecting Subtle Differences between Human and Model Languages Using Spectrum of Relative Likelihood [5.4] 本研究は、絶対値ではなく相対的確率値を用いることにより、新たな視点を提供する。
本稿では,教師型と教師型という2つの分類法を用いた検出手法を提案する。
また,人間の言語とモデル言語との微妙な差異を明らかにし,心理言語学研究の理論的ルーツを見出すことができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:28:52 GMT)
HAITCH: A Framework for Distortion and Motion Correction in Fetal Multi-Shell Diffusion-Weighted MRI [5.4] この研究は、マルチシェル高角解像度胎児dMRIデータの修正と再構成を行う最初の、かつ唯一公開されたツールであるHAITCHを提示する。
HaITCHは、動的歪み補正のためのblip-reversed dual-echo取得を含む、いくつかの技術的進歩を提供している。
HaITCHはアーティファクトの除去に成功し、高度な拡散モデリングに適した高忠実度胎児dMRIデータを再構成する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:40:57 GMT)
Scalable Training of Graph Foundation Models for Atomistic Materials Modeling: A Case Study with HydraGNN [5.4] 我々はHydraGNNを用いたスケーラブルグラフ基盤モデル(GFM)の開発と訓練について述べる。
HydraGNNは、トレーニングスケールとデータの多様性の両方において、グラフニューラルネットワーク(GNN)の境界を広げている。
GFMはマルチタスク学習(MTL)を用いて、原子構造体のグラフレベルとノードレベルの特性を同時に学習する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:58:27 GMT)
VarteX: Enhancing Weather Forecast through Distributed Variable Representation [5.3] 近年のデータ駆動型モデルでは, 予測性能の深層学習を利用して, 数値的な天気予報に勝っている。
本研究では,新しい変数集約方式と,その課題に対する効率的な学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:42:30 GMT)
Transformer-based Image and Video Inpainting: Current Challenges and Future Directions [5.2] 塗り絵は、写真復元、ビデオ編集、医用画像撮影など、様々な応用に有効なソリューションである。
CNNとGAN(Generative Adversarial Network)は、インペイントタスクを大幅に強化した。
ビジュアルトランスフォーマーが利用され、画像やビデオのインペイントにいくつかの改善が加えられている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 20:42:36 GMT)
LLM Critics Help Catch LLM Bugs [5.2] モデル記述コードをより正確に評価するのに役立つ“批判的”モデルをトレーニングします。
自然に発生するエラーを含むコードについては、63%のケースで人間の批判よりもモデルによる批判が好ましい。
当社の微調整LDM批評家は、ChatGPTトレーニングデータに数百のエラーを"flawless"と評価できることを確認した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:53:17 GMT)
EPOCH: Jointly Estimating the 3D Pose of Cameras and Humans [5.0] モノクラーヒューマンポース推定は、カメラが捉えた単一の2D画像から人間の関節の3D位置を決定することを目的としている。
本研究では,近似に頼らず,全視点カメラモデルの利用を提唱する。
本稿では,プライスリフタネットワーク(LiftNet)とプライスレグレシタネットワーク(RegNet)の2つの主要コンポーネントからなるEPOCHフレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:16:54 GMT)
SAT and Lattice Reduction for Integer Factorization [5.0] ランダムリークビット因数分解問題の解法として,新しいハイブリッドSATおよび計算機代数手法を提案する。
我々の実装は、純粋なSATや純粋計算機代数のアプローチよりもはるかに高速なランダムリークビット分解問題を解く。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:30:20 GMT)
Navigating LLM Ethics: Advancements, Challenges, and Future Directions [5.0] 本研究では,人工知能分野におけるLarge Language Models(LLM)を取り巻く倫理的問題に対処する。
LLMと他のAIシステムによってもたらされる共通の倫理的課題を探求する。
幻覚、検証可能な説明責任、検閲の複雑さの復号化といった課題を強調している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:56:09 GMT)
FAdam: Adam is a natural gradient optimizer using diagonal empirical Fisher information [5.0] 我々はアダムの対角的経験的フィッシャー情報行列(FIM)を厳密に分析した。
我々の分析は、元のAdamアルゴリズムの欠陥を明らかにし、提案された修正に繋がる。
修正アルゴリズムであるFisher Adam (FAdam) は、様々な領域で優れた性能を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:55:48 GMT)
Contextualized Hybrid Ensemble Q-learning: Learning Fast with Control Priors [5.0] 適応型ハイブリッド強化学習アルゴリズムCHEQ(Contextualized Hybrid Ensemble Q-learning)を提案する。
CHEQは、(i)適応重みを文脈変数として扱う適応ハイブリッドRL問題の時間不変な定式化、(ii)批判アンサンブルのパラメトリック不確実性に基づく重み適応機構、(iii)データ効率RLのためのアンサンブルベースの加速度の3つの重要な要素を組み合わせる。
CHEQをカーレースタスクで評価することで、最先端の適応型ハイブリッドRL法よりもデータ効率、探索安全性、未知のシナリオへの転送性が大幅に向上する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:17:51 GMT)
SHA-256 Collision Attack with Programmatic SAT [5.0] 最良のSHA-256衝突攻撃は、より少ないステップで縮小されたSHA-256の簡易バージョンにおける衝突を見つけるために差分暗号解析を使用する。
本稿では,ステップ再現型SHA-256衝突を探索するツールとして,SAT(SAT)ソルバを用いる。
我々のハイブリッドSAT+CASソルバは、純粋なSATアプローチよりも優れており、ステップリデュースされたSHA-256における衝突を、はるかに多くのステップで検出することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:30:20 GMT)
UINav: A Practical Approach to Train On-Device Automation Agents [5.0] モバイル機器に適合する自動化エージェントをトレーニングするための,デモベースのアプローチであるUINavを提案する。
わずか10のデモでUINavは70%の精度を達成でき、十分なデモで90%以上の精度を達成できる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:25:41 GMT)
Edge-DIRECT: A Deep Reinforcement Learning-based Method for Solving Heterogeneous Electric Vehicle Routing Problem with Time Window Constraints [4.9] 本稿では,時間制約付き異種電気自動車経路問題(HEVRPTW)について検討する。
We propose a DRL-based approach, named Edge-enhanced Dual attentIon encoderR and feature-EnhanCed dual attention decoder (Edge-DIRECT)。
2つの実世界のデータセットに基づく実験結果から、Edge-DIRECTは、最先端のDRLベースの手法と、ソリューションの品質と実行時間の確立したアプローチよりも優れていることが明らかになった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:18:12 GMT)
Systematizing Modeler Experience (MX) in Model-Driven Engineering Success Stories [4.8] everything-as-codeやlow-codeといった代替パラダイムは、使いやすさが認識されているため、受け入れられている。
モデラー体験のレンズを通して、これらの知覚間の二分法を探求する」
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:27:33 GMT)
Hidden orders and phase transitions for the fully packed quantum loop model on the triangular lattice [4.8] 量子ループと二量体モデルは、局所的な制約を伴う原型相関系である。
三角格子完全充填量子ループモデルの全位相図を明らかにする。
この結果は、実験と理論の両方における最近の発展に関係しており、隠れた相と遷移のさらなる研究を促進する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:52:47 GMT)
Protein Representation Learning with Sequence Information Embedding: Does it Always Lead to a Better Performance? [4.7] 本稿では,アミノ酸構造表現のみに基づく局所幾何アライメント手法ProtLOCAを提案する。
本手法は,構造的に整合性のあるタンパク質ドメインとより迅速かつ正確にマッチングすることで,既存の配列および構造に基づく表現学習法より優れる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:54:37 GMT)
LatentExplainer: Explaining Latent Representations in Deep Generative Models with Multi-modal Foundation Models [4.7] 本稿では,深層生成モデルにおける潜伏変数の意味論的説明を自動的に生成するフレームワークであるLatentExplainerを紹介する。
LatentExplainerは、潜伏変数の意味の推測、帰納的バイアスによる説明の整合、さまざまな説明可能性の扱いの3つの主な課題に取り組む。
提案手法を実環境および合成データセット上で評価し,提案手法は潜伏変数の高品質な説明を生成する上で優れた性能を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:19:37 GMT)
A parallel evolutionary algorithm to optimize dynamic memory managers in embedded systems [4.7] 組込みシステムにおけるDMM最適化のための新しい並列進化アルゴリズムを提案する。
我々のフレームワークは、他の最先端のアプローチと比較して86.40倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:47:25 GMT)
From Problem to Solution: A general Pipeline to Solve Optimisation Problems on Quantum Hardware [4.5] 本稿では、複数のステージにわたる22のアクティビティの深さで新規な、包括的な量子最適化開発パイプラインを提案する。
私たちは、文献やユースケースを幅広くスクリーニングし、専門家にインタビューし、この一般的な量子パイプラインを開発するための専門知識を持ってきました。
提案するソリューションパイプラインは,ユースケース識別,ソリューションドラフト,前処理,実行,後処理の5段階に分けられる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:35:14 GMT)
Latent variable model for high-dimensional point process with structured missingness [4.5] 縦断データは医療、社会学、地震学など多くの分野で重要である。
実世界のデータセットは高次元であり、構造化された欠陥パターンを含み、測定時間ポイントは未知のプロセスによって管理される。
これらの制限に対処可能な、柔軟で効率的な潜在変数モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:27:29 GMT)
Assessment of Sentinel-2 spatial and temporal coverage based on the scene classification layer [4.4] 本稿では,領域のクリーンな光学的カバレッジを評価する手法を提案する。
手動しきい値とSCLの特定のラベルにより、提案手法は空間的および時間的カバレッジのパーセンテージを割り当てる。
この評価は,MLモデルの予測結果と相関することを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:34:25 GMT)
Perturbative solution approach for computing the two-photon Kapitza-Dirac effect in a Gaussian beam standing light wave [4.4] カピツァ・ディラック効果の理論的なスピン特性は、平面波の描写を超えたものは不明である。
相対論的定式化における2光子Kapitza-Dirac効果の電子回折計算法を開発した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:49:22 GMT)
Improving Performance Prediction of Electrolyte Formulations with Transformer-based Molecular Representation Model [4.3] 本稿では, 変圧器を用いた分子表現モデルを用いて, 電解質の表現を効果的かつ効率的に取得する手法を提案する。
提案手法の性能を2つの電池特性予測タスクで評価し, 現状の手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:55:29 GMT)
Entanglement Assisted Squeezed States of Light in All Fiber Form-Factor [4.3] 記録7.5 (pm)0.1 dBは、全ファイバ、全誘導波プラットフォーム内で測定される。
特に5.1dBと1.1dBを部分的にコヒーレントでカオス的な時間周波数モードで測定した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:22:53 GMT)
Solving Differential Equations using Physics-Informed Deep Equilibrium Models [4.2] 本稿では、常微分方程式(ODE)の初期値問題(IVP)を解決する物理インフォームド・ディープ平衡モデル(PIDEQ)を提案する。
この研究は、深層学習と物理に基づくモデリングをブリッジすることで、IVPを解くための計算技術を進歩させ、科学計算と工学の応用に寄与する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:44:28 GMT)
Model Predictive Simulation Using Structured Graphical Models and Transformers [4.2] 本稿では、トランスフォーマと確率的グラフィカルモデル(PGM)に基づいて、複数の対話エージェント(道路利用者)の軌跡をシミュレートする手法を提案する。
次に, 先行知識を符号化する因子を含むPGMを用いて, これらの軌道を改良する。
我々はMPSがMTRベースラインを改善することを示し、特に衝突速度などの安全クリティカルな指標について述べる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:46:53 GMT)
The Pitfalls of Publishing in the Age of LLMs: Strange and Surprising Adventures with a High-Impact NLP Journal [4.2] 学術出版界の難解な側面を概説し,NLP誌による最近の事例研究を通して解説する。
学術出版界の難解な側面を概説し,NLP誌による最近の事例研究を通して解説する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:58:42 GMT)
On Central Primitives for Quantum Cryptography with Classical Communication [4.1] OWPuzzのコンバインダ、正確性、セキュリティの増幅、ユニバーサルな構成について述べる。
OWPuzzは、コミットメント、対称鍵暗号、従って擬似ランダム状態(PRS)を含む他のプリミティブのプリミティブによって暗示されていることが以前は知られていた。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:44:56 GMT)
Random coordinate descent: a simple alternative for optimizing parameterized quantum circuits [4.1] 本稿では、全勾配降下アルゴリズムに代わる実用的で実装が容易なランダム座標降下アルゴリズムを提案する。
本稿では,パラメータ化量子回路の実用最適化における計測ノイズの挙動から,解析可能な最適化問題を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:25:10 GMT)
Unified Framework for Calculating Convex Roof Resource Measures [4.1] 本稿では,コンベックスルーフ拡張から導かれる,広く利用されている量子資源測定のクラスに対する統一的な計算フレームワークを提案する。
我々は,この手法の有効性を,絡み合い,コヒーレンス,マジック状態など,いくつかの重要な量子資源に適用することによって実証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:45:58 GMT)
The Persistence of Contrarianism on Twitter: Mapping users' sharing habits for the Ukraine war, COVID-19 vaccination, and the 2022 Midterm Elections [3.8] われわれは、新型コロナウイルスのワクチン接種、ウクライナ戦争、2022年の中間選挙に関するTwitterデータの3つのサンプルを比較した。
以上の結果から,公衆衛生の物語・政治に対する反対によって定義された幅広い反トラスト的姿勢の出現が示唆された。
われわれは、Twitterユーザーの間でイデオロギー的に一貫性のあるクロスオブジェクトのスタンスの存在を確認するが、右派政治的指向とは正反対である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:20:50 GMT)
Quantum error cancellation in photonic systems -- undoing photon losses [3.6] 実際のフォトニックデバイスは、システムに符号化された量子情報を復号化できる光子損失を受ける。
本稿では,確率的エラーキャンセルにインスパイアされたエラー軽減プロトコルを提案する。
提案プロトコルは,期待値推定タスクにおける光子損失を解消できることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:30:31 GMT)
A Differentiable Approach to Multi-scale Brain Modeling [3.6] 本稿では,脳シミュレータBrainPyを用いたマルチスケール微分脳モデリングワークフローを提案する。
単一ニューロンレベルでは、微分可能なニューロンモデルを実装し、電気生理学的データへの適合を最適化するために勾配法を用いる。
ネットワークレベルでは、生物学的に制約されたネットワークモデルを構築するためにコネクトロミックデータを組み込む。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:41:31 GMT)
Classical Bandit Algorithms for Entanglement Detection in Parameterized Qubit States [3.6] 絡み合い(Entanglement)は、量子情報やコンピューティングにおける幅広いタスクの鍵となるリソースである。
本稿では,量子絡み検出に古典的機械学習技術を用いる可能性を強調する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:26:47 GMT)
External Model Motivated Agents: Reinforcement Learning for Enhanced Environment Sampling [3.5] 強化学習(RL)エージェントとは異なり、人間は環境の変化において有能なマルチタスクのままである。
環境変化における外部モデルの適応効率を向上させるために,RLエージェントのエージェント影響フレームワークを提案する。
提案手法は,効率と性能の両面を測る指標に対する外部モデル適応の観点から,ベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:31:22 GMT)
Submodular Information Selection for Hypothesis Testing with Misclassification Penalties [3.3] 仮説テスト/分類タスクにおいて,情報ソースの最適サブセットを選択する問題について検討する。
異なる誤分類誤りに対する一様でない処理を可能にする誤分類ペナルティフレームワークを提案する。
我々は,この指標が準モジュラであることを示すとともに,両情報集合選択問題に対するグリーディアルゴリズムのほぼ最適保証を確立する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:51:23 GMT)
Filtration learning in exact multi-parameter persistent homology and classification of time-series data [3.2] EMPHのフィルタ学習のためのフレームワークを提案する。
フィルタパラメータに対する損失関数の勾配の正確な式を導出する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:25:43 GMT)
Secure Outsourced Decryption for HE-based Privacy-preserving Cloud Computing System [3.1] ホモモルフィック暗号化(HE)は、データのプライバシを保護するためのソリューションのひとつであり、暗号化されたデータをクラウドでセキュアに処理できるようにする。
我々は、RLWEベースのHEスキームのアウトソース復号プロトコルを提案し、元の復号を2つのルーチンに分割し、計算集約部分をクラウドでリモートで実行した。
実験により,提案プロトコルはクライアントのローカル復号化において最大67%の高速化を実現し,空間使用量の50%の削減を図った。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:51:36 GMT)
Doc2Token: Bridging Vocabulary Gap by Predicting Missing Tokens for E-commerce Search [3.1] 文書から欠落している関連トークンを予測し,検索用文書にこれらのトークンを含むDoc2Tokenを提案する。
Doc2Tokenは、新しいRGE予測スコアにおいてDoc2Queryよりも優れていることが示されている。
当社は、この機能を運用し、オンラインA/Bテストで大きな収益を上げ、Walmart.comのフルトラフィックにこの機能をローンチしました。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:26:30 GMT)
RESVMUNetX: A Low-Light Enhancement Network Based on VMamba [3.1] ResVMUNetXは明るさを高め、構造の詳細を復元し、低照度画像のノイズを取り除く。
毎秒70フレームまでのリアルタイム処理速度を実現している。
これにより、低照度画像の高精細化と、実用的でリアルタイムな応用の可能性を確認することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:21:49 GMT)
Digital Twin Calibration for Biological System-of-Systems: Cell Culture Manufacturing Process [3.1] 細胞培養プロセスのマルチスケール力学モデル(バイオシステム)について考察する。
サブモデルで構成されたモジュラー設計のこのモデルは、さまざまな生産プロセスにまたがるデータの統合を可能にします。
そこで我々は,Bio-SoSディジタルツインを校正するために,モデル予測の平均2乗誤差を評価し,個々のサブモデルのパラメータ推定誤差がディジタルツインの予測精度に与える影響を定量化する計算手法を開発した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:13:15 GMT)
Text2Robot: Evolutionary Robot Design from Text Descriptions [3.1] ユーザテキスト仕様とパフォーマンス選好を物理的四足歩行ロボットに変換するフレームワークであるText2Robotを紹介した。
Text2Robotは、高速なプロトタイピングを可能にし、生成モデルによるロボットデザインの新しい機会を開く。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:51:01 GMT)
FAGhead: Fully Animate Gaussian Head from Monocular Videos [3.0] FAGheadは、モノクロビデオから完全に制御可能な人間の肖像画を可能にする方法である。
従来の3次元形状メッシュ(3DMM)を明示し,中性な3次元ガウス多様体を複素表現で再構成するために最適化する。
アバターのエッジを効果的に管理するために,各画素のアルファ値を監督するアルファレンダリングを導入した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:47:10 GMT)
RuBLiMP: Russian Benchmark of Linguistic Minimal Pairs [3.0] 本稿では,RuBLiMP (Linguistic Minimal Pairs) のロシア語ベンチマークを紹介する。
RuBLiMPは文法性が異なる45k対の文を含み、形態的、構文的、意味的な現象を分離する。
ロシア語の言語モデルは, 構造的・合意的コントラストに敏感であるが, 構造的関係, 否定, 推移性, 時制の理解を必要とする現象に人間に遅れがあることが判明した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:43:25 GMT)
LLM4DESIGN: An Automated Multi-Modal System for Architectural and Environmental Design [2.9] 本研究では,建築・環境設計を高度に自動化したLLM4DESIGNを提案する。
創造性を育むためにマルチエージェントシステムを使用し、リアリズムの基盤設計にRAG(Retrieval Augmented Generation)、すべての情報を同期するためにVisual Language Models(VLM)を採用している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:57:50 GMT)
Fuzzy Logic Guided Reward Function Variation: An Oracle for Testing Reinforcement Learning Programs [2.9] 本稿では,ファジィ論理を用いたRL特性を利用した自動オラクル手法を提案する。
我々のオラクルは、エージェントの行動コンプライアンスと報酬ポリシーを定量化し、トレーニングエピソードの傾向を分析します。
コンプライアンス傾向がRL特性に由来する期待に反した場合、RLプログラムを"バギー"とラベル付けする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:41:17 GMT)
Predicting Elevated Risk of Hospitalization Following Emergency Department Discharges [2.7] 1つ以上の救急部訪問のタイミングに追随する入院は、適切な診断を下す機会の欠如の兆候であることが多い。
データマイニング技術が既存の大規模入院データセットにどのように適用され、これらの入院を高精度に予測する有用なモデルを学ぶことができるかを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:01:12 GMT)
SMLT-MUGC: Small, Medium, and Large Texts -- Machine versus User-Generated Content Detection and Comparison [2.7] 我々は,(1)小規模(選挙,FIFA,ゲーム・オブ・スローンズからのツイート),(2)媒体(Wikipedia導入,PubMed要約),(3)大規模(OpenAI Webテキストデータセット)の4つのデータセットにおける機械学習アルゴリズムの性能を比較した。
その結果,非常に大きなパラメータを持つLCM(例えば1542万パラメータを持つGPT2のXL-1542変種など)は,従来の機械学習手法による検出が困難であることが示唆された。
言語学,人格,感情,偏見,道徳など,多次元にわたる人文・機械文の特徴について検討する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:19:01 GMT)
Uncertainty Quantification for Molecular Property Predictions with Graph Neural Architecture Search [2.7] 本稿では,分子特性予測のための自動不確実性定量化(UQ)手法であるAutoGNNUQを紹介する。
我々のアプローチでは、分散分解を用いてデータ(アラート)とモデル(エステミック)の不確実性を分離し、それらを減らすための貴重な洞察を提供する。
AutoGNNUQは、正確な不確実性定量化が意思決定に不可欠である薬物発見や材料科学などの領域で広く適用可能である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:10:16 GMT)
Do prompt positions really matter? [2.6] 以上の結果から,モデル性能に対する実質的な影響を定量的に評価した。
先行研究で用いられるプロンプト位置は、しばしば準最適であり、この観測は広く使われている命令調整モデルにおいても一貫している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:04:53 GMT)
ModeConv: A Novel Convolution for Distinguishing Anomalous and Normal Structural Behavior [2.6] 固有モードは、期待状態からの構造力学と偏差に関する洞察を与える。
固有モードの変化を自動的にキャプチャして解析するModeConvを提案する。
ModeConvは計算効率の向上を示し、結果としてモデル計算のランタイムが削減される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:46:17 GMT)
Adjoint Sensitivity Analysis on Multi-Scale Bioprocess Stochastic Reaction Network [2.6] 本稿では,機械的モデルパラメータの学習を高速化するための随伴感度アプローチを提案する。
本稿では,多スケールのバイオプロセス力学モデルを表す酵素解析(SA)について考察する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:50:16 GMT)
Mind the Gap: Analyzing Lacunae with Transformer-Based Transcription [2.5] 我々は、ラグネーを含む合成データに基づいて訓練されたトランスフォーマーベース光学文字認識(OCR)モデルを採用する。
本研究は,ラグナの検出および修復における有効性を示し,その成功率を65%とした。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:52:39 GMT)
Concept-aware Data Construction Improves In-context Learning of Language Models [2.5] 従来の命令チューニングと比較して,概念認識型インコンテキスト学習が新しいタスクの大部分に有効であることを示す。
概念認識学習(CoAT)は,実演から類推的推論概念を学習する上で,LMにとって有益な訓練シナリオを構築するためのフレームワークである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:03:19 GMT)
SemUV: Deep Learning based semantic manipulation over UV texture map of virtual human heads [2.4] 本稿では,セムUVについて紹介する。セムUVは,FFHQ-UVデータセットを用いて,UVテクスチャ空間内でのセマンティックな操作を行う。
年齢、性別、顔の毛髪などの意味的特徴を効果的に修正しながら、アイデンティティを保存できる優れた能力を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 20:58:59 GMT)
Systematic Literature Review on Application of Learning-based Approaches in Continuous Integration [2.3] 機械学習(ML)とディープラーニング(DL)は生データを分析して、特定のフェーズにおける貴重な洞察を抽出する。
ソフトウェアプロジェクトにおける継続的プラクティスの台頭は、これらの学習ベースの手法による継続的インテグレーション(CI)の自動化を強調している。
この研究は、CIにおける学習ベースの手法の包括的概要を提供し、CIタスク自動化を開発する研究者や実践者に貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:10:23 GMT)
Fine-tuning of Geospatial Foundation Models for Aboveground Biomass Estimation [2.3] 地上バイオマスを推定するための地理空間基盤モデルの微調整は、スクラッチから訓練されたU-Netに匹敵する性能を有する。
また、ブラジルの異なるエコリージョンのスパースラベルを用いた衛星画像の微調整により、モデルの伝達学習能力についても検討する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:54:10 GMT)
Linear Noise Approximation Assisted Bayesian Inference on Mechanistic Model of Partially Observed Stochastic Reaction Network [2.3] 本稿では、部分的に観察された酵素反応ネットワーク(SRN)に対する効率的なベイズ推論手法を開発する。
線形雑音近似(LNA)メタモデルを提案する。
マルコフ・チェイン・モンテカルロの収束を高速化するために、導出確率の勾配を利用して効率的な後方サンプリング手法を開発した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:30:36 GMT)
MBIAS: Mitigating Bias in Large Language Models While Retaining Context [2.3] 多様なアプリケーションにおける大規模言語モデル(LLM)は、生成されたコンテンツのコンテキスト整合性を損なうことなく安全性を保証する必要がある。
安全対策に特化して設計されたカスタムデータセットに微調整を施したLLMフレームワークであるMBIASを紹介する。
MBIASは、主要な情報を保持しながら、LLM出力のバイアスや有害な要素を著しく減少させるように設計されている。
実証分析により、BIASは標準評価では30%以上、多様な人口統計検査では90%以上、偏見と毒性の低下を達成していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:35:15 GMT)
Function+Data Flow: A Framework to Specify Machine Learning Pipelines for Digital Twinning [2.3] 物理システムのためのデジタル双生児(DT)は人工知能(AI)をますます活用している
本稿では,DT内のAIパイプラインを記述するためのドメイン固有言語(t+Data Flow)を提案する。
具体的には、tは関数を第一級市民として扱い、AIで学んだモデルの効果的な操作を可能にする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:44:47 GMT)
Experimental observation of spontaneous symmetry breaking in a quantum phase transition [2.3] 自発的対称性の破れは、相転移に関連する様々な現象を理解する上で中心的な役割を果たす。
超伝導回路を応用した量子Rabiモデルによる実験実験を行った。
その結果, 環境による脱コヒーレンス(脱コヒーレンス)がSSBにおいて重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:14:27 GMT)
FI-CBL: A Probabilistic Method for Concept-Based Learning with Expert Rules [2.2] このメソッドの背後にある主なアイデアは、各概念に注釈付けされたイメージをパッチに分割し、オートエンコーダを使用してパッチを埋め込みに変換し、埋め込みをクラスタ化することである。
新しいイメージの概念を見つけるために,概念の事前確率と後続確率の計算による頻繁な推論を実装した。
数値実験により、FI-CBLは、トレーニングデータの数が小さい場合において、概念ボトルネックモデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:05:17 GMT)
Generalized Quantum-assisted Digital Signature [2.2] 本稿では,デジタル署名のためにQKDキーを採用することで,情報理論のセキュリティを継承する手法の改良版を提案する。
偽造に対するセキュリティは、悪意のある偽造者によって取られた試行錯誤アプローチを考慮して計算され、GQaDSパラメータは偽造と鑑定確率のバランスをとる分析的アプローチによって最適化される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:04:38 GMT)
Permutation invariant multi-output Gaussian Processes for drug combination prediction in cancer [2.1] がんにおける線量応答予測は、機械学習における活発な応用分野である。
目標は、実験的な設計をガイドしたり、治療決定を知らせるために使用できる正確な予測モデルを開発することである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:28:38 GMT)
Deformable MRI Sequence Registration for AI-based Prostate Cancer Diagnosis [2.1] PI-CAI(Prostate Imaging: Cancer AI)の課題は、臨床上重要な前立腺がん検出のための専門家レベルの診断アルゴリズムに繋がった。
これらのアルゴリズムは、T2重み付きおよび拡散重み付きスキャンからなる、バイパラメトリックMRIスキャンを入力として受信する。
これらのスキャンは、スキャンプロセスの複数の要因により、不整合が生じる可能性がある。
画像登録は、シーケンス間の変形を予測することでこの問題を軽減することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:25:25 GMT)
The Gauge Theory of Measurement-Based Quantum Computation [2.1] 測定に基づく量子計算(英: Measurement-Based Quantum Computation、MBQC)は、単位ゲートの代わりに局所的な測定を使用する量子計算のモデルである。
ゲージ変換は、異なる局所参照フレームで同じMBQC計算を定式化する自由を反映する。
我々の枠組みは、凝縮物質と高エネルギー理論のより広い文脈でMBQCを定めている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:10:38 GMT)
EnSolver: Uncertainty-Aware Ensemble CAPTCHA Solvers with Theoretical Guarantees [2.0] 本研究では, 深層アンサンブル不確実性を利用して分布外CAPTCHAを検出し, スキップする解法であるEnrを提案する。
我々は,解法の有効性に新たな理論的限界を証明し,その応用を最先端のCAPTCHA解法で実証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:40:39 GMT)
ACES: Automatic Cohort Extraction System for Event-Stream Datasets [1.9] 医療における機械学習(ML)において、再現性は依然として重要な課題である。
イベントストリームデータセットの自動コホート抽出システム(ACES)について紹介する。
ACESは、(1)データセット固有の概念と、データセットに依存しない包含/排除基準の両方を定義するための、非常に直感的で表現力豊かな構成言語を提供し、(2)患者記録を自動的に抽出するパイプラインを提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:48:05 GMT)
How well ChatGPT understand Malaysian English? An Evaluation on Named Entity Recognition and Relation Extraction [1.8] マレーシア英語ニュースデータセットからエンティティと関係を抽出するChatGPTの機能を評価する。
ChatGPTはマレーシアの英語ニュース記事からエンティティを抽出するのにはあまり効果がなく、F1スコアは0.497である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:01:07 GMT)
Basketball-SORT: An Association Method for Complex Multi-object Occlusion Problems in Basketball Multi-object Tracking [1.7] バスケットボールビデオにおけるCMOO問題に焦点を当てた,オンラインかつ堅牢なMOT手法であるBasketball-SORTを提案する。
本手法は,バスケットボールの固定ビデオデータセット上で高次追跡精度(HOTA)の63.48$%のスコアを得る。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:49:57 GMT)
MoCheQoS: Automated Analysis of Quality of Service Properties of Communicating Systems [1.7] MoCheQoSは、メッセージパッシングシステムのQoS特性を分析するための有界モデルチェッカーである。
本研究は,MoCheQoSの適用性を評価するための2つのケーススタディである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:25:35 GMT)
Large Language Model Enhanced Clustering for News Event Detection [1.7] 本稿では,大規模言語モデル(LLM)とクラスタリング解析を組み合わせたイベント検出フレームワークを提案する。
このフレームワークは、事前検出タスクと後検出タスクの両方を通じてイベントクラスタリングを強化する。
本稿では,クラスタリング結果の有効性とロバスト性を評価するための新しいクラスタ安定性評価指標(CSAI)を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:16:28 GMT)
Attention Meets UAVs: A Comprehensive Evaluation of DDoS Detection in Low-Cost UAVs [1.7] 本稿では、低コストでWi-Fiベースの無人航空機(UAV)によるDDoS攻撃に対するサイバーセキュリティ対策の強化に関する重要な課題について検討する。
我々は,UAVシステムのコンパニオンコンピュータ上で動作する検出機構を開発した。
そこで本研究では,車載DDoS検出機構を構築するために必要なステップについて述べる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:44:01 GMT)
xSemAD: Explainable Semantic Anomaly Detection in Event Logs Using Sequence-to-Sequence Models [1.7] この研究は意味的異常検出のギャップに対処し、通常、異常の性質を説明することなく、異常の発生を示す。
我々はxSemADを提案する。xSemADは、シーケンス・ツー・シーケンス・モデルを用いて、純粋な識別を超越し、拡張された説明を提供するアプローチである。
実験により,本手法は既存の意味的異常検出手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:06:52 GMT)
Physics-Informed Boundary Integral Networks (PIBI-Nets): A Data-Driven Approach for Solving Partial Differential Equations [1.6] 偏微分方程式(PDE)は力学系の関連する現象を記述するために広く用いられる。
高次元設定では、PINNは計算領域全体にわたって密度の高いコロケーションポイントを必要とするため、しばしば計算上の問題に悩まされる。
本稿では,PDEを元の問題空間よりも1次元以下で解くためのデータ駆動手法として,Physical-Informed Boundary Networks(PIBI-Nets)を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:18:20 GMT)
A Survey on Data Quality Dimensions and Tools for Machine Learning [1.6] 機械学習(ML)技術は、私たちの社会の事実上のあらゆる面で重要なものになっています。
探索的データ分析(EDA)やクロスバリデーション(CV)といった従来の手法は、データ中心AIにおける課題に直面している。
本調査では,過去5年間の17のDQ評価・改善ツールについて概観する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:41:33 GMT)
The inertia bound is far from tight [1.5] 我々は、慣性境界が極端に厳密でないことを示し、実際は比縛を著しく過小評価できることを示した。
これらの結果はルーニー、シンコビッチ、ワクジャン=エルフィック=アビアドの疑問に対処する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:01:48 GMT)
Leveraging Large Language Models for enhanced personalised user experience in Smart Homes [1.4] 本稿では,Large Language Models(LLM)とユーザ嗜好を活用した,独自のスマートホームアーキテクチャを提案する。
提案手法の利点は, 様々なLLM実装との比較解析と同様に, 一連のシナリオで示される。
いくつかの指標は、システムの快適さ、安全性、ユーザの好みを維持する能力を決定するために評価される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:08:20 GMT)
Designing and Evaluating Multi-Chatbot Interface for Human-AI Communication: Preliminary Findings from a Persuasion Task [1.4] 本研究では, 特定の説得環境におけるマルチチャットボットコミュニケーションの効果について検討した。
マルチチャットボット通信が可能なオンライン環境を開発し,パイロット実験を行った。
本稿では,マルチチャットボットインタフェースの開発プロセスとパイロット実験による予備的な結果について述べる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 04:33:41 GMT)
State Matching and Multiple References in Adaptive Active Automata Learning [1.3] 状態マッチングは、適応学習の新しいフレームワークであるアダプティブL#の主要な要素である。
我々の経験的評価は、適応L#が最大2桁の精度で芸術の状態を改善していることを示している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:56:35 GMT)
LiverUSRecon: Automatic 3D Reconstruction and Volumetry of the Liver with a Few Partial Ultrasound Scans [1.2] 超音波(US)スキャンによる肝体積測定は,USスキャン,ぼやけた境界,部分的な肝可視性などのノイズが原因で困難である。
肝のCTスキャンを用いて構築した統計的形状モデル (SSM) と合わせて, 肝の非完全矢状面USスキャンのセグメンテーションマスクを用いて, これらの課題に対処する。
3次元肝再建は正確であり,自動肝体積計算に繋がる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:20:01 GMT)
Wavelets Are All You Need for Autoregressive Image Generation [1.2] 本稿では,2つの主成分をベースとした自己回帰画像生成手法を提案する。
1つ目はウェーブレット画像符号化で、画像の視覚的詳細を粗いものから細部までトークン化することができる。
2つ目は、アーキテクチャが再設計され、トークンシーケンスに最適化された言語トランスフォーマーの変種である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:32:59 GMT)
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID [1.2] 本稿では,提案する大規模データベース上でモデルをトレーニングするReID問題について検討する。
MLLM(Multi-modal Large Language Models)による訓練データを得る。
画像に対応しない記述中の単語を自動的に識別する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:23:10 GMT)
3D-Mol: A Novel Contrastive Learning Framework for Molecular Property Prediction with 3D Information [1.2] 3D-Molはより正確な空間構造表現のために設計された新しいアプローチである。
分子を3つの階層グラフに分解し、幾何学的情報をよりよく抽出する。
3D-Molと最先端のベースラインを7つのベンチマークで比較し,優れた性能を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:56:10 GMT)
Untangling the Unrestricted Web: Automatic Identification of Multilingual Registers [1.1] 本稿では16言語にわたるWebベースのデータセットにおけるレジスタの自動識別のためのディープラーニングモデルについて検討する。
モデルが最先端の結果を達成し、階層的なマルチラベル設定における詳細な分類が、競争力のある分類性能をもたらすことを示した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:00:30 GMT)
Robustness Assessment of a Runway Object Classifier for Safe Aircraft Taxiing [1.1] ディープニューラルネットワーク(DNN)は多くの計算問題の顕著な解決策になりつつある。
本稿では,航空機のタクシー走行時に使用する画像分類器DNNのロバスト性を実証する。
我々は、このDNNの頑健さを、ノイズ、明るさ、コントラストという3つの一般的なイメージ摂動タイプに評価するために、フォーマルな手法を用いています。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:42:12 GMT)
Can GPT-4 Help Detect Quit Vaping Intentions? An Exploration of Automatic Data Annotation Approach [1.1] 近年、アメリカ合衆国は電子タバコや電子タバコの普及が著しく進んでいるのを目撃している。
本研究では、Reddit上の1つの電子タバコサブコミュニティからサンプルデータセットを抽出し、ユーザの電子タバコの停止意図を分析した。
我々は, GPT-4にタスクを説明するために, 詳細レベルが異なる8つのプロンプトを開発した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:06:48 GMT)
Malaria Cell Detection Using Deep Neural Networks [1.1] マラリアは世界中で最も深刻な公衆衛生上の懸念の1つだ。
血液スミアの顕微鏡検査などの従来の診断法は、労働集約的である。
本研究の目的は, 深層学習によるマラリア感染細胞の自動検出である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:44:55 GMT)
Improved Monte Carlo tree search (MCTS) formulation with multiple root nodes for discrete sizing optimization of truss structures [1.1] 本稿ではモンテカルロ木探索(MCTS)を用いたトラス構造の離散最適設計法を提案する。
更新プロセスは、最終ソリューションが見つかると、次の検索ツリーの最初のソリューションとして使用されることを意味する。
最高の報酬は、バックプロパゲーションステップで使用されます。
探索木幅を減らし,最大反復回数を減らして高速化技術を導入する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:10:03 GMT)
Self-adaptive weights based on balanced residual decay rate for physics-informed neural networks and deep operator networks [1.1] 物理インフォームド・ディープ・ラーニングは偏微分方程式を解くための有望な代替手段として登場した。
複雑な問題に対して、これらのネットワークをトレーニングすることは依然として困難であり、しばしば不満足な精度と効率をもたらす。
本稿では,異なるトレーニングポイント間で残留減衰率のバランスをとる点幅適応重み付け法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:53:48 GMT)
Does Geo-co-location Matter? A Case Study of Public Health Conversations during COVID-19 [1.0] 公衆衛生の専門家にとってのゴールは、マスキングやソーシャルディスタンシングといった地域的な成果に影響を及ぼす社会行動を促進することであった。
本研究では,公共衛生専門家(PHE)と公衆の地域的関わりがソーシャルメディアに与える影響について検討した。
その結果,ジオコロケーションは,特にマスキング,ロックダウン,教育などの話題に関する会話において,高いエンゲージメント率と関連していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 06:24:37 GMT)
Deep Maxout Network-based Feature Fusion and Political Tangent Search Optimizer enabled Transfer Learning for Thalassemia Detection [1.0] タラセミア検出にPTSO_TL(Political Tangent Search based Transfer Learning)を導入する。
PTSO_TLは、それぞれ94.3%、96.1%、95.2%の最大精度、リコール、f測定値を得た。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:02:49 GMT)
Perfect cheating is impossible for single-qubit position verification [0.9] 量子位置検証において、証明者は、量子計算を実行し、結果を信頼された検証者集合に返すことによって、その位置を認証する。
量子位置検証のための最初のプロトコルの一つが提案された(Kent, Munro, Spiller 2011)。
元のKMS測定プロトコルに対して,完全な有限次元の不正処理戦略が存在しないことを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:13:38 GMT)
To Word Senses and Beyond: Inducing Concepts with Contextualized Language Models [0.9] 多義語と同義語は語彙的あいまいさの重要な面である。
本稿では,単語間のソフトクラスタリングを学習する教師なしタスクである概念誘導について紹介する。
本稿では,局所レンマ中心の視点と大域的相互関係の視点を両立する概念誘導手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:07:06 GMT)
Convergence analysis of kernel learning FBSDE filter [0.9] カーネル学習 後方SDEフィルタは、非線形フィルタリング問題を解決するための反復的かつ適応的なメッシュフリーアプローチである。
フォッカー・プランカー方程式は状態変数の進化密度を定義し、近似密度を利用する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:45:11 GMT)
Spatial features of CO2 for occupancy detection in a naturally ventilated school building [0.8] 自然に換気された建物では、複雑な換気挙動と窓を通しての実際の空気交換を測定するのが難しいため、CO2による占有率検出の精度が低いのが一般的である。
本研究では,CO2濃度の空間分布に基づく2つの新しい占有検知機能について述べる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:51:14 GMT)
Stackelberg Games with $k$-Submodular Function under Distributional Risk-Receptiveness and Robustness [0.8] 本研究では,不確実性や攻撃を受けやすいデータを用いた特徴選択などの機械学習問題に適用可能な,逆向き文脈における部分モジュラ最適化について検討する。
我々は、攻撃者(またはインターディクタ)とディフェンダーの間のStackelbergゲームに焦点を当て、攻撃者は$k$-submodular関数を最大化するディフェンダーの目的を最小化することを目的としている。
本稿では、分散リスク-Averse $k$-SIPと分散リスク-Receptive $k$-SIPと、それを解くための有限収束正確なアルゴリズムを紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:08:35 GMT)
Verifiable measurement-based quantum random sampling with trapped ions [0.8] 量子コンピュータは、今、彼らの古典的なコンピュータよりも優れています。
この利点を示す方法の1つは、量子コンピューティングデバイス上で実行される量子ランダムサンプリングである。
ここでは、量子計算の計測に基づくモデルにおいて、効率よく検証可能な量子ランダムサンプリングを実験的に示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:32:23 GMT)
Bayesian inversion of GPR waveforms for sub-surface material characterization: an uncertainty-aware retrieval of soil moisture and overlaying biomass properties [0.8] オーバーレイ層の特性評価は,山火事リスク評価などの応用に不可欠である。
本研究では,地中レーダ(GPR)波形に対するベイズモデル更新手法を提案する。
提案手法は不確実性を考慮した地下パラメータ推定のための有望な手法を提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:00:21 GMT)
Le sens de la famille : analyse du vocabulaire de la parent{é} par les plongements de mots [0.8] 本研究では, 家族関係の語彙という, 密度が高く, 高度に構造化された, フランスのレキシコンの領域のコーパス解析を提案する。
25の名詞の辞書から始め、これらの用語が分布解析を通して相互にどのように位置づけられているかを検討する。
分布情報は、この語彙を構成する特定の特徴を、異なるコーパスによって異なる方法で捉えることができることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:19:36 GMT)
SRViT: Vision Transformers for Estimating Radar Reflectivity from Satellite Observations at Scale [0.7] 静止衛星画像から高分解能(3km)合成レーダ反射率場を大規模に生成するトランスフォーマーベースニューラルネットワークを提案する。
本研究は,アメリカ合衆国における気象事象の短期的対流予測の強化と数値天気予報のためのデータ同化の支援を目的とする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:51:25 GMT)
Psychological Profiling in Cybersecurity: A Look at LLMs and Psycholinguistic Features [0.7] 心理学的プロファイリング手法の可能性を探り、特に大規模言語モデル(LLM)と心理言語学的特徴の利用に焦点を当てる。
我々の研究は、サイバーセキュリティの実践に心理学的視点を統合することが、進化する脅威に対する防御メカニズムを強化することの重要性を強調している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:22:56 GMT)
A Novel Labeled Human Voice Signal Dataset for Misbehavior Detection [0.7] 本研究は,音声認識のための自動学習システムにおける音声トーンと配信の重要性を強調した。
これは、人間の行動が音声信号の知覚と分類に与える影響を解明することにより、音声信号解析の幅広い分野に寄与する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:55:07 GMT)
Mining Reasons For And Against Vaccination From Unstructured Data Using Nichesourcing and AI Data Augmentation [0.7] GPT4 と GPT3.5-Turbo を用いたニッチソーシングと拡張による予防接種理由および予防接種対策のためのデータセットである Reasons For and Against Vaccination (RFAV) を提示する。
主観性が高いにもかかわらず、これらの理由を異なるタスク定義の下で非構造化テキストでどのように掘り下げることができるかを示す。
データセットとトレーニングされたモデルとアノテーションマニュアルを公開し、アノテーションをトレーニングしてタスクを定義します。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:36:31 GMT)
Spike Accumulation Forwarding for Effective Training of Spiking Neural Networks [0.7] スパイキングニューラルネットワーク(SNN)はエネルギー効率が高いが、訓練が難しいことが知られている。
オンライン・トレーニング・アズ・タイム(OTTT)は、メモリコストを抑えながら各タイムステップで推論できる方法である。
スパイキングニューラルネットワーク(SNN)、スパイク累積フォワード(SAF)のトレーニングのための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:33:07 GMT)
Scaling Quantum Computations via Gate Virtualization [0.6] 本稿では,大規模量子回路のスケーラブルな実行のためのエンドツーエンド汎用システムであるQuantum Virtual Machine (QVM)を提案する。
QVMは量子回路の概念を拡張する仮想回路中間表現(IR)を公開する。
我々は、IBMの7ビットおよび27ビット量子プロセッサ(QPU)上でのQVMを評価する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:41:14 GMT)
Message du troisi{è}me type : irruption d'un tiers dans un dialogue en ligne [0.6] 本研究は,世界的観点から,ウィキペディアのトークページに焦点を当てている。
ウィキペディアのすべてのトークページをフランス語で構成したコーパスを用いて、2人以上の参加者との議論がどのように展開されるかを検討する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:20:32 GMT)
InfiniGen: Efficient Generative Inference of Large Language Models with Dynamic KV Cache Management [0.6] トランスフォーマーベースの大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる優れたパフォーマンスを示す。
長いコンテンツを生成するための推論を提供することは、過渡状態の巨大なメモリフットプリントのために課題となる。
InfiniGenは、長文生成に適した新しいKVキャッシュ管理フレームワークである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:41:26 GMT)
Integrating Quantum Algorithms Into Classical Frameworks: A Predictor-corrector Approach Using HHL [0.6] 我々は、Harrow, Hassidim and Lloyd (HHL) によって提案された方程式の線形系に対するよく知られたアルゴリズムを、直接解法ではなく予測子-相関子に適応させることにより適用する。
この戦略は、多くの古典的アルゴリズムでよく見られる計算コストの高いステップのインテリジェントな省略を可能にし、同時に量子状態の抽出に関連する悪名高い読み出し問題を緩和する。
このアプローチの汎用性は、滑らかな粒子流体力学、プラズマシミュレーション、反応性流れ構成など、様々な分野の応用を通して説明される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:31:10 GMT)
Robustly learning the Hamiltonian dynamics of a superconducting quantum processor [0.6] 超伝導量子ビットアナログ量子シミュレータにおけるボソニック励起のフリーハミルトニアンパラメータを強く推定する。
この結果は、動的量子シミュレーションの正確な実装を構成する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:40:56 GMT)
Learning topological states from randomized measurements using variational tensor network tomography [0.5] 量子状態の忠実な表現を学ぶことは、量子プロセッサ上で生成される多体状態の多様性を完全に特徴づけるのに不可欠である。
本研究では,テンソルネットワーク上の変分最適化とランダムな計測手法を組み合わせたトモグラフィー手法の実装と検討を行う。
我々は、実験により実現可能な量子スピン液体状態と同様に、表面符号の基底状態を学ぶ能力を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 20:33:08 GMT)
Graph Neural Networks for Gut Microbiome Metaomic data: A preliminary work [0.5] グラフニューラルネットワーク(GNN)を用いた個々の腸内マイクロバイオームの有意義な表現の導出を目指す。
エンコーダから学習した表現は、炎症性腸疾患(IBD)などの表現型予測モデルの訓練に使用される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:53:36 GMT)
Quantum Time and the Time-Dilation induced Interaction Transfer mechanism [0.5] 非相互作用系成分を含む効果的な相互作用として,量子時間差効果について検討する。
この機構をTiDIT(Time-Dilation induced Interaction Transfer)機構と呼び、2つの結合スピンを量子クロックモデルとして用いた例を議論する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:00:33 GMT)
Solving a Real-World Package Delivery Routing Problem Using Quantum Annealers [0.4] 本研究は、量子コンピューティングとルーティング問題との連携に焦点を当てる。
本研究の主な目的は,実例を扱うための解法を提案することである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:49:51 GMT)
Machine Learning Predictors for Min-Entropy Estimation [0.4] 本研究では、ランダム数生成器(RNG)の最小エントロピー推定における機械学習予測器の適用について検討する。
RNGの最小エントロピー評価において,対象ビット数を考慮することの重要性が示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:15:01 GMT)
MDF: A Dynamic Fusion Model for Multi-modal Fake News Detection [0.4] フェイクニュース検出のためのMDFと呼ばれる新しい動的融合フレームワークを提案する。
本モデルは,(1)モーダル内不確実性をモデル化するためのマルチヘッドアテンション機構を用いた不確実性モデリングモジュールとしてのUEM,(2)DFNは2つのモーダルの重みを動的に融合させるD-Sエビデンス理論に基づく動的融合モジュールである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:24:52 GMT)
Effort and Size Estimation in Software Projects with Large Language Model-based Intelligent Interfaces [0.4] 我々は,開発作業の見積もりを可能にする自然言語ベースの質問の仕様を強化する新しい方法を提案する。
本稿では,従来の手法との比較を行い,自然言語に基づく質問の仕様を強化する新しい方法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:57:39 GMT)
Uncertainty Quantification in Large Language Models Through Convex Hull Analysis [0.4] 本研究では凸船体解析を用いた不確実性定量化のための新しい幾何学的手法を提案する。
提案手法は, 応答埋め込みの空間特性を利用して, モデル出力の分散と可変性を計測する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:47:34 GMT)
SmartML: Towards a Modeling Language for Smart Contracts [0.3] 本稿では,プラットフォームに依存しない,理解しやすいスマートコントラクトのモデリング言語であるSmartMLを提案する。
セキュリティ脆弱性に対処する上での役割に焦点をあてて、その形式的意味論と型システムについて詳述する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:14:23 GMT)
First Experiences with the Identification of People at Risk for Diabetes in Argentina using Machine Learning Techniques [0.3] 本稿では,アルゼンチンにおけるT2DとPDのリスクのある人を特定するための予測モデルの開発と評価について述べる。
その結果,これらのモデルを用いた2つのデータセットに対して,非常に良好な性能が得られた。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:21:45 GMT)
Many-body entropies and entanglement from polynomially-many local measurements [0.3] すべての空間相関長が有限であるという仮定のもとに効率的な推定戦略が存在することを示す。
我々は,今日の量子プラットフォームで利用可能な多数の量子ビットに対して,二分位混合状態の絡み合いを検出するのに,本手法は実用的に有用であると主張している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:21:02 GMT)
On the Value of PHH3 for Mitotic Figure Detection on H&E-stained Images [0.3] ヘマトキシリンおよびエオシン(H&E)染色スライスで観察されるミトティックフィギュア(MFs)の数は重要な予後マーカーである。
本研究は,PHH3によるMFアノテーションがレータ間信頼性およびオブジェクトレベルの一致に与える影響を解析する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:07:43 GMT)
Extract More from Less: Efficient Fine-Grained Visual Recognition in Low-Data Regimes [0.2] 本稿では,この課題に対するディープニューラルネットワークの性能向上を目的とした,AD-Netと呼ばれる新しいフレームワークを提案する。
特に, 本手法は, 強化試料を自己蒸留し, 有害なオーバーフィッティングを緩和することにより, 学習機能を洗練することを目的としている。
最小限のデータで、我々のフレームワークは、最大で45%の精度で顕著な相対的正確性を示した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:45:25 GMT)
Impact of Initialization on Intra-subject Pediatric Brain MR Image Registration: A Comparative Analysis between SyN ANTs and Deep Learning-Based Approaches [0.2] 小児神経画像診断における従来のSyN ANTと学習に基づく登録法の性能評価を行った。
我々は、DeepRegを使ってU-Netアーキテクチャで教師なしDLフレームワークを実装し、5倍のクロスバリデーションを実現した。
DLベースの手法はより高速で正確な登録を約束するが、SyN ANTsは広範なトレーニングを必要とせず、堅牢で一般化可能である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:22:30 GMT)
Transparency, Privacy, and Fairness in Recommender Systems [0.2] このハビテーションは、(i)透明性と認知モデル、(ii)プライバシーと限定された嗜好情報、(iii)推薦システムにおける公正性と人気バイアスに関連する側面を精査する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:43:01 GMT)
Quantum gravity as a communication resource [0.2] ブラックホール中の量子コヒーレンス、すなわち時空は、絡み合いの劣化を制限することができることを示す。
この発見は、時空の量子的特徴が量子情報処理の資源として役立つことを示唆している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 21:29:04 GMT)
Network Bending of Diffusion Models for Audio-Visual Generation [0.1] アーティストが音楽の視覚化を作成できるツールを開発するための第一歩を提示する。
生成ネットワークの層に変換を適用するプロセスであるネットワーク曲げの画像生成拡散モデルへの応用について検討する。
ネットワーク曲げ演算子にパラメータとして音声特徴を渡すことで,安定拡散を用いた音楽再生ビデオを生成する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:39:17 GMT)
Deep Fusion Model for Brain Tumor Classification Using Fine-Grained Gradient Preservation [0.1] この研究は、事前訓練されたResNet152V2と修正VGG16モデルを融合した、正確な脳腫瘍分類のための新しいアーキテクチャを提案する。
提案手法は,画像品質向上のために様々な画像処理技術を導入し,FigshareデータセットとKaggleデータセットでそれぞれ98.36%,98.04%の精度を実現している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:06:02 GMT)
The Impact of Feature Representation on the Accuracy of Photonic Neural Networks [0.0] フォトニックニューラルネットワーク(PNN)は、高並列化、低レイテンシ、エネルギー効率といった可能性から、研究コミュニティにおいて大きな関心を集めている。
複数の特徴を1つの入力に組み合わせることで、入力や関連機器の数を減らし、より小さくエネルギー効率のよいPNNを生み出すことが一般的である。
本稿では,PNNの性能と学習能力に共通する特徴を組み合わせた符号化手法について検討する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:12:37 GMT)
Efficient state preparation for the quantum simulation of molecules in first quantization [0.0] ガウス型軌道ベースで定義された状態を平面波ベースに効率よくマッピングする方法を,平面波数で対数的なスケーリングで示す。
我々の研究は、エンド・ツー・エンドの複雑性が真にサブリニアな基底集合サイズを持つ分子系の最初の量子シミュレーションを可能にする。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:46:01 GMT)
`Just One More Sensor is Enough' -- Iterative Water Leak Localization with Physical Simulation and a Small Number of Pressure Sensors [0.0] 本研究では,物理シミュレーションから得られたデータを用いて,複雑な配水網内の局所化をリークする手法を提案する。
本アルゴリズムは,物理シミュレーション(EPANETソフトウェア)と移動体センサの移動移動移動方式に基づく。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:10:13 GMT)
Zero-Shot Reasoning: Personalized Content Generation Without the Cold Start Problem [0.0] 本稿では,大規模言語モデルを用いてパーソナライズを実現するための新しいアプローチを提案する。
本研究では,個々のプレイヤーから連続的に収集されたゲームプレイデータに基づくレベルを提案する。
本手法は, 従来の手法が生成した生産環境では有効であり, プレイヤーが中間レベルを終了しない確率において, 性能が優れていた。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:41:02 GMT)
Uncovering the hidden core-periphery structure in hyperbolic networks [0.0] 双曲型ネットワークモデルは、小さな世界性、スケール自由性、高いクラスタリング係数、コミュニティ構造など、基本的で不可欠な特徴を示す。
本稿では,双曲型ネットワークモデルにおける重要な特徴であるコア周辺構造の存在について検討する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:39:21 GMT)
TreeSeg: Hierarchical Topic Segmentation of Large Transcripts [0.0] 本稿では,市販の埋め込みモデルと分割クラスタリングを組み合わせるアプローチであるTreeSegを紹介し,バイナリツリーの形で,階層的で構造化された転写文のセグメンテーションを生成する。
ICSIとAMIコーパスでTreeSegを評価し,すべてのベースラインを上回る性能を示した。
最後に,自己記録ビデオセッションから得られた手書き手書き文字の小さなコーパスであるTinyRecを紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:49:26 GMT)
Tradeoffs When Considering Deep Reinforcement Learning for Contingency Management in Advanced Air Mobility [0.0] 航空輸送は、Advanced Air Mobility (AAM)の導入により、世界中で急速に進化している。
運用上の安全性と効率の目標を達成するためには、自動化のレベルが増加する必要がある。
本稿では,複雑・高次元環境において有望な性能を示す深層強化学習(DRL)の利用について検討する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:09:55 GMT)
Towards Learning Stochastic Population Models by Gradient Descent [0.0] パラメータと構造を同時に推定することで,最適化手法に大きな課題が生じることを示す。
モデルの正確な推定を実証するが、擬似的、解釈可能なモデルの推論を強制することは、難易度を劇的に高める。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:14:13 GMT)
Topologically protected quantized changes of the distance between atoms [0.0] チューレスポンピングは、電位がゆっくりと周期的に時間的に変調されている場合、一次元周期ポテンシャルにおける粒子の輸送を可能にする。
ここでは、Thouless pumpingにより、原子s波散乱長が時間的に適切に変調された場合、原子間距離の位相的に保護された量子化変化を実現することができることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:48:01 GMT)
The impact of model size on catastrophic forgetting in Online Continual Learning [0.0] SplitCIFAR-10データセットを用いたクラス増分学習におけるネットワーク深さと幅がモデル性能に与える影響について検討した。
結果は、より大きなモデルは本質的に破滅的な忘れを和らげるという考えに挑戦する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:29:51 GMT)
The Qiyas Benchmark: Measuring ChatGPT Mathematical and Language Understanding in Arabic [0.0] アラビア語におけるモデルの数学的推論と言語理解能力を評価するために設計された2つの新しいベンチマークを導入する。
これらのベンチマークは、サウジアラビアの大学入試に広く使用される標準化された試験であるカイヤス試験(英語版)と呼ばれる一般適性試験(GAT)に由来する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:34:31 GMT)
Subjective fairness in algorithmic decision-support [0.0] 意思決定文学におけるフェアネスの扱いは、通常客観的な尺度を用いてフェアネスを定量化する。
この研究は、社会学的洞察を用いて、これらのアプローチの限界を強調するために批判的なスタンスを取る。
我々は、トップダウンからボトムアップアプローチに移行する主観的特性として公正を再定義する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:37:39 GMT)
Statistical signatures of quantum contextuality [0.0] 量子コンテキスト性(Quantum contextuality)とは、異なる測定コンテキストで観測された統計が、システムの独立した現実によって説明できない状況を指す。
非文脈統計量の境界に反する5つの測定コンテキストの関係に基づく再構成手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 01:31:20 GMT)
Spin Squeezing Enhanced Quantum Magnetometry with Nitrogen-Vacancy Center Qutrits [0.0] 量子磁気学における量子スピンスクイーズの有用性を探求し,ダイヤモンド中の3レベル窒素空洞(NV)中心に焦点をあてる。
以上の結果から,クエトリットとスピンスクイーズを併用すると,デフォーカス効果に制約された磁力測定精度が向上することが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:07:15 GMT)
Simple qudit ZX and ZH calculi, via integrals [0.0] ZX計算とZH計算は、量子演算を表すためにダイアグラムを使用し、書き直し規則を用いて、関手意味写像を通して同じ演算子を表すダイアグラム間の変換を行う。
ZX 図と ZH 図のセマンティックマップを記述し、ユニタリ回路の解析に適し、任意の固定次元 D>1 の立方体を 1 つの ZXH-計算として測定する。
本稿では,ZX電卓の安定化器フラグメント'とZH電卓のマルチキャラクタフラグメント'の書き直し規則を実証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:11:16 GMT)
Simple proof that there is no sign problem in Path Integral Monte Carlo simulations of fermions in one dimension [0.0] 一次元のフェルミオンのパス積分モンテカルロ (PIMC) シミュレーションには符号問題がないことが広く知られている。
しかし、著者が認識している限り、文献にこれの直接の証拠はない。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:08:09 GMT)
Saturation Dynamics in Non-Hermitian Topological Sensing Systems [0.0] 非エルミートトポロジカルセンサ(NTOS)のクラスが最近提案され、NTOSは非エルミートなSu-Schrieffer-Heeger鎖と鎖の両端間の測定依存性のカップリングからなる。
NTOSの挙動は巻線数によって特徴づけられ, 最小の固有エネルギーがシステムサイズとともに指数関数的に減少するか, あるいは臨界サイズまで指数関数的に増加するかを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:36:28 GMT)
Runtime Instrumentation for Reactive Components (Extended Version) [0.0] リアクティブソフトウェアは、システムのリアクティブ属性を裏付けるインスツルメンテーションメソッドを要求する。
本稿では,この2つの要求を満たすアウトラインモニタのための分散インスツルメンテーションアルゴリズムであるRIARCを提案する。
RIARCは次のホップIPルーティングアプローチを使ってこれらの課題を克服し、イベントを再配置し、モニタに適切に報告する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:18:04 GMT)
Relational Quantum Mechanics is Still Incompatible with Quantum Mechanics [0.0] 量子力学における中心的な概念が量子力学と矛盾していることが示される。
私たちの作品はCavalcanti, Di Biagio, Rovelli (CDR) によって批判されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:14:09 GMT)
Reinforcement Learning for Efficient Design and Control Co-optimisation of Energy Systems [0.0] 本研究では,エネルギーシステムの設計と制御の協調最適化に適した新しい強化学習フレームワークを提案する。
RLのモデルフリー機能を活用することで、このフレームワークは明示的なシステムモデリングの必要性を排除します。
この貢献により、エネルギー管理における高度なRL応用の道が開かれ、再生可能エネルギー源をより効率的に効果的に利用できるようになった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:01:02 GMT)
Realizing Altermagnetism in Fermi-Hubbard Models with Ultracold Atoms [0.0] オルター磁性は、強磁性と従来の反強磁性とは異なる新しいタイプのコリニア磁性を示す。
我々は,光格子中の超低温フェルミオン原子を用いて,d波の反磁性相をどうやって実現できるかを理論的に示す。
異方性スピン輸送(異方性スピン輸送)という反磁性の定義された特性の1つは、トラップ膨張実験(英語版)によって探究できる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:12:29 GMT)
Quantum key distribution rates from non-symmetric conic optimization [0.0] これは、凸非線型函数、相対エントロピーの最小化に依存する、難しい最適化問題である。
相対エントロピーを含む非対称錐体を最適化する実用的なアルゴリズムが発見された。
従来のテクニックと比較して、柔軟性、使いやすさ、そしてすべてのパフォーマンスの利点があります。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:00:01 GMT)
QuADTool: Attack-Defense-Tree Synthesis, Analysis and Bridge to Verification [0.0] 攻撃防御木を簡易に合成・解析するツールを提供する。
既存のモデルチェッカーや分析ツールにさまざまなインターフェースを提供する。
ツールの一部として、標準解析手法を拡張して、PAC入力を処理し、最終的な結果の不正確さと不確実性に厳密な境界を与える。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:49:39 GMT)
Prompting Techniques for Reducing Social Bias in LLMs through System 1 and System 2 Cognitive Processes [0.0] 二重過程理論は、人間の認知は2つのシステムを通して生じると仮定する。
システム1は迅速で感情的で直感的なプロセスです。
システム2は遅く、面倒で、意図的なプロセスです。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:54:49 GMT)
Predicting Topological Entanglement Entropy in a Rydberg analog simulator [0.0] この研究は、Rydberg-atomシミュレータ上での量子スピン-液体状態の動的準備に焦点を当てている。
このアプローチの柔軟性は、Rydberg-atom Hamiltonian の物理的に正しい形式に一致するだけでなく、関連する格子トポロジーにも一致する。
擬似状態は共鳴価結合状態(RVB)と類似した局所特性を示すが、後者の特徴的トポロジ的絡み合いエントロピー符号は欠如していることが示される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:27:42 GMT)
Polynomial Complexity of Inversion of sequences and Local Inversion of Maps [0.0] 論文は、二項体上の有限列のエンプインバージョン問題に対する解を定義し、探求する。
RR を定義する固定次数の複素数の最小数(位数)は、その次数の列の EmphPolynomial と呼ばれる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:34:29 GMT)
Phase-space measurements, decoherence and classicality [0.0] 位相空間におけるデコヒーレンスとは、位置および運動量表現における密度行列の対角化を意味する。
これは、位置と運動量が2つの独立なリンドブラッド作用素として現れるリンドブラッド力学と結びついていることが示されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:35:51 GMT)
Optimization of Static Potentials for Large Delocalization and Non-Gaussian Quantum Dynamics of Levitated Nanoparticles Under Decoherence [0.0] 浮遊ナノ粒子の最適静電位を求める最適化手法を提案する。
我々の戦略は、ポテンシャルのゆらぎから生じる位置依存ノイズ源を考慮に入れている。
最適構成はシステム内の雑音の強度と性質に依存することを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:01:24 GMT)
Optimal Video Compression using Pixel Shift Tracking [0.0] 本稿では,映像圧縮における主要なアプローチとして,映像のフレームの冗長性除去手法を提案する。
Shift (Rtextsuperscript2S) を用いた冗長除去手法をこの手法と呼ぶ。
本研究では,コンピュータビジョンに基づく画素点追跡手法を用いて,冗長な画素を識別し,最適な記憶のために映像を符号化した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:36:38 GMT)
On-chip microwave coherent source with in-situ control of the photon number distribution [0.0] 本研究では,チップ上で直接光子注入が可能な新しい設計を提案し,理論的に検討する。
提案手法の主な特徴は、ソースとターゲットキャビティ間の通常の容量リンクを調整可能なカプラで置き換えることである。
本研究では,外部フラックススレッディングにより生成したコヒーレント状態の動的制御を検証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 00:22:18 GMT)
On the bias in iterative quantum amplitude estimation [0.0] 本稿では,反復型量子振幅推定(IQAE)のバイアスについて検討する。
IQAEは偏りがあり、その偏りは特定の値の$a$に対して高められることを示す。
最終ラウンドをグロバー数とショット数で再実行するだけで、バイアス軽減法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:00:52 GMT)
Non-Hermitian Floquet dynamics in absorption spectroscopy [0.0] 弱いプローブの極限では、リンドブラッド・マスター方程式は関連する定常状態コヒーレンスに対してより小さな線形方程式系に還元される。
媒体の複雑な感受性は、崩壊する着衣状態の個々の寄与の観点から表すことができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:05:31 GMT)
Multi-Species Object Detection in Drone Imagery for Population Monitoring of Endangered Animals [0.0] 本研究は,動物種を正確に数えるために,ドローン画像の微調整対象検出モデルに焦点を当てた。
私たちは30の異なるモデルをトレーニングし、最大のモデルは4370万のパラメータと365のレイヤを持っていた。
我々はこれらのモデルをJetson Orin Nano上に展開し、ドローンで容易に推測できる低消費電力リアルタイム種検出のデモを行った。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:03:55 GMT)
Mixing of counterpropagating signals in a traveling-wave Josephson device [0.0] 光波は真空中では相互作用しないが、非線形媒質中を移動する際に様々なパラメトリック過程を通して混合することがある。
本研究では,1次元ジョセフソンメタマテリアルに沿って伝搬する入力マイクロ波信号を反対方向に伝搬する出力波に変換する方式について検討する。
我々は、このプロセスを利用して、相互に調整可能なカップラに再構成できる堅牢なオンチップマイクロ波アイソレータを実装する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:49:38 GMT)
Mitigating Externalities while Learning: an Online Version of the Coase Theorem [0.0] 経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。
我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。
次に、プレイヤーが全福祉を最大化する交渉戦略を学習できるようにするための政策を設計する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:00:53 GMT)
MeGA: Merging Multiple Independently Trained Neural Networks Based on Genetic Algorithm [0.0] 本稿では, 遺伝的アルゴリズムであるMeGAを用いて, 複数の事前学習ニューラルネットワークの重みをマージする新しい手法を提案する。
我々のアプローチは、トーナメントの選択、クロスオーバー、突然変異による遺伝的アルゴリズムを利用して重量の組み合わせを最適化し、より効果的な融合を生み出す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:53:21 GMT)
Markovian to non-Markovian phase transition in the operator dynamics of a mobile impurity [0.0] カオス媒質中を移動する不純物のランダムなユニタリ回路モデルについて検討する。
不純物と媒質の力学は非マルコフ的であり、情報は不純物に戻すことができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:33:01 GMT)
Machine-Learning-Driven Runtime Optimization of BLAS Level 3 on Modern Multi-Core Systems [0.0] 我々は、機械学習を用いてすべてのBLASレベル3操作のランタイムを最適化するアーキテクチャおよびデータ構造対応線形代数ライブラリの拡張について述べる。
我々は,MKLとBLISをベースラインBLAS実装として,IntelとAMDプロセッサの2つのHPCプラットフォーム上でテストを行った。
最大スレッド数に比べて,すべての操作に対して1.5から3.0の高速化を実現しています。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:07:53 GMT)
ML Updates for OpenStreetMap: Analysis of Research Gaps and Future Directions [0.0] 正確な最新の地図を維持することは、あらゆる動的な都市景観において重要である。
従来の(主に手動の)マップ生産とクラウドソースのマッピング手法は、構築された環境の急速な変化とペースを維持するのに依然として苦労している。
GoogleやMicrosoftのようなテクノロジーの巨人は、この現代のマッピング問題に対処するための機械学習(ML)技術の調査をすでに始まっている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:51:04 GMT)
Long-range interactions revealed by collective spin noise spectra in atomic vapors [0.0] アルカリ原子の高濃度蒸気の薄膜のスピンノイズスペクトロスコピー(SNS)における異常な特徴を報告する。
高密度で共鳴に近い場所では、スピンノイズスペクトルの劇的な拡張と、予期せぬ低周波雑音成分が観察される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:30:43 GMT)
Leveraging Knowledge Distillation for Lightweight Skin Cancer Classification: Balancing Accuracy and Computational Efficiency [0.0] 皮膚がんは公衆衛生にとって大きな関心事であり、報告されているがんの3分の1を占めている。
本稿では,軽量ながら高い性能の分類器を作成するための知識蒸留に基づく手法を提案する。
高精度でコンパクトなサイズを持つため、われわれのモデルは、特に資源制約のある環境では、正確な皮膚がん分類の候補となる可能性がある。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 05:50:11 GMT)
Learning Closed Signal Flow Graphs [0.0] 閉信号フローグラフの学習アルゴリズムを開発した。
このアルゴリズムは、閉信号フローグラフとシングルトンアルファベット上の重み付き有限オートマトンとの対応に依存する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:04:36 GMT)
LLMs and Memorization: On Quality and Specificity of Copyright Compliance [0.0] 大規模言語モデル(LLM)のメモリ化が懸念されている。
LLMは、著作権のある作品を含むトレーニングデータの一部を容易に再現できることが示されている。
これは、欧州AI法と同様に、既存の著作権法に違反している可能性があるため、解決すべき重要な問題である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:12:39 GMT)
Krylov complexity for 1-matric quantum mechanics [0.0] 本稿では, 1-行列量子力学(1-MQM)の枠組みの中で, 演算子成長の尺度であるクリロフ複雑性の概念を考察する。
相関関数から導かれるランツォス係数を解析し,この積分系においても線形成長を明らかにする。
1-MQMの基底状態と熱状態の両方における我々の発見は、量子力学モデルにおける複雑性の性質に関する新たな洞察を与える。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:00:03 GMT)
Koopman based trajectory model and computation offloading for high mobility paradigm in ISAC enabled IoT system [0.0] 6G技術の進歩は、モバイルの技術進化に急速に浸透しつつある。
モバイル通信における統合されたセンシングと通信は、軌道予測と処理遅延を改善する可能性がある。
本研究では,多ユーザネットワークにおける資源配分最適化手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:26:28 GMT)
Investigating the Timescales of Language Processing with EEG and Language Models [0.0] 本研究では,事前学習した言語モデルと脳波データからの単語表現のアライメントを検討することで,言語処理の時間的ダイナミクスについて検討する。
テンポラル・レスポンス・ファンクション(TRF)モデルを用いて、神経活動が異なる層にまたがるモデル表現とどのように対応するかを検討する。
分析の結果,異なる層からのTRFのパターンが明らかとなり,語彙的および構成的処理への様々な貢献が明らかになった。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 12:49:27 GMT)
Frustrated Random Walks: A Fast Method to Compute Node Distances on Hypergraphs [0.0] ハイパーグラフ(英: hypergraph)は、実体間の属性共有を考えると自然に現れるグラフの一般化である。
ハイパーグラフ研究におけるオープンな問題は、ハイパーグラフ上のノード距離を正確に効率的に計算する方法である。
我々は,ハイパーグラフノード距離を計算するために,ランダムウォークのヒット時間を用いて提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:18:24 GMT)
From square plaquettes to triamond lattices for SU(2) gauge theory [0.0] 我々は、量子色力学への慣れ親しんだ非アベリアステップであるSU(2)ゲージ理論の切り離されたバージョンに焦点を当てる。
本稿では,3次元の格子ゲージ理論に対する簡便なアプローチとして,トライアモンド格子を提案する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:03:46 GMT)
Fishnets: Information-Optimal, Scalable Aggregation for Sets and Graphs [0.0] Fishnetsは、データ集合に対する情報-最適埋め込みを学ぶための集約戦略である。
既存のベンチマークより, ogbnタンパク質データに対して, 最先端の性能とアーキテクチャサイズを両立させることができることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:59:14 GMT)
Finite-temperature properties of string-net models [0.0] 弦-ネットモデルの分割関数を計算し,いくつかの熱力学量について検討する。
熱力学の限界では、分配関数は純粋フラクトンと呼ばれる特別な粒子の寄与によって支配されることを示す。
また、励起に付随するウェグナー・ウィルソンループの挙動を解析し、それらが領域法則に従うことを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 07:51:58 GMT)
Extremal simplicial distributions on cycle scenarios with arbitrary outcomes [0.0] サイクルシナリオは、Crauser-Horne-Shimony-Holt(CHSH)シナリオが顕著な例である。
我々は、任意の結果のサイクルシナリオに対応する非シグナリングポリトープの文脈的頂点を特徴付けるために、単純な分布の枠組みにホモトピー的手法を用いる。
これにより、サイクルシナリオをグルリングすることによって形成されたシナリオを超えて拡張し、これらの一般化されたコンテキストにおける文脈的極小分布を記述することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:48:31 GMT)
Explainable Image Captioning using CNN- CNN architecture and Hierarchical Attention [0.0] 説明可能なAIは、モデルやアルゴリズムの予測が説明可能で正当化可能な方法で、従来の手法にアプローチするアプローチである。
CNNデコーダと階層型アテンションの概念を取り入れた新しいアーキテクチャが,キャプション生成の高速化と精度向上に利用されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:27:47 GMT)
Exact Bayesian Gaussian Cox Processes Using Random Integral [0.0] インテンシティ関数の後方推測は、二重インタラクタブルインテリジェンス(英語版)が二重インタラクタブルインテリジェンス(英語版)をもたらす可能性がある。
本研究では, 不均一なポアソン過程の強度関数を, 大容量データ増大や近似に依存することなく推定する非パラメトリックベイズアプローチを提案する。
我々は,時間的・空間的な事象データや,複数の解像度で収集した時系列データを含む実世界の3つのシナリオにおいて,本手法の有用性を実証する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:11:33 GMT)
Evaluation of autonomous systems under data distribution shifts [0.0] 我々は、データはデータ分散シフトの一定のしきい値までしか使用できないと主張している。
トレーニングデータとテストデータ間の距離メトリクスを提案し,そのシフト内での安全な操作限界を定義する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:58:32 GMT)
Epistemic Horizons From Deterministic Laws: Lessons From a Nomic Toy Theory [0.0] 本研究では, トイ理論が相容れない測定値を持ち, 物理的システムの完全状態を知ることができないことを示す。
被検体と対象物の分離性の観点から測定の不確かさを考察する。
この研究は、(完全な)量子論のようなさらなる研究を招待する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 13:51:40 GMT)
Entanglement signatures of a percolating quantum system [0.0] エンタングルメント対策は、量子相とその遷移を診断するための多用途プローブの1つとして登場した。
基礎となる格子がパーコレーション障害を持つとき、有限密度の自由フェルミオンは、非常に縮退した基底状態による興味深い絡み合い特性を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:01:23 GMT)
Enforcing Equity in Neural Climate Emulators [0.0] ニューラルネットワークエミュレータを予測の不平等な品質で罰するカスタム損失関数を提案する。
損失関数は、ニューラルネットワークを向かわせるために、特定の株式の定義を規定しない。
以上の結果から, 損失関数でトレーニングしたニューラル気候エミュレータの方が, より公平な予測が可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 03:47:54 GMT)
Electrostatics-based particle sampling and approximate inference [0.0] 静電気学とニュートン力学の原理に基づく新しい粒子に基づくサンプリングおよび近似推論法が導入された。
より一般的な推論問題において、離散時間離散空間のアルゴリズム設計が使用される。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:53:06 GMT)
Efficacy of Various Large Language Models in Generating Smart Contracts [0.0] 本研究では,Immutable上のSolidityスマートコントラクト作成におけるコード生成型大規模言語モデルの適用性について分析する。
また、新しいプロンプト戦略を通じてスマートコントラクトを生成する新しい方法を発見しました。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 17:31:47 GMT)
Effects of resonant dipole-dipole interactions in the spin noise of atomic vapors [0.0] 強い密度依存性を有するスピンノイズスペクトルの異常な直線性について報告する。
これらの特徴は,アンサンブル内のバイナリ間の強い双極子-双極子相互作用の象徴であることを示す。
この研究は、粒子アンサンブル内で発生する強い相互作用を観察し定量化するためのスピンノイズ分光法の可能性を示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:41:23 GMT)
Dynamic planning in hierarchical active inference [0.0] 人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
この研究は、ニューラルネットワークと強化学習を中心とした従来の見解とは距離を置き、アクティブ推論においてまだ探索されていない方向に向かっている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:16:53 GMT)
Defect Detection in Synthetic Fibre Ropes using Detectron2 Framework [0.0] 条件監視(CM)アプリケーションにおける深層学習モデルは、合成繊維ロープ(SFR)の欠陥検出に対して、よりシンプルで効果的なアプローチを提供する。
本研究の目的は,SFRの欠陥を自動かつ効率的に検出し,検査プロセスを向上し,繊維ロープの安全性を確保することである。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:13:48 GMT)
Deep Learning of Multivariate Extremes via a Geometric Representation [0.0] 本研究では, スケールした試料雲の極限形状から極端依存特性を推定する幾何学的極端の研究を行う。
本稿では,幾何学的極端フレームワークの実装を支援するための新しい理論結果を提案する。
本稿では,ディープラーニングニューラルネットワークを用いた制限セットのモデル化について紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:05:47 GMT)
Conceptual and formal groundwork for the study of resource dependence relations [0.0] 資源理論は状態に対して事前順序を課し、一方の状態が他方の状態より上である場合、第一の状態が自由操作によって第二の状態に変換される。
リソースフルネスの異なる概念の間には、非自明な依存関係が存在する可能性がある。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:04:31 GMT)
Comparative Analysis of LSTM Neural Networks and Traditional Machine Learning Models for Predicting Diabetes Patient Readmission [0.0] 本研究はDiabetes 130-US Hospitalsデータセットを用いて,各種機械学習モデルによる寛解患者の分析と予測を行う。
LightGBMは、XGBoostが首位だったのに対して、従来のモデルとしてはベストだった。
本研究は,予測医療モデリングにおいて,モデル選択,検証,解釈可能性が重要なステップであることを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 15:06:22 GMT)
Collinear three-photon excitation of a strongly forbidden optical clock transition [0.0] 弱磁場中における新しいコリニア3光子過程を用いて, ボソニック8.8$Srにおけるクロック遷移のコヒーレント励起を示す。
ボゾン同位体における核スピンの欠如は、磁場に対する感度の低下と光学格子光シフトをもたらす。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 02:36:22 GMT)
Chitchat as Interference: Adding User Backstories to Task-Oriented Dialogues [0.0] Llama-2-70Bを用いて,ユーザバックストリーによるMultiWOZデータセットの強化を行う。
私たちは2つのモデルをテストします。1つはTODのみを訓練し、もう1つはTODを予備的な整合相互作用で訓練しました。
我々のデータセットは、トレーニング目的に効果的に使用することができ、システムはユーザーの背景を一貫して認識することができる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:27:11 GMT)
Catastrophic-risk-aware reinforcement learning with extreme-value-theory-based policy gradients [0.0] 本稿では, 逐次意思決定プロセスにおける破滅的リスク軽減の問題に取り組む。
POTPGと呼ばれるポリシー勾配アルゴリズムが開発されている。
金融リスク管理への応用について紹介する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:23:49 GMT)
Beyond MP2 initialization for unitary coupled cluster quantum circuits [0.0] ユニタリ結合クラスタ(UCC)アンサッツは、高精度な結果を達成するための有望なツールである。
我々は,効率的なスパース波動関数回路ソルバを用いることで,UCCシミュレーションの最先端を推し進める。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:53:22 GMT)
Backpropagation scaling in parameterised quantum circuits [0.0] 我々は、古典的にシミュレート可能でない回路を導入し、回路数を大幅に減らして勾配推定を許容する。
具体的には、これらの回路は勾配、高次偏微分、フィッシャー情報行列の高速な推定を可能にする。
16量子ビットの玩具分類問題では、これらの回路は他の手法と競合する性能を示し、トレーニングコストを約2桁削減する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:44:11 GMT)
BMW Agents -- A Framework For Task Automation Through Multi-agent Collaboration [0.0] 我々は、様々なドメインにわたる複雑なユースケースアプリケーションを扱う柔軟なエージェントエンジニアリングフレームワークの設計に重点を置いている。
提案するフレームワークは,産業用アプリケーションの信頼性を提供し,複数の自律エージェントに対して,スケーラブルでフレキシブルで協調的なワークフローを保証するためのテクニックを提供する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:39:20 GMT)
Asymmetries of thermal processes in open quantum systems [0.0] 非平衡量子熱力学における興味深い現象は、熱過程の非対称性である。
熱平衡に対する自由緩和は, 系の温度が上昇(加熱)するか, あるいは低下(冷却)するかによって, 本質的に異なる経路を辿ることが示されている。
我々の理論は情報幾何学理論に基づく最近開発された熱キネマティクスを用いて実証されている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:07:21 GMT)
Assistive Image Annotation Systems with Deep Learning and Natural Language Capabilities: A Review [0.0] 本稿では、入力画像のテキスト提案、キャプション、記述をアノテータに提供するためのAI支援型ディープラーニング画像アノテーションシステムについて検討する。
各種データセットをレビューし,AI補助アノテーションシステムのトレーニングと評価にどのように貢献するかを検討する。
有望な可能性にもかかわらず、テキスト出力機能を備えたAIアシスト画像アノテーションに関する公開作業は限られている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 22:56:17 GMT)
AnomaLLMy -- Detecting anomalous tokens in black-box LLMs through low-confidence single-token predictions [0.0] AnomaLLMyはブラックボックス大言語モデルにおける異常トークンの自動検出のための新しい技術である。
AnomaLLMyはモデル動作の不規則を識別し、モデルの品質と信頼性を低下させる異常トークンの問題に対処する。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 11:28:44 GMT)
Analyzing Quality, Bias, and Performance in Text-to-Image Generative Models [0.0] 生成モデルの発展にもかかわらず、ほとんどの研究はバイアスの存在を無視している。
本稿では,人間の顔,グループ,特定対象物の正確な画像を生成する上で,その性能を定性的に評価するだけでなく,社会的バイアス分析を行うことにより,複数のテキスト・画像モデルについて検討する。
期待通り、より大きな能力を持つモデルは、高品質な画像を生成する。しかし、これらのモデルが持つ固有の性別や社会的バイアスも文書化しており、それらの影響と限界をより完全に理解している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 14:10:42 GMT)
Analytical evaluations of the Path Integral Monte Carlo thermodynamic and Hamiltonian energies for the harmonic oscillator [0.0] この研究は、現在知られている短時間プロパゲータのみを用いて、ハミルトンエネルギーを12階に最適化できることを示している。
この研究は、熱力学エネルギーの計算に使用される2階原始近似プロパゲータが、ビーズ数の増加とともに非常にゆっくりと収束していることを明確にしている。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:36:50 GMT)
An optically defined phononic crystal defect [0.0] フォトニック結晶膜に光ばねを印加し、単一のメカニカルモードをバンドギャップに転送する。
この局在は、モードの参加質量が37倍に減少する強化された機械的周波数シフトによって証明される。
本研究は, メカニカルモードプロファイルと参加質量を制御した新しいオプトメカニカルシステムについて基礎研究を行った。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 18:17:32 GMT)
Adiabatons in a double tripod coherent atom-light coupling scheme [0.0] 本研究の目的は, 多くの原子系におけるアディアバトン生成の解析と実証である。
その結果、M型原子系は、長距離光アディアバトンの形成を妨げる強い依存群速度とパルス前部急激化の傾向にあることがわかった。
二重三脚原子系は、不変形状で伝播する2つの異なる光学場を形成する光アディアバトンの形成に非常に有利である。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 23:07:55 GMT)
A numerical approach to the Bell-CHSH inequality in Quantum Field Theory [0.0] ベル-CHSH不等式は、テスト関数のローレンツ不変内積の項で表される。
粒子質量パラメータの異なる値に対してベル-CHSH不等式の振動を報告した。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 16:24:24 GMT)
A class of 2 X 2 correlated random-matrix models with Brody spacing distribution [0.0] ブロディ分布を固有値間隔分布とする 2 X 2 乱行列モデルのクラスを導入する。
ここで導入されたランダム行列は、ガウス直交アンサンブル(GOE)の3つの重要な方法で異なる。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 19:26:29 GMT)
A Unified Approach to Emotion Detection and Task-Oriented Dialogue Modeling [0.0] ユーザ感情検出はテキストベースのタスク指向対話システムでは見過ごされがちである。
EDとTODモデリングをシームレスに統一することは相互に利益をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:23:29 GMT)
A Traveling Wave Parametric Amplifier Isolator [0.0] ビルトインの分離とゲインは、彼らの主な制限、すなわち真の方向性の欠如に対処する。
ジョセフソン接合を用いた移動波パラメトリック増幅器の試作を行った。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 08:51:22 GMT)
A Simple Attention-Based Mechanism for Bimodal Emotion Classification [0.0] 本稿では,感情分類のためのテキストおよび音声データに基づいて,注意機構を訓練し,テストしたバイモーダル深層学習アーキテクチャを提案する。
我々の発見は、深層学習に基づくアーキテクチャは、異なるタイプのデータ(テキストと音声)に基づいて訓練され、テキストと音声だけで訓練されたアーキテクチャよりも優れていたことを示唆している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 10:43:02 GMT)
A Short Report on the Probability-Based Interpretation of Quantum Mechanics [0.0] Popper氏は、量子力学(QM)における基本的な問題は、未解決の確率的問題から直接引き起こされていることに気付く。
本稿では,本書で最近発表された確率構造理論について概説し,その完全性を示すためにQMに適用する。
確率に基づくQMの解釈は、論文の限界を越えており、これらのページはこの理論スキームのいくつかの側面を包含している。
論文参考訳(メタデータ) (Fri, 28 Jun 2024 09:50:11 GMT)