Skip to main content

每天拆解一个AI知识点:VLLM什么是 VLLMVLLM 是由加州大学伯克利分校 SkyLab 领导开发的一款高性能大语言模型推理引擎,专为高效部署和运行大模型而设计

  1. 每天拆解一个AI知识点:VLLM

    什么是 VLLM

    VLLM 是由加州大学伯克利分校 SkyLab 领导开发的一款高性能大语言模型推理引擎,专为高效部署和运行大模型而设计。
    其中的“y”代表virtual,指的是它通过类似操作系统分页机制的设计,实现了显存虚拟化管理,显著提升显存利用率,从而大幅提高推理吞吐量!
    ❤️ 2