OmniServe 面向大规模 LLM 服务的统一高效推理引擎

授权协议:None操作系统:None 开发语言:None
OmniServe 旨在通过统一和优化低比特量化和长上下文处理方面的关键进步来彻底改变大规模 LLM 服务。 OmniServe 集成了QServe和 LServe 的创新,前者通过 W4A8K...