8G显存也能起飞?llama.cpp深度调优:稳跑64k上下文,从133到996 Tokens/s

UP主:
封面:
简介: