12G显存30token每秒,编译llama.cpp跑Qwen3.5-35B-A3B-UD-IQ2_M量化的详细方法。

UP主:
封面:
简介: