ShowBL
www.showbl.com
哔哩哔哩视频解析
抖音视频去水印
12G显存30token每秒,编译llama.cpp跑Qwen3.5-35B-A3B-UD-IQ2_M量化的详细方法。
2026-04-30
24.8 token每秒,3060级别12G显卡跑Qwen3.5-35B-A3B, Q4_K_M量化GGUF版,禁用思考模式,编译llama.cpp后4倍提速。
2026-04-05