step_twenty:双 MI50/双 V100 跑 Qwen3.5/3.6 全面对比:llama.cpp、vLLM、RPC 分布式实测 - 28_1Cat-vLLM 1.0.0 来了!实测 MTP1MTP2 对 27B35B 模型的输出速度影响

UP主:
封面:
简介:
视频选集