UP主: 封面: 简介:IBM AC922 8335-GTW 6卡V100 16G + NvLINK 2.0 目前上手测试:llama.cpp 运行gpt-oss-120b 首轮70+ tokens/s,多轮大约50tokens/s。运行qwen3-next-80b 量化速度稍慢大概30...