ubuntu上Caffe使用OpenBLAS多线程加速

摘抄:http://wxyblog.com/2015/08/27/ubuntu-caffe-openblas/ 谢谢版主

一些概念

使用Caffe的模型做分类时,其运算大概是这样:把输入的图像当做矩阵,一直不停的和模型里面的卷积层kernel做卷积,然后推给pooling层做缩放,最后得到分类结果。最耗时的部分应该在于卷积的操作,Caffe把卷积这种操作转化成了矩阵相乘。而Caffe使用了BLAS的矩阵相乘接口。BLAS是一个数学函数接口标准,有很多个实现。按照Caffe官方ubuntu的安装文档默认安装的是ATLAS。这个版本的BLAS不能利用多核CPU,我们将其换为OpenBLAS,可以利用多核CPU并行计算,加快Caffe的分类速度。

安装配置OpenBLAS

使用下面命令将OpenBLAS的源代码clone到本地并安装:

修改Caffe的Makefile.config,将下面几行:

改为

然后编译程序运行,打开htop可以看到Caffe模型进行分类时会用满所有的CPU。

配置BLAS

事实上,在计算时候将所有CPU核心用完并不一定是一件好的事情。CPU核心使用的越多,数据通信的开销就会越大,性能反而会下降。OpenBLAS提供了很多方法修改占用CPU核心数。我觉得导出环境变量的方式最方便。在控制台里输入:

就是设置使用四个核心计算。尝试不同的核心数目,可以得到在当前设备上最优的选择,写到~/.bashrc里就可以一劳永逸啦。

dawei

【声明】:淮南站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。