CPU和GPU的区别

=Start=

缘由：

自从 chatGPT 横空出世之后，关于 AI 的讨论层出不穷，为了避免信息脱节，需要主动去学习了解相关知识。在看了一些文章之后，发现我有太多的基础知识要补充，只能一点一点来，先从基础的开始。这次先学习整理一下CPU和GPU的区别，才好去了解为什么深度学习等机器学习算法的介绍基本离不开GPU，为什么NVIDIA英伟达会和GPT产生如此紧密的联系？

正文：

参考解答：

CPU和GPU都是处理器，两者有什么不同

设计目标不同导致接下来的一系列不同。

CPU和GPU之所以大不相同，是由于其设计目标的不同，它们分别针对了两种不同的应用场景。CPU需要很强的通用性来处理各种不同的数据类型，同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂。而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。

GPU采用了数量众多的计算单元和超长的流水线，但只有非常简单的控制逻辑并省去了Cache。而CPU不仅被Cache占据了大量空间，而且还有复杂的控制逻辑和诸多优化电路，相比之下计算能力只是CPU很小的一部分。

理解 GPU 和 CPU 之间区别的一种简单方式是比较它们如何处理任务。CPU 由专为顺序串行处理而优化的几个核心组成，而 GPU 则拥有一个由数以千计的更小、更高效的核心（专为同时处理多重任务而设计）组成的大规模并行计算架构。

CPU (Central Processing Unit，中央处理器)就是机器的“大脑”，是完成布局谋略、发号施令、控制行动的“总司令官”。CPU的结构主要包括运算器(ALU，Arithmetic and Logic Unit)、控制单元(CU，Control Unit)、寄存器(Register)、高速缓存器(Cache)和之间通讯的数据、控制及状态的总线。

GPU(Graphics Processing Unit，中文为图形处理器)，又称显示核心、视觉处理器、显示芯片。就如其名字一样，GPU最初是用在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上运行绘图运算工作的微处理器。

CPU 基于低延时的设计(latency oriented design)。

GPU是基于大的吞吐量设计(throughput oriented design)。

与CPU擅长逻辑控制，串行的运算和通用类型数据运算不同，GPU擅长的是大规模并发计算，这也正是密码破解等所需要的。所以GPU除了图像处理，也越来越多地参与到计算当中来。

一个简单的类比——教授vs小学生

CPU和GPU的最大不同在于架构，CPU适用于广泛的应用场景(学识渊博)，可以执行任意程序，而GPU则专为多任务而生，并发能力强，具体来讲就是多核，一般的CPU有2核、4核、8核等，而GPU则可能会有成百上千核。

GPU的工作大部分就是这样，计算量大，但没什么技术含量，而且要重复很多很多次。就像你有个工作需要算几亿次一百以内加减乘除一样，最好的办法就是雇上几十个小学生一起算，一人算一部分，反正这些计算也没什么技术含量，纯粹体力活而已。而CPU就像老教授，积分微分都会算，就是工资高，一个老教授资顶二十个小学生，你要是富士康你雇哪个？GPU就是这样，用很多简单的计算单元去完成大量的计算任务，纯粹的人海战术。这种策略基于一个前提，就是小学生A和小学生B的工作没有什么依赖性，是互相独立的。很多涉及到大量计算的问题基本都有这种特性，比如你说的破解密码，挖矿和很多图形学的计算。这些计算可以分解为多个相同的简单小任务，每个任务就可以分给一个小学生去做。但还有一些任务涉及到“流”的问题。比如你去相亲，双方看着顺眼才能继续发展。总不能你这边还没见面呢，那边找人把证都给领了。这种比较复杂的问题都是CPU来做的。

总而言之，CPU和GPU因为最初用来处理的任务就不同，所以设计上有不小的区别。而某些任务和GPU最初用来解决的问题比较相似，所以用GPU来算了。GPU的运算速度取决于雇了多少小学生，CPU的运算速度取决于请了多么厉害的教授。教授处理复杂任务的能力是碾压小学生的，但是对于没那么复杂的任务，还是顶不住人多。当然现在的GPU也能做一些稍微复杂的工作了，相当于升级成初中生高中生的水平。但还需要CPU来把数据喂到嘴边才能开始干活，究竟还是靠CPU来管的。

为什么GPU需要这么多核心？

想一想计算机上的一张图是怎么表示的？无非就是屏幕上的一个个像素。

我们需要为每个像素进行计算，而且是相同的运算，就好比刚才例子中的小学生计算计加法一样，注意，对于屏幕来说一般会有上百万个像素，如果我们要串行的为每一个像素进行运算效率就太低了，因此我们可以让GPU中的每一个核心去为相应的像素进行计算，由于GPU中有很多核心，因此并行计算可以大幅提高速度。

现在你应该明白为什么GPU要这样工作了吧。

不同的工作方式

对CPU来说，不同的核心可以执行不同的机器指令，coreA在运行word线程的同时coreB上可以运行浏览器线程，这就是所谓的多指令多数据，MIMD，(Multiple Instruction, Multiple Data)。

而GPU则不同，GPU上的这些核心必须整齐划一的运行相同的机器指令，只是可以操作不同的数据，这就好比这些小学生在某个时刻必须都进行加法计算，不同的地方在于有的小学生可能需要计算1+1，有的要计算2+6等等，变化的地方仅在于操作数，这就是所谓的单指令多数据，SIMD，(Single Instruction, Multiple Data)。

因此我们可以看到GPU的工作方式和CPU是截然不同的。

除了这种工作方式之外，GPU的指令集还非常简单，不像CPU这种复杂的处理器，如果你去看CPU的编程手册就会发现，CPU负责的事情非常多：中断处理、内存管理、IO等等，这些对于GPU来说都是不存在的，可以看到GPU的定位非常简单，就是纯计算，GPU绝不是用来取代CPU的，CPU只是把一些GPU非常擅长的事情交给它，GPU仅仅是用来分担CPU工作的配角。

GPU擅长什么

什么类型的程序适合在GPU上运行？

（1）计算密集型的程序。所谓计算密集型(Compute-intensive)的程序，就是其大部分运行时间花在了寄存器运算上，寄存器的速度和处理器的速度相当，从寄存器读写数据几乎没有延时。可以做一下对比，读内存的延迟大概是几百个时钟周期；读硬盘的速度就不说了，即便是SSD, 也实在是太慢了。

（2）易于并行的程序。GPU其实是一种SIMD(Single Instruction Multiple Data)架构，他有成百上千个核，每一个核在同一时间最好能做同样的事情。

CPU会利用较高的主频、cache、分支预测等技术，使处理每条指令所需的时间尽可能少，从而降低具有复杂跳转分支程序执行所需的时间。GPU则通过数量丧心病狂的流处理器实现大量线程并行，使同时走一条指令的数据变多，从而提高数据的吞吐量。

举个GPU通用计算教材上比较常见的例子，一个向量相加的程序，你可以让CPU跑一个循环，每个循环对一个分量做加法，也可以让GPU同时开大量线程，每个并行的线程对应一个分量的相加。CPU跑循环的时候每条指令所需时间一般低于GPU，但GPU因为可以开大量的线程并行地跑，具有SIMD（准确地说是SIMT）的优势。

因此对于图形图像计算、天气预报以及神经网络等都适用于GPU，哦对了，GPU还适合用来挖矿。

为什么在人工智能领域GPU十分盛行？

深度学习是模拟人脑神经系统而建立的数学网络模型，这个模型的最大特点是需要大数据来训练。

因此，人工智能领域对计算能力的要求就是需要大量的并行的重复计算，GPU正好有这个专长，时势造英雄，因此GPU就出山担此重任。

讲到这里，也不妨提一下最近几年市场上很火的AI芯片。这个市场目前主流分为GPGPU（GeneralPurposeGPU）派、FPGA派和ASIC派，特别是在训练方面目前GPGPU占据绝对主导地位：

在众多的GPU厂商中，Nvidia以其产品高度的通用性（支持几乎所有主流AI算法）、成熟的软件生态（CUDA几乎成为深度学习算法设计必备工具）及不断迭代优化的产品矩阵，成为顶级的GPGPU供应商；GoogleTPU在支持某些固化的AI算法时可达到极高的性能/功耗比。

从长期来看，GPGPU的高度通用性和可编程性，无疑对于高速迭代的AI和其他新型算法具备更好的适应性和发展潜力，加上其产品经过长期的迭代和优化设计更加成熟，因此GPGPU成为近年来算法公司的主流硬件加速工具（特别是规模较大的NN加速）。

当GPU遇到人工智能后，开始大放异彩。2006年，英伟达推出基于GPU的CUDA开发平台，开发者可以通过这一平台，使用C语言编写程序以解决复杂的计算问题，换言之，原本只用做3D渲染的GPU变得更加通用，可执行的任务更加多样。

2009年，斯坦福大学的Raina、Madhavan及吴恩达在一篇论文中论述了GPU在深度学习方面相对CPU的大幅优势(http://robotics.stanford.edu/~ang/papers/icml09-LargeScaleUnsupervisedDeepLearningGPU.pdf)，将AI训练时间从几周缩短至几小时。这篇论文为人工智能的硬件实现指明了方向。GPU大大加速了AI从论文走向现实的过程。

参考链接：

CPU和GPU的不同
https://mp.weixin.qq.com/s/w_g35fttdhX1V6YUiujYDw

CPU与GPU到底有什么区别？
https://mp.weixin.qq.com/s/fCuifWU-9tXMJLW_fLZRew

简单聊聊CPU和GPU的区别
https://mp.weixin.qq.com/s/dBn_Uiln4wacRsqpFXMuGg

FPGA、 CPU、GPU、ASIC的区别
https://mp.weixin.qq.com/s/8d6QU4AVuXRJRk4l2KEdQg

什么是GPU？跟CPU有什么区别？终于有人讲明白了
https://mp.weixin.qq.com/s/MqgWdCuPTyJqFkJdLrB9pg

特斯拉的AI野心：向人类预警，给硅基带路
https://mp.weixin.qq.com/s/zV1HUgIQTAVkxmZDbWKPPw

=END=

6 4 月, 2023

Docker

KnowledgeBase, 机器学习

chatGPT, cpu, GPU, Nvidia, SIMD, 深度学习, 神经网络