一文读懂面向数据中心的高性能通用RISC-V处理器技术(上)

关于我们 > 新闻动态 > 行业动态

指令集架构(ISA)是算力领域最重要的根技术之一,当算力成为核心生产力,培育并自主掌控指令集架构,事关我国数字经济发展,也是网络强国、数字中国等重大战略落地的重要保障。作为主流三大指令集架构之一,RISC-V以其开源、开放等特点,在全球范围内受到了高度关注,被认为是打破x86和ARM垄断,提高芯片竞争力的关键。然而,RISC-V起步较晚,在高性能通用计算领域的相关技术尚未成熟,产业呈碎片化状态各自独立发展,软件生态上接受度较低,暂时还无法形成对x86和ARM的挑战。本文从技术背景、产业动态、关键技术等方面进行了分析,探讨推动面向数据中心的高性能通用RISC-V处理器技术快速发展的可行方案。

 

一、指令集架构是算力根技术

 

近几年来,算力成为大家所关注的热门话题,ARM、GPU、AI等算力相关技术也逐渐变得耳熟能详。算力,顾名思义就是硬件机器执行软件代码的能力,但由于硬件机器无法理解高级语言编写的软件代码,需要事先通过编译器将软件代码编译为硬件机器可以理解的二进制语言,组成这个二进制语言的基本单元就是指令(Instruction),一系列指令的集合即为指令集(Instruction Set)。

 

如果说指令和指令集是二进制这门语言的单词和词典,那么指令集架构(Instruction Set Architecture,简称ISA)则是二进制语言的语法,这门语法定义了指令的格式,以及围绕着指令执行定义了数据类型、寄存器、寻址模式、缓存结构、中断系统、外部I/O等设计范式,它描述了计算机如何去执行二进制指令的最基本的框架,它同时也是硬件和软件这两个领域的交互接口,因此,可以说指令集架构是算力的根技术,谁掌控了这门技术,谁就拥有这个领域的话语权。

 

    

 1 指令集是硬件与软件间的交互接口

 

在描述“指令集架构”时,大家习惯用“指令集”来简单指代,因此,本文所描述的指令集也可以代表指令集架构。

 

二、指令集及处理器芯片的产业现状

 

一生二:指令集包含CISC、RISC两种类型

 

从设计理念和实现方式上,可以将指令集划分为两个大类:CISC指令集(Complex Instruction Set Computer)和RISC指令集(Reduced Instruction Set Computer)。

 

 

  

2 CISC、RISC及其指令集

 

CISC:复杂指令集。它的“复杂”体现在尽可能使用晶体管满足更多的指令和计算功能(比如x86指令集拥有5000多条指令)。基于此特性,CISC相比RISC表现出更佳的对场景的适应性和特定场景下的性能,然而,其代价也是巨大的,由于需要适应不同场景下的差异化的指令功能,其电路设计相对要复杂得多,前向兼容性也成为一个巨大的负担,因此,基于CISC的处理器的产品迭代难度要远大于RISC,也因此现在的CISC处理器在内部实现上,通常将CISC指令拆分为多条RISC指令实现,以减少复杂度,比如,Intel Sandy-Bridge微架构(微架构是针对指令集的电路设计实现)下,每一个流水线设计了4个译码器,其中1个是复杂译码器,能够译码所有复杂指令,而另外3个是简单译码器,负责译码一个micro-op(微操作,相当于一条精简指令)。

 

RISC:精简指令集。与CISC相比,RISC保持指令和计算功能的简洁性(比如ARM指令集仅拥有1000多条指令,RISC-V仅有不到200条指令),它倾向于将多数晶体管用于相对容易演进的外围设计,比如更多的寄存器、缓存、指令译码器及乱序执行、指令压缩等能力。简洁的设计使得基于RISC的处理器更易于优化和演进,其综合性能理论上完全可以媲美基于CISC的处理器(处理器的性能还与微架构、生产工艺等相关)。

 

)二生三:X86、ARM、RISC-V占据主流市场

 

CISC指令集的典型代表是x86指令集,它于1976年由美国Intel发明并首先应用于其8086处理器上,受限于产能问题,在其最大客户IBM的要求下,Intel将x86产权授权给了AMD等公司,并逐渐发展成为兼容16位、32位计算机架构的x86_32指令集,然而在随后开始于1999年的64位计算机架构大战中Intel输给了AMD,最终,Intel、AMD交叉授权,共同拥有x86_32和x86_64的永久授权。此外,Intel最早授权的一系列公司经过诉讼、反诉讼和并购发展,还剩余VIA拥有x86_32授权(没有x86_64授权,且授权在2018年4月份到期)。目前x86指令集在服务器市场拥有霸主地位,其份额约为90%。

 

RISC的典型代表是ARM指令集和RISC-V指令集。ARM指令集于1983年起源于英国Acorn公司的ARM计划(Acorn RISC Machine),该计划的负责团队于1990年独立出来与苹果公司、VLSI公司联合成立ARM公司(Advanced RISC Machines),在随后的4G时代的智能手机浪潮中,ARM指令集抓住了x86功耗高、续航差的弱点和市场机遇,一举奠定了其在移动终端市场的绝对垄断地位,其市场份额高达99%,此外ARM在服务器市场也发展迅速,目前的市场份额约为9%。

 

x86主要以销售芯片的方式盈利,而ARM主要以对外授权的方式盈利,x86与ARM均属于由商业公司掌控的封闭或半封闭式的指令集,相比之下,RISC-V以其开源、开放、免费(无需指令集授权费,RISC-V处理器IP核的授权费属于商业公司销售其知识产权的行为)等特点,成为除x86、ARM之外最受欢迎的指令集。RISC-V于2010年由美国加州大学伯克利分校发明,其国际开源组织RISC-V International于2015年成立,并于2020年迁往中立国瑞士,不受任何单一企业或国家控制。由于起步较晚,RISC-V没有x86、ARM的前向兼容的历史包袱,它站在巨人的肩膀上发展,也成为当前最为简洁有效的指令集。RISC-V发展迅速,市场前景广阔,有望掀起新的一轮芯片浪潮。根据Semico Research的最新预测,到2025年,全球RISC-V CPU内核的出货量累计将达到约800亿颗,约占14%的市场份额。

 

(三)三生万物:我国芯片产业的指令集应用情况

 

算力已然成为推动科技发展的核心驱动力,而芯片是算力的基础载体。我国日益重视芯片的自主可控,目前国内处理器芯片主要有七家。

 

基于x86指令集的处理器有海光、兆鑫,其中海光基于AMD Zen1架构的IP核授权(但拥有指令集的定制和修改许可),目前海光1号、2号已在运营商等领域获得规模化应用;兆鑫来源于VIA的x86许可,由于仅拥有32位指令集的许可,且授权已于2018年4月份到期,无法使用该时间后的新技术,其后续发展状态有待观望。

 

基于ARM指令集的处理器有鲲鹏、飞腾、珠峰,其中鲲鹏和飞腾均来源于ARM v8的架构授权,而珠峰来源于ARM v9的IP核授权,ARM目前出货量在信创领域占据了半壁江山。

 

其它指令集的处理器有龙芯、申威。龙芯的指令集采用基于MIPS自研的LoongArch,申威的指令集采用基于Alpha自研的SW_64,目前主要活跃于信创领域,软件生态问题是制约其发展的最大障碍。

 

 

三、RISC-V技术的全球化动态及布局

 

全球主要国家纷纷布局RISC-V产业,RISC-V成为芯片竞争的新赛道。

 

2017年美国国防部高级研究计划局(DARPA)启动15 亿美金的“电子复兴计划”,RISC-V正是在DARPA的早期资助下诞生的,另外率先孵化出国际标杆企业SiFive,推动RISC-V的商业化。

 

欧盟在2023年发布《关于建立欧洲开源硬件、软件和RISC-V技术主权的建议和路线图》报告,提出九大优先发展关键方向和实施路径,支持RISC-V与开源硬件发展。

 

2022年俄罗斯成立“俄罗斯RISC-V联盟”支持RISC-V架构,2023年俄罗斯数字发展部宣布大力扶持RISC-V处理器的发展。

 

2022年印度启动“数字印度RISC-V处理器(DIR-V)”发展规划,其电子信息部加入RISC-V International。

 

我国政府也在政策和资金上扶持RISC-V研发,助力RISC-V商用落地,2018年中国RISC-V产业联盟和中国开放指令生态(RISC-V)联盟成立,2023年,工信部指导成立RISC-V工作委员会,围绕RISC-V产业开展标准研制、符合性评估、行业应用等方面工作。

 

审稿:网络与IT技术研究所 | 张昊、陈佳媛

 

本文作者


吴平松  网络与IT技术研究所就职于中国移动研究院,主要从事网络云、处理器芯片等领域的方案设计、标准制定和项目管理工作。

  兵  网络与IT技术研究所就职于中国移动研究院,主要从事硬件、CPU、指令集等方向的研发工作。

邹博韬  网络与IT技术研究所就职于中国移动研究院,主要从事硬件、CPU、指令集等方向的研发工作以及网络云试点测试工作。

姚晓霞  网络与IT技术研究所就职于中国移动研究院,主要从事硬件、CPU、指令集等方向的研发工作。

 

源自:中移智库

2024-08-21 10:00