-

电脑上的x86与x64有什么不同

来源:小高教学网 作者:本站 时间:2023-05-13 13:35:01 阅读次数:0

近期不少网友都在问:电脑上的x86与x64有什么不同,小编也是查阅很多资料,整理了一些相关方面的答案,大家可以参考一下。

【温馨提示】本文共有15236个字,预计阅读完需要39分钟,请仔细阅读哦!


目录:

手机的芯片安在电脑上 是众望所归还是哗众取宠

在早的时候就有人提出过这个设想,想把骁龙的芯片替换到笔记本电脑里。这么做的目的就是要压低耗能延长续航,相应所要的代价自然是要牺牲笔记本运行性能。这个设想已经被微软联合高通在惠普、华硕产品上开始实施,并在微软自家公司投入百台设备试用,市场定位可见一般。



产品的诞生的同时也会产生这几个疑问:


-它的性能会比轻薄本还要差?


-它和平板有何区别?


-很多电脑支持快充,超长续航意义何在?


-相比酷睿骁龙处理器如何?


-ARM和X86哪个平台更有前途?


这几个问题其实都是大部分用户想问的,像这样“跨界入侵”的意义在于要取长补短,舍去我们实际用不上的功能,即使这些功能并不鸡肋,只要个人用不上就会舍去不让它侵占PC本身的耗能,从根本上做到“节流”因为“开源”能够做的很有限。


X86和ARM的本质区别


目前市面上电脑CPU构架多以X86/X64构架而成,像骁龙这类手机芯片的构架是ARM。虽然都是“大脑”但构架不同对于各种软件处理也多有不同。最为核心区别就是——指令集,电脑CPU采用的指令集叫做CISC,就是“复杂指令系统计算机(Complex Instruction Set Computer)”的意思,CISC指令集的指令系统非常丰富,命令通常也很复杂,这样对操作发出的指令也有针对性,执行效率更高;ARM的CPU则是RISC,意思是“精简指令集计算机(reduced instruction set computer)”,它的特点是针对常用命令进行优化,让他赋予更简洁的执行环境。同时,对不常用的功能通过各种精简指令组合起来完成。


简单说,就是X86/X64的电脑CPU更适用于复杂的操作环境,而ARM的手机CPU则适合执行有针对性的使用环境。显然,从根本上,二者的出发点就不太一样。前者追求大而全,后者追求小而精。


2不能全面超越何谈替代!


不能全面超越何谈替代!


在微软联合高通推出各厂商带骁龙835电脑处理器产品之前,2016年底骁龙820处理器就公开展示了高通骁龙820运行完整版Windows 10 操作系统和对应Win32程序的情况,这期间只用了不到一年时间。



骁龙820处理器布局紧凑设计起来更容易周期更短


反观电脑CPU更新迭代,就算Intel有着更新经验的大厂商也没有快于一年的更新速度,两者之间的难度可想而知。究其原因,RISC CPU结构简单,布局紧凑,甚至是模块化设计,设计周期就更短且易于采用最新技术;反观CISC CPU,因为结构复杂设计周期就更长,而且从根本上讲,电脑CPU还没有像ARM CPU那样可以实现模块化设计。



结构和桌面级处理器有很大差别,尤其是内部总线


不过就目前骁龙处理器已经问世,或许有些人会问电脑CPU会不会被骁龙所替代?替补可以;替代不行,想要实现替代就需要有过人的能力,骁龙的计算能力过于精简,不是一个“全面手”,终究独木难支。如果不能解读更复杂的指令,能应用的场景也极为有限,骁龙处理器的更新也只能称作优化而已。


3短期威胁有限但警钟已敲响


短期威胁有限但警钟已敲响


作为PC市场导向而言永远都是技术优先,X86 架构已经统领桌面平台(包括笔记本)数十年,一直到今天AMD 和Intel 仍然激烈战斗,保持着双方的足够活力,但在部分低功耗领域,确实X86的迭代进步已经被ARM 架构的爆炸增长抵消了不少,双方的性能绝对差距在缩小,高能耗比CPU性能重叠区间越来越大。 短期内,高性能计算、复杂大型3D游戏确实和骁龙835 为代表的ARM 架构没多大关系,即使登上Windows 平台都改不不了这个事实。



续航的确很亮眼


不可否认的是骁龙CPU Win10 在续航、性能和市场方面对Intel 为代表的笔记本市场现在看影响不大。既然微软决定推动这样的策略,那么骁龙835 一定有相当的可用性。



骁龙CPU可用于PS(不流畅是肯定的),难保日后不会绝地反击


根据现在情况看,如果桌面CPU面对骁龙835 性能还真的未必无忧。骁龙835 也许无法真正意义上追平主流的PC处理器,但也不见得就是毫无优势,即使谈不上众望所归,但当面对市场时骁龙CPU笔记本也存在着有真正需求的用户。


Windows 10的MSIX究竟是什么?

微软曾宣布Windows 10将引入一种全新的安装包格式“MSIX”,它可以被看成现有MSI的升级版,几乎支持所有程序格式。到底是新技术还是旧酒装个新瓶子,就让我们来一睹究竟。


追根溯源,了解MSIX的前世今生


大家知道从Windows 8引入Windows商店开始,在Windows系统中软件就分为两大类,一类是传统的.EXE文件系统称之为“程序”( Program Files),一般装在C:Program Files下;另一类则称之为“应用”(Application),大多安装在C:Program FilesWindowsApps下(图1)。






图1 Windows 10应用安装位置


对于传统的标准EXE程序,默认使用的是MSI封装格式,MSI是Microsoft Installer的简写,是微软格式的安装包,Windows 10应用则使用APPX格式封装。这样开发者为Windows 10系统开发应用是就常常需要为应用两种独立封装格式,为了简化开发者的封装工作,微软引入了全新的安装包格式MSIX(=MSI APPX),这就是MSIX的来由(图2)。






图2 MSIX格式


组合格式的背后,MSIX封装解析


如上所述MSIX=MSI APPX,微软推出这种格式的目的是为了简化开发者的封装工作。那么MSIX是怎么实现这个功能的呢?


首先我们来了解一下MSI封装格式,MSI文件是Windows Installer的数据包,从本质上将它实际上是一个数据库,其中包含一个程序所需要的信息和在很多安装情形下安装(和卸载)程序所需的指令和数据。它将单纯的程序文件和功能封装在一起,并且包含有关安装过程信息,比如安装路径,系统运行库文件,安装选项等信息。这样使用标准MSI格式封装的程序,我们在安装的时候可以记录各种详细的信息,卸载的时候则可以根据这些信息将程序完全卸载,即使安装过程中出现错误,我们同样可以借助这些想信息恢复到安全前状态。因此很多大公司开发的软件都使用MSI格式进行封装(图3)。






图3 MSI格式


APPX则是Windows 8之后新增的一种应用格式,其实质一个准备好分配和安装的应用程序包。将安装包上传到Windows商店后,在出售之前,商店会运行安全性和遵从性测试,确保用户从应用商店下载的都是安全性的应用。但是由于目前CPU架构有ARM、x86、x64之分,因此Appx主要有.appx(非通用安装包,在ARM、x86、x64设备上需要不同的安装包)、.appxbundle(同一应用的APPX打包,将不同平台需要的APPX压缩在一起)、.appxsym(UWP符号文件)、.appxupload(开发者向商店上传应用用的文件)四种格式(图4)。






图4 .appxbundle文件


Windows 10应用商店是微软目前全力推广的应用安装方式,为了实现全平台(ARM、x86、x64)兼容,微软在MWC 2015上首次推出Win10通用应用(Windows10 Universal App),它构建了一整套可以在各种Windows平台上使用的通用而现代的跨语言API,再加上良好的文档和应用商店体系。实现了开发者的一份代码几乎完全不用改动,只用在生成安装包的时候勾选几个选项就可以实现应用的跨平台安装(图5)。






图5 应用商店的UWP应用


对于应用,UWP解决跨平台封装难题。不过从上面的介绍可以知道,UWP(APPX封装)和MSI是两种完全不同的封装格式,它们分别对应微软全力推广的应用和目前最为普及的EXE程序。如何让这两者在整合在一起?MSIX应运而生,它汇集了APP应用程序和MSI文件封装格式的功能。全新的MSIX安装器将支持所有的Windows文件格式,包括Win32、WPF、WinForm和UWP。这样开发者只要遵循MSIX封装协议,将开发的应用程序封装为.MSIX格式后发布到Windows 10应用商店,用户下载后就可以根据自己实际需要自行选择安装方式(图6)。






图6 MSIX通用格式


比如很多习惯Windows 7用户喜欢运行EXE文件,这种类型的程序功能更全面,扩展功能更丰富;但是很多平板用户则更喜欢APPX应用,这种应用界面清爽,操作简单。以后我们只要从应用商店下载安装自己喜欢的应用即可,而不是像现在EXE程序要到华军这些网站下载,应用则要到商店下载。


MSIX,将带给我们安全和便利


如上所述,传统EXE文件功能强大,但是大家也知道很多恶意软件,病毒也都是使用这种格式开发的。平时我们电脑的病毒、木马大多是EXE文件带来的,传统程序在带来便利的同时也给我们带来极大的安全隐患。


应用相对EXE程序来说安全性就提高了许多,这是因为一方面应用的开发需要打包证书(这样通过证书就很容追溯到恶意应用的开发者),另一方面应用安装包在上传到商店后需要通过微软的审核,运行安全性和遵从性测试,彻底杜绝恶意软件的入驻。因此从商店下载的MSIX文件可以给用户带来前所唯有的安全性。当然二合一方式的封装也便于用户自行选择安装方式,给开发者同样带来极大的便利。而且微软会将MSIX文件格式进行开源化,期待MSIX文件普及早些到来。


 


为什么32位CPU叫X86,64位CPU叫X64 有什么区别?

现在处理器的两个主要列别,分别是32位和64位。计算机的处理器类型不仅影响其总体性能,而且还可以决定它使用哪种类型的软件。


那么什么是32位CPU呢?直到20世纪90年代初,32位处理器一直是所有计算机使用的主要处理器。英特尔奔腾处理器和早期AMD处理器是32位的,这意味着操作系统和软件与32位宽的数据单元一起工作。Windows 95、98和XP都是32位操作系统.而32位处理器的计算机是不能安装64位操作,只能安装32位版本的操作系统。


那么什么又是64位CPU呢?64位计算机起源于1961年,当时ibm发明了ibm 7030超级计算机.然而,它直到2000年代初才在家用电脑上投入使用。微软发布了一款64位版本的WindowsXP,可以在有64位处理器的电脑上使用.WindowsVista、Windows 7和Windows 8及WINDOWS 10都是64位版本. 而64CPU是向下兼容的,能安装64操作系统和32位操作系统。但是32位系统下,64位CPU是不能发挥其性能的。


32位CPU叫x86而不叫X32呢?


x86是一个术语,意思是从Intel 8086处理器的指令集派生出来的任何指令集。它的继承者被命名为80186,80286,80386,80486,并且都与原始的8086兼容,能够执行为它制作的代码。后来英特尔还发布了8086兼容处理器,名为奔腾(Pentium)、塞隆(Celeron)、核心(Core)和西昂(Xeon),但x86的名字已经稳定下来,意味着所有基本指令集。其中,8086,80186和80286是16位处理器.80386是一个32位处理器,有一种新的32位操作模式.然而,它仍然保留了最初的16位模式,还添加了第三种模式,即“虚拟86”模式,允许在32位操作系统下运行16位程序。


64位CPU叫X64呢?


1978 年 6 月,Intel 发布了新款 16 位微处理器 8086,开创了一个全新时代,x86 架构由此诞生。x86 架构指的是特定微处理器执行的计算机语言指令集,定义了芯片的基本使用规则。


事实上,8086 处理器发布之初并没有获得太多关注,也没有被大范围采用。但 8086 在 PC 历史上的地位,怎么形容都不为过。这是因为它带来 x86 架构,奠定了 Intel 在微处理器界的霸主地位,也成为了一种业界标准。


十多年后,当x86指令集的64位扩展发布。64位扩展到x86的规范最初来自AMD,所以有些人称它为“AMD 64”,而“智能64”的意思是Itanium。但是微软不想在他们为架构选择的名称中包括一家公司的名称,而且后来使用的名称“x86-64”还没有稳定下来,成为该体系结构的通用名称,而且“X86-64”名称上的破折号在一些出现并必须被某些代码解析的地方可能会出现问题。所以他们选择了名字“x64”,作为x86的64位版本。


2003 年,AMD 推出了业界首款 64 位处理器 Athlon 64,带来了 amd64(x86-64)指令集,即 x86 指令集的 64 位扩展超集,具备向下兼容的特点。amd64 代表 AMD 放弃跟随 Intel 标准的一贯作风,类似 Intel 把 16 位的 8086 扩充成 32 位的80386 那样,把 x86 架构扩充成 64 位版本,且兼容原有标准。


32位和64位CPU之间的差异


32位处理器和64位处理器之间有一个很大的区别,那就是它们每秒可以执行的计算数,这影响了它们完成任务的速度。64位处理器有双核、四核、六核和八核的家庭计算版本。多个核允许每秒执行更多的计算,这增加了处理能力,有助于使计算机运行得更快。在大多数情况下,需要大量计算才能顺利运行的软件程序在多核64位处理器上可以运行得更快和更有效。


32位处理器和64位处理器之间的另一个巨大区别是。32位计算机最多支持32位操作系统支持的内存也最多为2的32次方,就是4G,而64位cpu 能使用最大为192GB内存,大量的RAM特别适用于图形设计、工程和视频编辑中的软件,因为这些程序必须执行许多计算才能呈现它们的图像。


需要注意的一点是,除非程序是64位的,否则3D图形程序和游戏不会有多大的好处。32位处理器适用于为32位处理器编写的任何程序.在电脑游戏中,如果它是为32位处理器设计的,那么通过升级显卡而不是得到64位处理器。然而,如果游戏是为64位处理器设计的,升级到64位处理器将大大提高游戏的性能。


最后,64位处理器在今天的家用计算机中是司空见惯的.由于价格便宜,而且现在有更多的用户使用64位操作系统和程序,大多数制造商生产64位处理器的计算机。电脑零件零售商提供的32位处理器越来越少,而且可能很快就什么都不提供了。


什么是i386,x86,RISV ? 一文了解处理器架构



处理器架构主要指的是处理器使用指令集,指令集是处理器使用的语言,只有具有相同架构的处理器可以执行相同的计算机指令,在处理器领域架构的命令有很多,i386, i486, 奔腾, ia32, x86, x86-64, x64, amd64, RISC, ARM, arm64 这些名字由于历史原因不是很清晰易懂,今天本文就来梳理一下各种处理器架构名称背后所表示的含义。




不同处理器架构都有其出现的背景原因,每种架构也各有优缺,以 Intel 为例,其最初与 IBM 在1978年推出个人计算机使用的处理器芯片为 8086 ,16位处理器,大约有 29k 个晶体管,该芯片使用的处理器架构即为最初的x86指令集




随后因为由于 Intel 的16位处理器其性能无法应对 AMD 同时代推出的处理器,在此基础上推出了 i386 处理器,也叫做 80386,指令集依然是x86指令集,不同的是 i386 处理器是 32 位处理器,具有275K个晶体管。




接着 Intel 1989年又相继推出了 i486 ,在其 386 基础上增加了晶体管数量,提高了浮点数性能,其指令集也是 x86 指令集。




随后 Intel 在1993年便进入奔腾时代 (Pentium),也是 Intel 第一个正式 CPU 品牌,奔腾处理器完全向下兼容,其处理器架构也是以 x86 为基础 ,主要在晶体管数量和主频上有了大幅度提高,奔腾处理器12年的产品周期内一共有6代处理器,按照发布时间分别为 奔腾(1993年),奔腾 Pro(1995年), 奔腾/MMX (1997年), 奔腾2(1997年),奔腾3(1999年), 奔腾4(2000年),奔腾4E (2004年)。


奔腾系列最后一个产品是奔腾4E,这是Intel首次在系列产品中使用了64位寻址方式,就是通俗上的64位处理器,为了和之前的区分 64位x86架构处理器我们称之为x86-64,也有人直接写作 x64。这款产品实际上是为了应对 AMD 当年推出的 速龙64 处理器 (2003年) 而草草推出的一款 64 位产品。AMD 的速龙64比 奔腾4E 早了一年发布,其架构最早被称作 AMD64, 后来因为 Intel 也推出的兼容 x86 的64位处理器,所以都叫做 x86-64。所以 AMD64 和 x86-64 和 x64 其实是同一种架构的不同名字。






在 x86-64 出来之前的32位处理器架构我们成为 IA-32 架构 (Intel Architecture 32-bit),也可以成为 x86-32。x86-64 向下兼容 IA-32, 也是目前消费级CPU的主流方案。其最大的区别是64位寻址空间最大支持 256TB 内存,而32位系统最大只支持 4GB 内存,以目前工作、游戏的需求,4GB 已经远远无法满足于日常使用,64位处理器几乎成为必然选择。




2006 年 Intel 开始进入酷睿时代,典型的消费级产品为大众所熟知的 Core i3, Core i5, Core i7, Core i9 ,这些产品依然采用 x86/x86-64 架构,并增加了多核心处理器,超线程技术,补充了更多的指令处理复杂运算,这些处理器以及 AMD 的同代产品速龙(2003年上市),锐龙(2017年上市) 其核心指令集一直没有太大变化,x86一直是霸占桌面处理器市场的存在。




桌面领域的CPU发展了近50年,其指令集一直没有出现较大的变化,因为几乎没有硬件厂商能够说服软件开发者支持一种新的小众指令集。说如果国产厂商想要实现一款消费级 CPU, 选择兼容 x86 指令集几乎是最优方法,只有和目前指令集做到兼容,才能享受到软件世界积累的程序遗产。目前国产CPU领域研发x86指令集CPU的厂商只有兆芯一家,其发展之路也是一路坎坷。另外龙芯也是国产CPU,但是其指令集为RISC指令集,注定无法替代普通桌面CPU,所以目前主要用在航空航天小众专业领域。




和桌面处理器架构不同的是手机处理器架构,由于由于桌面处理器比较注重性能,在功耗,封装尺寸,发热等参数相对不那么重视,导致无法在手机上使用桌面处理器,目前手机端处理器主要使用 RISC 指令集架构,这种架构最早在为路由器而研发的ARM处理器中使用,后来由于移动设备的快速发展,ARM也在手机市场快速占据了主导地位,RISC 架构也成为了移动端CPU架构首选。






ARM 既是一类 CPU 的型号,也是一个公司名。ARM公司设计了 ARM 处理器,但其并不生产处理器,而是将其授权给了高通,苹果,华为,三星,联发科生产,后者结合 ARM 核心处理器增加了诸如3G/4G/5G芯片,图形处理器,音频视频处理等芯片用来提供给手机使用。而且根据每家公司工艺不同,最终生产的CPU性能也相差很多。例如高通在通信领域具有制定标准能力,所以其通信芯片会优于其他,苹果三星由于其强大的半导体研发能力,主要生产高端处理器,相对的联发科处理器主要供应中低端处理器市场。




最后放一张手机CPU处理器天梯图,帮助大家快速识别处理器档次范围。




全球超算最新排名!ARM架构处理器雄踞第一,国产太湖之光排第四

近日,在德国法兰克福举行的国际超级计算大会上,2021第57版世界TOP500超级计算机排名正式公布,在Top10排名中,日本理化学研究所和富士通共同推进开发的超级计算机富岳(Fugaku)再次夺冠,第二和第三名均为美国的超级计算机,中国的神威·太湖之光超级计算机位列第4位,天河2A位列第6位。


与2020年11月份发布的第56版相比,Top10排名变化很小,只有一个新入围者,那就是来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统。该超级计算机基于HPE Cray“Shasta”平台和由GPU加速器和CPU节点组成的异构系统,实现了64.6 Pflop/s,它在新排名中位列第5。


尽管前十名榜单变化不大,但是从整体排名来看,还是能发现一些重要的趋势。


首先就是采用AMD处理器的超级计算机显著增加,比如刚入选TOP10榜单的Perlmutter就是在用的AMD EPYC 7763处理器,排在第6的Selene也采用了AMD EPYC 7742。


另一个是,近些年来,异构计算在超级计算机中使用越来越多,且大多数采用了NVIDIA的GPU或英特尔基于X86的Xeon Phi作为协处理器。在今年的TOP500中,共有145个系统采用了加速器/协同处理器技术,与第56版的147个相比,有所下降。其中有96个系统使用了NVIDIA Volta芯片,26个使用了NVIDIA Ampere芯片,9个使用了NVIDIA Pascal系统。


英特尔处理器在超级计算机中的份额仍然最高,为86.2%,但低于第56版的91.8%。此外,名单中有49个系统使用了AMD的处理器,高于之前的4.2%。


TOP500排名是针对全球已知最强大的电脑系统做出的排名,该计划始于1993年,并且一年出版两次最新的超级计算机排名表。每年的第一次排名公布于6月份的国际超级计算机会议上,而第二次排名公布则是在11月份的超级计算机会议上。


TOP500的排名表是由德国曼海姆大学的Hans Meuer、美国田纳西大学诺克斯维尔分校的Jack Dongarra以及美国劳伦斯伯克利国家实验室的Erich Strohmaier与Horst Simon等人共同汇编的。


下面我们来看看这些超级计算机:


富岳


富岳(Fugaku)是由日本理化学研究所和富士通共同开发的超级计算机,是“京”的后继机型。它在2014年就开始研发,2021年正式激活。富岳部署在兵库县神户市中央区港湾人工岛上的理化学研究所计算科学研究中心内,其运算能力为京的100至120倍,耗电为30兆瓦至40兆瓦,京的耗电为12.7兆瓦。其实,“富岳”是富士山的别称。


富岳是全球首度夺冠的ARM架构超级电脑,采用富士通48核心A64FX SoC,与过往超级计算机大多采用的Intel或AMD的x86、x64主流平台不同。富岳拥有 7,630,848 个内核,在HPL标准下算力为442Pflop/s,这样的性能表现超过了排名第二的美国Summit超级计算机的3倍。


恐怖的是其峰值性能可达到1 exaFLOPS(1,000 petaFLOPS)。而且它除了在Linpack中拿到好成绩,也在新的HPL-AI基准测试中获得了2 exaFLOPS的好成绩。


2020年6月23日,富岳正式获认证,以415 PFLOPS计算速度成为TOP500排名第一的超级计算机。之后同年11月17日发表的TOP 500排行榜成功蝉联第一。如今又再次夺冠。


Summit超级计算机


Summit超级计算机(中文有翻译顶点,或者高峰),实验室代号“OLCF-4”,是IBM为美国能源部旗下橡树岭国家实验室开发建造的超级计算机。机组于2018年6月8日落成,理论运算能达200 PFLOPS(浮点运算速度每秒20亿亿次),超过峰值运算性能125 PFLOPS的神威·太湖之光,2018年6月25日正式获TOP500认证为全球最快的超级计算机。随后被富岳超越。但仍然是美国最快的超计算机。


Summit在 HPL 基准测试中的性能为 148.8 Pflop/s,在全球排名第二。Summit 有 4,356 个节点,每个节点使用的是与泰坦类似的CPU GPU异构计算架构,包含两颗Power9 CPU(每颗CPU有 22个内核),以及6块NVIDIA Tesla V100 GPU组成。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起。


Sierra超级计算机


Sierra,代号ATS-2,是IBM为美国能源部下属的劳伦斯利佛摩国家实验室建造的超级计算机,由美国国家核安全局管理,也是该局的第二套“先进技术系统”(Advanced Technology System,ATS),本机组与橡树岭国家实验室的高峰使用几乎相同的架构。


Sierra的运算节点采用IBM的Witherspoon S922LC OpenPOWER主机,每台主机中配备IBM POWER9 CPU配以NVIDIA Tesla V100运算加速卡,CPU和加速卡之间使用NVLink连接,每颗CPU配以两块运算加速卡,不过原始计划里是每颗CPU配以三块运算加速卡。节点之间的连接采用EDR InfiniBand。


神威·太湖之光超级计算机


神威·太湖之光超级计算机(Sunway TaihuLight)是由国家并行计算机工程技术研究中心研制、安装在国家超级计算无锡中心的超级计算机,搭载了40960个中国自主研发的“申威26010”众核处理器,该众核处理器采用64位自主申威指令系统,峰值性能为12.54京次/秒,持续性能为9.3京次/秒。(1亿为1亿亿)


神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GB DDR3-2133。


2020年7月,中国科大在“神威·太湖之光”上首次实现千万核心并行第一性原理计算模拟。


天河二号超级计算机


天河二号(简称:TH-2),是一组由国防科技大学研制的异构超级计算机,为天河一号超级计算机的后继机型。天河二号的组装和测试由国防科技大学和浪潮集团来负责,于2013年底入驻位于广东省广州市的中山大学广州校区东校园内的国家超级计算广州中心并进行验收,2013年底交付使用后对外开放接受运算项目任务,用于实验、科研、教育、工业等领域。


天河二号造价达一亿美元,整个系统占地面积达720平方米。它于2013年6月起至2016年6月之前,为世界上最快的超级计算机。目前,天河二号由国防科技大学和中山大学共同使用和维护。


天河二号的处理器是英特尔的Xeon E5-2692v2 12核心处理器,基于英特尔Ivy Bridge微架构(Ivy Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS。


运算加速使用基于英特尔集成众核架构的Xeon Phi 31S1P协处理器,运行时钟频率为1.1GHz,拥有57个x86核心(实际上拥有61个核心,因激活全部核心时会存在运算周期协调冲突之问题,因此先遮蔽4个x86核心),每个x86核心借由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS。


不过基于美国商务部限制中国超级计算机采购美国器件,我国在2017年开始使用自主研发的Matrix-2000代替Xeon Phi作为协处理器的升级计划。


在TOP500榜单中,尽管其中中国超级计算机的绝对数量还是遥遥领先,但是由上一次的212变为现在186台,相应的,美国则由上一次的113台增至如今的123台。尚不清楚是否是由于芯片供应问题导致的负面效应。


但在综合性能指标上,来自美国的超级计算机仍然处于领先,目前总算力达到了856.8Pflop/s,而中国则为445.3Pflop/s。


近日,在德国法兰克福举行的国际超级计算大会上,2021第57版世界TOP500超级计算机排名正式公布,在Top10排名中,日本理化学研究所和富士通共同推进开发的超级计算机富岳(Fugaku)再次夺冠,第二和第三名均为美国的超级计算机,中国的神威·太湖之光超级计算机位列第4位,天河2A位列第6位。


与2020年11月份发布的第56版相比,Top10排名变化很小,只有一个新入围者,那就是来自美国新能源部劳伦斯伯克利国家实验室的Perlmutter系统。该超级计算机基于HPE Cray“Shasta”平台和由GPU加速器和CPU节点组成的异构系统,实现了64.6 Pflop/s,它在新排名中位列第5。


尽管前十名榜单变化不大,但是从整体排名来看,还是能发现一些重要的趋势。


首先就是采用AMD处理器的超级计算机显著增加,比如刚入选TOP10榜单的Perlmutter就是在用的AMD EPYC 7763处理器,排在第6的Selene也采用了AMD EPYC 7742。


另一个是,近些年来,异构计算在超级计算机中使用越来越多,且大多数采用了NVIDIA的GPU或英特尔基于X86的Xeon Phi作为协处理器。在今年的TOP500中,共有145个系统采用了加速器/协同处理器技术,与第56版的147个相比,有所下降。其中有96个系统使用了NVIDIA Volta芯片,26个使用了NVIDIA Ampere芯片,9个使用了NVIDIA Pascal系统。


英特尔处理器在超级计算机中的份额仍然最高,为86.2%,但低于第56版的91.8%。此外,名单中有49个系统使用了AMD的处理器,高于之前的4.2%。


TOP500排名是针对全球已知最强大的电脑系统做出的排名,该计划始于1993年,并且一年出版两次最新的超级计算机排名表。每年的第一次排名公布于6月份的国际超级计算机会议上,而第二次排名公布则是在11月份的超级计算机会议上。


TOP500的排名表是由德国曼海姆大学的Hans Meuer、美国田纳西大学诺克斯维尔分校的Jack Dongarra以及美国劳伦斯伯克利国家实验室的Erich Strohmaier与Horst Simon等人共同汇编的。


下面我们来看看这些超级计算机:


富岳


富岳(Fugaku)是由日本理化学研究所和富士通共同开发的超级计算机,是“京”的后继机型。它在2014年就开始研发,2021年正式激活。富岳部署在兵库县神户市中央区港湾人工岛上的理化学研究所计算科学研究中心内,其运算能力为京的100至120倍,耗电为30兆瓦至40兆瓦,京的耗电为12.7兆瓦。其实,“富岳”是富士山的别称。


富岳是全球首度夺冠的ARM架构超级电脑,采用富士通48核心A64FX SoC,与过往超级计算机大多采用的Intel或AMD的x86、x64主流平台不同。富岳拥有 7,630,848 个内核,在HPL标准下算力为442Pflop/s,这样的性能表现超过了排名第二的美国Summit超级计算机的3倍。


恐怖的是其峰值性能可达到1 exaFLOPS(1,000 petaFLOPS)。而且它除了在Linpack中拿到好成绩,也在新的HPL-AI基准测试中获得了2 exaFLOPS的好成绩。


2020年6月23日,富岳正式获认证,以415 PFLOPS计算速度成为TOP500排名第一的超级计算机。之后同年11月17日发表的TOP 500排行榜成功蝉联第一。如今又再次夺冠。


Summit超级计算机


Summit超级计算机(中文有翻译顶点,或者高峰),实验室代号“OLCF-4”,是IBM为美国能源部旗下橡树岭国家实验室开发建造的超级计算机。机组于2018年6月8日落成,理论运算能达200 PFLOPS(浮点运算速度每秒20亿亿次),超过峰值运算性能125 PFLOPS的神威·太湖之光,2018年6月25日正式获TOP500认证为全球最快的超级计算机。随后被富岳超越。但仍然是美国最快的超计算机。


Summit在 HPL 基准测试中的性能为 148.8 Pflop/s,在全球排名第二。Summit 有 4,356 个节点,每个节点使用的是与泰坦类似的CPU GPU异构计算架构,包含两颗Power9 CPU(每颗CPU有 22个内核),以及6块NVIDIA Tesla V100 GPU组成。这些节点通过 Mellanox 双轨 EDR InfiniBand 网络链接在一起。


Sierra超级计算机


Sierra,代号ATS-2,是IBM为美国能源部下属的劳伦斯利佛摩国家实验室建造的超级计算机,由美国国家核安全局管理,也是该局的第二套“先进技术系统”(Advanced Technology System,ATS),本机组与橡树岭国家实验室的高峰使用几乎相同的架构。


Sierra的运算节点采用IBM的Witherspoon S922LC OpenPOWER主机,每台主机中配备IBM POWER9 CPU配以NVIDIA Tesla V100运算加速卡,CPU和加速卡之间使用NVLink连接,每颗CPU配以两块运算加速卡,不过原始计划里是每颗CPU配以三块运算加速卡。节点之间的连接采用EDR InfiniBand。


神威·太湖之光超级计算机


神威·太湖之光超级计算机(Sunway TaihuLight)是由国家并行计算机工程技术研究中心研制、安装在国家超级计算无锡中心的超级计算机,搭载了40960个中国自主研发的“申威26010”众核处理器,该众核处理器采用64位自主申威指令系统,峰值性能为12.54京次/秒,持续性能为9.3京次/秒。(1亿为1亿亿)


神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GB DDR3-2133。


2020年7月,中国科大在“神威·太湖之光”上首次实现千万核心并行第一性原理计算模拟。


天河二号超级计算机


天河二号(简称:TH-2),是一组由国防科技大学研制的异构超级计算机,为天河一号超级计算机的后继机型。天河二号的组装和测试由国防科技大学和浪潮集团来负责,于2013年底入驻位于广东省广州市的中山大学广州校区东校园内的国家超级计算广州中心并进行验收,2013年底交付使用后对外开放接受运算项目任务,用于实验、科研、教育、工业等领域。


天河二号造价达一亿美元,整个系统占地面积达720平方米。它于2013年6月起至2016年6月之前,为世界上最快的超级计算机。目前,天河二号由国防科技大学和中山大学共同使用和维护。


天河二号的处理器是英特尔的Xeon E5-2692v2 12核心处理器,基于英特尔Ivy Bridge微架构(Ivy Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS。


运算加速使用基于英特尔集成众核架构的Xeon Phi 31S1P协处理器,运行时钟频率为1.1GHz,拥有57个x86核心(实际上拥有61个核心,因激活全部核心时会存在运算周期协调冲突之问题,因此先遮蔽4个x86核心),每个x86核心借由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS。


不过基于美国商务部限制中国超级计算机采购美国器件,我国在2017年开始使用自主研发的Matrix-2000代替Xeon Phi作为协处理器的升级计划。


在TOP500榜单中,尽管其中中国超级计算机的绝对数量还是遥遥领先,但是由上一次的212变为现在186台,相应的,美国则由上一次的113台增至如今的123台。尚不清楚是否是由于芯片供应问题导致的负面效应。


但在综合性能指标上,来自美国的超级计算机仍然处于领先,目前总算力达到了856.8Pflop/s,而中国则为445.3Pflop/s。


:
【本文标题和链接】电脑上的x86与x64有什么不同 http://www.hzhe123.cn//n/149992.html 页面最新缓存时间: 2024年07月08日 星期一