贝赢网

Discuz! Board 股票配资 资讯 查看内容

资讯

订阅

Graphcore IPU进入中国 能否搅动AI芯片市场?

2020-06-24| 来源:互联网| 查看: 317| 评论: 0

摘要: 原标题:GraphcoreIPU进入中国能否搅动AI芯片市场?【TechWeb】6月23日消息,不是老套的CPU、GPU,AI应该需要一块专属......
 

原标题:Graphcore IPU进入中国 能否搅动AI芯片市场?

【TechWeb】6月23日消息,不是老套的CPU、GPU,AI应该需要一块专属芯片。这个想法让全球更多创企看到挑战巨头的时机。

本年2月EE Times评选出“十大AI芯片创企”,其中来自英国的Graphcore依附其为AI计算而生研发的IPU获选。

英国半导体之父、Arm的联合首创人Hermann更是对Graphcore给予高度评价,他曾表示:“在计算机汗青上只产生过三次革命,一次是70年代的CPU,第二次是90年代的GPU,而Graphcore就是第三次革命。”

资料显示,Graphcore是一家英国AI芯片硬件设计初创公司,建立于2016年,总部位于英国布里斯托,Graphcore的主要业务是设计用于AI应用程序的处置惩罚器,为云服务等应用提供产物支持。

Graphcore的焦点技能和产物是智能处置惩罚器(IPU)硬件和相应的 “Poplar” 软件,该软件专门针对AI应用程序所需要的麋集型计算而设计,以及IPU体系解决方案。目前其IPU GC2处置惩罚器已经量产。

贝赢网截至目前,Graphcore已经得到凌驾4.5亿美元的融资,战略投资者不乏宝马、博世、戴尔、微软、三星等各行业巨头。Graphcore最近的一轮融资在本年2月完成,公司估值已达19.5亿美元。

贝赢网客岁,这家AI芯片创企Graphcore将业务拓展至中国,我们也得以近间隔相识这家企业的产物和中国市场愿景。

IPU为AI而生16纳米GC2处置惩罚器已量产

本年5月27日,在英国Intelligent Health峰会上,微软呆板学习科学家分享了使用IPU训练CXR模子的卓越性能:IPU在运行微软COVID-19影像分析算法模子时可以或许在30分钟内完成训练,而在NVIDIA GPU上这项事情需花费5个小时。

贝赢网Graphcore IPU一战成名。

Graphcore高级副总裁兼中国区总司理卢涛先容,之以是IPU能有云云优秀的体现,是由于 “Graphcore的IPU是为呆板智能专门设计的、完全差别的处置惩罚器架构,跟CPU、GPU等处置惩罚器架构非常不一样”。

贝赢网卢涛表示,CPU是针对应用和网络举行设计的处置惩罚器,是标量处置惩罚器。GPU是针对图形和高性能计算、以向量处置惩罚为焦点的处置惩罚器,而Graphcore IPU是针对计算图的处置惩罚来设计的处置惩罚器。

贝赢网详细而言,“IPU应用了大范围并行MIMD的处置惩罚器核。另外举行了非常大的漫衍式片上SRAM,在片内IPU能做到300 MB的SRAM。相对CPU的DDR2子体系或GPU的GDDR、HBM来说,IPU能做到10到320倍的性能提升。从时延的角度看,与访问外存相比,IPU时延基本为1%,可以忽略不计。” 卢涛透露。

以Graphcore已经量产的IPU GC2处置惩罚器为例,卢涛先容道:“这款产物接纳TSMC 16纳米工艺,是拥有236亿个晶体管的芯片处置惩罚器。它在120瓦的功耗下可以或许到达125TFlops的混淆精度,内存带宽为45TB/s、片上交换可达45TB/s、片间IPU-Links为2.5TB/s。GC2上有1216个独立处置惩罚器焦点(Tile),其300MSRAM可以或许把完备的模子放在片内。”

据悉,Graphcore接纳构建大范围数据中心集群的BSP(Bulk Synchronous Parallel)技能,该技能目前在谷歌、Facebook、百度如许的大范围数据中心都已得到应用。

卢涛夸大:“IPU是目前全球第一款BSP处置惩罚器,通过硬件能支持BSP协议,并通过BSP协议把整个计算逻辑分为计算、同步、交换。对软件工程师或开发者来说,这将非常易于编程;而用户也无需纠结于这内里是1216个焦点(Tile)照旧7000多个线程、使命详细在哪个核上执行,因此这是一项非常用户友好型的创新。”

贝赢网与IPU相辅助的是Poplar软件,该软件专门针对AI应用程序所需的麋集型计算而设计。卢涛透露:“目前Poplar已提供750个高性能计算元素的50多种优化功效,支持尺度呆板学习框架,如TensorFlow、ONNX和PyTorch,很快也会支持百度飞桨。在部署方面,目前Poplar可以支持容器化部署,可以或许快速启动并运行。在尺度生态方面,Poplar可以或许支持Docker、Kubernetes,以及Hyper-v等虚拟化技能和宁静技能。在操作体系方面,目前Poplar SDK支持最主要的三个Linux刊行版:ubuntu、RedHat Enterprise Linux、CentOS。”

贝赢网IPU服务AI上风凸显比GPU效率大幅提升

目前基于IPU的应用已笼罩到包括自然语言处置惩罚、图像/视频处置惩罚、时序分析、推荐/排名及概率模子在内的多个呆板学习应用领域。

“在自然语言处置惩罚、计算机视觉类应用和概率类算法中,IPU的体现在现有以及下一代模子上,性能均领先于GPU。”Graphcore中国贩卖总监朱江先容, “在自然语言处置惩罚方面,IPU速率可以或许提升20%至50%;在图像分类方面,IPU可以或许到达6倍的吞吐量和更低时延;在MCMC算法方面,IPU具有26倍的性能提升;在ResNeXt这类比力新的计算机视觉类应用方面,IPU能做到6倍的吞吐量、22分之1的时延。”

朱江以BERT模子为例举行了对比。BERT训练在NVLink-enabled的平台上,大概50多个小时才能做到一定精度,而在基于IPU的戴尔DSS-8440服务器上,只需要36.3小时,相当于训练时间缩短了25%。

贝赢网如果做一个分组卷积内核的micro-benchmark,将组维度(group dimension)分成从1到512来比力。这里组维度512就是应用得较多的 “Dense卷积网络” ,典型的应用如ResNet。此时IPU GC2性能比V100要好近一倍。

随着稠密水平降低、稀疏化水平增长,在组维度为1或32时,针对EfficientNet或MobileNet,IPU对比GPU展现出巨大的上风,可以到达成倍的性能提升,同时时延大大降低。

据朱江先容,Graphcore IPU现已遍及应用于金融、医疗、电信、搜索引擎等诸多垂直领域,并在这些领域体现出显著上风。

除了前面提到的IPU在运行微软COVID-19影像分析算法模子时的优秀体现外,在金融领域,包括算法买卖业务、投资管理、风险管理及诈骗辨认等方面,IPU可以使MCMC采样速率提高26倍,强化学习的训练时间缩短至1/13。

电信领域,LSTM模子预测性能促进网络规划,基于时间序列分析,接纳IPU比GPU有260倍以上的提升。

贝赢网朱江总结道:“IPU是一个全新的架构设计、是一个图形处置惩罚器,具备多指令、多数据的特点。除了稠密的数据之外,现在代表整个AI发展偏向的大范围稀疏化数据,在IPU上处置惩罚就会有非常明显的上风。”

贝赢网进入中国已与百度阿里互助7纳米IPU新品本年公布

贝赢网现在Graphcore携其IPU登岸中国市场,以期在中国市场大展拳脚。

贝赢网目前,如果用户想访问IPU体系,可以通过购置戴尔服务器或微软云来访问IPU资源。在中国,Graphcore和金山云互助,即将上线针对中国开发者和创新者的云业务。

卢涛透露,本年5月12日,在OCP Global Summit上,阿里巴巴宣布Graphcore支持ODLA的接口尺度。随后5月20日,在百度Wave Summit 2020上,百度宣布Graphcore成为飞桨硬件生态圈的首创成员之一。Graphcore希望通过如许的方式来积极融入中国的AI生态圈。

在谈到中美AI市场的差异时,卢涛向TechWeb表示:“目前,美国在IPU的落地与推进速率方面比中国要更快一些,不外现在中国的推进速率也愈发快速。这是由于美国用户更多来自于较为活跃的研究者社区,而中国用户非常注意产物落地。外洋的AI应用越发偏重研究,而中国越发看重产物化的训练和产物化的推理,越发偏重AI如何解决应用问题。”

贝赢网为了顺应这一市场差异,卢涛先容:“长期来讲,Graphcore会针对中国市场的需求,举行产物的定制化。从服务角度而言,Graphcore中国目前有两支技能团队——一支是以定制开发为主要使命的工程技能团队,另一支是以对用户技能服务为主的现场应用团队。工程技能团队负担两方面事情,一是根据中国当地的AI应用特点和需求,将AI的算法模子在IPU上实现落地;二是根据中国当地用户对AI稳定性学习框架平台软件的需求,举行功效性的开发增强事情。现场应用团队则是帮助客户完成现场的技能支持事情。”

贝赢网卢涛说:“我们对中国市场的期望非常高,期望中国市场可以或许占到Graphcore全球市场的40%甚至50%。虽然Graphcore在中国市场的整体启动比北美要晚一年左右,但从目进步展来看,我们发展得非常不错。”

贝赢网另据卢涛透露,Graphcore下一代7纳米处置惩罚器将于本年下半年正式公布,信赖新产物会有卓越体现。

分享至 : QQ空间

10 人收藏


鲜花

握手

雷人

路过

鸡蛋

收藏

邀请

上一篇:暂无
已有 0 人参与

会员评论

社区活动
在线教育促进教育资源共享,掌门优课双师课程广受用户认可

不久前,受疫情的影响,在教育部“停课不停学”的倡议下,很多孩【....】

654人往期回顾
配资公司 本站/服务条款/广告服务/法律咨询/求职招聘/公益事业/客服中心
Copyright ◎2015-2020 铜陵百事通版权所有 ALL Rights Reserved.
Powered by 铜陵百事通 X1.0