在云计算的另一面,HPC+正在带来新的联想
发表时间 2018-10-24 09:44 来源 网络

  全国高性能计算学术年会创办于2005年,到2017年已成功举办13届,会议吸引近千人参会,40家科研院所、厂商参展。每次年会围绕高性能计算技术的研究进展与发展趋势、高性能计算的重大应用等主题展开,为相关领域的学者提供交流合作、发布最前沿科研成果的平台,促进信息化与工业化的深度融合,推动中国高性能计算的发展。

  2018年10月18日到20日,第十四届全国高性能计算学术年会(HPC China 2018)在青岛举行,本次年会以“HPC+,一切皆可计算”为主题,突出了HPC高性能计算任务和范围的不断扩展。图灵奖得主Butler Lampson曾提出“一切皆可计算”的理念:通过网络和日益强大的存储功能,人类社会可以被计算;而从21世纪开始,智能活动也可以被计算。

  在本次年会上揭晓了HPC China Top100榜单,联想以40套的成绩名列榜首,第四次获得中国第一,这也是联想继获得全球HPC TOP500全球第一之后的新里程碑。联想数据中心业务集团(DCG)全球高性能计算与人工智能技术高级总监Scott Tease在接受采访时指出,高性能计算作为云计算的另一面,补充了云计算经济的不足之处,而HPC本身是可以普遍应用的技术,如果再结合人工智能的话,应用面将更广

  HPC的应用空间正在扩大



(上图为联想数据中心业务集团全球高性能计算与人工智能技术高级总监Scott Tease)

  IDC数据预测,2019年全球HPC市场将达到152亿美元的规模,中国市场增幅明显,而随着HPC开始在大数据、人工智能等领域得到应用,逐渐从科学研究向商业化应用转移,HPC更新速度逐渐加快,市场空间广阔。Scott Tease在HPC China 2018的主题演讲中说:“高性能计算是一个大家庭,把大家集合在一起,这是人类共同的事业。”

  为什么说高性能计算是人类的共同事业呢?除了高性能计算本身对于基础科研的重要性外,Scott Tease还指出了高性能计算是对云计算经济的重要补充。最近业界注意到了一个现象,就是HPC用户反而在采用公有云方面不那么积极。如果说以前是因为公有云无法获得高性能联网、没有GPU等等,但其实现在这些已经不是问题了。问题来自哪里?

  Scott Tease认为,首先,公有云的用户主要是在计算使用率或者计算系统的利用率方面比较低的用户,他们更愿意采纳云的多租户方式,通过更少数量的系统、更多用户的并行使用提高总体利用率。但是HPC用户的计算系统利用率其实非常高,能够达到接近百分之百,单凭这一点来说,就与云的经济性并不相符。

  其次,通常公有云的用户并没有在云端存储大量数据,而是把数据从云端移回到本地存储,但是HPC用户的特点就是拥有海量数据,如果把海量数据存储在云端后再移回本地,本身就是一件非常昂贵和复杂的事情,这一点实际上就成为了HPC用户使用云的极大障碍。Scott Tease认为,实际上云反而应该是HPC使用产品中的一部分,不过目前大多数人会把HPC当作本地系统处理。

  第三,就是数据在哪儿、计算就在哪里发生,这对于高性能计算和人工智能这两个领域都是这样。如果数据是在本地,人工智能计算就发生在本地;反过来如果数据在云端,那么人工智能的工作负载也同样发生在云端。因此,数据的位置将影响客户选择云或者是选择本地系统的决策。

  因此,从计算系统的高利用率、数据密集型计算任务以及计算的发生地点等因素来看,HPC高性能计算在云计算特别是公有云时代,不仅不会被公有云的超算服务所侵蚀,还有自己的广阔空间。Scott Tease以美国某车险公司为例,该公司能够针对每个美国人,在十分钟之内量身定制一个独一无二的保险计划,这是因为使用了HPC集群。当客户打进电话给这家车险公司时,就已经被分析了所有的数据,包括年龄、驾驶习惯等。

  联想对高性能计算的执着

  正因为高性能计算在云计算时代有着自己的独特价值,联想非常重视发展高性能计算。如今,联想在“三波战略”推动下,营业额连续第二个季度实现双位数的强劲增长,达到119亿美元,年比年提升了19%,创历史同期新高。而联想DCG的超大规模数据中心业务,营业额实现了年比年近68%的增长,毛利率年同比改善11个百分点,软件定义数据中心业务收入取得年比年三位数增长(119%)。

  联想DCG针对企业业务不同的特点和需求,提供了四大类计算力平台,包括稳态计算力平台、敏态计算力平台、高性能计算平台、超大规模计算平台。其中,当企业面对科学计算和AI深度学习负载时,联想凭借着十余年的深厚积淀,为企业提供了高性能计算平台(HPC)作为重要支撑。联想HPC广泛应用在科学研究、气象预报、计算模拟、军事研究、CFD/CAE、生物制药、基因测序、图像处理等众多领域,推动行业变革,促进国民经济发展。

  Scott Tease强调,联想现在已经成为世界上排名第一的高性能计算厂商,世界上四分之一的高性能计算系统都是联想造,而且联想的高性能计算客户来自于五大洲15个国家。联想高性能计算在中国有三大研究中心,北京研究中心专注于硬件、上海研究中心专注于软件、台北研究中心专注于工程设计。“我们非常骄傲全球25家顶级研发大学中的17家都用了联想的高性能计算系统。高性能计算被应用于社会不同领域如气象研究,很多顶级高性能计算的研发就是在这些大学进行的,我们深感骄傲。”Scott Tease表示。

  联想在高性能方面的成功,还来源于对基础创新的投入以及用户的认可。例如,联想发布了第四代温水水冷解决方案“海神”系统,采用了50℃的温水进行水冷,使数据中心的运行效率提升高达50%;此前,联想曾率先采用45℃的温水水冷技术,成熟和领先程度在业内居于前位。联想第四代温水水冷技术“海神”, Direct-to-Node整机柜温水水冷解决方案已经在多个科研机构得到应用:北京大学是中国首个使用联想DTN(Direct to Node)温水水冷技术的超级计算机,每年将为北京大学节省60万度电;联想的DTN温水散热技术已经将德国慕尼黑超级计算中心的设备能耗降低了40%。

  Scott Tease本人就对于水冷技术非常有热情,他认为水冷技术的好处是维护保养非常容易,而且所有备件都是标准化,因此替换零部件也很容易。其次是这种热交换器的方式,好处是可以适应数据中心里各种各样的设备,不论是对于网络设备还是存储设备等,有着普适价值。特别是针对即将到来的E级计算和高密度人工智能计算来说更有价值,这也是联想“海神”水冷技术开发项目的初衷。

  而联想高性能计算的成功,也离不开联想的产品策略:不会因为一个客户某唯一性需求而开发一款产品,因为这对于其他客户或者对于整个行业而言没有普适价值;联想要做的就是行业级解决方案,可以被不同规模的用户复用,包括把针对大型企业的产品简化后分享给中小企业,以带来更大的经济效益。

  HPC的下一站:人工智能



(上图为联想数据中心业务集团中国区方案营销总监李炜)

  HPC China 2018的一个热议主题就是人工智能,特别是本届大会的主题本身就是围绕促进人工智能、大数据、超算(ABC)的协同创新,迎接当今产业发展新机遇。

  在人工智能领域,联想DCG在AI领域的愿景是成为最值得信赖的AI解决方案提供商,通过轻松部署,提供最高性能的AI解决方案,引导客户的人工智能构想落地。联想发布了自主研发的AI产品家族,包括专为HPC和AI优化的全新人工智能服务器ThinkSystem SR670、ThinkSystem HG680、ThinkSystem HG690以及全新的LiCO GENE Edition。

  其中,值得一提的是在去年HPC China 2017上,联想发布了HPC+AI智能超算平台LiCO,不仅强化了上一代LiCO的全部功能,更在HPC软硬件平台上整合支撑了各种深度学习应用,融合了主流的人工智能开源框架,包括谷歌的Tensorflow、Facebook的Caffe、微软的MXNET等。如今,新一代联想智能超算平台LiCO,包括全新的LiCO HPC OS管理平台、LiCO-AI人工智能平台、LiCO GENE Edition。

  联想数据中心业务集团中国区方案营销总监李炜在HPC China 2018上介绍,LiCO系统是联想超算平台,现在已经作为联想智能计算的软件平台,它的好处就是能够帮助用户更加容易地使用超算集群系统,比如数据科学家利用LiCO平台就可以非常容易地使用HPC系统。这也很符合联想的产品策略,即行业的普适性和可复制性。

  在推动HPC向人工智能发展方面,Scott Tease表示联想 HPC团队在一年前接下人工智能工作后,联想HPC团队架构师、销售就转变成为人工智能专家,这两个领域需要的技术知识储备非常类似,这也成为联想做好人工智能的起点,因为在销售和架构端就已经有人工智能专家可以帮助客户部署人工智能系统了。

  人工智能看起来虽然很美好,但目前的实际落地程度却非常低。Scott Tease强调,事实上目前人工智能的商用场景还非常之少,联想数据中心用户中只有4%真正做人工智能商业应用。还有更多的企业,并不清楚人工智能到底能够帮助他们解决什么样的具体商业问题。为了更好的推动AI落地,联想已投入12亿美元,分别在美国莫里斯维尔、德国斯图加特、北京、台北建立了四大AI创新中心,为客户提供优秀的基础设施架构、人工智能专家以及简单易用的快速入门工具。联想希望借由创新中心,能够启发、帮助联想客户拥抱人工智能,尽早踏上人工智能之路、上手使用人工智能。

  北京大学智能科学系副主任、教授袁晓如在HPC China 2018上阐述了超算对支撑人工智能的重要意义。他指出,人工智能的飞速发展依托于计算能力的不断增强,而更强的人工智能也会促进计算能力的提升,这是一个相互促进的过程。对于联想HPC来说,人工智能将是下一个机遇与挑战,特别是解决高密度人工智能计算,将能进一步促进联想HPC业务的发展。无论是计算人类社会还是智能活动,联想HPC高性能计算都有着自己的一片天空。