美国当地时光5月9日,科年夜讯飞在圣何塞召开的GTC 2017年夜会时代宣告,讯飞开放平台将基于NVIDIA最新Pascal架构的NVIDIA Tesla P4平台,供给语音云办事的深度进修推理,进一步晋升讯飞语音云平台的效力。
科年夜讯飞美国分公司总裁李春燕博士表现,跟着对深度进修和人工智能技巧请求日趋进步,GPU在饰演愈来愈主要的脚色。在NVIDIA推出Pascal架构的GPU平台后,科年夜讯飞第一时光运用NVIDIA Tesla P4深度进修停止练习,并获得了绝对于CPU练习的50倍以上速度晋升。
“本来须要两个月时光来完成的练习,如今只须要一天就可以完成。”李春燕告知记者。
李春燕引见,科年夜讯飞从2013年便开端应用NVIDIA的K10 GPU平台停止相干人工智能产物的开辟,今朝科年夜讯飞在线日营业量过35亿人次,总用户数跨越10亿,具有30万家协作同伴、是中文语音技巧市场的抢先者。今朝,科年夜讯飞的全行业语音产物和人工智能产物在教导、客服、车载、智能家居、智能硬件、医疗等方面均有着普遍的运用。
“今朝深圳有跨越60%做机械人的公司,他们用的都是讯飞的计划。”得知记者来自深圳,李春燕如是说。
科年夜讯飞此次投入运用的Tesla P4具有超高的运算才能,重要将其运用于讯飞开放平台的深度进修推理,在语音辨认的线上解码引擎上。比拟起之前科年夜讯飞应用的M40,Tesla P4的并发路数晋升了3-4倍,而功耗峰值下降至75W,仅相当于M40的1/2-1/3。
在机能优化上,科年夜讯飞也下了一番工夫。Tesla P4实际上能供给每秒22T INT8运算的盘算峰值,在现实运用中,科年夜讯飞跑出了跨越20T INT8运算的接近实际峰值的盘算才能,这一成果让NVIDIA另眼相看。
“这是一切协作同伴到达的最高数值。”NVIDIA全球副总裁、亚太区总裁Raymond Teh告知记者。
Tesla P4运算才能的晋升和盘算并发路数的晋升关于科年夜讯飞来讲相当主要。前者有助于赞助科年夜讯飞晋升练习时光,加速迭代的速度,后者可以年夜年夜进步云端办事呼应速度。经由过程在练习和推理两头同时用GPU加快,不只可以或许下降在线辨认的本钱,更能有用晋升客户的体验。
据NVIDIA营业成长总监何涛引见,Tesla P4是为了顺应将来数据中间低功耗盘算才能而设计的。GPU关于一切盘算中间的盘算才能治理相当主要,P4逢迎了数据中间的需求,不只在机能上有明显晋升,体积更小,可以在异样空间中设置装备摆设更多的GPU;功率下降,更主要的是可以用PCIE供电,无需额定电源,可以或许便于客户更灵巧地治理盘算才能。
“中国的传统机房普通是给一个恒定的能耗,假如用年夜(功率的)GPU弗成能放许多。”何涛说。“如许的设计,特殊合适中国。”他接着弥补道。