本文是 摩尔定律还能走多远? (五) -- 这都是为了钱 的续篇。
2012年七月,半导体制造业发生了一件大事: 三家芯片生产的巨头,英特尔/台积电/三星, 集体为半导体光刻业的巨头, 荷兰公司艾司摩尔 (ASML), 承诺支付累计十三亿欧元的研发费用,帮其承担部分新技术开发的风险。
三家公司同时还以每股接近 40 欧元的价格注资购买了 ASML 大约23%的股票。 ( 四年后的2016年七月, ASML 股价在 96 欧元左右。)
ASML 获得的资金, 主要用于加快 450 毫米晶圆片相关的器材和下一代极紫外线光刻技术 (EUV)的研发。
(上图为 ASML 的极紫外光刻机, 单价接近一亿欧元)
光刻工艺,占芯片生产成本的接近一半。为了保证半导体产业链的技术发展,继续按照摩尔定律的路线图前进,芯片巨头们赤膊上阵,直接注巨资给器材商加速研发,这是第一次。
这同时也应了中国的一句老话: **有钱能使鬼推摩(尔)。**只要终极市场有需求,只要有源源不断的资金注入,所有工程挑战,都是最终可以被克服的。
半导体行业未来的发展,还会吸引多少钱来推摩(尔定律)呢?
咨询公司普华永道2015年的一份报告预测,全球半导体行业的产值将从 2014年的三千三百亿美元增加到2019年的四千三百亿美元。但是他们当时的模型,主要是假设半导体在工业生产,汽车/电车和物联网上的需求增长,而没有考虑到在人工智能应用上的爆发。
摩尔定律的进一步发展, 对于人工智能意味着什么?
如果你还记得我的这篇文章 深度学习有多深? (十七) -- 衡量GPU的计算能力 里面提到, 英伟达的 DGX-1 的超算系统,在训练 alexnet 的包含六千万个自由参数的神经网络模型时,只需两个小时。
粗略地推算,对于一个包含一百亿个自由参数的神经网络模型的训练,DGX-1 需要耗费三百多个小时, 接近两周的时间。而根据丹麦学者 Bente Pakkenberg 2003 年的论文的估计,人脑皮层等价于一个有着一百五十万亿个自由参数的神经网络。要想模拟和人脑一样复杂度的模型,需要的计算能力要在 DGX-1 的一万五千倍左右。
IBM 为首的团队,正在研发下一代的超级计算机 Summit,预计 2018年初面世。这个超算系统预计计算速度将达到 二十万 FLOPS, 这相当于DGX-1 系统的 43 FLOPS 速度的五千倍。
这个计算能力,应当可以部分模拟和人脑一样复杂的神经网络系统,并且通过主动的自我学习获得和人脑一样复杂的抽象思考能力, 而不只是简单的听说读写。
IBM Summit 的成本大约三亿两千万美元, 假设其使用寿命长达十年,那么每个小时计算成本高达三千美元。考虑到该系统耗电约 15 兆瓦时,假设一度电电费是 5 美分,一个小时电费就要 750 美元.
一个小时成本接近四千美元,听上去很贵。但是如果把这个数字横向比较: