摩尔定律还能走多远? (六) - 有钱能使鬼推摩(尔定律)

本文是摩尔定律还能走多远? (五)　-- 这都是为了钱的续篇。

(1)

2012年七月,半导体制造业发生了一件大事: 三家芯片生产的巨头,英特尔/台积电/三星, 集体为半导体光刻业的巨头, 荷兰公司艾司摩尔 (ASML), 承诺支付累计十三亿欧元的研发费用,帮其承担部分新技术开发的风险。

三家公司同时还以每股接近 40 欧元的价格注资购买了 ASML 大约23%的股票。 ( 四年后的2016年七月, ASML 股价在 96 欧元左右。)

ASML 获得的资金, 主要用于加快 450 毫米晶圆片相关的器材和下一代极紫外线光刻技术 (EUV)的研发。

(上图为 ASML 的极紫外光刻机, 单价接近一亿欧元)

光刻工艺,占芯片生产成本的接近一半。为了保证半导体产业链的技术发展,继续按照摩尔定律的路线图前进,芯片巨头们赤膊上阵,直接注巨资给器材商加速研发,这是第一次。

这同时也应了中国的一句老话: **有钱能使鬼推摩(尔)。**只要终极市场有需求,只要有源源不断的资金注入,所有工程挑战,都是最终可以被克服的。

(2)

半导体行业未来的发展,还会吸引多少钱来推摩(尔定律)呢?

咨询公司普华永道2015年的一份报告预测,全球半导体行业的产值将从 2014年的三千三百亿美元增加到2019年的四千三百亿美元。但是他们当时的模型,主要是假设半导体在工业生产,汽车/电车和物联网上的需求增长,而没有考虑到在人工智能应用上的爆发。

摩尔定律的进一步发展, 对于人工智能意味着什么?

如果你还记得我的这篇文章深度学习有多深? (十七) -- 衡量GPU的计算能力里面提到, 英伟达的 DGX-1 的超算系统,在训练 alexnet 的包含六千万个自由参数的神经网络模型时,只需两个小时。

粗略地推算,对于一个包含一百亿个自由参数的神经网络模型的训练,DGX-1 需要耗费三百多个小时, 接近两周的时间。而根据丹麦学者 Bente Pakkenberg 2003 年的论文的估计,人脑皮层等价于一个有着一百五十万亿个自由参数的神经网络。要想模拟和人脑一样复杂度的模型,需要的计算能力要在 DGX-1 的一万五千倍左右。

IBM 为首的团队,正在研发下一代的超级计算机 Summit,预计 2018年初面世。这个超算系统预计计算速度将达到二十万 FLOPS, 这相当于DGX-1 系统的 43 FLOPS 速度的五千倍。

这个计算能力,应当可以部分模拟和人脑一样复杂的神经网络系统,并且通过主动的自我学习获得和人脑一样复杂的抽象思考能力, 而不只是简单的听说读写。

IBM Summit 的成本大约三亿两千万美元, 假设其使用寿命长达十年,那么每个小时计算成本高达三千美元。考虑到该系统耗电约 15 兆瓦时,假设一度电电费是 5 美分,一个小时电费就要 750 美元.

一个小时成本接近四千美元,听上去很贵。但是如果把这个数字横向比较:

美国前总统克林顿一小时演讲费: 二十五万美元