AI芯片公司创办人谈AI平民普及化之路

2019-03-03
14:00:03
来源: 半导体行业观察

本文为 Lin Yang (杨林) 在 GTI  –  Robin.ly AI Talk 的专访

杨林简介 :

GTI 的联合创始人杨林教授有丰富的经历,他毕业于复旦 、 清华和 UC Berkeley,获得了 UC Berkeley 的博士学位。也曾经在 VLSI (Technology,Inc.) 、 Redwood Design 、 Cadence 做高级设计经理这方面的职位。

1999 年他创立了一家半导体公司,叫 Legend Silicon (凌讯科技),做数字电视方面的芯片。他同时也是北邮,清华和复旦的教授。2017 年和 OmniVision 的 Founding Member 董琪一起创立了一家公司 GTI,就是 Gyrfalcon Technology 这家公司,专门做 AI 芯片这方面的工作。杨教授在学术上也有很大的成就。他曾经在 1988 年发表了一篇文章,叫 Cellular Neural Networks Theory and Application,这篇文章获得了 IEEE 的电路与系统最佳论文。自此之后呢,CNN,也就是 Cellular Neural Networks 就成为了一个热点的研究领域。

ALEX REN :

杨教授创立了 GTI 这家公司,其实我第一次知道 GTI 这个公司之后,我看 Gyrfalcon 这个词还比较有意思。不知道杨教授能不能解释一下,这是什么意思?

杨林:

是一个大鸟的意思。中国东北有一种鸟叫海东青。Falcon 就是鹰的意思,Gyr 就是一个大鸟的意思。

ALEX REN :

OK。好像是说飞行速度最快的一种鸟。

杨林:

对,所以说中国的歼 11 战斗机叫猛禽,实际有人翻译成猛禽。这种鸟就是原始的海东青。

ALEX REN :

感觉就是,其实我相当于是见证了咱们 GTI 整个的创史过程。最早开始也跟董琪,跟其他几个 Founder 也聊过。感觉 GTI 过去一年发展得很快,就像猛禽一样。不知道过去一年发生了什么事情,杨老师能不能给我们解释一下?

杨林:

那好。神经网络大家都知道有过几次发展。那么我刚到 Berkeley 的时候是 1985 年,那个时候赶上了上一轮 (发展浪潮)。上一轮的时候,那个时候因为 PC 才刚开始,通讯还在 Analog (阶段),就是模拟电话,所以当时神经网络作为当时的下一代的计算工具呢,也有很多人在研究,它的主要特点就是平行处理。

那么这是当时我在 Berkeley 读博士的时候做的一个叫做 Cellular Neural Networks。它里边呢,我当时是用 Analog 实现的,Analog 电路,就是用电阻电容和运算放大器。当时也是主要是做的图像处理,是做的我们的汉字识别。当时用 MOSIS,就是学校支持的电路工艺做的,在电路里头做出来的。

那后来呢,神经网络由于其他方面,就是这个 PC 啊,通讯啊,都在发展,神经网络当时也有遇到一些困难的地方。实际上就是说怎么训练这个东西,怎么学习。因为当时我们在整个读 PhD (期间),我也就是弄了几个特征,我们当时叫滤波器。现在大概如果要数的话那现在就是几百万个了。我们那时候能设计出来几个就不错了,甚至那个时候尤其是做图像处理的那些处理器的算法,比如说像边缘识别,或者角识别,好多都被用人名命名了,包括 Berkeley 的一个教授叫 Canny,他 (设计的) 就是著名的边缘提取滤波器。现在呢 —— 这都是人工做的 —— 现在就是机器学习。

ALEX REN :

所以当这一波的人工智能再起来的时候,您是看到了什么机遇?我知道您创立 GTI,应该是看到了一个很大的机遇,当时创立这个公司的初衷是什么?

杨林:

当时创立这个公司的初衷呢,就是感觉到现在,PC/电脑都已经放到手机上了。第二是通讯都已经做到第五代通讯了,而且目标就是 IoT,Internet of Things,物联网。那么下面呢,大家又重新在考虑智能。为什么叫 Internet of Things 呢?原来就叫 Internet,相对来讲就应该叫 Internet of People,对不对?那 People 只要连起来,大家就可以交流。因为有这个语言文化,互相都懂。那你说,Thing,这个东西连在一起,那很难交流。所以这个时候就需要赋予这个物体一定的感觉的能力,和判断的能力。这也就是所谓的人工智能要解决的问题。

ALEX REN :

所以您实际上是为了解决 IoT 的 Deployment 里边的这个 (问题)?

杨林:

对。主要是为了解决 IoT 下面的连接 (问题)。IoT 已经发展了多少年了,但主要就是为了连接。连接由于 5G 开发了以后,现在正在实施。现在急需的就是,连接就要产业化,就不是个科研项目了。那么在这个时候呢,人工智能就起到了非常关键的作用。这是第一。第二呢,人工智能,或者叫神经网络,前一段时间呢,虽然产业化没有发展,但是在研发方面还是有人在做。但是研发方面在做也受益于现在的计算机的能力,那么就开发了这种深度学习的概念。

深度学习呢,它的技术方面的定义是叫多层卷积神经网络的机器学习,所以大概有这么三个意思。第一是卷积神经网络,第二是多层,第三个是用机器学习,不用人,不用编程。那么实际它本身的电路结构和算法很早以前就有了,至于为什么能够现在 Popular 起来,一个是现在有这个需要,再一个就是现在的算力,就是计算机仿真的能力很强。这个我下面可能在谈到其他问题的时候会再展开讲。

ALEX REN :

OK。那咱们创立这个公司一年,现在据说芯片已经出来了是吗?大概做到什么样的性能呢这个芯片?

杨林:

我们这个芯片呢,当时瞄准的就是低成本,低功耗,高性能。因为高性能是必须的。因为这个要赋予智能,让它能够自己去学习的话,就需要算力,所以必须得是高性能。那么在高性能的情况下,怎么能够降低成本,降低功耗,这个是我们主要的一个工作,集中在这个里边。那么得益于原来我做的这个 Analog 电路,它就是个 Device。它从架构来讲,和计算机是不一样的。所以从这里边呢,我们就达到了我们预期的目标。

ALEX REN :

这是个 ASIC 是吧?

杨林:

ASIC 呢,当然只要是 Application Specific 就叫 ASIC,我们这就是一个我应该叫它卷积神经网络加速器,它不是一个 SoC,那么我们也觉得这个是当前急需的那么一个。因为现在市场还没有起来,如果将来市场起来了,根据真正的应用,我们会做不同的电路。但是现在呢,还是属于一个平台,就是我们叫做卷积神经网络加速器。

ALEX REN :

那主要性能是手机上面吗,在什么芯片/平台/终端上面?

杨林:

手机只是一个应用。提到手机,我就顺便把我们最近做的这个东西拿出来看看。这个东西呢,是我们给电脑,Laptop 做的。它是个 USB Dango,我们这个芯片就在这里,它就是个加速器。那么现在的 PC 呢,里边基本什么都有了,就是说你没有 GPU,反正只要是 CPU,做训练都没问题,但是它速度慢。所以加了这个以后你就加速了。加速了以后呢,那就可以拿到。

ALEX REN :

举个例子,比如说我们这个视频结束之后我们要做渲染,Video 处理。那这个东西插到电脑上就可以加速我的渲染过程?

杨林:

对!你比如说有些东西它是需要——时间要很快反应的,那我们的这个可以做到识别,每秒可以跑 150 帧。当然其他的也可以做,但就是很慢。那你做的汽车,比如你反应时间可能就比较慢,所以它为什么要加速呢,就是说不光要有这个功能,那它还要反应非常快。

ALEX REN :

那就是像安防这种识别,对吧?摄像头上边的识别,OK。

杨林:

是。那这个也是用我们的芯片做的一个 WiFi 的小盒子。这个就跟手机一样,跟手机配合。像现在华为和苹果都做了 SoC,就是 Single Chip 的 Solution。但是这个东西呢,由于 CNN/卷积神经网络的运算量是需要很大的,那么我们的就是专门做了这么一个,配合现有的手机,我们就直接把这个手机升级为 AI 手机了。就是这个东西可以直接把你现在的电脑升级为 AI 电脑,因为我们手机上已经有了照相机啊,有 MPEG,就是这些 Video 的 Decoder 的啊,或者其他的,运算的东西它都有。唯一没有的,就是怎么做深度学习加速。所以我们主要就是做这个,脏活累活。

ALEX REN :

非常有意思。

杨林:

所以这样的话也适合——我们也在想,展开一下就是,为什么我们做这件事,就是我看到了。我就是搞电路的,这是个 Device。但是所谓现在呢,叫 CNN,Convolutional Neural Network,我们原来叫 Celluar Neural Network。Celluar Neural Network 就是一个电路,那么它其中有 Convolution 作为一个算子,就像里边有乘法。但是它那里边就是 Convolution,所以我们在那个里边就有这个Convolution,不光有 Convolution,我们还有 Feedback,就所谓现在的 RNN。但是现在呢,我们重点主要是做 CNN,因为这个 Feedback 还有一些其他的问题。所以现在 RNN 只用在一维的信号处理方面,还没有真正用到图像。但是将来我认为是会去做这样的。

ALEX REN :

所以你们选择这个 Inference 的原因,也是因为看到很多 IoT 在终端上面实现的大量机会。对吧,是不是这个意思?

杨林:

对。我们先选择了 Inference 的话呢,大家都在——很 Popular,就是说现在很流行的就是 Inference 和 Learning,或者说 Training。实际上跟人一样,Learning 就是试错,就是千万次的 Inference,你猜一个数,试一试,行就是行了,所以实际上是一样的。真正的 Work 就是 Inference,因为你要试验啊,就是实践认识,是吧?就是反复去做的一件事。那么实践是最重要的,所以 Inference 就是实践。认识是说,你这次错了,下次怎么改。那现在有很多诀窍,就是说或者是不同的学习的方法。但是不同的学习方法最后你还是要时间去检验。

那么我们为什么做这个东西呢,当时主要考虑的,现在我讲,指出来的一个现在一个局限性,但是这种局限性不是说故意的,人为的,而是说随着时代的发展。神经网络,或者叫机器学习,或者叫人工智能,在 2014 年,2015 年之前,基本就是学校在做,而且是很少的人在做。为什么是这样呢,就是说,没有真正的应用嘛。还有就是说,其他应用也很 Popular,大家都围着这个 PC 和互联网在做这件事儿。

那么这个东西呢,就变成了—— 神经网络本身按理说应该是一个物理器件,是一个 Device。那么后来就主要做的人都是 Computer Science的,就是计算机的人在做。计算机的人在做什们呢,我们叫计算机仿真。计算机什么都能做,对不对?那么就像你 CPU,GPU 都能做,但是 GPU 为什么比 CPU 做得好,就是因为它有平行处理,它做得快。但是说能不能做这件事儿,都能做,你就拿个 ARM,最简单的也能做,只是慢而已。

那么这个我们搞电路的人都知道,就是搞集成电路设计呢,它要有 Computer Simulation,就需要计算机仿真,仿真就是慢,然后还要有 FPGA (Field-Programmable Gate Array),这叫 Emulation。对,就是 Prototype。就是,慢还不行,得实时。但是 FPGA 的问题就是说,我虽然可以实时,解决了 Computer Simulation —— Computer Simulation 只是验证这个功能啊,性能够不够。那么 Emulation 呢,就是说我要证明实时这个问题,但是它的 Cost 是很大的,因为它的成本高。那么最后才做成芯片,这是必需的一个过程。

所以现在业界也在说,神经网络有几种,有 CPU 、 GPU 、 什么 FPGA 、 还有 ASIC,实际上最终就是 ASIC,其他都是一个过程。

ALEX REN :

是的,OK。所以咱们在做这个 Training。因为我知道,现在我们做 Inference 的话,因为有一个核心技术问题就是,比如说我们 Model,从 Training 到 Inference 中间有一个 Migration 的问题。你们怎么看这个问题?

杨林:

我们看这个问题就是说,另外的一个刚才我再继续展开 —— 由于集中在 Research,集中在 University,那么唯一可用的平台就是 CPU 或者 GPU。那相对来讲呢,GPU 速度或者性能更好,而且 Nvidia 也支持这个,他们做的这个平台叫 CUDA。那么大家就去集中用了这个平台。但是这个平台有好处,就是说下面有一些要调整的。就是做 Research,因为你就为了写一篇文章,或者为了证明一个概念,那你不计成本,是吧?所以那个时候呢,如果说你要考虑现在这个成本的话,两年前我在说要做 Quantization,说为什么做双精度,64 个 bit 啊,5 个 bit,8 个 bit 都可以,是吧?因为当时我们做 Analog,你说电子电容的精度是多少,能做到 10% 就已经不错了,10% 也就是 3 个 bit 了。

就是说那个时候从我个人经验来讲,知道这个东西都已经不在乎那个事儿了。但是你 CPU,GPU 你用的是 Library,你不去想那个东西,已经有了。你要说做一个 3 个 bit 的一个指令集,没有,你倒麻烦,所以你只能用浮点和定点。那这样的话所有现在训练出来的人,第一,都是学校出来的,第二,都用了 Nvidia 的平台,第三呢,根本没有问题说我一定要给它优化。那所以说才存在刚才你说的这个问题,因为我们的芯片的话呢,要进一步优化。

一开始我们开发算法也好,开发模型也好,用 CPU 或者 GPU 开发包括 Caffe 啊,PyTorch 这些东西呢,主要是证明能不能的问题。那么下面就要真正要用起来,产业化呢,就是要证明省不省的问题。你用不用得起的问题,所以我们这个东西是想人手一份儿,包括你可以,(任何人) 都可以。就是说人工智能本身呢,现在每个人都有自己的定义。有的人觉得这个东西很可怕,将来就是超人。

这个和我 30 年前描述计算机都是这样,计算机就是被认为要毁灭人类的。但实际上我们觉得计算机 (让我们) 得到了很多好处,是吧?当我在上学的时候,30 年前的时候,那真就是做计算机的人用计算机,用计算机的人做计算机,其他老百姓就是,就像现在人工智能就是高发展嘛。但是现在不都是人手一份手机嘛,都是这个。

ALEX REN :

我们现在讲叫民主化对吧。人工智能民主化。就是您说的,普及化实际上最终是 ASIC,对吧?ASIC 本身是要考虑经济效益,考虑成本,对吧?所以这个是我学习到的东西。那现在您做的这个 GTI 的这些工作,我也看到了说是借鉴了很多您以前的一些工作,包括 CNN 啊,那具体的关联是什么?您刚刚讲的电路本身啊,就是里边也用了一些您当初做的一些东西,应该是 (存在) 这样的一些关联性吗?是哪些东西有 (关联)?

杨林:

那这个就牵扯到刚才我说的,电路,神经网络和计算机的区分是什么。所以大家现在有个常用词叫异构。异构的意思就是我和计算机不一样,但是怎么个不一样法,是吧?第一呢,我个人认为,就是说神经网络呢,它因为是一个电路,尤其是当时我们做的,它是记忆元器件。记忆的和运算的是一体的。那么现在标准的计算机的架构,就是处理器,存储器,中间还有个 I/O,叫接口,有这三个,是吧?我们现在做的这个东西是都放在一起的。正是因为这样,我们才降低了功耗。

因为现在呢,你可以把里边的处理器,包括你的存储器,都用最新的,比如说是,7 纳米,10 纳米的来实现。但是你中间连接接口的那个Pad,就是我们叫芯片的管脚,不变,对不对?那个东西就是大量的传输高速,功耗都在那儿。所以这是一个。另外就是人也是啊,人的智能实际上是记忆和处理在一起的。不是说你想干什么,到哪儿去,充一下电,然后再去存取 —— 它是一体的,这个也是不同。但是作为 Computer Simulation 来讲,原来架构就是这样,你何苦去改呢。所以这也是说,我们认为将来的发展呢,实际上就是这种专用的结构。

另外一个呢,由于有计算机的话,大家现在也在比,说是看谁做得最好。我看现在好多 Startup 在做的芯片呢,都在比这些东西。那么还是计算机的概念。计算机有几个特点,第一呢,一定要有指令集,就是说我这个东西是专用指令集,指令集简化,没必要,因为这个东西不需要指令。因为顾名思义,深度学习,机器学习嘛,机器学习就是不用人来编程序,不用人来编程序,还要什么指令集呀,对不对?实际上我们真正用数据来训练里边的参数,训练完了以后呢,人工智能和人类智能相比有好处,就是它可以 Copy,训练完了可以移植,它不像人,对不对?我们学完了以后,我们的下一辈还得重学。

ALEX REN :

我觉得您讲的这个实际上就是逻辑上的,认识上的一些不同,对吧?就是说思维上的一些变化。您讲的这个指令集的变化,讲的非常好。那么您是非常有经验的,而且时间很长了,在半导体行业做这个研究啊,技术,产品啊。您看到 AI 时代来了之后,您觉得对整个半导体产业带来些什么样的变革。是不是感觉半导体行业又赢来了一个第二春啊,感觉好像我们又重新有人关注半导体。尤其是中国,开始有更多投资人开始投资芯片,这件事情意味着什么?

杨林:

很大的一个变化,但是我认为这个是时代的发展造成的。刚才你提到这个第二春,对我来讲,这就是一个——或者叫三十年河东,三十年河西。我当年在 Berkeley 读书的时候,Berkeley EE 和 Computer Science 一起的叫 EECS,对不对?当时 CS 的人都是 Hardware 的。我去年还是前年 —— 因为清华跟 Berkeley有一个 Joint Venture 在深圳,我回去,结果发现 EE 根本没有人学了。你只要做出个A to D (Analog to Digital),剩下的就是 Digital 的事儿了。那么这一点呢,将来也会对软件的人 —— 现在大家都在学软件,实际上机器学习将来就是会代替这些人。

我想,刚才听您介绍,您也是从硬件学习出发。为什么改行呢,两个事儿。我是一直跟着走的。第一件事儿就是 EDA (Electronic Design Automation)。最早我们来的时候还是画电路的。那个时候就是 —— 后来画不动了,因为太多了,所以才有 EDA,就是 Electronic Automatic 的 Design 嘛,我中间两个公司也是在 (做) 这个事儿。

ALEX REN :

Cadence 和 Synopsys 都是从伯克利出来的是吧?

杨林:

对。这个东西顾名思义,就有点类似机器学习,就是用机器代替人来设计。这是第一波。那这个呢,就已经说是很 Junior 的,就是很初级的 Design Work 已经没了。剩下的就是 Architecture,就涉及整个应用,所以就是 ASIC 的定义和应用,然后剩下的都是 Synopsys 、 Cadence Tools 自动生成了。至于加法器乘法器怎么来的,谁都不知道怎么回事,机器知道就行了,就描述的就行,描述功能。这还好,但还有一部分人在设计这个 Architecture,设计架构。10年 —— 刚才我说的是 20 年前 —— 10 年前,由于所有的应用都是有 Limited Requirement。

你比如说我当时做数字电视,Intel 当时也在做数字电视,我们在 Santa Clara 还立个电视台。但是那个时候它的算力不够,那个时候可能是 65 纳米,或者 130 纳米。我跟他说,现在你必须得用专用集成电路做。十年后你可能 (就不需要了)。所以呢,当时比如说 MPEG Decoder, 比如说 Demodulator,比如说手机 —— Qualcomm 一开始都是做电路的,10 年前都被 ARM 通吃了,所以变成没有 Hardware Design Engineer了。

所以这也是为什么有的人说,现在你就算是做芯片,也就是个集成。就是现在需要 System-on-Chip,SoC,实际上就是几个Core,或者几个 Interface 放在一起集成起来,剩下的功能都是软件设计。所以说 Hardward Design 的人一点都没有了,基本连学校都不 Train 了,都没有人去学习了。所以 (针对) 刚才你说的,这就是为什么我说是三十年河东,三十年河西。下面三十年呢,实际上又给 Hardware 的人 (新的机会),就是我们还要着重去做 Hardware。

为什么呢,因为这个我刚才也提到了,它不是一个计算机,它是一个 Device。它不一定去竞争,就像苹果手机似的。苹果今年出了手机,我就换个新的,去年的虽然打电话还可以用,但是大家就都换,是吧?我现在恨不得都变成,干脆叫 Lease,就是钱都转到那儿了,算起来就是一个 35 块钱,就基本就这个。为什么呢,就是计算机 —— 因为它是通用的东西,通用的东西 (大家都) 老比谁最好,因为可比。那以后的人工智能的应用呢,很广泛的,有的东西不需要一年一换。比如说你们家的 Garage Door Opener,那个东西你老换它干什么呢,没必要换。包括智能锁啊,好多这些东西。

ALEX REN :

就是有很多 Sensor,对吧?

杨林:

对,所以它不需要换。就像你说安防,或者小区放个安防,不可能说明年出了新的我再换,那不可能。因为它的功能是不变的,所以你就用那个东西就行。所以将来会有很多的,不是说做一个计算机就行了。所以这是为什么现在做 Hardware 的就是 Intel 、 Nvidiav 、 还有 ARM,就这么这几家嘛,其他都是集成。所以这个也是说,对于不光是学 Hardware 的人,将来可能好多学 Software 的人也许又转去学 Hardware 了,做系统。

ALEX REN :

对。就像您之前说的,确实我认识一些人,他们做比如说 AI Infrastructure 的人,最后的这个 Performance 提升,很多时候就需要看硬件架构是什么,硬件底层实现怎么回事儿,这个时候可能优化性能可能更多都是 Software 、 Hardware 、 Code Design 这些。OK。那您也是长期在中国和美国的半导体行业工作,您怎么看中国的半导体行业。因为现在您知道最近一年这也是个热点话题,我们确实有差距,对吧?您怎么看,问题在什么地方,我们应该做些什么事情,可能会把行业的差距缩小?

杨林:

大的方面刚才我已经说了,本身硬件由于 EDA 这个 Tool,由于每个 Applicaiton 是有一定限度的,后来都被 General Processor 给替代了,所以这个需求就很少,这是第一。第二呢,我感觉到前面这 30 年,过去的这 30 年,实际上中国还是处于一个学习和跟踪阶段。尤其做企业的人呢,我听了好几个比较有名的老板说不要吃第一个螃蟹。那不要吃第一个螃蟹你怎么创新呢?但是为什么,这是适合当时中国国情的,因为你没有那个财力,也没有那个需求,你犯不上去做这些事儿。那么比较稳的就是先把现在这个基本的事情做好。但是现在不一样了,现在中国能做的也都做了,跟别人都已经差不多一样了,你要想抄别人的呢,或者说学习别人的,还没出来呢,那就干脆自己去做这个事儿。

ALEX REN :

对。创新这方面您认为是一个突破点对吧?现在应该是个时机了。可以做更多的创新,新的领域。您之前创立了 Legend Silicon,现在又做这家新的公司,GTI,我不知道您从前面的经验,学习到哪些方面觉得是可以把 GTI 做得更好,这一点,您是怎么样的一个 Thinking Process?

杨林:

上次做那件事儿呢,有几点。第一呢,就是数字电视进入了产业化阶段,因为数字电视一开始也是科研项目,最早是在日本搞出来的。那么没有标准化是不可能产业化的。现在AI也就是这个问题 —— 没有标准化,大家都想标新立异,每个人想说我明天能不能再研究出来一个不同的,就是为了不同而去做事儿。那这个就不是产业化了,产业化是说尽量相同。而且也不一定说我做完这个事儿,就永远不再做了,已经全解决完了,这不是。你看通讯就告诉你了这个标准 —— 第一代通讯,就是模拟电话;然后有 2G,第二代,就是 GSM (Global System for Mobile Communications),CDMA (Code-Division Multiple Access);3G,然后 4G 、 5G。

实际上在做第二代第三代的时候,5G 的技术也存在了,研发上也有人讨论。但是大家说没必要了。标准化呢,它可以给你定义一个,大家都 Follow 同样的东西,而且做现在最急需的东西。现在我认为大家还是在科研的这种状态。

ALEX REN :

所以当时您的 Legend Silicon 也参与了很多标准化的过程吗?

杨林:

我回清华大学,当时的国家标准里边的——我还要展开说第二件事儿。因为第一,产业化的时候呢,当时因为已经有了三个数字电视标准了。一个是美国的ATSC (Advanced Television Systems Committee),一个是欧洲的 DVB-T (Digital Video Broadcasting — Terrestrial),一个是日本的 ISDB-T (Integrated Services Digital Broadcasting — Terrestrial)。在这个时候,正好是 2000 年左右,吴仪副总理到美国来,然后能见了小布什。布什当时就问她说,你为什么用欧洲的GSM,不用我们的 CDMA。当时吴仪傻眼了,不知道说的是啥,后来一问,哦,是通讯标准。感觉好像是说我们在政治上,或者在其他方面有取向似的,(其实) 她就随便选了一个。

做数字电视的时候,当时是朱镕基当总理,他就说了,如果是全世界一个标准,因为产业化必须标准化,那我们就 Follow。如果超过两个标准,我们只能做自己的了,要不然政治上都没法说,就敏感了。所以当时已经有了三个。但是做标准就存在知识产权 (的问题)。因为那时候我正好在 Cadence,实际上我在帮助日本做 ISDB-T,帮助 Fujisu 做美国的 ATSC,DVB-T 我都参与过,而且都是做的芯片。当时就是要做芯片,我说做标准必须得有知识产权。

所以中国的电视标准,实际上是有我们叫完整自主的什么什么知识产权。为什么呢,当时虽然我是美国公民了,但是我回清华当教授,还代表中国政府在日内瓦去申请这个标准,其他人当然要去 Challenge 你嘛。那么中国当时说的呢,因为美国当时的 ATSC 标准是高清,但是是固定接收。欧洲的呢,DVB-T 是移动,但是是标清的。日本基本跟欧洲是一样的,而且他们也没有什么特别的,主要当时就是美国和欧洲。我说中国定的实际上叫高清移动,因为当时说要办奥运会什么的,那时候就瞄准 2008 年奥运会,一定要看高清的,而且还是要移动的,因为中国人多,各个公共的 (平台都需要)。那这个东西如果做出来肯定就是有自己的知识产权嘛,所以当时就是做了这个。

实际上不光是对电视行业解决了知识产权的问题,使中国开始能够在信息产业有一些知识产权吧,而且对后来的第四代,第五代通讯的标准都有很大的影响。你看以前的标准,都有叫什么 Qualcomm,CDMA 的标准,都有各国,各个公司的标准。到了第四代通讯叫 LTE (Long-Term Evolution)。第一代是模拟,第二代就是电话。第三代是把 Text,Pager 都放里边了,叫 GPRS 或者什么。第四代就是 Video,中国基本就把电视的知识产权 (拿到了),基本上也都是这些方面。就是说那就算了,也没有什么公司了,所以就叫 LTE。所以你再听到第四代,第五代标准,没有任何国家,就是一个国际电联的组织。

ALEX REN :

OK。那这个标准化过程,您觉得现在在 GTI 的创业过程中,也可以用这样的流程吗?我感觉 AI 是一个更加开放性的,当然他们现在也是面临产业化的挑战,对吧?所以这个您觉得也会像通讯,会像数字电视这样,会有一些标准出来吗?

杨林:

会,每一个行业都有。你比如说安防的 AI,就有安防的标准。智能家居的,肯定有智能家居的标准。每个都有,否则的话,老百姓说,你弄个智能锁,每个人训练都不一样。因为这个东西就像洗照片一样。你想想,刚出来照相机的时候,照照片的人,洗照片的人,用照片的人都是专家。老百姓根本不知道怎么回事儿,(还得找专门的) 那叫摄影师。后来变成什么呢,卖照相机的人就是卖照相机,卖胶卷的人就卖胶卷,老百姓照相,玩儿,然后到店里边去洗。一定得变成这样的,这就是一个标准化。你想想胶卷都有标准呢。

ALEX REN :

对,胶卷有不同公司的胶卷,相机有不同公司的相机,但是都可以用。

杨林:

都可以用。但是呢,为了老百姓方便。

ALEX REN :

OK。这个还是比较新颖的观点,对我来讲。这个确实是比较有意思。那后面的 AI 商业化也许真的会出现这样的变化,对吧?

杨林:

一定的。因为现在 AI 的商业化一定得要产业化,产业化必须得标准化。

ALEX REN :

因为 GTI 作为一家初创公司,现在应该也还算是处于一个早期阶段,对吧?芯片这个行业,您知道,都是一些大公司,Intel 、 Nvidia 这种,Qualcomm 这些大公司吧。您怎么看待 GTI 怎么跟这些大公司竞争呢?

杨林:

我在硅谷呆了 30 多年了嘛,这是最重要的,你要做硬件是最重要的,尤其是电路。当然刚才我已经谈到了,标准是知识产权的问题。软件的人现在都讲究Open Source,尤其是 AI,都等不及 (发) 在专用 Paper上,赶快先放在网上大家先看。

ALEX REN :

是,Archive上面。

杨林:

硬件没有,硬件全是专利。那么硬件因为有专利,下来以后你看有几家?没有几家。咱们现在看,除了Intel、Nvidia,这是在 GPU,X86 就是 CPU。原来的那些都很少了。ARM 实际上是一个很老的公司,最早我在 VLSI Technology 的时候,当时就是 ARM、Apple/苹果,那在 1991 年,1990 年左右,和 VLSI Technology 三家做的这个 ARM 的 Architecture。英国那家公司只是说写指令集,VLSI Technology 是做芯片,苹果是做应用。但是后来因为其他原因,就不了了之了。但是它那个指令集的知识产权在那儿,所以它现在才能够反过来。Intel 跟它没法叫板,因为是同时发生的。

所以现在难呢,现在 AI 公司很多,你光简化指令没有意义,你说我没用减法,Who Cares,反正你用加法了。所以因为现在 AI 呢,只是一个 —— 现在 (对) 好多搞芯片的人 (来说),通用的 CPU 或者 GPU 可能专用做 AI 有些 Redundance,比如说我想把其他的都去掉,专做这个,但是这个东西绕不过去知识产权。你还没做成呢,等做成了就有人来找你了。

我们现在是个结构性的不一样,刚才我说过了。我没有那三个什么外存内存、处理器、I/O的,都在一起的。基本上我们为什么有这个信心呢,首先我没有抄别人的,这就是我 30 年前自己搞的。但是因为 30 年前在 Berkeley 申请了专利,而且那个时候申请专利呢,就保证了没有人去侵犯它这个专利,就没有人再去接着申请。2012 年,那是 1992 年,(过了) 20 年那算专利失效。2012 年的时候,我们赶快接着申请。那个失效了以后,第一,你首先要说你不是抄别人的,因为有人跟你打官司啊,你得能证明这是我的。第二呢,你还得有一定的特点,才能保护住。

所以在 GTI,我们现在已经有 5 个核心基本专利,很快的。当时我们这个专利去 Defense 的时候,去申请专利的时候主要就是 Intel 的人在评论。他们认为他们的是 (应该获得专利),但最后下来,没用,还是 (我们的) 这个是完全是新的东西。所以呢,做芯片必须得有专利。没有专利趁早别做。

ALEX REN :

OK。那咱们讲了很多技术方面的东西和研究方面的东西。咱们 GTI 的一个商业发展的策略是什么呢。您觉得我们作为一个初创公司,做芯片本身就不容易。面临这么多竞争,即使我们有基础,接下来我们在商业发展上会采取什么样的路径?

杨林:

商业发展现在正好是一个拐点,就是从 R&D,Research 到产业化,还缺两样东西。第一就是平台,因为我们现在没有产业化平台,都是 GPU。你不可能说买个 GPU 挂在门上当智能锁,那不可能啊。

ALEX REN :

对,GPU 现在也越来越贵是吧?

杨林:

对啊,是。GPU 有它们算的什么服务重心,它有它的市场。现在的人大家也都是希望,因为算力比较大嘛。还有就是培养的人,因为只有这一个平台,所以大家只会用这个东西。所以真正说老百姓要干什么,不知道,他也不想干让他干的这个事儿。你说你给我家弄个智能锁 —— 我学个 PhD 得 5 年呢,做那些东西 —— Master 都拿不到。没有意义,没有平台。所以我们第一件事就是做一个平台,做一个非常低成本,低功耗,但是还有 AI 的性能。这就很难。

让每一个人,我认为产业化,让大家都先能玩起来。大家都能玩,人才的问题就解决了。就像现在大家都玩计算机,那你不愁找懂计算机编程的。都玩手机,你不愁找手机 App 的 Developer。我们的做法就是这个,产业化嘛。现在的计算机和 30 年前的计算机完全不一样,现在的手机和以前的大哥大也完全不一样。它不是一个办公用品,它也不是一个 Business 的用品,它就是一个家用 (电子设备),就是个玩儿。所以我们现在 —— 你看这个东西做的就像让大家玩一样。我也不想拿你去开发什么自动驾驶,智能医疗,不用。你就能用这个识别出来一些很简单的东西,猫啊,狗啊,这些。

ALEX REN :

对,这个普及化确实是需要细分的领域,细分的应用,对吧?针对他自己想关注的问题怎么解决。

杨林:

对,所以我们第一个在推这个。但是这个比较长,因为需要一个生态系统。那么我们先是把芯片做出来,成本因为很低,能放到这里边呢,那就肯定是很低的。Intel 那个还有散热片呢。我们这个就是这样,从低功耗的角度来讲。再就是我们配合 (现状),每个人都有手机,每个人都有电脑。我们让你先熟悉什么叫 AI。那么第二个呢,也不是做 Mission Critical 的。你说让你去做 AI,做自动驾驶,撞死人的事儿,谁负责还没搞清楚呢。你说让他去做智能医疗,治好了行,治死人了,打官司怎么办?咱们不搞那个事儿。

ALEX REN :

对,您说很多应用呢,它其实需要一个不管是法规啊,或者是政策,或者甚至是有些伦理道德方面的,对吧?这些东西还有很大的障碍,您看像无人车的产业化,安全性啊,整个的法律规范,保险,这些都影响到很多东西,对吧?而我们所侧重的这种普及化,它可能更加容易实现一些,是不是这个道理?

杨林:

比如说,可以给你举个例子。现在有很多小玩具可以说话,但那都是云端的。云端有几个问题,一个就是说它有一个隐私的问题。你每天说什么话,可能也不敢说太多。

ALEX REN :

需要把这些隐私信息存在本地。

杨林:

对,存在本地。第二还有技术问题,实际上在云端处理识别的这个功能更复杂。你比如现在科大讯飞不也有人说它不行。是,那个问题太难了。因为那个东西叫什么,叫非特定人识别。因为语言这个东西是人为定义的。它和图像不一样,图像是自然发生的,语言是人为定义的,还有口音。

ALEX REN :

所以您说的就是个性化。比如我的手机上其实都是我的口音,那应该 Train 起来更容易一点,对吧?您说放在云端了变成几百万,几亿人的 (口音),那这个 Train 起来更不容易了。

杨林:

对啊。不同的语言,不同的语法,不同的语气,不同的语调,还有不同的兴趣。实际上你放在自己这儿,训练的就是你感兴趣的事儿。可能你家人感兴趣的事儿跟你还不一样,你的孩子更不一样。这个就把一个很复杂的问题变成很简单的问题了。就像我当年到美国来的时候就学了英语 900 句,在这儿我也没感觉到我有什么难的。因为我也不去跟别人去讨论什么很复杂的事儿,关键词抓到了就行。就是一个你要什么需求,你有什么问题,这东西非常好训练,而且非常有隐私。这就是我们现在要做的这个事儿。你就自己做,训练这个东西就行。你自己就能开发一个他们那样的 (应用)。

ALEX REN :

所以你们也提供工具包之类的是吧?

杨林:

对,我们提供。这东西就像刚才我说的,没有指令集。实际上机器学习这个事儿呢,让现在人工智能有好多人把它复杂化了。实际上老百姓还是没有真正切入到这一点。真正讲呢,它就是一个大数据,通过整理数据,让机器能够执行一些简单的功能,用我的话讲,就是像教小孩儿的幼儿园老师。你把它看成是一个小孩儿,教给它,这是苹果。再拿个梨,问这是什么,它说这是苹果,不对,梨,啊,梨,下回就是梨。你又弄个橘子,它说又是梨,不对,苹果,不对,什么,橘子。就这样一遍一遍地教。那这些东西就整理成 —— 就是说行行业业的专家去训练你自己要的东西。

随便举个例子,现在中国退休的人很多,有钱了都去到处旅游。智能旅游是什么呢,就是现在大家说,到此一游,照个照片。你也不知道这个东西到底怎么回事儿。将来 AR 就连上了,你一照照片,一开始有的人可以去,他就讲一段,这是谁,这是怎么回事儿。下回呢,你说你要到哪儿玩,比如说,你说你要到清华。清华我一回去,这一个楼,那一个楼,我也不知道怎么回事儿。反正到那儿大家都合影嘛,4 月份校庆回去。

那后来他们就训练了一个东西,你一照照片,它就告诉你说这个楼什么时候建的,为什么,怎么回事儿。这不就涨知识了吗?现在都是用二维码 (扫信息),这不用。而且将来的社区都是交换这个,就是开发的 App 不用写什么软件 C++,基本上你对这个东西感兴趣就行。比如说你到北海,你看那里有个半月桥。你到那个地方照个相,觉得挺美的,为什么叫半月桥?我经常去北海,我也不知道。后来看《国宝档案》才知道,那是乾隆写的 “半月桥”,是纪晓岚还是谁告诉他,说你看那个大白天的太阳在里边就是半个月亮。你说这种涨知识的事儿,谁也不知道啊。

ALEX REN :

对,确实看见了AI能做的事情。

杨林:

所以智能旅游是我们要做的一个事儿,智能教育,智能旅游,就是这些东西。像什么自动驾驶,智能交通,什么智能医疗,那是国家的事儿,这些是社区的事儿。

ALEX REN :

所以 GTI 这个策略就是说,我们做一个普及化的平台,可以让大家去做一些像您说的这个智能旅游,这些细枝末节的一些应用,对吧?让一些开发人员,让这些人才很容易掌握这些工具,做这些开发,针对他所关心的一些问题做出些解决 (方案)。

杨林:

就是这个意思。因为我今年 4 月份回国的时候曾经说过,我说要把 AI 玩起来。我们这个东西上面写的叫 “Plai”,音译好像就是玩嘛 (Play)。但是它的直接意思就是 People Learn AI,就是玩的意思。一旦大家都了解了,都玩起来了,你人才也不会缺了,行行业业都是专家。因为 AI 并不是要解决一个高大上的就这么一个事儿,AI 是要方方面面的解决很简单的事儿。

我们最近也在跟一家做 Baby Monitor (的公司合作)。小孩儿一哭 —— 小孩儿嘛,总得有人看着 —— 或者他刚要哭的时候,你马上把当妈的这个声音录在那儿了,起码给他 Distracts 一下,就不哭了。这就是很简单的一个事儿啊,也不需要什么云,这个那个的,这个东西就可以做,你自己训练。

ALEX REN :

其实我自己也一直想,因为天天接触 AI 的问题。我想到的问题,比如识别出我们家后院的松鼠,后院的水果都被松鼠吃掉了,这些东西都是很类似的。家用的,普通的,普通人所接触到的一些产品,怎么样可以解决。而不是说很多看起来非常非常复杂的,需要举国之力去解决的这样一个问题。

OK。您看到这里有两个以前可能相对来讲隔离比较深的领域,一个是 AI 领域,一个是芯片领域。现在有很多 AI 工程师,也有很多芯片工程师。这两个领域随着商业化会越来越 Merge,您对这两个领域的工程师,对他们的职业发展有什么建议?他们应该关注什么?对 AI 工程师 (来说) 应该怎么样去更了解硬件,还是对硬件工程师 (建议) 怎么去更了解 AI 吗?大概您是怎么给他们建议的?包括您也有学生嘛,您对您的学生是怎么教育他们的?

杨林:

因为我觉得,因为现在是个拐点,拐点变化是很快的,当前的需要就是产业化的问题。刚才我说了产业化,标准化,让大家都能够用起来。很短的这段时间我很难预测,那么等 AI 基本上普及了以后 —— 就像手机这种 —— 非常普及了以后呢,我觉得搞软件的人已经没用了。因为都是什么呢 ——

ALEX REN :

这是很shock的事情。

杨林:

你要让一个农民说哪个苹果长虫子了,哪个没长虫子。你怎么教,你说你还要学 Caffe,让人吓一跳。那他只能告诉你,你拿这个东西照几个相,然后你告诉我,什么是有虫子的,什么是没虫子的,没虫子的喷什么药。比如说你们家扫地机,现在都是瞎眼的。只是它很尽力去天天给你扫,现在所谓的智能就是没电了知道走回去充个电。但是真正的扫地机呢,是干净的地方就不扫了,就不擦,脏了再擦。有根头发捡起来,有了可乐 (渍) 喷点东西,这才是 (智能)。但就这么几类,没那么复杂。

但是这种东西用不着让很专业的人去训练,基本上将来大家训练 AI,就需要各种级别的导师,而且越低级别的老师需要越多。就像人的智慧一定要有程度的,所以才有一个小学毕业,中学毕业,大学毕业,博士,教授什么的,越往上 (学历) 高的人学的时间越长。学的时间越长,就是 Cost 越高,但是大部分的人,(对) 我们真正需要的 (来说) 呢,基本就够了。就像刚才我说的,Baby Monitor,你找一个安徽小保姆不照样给你看着么?

ALEX REN :

是。所以您刚才提出的是软件工程师这块。那还有硬件工程师,他们这些软硬件工程师该怎么办呢?如果说未来 —— 我知道您的这个意思,以某种程度来说也是应该有 AutoML 的含义,是不是?也有从某种程度上讲,说 AI 本身的普及化之后,可能让普通人就可以教会 AI 怎么去做,就是 Train AI,对吧?那您说那些过去热门的这些软件工程师怎么办呢?

杨林:

这一点呢,这是一个很热门的 (大家都在) 讨论的问题,是不是会抢了 (这些人的) Job。我个人觉得,他们不会,会活得更有意义。但是不一定做现在做的这个工作。所以我想,什么时候发生我不知道,但是最终发生的时候,应该是大家都变成老师了,都去教机器去做人的事儿。

ALEX REN :

就好像我们以前教计算机去做事儿,现在转变成去教 AI 去做事儿。

杨林:

对。教计算机做事儿呢,你得自己学本领。

ALEX REN :

你要会它的语言,对吧?

杨林:

对。机器学习呢,是你只要整理数据就行了。那么实际上你这么想吧,中国几千年文化,大学,清华才 100年,100 多年。这就是因为工业革命造成的。那么美国的大学 200 多年,欧洲的大学 400 多年,都是工业革命造成的。也是随着时间不同才有。实际上大学就是为了让人去操纵机器,需要一些专业。所以那个时候清华叫什么,我们要甘当螺丝钉嘛。就是把人先变成机器人,就是学校。

以后不是,以后学校就是培养老师,把机器变成机器人,不是把人变成机器了。教育是要很大的改变的,教育一改变了,人就可以学别的。你可以教机器去作曲啊,不是还有教机器跳舞的吗?多了,是吧?各种方向,就是说现在你可能都想象不到。就像当年马车司机老觉得自己没 Job了,最后不都当 Taxi 司机了,也不错嘛。当然不是同一代人啦。

ALEX REN :

这个非常有道理啊!那您说现在做硬件的工程师,他们应该做什么呢?

杨林:

最近这几年 —— 将来我说的那个时候就没有软件硬件这个概念了 —— 最近这几年呢,我觉得硬件工程师做这个系统,不是做一样的,只是 CPU,GPU,大家比那个,只有几家大公司做,所以会有很多 Startup。你别看有很多 Startup,他们不是在竞争。就像开饭馆似的,每个人有自己的风味,每个人都有自己的 (特点),只要你自己能够想一个你做的东西有需求,就有 Business。这是做硬件的。那做软件的人呢,因为有硬件配套么,那就是生态系统,可能是要做这个。

ALEX REN :

做 Application。

杨林:

对。你看我在 Silicon Valley —— 一开始到处都是卖 PC 的,谁都能攒个 PC 去卖,做硬件的人很多,后来没有了。然后去做芯片,芯片也没有了,现在哪有做芯片的了,就几家大公司。然后做软件,现在连软件也没有了,就几家大公司。可能将来我又感觉到,这个又会回来。就是为什么说三十年河东,三十年河西呢,因为这是个新的领域,原来的东西呢,很难适应做这个事儿。所以它就需要人去有更多的灵活性和创新能力。而且更服务于方方面面的需求。

ALEX REN :

OK。那非常好,就是说您做了这么多年研究和工程,包括现在创业,您觉得未来几年 —— 这是最后一个问题。未来几年,比如 3 到 5 年,您自己的目标是什么。还有就是您觉得 GTI 未来 3 到 5 年的发展会是什么样子?

杨林:

我们最近的这两三年,就是要做一个普及的平台。把这个事儿普及起来,这是我们现在 (的目标)。普及这件事儿呢,我们认为是个平台效应,是 Horizontal的,就是说我拿这个东西,你放在 PC 上可以自己去开发自己的应用。然后可能三五年以后呢,我们会觉得行业应用的人越来越清楚自己要干什么了,因为他先是拿这个平台。这个平台很小,也很物美价廉,但是还是不够专用,那进一步优化怎么办呢?就是要做 ASIC,就是在做专用电路。

然后我们就开始做 Vertical 的。针对某一个,比如说安防,那以后安防标准化了,大家都做一样的了。所以方方面面,包括汽车,包括智能医疗变成说你看病是可以用那个,但是家里边有一个 Personal Doctor,起码早上起来,看你一照镜子发现今天没睡醒,提醒你一下。那么这种东西我觉得都是比较专用的东西,就像冰箱,电视啊这些东西。那么如果有量,我们的 Hardware Engineer,或者是做芯片的,就会根据这个量 (进行开发)。原来都被通吃了,原来大家都不同,叫 Device。

前一段时间开了一个 (会) 叫 Hardware Summit,我当时说什么叫 Hardware,大家现在就认为就是 Computer。但是实际上 Hardware 以前不是 Computer。Hardware 就是能具体干事儿的一个东西。那这个随着人工智能方方面面 (的应用) 多了,各各方面都有,不一定我就需要最好的,

ALEX REN :

那您个人呢?这个过程中,我的理解您是在做整个 AI 的普及化,对不对?这是不是您的个人目标?

杨林:

我的个人目标现在,所以我现在实际上在填补空白嘛。因为刚才咱们不说了吗,没有 Hardware Design Engineer 了,所以我干脆先启动一下。然后在这个时候由于我们的公司增长也很快,以后就要招很多人嘛,培养一些新的人,把这些事儿慢慢做起来以后呢,我也就退休了。

ALEX REN :

所以您是还在提携后辈,很多新的工程师。所以今天其实也是受益匪浅啊,杨老师讲了很多他对于整个 30 年来,包括从上一次的人工智能 (浪潮) 开始,整个的发展,不管是通讯,半导体,计算机,以及现在人工智能。那通过以前的这种计算机通讯这方面的发展,看到说我们现在 AI 普及化所面临的一些机遇。所以杨老师创立的这个 GTI 也是为了瞄准这个机会来的,对吧?同时也会希望能够利用我们所积累的这些经验,用一些新的架构,新的一些方法去为这个普及化而做出努力。

所以非常感谢杨老师的分享,(让)我个人是非常非常的受益匪浅。所以今天就是我们 Robin.ly 的第四期节目,谢谢大家。

杨林:

好,谢谢让我有这个机会能跟大家分享!

原创文章,作者:admin,如若转载,请注明出处:http://www.eefans.com/archives/1947

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注